اخبار هوش مصنوعی در 2025-12-12

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2 را با به‌روزرسانی دانش تا اوت 2025 منتشر کرد. قیمت این مدل 1.4 برابر GPT-5.1 است و بهبودهای قابل‌توجهی در مدیریت متن‌های طولانی و وظایف «سوزن در انبار کاه» (needle-in-haystack) نشان می‌دهد @simonw
  • GPT-5.2 Pro (X-High) به امتیاز 90.5% در ARC-AGI-1 با هزینه 11.64 دلار به ازای هر وظیفه دست یافت که نشان‌دهنده‌ی بهبود 390 برابری در کارایی نسبت به نسخه‌ی منتشرنشده‌ی o3 (High) از یک سال پیش است که با امتیاز 88% و هزینه 4.5 هزار دلار به ازای هر وظیفه عمل می‌کرد @simonw
  • Ai2 مدل Olmo 3.1 را با مدل‌های 32B Think و 32B Instruct منتشر کرد که اجرای RL آن‌ها را برای سه هفته‌ی دیگر تمدید کرده و بهبودهای مستمری در عملکرد AIME و معیارهای کدنویسی با هزینه‌ی کلی تقریباً 250 هزار دلار به دست آورده است @natolambert
  • گوگل مدل به‌روزرسانی‌شده‌ی Gemini 2.5 Flash Native Audio را با بهبودهایی برای مدیریت گردش‌کارهای پیچیده، هدایت دستورالعمل‌های کاربر و مکالمات طبیعی منتشر کرد @GoogleAI
  • مدل‌های پیش‌نمایش تبدیل متن به گفتار Gemini 2.5 Flash و 2.5 Pro بهبودهایی در رعایت دستورات سبک، تنظیم دقیق سرعت با تنظیمات سرعت آگاه از متن و ثبات صدای شخصیت برای سناریوهای چند گوینده به ارمغان می‌آورند @GoogleAI
  • Moonshoot AI مدل Kimi K2 Thinking را منتشر کرد که اکنون در پلتفرم Tinker با قابلیت‌های جستجوی گسترده در دسترس است @AndrewCurran_
  • ByteDance مدل Dolphin-v2 را منتشر کرد، یک مدل 3B برای تجزیه‌ی اسناد با مجوز MIT که روی PDFها، اسکن‌ها و عکس‌ها کار می‌کند و 21 نوع محتوا را با دقت پیکسلی درک می‌کند @AdinaYakup
  • OpenAI مدل circuit-sparsity را در Hugging Face منتشر کرد @_akhaliq

تحلیل صنعت

  • Anthropic به عنوان مشتری 10 میلیارد دلاری مرموز Broadcom از سپتامبر فاش شد، با سفارش 11 میلیارد دلاری اضافی برای زیرساخت‌های هوش مصنوعی @AndrewCurran_
  • OpenAI همکاری با BBVA را برای گسترش استقرار ChatGPT Enterprise به 120,000 کارمند اعلام کرد که از تغییر BBVA به سمت بانکداری مبتنی بر هوش مصنوعی حمایت می‌کند @gdb
  • سم آلتمن، مدیرعامل OpenAI، اعلام کرد که هوش مصنوعی سازمانی در سال 2026 اولویت بزرگی برای OpenAI خواهد بود که نشان‌دهنده‌ی یک تغییر استراتژیک عمده است @gdb
  • مدیرعامل Pinterest گزارش داد که با استفاده از مدل‌های متن‌باز، تنظیم دقیق آن‌ها و دستیابی به عملکردی مشابه بهترین مدل‌های اختصاصی با کمتر از 10% هزینه، به نتایج مشابهی دست یافته است @jeffboudier
  • NVIDIA به دلیل تقاضای قوی چین، با وجود محدودیت‌های صادراتی، افزایش تولید تراشه‌ی H200 را در نظر دارد @AndrewCurran_
  • اتان مولیک اطمینان خود را ابراز کرد که حتی اگر توسعه‌ی هوش مصنوعی امروز متوقف شود، جامعه برای ده سال آینده با اختلالات گسترده‌ای مواجه خواهد شد، زیرا مردم در تلاش برای بهره‌برداری از قابلیت‌های مدل‌های موجود هستند @emollick
  • ناظران صنعت به پتانسیل خستگی مدل در LLMها مشابه خستگی نصب برنامه در برنامه‌های موبایل اشاره می‌کنند، جایی که حتی محصولات برتر نیز برای پذیرش با مشکل مواجه می‌شوند @GergelyOrosz
  • تحلیل‌ها نشان می‌دهد که صنعت به اوج APIهای اختصاصی رسیده و وارد دنیایی متعادل‌تر می‌شود که در آن متن‌باز، آموزش و پلتفرم‌های جایگزین سهم بیشتری از توجه، استفاده و درآمد را به دست خواهند آورد @ClementDelangue
  • پست طنزآمیز چالش‌های پذیرش هوش مصنوعی سازمانی را برجسته می‌کند و استقرار 1.4 میلیون دلاری Microsoft Copilot را با حداقل استفاده‌ی واقعی اما گزارش‌دهی موفقیت‌آمیز معیارها برای ارائه‌های هیئت‌مدیره توصیف می‌کند @gothburz

اخلاق و جامعه

  • رئیس‌جمهور ترامپ فرمان اجرایی چارچوب سیاست ملی برای هوش مصنوعی را امضا کرد و اعلام کرد که ایالات متحده باید یک استاندارد ملی با حداقل بار برای هوش مصنوعی داشته باشد، نه 50 قانون ایالتی متناقض @AndrewCurran_
  • این فرمان اجرایی شامل ابزارهایی مانند کارگروه دعاوی DOJ، توقف بودجه‌ی فدرال از ایالت‌هایی با قوانین هوش مصنوعی دست‌وپاگیر، تلاش‌های FTC برای مهار تلاش‌های ایالت‌ها برای مجبور کردن مدل‌های هوش مصنوعی به تغییر خروجی‌های واقعی، و تلاش‌های FCC برای مهار الزامات افشاگری است @AndrewCurran_
  • یوتیوب سیستم تأیید سن مبتنی بر هوش مصنوعی را با استفاده از Gemini برای تعیین خودکار سن کاربر با تجزیه و تحلیل الگوهای مشاهده اعلام کرد، با کاربران که به اشتباه زیر 18 سال تخمین زده می‌شوند، ملزم به تأیید از طریق کارت اعتباری یا شناسه‌ی دولتی هستند @AndrewCurran_
  • آرویند نارایانان، محقق پرینستون، مقاله‌ای منتشر کرد که در آن استدلال می‌کند که عدالت الگوریتمی یک خطای دسته‌بندی است و از مطالعه‌ی کل سیستم‌های اجتماعی-فنی به جای فقط زیرسیستم‌های فنی هنگام طراحی بوروکراسی‌های الگوریتمی حمایت می‌کند @random_walker
  • تحلیل‌ها نشان می‌دهد که اگر افراد زمان کوتاهی تا هوش مصنوعی تحول‌آفرین داشته باشند و معتقد باشند که برخی از ارزش‌های انسانی اساساً آشتی‌ناپذیر هستند، اطمینان از اینکه مدل برنده چارچوب اخلاقی آن‌ها را در بر می‌گیرد، به طور فزاینده‌ای مهم‌ترین چیز در جهان به نظر خواهد رسید @AndrewCurran_

کاربردها

  • Comet Android از Perplexity توانایی اشکال‌زدایی کد از طریق تلفن را با تجزیه و تحلیل لاگ‌های CI، ردیابی خطاها، یافتن راه‌حل‌ها و باز کردن درخواست‌های کشش آماده برای ادغام نشان می‌دهد @AravSrinivas
  • ChatGPT اکنون شامل یک پوشه‌ی /home/oai/skills با تعاریف مهارت برای PDFها، اسناد و صفحات گسترده است، با پشتیبانی آزمایشی نیز به Codex CLI اضافه شده است @simonw
  • گوگل ترنسلیت ترجمه‌ی گفتار به گفتار زنده با پشتیبانی از Gemini را در نسخه‌ی بتا منتشر کرد که ترجمه‌ی صوتی بلادرنگ را با درک ظرافت‌های گفتار انسانی به ارمغان می‌آورد @TechCrunch
  • ادوبی برنامه‌های رایگان یکپارچه با ChatGPT را برای فتوشاپ، آکروبات و اکسپرس در دسکتاپ، وب و iOS راه‌اندازی کرد که به کاربران امکان می‌دهد مستقیماً از داخل ChatGPT به برنامه‌های ادوبی دسترسی داشته باشند @gdb
  • OpenAI همکاری با دیزنی را برای آوردن Sora و قابلیت‌های تولید تصویر برای شخصیت‌های دیزنی اعلام کرد که به کاربران امکان می‌دهد محتوا را با IP دیزنی تولید کنند @sama
  • مایکروسافت همکاری هوش مصنوعی MahaCrimeOS را با ماهاراشترا برای حمایت از قربانیان جرایم سایبری و کلاهبرداری مالی اعلام کرد @satyanadella
  • Moonlake مدل Reverie را معرفی کرد، یک مدل انتشار قابل برنامه‌ریزی بلادرنگ که برای بازی‌ها آموزش دیده است و قادر به شرطی‌سازی فراتر از پیکسل‌ها است و به گیم‌پلی اجازه می‌دهد تا با حفظ مکانیک بازی به هر زیبایی‌شناسی بازسازی شود @chrmanning
  • کاربر گزارش می‌دهد که GPT-5.2 تحلیل طولانی و چشمگیری از اسکریپت‌های بازی ارائه می‌دهد، جزئیات ظریف را درک می‌کند و تفسیرهایی مشابه کسی که بازی را عمیقاً بازی کرده است، با تقریباً بدون توهم، ارائه می‌دهد @AndrewCurran_
  • Kimi K2 رفتار جستجوی گسترده‌ای را در طول استدلال نشان می‌دهد، بارها برای حمایت از ادعاها، بررسی مثال‌های نقض و تأیید اطلاعات قبل از ارائه‌ی پاسخ‌های نهایی جستجو می‌کند @AndrewCurran_

پژوهش‌ها

  • Olmo 3.1 32B Think از Ai2 نشان می‌دهد که مقیاس‌بندی RL می‌تواند بسیار فراتر از انتظارات اولیه ادامه یابد، با افزایش عملکرد بیش از 125 هزار ساعت H100 با هزینه‌ی تقریباً 250 هزار دلار، قابل مقایسه با مصرف منابع DeepSeek R1 @natolambert
  • پژوهش Fast Flow Joint Distillation (F2D2) را معرفی می‌کند که NFEs را برای نمونه‌برداری و ارزیابی احتمال به میزان دو مرتبه در مدل‌های مبتنی بر جریان کاهش می‌دهد و در عین حال کیفیت نمونه را حفظ می‌کند @rsalakhu
  • Google DeepMind پژوهشی را در مورد ارزیابی سیاست‌های رباتیک Gemini در شبیه‌ساز Veo World ارائه می‌دهد و یک ارزیاب عمومی برای آزمایش ایمنی ربات بدون شکستن اشیاء فیزیکی معرفی می‌کند @Majumdar_Ani
  • فرانسوا شوله استدلال می‌کند که هوش مصنوعی از ماشین اتوماسیون به ماشین اختراع تکامل خواهد یافت و به یک پارادایم اساساً جدید با جستجوی نمادین به عنوان هسته‌ی آن به جای برازش منحنی نیاز دارد @fchollet
  • شوله توضیح می‌دهد که هوش سیال اندازه‌گیری‌شده توسط ARC با قابلیت‌های اکتشاف، تعیین هدف و برنامه‌ریزی مورد نیاز برای عوامل خودمختار متفاوت است، با اکتشاف سخت‌ترین و برنامه‌ریزی آسان‌ترین در میان این مشکلات باز @fchollet
  • اولین LLM آموزش‌دیده در فضا با استفاده از NVIDIA H100 در Starcloud-1، همچنین اولین بار است که نسخه‌ای از Gemini گوگل در فضا اجرا می‌شود، با استفاده از مدل‌های متن‌باز بسیار کارآمد Gemma @demishassabis
  • روش جدید جاسازی متن با استفاده از شبکه‌ی کوچک ReLU برای تقریب ترانسفورمر بزرگ از ویژگی