اخبار هوش مصنوعی در 2025-12-12

مدل‌های جدید هوش مصنوعی

OpenAI مدل GPT-5.2 را با به‌روزرسانی دانش تا اوت 2025 منتشر کرد. قیمت این مدل 1.4 برابر GPT-5.1 است و بهبودهای قابل‌توجهی در مدیریت متن‌های طولانی و وظایف «سوزن در انبار کاه» (needle-in-haystack) نشان می‌دهد @simonw
GPT-5.2 Pro (X-High) به امتیاز 90.5% در ARC-AGI-1 با هزینه 11.64 دلار به ازای هر وظیفه دست یافت که نشان‌دهنده‌ی بهبود 390 برابری در کارایی نسبت به نسخه‌ی منتشرنشده‌ی o3 (High) از یک سال پیش است که با امتیاز 88% و هزینه 4.5 هزار دلار به ازای هر وظیفه عمل می‌کرد @simonw
Ai2 مدل Olmo 3.1 را با مدل‌های 32B Think و 32B Instruct منتشر کرد که اجرای RL آن‌ها را برای سه هفته‌ی دیگر تمدید کرده و بهبودهای مستمری در عملکرد AIME و معیارهای کدنویسی با هزینه‌ی کلی تقریباً 250 هزار دلار به دست آورده است @natolambert
گوگل مدل به‌روزرسانی‌شده‌ی Gemini 2.5 Flash Native Audio را با بهبودهایی برای مدیریت گردش‌کارهای پیچیده، هدایت دستورالعمل‌های کاربر و مکالمات طبیعی منتشر کرد @GoogleAI
مدل‌های پیش‌نمایش تبدیل متن به گفتار Gemini 2.5 Flash و 2.5 Pro بهبودهایی در رعایت دستورات سبک، تنظیم دقیق سرعت با تنظیمات سرعت آگاه از متن و ثبات صدای شخصیت برای سناریوهای چند گوینده به ارمغان می‌آورند @GoogleAI
Moonshoot AI مدل Kimi K2 Thinking را منتشر کرد که اکنون در پلتفرم Tinker با قابلیت‌های جستجوی گسترده در دسترس است @AndrewCurran_
ByteDance مدل Dolphin-v2 را منتشر کرد، یک مدل 3B برای تجزیه‌ی اسناد با مجوز MIT که روی PDFها، اسکن‌ها و عکس‌ها کار می‌کند و 21 نوع محتوا را با دقت پیکسلی درک می‌کند @AdinaYakup
OpenAI مدل circuit-sparsity را در Hugging Face منتشر کرد @_akhaliq

تحلیل صنعت

Anthropic به عنوان مشتری 10 میلیارد دلاری مرموز Broadcom از سپتامبر فاش شد، با سفارش 11 میلیارد دلاری اضافی برای زیرساخت‌های هوش مصنوعی @AndrewCurran_
OpenAI همکاری با BBVA را برای گسترش استقرار ChatGPT Enterprise به 120,000 کارمند اعلام کرد که از تغییر BBVA به سمت بانکداری مبتنی بر هوش مصنوعی حمایت می‌کند @gdb
سم آلتمن، مدیرعامل OpenAI، اعلام کرد که هوش مصنوعی سازمانی در سال 2026 اولویت بزرگی برای OpenAI خواهد بود که نشان‌دهنده‌ی یک تغییر استراتژیک عمده است @gdb
مدیرعامل Pinterest گزارش داد که با استفاده از مدل‌های متن‌باز، تنظیم دقیق آن‌ها و دستیابی به عملکردی مشابه بهترین مدل‌های اختصاصی با کمتر از 10% هزینه، به نتایج مشابهی دست یافته است @jeffboudier
NVIDIA به دلیل تقاضای قوی چین، با وجود محدودیت‌های صادراتی، افزایش تولید تراشه‌ی H200 را در نظر دارد @AndrewCurran_
اتان مولیک اطمینان خود را ابراز کرد که حتی اگر توسعه‌ی هوش مصنوعی امروز متوقف شود، جامعه برای ده سال آینده با اختلالات گسترده‌ای مواجه خواهد شد، زیرا مردم در تلاش برای بهره‌برداری از قابلیت‌های مدل‌های موجود هستند @emollick
ناظران صنعت به پتانسیل خستگی مدل در LLMها مشابه خستگی نصب برنامه در برنامه‌های موبایل اشاره می‌کنند، جایی که حتی محصولات برتر نیز برای پذیرش با مشکل مواجه می‌شوند @GergelyOrosz
تحلیل‌ها نشان می‌دهد که صنعت به اوج APIهای اختصاصی رسیده و وارد دنیایی متعادل‌تر می‌شود که در آن متن‌باز، آموزش و پلتفرم‌های جایگزین سهم بیشتری از توجه، استفاده و درآمد را به دست خواهند آورد @ClementDelangue
پست طنزآمیز چالش‌های پذیرش هوش مصنوعی سازمانی را برجسته می‌کند و استقرار 1.4 میلیون دلاری Microsoft Copilot را با حداقل استفاده‌ی واقعی اما گزارش‌دهی موفقیت‌آمیز معیارها برای ارائه‌های هیئت‌مدیره توصیف می‌کند @gothburz

اخلاق و جامعه

رئیس‌جمهور ترامپ فرمان اجرایی چارچوب سیاست ملی برای هوش مصنوعی را امضا کرد و اعلام کرد که ایالات متحده باید یک استاندارد ملی با حداقل بار برای هوش مصنوعی داشته باشد، نه 50 قانون ایالتی متناقض @AndrewCurran_
این فرمان اجرایی شامل ابزارهایی مانند کارگروه دعاوی DOJ، توقف بودجه‌ی فدرال از ایالت‌هایی با قوانین هوش مصنوعی دست‌وپاگیر، تلاش‌های FTC برای مهار تلاش‌های ایالت‌ها برای مجبور کردن مدل‌های هوش مصنوعی به تغییر خروجی‌های واقعی، و تلاش‌های FCC برای مهار الزامات افشاگری است @AndrewCurran_
یوتیوب سیستم تأیید سن مبتنی بر هوش مصنوعی را با استفاده از Gemini برای تعیین خودکار سن کاربر با تجزیه و تحلیل الگوهای مشاهده اعلام کرد، با کاربران که به اشتباه زیر 18 سال تخمین زده می‌شوند، ملزم به تأیید از طریق کارت اعتباری یا شناسه‌ی دولتی هستند @AndrewCurran_
آرویند نارایانان، محقق پرینستون، مقاله‌ای منتشر کرد که در آن استدلال می‌کند که عدالت الگوریتمی یک خطای دسته‌بندی است و از مطالعه‌ی کل سیستم‌های اجتماعی-فنی به جای فقط زیرسیستم‌های فنی هنگام طراحی بوروکراسی‌های الگوریتمی حمایت می‌کند @random_walker
تحلیل‌ها نشان می‌دهد که اگر افراد زمان کوتاهی تا هوش مصنوعی تحول‌آفرین داشته باشند و معتقد باشند که برخی از ارزش‌های انسانی اساساً آشتی‌ناپذیر هستند، اطمینان از اینکه مدل برنده چارچوب اخلاقی آن‌ها را در بر می‌گیرد، به طور فزاینده‌ای مهم‌ترین چیز در جهان به نظر خواهد رسید @AndrewCurran_

کاربردها

Comet Android از Perplexity توانایی اشکال‌زدایی کد از طریق تلفن را با تجزیه و تحلیل لاگ‌های CI، ردیابی خطاها، یافتن راه‌حل‌ها و باز کردن درخواست‌های کشش آماده برای ادغام نشان می‌دهد @AravSrinivas
ChatGPT اکنون شامل یک پوشه‌ی /home/oai/skills با تعاریف مهارت برای PDFها، اسناد و صفحات گسترده است، با پشتیبانی آزمایشی نیز به Codex CLI اضافه شده است @simonw
گوگل ترنسلیت ترجمه‌ی گفتار به گفتار زنده با پشتیبانی از Gemini را در نسخه‌ی بتا منتشر کرد که ترجمه‌ی صوتی بلادرنگ را با درک ظرافت‌های گفتار انسانی به ارمغان می‌آورد @TechCrunch
ادوبی برنامه‌های رایگان یکپارچه با ChatGPT را برای فتوشاپ، آکروبات و اکسپرس در دسکتاپ، وب و iOS راه‌اندازی کرد که به کاربران امکان می‌دهد مستقیماً از داخل ChatGPT به برنامه‌های ادوبی دسترسی داشته باشند @gdb
OpenAI همکاری با دیزنی را برای آوردن Sora و قابلیت‌های تولید تصویر برای شخصیت‌های دیزنی اعلام کرد که به کاربران امکان می‌دهد محتوا را با IP دیزنی تولید کنند @sama
مایکروسافت همکاری هوش مصنوعی MahaCrimeOS را با ماهاراشترا برای حمایت از قربانیان جرایم سایبری و کلاهبرداری مالی اعلام کرد @satyanadella
Moonlake مدل Reverie را معرفی کرد، یک مدل انتشار قابل برنامه‌ریزی بلادرنگ که برای بازی‌ها آموزش دیده است و قادر به شرطی‌سازی فراتر از پیکسل‌ها است و به گیم‌پلی اجازه می‌دهد تا با حفظ مکانیک بازی به هر زیبایی‌شناسی بازسازی شود @chrmanning
کاربر گزارش می‌دهد که GPT-5.2 تحلیل طولانی و چشمگیری از اسکریپت‌های بازی ارائه می‌دهد، جزئیات ظریف را درک می‌کند و تفسیرهایی مشابه کسی که بازی را عمیقاً بازی کرده است، با تقریباً بدون توهم، ارائه می‌دهد @AndrewCurran_
Kimi K2 رفتار جستجوی گسترده‌ای را در طول استدلال نشان می‌دهد، بارها برای حمایت از ادعاها، بررسی مثال‌های نقض و تأیید اطلاعات قبل از ارائه‌ی پاسخ‌های نهایی جستجو می‌کند @AndrewCurran_

پژوهش‌ها

Olmo 3.1 32B Think از Ai2 نشان می‌دهد که مقیاس‌بندی RL می‌تواند بسیار فراتر از انتظارات اولیه ادامه یابد، با افزایش عملکرد بیش از 125 هزار ساعت H100 با هزینه‌ی تقریباً 250 هزار دلار، قابل مقایسه با مصرف منابع DeepSeek R1 @natolambert
پژوهش Fast Flow Joint Distillation (F2D2) را معرفی می‌کند که NFEs را برای نمونه‌برداری و ارزیابی احتمال به میزان دو مرتبه در مدل‌های مبتنی بر جریان کاهش می‌دهد و در عین حال کیفیت نمونه را حفظ می‌کند @rsalakhu
Google DeepMind پژوهشی را در مورد ارزیابی سیاست‌های رباتیک Gemini در شبیه‌ساز Veo World ارائه می‌دهد و یک ارزیاب عمومی برای آزمایش ایمنی ربات بدون شکستن اشیاء فیزیکی معرفی می‌کند @Majumdar_Ani
فرانسوا شوله استدلال می‌کند که هوش مصنوعی از ماشین اتوماسیون به ماشین اختراع تکامل خواهد یافت و به یک پارادایم اساساً جدید با جستجوی نمادین به عنوان هسته‌ی آن به جای برازش منحنی نیاز دارد @fchollet
شوله توضیح می‌دهد که هوش سیال اندازه‌گیری‌شده توسط ARC با قابلیت‌های اکتشاف، تعیین هدف و برنامه‌ریزی مورد نیاز برای عوامل خودمختار متفاوت است، با اکتشاف سخت‌ترین و برنامه‌ریزی آسان‌ترین در میان این مشکلات باز @fchollet
اولین LLM آموزش‌دیده در فضا با استفاده از NVIDIA H100 در Starcloud-1، همچنین اولین بار است که نسخه‌ای از Gemini گوگل در فضا اجرا می‌شود، با استفاده از مدل‌های متن‌باز بسیار کارآمد Gemma @demishassabis
روش جدید جاسازی متن با استفاده از شبکه‌ی کوچک ReLU برای تقریب ترانسفورمر بزرگ از ویژگی