اخبار هوش مصنوعی در 2025-12-12
مدلهای جدید هوش مصنوعی
- OpenAI مدل GPT-5.2 را با بهروزرسانی دانش تا اوت 2025 منتشر کرد. قیمت این مدل 1.4 برابر GPT-5.1 است و بهبودهای قابلتوجهی در مدیریت متنهای طولانی و وظایف «سوزن در انبار کاه» (needle-in-haystack) نشان میدهد @simonw
- GPT-5.2 Pro (X-High) به امتیاز 90.5% در ARC-AGI-1 با هزینه 11.64 دلار به ازای هر وظیفه دست یافت که نشاندهندهی بهبود 390 برابری در کارایی نسبت به نسخهی منتشرنشدهی o3 (High) از یک سال پیش است که با امتیاز 88% و هزینه 4.5 هزار دلار به ازای هر وظیفه عمل میکرد @simonw
- Ai2 مدل Olmo 3.1 را با مدلهای 32B Think و 32B Instruct منتشر کرد که اجرای RL آنها را برای سه هفتهی دیگر تمدید کرده و بهبودهای مستمری در عملکرد AIME و معیارهای کدنویسی با هزینهی کلی تقریباً 250 هزار دلار به دست آورده است @natolambert
- گوگل مدل بهروزرسانیشدهی Gemini 2.5 Flash Native Audio را با بهبودهایی برای مدیریت گردشکارهای پیچیده، هدایت دستورالعملهای کاربر و مکالمات طبیعی منتشر کرد @GoogleAI
- مدلهای پیشنمایش تبدیل متن به گفتار Gemini 2.5 Flash و 2.5 Pro بهبودهایی در رعایت دستورات سبک، تنظیم دقیق سرعت با تنظیمات سرعت آگاه از متن و ثبات صدای شخصیت برای سناریوهای چند گوینده به ارمغان میآورند @GoogleAI
- Moonshoot AI مدل Kimi K2 Thinking را منتشر کرد که اکنون در پلتفرم Tinker با قابلیتهای جستجوی گسترده در دسترس است @AndrewCurran_
- ByteDance مدل Dolphin-v2 را منتشر کرد، یک مدل 3B برای تجزیهی اسناد با مجوز MIT که روی PDFها، اسکنها و عکسها کار میکند و 21 نوع محتوا را با دقت پیکسلی درک میکند @AdinaYakup
- OpenAI مدل circuit-sparsity را در Hugging Face منتشر کرد @_akhaliq
تحلیل صنعت
- Anthropic به عنوان مشتری 10 میلیارد دلاری مرموز Broadcom از سپتامبر فاش شد، با سفارش 11 میلیارد دلاری اضافی برای زیرساختهای هوش مصنوعی @AndrewCurran_
- OpenAI همکاری با BBVA را برای گسترش استقرار ChatGPT Enterprise به 120,000 کارمند اعلام کرد که از تغییر BBVA به سمت بانکداری مبتنی بر هوش مصنوعی حمایت میکند @gdb
- سم آلتمن، مدیرعامل OpenAI، اعلام کرد که هوش مصنوعی سازمانی در سال 2026 اولویت بزرگی برای OpenAI خواهد بود که نشاندهندهی یک تغییر استراتژیک عمده است @gdb
- مدیرعامل Pinterest گزارش داد که با استفاده از مدلهای متنباز، تنظیم دقیق آنها و دستیابی به عملکردی مشابه بهترین مدلهای اختصاصی با کمتر از 10% هزینه، به نتایج مشابهی دست یافته است @jeffboudier
- NVIDIA به دلیل تقاضای قوی چین، با وجود محدودیتهای صادراتی، افزایش تولید تراشهی H200 را در نظر دارد @AndrewCurran_
- اتان مولیک اطمینان خود را ابراز کرد که حتی اگر توسعهی هوش مصنوعی امروز متوقف شود، جامعه برای ده سال آینده با اختلالات گستردهای مواجه خواهد شد، زیرا مردم در تلاش برای بهرهبرداری از قابلیتهای مدلهای موجود هستند @emollick
- ناظران صنعت به پتانسیل خستگی مدل در LLMها مشابه خستگی نصب برنامه در برنامههای موبایل اشاره میکنند، جایی که حتی محصولات برتر نیز برای پذیرش با مشکل مواجه میشوند @GergelyOrosz
- تحلیلها نشان میدهد که صنعت به اوج APIهای اختصاصی رسیده و وارد دنیایی متعادلتر میشود که در آن متنباز، آموزش و پلتفرمهای جایگزین سهم بیشتری از توجه، استفاده و درآمد را به دست خواهند آورد @ClementDelangue
- پست طنزآمیز چالشهای پذیرش هوش مصنوعی سازمانی را برجسته میکند و استقرار 1.4 میلیون دلاری Microsoft Copilot را با حداقل استفادهی واقعی اما گزارشدهی موفقیتآمیز معیارها برای ارائههای هیئتمدیره توصیف میکند @gothburz
اخلاق و جامعه
- رئیسجمهور ترامپ فرمان اجرایی چارچوب سیاست ملی برای هوش مصنوعی را امضا کرد و اعلام کرد که ایالات متحده باید یک استاندارد ملی با حداقل بار برای هوش مصنوعی داشته باشد، نه 50 قانون ایالتی متناقض @AndrewCurran_
- این فرمان اجرایی شامل ابزارهایی مانند کارگروه دعاوی DOJ، توقف بودجهی فدرال از ایالتهایی با قوانین هوش مصنوعی دستوپاگیر، تلاشهای FTC برای مهار تلاشهای ایالتها برای مجبور کردن مدلهای هوش مصنوعی به تغییر خروجیهای واقعی، و تلاشهای FCC برای مهار الزامات افشاگری است @AndrewCurran_
- یوتیوب سیستم تأیید سن مبتنی بر هوش مصنوعی را با استفاده از Gemini برای تعیین خودکار سن کاربر با تجزیه و تحلیل الگوهای مشاهده اعلام کرد، با کاربران که به اشتباه زیر 18 سال تخمین زده میشوند، ملزم به تأیید از طریق کارت اعتباری یا شناسهی دولتی هستند @AndrewCurran_
- آرویند نارایانان، محقق پرینستون، مقالهای منتشر کرد که در آن استدلال میکند که عدالت الگوریتمی یک خطای دستهبندی است و از مطالعهی کل سیستمهای اجتماعی-فنی به جای فقط زیرسیستمهای فنی هنگام طراحی بوروکراسیهای الگوریتمی حمایت میکند @random_walker
- تحلیلها نشان میدهد که اگر افراد زمان کوتاهی تا هوش مصنوعی تحولآفرین داشته باشند و معتقد باشند که برخی از ارزشهای انسانی اساساً آشتیناپذیر هستند، اطمینان از اینکه مدل برنده چارچوب اخلاقی آنها را در بر میگیرد، به طور فزایندهای مهمترین چیز در جهان به نظر خواهد رسید @AndrewCurran_
کاربردها
- Comet Android از Perplexity توانایی اشکالزدایی کد از طریق تلفن را با تجزیه و تحلیل لاگهای CI، ردیابی خطاها، یافتن راهحلها و باز کردن درخواستهای کشش آماده برای ادغام نشان میدهد @AravSrinivas
- ChatGPT اکنون شامل یک پوشهی /home/oai/skills با تعاریف مهارت برای PDFها، اسناد و صفحات گسترده است، با پشتیبانی آزمایشی نیز به Codex CLI اضافه شده است @simonw
- گوگل ترنسلیت ترجمهی گفتار به گفتار زنده با پشتیبانی از Gemini را در نسخهی بتا منتشر کرد که ترجمهی صوتی بلادرنگ را با درک ظرافتهای گفتار انسانی به ارمغان میآورد @TechCrunch
- ادوبی برنامههای رایگان یکپارچه با ChatGPT را برای فتوشاپ، آکروبات و اکسپرس در دسکتاپ، وب و iOS راهاندازی کرد که به کاربران امکان میدهد مستقیماً از داخل ChatGPT به برنامههای ادوبی دسترسی داشته باشند @gdb
- OpenAI همکاری با دیزنی را برای آوردن Sora و قابلیتهای تولید تصویر برای شخصیتهای دیزنی اعلام کرد که به کاربران امکان میدهد محتوا را با IP دیزنی تولید کنند @sama
- مایکروسافت همکاری هوش مصنوعی MahaCrimeOS را با ماهاراشترا برای حمایت از قربانیان جرایم سایبری و کلاهبرداری مالی اعلام کرد @satyanadella
- Moonlake مدل Reverie را معرفی کرد، یک مدل انتشار قابل برنامهریزی بلادرنگ که برای بازیها آموزش دیده است و قادر به شرطیسازی فراتر از پیکسلها است و به گیمپلی اجازه میدهد تا با حفظ مکانیک بازی به هر زیباییشناسی بازسازی شود @chrmanning
- کاربر گزارش میدهد که GPT-5.2 تحلیل طولانی و چشمگیری از اسکریپتهای بازی ارائه میدهد، جزئیات ظریف را درک میکند و تفسیرهایی مشابه کسی که بازی را عمیقاً بازی کرده است، با تقریباً بدون توهم، ارائه میدهد @AndrewCurran_
- Kimi K2 رفتار جستجوی گستردهای را در طول استدلال نشان میدهد، بارها برای حمایت از ادعاها، بررسی مثالهای نقض و تأیید اطلاعات قبل از ارائهی پاسخهای نهایی جستجو میکند @AndrewCurran_
پژوهشها
- Olmo 3.1 32B Think از Ai2 نشان میدهد که مقیاسبندی RL میتواند بسیار فراتر از انتظارات اولیه ادامه یابد، با افزایش عملکرد بیش از 125 هزار ساعت H100 با هزینهی تقریباً 250 هزار دلار، قابل مقایسه با مصرف منابع DeepSeek R1 @natolambert
- پژوهش Fast Flow Joint Distillation (F2D2) را معرفی میکند که NFEs را برای نمونهبرداری و ارزیابی احتمال به میزان دو مرتبه در مدلهای مبتنی بر جریان کاهش میدهد و در عین حال کیفیت نمونه را حفظ میکند @rsalakhu
- Google DeepMind پژوهشی را در مورد ارزیابی سیاستهای رباتیک Gemini در شبیهساز Veo World ارائه میدهد و یک ارزیاب عمومی برای آزمایش ایمنی ربات بدون شکستن اشیاء فیزیکی معرفی میکند @Majumdar_Ani
- فرانسوا شوله استدلال میکند که هوش مصنوعی از ماشین اتوماسیون به ماشین اختراع تکامل خواهد یافت و به یک پارادایم اساساً جدید با جستجوی نمادین به عنوان هستهی آن به جای برازش منحنی نیاز دارد @fchollet
- شوله توضیح میدهد که هوش سیال اندازهگیریشده توسط ARC با قابلیتهای اکتشاف، تعیین هدف و برنامهریزی مورد نیاز برای عوامل خودمختار متفاوت است، با اکتشاف سختترین و برنامهریزی آسانترین در میان این مشکلات باز @fchollet
- اولین LLM آموزشدیده در فضا با استفاده از NVIDIA H100 در Starcloud-1، همچنین اولین بار است که نسخهای از Gemini گوگل در فضا اجرا میشود، با استفاده از مدلهای متنباز بسیار کارآمد Gemma @demishassabis
- روش جدید جاسازی متن با استفاده از شبکهی کوچک ReLU برای تقریب ترانسفورمر بزرگ از ویژگی