اخبار هوش مصنوعی در 2025-12-31

مدل‌های جدید هوش مصنوعی

علی‌بابا مدل Qwen-Image-2512 را منتشر کرد؛ یک مدل تبدیل متن به تصویر ارتقاءیافته که رندرهای انسانی واقع‌گرایانه‌تر با «ظاهر هوش مصنوعی» کمتر، بافت‌های طبیعی دقیق‌تر برای مناظر و مواد، و قابلیت‌های رندر متن قوی‌تر را ارائه می‌دهد. این مدل در بیش از 10,000 دور آزمایش کور در AI Arena، به‌عنوان قوی‌ترین مدل تصویر متن‌باز رتبه‌بندی شده و در عین حال با سیستم‌های متن‌بسته نیز رقابت می‌کند @Alibaba_Qwen
وزارت علوم کره‌ی جنوبی، طرح هوش مصنوعی ملی را با پنج شرکت آغاز کرد که مدل‌های متن‌باز خود را منتشر کردند: A.X-K1 از SK Telecom (مجموعاً 519 میلیارد، 33 میلیارد پارامتر فعال)، K-EXAONE از LG (مجموعاً 236 میلیارد، 23 میلیارد فعال)، VAETKI از NC-AI (مجموعاً 112 میلیارد، 10 میلیارد فعال)، Solar-Open از Upstage (مجموعاً 102 میلیارد، 12 میلیارد فعال)، و HyperCLOVAX-SEED-Think از Naver (32 میلیارد متراکم). این برنامه‌ی 140 میلیون دلاری در دور اول، نیازمند آموزش از پایه، قابلیت استفاده‌ی تجاری، و مقیاس بلندپروازانه است @eliebakouch
OpenAI در 48 ساعت گذشته بی‌سروصدا «Codex cloud» را به «Codex web» تغییر نام داد @simonw

تحلیل صنعت

بایت‌دنس قصد دارد سال آینده 14 میلیارد دلار برای پردازنده‌های گرافیکی H200 انویدیا هزینه کند، و شرکت‌های چینی بیش از 2 میلیون H200 را برای سال 2026 سفارش داده‌اند. TSMC باید 1.3 میلیون H200 را تولید کند که تقریباً 24,000 شروع ویفر نیاز دارد، و 3,000 ویفر در ماه از ظرفیت N4 را طی 8 ماه اختصاص می‌دهد که تقریباً 450 میلیون دلار برای TSMC درآمدزایی می‌کند @AndrewCurran_
گزارش‌های تأییدنشده ادعا می‌کنند که قیمت‌های NVIDIA RTX 5090 ممکن است طی چند ماه آینده به‌تدریج از 1,999 دلار به 5,000 دلار افزایش یابد، اگرچه هیچ بیانیه‌ی رسمی از سوی انویدیا یا AMD منتشر نشده است @AndrewCurran_
Scale AI گزارش می‌دهد که سه‌ماهه‌ی چهارم 2025 بزرگ‌ترین سه‌ماهه در تاریخ آن‌ها بوده است، با رشد بی‌سابقه‌ی کسب‌وکار دولتی ایالات متحده، کسب‌وکار داده‌ی سودآور، و چندین قرارداد سازمانی و دولتی نه‌رقمی @alexandr_wang
سرمایه‌گذاران پیش‌بینی می‌کنند که هوش مصنوعی در سال 2026 به نیروی کار خواهد رسید، که نشان‌دهنده‌ی تحول بزرگ در نیروی کار در آینده است @TechCrunch
انتظار می‌رود تقاضا برای آموزش افراد غیربرنامه‌نویس برای تبدیل شدن به توسعه‌دهندگان توانمند با هوش مصنوعی به‌شدت افزایش یابد، اگرچه تسلط بر اصول مهندسی نرم‌افزار همچنان نیازمند زمان و تلاش قابل‌توجهی است که نمی‌توان از آن صرف‌نظر کرد @GergelyOrosz
کره در یک روز مدل‌های با بیش از 100 میلیارد پارامتر بیشتری را منتشر کرد تا اتحادیه‌ی اروپا یا ایالات متحده در کل سال 2025، که این امر تنها با تقریباً 1,000 پردازنده‌ی گرافیکی B200 از سوی دولت انجام شد @eliebakouch

اخلاق و جامعه

پلتفرم X به Grok اجازه می‌دهد بدون رضایت افراد تصویرشده، عکس تولید کند، که نگرانی‌هایی را در مورد رفتار نامناسب و عدم وجود مکانیزم‌های رضایت ایجاد می‌کند @RhysSullivan
تحلیل‌ها این سؤال را مطرح می‌کنند که آیا راستی‌آزمایی هوش مصنوعی واقعاً محیط اطلاعاتی در X را بهبود بخشیده است یا خیر، و اشاره می‌کنند که Grok ظاهراً قادر به تغییر نظر شخصیت‌های اصلی در مورد مسائل با اعتقاد قوی نیست، که نشان‌دهنده‌ی محدودیت‌های هوش مصنوعی در غلبه بر پیش‌فرض‌های عمیق است و ابزارهای راستی‌آزمایی بیشتر از طریق دسترسی به اطلاعات، گفتمان را بهبود می‌بخشند تا از طریق اقناع @emollick
رسانه‌های اجتماعی به‌عنوان یک آرام‌بخش توصیف می‌شوند که باعث می‌شود مردم آزادی و اختیار خود را فراموش کنند، با یادآوری اینکه «شما می‌توانید کارها را انجام دهید، اما ابتدا باید برنامه را ببندید» @fchollet

کاربردها

کاربر، گزارش اشکال‌زدایی متخصص با هوش مصنوعی را با استفاده از هوش مصنوعی برای نوشتن اسکریپت‌های پایتون که فایل‌های خرابی را رمزگشایی می‌کنند، آن‌ها را با فایل‌های dsym مطابقت می‌دهند، و پایگاه‌های کد را برای یافتن ریشه‌ی مشکلات تجزیه و تحلیل می‌کنند، نشان می‌دهد، با وجود اینکه هیچ دانشی از Zig، توسعه‌ی macOS، یا ترمینال‌ها ندارد. این منجر به رفع 4 مورد خرابی واقعی در Ghostty شد، که نشان می‌دهد چگونه درایورهای هوش مصنوعی با کیفیت بالا می‌توانند در ترکیب با ناوبری انسانی متفکرانه و تفکر انتقادی، مشارکت‌های ارزشمندی را ایجاد کنند @mitchellh
توسعه‌دهنده گزارش می‌دهد که یک پروژه‌ی افزونه‌ی Jupyter را در 8 ساعت با استفاده از عوامل هوش مصنوعی با ابزارهای تست خاص بسته‌بندی‌شده به‌عنوان مهارت‌ها، مجموعه‌های تست جامع، و نظارت دقیق بر تفاوت‌ها و ردیابی تفکر، تکمیل کرده است. با وجود قابلیت تکرار ویژگی‌ها، توسعه‌دهنده اشاره می‌کند که این امر SaaS را از بین نمی‌برد، به دلیل تعداد زیاد ویژگی‌ها، مشکلات کوچک، و ترجیح برای واگذاری تنظیمات مداوم به تیم‌های متمرکز با سلیقه‌ی خوب @HamelHusain
توسعه‌دهنده گزارش می‌دهد که 100% مشارکت‌ها در Claude Code در سی روز گذشته توسط خود Claude Code نوشته شده است، که پیش‌بینی داریو مبنی بر اینکه 90% کد توسط هوش مصنوعی نوشته خواهد شد را تنها با چند ماه اختلاف تأیید می‌کند @emollick
تسلا FSD V14.2 اولین رانندگی کاملاً خودران از ساحل به ساحل در سراسر ایالات متحده را بدون هیچ‌گونه دخالتی تکمیل کرد، که 2,732.4 مایل از لس‌آنجلس تا میرتل بیچ را طی 2 روز و 20 ساعت، شامل تمام پارک کردن در سوپرشارژرهای تسلا، پوشش داد. این دستاورد یک نقطه‌ی عطف بزرگ است که از ابتدا هدف تیم اتوپایلوت بود @karpathy
جمینی قابلیت‌های یادگیری تعاملی را با تولید تصاویر کاملاً تعاملی در هر موضوعی که کاربران می‌توانند هر منطقه‌ای را برای دریافت توضیحات کامل برجسته کنند، نشان می‌دهد، که پتانسیل بهبود آموزش را نشان می‌دهد @JeffDean
مدل‌های هوش مصنوعی تجسم‌یافته می‌توانند زندگی روستایی را متحول کنند و به یک نفر با پشتیبانی ربات‌ها امکان دهند تا یک مزرعه‌ی کوچک را به‌طور واقع‌بینانه اداره کند و مازاد تولید کند، با ربات‌هایی که به‌عنوان تکنسین‌های عمومی، مکانیک‌ها، و پزشکان 24/7 در دسترس هستند @AndrewCurran_
تمرکززدایی رادیکال توسعه‌ی نرم‌افزار با حداقل 260 پیاده‌سازی سفارشی «loom» تا چند ماه پیش، که احتمالاً از آن زمان دو برابر شده است، در حال شتاب گرفتن است. این روند نشان‌دهنده‌ی آینده‌ای است که در آن سیستم‌عامل‌های شخصی و نرم‌افزارهای بومی هوش مصنوعی و خودتغییردهنده که به‌عنوان ذهن‌های توسعه‌یافته بهینه شده‌اند، رایج می‌شوند و از نرم‌افزارهای متمرکز شرکتی به سمت راه‌حل‌های خانگی حرکت می‌کنند @repligate
ادغام‌های Replit MCP امکان ایجاد وب‌سایت با پرداخت‌های جهانی را با یک بار انجام کار فراهم می‌کند، و به کاربران اجازه می‌دهد تا در کمتر از 10 دقیقه از ایده به پرداخت‌های تولیدی برسند، تنها با گفتن «add moneydevkit» @amasad

پژوهش‌ها

GPT-5.2 Pro عملکرد بسیار قوی در علوم و ریاضیات نشان می‌دهد و به توانایی حل مسائل FrontierMath Tier 4 نزدیک می‌شود، که شواهدی را ارائه می‌دهد که هوش مصنوعی می‌تواند استدلال پیچیده‌ی مورد نیاز برای پیشرفت‌های علمی در حوزه‌های فنی را انجام دهد @gdb
نمونه‌برداری اهمیت بریده‌شده (TIS) در یادگیری تقویتی، عدم تطابق بین موتورهای نمونه‌بردار (vLLM/SGLang) و موتورهای یادگیرنده (FSDP/DeepSpeed) را با مقیاس‌بندی گرادیان‌های سیاست با نسبت‌های اهمیت محدودشده، برطرف می‌کند. در حالی که TIS ممکن است پاداش‌های ثبت‌شده‌ی کمتری را در طول آموزش نشان دهد (یک مصنوع از موتور نمونه‌بردار)، عملکرد نهایی مدل را با تصحیح عدم تطابق موتور بهبود می‌بخشد. تحلیل‌ها نشان می‌دهد که تفاوت‌های استراتژی توزیع و طول دنباله به‌طور قابل‌توجهی بر عدم تطابق تأثیر می‌گذارند، در حالی که انتخاب بک‌اند استنتاج حداقل تأثیر را دارد @cwolferesearch
GLM-4.7 به امتیاز 1224 ELO در جدول رده‌بندی GDPval-AA دست یافت و با افزایش 170 امتیازی نسبت به GLM-4.6، رهبر جدید وزن‌های باز شد، به این معنی که انتظار می‌رود خروجی‌های GLM-4.7 در مقایسه‌های رودررو، 73% مواقع GLM-4.6 را شکست دهند @xeophon
K-EXAONE از LG دارای طراحی MoE دقیق است که با پیش‌بینی چند توکن (MTP) بهینه شده است، و امکان رمزگشایی خود-حدسی را فراهم می‌کند که توان عملیاتی استنتاج را تقریباً 1.5 برابر افزایش می‌دهد @ClementDelangue
تری تائو، برنده‌ی مدال فیلدز، در مورد آینده‌ی ریاضیات با سیستم‌های اثبات رسمی بحث می‌کند و می‌گوید: «من متقاعد شدم که این آینده‌ی ریاضیات است... این یک سبک متفاوت از نوشتن اثبات است که در برخی جهات خواندن آن آسان‌تر است – بررسی آن برای انسان‌ها دشوارتر است، اما ورودی‌ها و خروجی‌های یک اثبات را واضح‌تر می‌بینید، که نوشتار سنتی اغلب آن را پنهان می‌کند... فکر می‌کنم تعریف یک ریاضیدان گسترده‌تر خواهد شد» @mathematics_inc