اخبار هوش مصنوعی در 2025-12-31
مدلهای جدید هوش مصنوعی
- علیبابا مدل Qwen-Image-2512 را منتشر کرد؛ یک مدل تبدیل متن به تصویر ارتقاءیافته که رندرهای انسانی واقعگرایانهتر با «ظاهر هوش مصنوعی» کمتر، بافتهای طبیعی دقیقتر برای مناظر و مواد، و قابلیتهای رندر متن قویتر را ارائه میدهد. این مدل در بیش از 10,000 دور آزمایش کور در AI Arena، بهعنوان قویترین مدل تصویر متنباز رتبهبندی شده و در عین حال با سیستمهای متنبسته نیز رقابت میکند @Alibaba_Qwen
- وزارت علوم کرهی جنوبی، طرح هوش مصنوعی ملی را با پنج شرکت آغاز کرد که مدلهای متنباز خود را منتشر کردند: A.X-K1 از SK Telecom (مجموعاً 519 میلیارد، 33 میلیارد پارامتر فعال)، K-EXAONE از LG (مجموعاً 236 میلیارد، 23 میلیارد فعال)، VAETKI از NC-AI (مجموعاً 112 میلیارد، 10 میلیارد فعال)، Solar-Open از Upstage (مجموعاً 102 میلیارد، 12 میلیارد فعال)، و HyperCLOVAX-SEED-Think از Naver (32 میلیارد متراکم). این برنامهی 140 میلیون دلاری در دور اول، نیازمند آموزش از پایه، قابلیت استفادهی تجاری، و مقیاس بلندپروازانه است @eliebakouch
- OpenAI در 48 ساعت گذشته بیسروصدا «Codex cloud» را به «Codex web» تغییر نام داد @simonw
تحلیل صنعت
- بایتدنس قصد دارد سال آینده 14 میلیارد دلار برای پردازندههای گرافیکی H200 انویدیا هزینه کند، و شرکتهای چینی بیش از 2 میلیون H200 را برای سال 2026 سفارش دادهاند. TSMC باید 1.3 میلیون H200 را تولید کند که تقریباً 24,000 شروع ویفر نیاز دارد، و 3,000 ویفر در ماه از ظرفیت N4 را طی 8 ماه اختصاص میدهد که تقریباً 450 میلیون دلار برای TSMC درآمدزایی میکند @AndrewCurran_
- گزارشهای تأییدنشده ادعا میکنند که قیمتهای NVIDIA RTX 5090 ممکن است طی چند ماه آینده بهتدریج از 1,999 دلار به 5,000 دلار افزایش یابد، اگرچه هیچ بیانیهی رسمی از سوی انویدیا یا AMD منتشر نشده است @AndrewCurran_
- Scale AI گزارش میدهد که سهماههی چهارم 2025 بزرگترین سهماهه در تاریخ آنها بوده است، با رشد بیسابقهی کسبوکار دولتی ایالات متحده، کسبوکار دادهی سودآور، و چندین قرارداد سازمانی و دولتی نهرقمی @alexandr_wang
- سرمایهگذاران پیشبینی میکنند که هوش مصنوعی در سال 2026 به نیروی کار خواهد رسید، که نشاندهندهی تحول بزرگ در نیروی کار در آینده است @TechCrunch
- انتظار میرود تقاضا برای آموزش افراد غیربرنامهنویس برای تبدیل شدن به توسعهدهندگان توانمند با هوش مصنوعی بهشدت افزایش یابد، اگرچه تسلط بر اصول مهندسی نرمافزار همچنان نیازمند زمان و تلاش قابلتوجهی است که نمیتوان از آن صرفنظر کرد @GergelyOrosz
- کره در یک روز مدلهای با بیش از 100 میلیارد پارامتر بیشتری را منتشر کرد تا اتحادیهی اروپا یا ایالات متحده در کل سال 2025، که این امر تنها با تقریباً 1,000 پردازندهی گرافیکی B200 از سوی دولت انجام شد @eliebakouch
اخلاق و جامعه
- پلتفرم X به Grok اجازه میدهد بدون رضایت افراد تصویرشده، عکس تولید کند، که نگرانیهایی را در مورد رفتار نامناسب و عدم وجود مکانیزمهای رضایت ایجاد میکند @RhysSullivan
- تحلیلها این سؤال را مطرح میکنند که آیا راستیآزمایی هوش مصنوعی واقعاً محیط اطلاعاتی در X را بهبود بخشیده است یا خیر، و اشاره میکنند که Grok ظاهراً قادر به تغییر نظر شخصیتهای اصلی در مورد مسائل با اعتقاد قوی نیست، که نشاندهندهی محدودیتهای هوش مصنوعی در غلبه بر پیشفرضهای عمیق است و ابزارهای راستیآزمایی بیشتر از طریق دسترسی به اطلاعات، گفتمان را بهبود میبخشند تا از طریق اقناع @emollick
- رسانههای اجتماعی بهعنوان یک آرامبخش توصیف میشوند که باعث میشود مردم آزادی و اختیار خود را فراموش کنند، با یادآوری اینکه «شما میتوانید کارها را انجام دهید، اما ابتدا باید برنامه را ببندید» @fchollet
کاربردها
- کاربر، گزارش اشکالزدایی متخصص با هوش مصنوعی را با استفاده از هوش مصنوعی برای نوشتن اسکریپتهای پایتون که فایلهای خرابی را رمزگشایی میکنند، آنها را با فایلهای dsym مطابقت میدهند، و پایگاههای کد را برای یافتن ریشهی مشکلات تجزیه و تحلیل میکنند، نشان میدهد، با وجود اینکه هیچ دانشی از Zig، توسعهی macOS، یا ترمینالها ندارد. این منجر به رفع 4 مورد خرابی واقعی در Ghostty شد، که نشان میدهد چگونه درایورهای هوش مصنوعی با کیفیت بالا میتوانند در ترکیب با ناوبری انسانی متفکرانه و تفکر انتقادی، مشارکتهای ارزشمندی را ایجاد کنند @mitchellh
- توسعهدهنده گزارش میدهد که یک پروژهی افزونهی Jupyter را در 8 ساعت با استفاده از عوامل هوش مصنوعی با ابزارهای تست خاص بستهبندیشده بهعنوان مهارتها، مجموعههای تست جامع، و نظارت دقیق بر تفاوتها و ردیابی تفکر، تکمیل کرده است. با وجود قابلیت تکرار ویژگیها، توسعهدهنده اشاره میکند که این امر SaaS را از بین نمیبرد، به دلیل تعداد زیاد ویژگیها، مشکلات کوچک، و ترجیح برای واگذاری تنظیمات مداوم به تیمهای متمرکز با سلیقهی خوب @HamelHusain
- توسعهدهنده گزارش میدهد که 100% مشارکتها در Claude Code در سی روز گذشته توسط خود Claude Code نوشته شده است، که پیشبینی داریو مبنی بر اینکه 90% کد توسط هوش مصنوعی نوشته خواهد شد را تنها با چند ماه اختلاف تأیید میکند @emollick
- تسلا FSD V14.2 اولین رانندگی کاملاً خودران از ساحل به ساحل در سراسر ایالات متحده را بدون هیچگونه دخالتی تکمیل کرد، که 2,732.4 مایل از لسآنجلس تا میرتل بیچ را طی 2 روز و 20 ساعت، شامل تمام پارک کردن در سوپرشارژرهای تسلا، پوشش داد. این دستاورد یک نقطهی عطف بزرگ است که از ابتدا هدف تیم اتوپایلوت بود @karpathy
- جمینی قابلیتهای یادگیری تعاملی را با تولید تصاویر کاملاً تعاملی در هر موضوعی که کاربران میتوانند هر منطقهای را برای دریافت توضیحات کامل برجسته کنند، نشان میدهد، که پتانسیل بهبود آموزش را نشان میدهد @JeffDean
- مدلهای هوش مصنوعی تجسمیافته میتوانند زندگی روستایی را متحول کنند و به یک نفر با پشتیبانی رباتها امکان دهند تا یک مزرعهی کوچک را بهطور واقعبینانه اداره کند و مازاد تولید کند، با رباتهایی که بهعنوان تکنسینهای عمومی، مکانیکها، و پزشکان 24/7 در دسترس هستند @AndrewCurran_
- تمرکززدایی رادیکال توسعهی نرمافزار با حداقل 260 پیادهسازی سفارشی «loom» تا چند ماه پیش، که احتمالاً از آن زمان دو برابر شده است، در حال شتاب گرفتن است. این روند نشاندهندهی آیندهای است که در آن سیستمعاملهای شخصی و نرمافزارهای بومی هوش مصنوعی و خودتغییردهنده که بهعنوان ذهنهای توسعهیافته بهینه شدهاند، رایج میشوند و از نرمافزارهای متمرکز شرکتی به سمت راهحلهای خانگی حرکت میکنند @repligate
- ادغامهای Replit MCP امکان ایجاد وبسایت با پرداختهای جهانی را با یک بار انجام کار فراهم میکند، و به کاربران اجازه میدهد تا در کمتر از 10 دقیقه از ایده به پرداختهای تولیدی برسند، تنها با گفتن «add moneydevkit» @amasad
پژوهشها
- GPT-5.2 Pro عملکرد بسیار قوی در علوم و ریاضیات نشان میدهد و به توانایی حل مسائل FrontierMath Tier 4 نزدیک میشود، که شواهدی را ارائه میدهد که هوش مصنوعی میتواند استدلال پیچیدهی مورد نیاز برای پیشرفتهای علمی در حوزههای فنی را انجام دهد @gdb
- نمونهبرداری اهمیت بریدهشده (TIS) در یادگیری تقویتی، عدم تطابق بین موتورهای نمونهبردار (vLLM/SGLang) و موتورهای یادگیرنده (FSDP/DeepSpeed) را با مقیاسبندی گرادیانهای سیاست با نسبتهای اهمیت محدودشده، برطرف میکند. در حالی که TIS ممکن است پاداشهای ثبتشدهی کمتری را در طول آموزش نشان دهد (یک مصنوع از موتور نمونهبردار)، عملکرد نهایی مدل را با تصحیح عدم تطابق موتور بهبود میبخشد. تحلیلها نشان میدهد که تفاوتهای استراتژی توزیع و طول دنباله بهطور قابلتوجهی بر عدم تطابق تأثیر میگذارند، در حالی که انتخاب بکاند استنتاج حداقل تأثیر را دارد @cwolferesearch
- GLM-4.7 به امتیاز 1224 ELO در جدول ردهبندی GDPval-AA دست یافت و با افزایش 170 امتیازی نسبت به GLM-4.6، رهبر جدید وزنهای باز شد، به این معنی که انتظار میرود خروجیهای GLM-4.7 در مقایسههای رودررو، 73% مواقع GLM-4.6 را شکست دهند @xeophon
- K-EXAONE از LG دارای طراحی MoE دقیق است که با پیشبینی چند توکن (MTP) بهینه شده است، و امکان رمزگشایی خود-حدسی را فراهم میکند که توان عملیاتی استنتاج را تقریباً 1.5 برابر افزایش میدهد @ClementDelangue
- تری تائو، برندهی مدال فیلدز، در مورد آیندهی ریاضیات با سیستمهای اثبات رسمی بحث میکند و میگوید: «من متقاعد شدم که این آیندهی ریاضیات است... این یک سبک متفاوت از نوشتن اثبات است که در برخی جهات خواندن آن آسانتر است – بررسی آن برای انسانها دشوارتر است، اما ورودیها و خروجیهای یک اثبات را واضحتر میبینید، که نوشتار سنتی اغلب آن را پنهان میکند... فکر میکنم تعریف یک ریاضیدان گستردهتر خواهد شد» @mathematics_inc