اخبار هوش مصنوعی در 2025-08-11

مدل‌های جدید هوش مصنوعی

تیم هوش مصنوعی و مغز Meta FAIR در مسابقه‌ی مدل‌سازی مغز Algonauts 2025، با استفاده از **TRIBE** (رمزگذار مغزی سه‌حالته)، که مدلی با ۱ میلیارد پارامتر است و بازنمایی‌های از پیش‌آموزش‌دیده از **Llama 3.2**، Wav2Vec2-BERT و V-JEPA 2 را برای پیش‌بینی واکنش‌های مغزی به فیلم‌ها ترکیب می‌کند، رتبه‌ی اول را کسب کرد @AIatMeta
ByteDance مدل Seed LiveInterp 2 را منتشر کرد؛ یک مدل دوطرفه‌ی گفتار به گفتار برای ترجمه‌ی صوتی بلادرنگ که ۳ برابر سریع‌تر از قبل است و تنها حدود ۳ ثانیه تأخیر و دقت بیش از ۷۰ درصد دارد @deedydas
GLM-4.5V به عنوان یک پیشرفت در استدلال بصری متن‌باز معرفی شد و با معماری MoE با ۱۰۶ میلیارد پارامتر، عملکردی پیشرو را در میان مدل‌های متن‌باز ارائه می‌دهد @Zai_org
NVIDIA از مدل‌های جدید **Nemotron Nano 2** و **Llama Nemotron Super 1.5** برای عامل‌های هوش مصنوعی، و همچنین مدل زبان بصری **Cosmos Reason** را برای کاربردهای هوش مصنوعی فیزیکی در SIGGRAPH 2025 رونمایی کرد @NVIDIAAI
Perplexity تولید ویدئو با صدا را برای مشترکین Pro و Max راه‌اندازی کرد؛ کاربران Max محدودیت‌های نرخ بالاتر و کیفیت بهبود یافته‌ای دریافت می‌کنند @perplexity_ai
Claude اکنون از ارجاع به چت‌های قبلی پشتیبانی می‌کند و به کاربران اجازه می‌دهد تا به راحتی از جایی که متوقف شده بودند ادامه دهند @claudeai
**Gemini Live** گوگل اکنون به برنامه‌های گوگل متصل می‌شود و به کاربران اجازه می‌دهد دوربین یا صفحه‌نمایش خود را برای کمک فوری به اشتراک بگذارند @GeminiApp
گوگل **Deep Think** را برای مشترکین Ultra منتشر کرد که عملکرد قوی‌ای را در مسائل ریاضی و کدنویسی نشان می‌دهد @GeminiApp
Ant Group مدل EchoMimicV3، یک مدل سر سخنگوی جدید مبتنی بر Wan 2.1 1.3B را منتشر کرد @Xianbao_QIAN

تحلیل صنعت

**GPT-OSS** اوپن‌اِی‌آی (OpenAI) در کمتر از یک هفته در هاگینگ فیس (Hugging Face) به بیش از ۵ میلیون دانلود و بیش از ۴۰۰ تنظیم دقیق (fine-tune) دست یافت که از آمار راه‌اندازی DeepSeek R1 پیشی گرفت و به محبوب‌ترین نسخه‌ی منتشرشده از هر LLM (مدل زبان بزرگ) اصلی در سال جاری تبدیل شد @reach_vb
بزرگ‌ترین شرکت‌های فناوری چین در مسیر صرف هزینه‌ای معادل یک‌دهم هزینه‌های سرمایه‌ای (capex) رقبای آمریکایی خود هستند که احتمالاً از استراتژی هوش مصنوعی متن‌باز بهره‌مند می‌شوند؛ جایی که دیگران هزینه‌های GPU را پرداخت می‌کنند @natolambert
NVIDIA و AMD توافق کردند ۱۵ درصد از درآمدهای حاصل از فروش تراشه‌های H20 و MI308 در چین را به عنوان بخشی از توافق‌نامه‌های مجوز صادرات، مستقیماً به دولت آمریکا بدهند @AndrewCurran_
رید هافمن (Reid Hoffman) استراتژی اوپن‌اِی‌آی (OpenAI) برای باز کردن فوری **GPT-5** برای همه را به عنوان یک شرط blitzscale برای تثبیت اثرات شبکه‌ای گسترده، با وجود هزینه‌های بالاتر سرویس‌دهی، برای رسیدن به هدفشان یعنی ۱ میلیارد کاربر فعال هفتگی تا پایان سال، توضیح می‌دهد @reidhoffman
پل گراهام (Paul Graham) اشاره می‌کند که دو شرکت برجسته‌ی دسته‌ی فعلی YC (Y Combinator) روی هوش مصنوعی کار نمی‌کنند و تأکید می‌کند که بنیان‌گذاران بیش از صنعت هنگام پیش‌بینی موفقیت استارتاپ‌ها اهمیت دارند @paulg
گرگلی اوروس (Gergely Orosz) مشاهده می‌کند که هر چه ابزارهای کمکی مصاحبه‌ی هوش مصنوعی پیچیده‌تر می‌شوند، شرکت‌ها به طور فزاینده‌ای بر مصاحبه‌های حضوری اصرار خواهند ورزید تا قابلیت‌های واقعی داوطلبان را تمایز دهند @GergelyOrosz
مصطفی سلیمان (Mustafa Suleyman) پیش‌بینی می‌کند که با تجاری‌سازی (commoditized) مدل‌های هوش مصنوعی، ارزش در لایه‌ی هماهنگ‌سازی (orchestration layer) اضافه خواهد شد؛ با هماهنگی چندین مدل برای ترکیب نقاط قوت به جای هدایت به تنها یک مدل برتر @mustafasuleyman
ایتان مولیک (Ethan Mollick) پیشنهاد می‌کند که هنگامی که توسعه‌ی هوش مصنوعی به ثبات می‌رسد، ممکن است در واقع ادغام هوش مصنوعی در زندگی روزمره را تسریع کند، زیرا فهمیدن اینکه چه محصولات و خدمات مکملی لازم است، آسان‌تر می‌شود @emollick

اخلاق و جامعه

سم آلتمن (Sam Altman) در مورد دلبستگی نگران‌کننده‌ای که افراد به مدل‌های خاص هوش مصنوعی پیدا می‌کنند، بحث می‌کند؛ او اشاره می‌کند که این دلبستگی متفاوت و قوی‌تر از دلبستگی‌های قبلی به فناوری است و مسئولیت اوپن‌اِی‌آی (OpenAI) را در مدیریت روابط کاربران با هوش مصنوعی برای تضمین رفاه بلندمدت تشریح می‌کند @sama
جفری هینتون (Geoffrey Hinton) هشدار می‌دهد که کاهش‌های عمده در بودجه‌ی بنیاد ملی علوم (National Science Foundation) برای آینده‌ی آمریکا (US) بسیار بد خواهد بود @geoffreyhinton
MIT Technology Review در مورد قضات پیشگامی که از هوش مصنوعی در دادگاه‌های خود استفاده می‌کنند، گزارش می‌دهد و سؤالاتی را در مورد نقش هوش مصنوعی در تصمیم‌گیری‌های قضایی مطرح می‌کند @techreview

کاربردها

FutureHouse، که توسط فارغ‌التحصیلان MIT بنیان‌گذاری شده است، عامل‌های هوش مصنوعی را برای خودکارسازی مراحل پژوهش علمی از جمله بازیابی اطلاعات، ترکیب، طراحی سنتز شیمیایی و تحلیل داده‌ها توسعه داد؛ با هدف ارائه‌ی ابزارهای جدید به دانشمندان به جای جایگزینی آن‌ها @medialab
ایتان مولیک (Ethan Mollick) توانایی‌های خلاقانه‌ی Claude را با بازنویسی کتاب «گتسبی بزرگ» (The Great Gatsby) به صورت «ضدسرطانی» (de-carcinized) (حذف رفتارهای دفاعی شبیه خرچنگ) نشان می‌دهد؛ که توانایی هوش مصنوعی را در درک و اجرای تبدیل‌های ادبی پیچیده به نمایش می‌گذارد @emollick
یوجین یان (Eugene Yan) با موفقیت به Qwen3-8B یک واژگان ساختگی جدید با استفاده از شناسه‌های معنایی (semantic IDs) آموزش می‌دهد و نشان می‌دهد که مدل پس از ۳۴۰۰ گام آموزش (training steps) در انگلیسی و شناسه‌های معنایی دو زبانه می‌شود @eugeneyan
سایمون ویلیسون (Simon Willison) اشاره می‌کند که Qwen3-4B-Thinking اولین مدلی شد که مستقیماً در برابر آزمون «پلیکانی که دوچرخه می‌راند» او مقاومت کرد، آن را «به طرز عجیبی خاص و کاملاً غیرواقعی» خواند و رفتاری قاطع‌تر از خود نشان داد @simonw

پژوهش‌ها

اوپن‌اِی‌آی (OpenAI) عملکردی در سطح مدال طلا در المپیاد جهانی کامپیوتر (IOI) ۲۰۲۵ کسب کرد؛ که در میان انسان‌ها رتبه‌ی ۶ و در میان هوش‌های مصنوعی رتبه‌ی ۱ را به دست آورد؛ این موفقیت با استفاده از همان **مدل طلای IMO** و بدون آموزش مخصوص IOI حاصل شد که نشان می‌دهد استدلال در حوزه‌های مختلف تعمیم‌پذیر است @SherylHsu02
الکساندر وِی (Alexander Wei) از اوپن‌اِی‌آی (OpenAI) تأکید می‌کند که **مدل طلای IMO** آن‌ها یک استاندارد جدید را در ارزیابی‌های برنامه‌نویسی رقابتی داخلی تعیین کرد و نشان می‌دهد که قابلیت‌های استدلال در اثبات‌های ریاضی، برنامه‌نویسی رقابتی و حل مسائل الگوریتمی تعمیم‌پذیر است @alexwei_
نوام براون (Noam Brown) برجسته می‌کند که **مدل طلای IMO** اوپن‌اِی‌آی (OpenAI) به عنوان بهترین مدل کدنویسی رقابتی آن‌ها، تعمیم‌پذیری استدلال را در وظایف استدلالی خلاقانه، مبهم و دقیق نشان می‌دهد @polynoamial
دیمیس هاسابیس (Demis Hassabis) در مورد برنامه‌های گوگل (Google) برای **Genie 3** بحث می‌کند؛ از جمله اشتراک‌گذاری محتوای تولیدشده توسط کاربر و همگرایی مدل‌های Genie، Veo و Gemini به یک «اُمنی‌مدل» (omnimodel) که می‌تواند همه کارها را انجام دهد @AndrewCurran_
نوام براون (Noam Brown) پژوهشی را تحلیل می‌کند که نشان می‌دهد تأثیر اقتصادی هوش مصنوعی ممکن است در GDP (تولید ناخالص داخلی) ظاهر نشود، زیرا بیشتر مزایا به مصرف‌کنندگان می‌رسد تا اینکه در قیمت‌های بازار ثبت شود؛ مشابه ایمیل، ویکی‌پدیا (Wikipedia) و گوگل مپز (Google Maps) @polynoamial