اخبار هوش مصنوعی در 2025-08-11

مدل‌های جدید هوش مصنوعی

  • تیم هوش مصنوعی و مغز Meta FAIR در مسابقه‌ی مدل‌سازی مغز Algonauts 2025، با استفاده از **TRIBE** (رمزگذار مغزی سه‌حالته)، که مدلی با ۱ میلیارد پارامتر است و بازنمایی‌های از پیش‌آموزش‌دیده از **Llama 3.2**، Wav2Vec2-BERT و V-JEPA 2 را برای پیش‌بینی واکنش‌های مغزی به فیلم‌ها ترکیب می‌کند، رتبه‌ی اول را کسب کرد @AIatMeta
  • ByteDance مدل Seed LiveInterp 2 را منتشر کرد؛ یک مدل دوطرفه‌ی گفتار به گفتار برای ترجمه‌ی صوتی بلادرنگ که ۳ برابر سریع‌تر از قبل است و تنها حدود ۳ ثانیه تأخیر و دقت بیش از ۷۰ درصد دارد @deedydas
  • GLM-4.5V به عنوان یک پیشرفت در استدلال بصری متن‌باز معرفی شد و با معماری MoE با ۱۰۶ میلیارد پارامتر، عملکردی پیشرو را در میان مدل‌های متن‌باز ارائه می‌دهد @Zai_org
  • NVIDIA از مدل‌های جدید **Nemotron Nano 2** و **Llama Nemotron Super 1.5** برای عامل‌های هوش مصنوعی، و همچنین مدل زبان بصری **Cosmos Reason** را برای کاربردهای هوش مصنوعی فیزیکی در SIGGRAPH 2025 رونمایی کرد @NVIDIAAI
  • Perplexity تولید ویدئو با صدا را برای مشترکین Pro و Max راه‌اندازی کرد؛ کاربران Max محدودیت‌های نرخ بالاتر و کیفیت بهبود یافته‌ای دریافت می‌کنند @perplexity_ai
  • Claude اکنون از ارجاع به چت‌های قبلی پشتیبانی می‌کند و به کاربران اجازه می‌دهد تا به راحتی از جایی که متوقف شده بودند ادامه دهند @claudeai
  • **Gemini Live** گوگل اکنون به برنامه‌های گوگل متصل می‌شود و به کاربران اجازه می‌دهد دوربین یا صفحه‌نمایش خود را برای کمک فوری به اشتراک بگذارند @GeminiApp
  • گوگل **Deep Think** را برای مشترکین Ultra منتشر کرد که عملکرد قوی‌ای را در مسائل ریاضی و کدنویسی نشان می‌دهد @GeminiApp
  • Ant Group مدل EchoMimicV3، یک مدل سر سخنگوی جدید مبتنی بر Wan 2.1 1.3B را منتشر کرد @Xianbao_QIAN

تحلیل صنعت

  • **GPT-OSS** اوپن‌اِی‌آی (OpenAI) در کمتر از یک هفته در هاگینگ فیس (Hugging Face) به بیش از ۵ میلیون دانلود و بیش از ۴۰۰ تنظیم دقیق (fine-tune) دست یافت که از آمار راه‌اندازی DeepSeek R1 پیشی گرفت و به محبوب‌ترین نسخه‌ی منتشرشده از هر LLM (مدل زبان بزرگ) اصلی در سال جاری تبدیل شد @reach_vb
  • بزرگ‌ترین شرکت‌های فناوری چین در مسیر صرف هزینه‌ای معادل یک‌دهم هزینه‌های سرمایه‌ای (capex) رقبای آمریکایی خود هستند که احتمالاً از استراتژی هوش مصنوعی متن‌باز بهره‌مند می‌شوند؛ جایی که دیگران هزینه‌های GPU را پرداخت می‌کنند @natolambert
  • NVIDIA و AMD توافق کردند ۱۵ درصد از درآمدهای حاصل از فروش تراشه‌های H20 و MI308 در چین را به عنوان بخشی از توافق‌نامه‌های مجوز صادرات، مستقیماً به دولت آمریکا بدهند @AndrewCurran_
  • رید هافمن (Reid Hoffman) استراتژی اوپن‌اِی‌آی (OpenAI) برای باز کردن فوری **GPT-5** برای همه را به عنوان یک شرط blitzscale برای تثبیت اثرات شبکه‌ای گسترده، با وجود هزینه‌های بالاتر سرویس‌دهی، برای رسیدن به هدفشان یعنی ۱ میلیارد کاربر فعال هفتگی تا پایان سال، توضیح می‌دهد @reidhoffman
  • پل گراهام (Paul Graham) اشاره می‌کند که دو شرکت برجسته‌ی دسته‌ی فعلی YC (Y Combinator) روی هوش مصنوعی کار نمی‌کنند و تأکید می‌کند که بنیان‌گذاران بیش از صنعت هنگام پیش‌بینی موفقیت استارتاپ‌ها اهمیت دارند @paulg
  • گرگلی اوروس (Gergely Orosz) مشاهده می‌کند که هر چه ابزارهای کمکی مصاحبه‌ی هوش مصنوعی پیچیده‌تر می‌شوند، شرکت‌ها به طور فزاینده‌ای بر مصاحبه‌های حضوری اصرار خواهند ورزید تا قابلیت‌های واقعی داوطلبان را تمایز دهند @GergelyOrosz
  • مصطفی سلیمان (Mustafa Suleyman) پیش‌بینی می‌کند که با تجاری‌سازی (commoditized) مدل‌های هوش مصنوعی، ارزش در لایه‌ی هماهنگ‌سازی (orchestration layer) اضافه خواهد شد؛ با هماهنگی چندین مدل برای ترکیب نقاط قوت به جای هدایت به تنها یک مدل برتر @mustafasuleyman
  • ایتان مولیک (Ethan Mollick) پیشنهاد می‌کند که هنگامی که توسعه‌ی هوش مصنوعی به ثبات می‌رسد، ممکن است در واقع ادغام هوش مصنوعی در زندگی روزمره را تسریع کند، زیرا فهمیدن اینکه چه محصولات و خدمات مکملی لازم است، آسان‌تر می‌شود @emollick

اخلاق و جامعه

  • سم آلتمن (Sam Altman) در مورد دلبستگی نگران‌کننده‌ای که افراد به مدل‌های خاص هوش مصنوعی پیدا می‌کنند، بحث می‌کند؛ او اشاره می‌کند که این دلبستگی متفاوت و قوی‌تر از دلبستگی‌های قبلی به فناوری است و مسئولیت اوپن‌اِی‌آی (OpenAI) را در مدیریت روابط کاربران با هوش مصنوعی برای تضمین رفاه بلندمدت تشریح می‌کند @sama
  • جفری هینتون (Geoffrey Hinton) هشدار می‌دهد که کاهش‌های عمده در بودجه‌ی بنیاد ملی علوم (National Science Foundation) برای آینده‌ی آمریکا (US) بسیار بد خواهد بود @geoffreyhinton
  • MIT Technology Review در مورد قضات پیشگامی که از هوش مصنوعی در دادگاه‌های خود استفاده می‌کنند، گزارش می‌دهد و سؤالاتی را در مورد نقش هوش مصنوعی در تصمیم‌گیری‌های قضایی مطرح می‌کند @techreview

کاربردها

  • FutureHouse، که توسط فارغ‌التحصیلان MIT بنیان‌گذاری شده است، عامل‌های هوش مصنوعی را برای خودکارسازی مراحل پژوهش علمی از جمله بازیابی اطلاعات، ترکیب، طراحی سنتز شیمیایی و تحلیل داده‌ها توسعه داد؛ با هدف ارائه‌ی ابزارهای جدید به دانشمندان به جای جایگزینی آن‌ها @medialab
  • ایتان مولیک (Ethan Mollick) توانایی‌های خلاقانه‌ی Claude را با بازنویسی کتاب «گتسبی بزرگ» (The Great Gatsby) به صورت «ضدسرطانی» (de-carcinized) (حذف رفتارهای دفاعی شبیه خرچنگ) نشان می‌دهد؛ که توانایی هوش مصنوعی را در درک و اجرای تبدیل‌های ادبی پیچیده به نمایش می‌گذارد @emollick
  • یوجین یان (Eugene Yan) با موفقیت به Qwen3-8B یک واژگان ساختگی جدید با استفاده از شناسه‌های معنایی (semantic IDs) آموزش می‌دهد و نشان می‌دهد که مدل پس از ۳۴۰۰ گام آموزش (training steps) در انگلیسی و شناسه‌های معنایی دو زبانه می‌شود @eugeneyan
  • سایمون ویلیسون (Simon Willison) اشاره می‌کند که Qwen3-4B-Thinking اولین مدلی شد که مستقیماً در برابر آزمون «پلیکانی که دوچرخه می‌راند» او مقاومت کرد، آن را «به طرز عجیبی خاص و کاملاً غیرواقعی» خواند و رفتاری قاطع‌تر از خود نشان داد @simonw

پژوهش‌ها

  • اوپن‌اِی‌آی (OpenAI) عملکردی در سطح مدال طلا در المپیاد جهانی کامپیوتر (IOI) ۲۰۲۵ کسب کرد؛ که در میان انسان‌ها رتبه‌ی ۶ و در میان هوش‌های مصنوعی رتبه‌ی ۱ را به دست آورد؛ این موفقیت با استفاده از همان **مدل طلای IMO** و بدون آموزش مخصوص IOI حاصل شد که نشان می‌دهد استدلال در حوزه‌های مختلف تعمیم‌پذیر است @SherylHsu02
  • الکساندر وِی (Alexander Wei) از اوپن‌اِی‌آی (OpenAI) تأکید می‌کند که **مدل طلای IMO** آن‌ها یک استاندارد جدید را در ارزیابی‌های برنامه‌نویسی رقابتی داخلی تعیین کرد و نشان می‌دهد که قابلیت‌های استدلال در اثبات‌های ریاضی، برنامه‌نویسی رقابتی و حل مسائل الگوریتمی تعمیم‌پذیر است @alexwei_
  • نوام براون (Noam Brown) برجسته می‌کند که **مدل طلای IMO** اوپن‌اِی‌آی (OpenAI) به عنوان بهترین مدل کدنویسی رقابتی آن‌ها، تعمیم‌پذیری استدلال را در وظایف استدلالی خلاقانه، مبهم و دقیق نشان می‌دهد @polynoamial
  • دیمیس هاسابیس (Demis Hassabis) در مورد برنامه‌های گوگل (Google) برای **Genie 3** بحث می‌کند؛ از جمله اشتراک‌گذاری محتوای تولیدشده توسط کاربر و همگرایی مدل‌های Genie، Veo و Gemini به یک «اُمنی‌مدل» (omnimodel) که می‌تواند همه کارها را انجام دهد @AndrewCurran_
  • نوام براون (Noam Brown) پژوهشی را تحلیل می‌کند که نشان می‌دهد تأثیر اقتصادی هوش مصنوعی ممکن است در GDP (تولید ناخالص داخلی) ظاهر نشود، زیرا بیشتر مزایا به مصرف‌کنندگان می‌رسد تا اینکه در قیمت‌های بازار ثبت شود؛ مشابه ایمیل، ویکی‌پدیا (Wikipedia) و گوگل مپز (Google Maps) @polynoamial