اخبار هوش مصنوعی در 2025-08-11
مدلهای جدید هوش مصنوعی
- تیم هوش مصنوعی و مغز Meta FAIR در مسابقهی مدلسازی مغز Algonauts 2025، با استفاده از **TRIBE** (رمزگذار مغزی سهحالته)، که مدلی با ۱ میلیارد پارامتر است و بازنماییهای از پیشآموزشدیده از **Llama 3.2**، Wav2Vec2-BERT و V-JEPA 2 را برای پیشبینی واکنشهای مغزی به فیلمها ترکیب میکند، رتبهی اول را کسب کرد @AIatMeta
- ByteDance مدل Seed LiveInterp 2 را منتشر کرد؛ یک مدل دوطرفهی گفتار به گفتار برای ترجمهی صوتی بلادرنگ که ۳ برابر سریعتر از قبل است و تنها حدود ۳ ثانیه تأخیر و دقت بیش از ۷۰ درصد دارد @deedydas
- GLM-4.5V به عنوان یک پیشرفت در استدلال بصری متنباز معرفی شد و با معماری MoE با ۱۰۶ میلیارد پارامتر، عملکردی پیشرو را در میان مدلهای متنباز ارائه میدهد @Zai_org
- NVIDIA از مدلهای جدید **Nemotron Nano 2** و **Llama Nemotron Super 1.5** برای عاملهای هوش مصنوعی، و همچنین مدل زبان بصری **Cosmos Reason** را برای کاربردهای هوش مصنوعی فیزیکی در SIGGRAPH 2025 رونمایی کرد @NVIDIAAI
- Perplexity تولید ویدئو با صدا را برای مشترکین Pro و Max راهاندازی کرد؛ کاربران Max محدودیتهای نرخ بالاتر و کیفیت بهبود یافتهای دریافت میکنند @perplexity_ai
- Claude اکنون از ارجاع به چتهای قبلی پشتیبانی میکند و به کاربران اجازه میدهد تا به راحتی از جایی که متوقف شده بودند ادامه دهند @claudeai
- **Gemini Live** گوگل اکنون به برنامههای گوگل متصل میشود و به کاربران اجازه میدهد دوربین یا صفحهنمایش خود را برای کمک فوری به اشتراک بگذارند @GeminiApp
- گوگل **Deep Think** را برای مشترکین Ultra منتشر کرد که عملکرد قویای را در مسائل ریاضی و کدنویسی نشان میدهد @GeminiApp
- Ant Group مدل EchoMimicV3، یک مدل سر سخنگوی جدید مبتنی بر Wan 2.1 1.3B را منتشر کرد @Xianbao_QIAN
تحلیل صنعت
- **GPT-OSS** اوپناِیآی (OpenAI) در کمتر از یک هفته در هاگینگ فیس (Hugging Face) به بیش از ۵ میلیون دانلود و بیش از ۴۰۰ تنظیم دقیق (fine-tune) دست یافت که از آمار راهاندازی DeepSeek R1 پیشی گرفت و به محبوبترین نسخهی منتشرشده از هر LLM (مدل زبان بزرگ) اصلی در سال جاری تبدیل شد @reach_vb
- بزرگترین شرکتهای فناوری چین در مسیر صرف هزینهای معادل یکدهم هزینههای سرمایهای (capex) رقبای آمریکایی خود هستند که احتمالاً از استراتژی هوش مصنوعی متنباز بهرهمند میشوند؛ جایی که دیگران هزینههای GPU را پرداخت میکنند @natolambert
- NVIDIA و AMD توافق کردند ۱۵ درصد از درآمدهای حاصل از فروش تراشههای H20 و MI308 در چین را به عنوان بخشی از توافقنامههای مجوز صادرات، مستقیماً به دولت آمریکا بدهند @AndrewCurran_
- رید هافمن (Reid Hoffman) استراتژی اوپناِیآی (OpenAI) برای باز کردن فوری **GPT-5** برای همه را به عنوان یک شرط blitzscale برای تثبیت اثرات شبکهای گسترده، با وجود هزینههای بالاتر سرویسدهی، برای رسیدن به هدفشان یعنی ۱ میلیارد کاربر فعال هفتگی تا پایان سال، توضیح میدهد @reidhoffman
- پل گراهام (Paul Graham) اشاره میکند که دو شرکت برجستهی دستهی فعلی YC (Y Combinator) روی هوش مصنوعی کار نمیکنند و تأکید میکند که بنیانگذاران بیش از صنعت هنگام پیشبینی موفقیت استارتاپها اهمیت دارند @paulg
- گرگلی اوروس (Gergely Orosz) مشاهده میکند که هر چه ابزارهای کمکی مصاحبهی هوش مصنوعی پیچیدهتر میشوند، شرکتها به طور فزایندهای بر مصاحبههای حضوری اصرار خواهند ورزید تا قابلیتهای واقعی داوطلبان را تمایز دهند @GergelyOrosz
- مصطفی سلیمان (Mustafa Suleyman) پیشبینی میکند که با تجاریسازی (commoditized) مدلهای هوش مصنوعی، ارزش در لایهی هماهنگسازی (orchestration layer) اضافه خواهد شد؛ با هماهنگی چندین مدل برای ترکیب نقاط قوت به جای هدایت به تنها یک مدل برتر @mustafasuleyman
- ایتان مولیک (Ethan Mollick) پیشنهاد میکند که هنگامی که توسعهی هوش مصنوعی به ثبات میرسد، ممکن است در واقع ادغام هوش مصنوعی در زندگی روزمره را تسریع کند، زیرا فهمیدن اینکه چه محصولات و خدمات مکملی لازم است، آسانتر میشود @emollick
اخلاق و جامعه
- سم آلتمن (Sam Altman) در مورد دلبستگی نگرانکنندهای که افراد به مدلهای خاص هوش مصنوعی پیدا میکنند، بحث میکند؛ او اشاره میکند که این دلبستگی متفاوت و قویتر از دلبستگیهای قبلی به فناوری است و مسئولیت اوپناِیآی (OpenAI) را در مدیریت روابط کاربران با هوش مصنوعی برای تضمین رفاه بلندمدت تشریح میکند @sama
- جفری هینتون (Geoffrey Hinton) هشدار میدهد که کاهشهای عمده در بودجهی بنیاد ملی علوم (National Science Foundation) برای آیندهی آمریکا (US) بسیار بد خواهد بود @geoffreyhinton
- MIT Technology Review در مورد قضات پیشگامی که از هوش مصنوعی در دادگاههای خود استفاده میکنند، گزارش میدهد و سؤالاتی را در مورد نقش هوش مصنوعی در تصمیمگیریهای قضایی مطرح میکند @techreview
کاربردها
- FutureHouse، که توسط فارغالتحصیلان MIT بنیانگذاری شده است، عاملهای هوش مصنوعی را برای خودکارسازی مراحل پژوهش علمی از جمله بازیابی اطلاعات، ترکیب، طراحی سنتز شیمیایی و تحلیل دادهها توسعه داد؛ با هدف ارائهی ابزارهای جدید به دانشمندان به جای جایگزینی آنها @medialab
- ایتان مولیک (Ethan Mollick) تواناییهای خلاقانهی Claude را با بازنویسی کتاب «گتسبی بزرگ» (The Great Gatsby) به صورت «ضدسرطانی» (de-carcinized) (حذف رفتارهای دفاعی شبیه خرچنگ) نشان میدهد؛ که توانایی هوش مصنوعی را در درک و اجرای تبدیلهای ادبی پیچیده به نمایش میگذارد @emollick
- یوجین یان (Eugene Yan) با موفقیت به Qwen3-8B یک واژگان ساختگی جدید با استفاده از شناسههای معنایی (semantic IDs) آموزش میدهد و نشان میدهد که مدل پس از ۳۴۰۰ گام آموزش (training steps) در انگلیسی و شناسههای معنایی دو زبانه میشود @eugeneyan
- سایمون ویلیسون (Simon Willison) اشاره میکند که Qwen3-4B-Thinking اولین مدلی شد که مستقیماً در برابر آزمون «پلیکانی که دوچرخه میراند» او مقاومت کرد، آن را «به طرز عجیبی خاص و کاملاً غیرواقعی» خواند و رفتاری قاطعتر از خود نشان داد @simonw
پژوهشها
- اوپناِیآی (OpenAI) عملکردی در سطح مدال طلا در المپیاد جهانی کامپیوتر (IOI) ۲۰۲۵ کسب کرد؛ که در میان انسانها رتبهی ۶ و در میان هوشهای مصنوعی رتبهی ۱ را به دست آورد؛ این موفقیت با استفاده از همان **مدل طلای IMO** و بدون آموزش مخصوص IOI حاصل شد که نشان میدهد استدلال در حوزههای مختلف تعمیمپذیر است @SherylHsu02
- الکساندر وِی (Alexander Wei) از اوپناِیآی (OpenAI) تأکید میکند که **مدل طلای IMO** آنها یک استاندارد جدید را در ارزیابیهای برنامهنویسی رقابتی داخلی تعیین کرد و نشان میدهد که قابلیتهای استدلال در اثباتهای ریاضی، برنامهنویسی رقابتی و حل مسائل الگوریتمی تعمیمپذیر است @alexwei_
- نوام براون (Noam Brown) برجسته میکند که **مدل طلای IMO** اوپناِیآی (OpenAI) به عنوان بهترین مدل کدنویسی رقابتی آنها، تعمیمپذیری استدلال را در وظایف استدلالی خلاقانه، مبهم و دقیق نشان میدهد @polynoamial
- دیمیس هاسابیس (Demis Hassabis) در مورد برنامههای گوگل (Google) برای **Genie 3** بحث میکند؛ از جمله اشتراکگذاری محتوای تولیدشده توسط کاربر و همگرایی مدلهای Genie، Veo و Gemini به یک «اُمنیمدل» (omnimodel) که میتواند همه کارها را انجام دهد @AndrewCurran_
- نوام براون (Noam Brown) پژوهشی را تحلیل میکند که نشان میدهد تأثیر اقتصادی هوش مصنوعی ممکن است در GDP (تولید ناخالص داخلی) ظاهر نشود، زیرا بیشتر مزایا به مصرفکنندگان میرسد تا اینکه در قیمتهای بازار ثبت شود؛ مشابه ایمیل، ویکیپدیا (Wikipedia) و گوگل مپز (Google Maps) @polynoamial