اخبار هوش مصنوعی در 2025-07-29

مدل‌های جدید هوش مصنوعی

Qwen3-30B-A3B با یک به‌روزرسانی کوچک همراه شده است که مهارت‌های استدلال، کدنویسی و ریاضیات را در آن بهبود بخشیده، دانش چندزبانه‌ی آن را گسترش داده، درک محتوای طولانی را تا 256 هزار توکن بهبود بخشیده و مشکل انسداد فکری را برطرف کرده است – این مدل با تنها 3 میلیارد پارامتر فعال‌شده، به عملکرد GPT-4o نزدیک می‌شود. @Alibaba_Qwen
گوگل Veo 3 و Veo 3 Fast را به‌صورت عمومی در Vertex AI منتشر می‌کند؛ این مدل‌ها قابلیت تولید یکپارچه‌ی ویدئو و صدا را از یک ورودی متنی (prompt) دارند. @GoogleCloudTech
گوگل MedGemma را راه‌اندازی می‌کند؛ مجموعه‌ای از مدل‌های پزشکی چندوجهیِ (multimodal) متن‌باز که برای کاربردهای مراقبت‌های بهداشتی مانند تحلیل تصاویر رادیولوژی و خلاصه‌سازی یادداشت‌های پزشکان طراحی شده‌اند. @GoogleAI
TencentARC از ARC-Hunyuan-Video-7B رونمایی می‌کند؛ یک مدل چندوجهی 7B فشرده برای درک ساختاریافته‌ی عمیق از ویدئوهای کوتاه واقعی، که سیگنال‌های بصری، صوتی و متنی را به‌صورت کامل (end-to-end) پردازش می‌کند. @HuggingPapers

تحلیل صنعت

گفته می‌شود مایکروسافت برای حفظ دسترسی به فناوری OpenAI پس از رسیدن به نقطه‌ی عطف AGI، در حال مذاکره است که نشان‌دهنده‌ی مذاکرات پیرامون شرایط همکاری‌های آتی است. @TechCrunch
گفته می‌شود Anthropic با دور تامین مالی احتمالی 5 میلیارد دلاری، به ارزش‌گذاری 170 میلیارد دلاری نزدیک می‌شود که نشان‌دهنده‌ی سرمایه‌گذاری گسترده و مداوم در شرکت‌های هوش مصنوعی است. @TechCrunch
گفته می‌شود فردی در شرکت Thinking Machines متعلق به میرا موراتی، پیشنهاد یک میلیارد دلاری مارک زاکربرگ را رد کرده است که ارزش‌گذاری‌های بسیار بالا در جذب استعدادهای هوش مصنوعی را برجسته می‌کند. @AndrewCurran_
مدیر محصول گروه (Group PM) گزارش می‌دهد که ابزارهای هوش مصنوعی مانند v0، مدیران محصول را قادر ساخته‌اند تا نمونه‌های اولیه‌ی مشتری را 10 برابر سریع‌تر تولید کنند و PRها را برای اصلاحات کوچک به‌طور مستقل ایجاد کنند که منجر به تکمیل سریع‌تر کارهای تجاری شده است. @GergelyOrosz
LLMها (مدل‌های زبانی بزرگ) به‌دلیل ماهیت غیرقطعی خود، برای تولید و نگهداری SDKها مناسب نیستند، اما می‌توانند به ساخت ابزارهای خودکار کمک کنند که SDKها را از روی مشخصات تولید می‌کنند. @GergelyOrosz
لوما و رانوی انتظار دارند که رباتیک در نهایت به یک محرک بزرگ درآمدزایی برای پلتفرم‌های تولید ویدئوی آن‌ها تبدیل شود. @TechCrunch

اخلاق و جامعه

حضور ربات‌ها در بحث‌های سیاسی در سراسر پلتفرم‌ها در حال افزایش است؛ به‌طوری که ربات‌های جدید فاقد نشانه‌های قدیمی هستند، اما الگوهای استدلالی مشابهی را در طول، چارچوب‌بندی، ریتم و لحن نشان می‌دهند و به‌طور بالقوه از آستانه‌ی نفوذ در رسانه‌های اجتماعی فراتر می‌روند. @AndrewCurran_
اکثر مردم خروجی‌های هوش مصنوعی را که برای کسانی که از مدل‌ها به‌طور گسترده استفاده کرده‌اند، واضح هستند، تشخیص نمی‌دهند؛ زیرا برخی افراد تنها به ادعاهای محتوایی توجه می‌کنند، نه به شکل آن‌ها. @AndrewCurran_

کاربردها

مرورگر Comet پرپلکسیتی، قابلیت‌های عامل هوش مصنوعی را با رزرو بلیط‌های یونایتد ایرلاینز، از جمله انتخاب صندلی، به نمایش می‌گذارد؛ این مرورگر تمامی جستجوهای omnibox را به‌طور پیش‌فرض به پرپلکسیتی مسیردهی می‌کند. @AravSrinivas
OpenAI حالت مطالعه (Study Mode) را در ChatGPT راه‌اندازی می‌کند؛ این حالت برای یادگیری تعاملی با استفاده از پرسش‌گری سقراطی و پاسخ‌های گام‌به‌گام طراحی شده است و برای کاربران نسخه‌های رایگان، پلاس، پرو و تیم در دسترس است. @OpenAI
مایکروسافت کوپایلوت می‌تواند پادکست‌های سفارشی را در هر موضوعی، با دو مجری که درباره‌ی موضوعات مشخص‌شده توسط کاربر بحث می‌کنند، تولید کند؛ این قابلیت برای یادگیری در حین حرکت مفید است. @mustafasuleyman
NotebookLM گوگل قابلیت نمای کلی ویدئو (Video Overviews) را عرضه می‌کند و قابلیت‌های خلاصه‌سازی محتوای خود را گسترش می‌دهد. @TechCrunch
حالت هوش مصنوعی گوگل، قابلیت جدید Canvas و کمک بلادرنگ (real-time) با Search Live را دریافت می‌کند که قابلیت‌های جستجوی تعاملی را افزایش می‌دهد. @TechCrunch
Cursor 1.3 با قابلیت همکاری عامل‌ها (Agents) در ترمینال، قابلیت مشاهده‌ی میزان استفاده از پنجره‌ی متنی (context window) و 25 درصد کاهش تاخیر در ویرایش‌های جستجو و جایگزینی (search and replace) راه‌اندازی می‌شود. @cursor_ai
Claude Code اکنون از کار در چندین دایرکتوری در یک جلسه‌ی کاری با استفاده از دستور `/add-dir ` پشتیبانی می‌کند که برای monorepoها و کارهای بین‌پروژه‌ای مفید است. @_catwu
سایبر دسک (Cyberdesk) نمایانگر یک کاربرد جالب از عامل‌های استفاده‌کننده‌ی از رایانه است و پتانسیل کشف‌نشده‌ی این حوزه‌ی فناوری را برجسته می‌کند. @cwolferesearch
Embedder به‌عنوان اولین عامل کدنویسی آگاه از سخت‌افزار در جهان راه‌اندازی می‌شود؛ این عامل با درک و تعامل مستقیم با سخت‌افزار، به عملکردی پیشرفته (state-of-the-art) در زمینه‌ی سیستم‌های جاسازی‌شده (embedded systems) (C/C++) دست می‌یابد. @ethanmgibbs

پژوهش‌ها

محققان استنفورد «آزمایشگاه مجازی» (Virtual Lab) را ایجاد می‌کنند – تیمی از عامل‌های هوش مصنوعی که آینه‌ی یک آزمایشگاه پژوهشی هستند و توسط یک عامل PI هدایت می‌شوند که جلسات گروهی را برگزار کرده و عوامل اتصال‌دهنده‌ی مؤثر برای سویه‌های جدید COVID را کشف می‌کند؛ این پژوهش در مجله‌ی Nature منتشر شده است. @james_y_zou
Anthropic برنامه‌ی Fellows را اعلام می‌کند که کمک‌هزینه‌ی هفتگی 2100 دلاری، حدود 15 هزار دلار هزینه‌ی محاسباتی ماهانه و راهنمایی برای پژوهش در زمینه‌های پایداری در برابر حملات (adversarial robustness)، کنترل هوش مصنوعی، نظارت مقیاس‌پذیر، ارگانیسم‌های مدل ناهماهنگی (model organisms of misalignment) و تفسیرپذیری مکانیکی (mechanistic interpretability) ارائه می‌دهد. @AnthropicAI
پژوهش نشان می‌دهد که «یادگیری ناخودآگاه» (subliminal learning) حالتی است که در آن مدل‌های زبانی می‌توانند ویژگی‌های خود را حتی در داده‌هایی که ظاهراً بی‌معنی هستند، به مدل‌های دیگر منتقل کنند. @AnthropicAI
مطالعه‌ای مواردی از مقیاس‌گذاری معکوس (inverse scaling) را در محاسبات زمان آزمون (test-time compute) یافته است که در آن استدلال بیشتر منجر به نتایج بدتر می‌شود. @AnthropicAI
قابلیت‌های HELM نسخه‌ی 1.9.0 منتشر شد که نشان می‌دهد Grok 4 و Kimi K2 در مجموع در بین 10 رتبه‌ی برتر قرار گرفته‌اند و Kimi K2 بهترین مدل «غیرمتفکر» (non-thinking) است. @percyliang
گرادیان‌های خط‌مشی تطبیق جریان (Flow Matching Policy Gradients) به‌عنوان خط‌مشی‌های (policies) RL بیانگر معرفی شدند که با استفاده از تطبیق جریان (flow matching) و از پاداش‌ها آموزش دیده‌اند و به‌عنوان جایگزینی مستقیم (drop-in replacement) برای PPO گاوسی (Gaussian PPO) در وظایف کنترلی عمل می‌کنند. @davidrmcall
«سوون مین» (Sewon Min) اولین جایزه‌ی پایان‌نامه‌ی دکتری ACL در رشته‌ی زبان‌شناسی محاسباتی (Computational Linguistics) را برای اثر خود با عنوان «بازاندیشی در استفاده از داده‌ها در مدل‌های زبانی بزرگ» دریافت کرد. @berkeley_ai
مقاله‌ی GSPO تیم Qwen علی‌بابا، سومین مقاله‌ی محبوب ماه در Hugging Face شد که انتظار می‌رود تاثیر گسترده‌ای بر این حوزه داشته باشد. @ClementDelangue