اخبار هوش مصنوعی در 2025-07-29

مدل‌های جدید هوش مصنوعی

  • Qwen3-30B-A3B با یک به‌روزرسانی کوچک همراه شده است که مهارت‌های استدلال، کدنویسی و ریاضیات را در آن بهبود بخشیده، دانش چندزبانه‌ی آن را گسترش داده، درک محتوای طولانی را تا 256 هزار توکن بهبود بخشیده و مشکل انسداد فکری را برطرف کرده است – این مدل با تنها 3 میلیارد پارامتر فعال‌شده، به عملکرد GPT-4o نزدیک می‌شود. @Alibaba_Qwen
  • گوگل Veo 3 و Veo 3 Fast را به‌صورت عمومی در Vertex AI منتشر می‌کند؛ این مدل‌ها قابلیت تولید یکپارچه‌ی ویدئو و صدا را از یک ورودی متنی (prompt) دارند. @GoogleCloudTech
  • گوگل MedGemma را راه‌اندازی می‌کند؛ مجموعه‌ای از مدل‌های پزشکی چندوجهیِ (multimodal) متن‌باز که برای کاربردهای مراقبت‌های بهداشتی مانند تحلیل تصاویر رادیولوژی و خلاصه‌سازی یادداشت‌های پزشکان طراحی شده‌اند. @GoogleAI
  • TencentARC از ARC-Hunyuan-Video-7B رونمایی می‌کند؛ یک مدل چندوجهی 7B فشرده برای درک ساختاریافته‌ی عمیق از ویدئوهای کوتاه واقعی، که سیگنال‌های بصری، صوتی و متنی را به‌صورت کامل (end-to-end) پردازش می‌کند. @HuggingPapers

تحلیل صنعت

  • گفته می‌شود مایکروسافت برای حفظ دسترسی به فناوری OpenAI پس از رسیدن به نقطه‌ی عطف AGI، در حال مذاکره است که نشان‌دهنده‌ی مذاکرات پیرامون شرایط همکاری‌های آتی است. @TechCrunch
  • گفته می‌شود Anthropic با دور تامین مالی احتمالی 5 میلیارد دلاری، به ارزش‌گذاری 170 میلیارد دلاری نزدیک می‌شود که نشان‌دهنده‌ی سرمایه‌گذاری گسترده و مداوم در شرکت‌های هوش مصنوعی است. @TechCrunch
  • گفته می‌شود فردی در شرکت Thinking Machines متعلق به میرا موراتی، پیشنهاد یک میلیارد دلاری مارک زاکربرگ را رد کرده است که ارزش‌گذاری‌های بسیار بالا در جذب استعدادهای هوش مصنوعی را برجسته می‌کند. @AndrewCurran_
  • مدیر محصول گروه (Group PM) گزارش می‌دهد که ابزارهای هوش مصنوعی مانند v0، مدیران محصول را قادر ساخته‌اند تا نمونه‌های اولیه‌ی مشتری را 10 برابر سریع‌تر تولید کنند و PRها را برای اصلاحات کوچک به‌طور مستقل ایجاد کنند که منجر به تکمیل سریع‌تر کارهای تجاری شده است. @GergelyOrosz
  • LLMها (مدل‌های زبانی بزرگ) به‌دلیل ماهیت غیرقطعی خود، برای تولید و نگهداری SDKها مناسب نیستند، اما می‌توانند به ساخت ابزارهای خودکار کمک کنند که SDKها را از روی مشخصات تولید می‌کنند. @GergelyOrosz
  • لوما و رانوی انتظار دارند که رباتیک در نهایت به یک محرک بزرگ درآمدزایی برای پلتفرم‌های تولید ویدئوی آن‌ها تبدیل شود. @TechCrunch

اخلاق و جامعه

  • حضور ربات‌ها در بحث‌های سیاسی در سراسر پلتفرم‌ها در حال افزایش است؛ به‌طوری که ربات‌های جدید فاقد نشانه‌های قدیمی هستند، اما الگوهای استدلالی مشابهی را در طول، چارچوب‌بندی، ریتم و لحن نشان می‌دهند و به‌طور بالقوه از آستانه‌ی نفوذ در رسانه‌های اجتماعی فراتر می‌روند. @AndrewCurran_
  • اکثر مردم خروجی‌های هوش مصنوعی را که برای کسانی که از مدل‌ها به‌طور گسترده استفاده کرده‌اند، واضح هستند، تشخیص نمی‌دهند؛ زیرا برخی افراد تنها به ادعاهای محتوایی توجه می‌کنند، نه به شکل آن‌ها. @AndrewCurran_

کاربردها

  • مرورگر Comet پرپلکسیتی، قابلیت‌های عامل هوش مصنوعی را با رزرو بلیط‌های یونایتد ایرلاینز، از جمله انتخاب صندلی، به نمایش می‌گذارد؛ این مرورگر تمامی جستجوهای omnibox را به‌طور پیش‌فرض به پرپلکسیتی مسیردهی می‌کند. @AravSrinivas
  • OpenAI حالت مطالعه (Study Mode) را در ChatGPT راه‌اندازی می‌کند؛ این حالت برای یادگیری تعاملی با استفاده از پرسش‌گری سقراطی و پاسخ‌های گام‌به‌گام طراحی شده است و برای کاربران نسخه‌های رایگان، پلاس، پرو و تیم در دسترس است. @OpenAI
  • مایکروسافت کوپایلوت می‌تواند پادکست‌های سفارشی را در هر موضوعی، با دو مجری که درباره‌ی موضوعات مشخص‌شده توسط کاربر بحث می‌کنند، تولید کند؛ این قابلیت برای یادگیری در حین حرکت مفید است. @mustafasuleyman
  • NotebookLM گوگل قابلیت نمای کلی ویدئو (Video Overviews) را عرضه می‌کند و قابلیت‌های خلاصه‌سازی محتوای خود را گسترش می‌دهد. @TechCrunch
  • حالت هوش مصنوعی گوگل، قابلیت جدید Canvas و کمک بلادرنگ (real-time) با Search Live را دریافت می‌کند که قابلیت‌های جستجوی تعاملی را افزایش می‌دهد. @TechCrunch
  • Cursor 1.3 با قابلیت همکاری عامل‌ها (Agents) در ترمینال، قابلیت مشاهده‌ی میزان استفاده از پنجره‌ی متنی (context window) و 25 درصد کاهش تاخیر در ویرایش‌های جستجو و جایگزینی (search and replace) راه‌اندازی می‌شود. @cursor_ai
  • Claude Code اکنون از کار در چندین دایرکتوری در یک جلسه‌ی کاری با استفاده از دستور `/add-dir ` پشتیبانی می‌کند که برای monorepoها و کارهای بین‌پروژه‌ای مفید است. @_catwu
  • سایبر دسک (Cyberdesk) نمایانگر یک کاربرد جالب از عامل‌های استفاده‌کننده‌ی از رایانه است و پتانسیل کشف‌نشده‌ی این حوزه‌ی فناوری را برجسته می‌کند. @cwolferesearch
  • Embedder به‌عنوان اولین عامل کدنویسی آگاه از سخت‌افزار در جهان راه‌اندازی می‌شود؛ این عامل با درک و تعامل مستقیم با سخت‌افزار، به عملکردی پیشرفته (state-of-the-art) در زمینه‌ی سیستم‌های جاسازی‌شده (embedded systems) (C/C++) دست می‌یابد. @ethanmgibbs

پژوهش‌ها

  • محققان استنفورد «آزمایشگاه مجازی» (Virtual Lab) را ایجاد می‌کنند – تیمی از عامل‌های هوش مصنوعی که آینه‌ی یک آزمایشگاه پژوهشی هستند و توسط یک عامل PI هدایت می‌شوند که جلسات گروهی را برگزار کرده و عوامل اتصال‌دهنده‌ی مؤثر برای سویه‌های جدید COVID را کشف می‌کند؛ این پژوهش در مجله‌ی Nature منتشر شده است. @james_y_zou
  • Anthropic برنامه‌ی Fellows را اعلام می‌کند که کمک‌هزینه‌ی هفتگی 2100 دلاری، حدود 15 هزار دلار هزینه‌ی محاسباتی ماهانه و راهنمایی برای پژوهش در زمینه‌های پایداری در برابر حملات (adversarial robustness)، کنترل هوش مصنوعی، نظارت مقیاس‌پذیر، ارگانیسم‌های مدل ناهماهنگی (model organisms of misalignment) و تفسیرپذیری مکانیکی (mechanistic interpretability) ارائه می‌دهد. @AnthropicAI
  • پژوهش نشان می‌دهد که «یادگیری ناخودآگاه» (subliminal learning) حالتی است که در آن مدل‌های زبانی می‌توانند ویژگی‌های خود را حتی در داده‌هایی که ظاهراً بی‌معنی هستند، به مدل‌های دیگر منتقل کنند. @AnthropicAI
  • مطالعه‌ای مواردی از مقیاس‌گذاری معکوس (inverse scaling) را در محاسبات زمان آزمون (test-time compute) یافته است که در آن استدلال بیشتر منجر به نتایج بدتر می‌شود. @AnthropicAI
  • قابلیت‌های HELM نسخه‌ی 1.9.0 منتشر شد که نشان می‌دهد Grok 4 و Kimi K2 در مجموع در بین 10 رتبه‌ی برتر قرار گرفته‌اند و Kimi K2 بهترین مدل «غیرمتفکر» (non-thinking) است. @percyliang
  • گرادیان‌های خط‌مشی تطبیق جریان (Flow Matching Policy Gradients) به‌عنوان خط‌مشی‌های (policies) RL بیانگر معرفی شدند که با استفاده از تطبیق جریان (flow matching) و از پاداش‌ها آموزش دیده‌اند و به‌عنوان جایگزینی مستقیم (drop-in replacement) برای PPO گاوسی (Gaussian PPO) در وظایف کنترلی عمل می‌کنند. @davidrmcall
  • «سوون مین» (Sewon Min) اولین جایزه‌ی پایان‌نامه‌ی دکتری ACL در رشته‌ی زبان‌شناسی محاسباتی (Computational Linguistics) را برای اثر خود با عنوان «بازاندیشی در استفاده از داده‌ها در مدل‌های زبانی بزرگ» دریافت کرد. @berkeley_ai
  • مقاله‌ی GSPO تیم Qwen علی‌بابا، سومین مقاله‌ی محبوب ماه در Hugging Face شد که انتظار می‌رود تاثیر گسترده‌ای بر این حوزه داشته باشد. @ClementDelangue