اخبار هوش مصنوعی در 2025-08-28

مدل‌های جدید هوش مصنوعی

  • مایکروسافت MAI-1-preview، اولین مدل بنیادی‌اش را که به صورت درون‌سازمانی و جامع (end-to-end) آموزش دیده است، منتشر کرد. این مدل اکنون در حال آزمایش عمومی در LMArena است @mustafasuleyman
  • مایکروسافت MAI-Voice-1 را معرفی کرد؛ مدلی که گویاترین و طبیعی‌ترین مدل تولید صدای آن‌ها توصیف شده و می‌تواند یک دقیقه صدا را در کمتر از ۱ ثانیه با یک GPU تولید کند @mustafasuleyman
  • xAI، Grok Code Fast 1 را راه‌اندازی کرد؛ یک مدل استدلالی سریع و اقتصادی که در کدنویسی عامل‌محور (agentic coding) برتری دارد و به مدت ۷ روز به صورت رایگان در GitHub Copilot، Cursor و سایر پلتفرم‌ها در دسترس است @xai
  • OpenAI، gpt-realtime را معرفی کرد؛ بهترین مدل تبدیل گفتار به گفتار آن‌ها برای توسعه‌دهندگان، که Realtime API آن به طور رسمی از حالت بتا خارج شده و آماده برای عامل‌های صوتی تولیدی است @OpenAI
  • Cohere، Command A Translate را منتشر کرد؛ یک مدل پیشرفته که برای وظایف ترجمه‌ی باکیفیت بالا طراحی شده و از تمامی مدل‌های دیگر در کیفیت ترجمه پیشی می‌گیرد @cohere
  • آزمایشگاه هوش مصنوعی Tencent، HunyuanVideo-Foley را منتشر کرد؛ یک چارچوب جامع (end-to-end) تبدیل متن-ویدئو به صدا برای تولید صدای باکیفیت بالا که با استفاده از یک مجموعه‌داده‌ی چندوجهی (multimodal) عظیم ۱۰۰ هزار ساعته آموزش دیده است @TencentHunyuan

تحلیل صنعت

  • اندرو نگ، عامل‌های موازی (parallel agents) را به عنوان یک جهت‌گیری مهم و نوظهور برای مقیاس‌پذیری هوش مصنوعی شناسایی کرده است که راهی برای بهبود نتایج بدون منتظر نگه‌داشتن بیشتر کاربران ارائه می‌دهد، چرا که قیمت LLM به ازای هر توکن همچنان رو به کاهش است @AndrewYNg
  • پاول گراهام استدلال می‌کند که افرادی که در برنامه‌نویسی ماهر هستند، از هوش مصنوعی برای گرفتن مشاغل از کسانی که در آن متوسط هستند، استفاده خواهند کرد و تأکید می‌کند که انگیزه‌ی ساختن چیزها، بیش از صرفاً مهارت فنی اهمیت دارد @paulg
  • کاری سارینن گزارش می‌دهد که ۴۵٪ از مشتریان سازمانی، عامل‌های هوش مصنوعی Cursor را در Linear ظرف یک هفته پس از راه‌اندازی فعال کرده‌اند که نشان‌دهنده‌ی پذیرش سریع عامل‌های هوش مصنوعی در تیم‌های محصول است @karrisaarinen
  • Liquid AI بیش از یک میلیون دانلود مدل بنیادی را از طریق Hugging Face به دست آورد که نشان‌دهنده‌ی علاقه‌ی جامعه به مدل‌های کوچک طراحی‌شده بر اساس اصول اولیه است @ramin_m_h
  • Framer ۱۰۰ میلیون دلار در سری D با ارزش‌گذاری ۲ میلیارد دلار جذب سرمایه کرد و ادعا می‌کند که بیش از نیم میلیون کاربر فعال ماهانه برای سازنده‌ی وب‌سایت بدون کد (no-code) خود دارد @TechCrunch

اخلاق و جامعه

  • هیدی خلاف از مؤسسه‌ی AI Now در لیست ۱۰۰ AI مجله‌ی TIME به دلیل پرداختن به بازنگری ایمنی هوش مصنوعی در زمینه‌های دفاعی و حیاتی از نظر ایمنی، جایی که ایمنی با مسئولیت‌پذیری کم، پنهان شده است، شناخته شده است @HeidyKhlaaf
  • همل حسین گزارش می‌دهد که مشکلات کیفیت قابل توجهی را با GPT-5 در API تجربه کرده است، از جمله اشتباهات تایپی عجیب، خطاهای نگارشی و پاسخ‌های بی‌معنی که در طول هفته تشدید شده‌اند @clairevo
  • آرویند نارایانان مشاهده می‌کند که مدل‌های توانمندتر لزوماً به معنای محصولات مفیدتر نیستند و به تصمیم Anthropic برای آموزش بر روی داده‌های کاربر، پس از مقاومت طولانی‌مدت، اشاره می‌کند @random_walker

کاربردها

  • یوجین یان یک سیستم توصیه‌گر دوزبانه را نمایش می‌دهد که قابلیت‌های LLM را با شناسه‌های آیتم ترکیب می‌کند و یک سیستم ترکیبی LLM-recsys ایجاد می‌کند که می‌تواند بر اساس رفتار کاربر توصیه کند، در حالی که توضیحات زبان طبیعی را نیز ممکن می‌سازد @eugeneyan
  • رید هافمن، استفاده‌ی مدرسه‌ی آلفا از هوش مصنوعی را برای شخصی‌سازی آموزش برجسته می‌کند؛ جایی که هوش مصنوعی روزانه دو ساعت سرعت و ارائه‌ی درس را مدیریت می‌کند، در حالی که معلمان بر مهارت‌های زندگی مانند کار گروهی و کارآفرینی تمرکز می‌کنند @reidhoffman
  • گوگل جیمینای قابلیت‌های ویرایش تصویر «نانو موز» (nano banana) را معرفی می‌کند که به کاربران امکان می‌دهد چندین عکس را آپلود کرده و آن‌ها را در یک تصویر با استفاده از دستورات خاص برای ویرایش‌ها و تنظیمات ترکیب کنند @GeminiApp
  • Qwen، قابلیت «Web Dev prompt» را منتشر کرد؛ یک دستیار هوش مصنوعی طراحی‌محور برای توسعه‌ی فرانت‌اند که به ساخت وب‌سایت‌ها با استفاده از React یا HTML همراه با TailwindCSS در خروجی‌های تک‌فایلی کمک می‌کند @Alibaba_Qwen
  • OpenAI ویژگی‌های جدید Codex را اعلام کرد که شامل افزونه‌ی IDE، یکپارچه‌سازی محیط ابری-محلی، بررسی کدهای GitHub و CLI بازطراحی‌شده است و همگی توسط GPT-5 پشتیبانی می‌شوند @OpenAIDevs

پژوهش‌ها

  • ایتان مولیک بر رمز و راز عمیق LLMها تأکید می‌کند: این که چگونه ضرب ماتریسی برای پیش‌بینی کلمه‌ی بعدی موفق می‌شود افکار انسانی را به اندازه‌ی کافی خوب شبیه‌سازی کند تا کارهای انسان‌گونه را انجام دهد، با ارجاع به نظریه‌ی ولفارم درباره‌ی کاهش‌ناپذیری محاسباتی (computational irreducibility) @emollick
  • فرانسوا شوله توضیح می‌دهد که استدلال، یک دسته‌ی از وظایف نیست، بلکه یک توانایی است که توسط تعمیم ترکیبی (compositional generalization) پشتیبانی می‌شود و اشاره می‌کند که وظایف استدلالی می‌توانند بدون استدلال و از طریق حفظ کردن حل شوند @fchollet
  • Cosmos Reason انویدیا در صدر جدول رتبه‌بندی استدلال فیزیکی در Hugging Face قرار گرفت و در کاربردهای هوش مصنوعی فیزیکی مانند سازمان‌دهی داده‌ها، برنامه‌ریزی ربات و تحلیل ویدئو برتری دارد @NVIDIAAIDev
  • پژوهش هوش مصنوعی برکلی مقاله‌ای منتشر کرد که در آن سؤال می‌شود آیا داده‌ها رباتیک را حل خواهند کرد، و کن گلدبرگ استدلال می‌کند که مهندسی سنتی خوب می‌تواند شکاف ۱۰۰ هزار ساله‌ی داده‌ها در رباتیک را پر کند @berkeley_ai
  • یک آسیب‌پذیری روز صفر (zero-day) در کروم توسط یک سیستم هوش مصنوعی کشف شد که توانایی هوش مصنوعی را در پژوهش‌های امنیت سایبری نشان می‌دهد @Sauers_