اخبار هوش مصنوعی در 2025-08-28

مدل‌های جدید هوش مصنوعی

مایکروسافت MAI-1-preview، اولین مدل بنیادی‌اش را که به صورت درون‌سازمانی و جامع (end-to-end) آموزش دیده است، منتشر کرد. این مدل اکنون در حال آزمایش عمومی در LMArena است @mustafasuleyman
مایکروسافت MAI-Voice-1 را معرفی کرد؛ مدلی که گویاترین و طبیعی‌ترین مدل تولید صدای آن‌ها توصیف شده و می‌تواند یک دقیقه صدا را در کمتر از ۱ ثانیه با یک GPU تولید کند @mustafasuleyman
xAI، Grok Code Fast 1 را راه‌اندازی کرد؛ یک مدل استدلالی سریع و اقتصادی که در کدنویسی عامل‌محور (agentic coding) برتری دارد و به مدت ۷ روز به صورت رایگان در GitHub Copilot، Cursor و سایر پلتفرم‌ها در دسترس است @xai
OpenAI، gpt-realtime را معرفی کرد؛ بهترین مدل تبدیل گفتار به گفتار آن‌ها برای توسعه‌دهندگان، که Realtime API آن به طور رسمی از حالت بتا خارج شده و آماده برای عامل‌های صوتی تولیدی است @OpenAI
Cohere، Command A Translate را منتشر کرد؛ یک مدل پیشرفته که برای وظایف ترجمه‌ی باکیفیت بالا طراحی شده و از تمامی مدل‌های دیگر در کیفیت ترجمه پیشی می‌گیرد @cohere
آزمایشگاه هوش مصنوعی Tencent، HunyuanVideo-Foley را منتشر کرد؛ یک چارچوب جامع (end-to-end) تبدیل متن-ویدئو به صدا برای تولید صدای باکیفیت بالا که با استفاده از یک مجموعه‌داده‌ی چندوجهی (multimodal) عظیم ۱۰۰ هزار ساعته آموزش دیده است @TencentHunyuan

تحلیل صنعت

اندرو نگ، عامل‌های موازی (parallel agents) را به عنوان یک جهت‌گیری مهم و نوظهور برای مقیاس‌پذیری هوش مصنوعی شناسایی کرده است که راهی برای بهبود نتایج بدون منتظر نگه‌داشتن بیشتر کاربران ارائه می‌دهد، چرا که قیمت LLM به ازای هر توکن همچنان رو به کاهش است @AndrewYNg
پاول گراهام استدلال می‌کند که افرادی که در برنامه‌نویسی ماهر هستند، از هوش مصنوعی برای گرفتن مشاغل از کسانی که در آن متوسط هستند، استفاده خواهند کرد و تأکید می‌کند که انگیزه‌ی ساختن چیزها، بیش از صرفاً مهارت فنی اهمیت دارد @paulg
کاری سارینن گزارش می‌دهد که ۴۵٪ از مشتریان سازمانی، عامل‌های هوش مصنوعی Cursor را در Linear ظرف یک هفته پس از راه‌اندازی فعال کرده‌اند که نشان‌دهنده‌ی پذیرش سریع عامل‌های هوش مصنوعی در تیم‌های محصول است @karrisaarinen
Liquid AI بیش از یک میلیون دانلود مدل بنیادی را از طریق Hugging Face به دست آورد که نشان‌دهنده‌ی علاقه‌ی جامعه به مدل‌های کوچک طراحی‌شده بر اساس اصول اولیه است @ramin_m_h
Framer ۱۰۰ میلیون دلار در سری D با ارزش‌گذاری ۲ میلیارد دلار جذب سرمایه کرد و ادعا می‌کند که بیش از نیم میلیون کاربر فعال ماهانه برای سازنده‌ی وب‌سایت بدون کد (no-code) خود دارد @TechCrunch

اخلاق و جامعه

هیدی خلاف از مؤسسه‌ی AI Now در لیست ۱۰۰ AI مجله‌ی TIME به دلیل پرداختن به بازنگری ایمنی هوش مصنوعی در زمینه‌های دفاعی و حیاتی از نظر ایمنی، جایی که ایمنی با مسئولیت‌پذیری کم، پنهان شده است، شناخته شده است @HeidyKhlaaf
همل حسین گزارش می‌دهد که مشکلات کیفیت قابل توجهی را با GPT-5 در API تجربه کرده است، از جمله اشتباهات تایپی عجیب، خطاهای نگارشی و پاسخ‌های بی‌معنی که در طول هفته تشدید شده‌اند @clairevo
آرویند نارایانان مشاهده می‌کند که مدل‌های توانمندتر لزوماً به معنای محصولات مفیدتر نیستند و به تصمیم Anthropic برای آموزش بر روی داده‌های کاربر، پس از مقاومت طولانی‌مدت، اشاره می‌کند @random_walker

کاربردها

یوجین یان یک سیستم توصیه‌گر دوزبانه را نمایش می‌دهد که قابلیت‌های LLM را با شناسه‌های آیتم ترکیب می‌کند و یک سیستم ترکیبی LLM-recsys ایجاد می‌کند که می‌تواند بر اساس رفتار کاربر توصیه کند، در حالی که توضیحات زبان طبیعی را نیز ممکن می‌سازد @eugeneyan
رید هافمن، استفاده‌ی مدرسه‌ی آلفا از هوش مصنوعی را برای شخصی‌سازی آموزش برجسته می‌کند؛ جایی که هوش مصنوعی روزانه دو ساعت سرعت و ارائه‌ی درس را مدیریت می‌کند، در حالی که معلمان بر مهارت‌های زندگی مانند کار گروهی و کارآفرینی تمرکز می‌کنند @reidhoffman
گوگل جیمینای قابلیت‌های ویرایش تصویر «نانو موز» (nano banana) را معرفی می‌کند که به کاربران امکان می‌دهد چندین عکس را آپلود کرده و آن‌ها را در یک تصویر با استفاده از دستورات خاص برای ویرایش‌ها و تنظیمات ترکیب کنند @GeminiApp
Qwen، قابلیت «Web Dev prompt» را منتشر کرد؛ یک دستیار هوش مصنوعی طراحی‌محور برای توسعه‌ی فرانت‌اند که به ساخت وب‌سایت‌ها با استفاده از React یا HTML همراه با TailwindCSS در خروجی‌های تک‌فایلی کمک می‌کند @Alibaba_Qwen
OpenAI ویژگی‌های جدید Codex را اعلام کرد که شامل افزونه‌ی IDE، یکپارچه‌سازی محیط ابری-محلی، بررسی کدهای GitHub و CLI بازطراحی‌شده است و همگی توسط GPT-5 پشتیبانی می‌شوند @OpenAIDevs

پژوهش‌ها

ایتان مولیک بر رمز و راز عمیق LLMها تأکید می‌کند: این که چگونه ضرب ماتریسی برای پیش‌بینی کلمه‌ی بعدی موفق می‌شود افکار انسانی را به اندازه‌ی کافی خوب شبیه‌سازی کند تا کارهای انسان‌گونه را انجام دهد، با ارجاع به نظریه‌ی ولفارم درباره‌ی کاهش‌ناپذیری محاسباتی (computational irreducibility) @emollick
فرانسوا شوله توضیح می‌دهد که استدلال، یک دسته‌ی از وظایف نیست، بلکه یک توانایی است که توسط تعمیم ترکیبی (compositional generalization) پشتیبانی می‌شود و اشاره می‌کند که وظایف استدلالی می‌توانند بدون استدلال و از طریق حفظ کردن حل شوند @fchollet
Cosmos Reason انویدیا در صدر جدول رتبه‌بندی استدلال فیزیکی در Hugging Face قرار گرفت و در کاربردهای هوش مصنوعی فیزیکی مانند سازمان‌دهی داده‌ها، برنامه‌ریزی ربات و تحلیل ویدئو برتری دارد @NVIDIAAIDev
پژوهش هوش مصنوعی برکلی مقاله‌ای منتشر کرد که در آن سؤال می‌شود آیا داده‌ها رباتیک را حل خواهند کرد، و کن گلدبرگ استدلال می‌کند که مهندسی سنتی خوب می‌تواند شکاف ۱۰۰ هزار ساله‌ی داده‌ها در رباتیک را پر کند @berkeley_ai
یک آسیب‌پذیری روز صفر (zero-day) در کروم توسط یک سیستم هوش مصنوعی کشف شد که توانایی هوش مصنوعی را در پژوهش‌های امنیت سایبری نشان می‌دهد @Sauers_