اخبار هوش مصنوعی در 2025-08-28
مدلهای جدید هوش مصنوعی
- مایکروسافت MAI-1-preview، اولین مدل بنیادیاش را که به صورت درونسازمانی و جامع (end-to-end) آموزش دیده است، منتشر کرد. این مدل اکنون در حال آزمایش عمومی در LMArena است @mustafasuleyman
- مایکروسافت MAI-Voice-1 را معرفی کرد؛ مدلی که گویاترین و طبیعیترین مدل تولید صدای آنها توصیف شده و میتواند یک دقیقه صدا را در کمتر از ۱ ثانیه با یک GPU تولید کند @mustafasuleyman
- xAI، Grok Code Fast 1 را راهاندازی کرد؛ یک مدل استدلالی سریع و اقتصادی که در کدنویسی عاملمحور (agentic coding) برتری دارد و به مدت ۷ روز به صورت رایگان در GitHub Copilot، Cursor و سایر پلتفرمها در دسترس است @xai
- OpenAI، gpt-realtime را معرفی کرد؛ بهترین مدل تبدیل گفتار به گفتار آنها برای توسعهدهندگان، که Realtime API آن به طور رسمی از حالت بتا خارج شده و آماده برای عاملهای صوتی تولیدی است @OpenAI
- Cohere، Command A Translate را منتشر کرد؛ یک مدل پیشرفته که برای وظایف ترجمهی باکیفیت بالا طراحی شده و از تمامی مدلهای دیگر در کیفیت ترجمه پیشی میگیرد @cohere
- آزمایشگاه هوش مصنوعی Tencent، HunyuanVideo-Foley را منتشر کرد؛ یک چارچوب جامع (end-to-end) تبدیل متن-ویدئو به صدا برای تولید صدای باکیفیت بالا که با استفاده از یک مجموعهدادهی چندوجهی (multimodal) عظیم ۱۰۰ هزار ساعته آموزش دیده است @TencentHunyuan
تحلیل صنعت
- اندرو نگ، عاملهای موازی (parallel agents) را به عنوان یک جهتگیری مهم و نوظهور برای مقیاسپذیری هوش مصنوعی شناسایی کرده است که راهی برای بهبود نتایج بدون منتظر نگهداشتن بیشتر کاربران ارائه میدهد، چرا که قیمت LLM به ازای هر توکن همچنان رو به کاهش است @AndrewYNg
- پاول گراهام استدلال میکند که افرادی که در برنامهنویسی ماهر هستند، از هوش مصنوعی برای گرفتن مشاغل از کسانی که در آن متوسط هستند، استفاده خواهند کرد و تأکید میکند که انگیزهی ساختن چیزها، بیش از صرفاً مهارت فنی اهمیت دارد @paulg
- کاری سارینن گزارش میدهد که ۴۵٪ از مشتریان سازمانی، عاملهای هوش مصنوعی Cursor را در Linear ظرف یک هفته پس از راهاندازی فعال کردهاند که نشاندهندهی پذیرش سریع عاملهای هوش مصنوعی در تیمهای محصول است @karrisaarinen
- Liquid AI بیش از یک میلیون دانلود مدل بنیادی را از طریق Hugging Face به دست آورد که نشاندهندهی علاقهی جامعه به مدلهای کوچک طراحیشده بر اساس اصول اولیه است @ramin_m_h
- Framer ۱۰۰ میلیون دلار در سری D با ارزشگذاری ۲ میلیارد دلار جذب سرمایه کرد و ادعا میکند که بیش از نیم میلیون کاربر فعال ماهانه برای سازندهی وبسایت بدون کد (no-code) خود دارد @TechCrunch
اخلاق و جامعه
- هیدی خلاف از مؤسسهی AI Now در لیست ۱۰۰ AI مجلهی TIME به دلیل پرداختن به بازنگری ایمنی هوش مصنوعی در زمینههای دفاعی و حیاتی از نظر ایمنی، جایی که ایمنی با مسئولیتپذیری کم، پنهان شده است، شناخته شده است @HeidyKhlaaf
- همل حسین گزارش میدهد که مشکلات کیفیت قابل توجهی را با GPT-5 در API تجربه کرده است، از جمله اشتباهات تایپی عجیب، خطاهای نگارشی و پاسخهای بیمعنی که در طول هفته تشدید شدهاند @clairevo
- آرویند نارایانان مشاهده میکند که مدلهای توانمندتر لزوماً به معنای محصولات مفیدتر نیستند و به تصمیم Anthropic برای آموزش بر روی دادههای کاربر، پس از مقاومت طولانیمدت، اشاره میکند @random_walker
کاربردها
- یوجین یان یک سیستم توصیهگر دوزبانه را نمایش میدهد که قابلیتهای LLM را با شناسههای آیتم ترکیب میکند و یک سیستم ترکیبی LLM-recsys ایجاد میکند که میتواند بر اساس رفتار کاربر توصیه کند، در حالی که توضیحات زبان طبیعی را نیز ممکن میسازد @eugeneyan
- رید هافمن، استفادهی مدرسهی آلفا از هوش مصنوعی را برای شخصیسازی آموزش برجسته میکند؛ جایی که هوش مصنوعی روزانه دو ساعت سرعت و ارائهی درس را مدیریت میکند، در حالی که معلمان بر مهارتهای زندگی مانند کار گروهی و کارآفرینی تمرکز میکنند @reidhoffman
- گوگل جیمینای قابلیتهای ویرایش تصویر «نانو موز» (nano banana) را معرفی میکند که به کاربران امکان میدهد چندین عکس را آپلود کرده و آنها را در یک تصویر با استفاده از دستورات خاص برای ویرایشها و تنظیمات ترکیب کنند @GeminiApp
- Qwen، قابلیت «Web Dev prompt» را منتشر کرد؛ یک دستیار هوش مصنوعی طراحیمحور برای توسعهی فرانتاند که به ساخت وبسایتها با استفاده از React یا HTML همراه با TailwindCSS در خروجیهای تکفایلی کمک میکند @Alibaba_Qwen
- OpenAI ویژگیهای جدید Codex را اعلام کرد که شامل افزونهی IDE، یکپارچهسازی محیط ابری-محلی، بررسی کدهای GitHub و CLI بازطراحیشده است و همگی توسط GPT-5 پشتیبانی میشوند @OpenAIDevs
پژوهشها
- ایتان مولیک بر رمز و راز عمیق LLMها تأکید میکند: این که چگونه ضرب ماتریسی برای پیشبینی کلمهی بعدی موفق میشود افکار انسانی را به اندازهی کافی خوب شبیهسازی کند تا کارهای انسانگونه را انجام دهد، با ارجاع به نظریهی ولفارم دربارهی کاهشناپذیری محاسباتی (computational irreducibility) @emollick
- فرانسوا شوله توضیح میدهد که استدلال، یک دستهی از وظایف نیست، بلکه یک توانایی است که توسط تعمیم ترکیبی (compositional generalization) پشتیبانی میشود و اشاره میکند که وظایف استدلالی میتوانند بدون استدلال و از طریق حفظ کردن حل شوند @fchollet
- Cosmos Reason انویدیا در صدر جدول رتبهبندی استدلال فیزیکی در Hugging Face قرار گرفت و در کاربردهای هوش مصنوعی فیزیکی مانند سازماندهی دادهها، برنامهریزی ربات و تحلیل ویدئو برتری دارد @NVIDIAAIDev
- پژوهش هوش مصنوعی برکلی مقالهای منتشر کرد که در آن سؤال میشود آیا دادهها رباتیک را حل خواهند کرد، و کن گلدبرگ استدلال میکند که مهندسی سنتی خوب میتواند شکاف ۱۰۰ هزار سالهی دادهها در رباتیک را پر کند @berkeley_ai
- یک آسیبپذیری روز صفر (zero-day) در کروم توسط یک سیستم هوش مصنوعی کشف شد که توانایی هوش مصنوعی را در پژوهشهای امنیت سایبری نشان میدهد @Sauers_