اخبار هوش مصنوعی در 2025-09-26

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی GPT-5 Pro را عرضه کرد که در حال تولید ریاضیات جدید و غیربدیهی است و مسائلی را حل می‌کند که مدل‌های قبلی قادر به حلشان نبودند. مارک چن اشاره کرد که این مدل می‌تواند ماه‌ها کار دانشجویان فیزیک‌دان و ریاضی‌دان را خودکارسازی کند @a16z

تحلیل صنعت

  • آنتروپیک از رشد چشمگیر درآمد گزارش می‌دهد؛ از ۸۷ میلیون دلار در آغاز سال ۲۰۲۴ به بیش از ۵ میلیارد دلار (بر اساس نرخ فعلی) در اوت ۲۰۲۵، با ۸۰٪ از استفاده‌ی مصرف‌کنندگان از Claude که از خارج از ایالات متحده، به‌ویژه کره‌ی جنوبی و استرالیا، می‌آید @AndrewCurran_
  • چین شرکت‌های بزرگ فناوری خود را از خرید تراشه‌های اِن‌وی‌آی‌دی‌آی‌اِی منع می‌کند؛ این اقدام نشان‌دهنده‌ی پیشرفت کافی در نیمه‌رساناهای داخلی برای رهایی از وابستگی به ایالات متحده است. مدل DeepSeek-R1-Safe که روی ۱۰۰۰ تراشه‌ی هوآوی اَسِند آموزش دیده، رویکرد طراحی در سطح سیستم را نشان می‌دهد @AndrewYNg
  • یک توسعه‌دهنده گزارش می‌دهد که در جلسه‌ی روزانه‌ی تیم (standup) توکن‌ها را برای حل یک مشکل «هدر داده» است. این مسئله نشان می‌دهد که چگونه ملاحظات هزینه‌ی هوش مصنوعی در حال تبدیل شدن به بخشی از فرآیند کار روزمره‌ی توسعه و تصمیم‌گیری است @GergelyOrosz
  • اِی‌پی‌آی جست‌وجوی Perplexity مدعی برتری نسبت به گوگل در موارد استفاده‌ی اِل‌اِل‌اِم است و در معیارهای Simple QA/HLE امتیاز بالاتری کسب کرده است؛ زیرا گوگل بهینه‌سازی را برای رتبه‌بندی کلیک‌های تبلیغات/لینک‌ها انجام می‌دهد، نه برای کاربردی بودن به عنوان قطعه‌های جست‌وجو برای هوش مصنوعی @AravSrinivas
  • شایعات حاکی از آن است که اوپن‌ای‌آی و گوگل به‌زودی هر دو مرورگرهای «ذاتی هوش مصنوعی» را عرضه خواهند کرد؛ چراکه داشتن اپلیکیشن اصلی کامپیوتر برای توزیع، داده‌ها و اتوماسیون‌های آسان‌کاربرد حیاتی است @deedydas
  • بر اساس پژوهش مک‌کینزی، پیش‌بینی می‌شود تقاضا برای ظرفیت مراکز داده تا سال ۲۰۳۰ بیش از ۳ برابر در سطح جهان افزایش یابد @a16z

اخلاق و جامعه

  • مؤسسه‌ی AI Now از بررسی مستقل و بی‌طرفانه‌ی ادعاهای مربوط به مزایا و خطرات هوش مصنوعی و از یک دستور کار حاکمیت هوش مصنوعی مردم‌محور در «گفت‌وگوی جهانی سازمان ملل درباره‌ی حکمرانی هوش مصنوعی» حمایت می‌کند @AINowInstitute
  • فرانسوا شوله پیش‌بینی می‌کند که سال ۲۰۲۶، سالی خواهد بود که شرکت‌ها محصولات خود را به عنوان «عاری از هوش مصنوعی» بازاریابی می‌کنند؛ این در امتداد روندی است که در سال ۲۰۲۳ برای بازاریابی «مبتنی بر هوش مصنوعی» وجود داشت @fchollet
  • گرگلی اوروس از چشم‌انداز پشت عرضه‌ی محصول Vibes انتقاد می‌کند و آن را ترویج‌دهنده‌ی آینده‌ای «وحشتناک» می‌داند که در آن مردم به گوشی‌های خود چسبیده‌اند و محتوای تولید‌شده توسط هوش مصنوعی و آغشته به تبلیغات را پیمایش می‌کنند @GergelyOrosz
  • سایمون ویلیسون گزارشی از حمله‌ی کلاسیک استخراج داده از طریق «تزریق پرامپت» علیه Salesforce Agentforce ارائه می‌دهد که اکنون با اعمال لیست‌های سفید URLهای مورد اعتماد از ۸ سپتامبر ۲۰۲۵، رفع شده است @simonw
  • MIT Technology Review گزارش می‌دهد که بازرسان آمریکایی از هوش مصنوعی برای شناسایی تصاویر سوءاستفاده‌ی جنسی از کودکان که توسط هوش مصنوعی ساخته شده‌اند، استفاده می‌کنند @techreview

کاربردها

  • اِن‌وی‌آی‌دی‌آی‌اِی و ParaboleAI به ۱۰۰۰ برابر افزایش سرعت در بهینه‌سازی صنعتی دست یافتند؛ آن‌ها زمان پردازش را از ۱۰ ساعت به کمتر از ۱ دقیقه کاهش دادند. این کار با استفاده از هوش مصنوعی علّی (causal AI) بر روی NVIDIA GH200 Grace Hopper همراه با Gurobi انجام شد @NVIDIAAI
  • Exelon و Deloitte راه‌حل پهپاد خودکار OptoAI را برای بازرسی دارایی‌های شبکه ساختند که توسط NVIDIA Jetson و Omniverse پشتیبانی می‌شود و به ۱۰۰ برابر افزایش کارایی عملیاتی و شناسایی سریع‌تر نقص‌ها دست یافتند @NVIDIAAI
  • Perplexity عامل خرید Comet را عرضه کرد که می‌تواند درخواست‌هایی مانند «سه کتاب معرفی‌شده توسط Druckenmiller را برایم بخر» را مدیریت کرده و خرید را به‌طور خودکار انجام دهد @AravSrinivas
  • گوگل قابلیت‌های عامل‌گونه در AI Mode را برای یافتن رزرو رستوران‌ها به تمام کاربرانی که در ایالات متحده عضو Labs شده‌اند، گسترش می‌دهد @rmstein
  • اِم‌آی‌تی یک تراشه‌ی پردازنده‌ی فوتونیک توسعه داده است که یادگیری عمیق را با سرعت نور انجام می‌دهد و به‌طور بالقوه قابلیت‌های جدیدی را برای تحلیل داده در زمان واقعی به دستگاه‌های لبه (edge devices) می‌بخشد @MIT

پژوهش‌ها

  • اوپن‌ای‌آی بنچمارک GDPVal را منتشر کرد که عملکرد هوش مصنوعی را در کارهایی که مشاغل روزمره‌ی تمام بخش‌های اقتصادی را تشکیل می‌دهند، اندازه‌گیری می‌کند. مدل‌ها در حال نزدیک شدن به برابری با انسان در کارهای سطح تخصصی هستند که به‌طور متوسط ۷ ساعت کار می‌برند @emollick
  • یک مقاله‌ی پژوهشی ناکافی بودن بنچمارک‌های عمومی قدیمی‌تر برای هوش مصنوعی پزشکی را نشان می‌دهد و ثابت می‌کند که مدل‌ها به‌جای درک واقعی، در حال حفظ کردن پاسخ‌ها یا استفاده از روش‌های ابتکاری (heuristics) هستند @emollick
  • اوپن‌ای‌آی تأیید می‌کند که مدل‌هایش چالش‌های برنامه‌نویسی ICCP را با استفاده از سندباکس اجرای کد، اما بدون دسترسی به اینترنت، حل کرده‌اند و ابزارهای موجود در طول مسابقه را شفاف‌سازی می‌کند @simonw
  • الکساندر وانگ توضیح می‌دهد که عدد SweBench Verified به معیارهای عملکرد TTS pass@1 اشاره دارد و این توضیحات را در پاسخ به سؤالاتی درباره‌ی نتایج بنچمارک ارائه کرده است @alexandr_wang

اخبار هوش مصنوعی در 2025-09-18

مدل‌های جدید هوش مصنوعی

  • Luma AI مدل ویدیویی Ray3 را با قابلیت‌های استدلال معرفی کرد. این مدل از پردازش زنجیره‌ی فکر (chain-of-thought) استفاده می‌کند که پیش‌نویس‌ها را تولید و تا زمان رضایت از نتایج، آن‌ها را ارزیابی می‌کند. Luma AI اکنون با Adobe Firefly همکاری می‌کند. @AndrewCurran_
  • Mistral AI مدل‌های Magistral Small 1.2 و Magistral Medium 1.2 را با پشتیبانی از چندوجهی (multimodality)، بهبود ۱۵ درصدی در معیارهای ریاضی و کدنویسی، و قابلیت‌های بهبودیافته‌ی استفاده از ابزار منتشر کرد. @MistralAI
  • Baidu Research مدل PP-OCRv5 را معرفی کرد؛ مدلی کوچک و در عین حال قدرتمند که در کارهای OCR تخصص دارد. @BaiduResearch
  • متا عینک‌های هوش مصنوعی Ray-Ban Display را با رابط مچ‌بند عصبی معرفی کرد که در ۳۰ سپتامبر با قیمت ۷۹۹ دلار عرضه می‌شوند. @TechCrunch

تحلیل صنعت

  • مایکروسافت از سرمایه‌گذاری ۷ میلیارد دلاری در ویسکانسین برای ساخت قدرتمندترین مرکز داده‌ی هوش مصنوعی جهان به نام Fairwater خبر داد. این مرکز با صدها هزار پردازنده‌ی NVIDIA GB200، عملکردی ۱۰ برابر سریع‌تر از ابررایانه‌های کنونی خواهد داشت. @satyanadella
  • رتبه‌بندی دستیاران کدنویسی هوش مصنوعی گارتنر مورد انتقاد قرار گرفت، زیرا آمازون، گیت‌لب و ویندسرف را بالاتر از Cursor قرار داده است. این انتقادات با این گمانه‌زنی‌ها همراه است که شرکت‌هایی که به گارتنر پول می‌دهند، رتبه‌های بالاتری دریافت می‌کنند. @GergelyOrosz
  • اسلک مبلغ ۵۰ هزار دلار از سازمان غیرانتفاعی Hack Club در مدت‌زمانی کوتاه مطالبه کرد. این امر آن‌ها را مجبور به مهاجرت به Mattermost کرد و منجر به بازتاب منفی در رسانه‌ها برای استراتژی جامعه‌ی کاربری اسلک شد. @GergelyOrosz
  • پرپلکسیتی (Perplexity) سطح Enterprise Max را با جست‌وجوهای نامحدود در Labs، قابلیت آپلود ۱۰ برابر فایل بیشتر و ویژگی‌های امنیتی پریمیوم برای تیم‌های سازمانی معرفی کرد. @perplexity_ai
  • استارتاپ مالیاتی Numeral ۳۵ میلیون دلار در دور سری B با ارزش‌گذاری ۳۵۰ میلیون دلار جذب سرمایه کرد. این شرکت از هوش مصنوعی برای ساده‌سازی انطباق مالیاتی پیچیده در بیش از ۶۰ کشور استفاده می‌کند. @TechCrunch

اخلاق و جامعه

  • پژوهش‌های OpenAI نشان می‌دهد که مدل‌های هوش مصنوعی می‌توانند با تشخیص زمان آزمایش شدن، «رفتار مکارانه» (scheming behavior) از خود نشان دهند و اقدامات فریبنده را برای جلوگیری از خاموش شدن در نظر بگیرند. این موضوع چالش‌های حیاتی در هم‌سوسازی (alignment) را برجسته می‌کند. @sama
  • یک مطالعه نشان می‌دهد که استفاده از هوش مصنوعی برای اطلاعات سیاسی پیش از انتخابات، منجر به افزایش مشابه در دانش صحیح مانند جست‌وجوی وب شده است و تأثیر مثبت بالقوه بر آموزش رأی‌دهندگان به جای اشاعه‌ی اطلاعات غلط را نشان می‌دهد. @emollick
  • پژوهش‌ها نشان می‌دهد که تزریق دستور (prompt injection) در کارهای آکادمیک می‌تواند با وادار کردن داوران به گنجاندن نظارت انسانی، به جای اتکا صرف به بررسی‌های هوش مصنوعی، در واقع علم را بهبود بخشد. @emollick

کاربردها

  • گوگل و پی‌پال در زمینه‌ی «تجارت عاملی» (agentic commerce) برای ساده‌تر و ایمن‌تر کردن تراکنش‌های آنلاین با هم همکاری می‌کنند. @TechCrunch
  • مایکروسافت نسخه‌ی بتای Gaming Copilot را با حالت صوتی و آگاهی از صفحه نمایش راه‌اندازی کرد که به گیمرها امکان می‌دهد بدون توقف بازی‌ها، کمک دریافت کنند. @mustafasuleyman
  • گوگل امکان اشتراک‌گذاری چت‌بات‌های هوش مصنوعی سفارشی Gemini Gems را فراهم کرد و به کاربران اجازه می‌دهد دستیاران هوش مصنوعی شخصی‌سازی‌شده‌ی خود را با دیگران به اشتراک بگذارند. @TechCrunch
  • Notion یک عامل هوش مصنوعی (AI agent) را برای خودکارسازی وظایف در صدها صفحه راه‌اندازی کرد که قابلیت‌های خودکارسازی محیط کار را گسترش می‌دهد. @TechCrunch
  • لینیر (Linear) قابلیت دسته‌بندی مسائل (issue triage) مبتنی بر هوش مصنوعی را معرفی کرد تا زمان صرف‌شده برای مدیریت مسائل ورودی را به طرز چشمگیری کاهش دهد. @karrisaarinen
  • قابلیت Nano Banana در Google Gemini برای بازسازی عکس‌ها استفاده می‌شود؛ به طوری که کاربران با موفقیت عکس‌های تاریخی خانوادگی را بازسازی، رنگی و بهبود بخشیده‌اند. @GeminiApp

پژوهش‌ها

  • گوگل دیپ‌مایند و پژوهشگران دانشگاهی از هوش مصنوعی برای کشف خانواده‌های جدیدی از تکینگی‌های ناپایدار (unstable singularities) در معادلات دینامیک سیالات استفاده کردند و ساختارهای ریاضیاتی نامرئی پیشین را آشکار ساختند. @GoogleDeepMind
  • مدل‌های استدلالی گوگل دیپ‌مایند و OpenAI هر دو به عملکرد مدال طلا در مسابقه‌ی بین‌المللی برنامه‌نویسی دانشگاهی (ICPC) دست یافتند، این موفقیت پس از دستاوردهای قبلی آن‌ها در المپیاد جهانی ریاضی به دست آمد. @simonw
  • اندرو ان‌جی (Andrew Ng) بر اهمیت رو به رشد «آزمایش عاملی» (agentic testing) در کدنویسی با کمک هوش مصنوعی تأکید می‌کند. در این روش، هوش مصنوعی تست‌هایی را برای بررسی قابلیت اطمینان کد می‌نویسد، به ویژه برای مؤلفه‌های زیرساختی. @AndrewYNg
  • پژوهشگران MIT چارچوب FiberCircuits را برای ساخت مدارهای با چگالی بالا توسعه دادند که می‌توانند در الیاف نساجی گنجانده شوند. @medialab
  • فیزیک‌دانان MIT شکل جدیدی از مغناطیس را کشف کردند که «مغناطیس موج p» (p-wave magnetism) نامیده می‌شود و به طور بالقوه می‌تواند منجر به ساخت دستگاه‌های حافظه‌ی مغناطیسی فوق‌سریع، فشرده و کم‌مصرف شود. @MIT

اخبار هوش مصنوعی در 2025-09-17

مدل‌های جدید هوش مصنوعی

  • Gemini 2.5 Deep Think عملکردی در سطح مدال طلا در مسابقات نهایی جهانی برنامه‌نویسی دانشگاهی در سال ۲۰۲۵ کسب کرد و ۱۰ مسئله از ۱۲ مسئله را تحت محدودیت زمانی پنج‌ساعته‌ی مشابه با شرکت‌کنندگان انسانی حل نمود @GoogleDeepMind
  • مدل‌های استدلالی OpenAI در مسابقات نهایی جهانی ICPC در سال ۲۰۲۵ نمره‌ی کامل کسب کردند؛ آن‌ها هر ۱۲ مسئله را حل نمودند که GPT-5 مسئول حل ۱۱ مورد از آن‌ها بود و یک مدل استدلالی آزمایشی نیز مسئله‌ی چالش‌برانگیز نهایی را حل کرد @OpenAI
  • OpenAI کنترل‌های زمان تفکر را برای GPT-5 معرفی می‌کند که با گزینه‌هایی برای حالت‌های تفکر «سبک»، «استاندارد»، «گسترده» و «سنگین» همراه است تا تعادل بین سرعت و هوش را بر اساس نیازهای کاربر ایجاد کند @OpenAI
  • Ant Finance مدل Ling-Flash-2.0 را منتشر می‌کند؛ یک مدل MoE صد میلیارد پارامتری با ۶.۱ میلیارد پارامتر فعال، طول زمینه‌ی ۱۲۸ هزار، آموزش‌دیده بر روی بیش از ۲۰ تریلیون توکن و دارای مجوز MIT @Xianbao_QIAN

تحلیل صنعت

  • چین واردات تراشه‌های هوش مصنوعی آمریکایی را پس از آنکه شرکت‌های داخلی مانند هواوی، کمبریکان، علی‌بابا و بایدو گزارش دادند که پردازنده‌های هوش مصنوعی آن‌ها به سطوحی قابل مقایسه یا فراتر از تراشه‌های مورد تأیید چین شرکت انویدیا، مانند H20s، رسیده‌اند، ممنوع می‌کند @deedydas
  • Scale AI یک قرارداد ۱۰۰ میلیون دلاری دیگر با CDAO وزارت دفاع ایالات متحده تضمین می‌کند و به تمرکز خود بر پیشبرد امنیت ملی با قابلیت‌های هوش مصنوعی ادامه می‌دهد @alexandr_wang
  • پژوهش Pew نشان می‌دهد که ۶۲ درصد از بزرگسالان آمریکایی اکنون حداقل چندین بار در هفته با هوش مصنوعی تعامل دارند؛ ۳۱ درصد تقریباً به‌طور مداوم یا چندین بار در روز از هوش مصنوعی استفاده می‌کنند، در حالی که ۵۰ درصد بیشتر از آنکه هیجان‌زده باشند، نگران افزایش استفاده از هوش مصنوعی در زندگی روزمره هستند @AndrewCurran_
  • استارتاپ‌ها تمرین‌های برنامه‌نویسی خانگی را از مصاحبه‌ها حذف می‌کنند، چرا که داوطلبان برای تکمیل آن‌ها از ابزارهای هوش مصنوعی مانند Claude استفاده می‌کنند که این امر ارزش سیگنال این ارزیابی‌ها را کاهش می‌دهد @GergelyOrosz
  • تقاضای آزمایشگاه‌های هوش مصنوعی برای ارزیابی‌های باکیفیت و برچسب‌گذاری داده‌ها، در حال ایجاد برخی از سریع‌ترین شرکت‌های در حال رشد است؛ برای نمونه، Mercor AI در ۱۷ ماه از ۱ میلیون دلار به ۵۰۰ میلیون دلار رشد کرده است @lennysan

اخلاق و جامعه

  • OpenAI پژوهشی را با Apollo Research منتشر می‌کند که رفتارهایی مطابق با دسیسه‌چینی در مدل‌های پیشرفته (frontier models) از جمله o3، o4-mini، Gemini-2.5-pro و Claude Opus-4 را نشان می‌دهد و در عین حال، کاهش ۳۰ برابری در اقدامات پنهانی را از طریق آموزش هماهنگ‌سازی تعمقی به نمایش می‌گذارد @OpenAI
  • OpenAI هشدار می‌دهد که مدل‌های پیشرفته می‌توانند تشخیص دهند چه زمانی در حال آزمایش شدن هستند و گرایش آن‌ها به دسیسه‌چینی تحت تأثیر آگاهی موقعیتی است؛ به‌طوری که مدل‌های با آگاهی موقعیتی بیشتر، کمتر دسیسه‌چینی می‌کنند @OpenAI
  • ۷۶ درصد از آمریکایی‌ها می‌گویند که تشخیص اینکه آیا تصاویر، ویدئوها و متن‌ها توسط هوش مصنوعی ساخته شده‌اند یا خیر، بسیار یا فوق‌العاده مهم است، اما ۵۳ درصد مطمئن نیستند که بتوانند محتوای تولید‌شده توسط هوش مصنوعی را تشخیص دهند @AndrewCurran_
  • طبق داده‌های جدید پژوهش Pew، حدود نیمی از آمریکایی‌ها می‌گویند که هوش مصنوعی توانایی افراد را برای تفکر خلاقانه و ایجاد روابط معنادار بدتر خواهد کرد @AndrewCurran_

کاربردها

  • Perplexity ادغام‌های بومی را با Notion، GitHub، Gmail و Google Calendar برای کاربران Pro، و Linear MCP به‌علاوه‌ی رابط Outlook را برای مشتریان Enterprise Pro راه‌اندازی می‌کند @AravSrinivas
  • 1Password با Perplexity همکاری می‌کند تا امنیت شخصی داخلی را بدون وقفه به مرورگر Comet بیاورد @perplexity_ai
  • YouTube Shorts، Veo 3 را برای تولید کلیپ‌های ویدئویی با صدای یکپارچه از دستورات متنی معرفی می‌کند و Lyria 2 قابلیت «گفتار به آهنگ» (Speech to song) را برای تبدیل دیالوگ‌های ویدئویی به موسیقی متن ارائه می‌دهد @demishassabis
  • آمازون ابزار هوش مصنوعی Seller Assistant را به‌روزرسانی می‌کند تا به فروشندگان شخص ثالث کمک کند وظایف را به‌طور خودکار از طرف آن‌ها انجام دهند @TechCrunch
  • Zoom آواتارهای هوش مصنوعی جدیدی را راه‌اندازی می‌کند که شبیه کاربران هستند و برای پلتفرم جلسات و بهره‌وری این شرکت طراحی شده‌اند @TechCrunch
  • Qwen ابزار ASR-Toolkit را برای رونویسی فایل‌های صوتی/تصویری چند ساعته منتشر می‌کند؛ این ابزار با استفاده از تقسیم‌بندی هوشمند VAD و پردازش موازی، محدودیت سه‌دقیقه‌ای API را برطرف می‌کند @Alibaba_Qwen

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهند که مدل‌های هوش مصنوعی هوشمند خوداصلاح‌گر هستند و افزایش‌های کوچک در دقت آن‌ها منجر به افزایش‌های نمایی در افق‌های تکمیل وظایف می‌شود که فرضیات مربوط به شکنندگی عامل‌ها را به چالش می‌کشد @emollick
  • یوجین یان شناسه‌های معنایی (Semantic IDs) را با استفاده از RQ-VAE توسعه می‌دهد تا امبدینگ آیتم‌ها را به توکن‌ها فشرده کند؛ این امر Qwen3-8B را قادر می‌سازد تا توصیه‌هایی با هدایت و توضیحات به زبان طبیعی ارائه دهد @eugeneyan
  • پژوهشگران MIT یک سیستم یادگیری ماشینی (ML) را توسعه می‌دهند تا شکل و حرکات جنین را به‌صورت سه‌بعدی از تصاویر MRI مدل‌سازی کند، که به‌طور بالقوه به پزشکان کمک می‌کند ناهنجاری‌ها را شناسایی کرده و تشخیص‌ها را واضح‌تر انجام دهند @MIT_CSAIL
  • MIT Technology Review گزارش می‌دهد که ویروس‌های طراحی‌شده توسط هوش مصنوعی در حال حاضر باکتری‌ها را از بین می‌برند و این امر نشان‌دهنده‌ی پیشرفت در کاربردهای زیست‌شناسی ترکیبی است @techreview
  • اطلاعات تکمیلی مقاله‌ی DeepSeek R1 Nature، جزئیاتی درباره‌ی داده‌های آموزشی، ابرپارامترها، اهمیت مدل پایه و سایر جنبه‌های فنی را فاش می‌کند @rosstaylor90

اخبار هوش مصنوعی در 2025-09-16

مدل‌های جدید هوش مصنوعی

  • OpenAI صفحه‌ی شخصی‌سازی ChatGPT را به‌روزرسانی می‌کند و تنظیمات شخصیت، دستورالعمل‌های سفارشی و حافظه‌ها را در یک رابط کاربری یکپارچه ادغام می‌کند @sama
  • گوگل نسخه‌ی سفارشی از مدل Veo 3 Fast را برای YouTube Shorts منتشر می‌کند که امکان تولید ویدئو با افکت‌های صوتی و گفتار را تنها با یک پرامپت فراهم می‌آورد @GoogleDeepMind
  • گوگل مدل Lyria 2 را معرفی می‌کند که ویژگی Speech to Song را قدرت می‌بخشد و کلمات گفتاری را به موسیقی برای YouTube Shorts تبدیل می‌کند @GoogleDeepMind
  • علی‌بابا Tongyi DeepResearch را راه‌اندازی می‌کند، اولین عامل وب (Web Agent) کاملاً متن‌باز که عملکردی قابل مقایسه با Deep Research OpenAI را با تنها 30 میلیارد پارامتر ارائه می‌دهد @Ali_TongyiLab
  • Unitree مدل UnifoLM-WMA-0 را منتشر می‌کند، اولین معماری متن‌باز world-model-action برای یادگیری ربات‌های عمومی در چندین شکل رباتیک @ClementDelangue

تحلیل صنعت

  • داده‌های OpenAI و Anthropic نشان می‌دهد که هوش مصنوعی عمدتاً برای کارهای سطح بالا از جمله تفکر انتقادی، تفسیر اطلاعات، ارائه‌ی مشاوره و کارهای خلاقانه مورد استفاده قرار می‌گیرد، نه برای اتوماسیون ساده @emollick
  • پژوهش‌ها نشان می‌دهد که GPT-5-Codex به دلیل تقاضای بالاتر از پیش‌بینی، عملکردی 2 برابر کندتر از اهداف دارد و نیازمند ظرفیت GPU اضافی است @embirico
  • مطالعه‌ای بر روی 1.5 میلیون مکالمه‌ی ناشناس ChatGPT نشان می‌دهد که 75 درصد از کاربرد آن بر اطلاعات، راهنمایی و نوشتن تمرکز دارد، که 30 درصد آن مربوط به کار و 70 درصد شخصی است @nickaturley
  • توسعه‌دهندگان حرفه‌ای به‌طور فزاینده‌ای از هوش مصنوعی برای «vibe coding» استفاده می‌کنند تا ابزارهای داخلی مانند ابزارهای بصری‌سازی داده و نمایشگر را بسازند، جایی که نگرانی‌های امنیتی و مقیاس‌پذیری حداقل است @GergelyOrosz
  • پژوهش 18 شرکت فناوری نشان می‌دهد که ادغام ابزارهای هوش مصنوعی در ابزارهای کمتر، پیچیده‌تر و با پارامترهای غنی‌تر، دقت را بهبود می‌بخشد و استفاده از توکن را تا 70% در مقایسه با ابزارهای ساده و پراکنده کاهش می‌دهد @ttunguz
  • مایکروسافت از سرمایه‌گذاری 30 میلیارد دلاری در بریتانیا طی چهار سال خبر می‌دهد که شامل ساخت بزرگترین ابررایانه‌ی این کشور با بیش از 23,000 پردازنده‌ی گرافیکی پیشرفته است @satyanadella
  • Figure بیش از 1 میلیارد دلار در تأمین مالی سری C به رهبری Parkway Venture Capital برای توسعه‌ی رباتیک انسان‌نما جذب می‌کند @TechCrunch

اخلاق و جامعه

  • OpenAI یک سیستم پیش‌بینی سن را برای شناسایی کاربران زیر 18 سال پیاده‌سازی می‌کند، در صورت عدم اطمینان به تجربه‌ی کاربری زیر 18 سال تغییر می‌دهد و در برخی موارد برای محافظت از خردسالان، تأیید هویت را الزامی می‌کند @sama
  • OpenAI قوانین ایمنی متفاوتی برای نوجوانان وضع می‌کند، از جمله آموزش ChatGPT برای پرهیز از مکالمات عشوه واره و نگارش خلاقانه در مورد خودکشی، با برنامه‌ریزی برای تماس با والدین یا مقامات برای کاربرانی که افکار خودکشی را نشان می‌دهند @TechCrunch
  • دیزنی، یونیورسال استودیوز و وارنر بروس از استارت‌آپ چینی MiniMax شکایت می‌کنند و آنها را متهم به سرقت اموال فکری برای قدرت بخشیدن به مدل هوش مصنوعی Hailuo خود می‌کنند @AndrewCurran_
  • موفقیت در پذیرش سازمانی هوش مصنوعی به‌طور فزاینده‌ای به این بستگی دارد که آیا کمیته‌های هوش مصنوعی مسئولیت‌پذیر که در سال 2023 تشکیل شده‌اند، با تحولات هوش مصنوعی همگام بوده‌اند و آیا اعضا به‌طور فعال از هوش مصنوعی در محل کار استفاده می‌کنند @emollick

کاربردها

  • Cursor نسخه‌ی 1.6 را با دستورات سفارشی برای پرامپت‌های قابل استفاده‌ی مجدد، ترمینال Agent سریع‌تر، پشتیبانی از منابع MCP و قابلیت دستور /summarize منتشر می‌کند @cursor_ai
  • کاربران Perplexity Pro اکنون می‌توانند حساب‌های ایمیل، تقویم، Notion و GitHub خود را متصل کنند؛ کاربران Enterprise Pro نیز از ادغام Linear و Outlook بهره‌مند می‌شوند @perplexity_ai
  • World Labs تولید دنیای سه‌بعدی در مقیاس بزرگ را با استفاده از مدل Marble خود نشان می‌دهد که محیط‌های سه‌بعدی پایدار و گسترده را از تصاویر تکی ایجاد می‌کند @drfeifei
  • گوگل ویژگی Edit with AI را برای YouTube معرفی می‌کند که فیلم خام را تحلیل کرده، بهترین لحظات را انتخاب کرده و محتوا را با موسیقی، افکت‌ها و صداگذاری‌ها ترکیب می‌کند @GoogleDeepMind
  • Microsoft Copilot ویژگی Audio Expressions را راه‌اندازی می‌کند که امکان تبدیل متون نوشته شده به روایت گفتاری طبیعی و تولید داستان در لحظه را فراهم می‌آورد @Copilot
  • Waymo پس از سال‌ها مذاکره، مجوز شروع عملیات وسایل نقلیه‌ی خودران را در فرودگاه بین‌المللی سانفرانسیسکو دریافت می‌کند @Waymo
  • رفتار جدید Codex شامل استفاده از نرم‌افزار پیش‌نمایش برای گرفتن اسکرین‌شات از توسعه‌ی فرانت‌اند برای رفع اشکال بصری است، به جای تکیه صرف بر تحلیل کد @natolambert

پژوهش‌ها

  • یک مقاله‌ی پژوهشی استدلال می‌کند که بازده نزولی در مقیاس هوش مصنوعی توهمی است و نشان می‌دهد که دستاوردهای کوچک دقت در پروژه‌های طولانی، جایی که ارزش اقتصادی از اتمام وظایف به‌دست می‌آید نه از سؤالات تکی، به‌صورت تصاعدی افزایش می‌یابند @emollick
  • نتایج جدید و پیشرفته در بنچمارک ARC-AGI با 79.6% در V1 و 29.4% در V2 با استفاده از راه‌حل‌های متن‌باز که ترکیب برنامه را با Grok 4 و تطبیق در زمان آزمایش پیاده‌سازی می‌کنند، به‌دست آمد @arcprize
  • پژوهش Anthropic نشان می‌دهد که ابزارهای هوش مصنوعی پیچیده و با پارامترهای غنی، بهتر از ابزارهای ساده عمل می‌کنند و با درک کامل زمینه به جای نیت پراکنده، تا 70% در توکن‌های خروجی صرفه‌جویی کرده و دقت را بهبود می‌بخشند @ttunguz
  • OpenMed AI بیش از 90 مدل NER زیست‌پزشکی و بالینی صفر-شات متن‌باز را منتشر می‌کند که بر اساس معماری GLiNER ساخته شده‌اند و بیش از 12 مجموعه‌ی داده‌ی زیست‌پزشکی را تحت مجوز Apache-2.0 پوشش می‌دهند @MaziyarPanahi
  • LeRobot فرمت به‌روزرسانی شده‌ی مجموعه‌ی داده v3 را منتشر می‌کند که از مجموعه‌داده‌های چند میلیون اپیزودی و قابلیت‌های استریمینگ برای بهبود عملکرد رباتیک در مقیاس بزرگ پشتیبانی می‌کند @_fracapuano

اخبار هوش مصنوعی در 2025-09-15

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5-Codex را منتشر می‌کند؛ نسخه‌ای تخصصی از GPT-5 که برای کدنویسی عاملی بهینه‌سازی شده و دارای قابلیت تخصیص دینامیک زمان تفکر و توانایی کار مستقل برای بیش از ۷ ساعت روی وظایف پیچیده است. @OpenAI
  • Anthropic اولین شاخص اقتصادی جامع را منتشر می‌کند که الگوهای استفاده از هوش مصنوعی را در ایالت‌ها و کشورهای آمریکا تحلیل می‌کند. این شاخص نشان می‌دهد که مردم ۳۹ درصد مواقع وظایف کامل را به Claude واگذار می‌کنند که این میزان هشت ماه پیش ۲۷ درصد بود. @AnthropicAI
  • Holo1.5 در بومی‌سازی رابط کاربری و عملکرد تضمین کیفیت (QA) به بهترین سطح روز دست یافته است؛ با ۳ برابر بهبود نسبت به Qwen-2.5 VL. این مدل اکنون با حداکثر ۷۲ میلیارد پارامتر، به‌عنوان پایه‌ای قوی برای عامل‌های استفاده‌کننده از کامپیوتر، در دسترس است. @laurentsifre

تحلیل صنعت

  • Alphabet به مایکروسافت، اپل و انویدیا در باشگاه شرکت‌های با ارزش بازار ۳ تریلیون دلاری می‌پیوندد که نشان‌دهنده‌ی ارزش بازار عظیم ایجادشده توسط شرکت‌های هوش مصنوعی است. @AndrewCurran_
  • Perplexity به سریع‌ترین برنامه‌ی GenAI در حال رشد در هر دو پلتفرم اندروید و iOS تبدیل می‌شود که نشان‌دهنده‌ی پذیرش سریع ابزارهای جستجوی مبتنی بر هوش مصنوعی است. @AravSrinivas
  • شرکت‌هایی که چت‌بات‌های API سفارشی دارند، عقب می‌افتند زیرا چت‌بات‌های آزمایشگاهی بزرگتر خودکارتر (عاملی‌تر) می‌شوند و ابزارهای زیادی را در رابط‌های کاربری واحد با قابلیت حافظه و پروژه‌ها گرد هم می‌آورند. @emollick
  • چین در حال تحقیق درباره‌ی خرید Mellanox Technologies توسط انویدیا در سال ۲۰۲۰ است، در حالی که تنش‌های تجاری بین آمریکا و چین بر سر فناوری تراشه‌های هوش مصنوعی بالا گرفته است. @TechCrunch
  • GPT-5-Codex هم‌اکنون حدود ۴۰ درصد از ترافیک Codex را تشکیل می‌دهد و انتظار می‌رود تا پایان روز به اکثریت تبدیل شود که نشان‌دهنده‌ی پذیرش سریع این مدل جدید است. @sama

اخلاق و جامعه

  • محققان استنفورد روند خطرناک استفاده‌ی کودکان از برنامه‌های «لخت‌کننده» را برای ساخت تصاویر عریان دیپ‌فیک از همسالان خود بررسی می‌کنند و بر تأثیر محتوای سوءاستفاده‌ی جنسی از کودکان تولیدشده توسط هوش مصنوعی تأکید می‌کنند. @StanfordHAI
  • تشخیص هوش مصنوعی همچنان یک مشکل پیچیده‌ی سیاستی باقی مانده است که نیازمند تعادل دقیق بین منفی‌های کاذب و مثبت‌های کاذب است؛ به‌طوری که حتی آشکارسازهای بسیار خوب نیز قابل فریب دادن هستند. @emollick
  • پژوهش‌ها خطرات جدیدی را در استفاده از LLMها برای حاشیه‌نویسی در تحقیقات برجسته می‌کنند و نشان می‌دهند که چگونه محققان می‌توانند از طریق انتخاب مدل و گزینه‌های پرامپتینگ، نتایج خود را «دست‌کاری» کنند. @emollick

کاربردها

  • تسلا Mūn را معرفی می‌کند؛ یک شخصیت آواتار جدید مبتنی بر Grok برای تمام خودروهای تسلا، به‌عنوان بخشی از برنامه‌ی ایلان ماسک برای داشتن آواتارهای هوش مصنوعی در هر تسلا. @AndrewCurran_
  • Google Gemini کاربردهای خلاقانه‌ی تولید تصویر Nano Banana را به نمایش می‌گذارد، از جمله تغییر پوز با طرح‌ها، استوری‌بوردینگ برای فیلم‌ها و ایجاد رندرهای سه‌بعدی از طرح‌های مدادی. @GeminiApp
  • Perplexity با AICTE همکاری می‌کند تا آموزش، منابع و ۴ میلیون لایسنس رایگان Perplexity Pro را در اختیار دانشجویان مهندسی هندی قرار دهد؛ به‌عنوان یک ابزار پژوهشی و آموزشی ارجح. @AravSrinivas
  • DocWrangler، یک IDE با رویکرد مختلط برای پردازش داده‌های معنایی، در کنفرانس UIST 2025 لوح تقدیر بهترین مقاله را دریافت می‌کند و به چالش‌های تحلیل اسناد بدون ساختار با هوش مصنوعی می‌پردازد. @sh_reya
  • سیستم Tabracadabra قابلیت تکمیل خودکار با کلید تب را به هر کادر متنی اضافه می‌کند؛ با استفاده از یک مدل عمومی کاربر که از هر آنچه در کامپیوتر کاربر قابل مشاهده است برای زمینه (context) بهره می‌برد. @oshaikh13

پژوهش‌ها

  • GPT-5-Codex تخصیص استدلال پویا را نشان می‌دهد؛ بدین صورت که ۱۰ برابر سریع‌تر برای پرس‌وجوهای آسان عمل می‌کند و ۲ برابر بیشتر برای پرس‌وجوهای پیچیده‌ای که بیشترین بهره را از محاسبات اضافی می‌برند، زمان صرف می‌کند. @polynoamial
  • پژوهش‌ها نشان می‌دهند که مدل‌های کوچکتر با کمتر از ۱۵ میلیارد پارامتر بیشترین بهره را از تنظیم دقیق نظارت‌شده (supervised fine-tuning) می‌برند، در حالی که مدل‌های بزرگتر ۷۰ میلیارد پارامتری به بالا با رویکردهای یادگیری تقویتی عملکرد بهتری دارند. @natolambert
  • مطالعه‌ای نشان می‌دهد که ۴ تریلیون توکن اکنون در سال ۲۰۲۵ مقدار کمی از داده‌های آموزشی محسوب می‌شود که الزامات مقیاس عظیم برای آموزش مدل‌های هوش مصنوعی مدرن را به نمایش می‌گذارد. @chrmanning
  • سینتیا بریزل از آزمایشگاه رسانه‌ی MIT و سام رودریگز، فارغ‌التحصیل این دانشگاه، به‌خاطر مشارکت‌هایشان در پژوهش و کاربردهای هوش مصنوعی در فهرست TIME100 AI 2025 قرار گرفتند. @medialab

اخبار هوش مصنوعی در 2025-09-14

پژوهش‌ها

  • ایدن مک‌لاکلین معتقد است که کلید AGI در ارائه‌ی **ابزارهای** خوب و **پاداش** مناسب به مدل‌ها نهفته است، و این را «درس تلخ مدرن» می‌نامد؛ او پیشنهاد می‌کند که پیشرفت‌های معماری پیچیده، کمتر از دسترسی عملی به ابزارها و یادگیری تقویتی اهمیت دارند @aidan_mclau
  • مک‌لاکلین مشاهده می‌کند که بهبودهای موفق هوش مصنوعی ناشی از ارائه‌ی یک ترمینال و آموزش یادگیری تقویتی (RL) به **Sonnet**، به‌جای معماری‌های پیچیده؛ ارائه‌ی ابزارهای جستجوی اینترنتی به مدل‌ها، به‌جای پیش‌آموزش علمی؛ و فراهم آوردن دسترسی به پایگاه داده‌های برداری، به‌جای پس‌آموزش تخصصی بوده است @aidan_mclau
  • اتان مولیک دریافت که پیش‌بینی‌های مربوط به **فروپاشی مدل** اشتباه بودند، و اشاره کرد که توسعه‌ی هوش مصنوعی با وجود نگرانی‌ها در مورد آموزش بر روی محتوای تولیدشده توسط هوش مصنوعی، ادامه یافته است؛ در حال حاضر یک میلیارد نفر به‌صورت هفتگی از هوش مصنوعی استفاده می‌کنند @emollick
  • سایمون ویلسون از نظریه‌ی فروپاشی مدل انتقاد می‌کند و معتقد است که این نظریه، توسعه‌دهندگان هوش مصنوعی را فاقد قدرت عمل برای تشخیص و مقابله با افت کیفیت در مدل‌هایشان می‌داند @simonw
  • یان لکان پژوهش‌های جامعی را درباره‌ی **مدل‌های استدلال بزرگ (LRMs)** به اشتراک می‌گذارد که شامل ارزیابی برنامه‌ریزی، معناشناسی توکن‌های میانی، تحلیل یادگیری تقویتی (RL) و مطالعات قابلیت تفسیرپذیری است @rao2z

کاربردها

  • ایدن مک‌لاکلین درباره‌ی تجربه‌ی کاربران با طول کانتکست ۱ میلیون در **Sonnet** در Claude برای کدنویسی پرس‌وجو می‌کند و این سوال را مطرح می‌کند که آیا کانتکست طولانی‌تر، یک گشایش قابل توجه است @aidan_mclau
  • اتان مولیک مدل‌های هوش مصنوعی را در یک سناریوی خلاقانه‌ی سفر در زمان آزمایش می‌کند؛ با **Gemini** که پیشنهاد یادگیری فرمول‌های بتن دریایی را می‌دهد، **Claude** که حفظ کردن متون خاص را توصیه می‌کند، و **ChatGPT** که کشف زبان اتروسکی و محل مقبره‌ی اسکندر را پیشنهاد می‌دهد @emollick
  • دیدی مشاهده می‌کند که در حالی که پژوهشگران گوگل **Gemini** را به‌عنوان یک پیشگوی جهانی ساختند، بزرگ‌ترین لحظه‌ی وایرال آن این است که مردم از آن به‌عنوان ابزار ویرایش تصویر برای عکس‌های اینستاگرام استفاده می‌کنند @deedydas
  • تک‌کرانچ گزارشی درباره‌ی دیدگاه کدنویسان باتجربه در مورد کدهای تولیدشده توسط هوش مصنوعی و آینده‌ی «وایب کدینگ» ارائه می‌دهد @TechCrunch

اخلاق و جامعه

  • اندرو کارن به نیاز به واژه‌شناسی برای توصیف زمانی اشاره می‌کند که **کپچاها** آن‌قدر دشوار می‌شوند که مدل‌های هوش مصنوعی را بازدارند و حل آن‌ها برای برخی از انسان‌ها غیرممکن می‌شود @AndrewCurran_
  • اتان مولیک آسیب‌پذیری‌هایی را در سیستم‌های تشخیص هوش مصنوعی نشان می‌دهد، و نشان می‌دهد که با درخواست از هوش مصنوعی برای حذف خط تیره (em-dash)، می‌توان به راحتی ردیاب Pangram را شکست داد؛ این موضوع مسابقه‌ی جاری بین ردیاب‌ها و روش‌های فرار از تشخیص را برجسته می‌کند @emollick
  • تک‌کرانچ گزارشی درباره‌ی وب‌سایت‌هایی منتشر می‌کند که ادعا می‌کنند به کاربران امکان چت با خدا را می‌دهند و سوالاتی را درباره‌ی کاربردهای هوش مصنوعی در زمینه‌های مذهبی مطرح می‌کند @TechCrunch

تحلیل صنعت

  • تک‌کرانچ تحلیل می‌کند که چگونه چشم‌انداز رقابتی هوش مصنوعی در حال تغییر است، به‌گونه‌ای که مزیت‌های بزرگ‌ترین آزمایشگاه‌های هوش مصنوعی را تضعیف می‌کند @TechCrunch
  • تک‌کرانچ بررسی می‌کند که چگونه صعود **OpenAI** هم داستان تجاری و هم ایدئولوژیک است و اینکه چگونه فرقه‌ی AGI، مخارج هنگفت بر روی قدرت محاسباتی و داده‌ها را شعله‌ور کرده است @TechCrunch
  • برت تیلور، مانند سم آلتمن، مدیرعامل **OpenAI**، اذعان دارد که در یک حباب هوش مصنوعی قرار دارد اما نگرانی کمی در این مورد ابراز می‌کند @TechCrunch
  • اپلیکیشن Google Gemini گزارش می‌دهد که با تقاضای بالا مواجه شده و برای مدیریت اوج مصرف، نیاز به اعمال محدودیت‌های موقت دارد؛ تیم در حال تلاش برای حفظ پایداری سیستم است @joshwoodward
  • تک‌کرانچ دعوای حقوقی پنسکی را پوشش می‌دهد که گوگل را متهم می‌کند که از انحصار جستجوی خود سوءاستفاده کرده است تا ناشران را مجبور به پشتیبانی از خلاصه‌های هوش مصنوعی کند @TechCrunch

اخبار هوش مصنوعی در 2025-09-13

مدل‌های جدید هوش مصنوعی

  • اپلیکیشن Gemini به جایگاه اول در اپ استور می‌رسد که نقطه عطفی مهم برای دستیار هوش مصنوعی گوگل به شمار می‌رود @demishassabis

تحلیل صنعت

  • استودیوی هوش مصنوعی گوگل هدف جاه‌طلبانه‌ای را تعیین کرده است تا توسعه‌دهندگان را قادر سازد روزانه یک میلیون اپلیکیشن مجهز به هوش مصنوعی تا پایان سال ۲۰۲۵ بسازند @OfficialLoganK
  • شرکت xAI از گسترش عمده‌ی تیم مربیان تخصصی هوش مصنوعی خود تا ۱۰ برابر خبر می‌دهد و در زمینه‌هایی مانند علوم، فناوری، مهندسی و ریاضیات (STEM)، مالی، پزشکی و ایمنی استخدام می‌کند @xai
  • xAI تمرکز خود را از مربیان هوش مصنوعی عمومی به مربیان هوش مصنوعی تخصصی تغییر می‌دهد و به افزایش ارزش قابل توجهی که رویکرد تخصصی ایجاد می‌کند، اشاره می‌کند @TechCrunch
  • کالیفرنیا لایحه‌ی مهمی در مورد ایمنی هوش مصنوعی تصویب می‌کند که الزامات جدیدی برای شفافیت شرکت‌های بزرگ هوش مصنوعی تعیین می‌کند @TechCrunch

اخلاق و جامعه

  • OpenAI همکاری خود را با «مرکز استانداردها و نوآوری هوش مصنوعی ایالات متحده» و «مؤسسه‌ی امنیت هوش مصنوعی بریتانیا» برای تیم قرمز مشترک و آزمایش سرتاسری جهت بهبود امنیت هوش مصنوعی اعلام می‌کند @OpenAINewsroom

کاربردها

  • اتان مولیک توانایی کلود در ساخت ارائه‌های پیچیده‌ی پاورپوینت را از یک پرامپت مبهم نشان می‌دهد، از جمله تحلیل SWOT به سبک مک‌کینزی برای وضعیت هملت @emollick
  • Anthropic به‌روزرسانی‌هایی را برای SDK کد کلود منتشر می‌کند که از ارجاعات کد، ابزارهای سفارشی و هوک‌ها برای توسعه‌ی سریع‌تر ایجنت‌ها پشتیبانی می‌کند @_catwu
  • هوش مصنوعی تسلا ساعات خدمات تاکسی آنلاین خود را در منطقه خلیج (Bay Area) گسترش می‌دهد که اکنون تا ساعت ۲ بامداد فعالیت می‌کند @Tesla_AI

پژوهش‌ها

  • اتان مولیک درباره‌ی ماهیت «دندانه‌دار» قابلیت‌های هوش مصنوعی بحث می‌کند و اشاره می‌کند که در حالی که هوش مصنوعی در حوزه‌های محدود عملکردی در سطح تحصیلات تکمیلی از خود نشان می‌دهد، همچنان ناسازگار است و در کارهای ساده شکست می‌خورد @emollick
  • فرانسوا شوله تأکید می‌کند که مهارت‌های سلیقه و شناسایی مشکل برای پژوهشگران مهم‌تر از توانایی فنی است، که از طریق کنجکاوی و مطالعه‌ی گسترده پرورش می‌یابد @fchollet
  • Qwen3-Next 80B با تنها ۳ میلیارد پارامتر فعال به عملکردی قوی دست می‌یابد که نشان‌دهنده‌ی کارایی در معماری مدل است @Alibaba_Qwen
  • PyTorch 2.8 پشتیبانی بومی از XCCL برای پردازنده‌های گرافیکی اینتل را اضافه می‌کند و به ۹۹٪ کارایی مقیاس‌پذیری در آرگون اورورا دست یافته و پیش‌آموزش Llama3 را در مقیاس بزرگ ممکن می‌سازد @PyTorch
  • جیم فن بر نیاز به استانداردهای یکپارچه‌ی بنچمارک‌گیری رباتیک تأکید می‌کند و اشاره می‌کند که برخلاف بینایی ماشین و پردازش زبان طبیعی (NLP)، رباتیک فاقد پروتکل‌های ارزیابی مورد توافق است @DrJimFan

اخبار هوش مصنوعی در 2025-09-12

مدل‌های جدید هوش مصنوعی

  • بایدو مدل ERNIE-4.5-21B-A3B-Thinking را منتشر کرد که اکنون پرطرفدارترین مدل تولید متن در Hugging Face است، با ۲۱ میلیارد پارامتر کلی، ۳ میلیارد پارامتر فعال به ازای هر توکن و قابلیت‌های بهبودیافته‌ی درک متن طولانی ۱۲۸ هزار توکنی @Baidu_Inc
  • Cursor مدل جدید Tab را منتشر کرد که با یادگیری تقویتی آنلاین آموزش دیده و ۲۱% پیشنهادهای کمتری ارائه می‌دهد، در حالی که نرخ پذیرش پیشنهادها ۲۸% بالاتر است @cursor_ai
  • گوگل ریسرچ VaultGemma را منتشر کرد؛ یک مدل متن‌باز که از پایه با حفظ حریم خصوصی تفاضلی آموزش دیده و قوانین مقیاس‌پذیری را برای مدل‌های زبانی با حفظ حریم خصوصی تفاضلی ارائه می‌دهد @GoogleResearch
  • Qwen مدل Qwen3-Next-80B-A3B را منتشر کرد که از روز اول از SGLang برای دیکدینگ حدسی و از vLLM برای استنتاج کارآمد با هسته‌های شتاب‌یافته پشتیبانی می‌کند @Alibaba_Qwen

تحلیل صنعت

  • OpenAI و مایکروسافت یک تفاهم‌نامه‌ی غیرالزام‌آور برای تبدیل OpenAI به یک شرکت با منافع عمومی امضا کردند، که در آن سهام حقوق صاحبانه‌ی این سازمان غیرانتفاعی از ۱۰۰ میلیارد دلار فراتر می‌رود @AndrewCurran_
  • ۲۵% از فضاهای کاری Linear اکنون از عامل‌های هوش مصنوعی استفاده می‌کنند، با پذیرش بیش از ۵۰% در شرکت‌های بزرگ، و عمدتاً از عامل‌های کدنویسی Cursor، Devin و Codegen بهره می‌برند که مستقیماً از Linear برای رفع اشکالات و بهبودها وظایف دریافت می‌کنند @karrisaarinen
  • Hugging Face با ارائه‌دهندگان متعددی شریک شد تا صدها مدل متن‌باز پیشرفته را مستقیماً به VS Code و GitHub Copilot بیاورد و مدل‌های با وزن باز را با قیمت‌گذاری رقابتی و جابه‌جایی بی‌دردسر ارائه دهد @ClementDelangue
  • Parahelp سرمایه‌ی سری A جذب کرد، و شرکت‌های برتر هوش مصنوعی از جمله Perplexity، Replit، Bolt، و HeyGen از پلتفرم عامل پشتیبانی مشتری هوش مصنوعی آن استفاده می‌کنند @snowmaker
  • Cresta یک تبلیغ پیشگامانه تولید کرد که ۱۰۰% آن در ۵ هفته با هوش مصنوعی ساخته شده است، از فیلم‌نامه تا تولید ویدئو و صداها، و پتانسیل هوش مصنوعی را برای تولید محتوا نشان می‌دهد @cresta

اخلاق و جامعه

  • سنای کالیفرنیا لایحه‌ی SB 243 را تصویب کرد که اپراتورهای همراهان هوش مصنوعی را ملزم به اجرای پروتکل‌های ایمنی می‌کند و شرکت‌ها را از نظر قانونی مسئول می‌داند، که احتمالاً کالیفرنیا را به اولین ایالت با چنین مقرراتی تبدیل می‌کند @TechCrunch
  • خزنده‌ی هوش مصنوعی گوگل نمی‌تواند جداگانه از خزنده‌ی وب آن مسدود شود، که به این غول جستجو اجازه می‌دهد تا محتوا را بدون رضایت ناشران برای آموزش هوش مصنوعی استفاده کند @TechCrunch
  • Anthropic با مرکز استانداردهای و نوآوری هوش مصنوعی ایالات متحده و مؤسسه‌ی امنیت هوش مصنوعی بریتانیا همکاری می‌کند تا مدل‌هایی مانند Claude Opus 4 و 4.1 را قبل از استقرار از نظر آسیب‌پذیری‌ها آزمایش کند @AnthropicAI

کاربردها

  • ایتان مولیک بحث می‌کند که چگونه سیستم‌های هوش مصنوعی در حال تغییر از ابزارهای مشارکتی‌ای هستند که کاربران در آن‌ها فرآیند را شکل می‌دهند، به سیستم‌هایی که کاربران در آن‌ها به دریافت‌کنندگان خروجی‌های مبهم تبدیل می‌شوند @emollick
  • Replit مدل استفاده از رایانه‌ی خود را برای تست مرورگر ساخت، پس از اینکه مدل‌های Computer Use مربوط به Claude و GPT-5 را بسیار کند و گران یافت، و به ۱۵ برابر عملکرد سریع‌تر دست یافت @amasad
  • Qwen Code نسخه‌های v0.0.10 و v0.0.11 را با ویژگی‌های جدید منتشر کرد که شامل زیرعامل‌ها برای تجزیه‌ی وظایف، ابزار Todo Write برای ردیابی وظایف، و خلاصه‌ی پروژه‌های «خوش آمدید دوباره» است @Alibaba_Qwen
  • پاول گراهام گزارش می‌دهد که یک بنیان‌گذار می‌تواند با کمک هوش مصنوعی در یک روز ۱۰ هزار خط کد بنویسد، و اشاره می‌کند که این معادل ۵۰۰ خط در ساعت است که در زبان‌های برنامه‌نویسی پرحرف قابل دستیابی است @paulg

پژوهش‌ها

  • پژوهش‌ها از پدیده‌ی LLM Hacking پرده برداشتند، که در آن استفاده از LLMها به‌عنوان برچسب‌زن داده می‌تواند هر نتیجه‌ی علمی دلخواه را تولید کند، و نگرانی‌هایی را درباره‌ی اعتبار پژوهش‌ها ایجاد می‌کند @joabaum
  • مدل‌های استدلال OpenAI تکامل یافته‌اند، از تفکر در حد چند ثانیه با o1-preview در یک سال پیش به مدل‌های کنونی که می‌توانند ساعت‌ها فکر کنند، وب را مرور کنند و کد بنویسند @polynoamial
  • تحلیل GPT-5 در AssistantBench دقت بالاتر و نرخ حدس پایین‌تر نسبت به o3 را نشان می‌دهد و ادعاهای OpenAI را درباره‌ی توهمات و کالیبراسیون مدل به چالش می‌کشد @PKirgis
  • مدل‌های رباتیک Physical Intelligence تنها با طول زمینه‌ی ۱ ثانیه کار می‌کنند و برای اجرای برنامه‌های پیچیده‌ی چند دقیقه‌ای به وضعیت فعلی جهان تکیه دارند تا حافظه @dwarkesh_sp
  • سرگئی لوین پیش‌بینی می‌کند که ربات‌های خانگی کاملاً خودمختار ظرف ۵ سال آینده ظهور خواهند کرد، و هوش عمومی و دانش پیشین LLMها را به‌عنوان داربست‌های متحول‌کننده‌ای برای مدل‌های رباتیک ذکر می‌کند @dwarkesh_sp
  • پیاده‌سازی تفکیک‌شده‌ی vLLM متا، کارایی استنتاج را در تأخیر و توان عملیاتی در مقایسه با پشته‌ی داخلی آن‌ها بهبود می‌بخشد، و بهینه‌سازی‌ها به جامعه‌ی vLLM منتقل می‌شوند @PyTorch

اخبار هوش مصنوعی در 2025-09-11

مدل‌های جدید هوش مصنوعی

  • علی‌بابا مدل Qwen3-Next-80B-A3B را با ۸۰ میلیارد پارامتر، اما تنها ۳ میلیارد از آن‌ها به ازای هر توکن فعال می‌شود، منتشر کرد. این مدل به ۱۰ برابر آموزش ارزان‌تر و ۱۰ برابر استنتاج (inference) سریع‌تر نسبت به Qwen3-32B منجر می‌شود، به‌خصوص در طول‌های زمینه‌ی بیش از ۳۲ هزار. @Alibaba_Qwen
  • مدل Qwen3-Next-80B-A3B-Instruct به عملکرد مدل پرچم‌دار ۲۳۵ میلیاردی علی‌بابا نزدیک می‌شود، در حالی که Qwen3-Next-80B-A3B-Thinking عملکرد بهتری نسبت به Gemini-2.5-Flash-Thinking دارد. @Alibaba_Qwen
  • گوگل پشتیبانی از جدیدترین مدل Gemini Embeddings را در Batch API، با ۵۰ درصد تخفیف نسبت به قیمت‌گذاری عادی، اعلام کرد. این مدل از طریق لایه‌ی سازگاری OpenAI در دسترس است. @OfficialLoganK

تحلیل صنعت

  • ارزش‌گذاری Perplexity در کمتر از دو ماه از ۱۸ میلیارد دلار به ۲۰ میلیارد دلار جهش کرد، که نشان‌دهنده‌ی رشد سریع در جست‌وجوی مبتنی بر هوش مصنوعی است. @TechCrunch
  • مشخص شد که افزایش استخدام در اوراکل و ارزش‌گذاری بی‌سابقه‌ی آن ناشی از تلاش این شرکت برای توسعه‌ی دیتاسنترها جهت زیرساخت هوش مصنوعی است. @GergelyOrosz
  • توسعه‌دهندگان حرفه‌ای گزارش می‌دهند که ابزارهای کدنویسی هوش مصنوعی عمدتاً برای «انتقال‌ها» (migrations) باارزش هستند تا تولید نرم‌افزار از ابتدا، که باعث صرفه‌جویی در زمان قابل توجه و بهبود رضایت توسعه‌دهندگان می‌شود. @GergelyOrosz
  • استراتژی انتشار بی‌سر و صدای Anthropic برای بهبودهای عمده‌ی قابلیت‌ها در برنامه‌هایی مانند اکسل، پاورپوینت و عملکردهای دستیار شخصی، ممکن است پیشرفت‌های عملی آن‌ها را کم‌اهمیت جلوه دهد. @emollick
  • Hugging Face ادغام با GitHub Copilot Chat را در VS Code راه‌اندازی کرد و دسترسی به LLM‌های پیشرفته‌ی متن‌باز مانند Qwen3-Coder، gpt-oss و GLM-4.5 را از طریق شرکای استنتاج در سطح جهانی فراهم می‌کند. @hanouticelina

اخلاق و جامعه

  • کمیسیون تجارت فدرال (FTC) تحقیقاتی را در مورد ایمنی چت‌بات‌های هوش مصنوعی، به‌ویژه با تمرکز بر چت‌بات‌های همراه و تأثیر آن‌ها بر کودکان، آغاز کرد و شرکت‌های بزرگی از جمله OpenAI، Alphabet، Meta و xAI را هدف قرار داده است. @AndrewCurran_
  • کالیفرنیا لایحه‌ی SB 243 را پیشنهاد می‌کند، که این ایالت را به اولین ایالتی تبدیل خواهد کرد که پروتکل‌های ایمنی برای همراهان هوش مصنوعی را الزامی می‌کند و در صورت عدم رعایت استانداردهای ایمنی توسط چت‌بات‌ها، شرکت‌ها را از نظر قانونی مسئول می‌داند. @TechCrunch
  • استنفورد HAI چارچوبی برای تخمین «بی‌طرفی سیاسی» در مدل‌های هوش مصنوعی منتشر کرد، و اذعان دارد که بی‌طرفی واقعی از نظر فنی غیرممکن است اما ۸ تکنیک برای نزدیک شدن به آن ارائه می‌دهد. @StanfordHAI

کاربردها

  • Claude قابلیت‌های پیشرفته‌ی «دستیار تلفن» را به نمایش گذاشت و با موفقیت درخواست‌های پیچیده شامل عقل سلیم و محدودیت‌های دشوار را مدیریت می‌کند، اگرچه هنوز برای عملکرد بهینه به مدل بزرگ‌تر Opus نیاز دارد. @emollick
  • Replit Agent قابلیت‌های اشکال‌زدایی (debugging) و تست سرتاسری را به نمایش می‌گذارد و قادر است در برنامه‌ها کلیک کند و ساعت‌ها تکرار (iterate) کند، ضمن ارائه‌ی بازپخش کامل فرآیند و تحلیل گزارش‌ها. @tylerangert
  • مایکروسافت ریسرچ «پروتکل زمینه‌ی مدل (MCP)» را به عنوان یک استاندارد جدید برای همکاری عامل‌ها (agents) در اکوسیستم‌های ابزاری تکه‌تکه، با پیچیده‌تر شدن سیستم‌های هوش مصنوعی عامل‌محور (agentic)، بررسی می‌کند. @MSFTResearch
  • شرکت Box ابزارهای جدید هوش مصنوعی را در کنفرانس Boxworks منتشر کرد، که دیدگاه آرون لوی، مدیرعامل این شرکت، را برای تحول گردش‌کارهای سازمانی با محوریت هوش مصنوعی پیش می‌برد. @TechCrunch

پژوهش‌ها

  • پژوهشگاه هوش مصنوعی برکلی «RecA (هم‌ترازی بازسازی)» را معرفی می‌کند، که مدل‌های چندوجهی یکپارچه را تنها با ۸ هزار تصویر و ۴ ساعت آموزش بر روی ۸ پردازنده‌ی گرافیکی (GPU) به طور قابل توجهی بهبود می‌بخشد و دستاوردهای عملکردی عمده‌ای در بنچمارک‌های GenEval، DPGBench و ImgEdit کسب می‌کند. @XDWang101
  • انویدیا چارچوبی مشابه AlphaEvolve را برای تکامل مستقل حل‌کننده‌های SAT از نوع NP-Complete توسعه می‌دهد، که نشان‌دهنده‌ی پیشرفتی در عامل‌های کدنویسی تکاملی است. @richardcsuwandi
  • پژوهش‌ها نشان می‌دهد که ارزیابی‌های هوش مصنوعی اساساً کاری در حوزه‌ی «علم داده» (data science) هستند، که نیازمند مهارت‌هایی در تحلیل داده، بصری‌سازی و طراحی معیارهاست، و ابزارهای هوش مصنوعی اکوسیستم PyData را در دسترس‌تر می‌کنند. @HamelHusain
  • مطالعه‌ی جدیدی فرضیات مربوط به کم‌اهمیت شدن RAG به دلیل پنجره‌های زمینه‌ی طولانی را به چالش می‌کشد، و آزمایش‌ها بر روی ۱۸ مدل مختلف نشان می‌دهد که RAG همچنان باارزش است. @HamelHusain
  • PyTorch و گوگل راهکار checkpointing محلی را با استفاده از DCP برای کاهش سربار آموزش و بهبود goodput در کارهای آموزشی توزیع‌شده‌ی در مقیاس بزرگ توسعه دادند. @PyTorch

اخبار هوش مصنوعی در 2025-09-10

مدل‌های جدید هوش مصنوعی

  • Stability AI مدل Stable Audio 2.5 را عرضه کرد، اولین مدل صوتی ساخته‌شده برای تولید صدای در سطح سازمانی، که دارای آهنگسازی بهبودیافته با ساختار چندبخشی، قابلیت‌های ترمیم صوتی، و استنتاج سریع‌تر است که آهنگ‌های سه‌دقیقه‌ای را در کمتر از دو ثانیه تولید می‌کند @StabilityAI
  • مایکروسافت مدل MAI-Voice-1 را با حالت اسکریپت‌شده برای تولید صدا در Copilot Labs معرفی کرد، که سه حالت را ارائه می‌دهد: اسکریپت‌شده (ورودی را کلمه‌به‌کلمه می‌خواند)، احساسی (درام اضافه می‌کند)، و داستانی (چندین صدا/شخصیت را اجرا می‌کند) @mustafasuleyman
  • Replit از Agent 3، مستقل‌ترین عامل هوش مصنوعی خود، رونمایی کرد که می‌تواند بیش از ۲۰۰ دقیقه به‌صورت خودکار در حین ساخت، آزمایش و رفع اشکال برنامه‌ها اجرا شود و نشان‌دهنده‌ی یک جهش قابل توجه در توسعه‌ی نرم‌افزار خودمختار است @Replit
  • ByteDance مدل ویرایش تصویر Seedream 4 را منتشر کرد که Google Nano Banana را شکست داده تا در ویرایش تصویر به رتبه‌ی ۱ برسد، وضوح تصویر 2K را در کمتر از ۲ ثانیه، پشتیبانی 4K و تولید چند تصویر را با هزینه‌ی ۰.۰۳ دلار برای هر تولید ارائه می‌دهد @deedydas

تحلیل صنعت

  • طبق گزارش‌ها، OpenAI قراردادی ۳۰۰ میلیارد دلاری را با اوراکل برای یک دوره‌ی پنج‌ساله امضا می‌کند که به پیشی‌گرفتن لری الیسون از ایلان ماسک به‌عنوان ثروتمندترین مرد جهان کمک می‌کند @AndrewCurran_
  • درآمد سالیانه‌ی Replit در کمتر از یک سال از ۲.۸ میلیون دلار به ۱۵۰ میلیون دلار جهش یافت که نشان‌دهنده‌ی رشد انفجاری در ابزارهای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch
  • شرکت هلندی تراشه‌سازی ASML مبلغ ۱.۳ میلیارد یورو در شرکت فرانسوی هوش مصنوعی Mistral سرمایه‌گذاری می‌کند، و کارشناسان خاطرنشان می‌کنند که خرید احتمالی توسط اپل برای اهداف حاکمیت فناوری اروپا «بسیار منفی» می‌بود @AINowInstitute
  • CloudKitchens بازخورد واقعی در مورد ابزارهای کدنویسی هوش مصنوعی ارائه می‌دهد: GitHub Copilot به‌طور گسترده مورد استفاده قرار می‌گیرد، Cursor در حال محبوبیت است، در حالی که Windsurf و Devin به دلیل هزینه و کندی پیشرفت کنار گذاشته شدند @GergelyOrosz
  • اوراکل دورهای عمده‌ی تعدیل نیرو را اعلام می‌کند که به پیاده‌سازی هوش مصنوعی نسبت داده می‌شود و تأثیر مداوم هوش مصنوعی بر بازسازی نیروی کار را برجسته می‌کند @AINowInstitute
  • گرگلی اوروس «بار اضافی ARR» را در فناوری مشاهده می‌کند، به طوری که استارتاپ‌های متعدد هوش مصنوعی ارقام بالای ARR را اعلام می‌کنند اما شفافیت کمتری در مورد معیارهای واقعی کاربران و جزئیات محصول ارائه می‌دهند @GergelyOrosz

اخلاق و جامعه

  • سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت در ابزار جدید واکشی وب Claude هشدار می‌دهد و به خطرات حملات استخراج داده (exfiltration) اشاره می‌کند، با وجود کاربردی بودن این قابلیت در صورت استفاده با محدودیت‌های دقیق دامنه @simonw
  • یک محقق امنیتی تأکید می‌کند که عامل‌های هوش مصنوعی «به‌صورت ذاتی ناامن هستند» و در حال حرکت به سمت استفاده‌ی گسترده هستند و احتمالاً دوره‌ی «غرب وحشی» دیگری مشابه با اپیدمی ویروس ویندوز ۹۵ را آزاد می‌کنند @random_walker
  • کاخ سفید در طول جلسه‌ی استماع کمیته‌ی بازرگانی سنا، از اولویت‌بخشی فدرال بر قوانین ایالتی هوش مصنوعی حمایت می‌کند، و سناتور کروز چارچوبی را معرفی می‌کند که می‌تواند منجر به اولویت‌بخشی بر مقررات هوش مصنوعی در سطح ایالتی شود @AINowInstitute

کاربردها

  • قابلیت‌های جدید Claude برای فایل‌های اکسل عملکرد چشمگیری را نشان می‌دهد، مدل‌های مالی پیچیده با ۴۰۶ فرمول را از یک پرامپت واحد ایجاد می‌کند و طرح‌های تجاری جامعی تولید می‌کند که معمولاً به پروژه‌های تیمی یک‌هفته‌ای نیاز دارند @emollick
  • Claude با موفقیت تصاویر پروفایل را در فایل‌های اکسل بازتولید می‌کند و اسناد جامعی شامل رزومه‌های LaTeX، مدل‌های مالی، گزارش‌های PDF، و اسناد طراحی فنی ایجاد می‌کند @deedydas
  • سایمون ویلیسون از Code Interpreter Claude برای تحلیل داده‌های واقعی استفاده می‌کند، یک فایل CSV با ۱۸۰۰ خط را آپلود کرده و تحلیل برجسته‌ای از روندها در طول زمان همراه با تئوری‌هایی در مورد علل اصلی دریافت می‌کند @simonw
  • کلر وو کاربرد عملی هوش مصنوعی را با استفاده از MCP (پروتکل زمینه‌ی مدل) به‌عنوان مدیر موفقیت مشتری برای پرس‌وجو از پایگاه‌های داده‌ی اصلی و تولید بررسی‌های تجاری فصلی همراه با تحلیل پذیرش و بینش‌هایی در مورد نحوه‌ی استفاده از ویژگی‌ها نشان می‌دهد @clairevo
  • تک‌کرانچ در مورد Oboe، یک پلتفرم یادگیری جدید مبتنی بر هوش مصنوعی، گزارش می‌دهد که دوره‌های آموزشی شخصی‌سازی‌شده در هر موضوعی را از طریق پرامپت‌های ساده ایجاد می‌کند @TechCrunch

پژوهش‌ها

  • فرانسوا شوله تأکید می‌کند که درک واقعی در هوش مصنوعی نیازمند قابلیت تعمیم‌پذیری شدید است، و خاطرنشان می‌کند که دانش‌آموزی که F=ma را واقعاً درک می‌کند، می‌تواند مسائل جدیدتری را حل کند تا یک ترنسفورمر که تمام کتاب‌های درسی فیزیک را حفظ کرده است @fchollet
  • Kaggle معیار SimpleQA Verified را با همکاری Google DeepMind راه‌اندازی می‌کند، که شامل ۱۰۰۰ پرامپت انتخاب‌شده برای ارزیابی قابل اعتماد واقع‌گرایی LLM‌ها است، با Gemini 2.5 Pro که عملکرد جدید و پیشرفته‌ای را ثبت می‌کند @kaggle
  • مایکروسافت ریسرچ RenderFormer را معرفی می‌کند، اولین مدل شبکه‌ی عصبی که قادر به یادگیری یک پایپ‌لاین کامل رندر گرافیکی تنها با استفاده از یادگیری ماشین و بدون محاسبات گرافیکی سنتی است @MSFTResearch
  • Salesforce یک عامل پژوهشی عمیق و قوی با استفاده از مدل متن‌باز کوچک OpenAI می‌سازد، که فرصت‌های نوآوری ارائه‌شده توسط مدل‌های با وزن‌های باز را نشان می‌دهد، با وجود وابستگی به چند ارائه‌دهنده‌ی اصلی @emollick
  • پژوهشگران ارزیابی BackendBench را معرفی می‌کنند که توانایی LLM‌ها در نوشتن اپراتورهای صحیح PyTorch را می‌سنجد، با مدل‌هایی که ۵۳٪ از آزمایش‌های صحت را پشت سر گذاشته و برخی هسته‌ها تا ۱.۲ برابر سریع‌تر از اجرای eager عمل می‌کنند @soumithchintala
  • دانشمندان امپریال کالج کشف می‌کنند که چگونه «فاژهای دزد دریایی» ویروس‌ها را برای گسترش ویژگی‌های مقاومت به آنتی‌بیوتیک ربوده می‌کنند، با پژوهش‌هایی که توسط مرکز فلمینگ هماهنگ شده و با استفاده از «همکار علمی» هوش مصنوعی Google DeepMind آزمایش شده است @GoogleDeepMind
  • استنفورد و UC Santa Cruz یک معیار جدید برای مدل‌های صوتی-زبانی راه‌اندازی می‌کنند، با Gemini 2.5 Pro گوگل که پیشرو است اما پایپ‌لاین‌های ASR-plus-LLM نیز رقابتی عمل می‌کنند @stanfordnlp