اخبار هوش مصنوعی در 2025-06-30

مدل‌های جدید هوش مصنوعی

  • بایدو سری ERNIE 4.5 را با ۲۳ مدل شامل پارامترهای ۰.۳ میلیارد تا ۴۲۴ میلیارد منتشر کرده است که در بنچمارک‌های متنی و چندوجهی به عملکردی پیشرو دست یافته و با DeepSeek V3 و Qwen 235B رقابت می‌کند @PaddlePaddle
  • علی‌بابا مدل چندوجهی Ovis-U1-3B را برای درک، تولید و ویرایش منتشر کرده که با بهره‌گیری از MMDiT و پالایش توکن دوسویه کار می‌کند @AdinaYakup
  • کوئن Qwen-TTS را از طریق API راه‌اندازی کرد، این مدل با میلیون‌ها ساعت گفتار آموزش دیده و از ۳ لهجه‌ی چینی و ۷ صدای دوزبانه پشتیبانی می‌کند @Alibaba_Qwen
  • آرسی AI پنج مدل زبانی را منتشر کرده است، که شامل سه مدل تولیدی در سطح سازمانی و دو مدل پژوهشی می‌شود. این اقدام بخشی از گذار آن‌ها به خانواده‌ی مدل‌های بنیادی آرسی است @arcee_ai
  • مدل منبع‌باز شایعه‌شده‌ی OpenAI در حال ایجاد هیجان قابل توجهی از سوی منابع معتبر است، با گمانه‌زنی‌هایی درباره‌ی نام واقعی و تأثیر قابل توجه آن @AndrewCurran_

تحلیل صنعت

  • شرکت‌ها در حال بازنویسی محصولات اصلی خود برای بهره‌گیری از مدل‌های استدلالی هستند، چارچوب‌های LLM 1.0 را حذف کرده و تجربه‌های کاربری کاملاً جدیدی می‌سازند؛ این امر با شتاب گرفتن دوران مدل‌های استدلالی همراه است @OfficialLoganK
  • شرکت‌های زیرساخت AI مانند Lovable، Vercel، Cursor و Replit، به عنوان برندگان قابل پیش‌بینی در هجوم طلای AI شناخته می‌شوند و ابزارهایی را برای ساخت ایده‌ها حتی برای افراد غیرتوسعه‌دهنده به فروش می‌رسانند @GergelyOrosz
  • اپل در حال آزمایش مدل‌های Anthropic و OpenAI بر روی زیرساخت ابری خود است، و برنده‌ی این رقابت احتمالاً Siri جدید را تقویت خواهد کرد، که رقابت قابل توجهی بین این دو شرکت AI ایجاد می‌کند @AndrewCurran_
  • متا واحد AI خود را تحت عنوان «آزمایشگاه‌های ابرهوشمندی» بازسازی کرده و استعدادهای برتر را با بسته‌های جبرانی سالانه بیش از ۱۰ میلیون دلار برای تیم جدید خود استخدام می‌کند @deedydas
  • بسیاری از شرکت‌هایی که بر اساس محدودیت‌های GPT-3.5 بنا شده بودند، اکنون با راه‌حل‌های پیچیده و گران‌قیمتی درگیر هستند که از مدل‌های استدلالی جدیدتر بدون نیاز به چارچوب بدتر عمل می‌کنند @emollick
  • مایکروسافت VS Code و GitHub Copilot را به صورت منبع‌باز منتشر می‌کند، در حالی که رقیب اصلی آن، Cursor، یک فورک منبع‌بسته باقی می‌ماند، که نشان‌دهنده‌ی پویایی غیرمنتظره‌ای در صنعت است @GergelyOrosz

اخلاق و جامعه

  • عوامل هوش مصنوعی ترجیحات برند را نشان می‌دهند و به انواع مختلف تبلیغات جذب می‌شوند؛ احتمالاً در آینده‌ی نزدیک پول قابل توجهی برای تأثیرگذاری بر این ترجیحات صرف خواهد شد @emollick
  • نظرسنجی‌های ملی نماینده‌گر افزایش بهره‌وری واقعی AI را نشان می‌دهند: معلمان ۶ ساعت صرفه‌جویی هفتگی در زمان و کارگران ۳ برابر افزایش بهره‌وری را در یک‌پنجم وظایف گزارش می‌کنند، که این امر با ادعاهایی مبنی بر بی‌فایده بودن AI برای افراد واقعی در تناقض است @emollick
  • پژوهش دانشگاه استنفورد یک «شکاف ایده‌پردازی-اجرا» را آشکار می‌کند؛ در آن، ایده‌های پژوهشی تولیدشده توسط LLM بدیع به نظر می‌رسند اما هنگامی که دانشجویان دکترا آن‌ها را طی بیش از ۱۰۰ ساعت اجرا می‌کنند، منجر به پروژه‌هایی بدتر از ایده‌های تولیدشده توسط انسان می‌شوند @ChengleiSi
  • جیسون وی استدلال می‌کند که خودبهبود AI طی سالیان متمادی تدریجی خواهد بود، به جای یک صعود سریع؛ او به تنگناهای موجود در آزمایش‌های دنیای واقعی و دشواری‌های بهبود خاص دامنه اشاره می‌کند @_jasonwei

کاربردها

  • Cursor نسخه‌های وب و موبایل را راه‌اندازی می‌کند که به کاربران امکان می‌دهد ده‌ها عامل را ایجاد کرده و بعداً آن‌ها را در ویرایشگر خود بازبینی کنند، و از این طریق فراتر از توسعه‌ی دسکتاپ گسترش می‌یابد @cursor_ai
  • Comet پرپلکسیتی می‌تواند Pokemon بازی کند و به طور هم‌زمان در پلتفرم‌های ویندوز، مک، iOS و اندروید در دسترس خواهد بود @AravSrinivas
  • MAI-DxO مایکروسافت در موارد پزشکی پیچیده از مجله‌ی پزشکی New England به دقت تشخیص ۸۵.۵٪ دست می‌یابد، که چهار برابر بهتر از پزشکان باتجربه است و هم‌زمان هزینه‌ها را کاهش می‌دهد @satyanadella
  • Veo 3 گوگل Gemini ویدئوهای بسیار واقع‌گرایانه از حیوانات اسکیت‌باز تولید می‌کند، که قابلیت‌های پیشرفته‌ی تولید ویدئو را برای کاربردهای خلاقانه نشان می‌دهد @GeminiApp
  • Perplexity به طور مؤثر در چندین زبان کار می‌کند و داده‌ها را هم از منابع انگلیسی و هم غیرانگلیسی جمع‌آوری کرده و نتایج را به زبان درخواستی ارائه می‌دهد، که این امر یک ابرقدرت جستجوی چندزبانه جدید ایجاد می‌کند @GergelyOrosz
  • پژوهشگران MIT از AI مولد برای اصلاح طرح‌های ربات و آزمایش طرح‌های سه‌بعدی در شبیه‌سازی استفاده می‌کنند و ماشین‌هایی را می‌سازند که بهتر از ربات‌های طراحی‌شده توسط انسان می‌پرند و با ثبات‌تر فرود می‌آیند @MIT_CSAIL

پژوهش‌ها

  • SparseLoRA به تنظیم دقیق مدل‌های LLM با سرعت ۱.۶ تا ۱.۹ برابر سریع‌تر و با ۲.۲ برابر FLOP کمتر از طریق پراکندگی زمینه‌ای دست می‌یابد، ضمن آنکه عملکرد را در وظایف ریاضی، کدنویسی، چت و ARC-AGI حفظ می‌کند @xiuyu_l
  • رویکرد رگرسیون متن به متن گوگل با موفقیت خوشه‌های محاسباتی عظیم را بهینه می‌کند، و نشان می‌دهد که مدل‌ها می‌توانند با آموزش رمزگذار-رمزگشاها برای خواندن حالات پیچیده به صورت متن، عملاً با هرگونه بازخورد دنیای واقعی پاداش بگیرند @XingyouSong
  • Chai-2 کشف آنتی‌بادی «صفر-شات» را در یک پلیت ۲۴ خانه‌ای ممکن می‌سازد، که در قابلیت‌های طراحی مولکولی بیش از ۱۰۰ برابر از وضعیت پیشرو قبلی پیشی می‌گیرد @chaidiscovery
  • پژوهش استنفورد در مورد RL از طریق هدایت تقلید ضمنی نشان می‌دهد که چگونه می‌توان از داده‌های تخصصی برای هدایت اکتشاف کارآمدتر استفاده کرد، به جای محدود کردن سیاست‌ها از طریق زیان‌های تقلید @_anniechen_
  • فیزیکدانان خلاقیت AI را در تولید تصویر با استفاده از دو عامل قابل پیش‌بینی بازتولید می‌کنند و درک نظری از رفتار مدل‌های انتشار را ارائه می‌دهند @QuantaMagazine
  • پژوهش نشان می‌دهد که روش‌های بیزی سلسله‌مراتبی می‌توانند اوج و فرود یادگیری درون‌متنی در LLMها را بدون دانستن معماری یا الگوریتم‌های یادگیری پیش‌بینی کنند @EkdeepL
  • مطالعه‌ی جدید نشان می‌دهد DPO آنلاین و GRPO عملکرد مشابهی دارند، در حالی که DPO تکراری نیمه‌آنلاین با کارایی بهتر خوب عمل می‌کند، و ترکیب وظایف قابل تأیید با وظایف غیرقابل تأیید مزایای انتقال متقابل را فراهم می‌کند @jaseweston