اخبار هوش مصنوعی در 2025-06-30
مدلهای جدید هوش مصنوعی
- بایدو سری ERNIE 4.5 را با ۲۳ مدل شامل پارامترهای ۰.۳ میلیارد تا ۴۲۴ میلیارد منتشر کرده است که در بنچمارکهای متنی و چندوجهی به عملکردی پیشرو دست یافته و با DeepSeek V3 و Qwen 235B رقابت میکند @PaddlePaddle
- علیبابا مدل چندوجهی Ovis-U1-3B را برای درک، تولید و ویرایش منتشر کرده که با بهرهگیری از MMDiT و پالایش توکن دوسویه کار میکند @AdinaYakup
- کوئن Qwen-TTS را از طریق API راهاندازی کرد، این مدل با میلیونها ساعت گفتار آموزش دیده و از ۳ لهجهی چینی و ۷ صدای دوزبانه پشتیبانی میکند @Alibaba_Qwen
- آرسی AI پنج مدل زبانی را منتشر کرده است، که شامل سه مدل تولیدی در سطح سازمانی و دو مدل پژوهشی میشود. این اقدام بخشی از گذار آنها به خانوادهی مدلهای بنیادی آرسی است @arcee_ai
- مدل منبعباز شایعهشدهی OpenAI در حال ایجاد هیجان قابل توجهی از سوی منابع معتبر است، با گمانهزنیهایی دربارهی نام واقعی و تأثیر قابل توجه آن @AndrewCurran_
تحلیل صنعت
- شرکتها در حال بازنویسی محصولات اصلی خود برای بهرهگیری از مدلهای استدلالی هستند، چارچوبهای LLM 1.0 را حذف کرده و تجربههای کاربری کاملاً جدیدی میسازند؛ این امر با شتاب گرفتن دوران مدلهای استدلالی همراه است @OfficialLoganK
- شرکتهای زیرساخت AI مانند Lovable، Vercel، Cursor و Replit، به عنوان برندگان قابل پیشبینی در هجوم طلای AI شناخته میشوند و ابزارهایی را برای ساخت ایدهها حتی برای افراد غیرتوسعهدهنده به فروش میرسانند @GergelyOrosz
- اپل در حال آزمایش مدلهای Anthropic و OpenAI بر روی زیرساخت ابری خود است، و برندهی این رقابت احتمالاً Siri جدید را تقویت خواهد کرد، که رقابت قابل توجهی بین این دو شرکت AI ایجاد میکند @AndrewCurran_
- متا واحد AI خود را تحت عنوان «آزمایشگاههای ابرهوشمندی» بازسازی کرده و استعدادهای برتر را با بستههای جبرانی سالانه بیش از ۱۰ میلیون دلار برای تیم جدید خود استخدام میکند @deedydas
- بسیاری از شرکتهایی که بر اساس محدودیتهای GPT-3.5 بنا شده بودند، اکنون با راهحلهای پیچیده و گرانقیمتی درگیر هستند که از مدلهای استدلالی جدیدتر بدون نیاز به چارچوب بدتر عمل میکنند @emollick
- مایکروسافت VS Code و GitHub Copilot را به صورت منبعباز منتشر میکند، در حالی که رقیب اصلی آن، Cursor، یک فورک منبعبسته باقی میماند، که نشاندهندهی پویایی غیرمنتظرهای در صنعت است @GergelyOrosz
اخلاق و جامعه
- عوامل هوش مصنوعی ترجیحات برند را نشان میدهند و به انواع مختلف تبلیغات جذب میشوند؛ احتمالاً در آیندهی نزدیک پول قابل توجهی برای تأثیرگذاری بر این ترجیحات صرف خواهد شد @emollick
- نظرسنجیهای ملی نمایندهگر افزایش بهرهوری واقعی AI را نشان میدهند: معلمان ۶ ساعت صرفهجویی هفتگی در زمان و کارگران ۳ برابر افزایش بهرهوری را در یکپنجم وظایف گزارش میکنند، که این امر با ادعاهایی مبنی بر بیفایده بودن AI برای افراد واقعی در تناقض است @emollick
- پژوهش دانشگاه استنفورد یک «شکاف ایدهپردازی-اجرا» را آشکار میکند؛ در آن، ایدههای پژوهشی تولیدشده توسط LLM بدیع به نظر میرسند اما هنگامی که دانشجویان دکترا آنها را طی بیش از ۱۰۰ ساعت اجرا میکنند، منجر به پروژههایی بدتر از ایدههای تولیدشده توسط انسان میشوند @ChengleiSi
- جیسون وی استدلال میکند که خودبهبود AI طی سالیان متمادی تدریجی خواهد بود، به جای یک صعود سریع؛ او به تنگناهای موجود در آزمایشهای دنیای واقعی و دشواریهای بهبود خاص دامنه اشاره میکند @_jasonwei
کاربردها
- Cursor نسخههای وب و موبایل را راهاندازی میکند که به کاربران امکان میدهد دهها عامل را ایجاد کرده و بعداً آنها را در ویرایشگر خود بازبینی کنند، و از این طریق فراتر از توسعهی دسکتاپ گسترش مییابد @cursor_ai
- Comet پرپلکسیتی میتواند Pokemon بازی کند و به طور همزمان در پلتفرمهای ویندوز، مک، iOS و اندروید در دسترس خواهد بود @AravSrinivas
- MAI-DxO مایکروسافت در موارد پزشکی پیچیده از مجلهی پزشکی New England به دقت تشخیص ۸۵.۵٪ دست مییابد، که چهار برابر بهتر از پزشکان باتجربه است و همزمان هزینهها را کاهش میدهد @satyanadella
- Veo 3 گوگل Gemini ویدئوهای بسیار واقعگرایانه از حیوانات اسکیتباز تولید میکند، که قابلیتهای پیشرفتهی تولید ویدئو را برای کاربردهای خلاقانه نشان میدهد @GeminiApp
- Perplexity به طور مؤثر در چندین زبان کار میکند و دادهها را هم از منابع انگلیسی و هم غیرانگلیسی جمعآوری کرده و نتایج را به زبان درخواستی ارائه میدهد، که این امر یک ابرقدرت جستجوی چندزبانه جدید ایجاد میکند @GergelyOrosz
- پژوهشگران MIT از AI مولد برای اصلاح طرحهای ربات و آزمایش طرحهای سهبعدی در شبیهسازی استفاده میکنند و ماشینهایی را میسازند که بهتر از رباتهای طراحیشده توسط انسان میپرند و با ثباتتر فرود میآیند @MIT_CSAIL
پژوهشها
- SparseLoRA به تنظیم دقیق مدلهای LLM با سرعت ۱.۶ تا ۱.۹ برابر سریعتر و با ۲.۲ برابر FLOP کمتر از طریق پراکندگی زمینهای دست مییابد، ضمن آنکه عملکرد را در وظایف ریاضی، کدنویسی، چت و ARC-AGI حفظ میکند @xiuyu_l
- رویکرد رگرسیون متن به متن گوگل با موفقیت خوشههای محاسباتی عظیم را بهینه میکند، و نشان میدهد که مدلها میتوانند با آموزش رمزگذار-رمزگشاها برای خواندن حالات پیچیده به صورت متن، عملاً با هرگونه بازخورد دنیای واقعی پاداش بگیرند @XingyouSong
- Chai-2 کشف آنتیبادی «صفر-شات» را در یک پلیت ۲۴ خانهای ممکن میسازد، که در قابلیتهای طراحی مولکولی بیش از ۱۰۰ برابر از وضعیت پیشرو قبلی پیشی میگیرد @chaidiscovery
- پژوهش استنفورد در مورد RL از طریق هدایت تقلید ضمنی نشان میدهد که چگونه میتوان از دادههای تخصصی برای هدایت اکتشاف کارآمدتر استفاده کرد، به جای محدود کردن سیاستها از طریق زیانهای تقلید @_anniechen_
- فیزیکدانان خلاقیت AI را در تولید تصویر با استفاده از دو عامل قابل پیشبینی بازتولید میکنند و درک نظری از رفتار مدلهای انتشار را ارائه میدهند @QuantaMagazine
- پژوهش نشان میدهد که روشهای بیزی سلسلهمراتبی میتوانند اوج و فرود یادگیری درونمتنی در LLMها را بدون دانستن معماری یا الگوریتمهای یادگیری پیشبینی کنند @EkdeepL
- مطالعهی جدید نشان میدهد DPO آنلاین و GRPO عملکرد مشابهی دارند، در حالی که DPO تکراری نیمهآنلاین با کارایی بهتر خوب عمل میکند، و ترکیب وظایف قابل تأیید با وظایف غیرقابل تأیید مزایای انتقال متقابل را فراهم میکند @jaseweston