اخبار هوش مصنوعی در 2025-07-23

مدل‌های جدید هوش مصنوعی

علی‌بابا مدل Qwen3-Coder-480B-A35B-Instruct را منتشر کرد؛ یک مدل «میزبان متخصص» (Mixture-of-Experts) با ۴۸۰ میلیارد پارامتر که ۳۵ میلیارد پارامتر فعال دارد، قابلیت پشتیبانی از ۲۵۶ هزار توکن ورودی (قابل‌گسترش تا ۱ میلیون) را ارائه می‌دهد و عملکردی در سطح عالی در بنچمارک‌های کدنویسی عامل‌محور، از جمله SWE-bench-Verified، کسب کرده است @Alibaba_Qwen
گوگل شناسه مدل Gemini 2.5 Flash Lite را منتشر کرد که اکنون از طریق ترکیب‌های مختلف API در دسترس است @GoogleCloudTech
میسترال ای‌آی گزارش فنی Voxtral Technical Report را منتشر کرد که شامل پیش‌آموزش، پس‌آموزش، هم‌ترازی و ارزیابی‌ها، از جمله تحلیل انتخاب بهینه‌ی معماری مدل است @MistralAI
بوزون ای‌آی Higgs Audio V2 را منتشر کرد؛ یک مدل باز و یکپارچه‌ی TTS با قابلیت شبیه‌سازی صدا که بر روی ۱۰ میلیون ساعت گفتار، موسیقی و رویداد آموزش داده شده و بر پایه‌ی Llama 3.2 3B ساخته شده است و طبق گزارش‌ها GPT-4o-mini-tts و ElevenLabs v2 را شکست می‌دهد @reach_vb

تحلیل صنعت

کاخ سفید برنامه‌ی اقدام هوش مصنوعی خود را منتشر کرد و بر نیاز آمریکا به پیشتازی در مدل‌های هوش مصنوعی منبع‌باز مبتنی بر ارزش‌های آمریکایی تأکید کرد و بیان داشت که این مدل‌ها ارزش ژئواستراتژیک دارند و می‌توانند به استانداردهای جهانی تبدیل شوند @AndrewCurran_
برنامه‌ی اقدام هوش مصنوعی، هوش مصنوعی را این‌گونه توصیف می‌کند: «یک انقلاب صنعتی، یک انقلاب اطلاعاتی و یک رنسانس – همه در یک زمان» با اولویت‌های سرمایه‌گذاری فدرال در رباتیک و فناوری‌های مرتبط برای تولید @AndrewCurran_
داده‌های باکیفیت در برنامه‌ی اقدام هوش مصنوعی «دارایی استراتژیک ملی» اعلام شده‌اند و ایالات متحده قصد دارد بزرگترین و باکیفیت‌ترین مجموعه‌داده‌های علمی آماده برای هوش مصنوعی را در جهان ایجاد کند @AndrewCurran_
این طرح به‌روزرسانی دستورالعمل‌های تدارکات فدرال را پیشنهاد می‌کند تا اطمینان حاصل شود که قراردادهای دولتی تنها با توسعه‌دهندگان مدل‌های زبانی بزرگ پیشرفته (frontier LLM) منعقد می‌شوند که سیستم‌هایشان عینی و عاری از سوگیری ایدئولوژیک باشند @AndrewCurran_
آنتروپیک از برنامه‌ی اقدام هوش مصنوعی کاخ سفید، به‌ویژه تمرکز آن بر زیرساخت، پذیرش فدرال و هماهنگی ایمنی، حمایت می‌کند و در عین حال بر لزوم کنترل‌های سخت‌گیرانه‌ی صادرات بر تراشه‌های پیشرفته تأکید می‌ورزد @AnthropicAI
Qwen بر اساس داده‌های OpenRouter، در سهم بازار توکن از Moonshot و xAI پیشی گرفته است، که نشان‌دهنده‌ی پذیرش رو به رشد مدل‌های هوش مصنوعی چینی است @OpenRouterAI
وانتا از تأمین مالی سری D با ارزش ۴.۱۵ میلیارد دلار خبر داد که نشان‌دهنده‌ی تداوم اعتماد سرمایه‌گذاران به ابزارهای امنیتی و انطباق مبتنی بر هوش مصنوعی است @christinacaci

اخلاق و جامعه

مؤسسه‌ی ای‌آی‌نو (AI Now Institute) برنامه‌ی اقدام هوش مصنوعی کاخ سفید را به‌دلیل «مستقیماً از شرکت‌های بزرگ فناوری» بودن مورد انتقاد قرار داد و از «برنامه‌ی اقدام هوش مصنوعی مردم» (People's AI Action Plan) که با همکاری بیش از ۱۰۰ سازمان توسعه یافته است، حمایت می‌کند @AINowInstitute
ایتان مولیک شفافیت در مورد مصرف آب توسط هوش مصنوعی را ارائه می‌دهد و گزارش می‌کند که طول عمر ۱۸ ماهه‌ی میسترال لارج ۲ به اندازه‌ی مصرف آب ۶۷۸ خانوار آمریکایی در سال، آب مصرف کرده است و هر جست‌وجو ۴۵ میلی‌لیتر آب مصرف می‌کند @emollick
مولیک نشان می‌دهد که چگونه یک داده‌ی زیست‌محیطی می‌تواند به‌صورت مثبت یا منفی مطرح شود و بیان می‌کند که هر جست‌وجوی هوش مصنوعی به اندازه‌ی ۰.۰۰۱۸۷۵ درصد از ردپای آبی یک همبرگر، آب مصرف می‌کند @emollick
نگرانی‌هایی در مورد مدل‌های زبانی بزرگ چندوجهی (multimodal LLMs) مطرح شده است که امکان شکل‌های جدیدی از نظارت را فراهم می‌کنند، زیرا این مدل‌ها می‌توانند ساعت‌ها از فیلم‌های ضبط‌شده را به روش‌هایی که نه قانون و نه جامعه پیش‌بینی کرده بودند، کاوش کنند و «فراموشی طبیعی» را از بین ببرند @emollick
فرانسوا شوله هشدار می‌دهد که فقط نمرات تأییدشده توسط بنیاد ARC Prize در مجموعه‌ی نیمه‌خصوصی باید قابل‌اعتماد باشند، و به عدم توانایی در بازتولید نمره‌ی ادعاشده‌ی ۴۱.۸ درصدی ARC-AGI-1 از آخرین نسخه‌ی منتشرشده‌ی Qwen 3 اشاره می‌کند @fchollet

کاربردها

پرپلکسیتی مرورگر Comet browser را با ویژگی‌های مبتنی بر هوش مصنوعی راه‌اندازی کرد، از جمله دستیار خودکار «ویزارد آپلود یوتیوب»، مدیریت حافظه‌ی بهتر از کروم و قابلیت‌های جست‌وجوی عامل‌مانند بر روی محتوای غیرنمایه‌شده @WholeMarsBlog
گیت‌هاب Spark را برای کاربران Copilot Pro+ منتشر کرد، ابزاری که ایده‌ها را کاملاً از طریق زبان طبیعی به «برنامه‌های فول‌استک» (full-stack applications) تبدیل می‌کند و کاربران را در عرض چند دقیقه از مفهوم به استقرار می‌رساند @satyanadella
گوگل فوتوز ویژگی‌های هوش مصنوعی برای «ریمیکس» کردن عکس‌ها به سبک‌های مختلف و تبدیل عکس‌ها به ویدیو را اضافه کرد، با قابلیت‌های مشابهی که در حال انتشار برای یوتیوب شورتس نیز هستند @sundarpichai
پژوهشگران متا فناوری دستبند کنترل‌شده با ژست را توسعه دادند که سیگنال‌های عصبی از عضلات مچ دست را به فرمان‌های کامپیوتری تبدیل می‌کند و در نشریه‌ی Nature منتشر شده است @AIatMeta
ان‌ویدیا «عامل‌های هوش مصنوعی بینایی» (Vision AI agents) را به نمایش می‌گذارد که کارایی را در صنایع مختلف، از تحلیل ورزشی گرفته تا واکنش به حوادث شهری و کنترل کیفیت تولید، افزایش می‌دهند @NVIDIAAI
ان‌ویدیا «Climate in a Bottle» را معرفی کرد؛ ابزار تعاملی مبتنی بر هوش مصنوعی که به کاربران امکان می‌دهد با تنظیم پارامترهایی مانند فصل و دمای اقیانوس، سیستم‌های اقلیمی را کاوش کنند تا حالت‌های اقلیمی با وضوح بالا را فوراً تولید کنند @NVIDIAAI

پژوهش‌ها

گوگل دیپ‌مایند مدل هوش مصنوعی Aeneas را منتشر کرد که به مورخان کمک می‌کند تا کتیبه‌های باستانی لاتین را با ایجاد «اثرانگشت‌های تاریخی» منحصر به فرد و شناسایی شباهت‌ها در ۱۷۶,۰۰۰ کتیبه تفسیر کنند و اعتماد مورخان را تا ۴۴ درصد بهبود بخشد @GoogleDeepMind
پژوهش‌ها نشان می‌دهد که Llama 3.1 70B می‌تواند نسخه‌های تقریباً دقیق از کل کتاب‌های دارای حق چاپ مانند «Harry Potter & the Sorcerer's Stone» را هنگام دریافت عبارات تحریک‌کننده‌ی خاص مانند «Mr and Mrs. D» تولید کند @AhmedSQRD
هگینگ‌فیس بنچمارک جدیدی را برای آزمایش توانایی مدل‌های زبانی بزرگ بینایی (vision LLMs) در پردازش ورودی‌های ویدیویی طولانی با تقسیم آن‌ها به هزاران تصویر منتشر کرد، که محدودیت‌های عملکردی در مدل‌های فعلی را آشکار می‌سازد @andimarafioti
پژوهشگران CMU با بوم‌شناسان حفاظت از محیط زیست همکاری می‌کنند تا از هوش مصنوعی برای مطالعه و ریشه‌کن کردن گیاهان مهاجم «Leafy Spurge» استفاده کنند و مجموعه‌داده‌ی منحصربه‌فردی از تصاویر پهپادی با وضوح بالا و تأییدشده از زمین را منتشر کرده‌اند @rsalakhu
پژوهشی در مورد «ترکیب برنامه‌ی عصبی هدایت‌شده با اجرا» (execution-guided neural program synthesis) برای ARC-AGI، قابلیت‌های تعمیم ترکیبی (compositional generalization) برتری را در مقایسه با جایگزین‌هایی مانند «تنظیم دقیق در زمان تست» (test-time fine-tuning) نشان می‌دهد @SimonOuellette6
ام‌آی‌تی فناوری «پوست الکترونیکی» (electronic skin) انعطاف‌پذیری را توسعه داد که می‌تواند بینایی شبانه‌ی فوق‌نازک و پوشیدنی به سبکی عینک آفتابی را امکان‌پذیر سازد @MIT