اخبار هوش مصنوعی در 2025-07-23

مدل‌های جدید هوش مصنوعی

  • علی‌بابا مدل Qwen3-Coder-480B-A35B-Instruct را منتشر کرد؛ یک مدل «میزبان متخصص» (Mixture-of-Experts) با ۴۸۰ میلیارد پارامتر که ۳۵ میلیارد پارامتر فعال دارد، قابلیت پشتیبانی از ۲۵۶ هزار توکن ورودی (قابل‌گسترش تا ۱ میلیون) را ارائه می‌دهد و عملکردی در سطح عالی در بنچمارک‌های کدنویسی عامل‌محور، از جمله SWE-bench-Verified، کسب کرده است @Alibaba_Qwen
  • گوگل شناسه مدل Gemini 2.5 Flash Lite را منتشر کرد که اکنون از طریق ترکیب‌های مختلف API در دسترس است @GoogleCloudTech
  • میسترال ای‌آی گزارش فنی Voxtral Technical Report را منتشر کرد که شامل پیش‌آموزش، پس‌آموزش، هم‌ترازی و ارزیابی‌ها، از جمله تحلیل انتخاب بهینه‌ی معماری مدل است @MistralAI
  • بوزون ای‌آی Higgs Audio V2 را منتشر کرد؛ یک مدل باز و یکپارچه‌ی TTS با قابلیت شبیه‌سازی صدا که بر روی ۱۰ میلیون ساعت گفتار، موسیقی و رویداد آموزش داده شده و بر پایه‌ی Llama 3.2 3B ساخته شده است و طبق گزارش‌ها GPT-4o-mini-tts و ElevenLabs v2 را شکست می‌دهد @reach_vb

تحلیل صنعت

  • کاخ سفید برنامه‌ی اقدام هوش مصنوعی خود را منتشر کرد و بر نیاز آمریکا به پیشتازی در مدل‌های هوش مصنوعی منبع‌باز مبتنی بر ارزش‌های آمریکایی تأکید کرد و بیان داشت که این مدل‌ها ارزش ژئواستراتژیک دارند و می‌توانند به استانداردهای جهانی تبدیل شوند @AndrewCurran_
  • برنامه‌ی اقدام هوش مصنوعی، هوش مصنوعی را این‌گونه توصیف می‌کند: «یک انقلاب صنعتی، یک انقلاب اطلاعاتی و یک رنسانس – همه در یک زمان» با اولویت‌های سرمایه‌گذاری فدرال در رباتیک و فناوری‌های مرتبط برای تولید @AndrewCurran_
  • داده‌های باکیفیت در برنامه‌ی اقدام هوش مصنوعی «دارایی استراتژیک ملی» اعلام شده‌اند و ایالات متحده قصد دارد بزرگترین و باکیفیت‌ترین مجموعه‌داده‌های علمی آماده برای هوش مصنوعی را در جهان ایجاد کند @AndrewCurran_
  • این طرح به‌روزرسانی دستورالعمل‌های تدارکات فدرال را پیشنهاد می‌کند تا اطمینان حاصل شود که قراردادهای دولتی تنها با توسعه‌دهندگان مدل‌های زبانی بزرگ پیشرفته (frontier LLM) منعقد می‌شوند که سیستم‌هایشان عینی و عاری از سوگیری ایدئولوژیک باشند @AndrewCurran_
  • آنتروپیک از برنامه‌ی اقدام هوش مصنوعی کاخ سفید، به‌ویژه تمرکز آن بر زیرساخت، پذیرش فدرال و هماهنگی ایمنی، حمایت می‌کند و در عین حال بر لزوم کنترل‌های سخت‌گیرانه‌ی صادرات بر تراشه‌های پیشرفته تأکید می‌ورزد @AnthropicAI
  • Qwen بر اساس داده‌های OpenRouter، در سهم بازار توکن از Moonshot و xAI پیشی گرفته است، که نشان‌دهنده‌ی پذیرش رو به رشد مدل‌های هوش مصنوعی چینی است @OpenRouterAI
  • وانتا از تأمین مالی سری D با ارزش ۴.۱۵ میلیارد دلار خبر داد که نشان‌دهنده‌ی تداوم اعتماد سرمایه‌گذاران به ابزارهای امنیتی و انطباق مبتنی بر هوش مصنوعی است @christinacaci

اخلاق و جامعه

  • مؤسسه‌ی ای‌آی‌نو (AI Now Institute) برنامه‌ی اقدام هوش مصنوعی کاخ سفید را به‌دلیل «مستقیماً از شرکت‌های بزرگ فناوری» بودن مورد انتقاد قرار داد و از «برنامه‌ی اقدام هوش مصنوعی مردم» (People's AI Action Plan) که با همکاری بیش از ۱۰۰ سازمان توسعه یافته است، حمایت می‌کند @AINowInstitute
  • ایتان مولیک شفافیت در مورد مصرف آب توسط هوش مصنوعی را ارائه می‌دهد و گزارش می‌کند که طول عمر ۱۸ ماهه‌ی میسترال لارج ۲ به اندازه‌ی مصرف آب ۶۷۸ خانوار آمریکایی در سال، آب مصرف کرده است و هر جست‌وجو ۴۵ میلی‌لیتر آب مصرف می‌کند @emollick
  • مولیک نشان می‌دهد که چگونه یک داده‌ی زیست‌محیطی می‌تواند به‌صورت مثبت یا منفی مطرح شود و بیان می‌کند که هر جست‌وجوی هوش مصنوعی به اندازه‌ی ۰.۰۰۱۸۷۵ درصد از ردپای آبی یک همبرگر، آب مصرف می‌کند @emollick
  • نگرانی‌هایی در مورد مدل‌های زبانی بزرگ چندوجهی (multimodal LLMs) مطرح شده است که امکان شکل‌های جدیدی از نظارت را فراهم می‌کنند، زیرا این مدل‌ها می‌توانند ساعت‌ها از فیلم‌های ضبط‌شده را به روش‌هایی که نه قانون و نه جامعه پیش‌بینی کرده بودند، کاوش کنند و «فراموشی طبیعی» را از بین ببرند @emollick
  • فرانسوا شوله هشدار می‌دهد که فقط نمرات تأییدشده توسط بنیاد ARC Prize در مجموعه‌ی نیمه‌خصوصی باید قابل‌اعتماد باشند، و به عدم توانایی در بازتولید نمره‌ی ادعاشده‌ی ۴۱.۸ درصدی ARC-AGI-1 از آخرین نسخه‌ی منتشرشده‌ی Qwen 3 اشاره می‌کند @fchollet

کاربردها

  • پرپلکسیتی مرورگر Comet browser را با ویژگی‌های مبتنی بر هوش مصنوعی راه‌اندازی کرد، از جمله دستیار خودکار «ویزارد آپلود یوتیوب»، مدیریت حافظه‌ی بهتر از کروم و قابلیت‌های جست‌وجوی عامل‌مانند بر روی محتوای غیرنمایه‌شده @WholeMarsBlog
  • گیت‌هاب Spark را برای کاربران Copilot Pro+ منتشر کرد، ابزاری که ایده‌ها را کاملاً از طریق زبان طبیعی به «برنامه‌های فول‌استک» (full-stack applications) تبدیل می‌کند و کاربران را در عرض چند دقیقه از مفهوم به استقرار می‌رساند @satyanadella
  • گوگل فوتوز ویژگی‌های هوش مصنوعی برای «ریمیکس» کردن عکس‌ها به سبک‌های مختلف و تبدیل عکس‌ها به ویدیو را اضافه کرد، با قابلیت‌های مشابهی که در حال انتشار برای یوتیوب شورتس نیز هستند @sundarpichai
  • پژوهشگران متا فناوری دستبند کنترل‌شده با ژست را توسعه دادند که سیگنال‌های عصبی از عضلات مچ دست را به فرمان‌های کامپیوتری تبدیل می‌کند و در نشریه‌ی Nature منتشر شده است @AIatMeta
  • ان‌ویدیا «عامل‌های هوش مصنوعی بینایی» (Vision AI agents) را به نمایش می‌گذارد که کارایی را در صنایع مختلف، از تحلیل ورزشی گرفته تا واکنش به حوادث شهری و کنترل کیفیت تولید، افزایش می‌دهند @NVIDIAAI
  • ان‌ویدیا «Climate in a Bottle» را معرفی کرد؛ ابزار تعاملی مبتنی بر هوش مصنوعی که به کاربران امکان می‌دهد با تنظیم پارامترهایی مانند فصل و دمای اقیانوس، سیستم‌های اقلیمی را کاوش کنند تا حالت‌های اقلیمی با وضوح بالا را فوراً تولید کنند @NVIDIAAI

پژوهش‌ها

  • گوگل دیپ‌مایند مدل هوش مصنوعی Aeneas را منتشر کرد که به مورخان کمک می‌کند تا کتیبه‌های باستانی لاتین را با ایجاد «اثرانگشت‌های تاریخی» منحصر به فرد و شناسایی شباهت‌ها در ۱۷۶,۰۰۰ کتیبه تفسیر کنند و اعتماد مورخان را تا ۴۴ درصد بهبود بخشد @GoogleDeepMind
  • پژوهش‌ها نشان می‌دهد که Llama 3.1 70B می‌تواند نسخه‌های تقریباً دقیق از کل کتاب‌های دارای حق چاپ مانند «Harry Potter & the Sorcerer's Stone» را هنگام دریافت عبارات تحریک‌کننده‌ی خاص مانند «Mr and Mrs. D» تولید کند @AhmedSQRD
  • هگینگ‌فیس بنچمارک جدیدی را برای آزمایش توانایی مدل‌های زبانی بزرگ بینایی (vision LLMs) در پردازش ورودی‌های ویدیویی طولانی با تقسیم آن‌ها به هزاران تصویر منتشر کرد، که محدودیت‌های عملکردی در مدل‌های فعلی را آشکار می‌سازد @andimarafioti
  • پژوهشگران CMU با بوم‌شناسان حفاظت از محیط زیست همکاری می‌کنند تا از هوش مصنوعی برای مطالعه و ریشه‌کن کردن گیاهان مهاجم «Leafy Spurge» استفاده کنند و مجموعه‌داده‌ی منحصربه‌فردی از تصاویر پهپادی با وضوح بالا و تأییدشده از زمین را منتشر کرده‌اند @rsalakhu
  • پژوهشی در مورد «ترکیب برنامه‌ی عصبی هدایت‌شده با اجرا» (execution-guided neural program synthesis) برای ARC-AGI، قابلیت‌های تعمیم ترکیبی (compositional generalization) برتری را در مقایسه با جایگزین‌هایی مانند «تنظیم دقیق در زمان تست» (test-time fine-tuning) نشان می‌دهد @SimonOuellette6
  • ام‌آی‌تی فناوری «پوست الکترونیکی» (electronic skin) انعطاف‌پذیری را توسعه داد که می‌تواند بینایی شبانه‌ی فوق‌نازک و پوشیدنی به سبکی عینک آفتابی را امکان‌پذیر سازد @MIT