اخبار هوش مصنوعی در 2025-07-23
مدلهای جدید هوش مصنوعی
- علیبابا مدل Qwen3-Coder-480B-A35B-Instruct را منتشر کرد؛ یک مدل «میزبان متخصص» (Mixture-of-Experts) با ۴۸۰ میلیارد پارامتر که ۳۵ میلیارد پارامتر فعال دارد، قابلیت پشتیبانی از ۲۵۶ هزار توکن ورودی (قابلگسترش تا ۱ میلیون) را ارائه میدهد و عملکردی در سطح عالی در بنچمارکهای کدنویسی عاملمحور، از جمله SWE-bench-Verified، کسب کرده است @Alibaba_Qwen
- گوگل شناسه مدل Gemini 2.5 Flash Lite را منتشر کرد که اکنون از طریق ترکیبهای مختلف API در دسترس است @GoogleCloudTech
- میسترال ایآی گزارش فنی Voxtral Technical Report را منتشر کرد که شامل پیشآموزش، پسآموزش، همترازی و ارزیابیها، از جمله تحلیل انتخاب بهینهی معماری مدل است @MistralAI
- بوزون ایآی Higgs Audio V2 را منتشر کرد؛ یک مدل باز و یکپارچهی TTS با قابلیت شبیهسازی صدا که بر روی ۱۰ میلیون ساعت گفتار، موسیقی و رویداد آموزش داده شده و بر پایهی Llama 3.2 3B ساخته شده است و طبق گزارشها GPT-4o-mini-tts و ElevenLabs v2 را شکست میدهد @reach_vb
تحلیل صنعت
- کاخ سفید برنامهی اقدام هوش مصنوعی خود را منتشر کرد و بر نیاز آمریکا به پیشتازی در مدلهای هوش مصنوعی منبعباز مبتنی بر ارزشهای آمریکایی تأکید کرد و بیان داشت که این مدلها ارزش ژئواستراتژیک دارند و میتوانند به استانداردهای جهانی تبدیل شوند @AndrewCurran_
- برنامهی اقدام هوش مصنوعی، هوش مصنوعی را اینگونه توصیف میکند: «یک انقلاب صنعتی، یک انقلاب اطلاعاتی و یک رنسانس – همه در یک زمان» با اولویتهای سرمایهگذاری فدرال در رباتیک و فناوریهای مرتبط برای تولید @AndrewCurran_
- دادههای باکیفیت در برنامهی اقدام هوش مصنوعی «دارایی استراتژیک ملی» اعلام شدهاند و ایالات متحده قصد دارد بزرگترین و باکیفیتترین مجموعهدادههای علمی آماده برای هوش مصنوعی را در جهان ایجاد کند @AndrewCurran_
- این طرح بهروزرسانی دستورالعملهای تدارکات فدرال را پیشنهاد میکند تا اطمینان حاصل شود که قراردادهای دولتی تنها با توسعهدهندگان مدلهای زبانی بزرگ پیشرفته (frontier LLM) منعقد میشوند که سیستمهایشان عینی و عاری از سوگیری ایدئولوژیک باشند @AndrewCurran_
- آنتروپیک از برنامهی اقدام هوش مصنوعی کاخ سفید، بهویژه تمرکز آن بر زیرساخت، پذیرش فدرال و هماهنگی ایمنی، حمایت میکند و در عین حال بر لزوم کنترلهای سختگیرانهی صادرات بر تراشههای پیشرفته تأکید میورزد @AnthropicAI
- Qwen بر اساس دادههای OpenRouter، در سهم بازار توکن از Moonshot و xAI پیشی گرفته است، که نشاندهندهی پذیرش رو به رشد مدلهای هوش مصنوعی چینی است @OpenRouterAI
- وانتا از تأمین مالی سری D با ارزش ۴.۱۵ میلیارد دلار خبر داد که نشاندهندهی تداوم اعتماد سرمایهگذاران به ابزارهای امنیتی و انطباق مبتنی بر هوش مصنوعی است @christinacaci
اخلاق و جامعه
- مؤسسهی ایآینو (AI Now Institute) برنامهی اقدام هوش مصنوعی کاخ سفید را بهدلیل «مستقیماً از شرکتهای بزرگ فناوری» بودن مورد انتقاد قرار داد و از «برنامهی اقدام هوش مصنوعی مردم» (People's AI Action Plan) که با همکاری بیش از ۱۰۰ سازمان توسعه یافته است، حمایت میکند @AINowInstitute
- ایتان مولیک شفافیت در مورد مصرف آب توسط هوش مصنوعی را ارائه میدهد و گزارش میکند که طول عمر ۱۸ ماههی میسترال لارج ۲ به اندازهی مصرف آب ۶۷۸ خانوار آمریکایی در سال، آب مصرف کرده است و هر جستوجو ۴۵ میلیلیتر آب مصرف میکند @emollick
- مولیک نشان میدهد که چگونه یک دادهی زیستمحیطی میتواند بهصورت مثبت یا منفی مطرح شود و بیان میکند که هر جستوجوی هوش مصنوعی به اندازهی ۰.۰۰۱۸۷۵ درصد از ردپای آبی یک همبرگر، آب مصرف میکند @emollick
- نگرانیهایی در مورد مدلهای زبانی بزرگ چندوجهی (multimodal LLMs) مطرح شده است که امکان شکلهای جدیدی از نظارت را فراهم میکنند، زیرا این مدلها میتوانند ساعتها از فیلمهای ضبطشده را به روشهایی که نه قانون و نه جامعه پیشبینی کرده بودند، کاوش کنند و «فراموشی طبیعی» را از بین ببرند @emollick
- فرانسوا شوله هشدار میدهد که فقط نمرات تأییدشده توسط بنیاد ARC Prize در مجموعهی نیمهخصوصی باید قابلاعتماد باشند، و به عدم توانایی در بازتولید نمرهی ادعاشدهی ۴۱.۸ درصدی ARC-AGI-1 از آخرین نسخهی منتشرشدهی Qwen 3 اشاره میکند @fchollet
کاربردها
- پرپلکسیتی مرورگر Comet browser را با ویژگیهای مبتنی بر هوش مصنوعی راهاندازی کرد، از جمله دستیار خودکار «ویزارد آپلود یوتیوب»، مدیریت حافظهی بهتر از کروم و قابلیتهای جستوجوی عاملمانند بر روی محتوای غیرنمایهشده @WholeMarsBlog
- گیتهاب Spark را برای کاربران Copilot Pro+ منتشر کرد، ابزاری که ایدهها را کاملاً از طریق زبان طبیعی به «برنامههای فولاستک» (full-stack applications) تبدیل میکند و کاربران را در عرض چند دقیقه از مفهوم به استقرار میرساند @satyanadella
- گوگل فوتوز ویژگیهای هوش مصنوعی برای «ریمیکس» کردن عکسها به سبکهای مختلف و تبدیل عکسها به ویدیو را اضافه کرد، با قابلیتهای مشابهی که در حال انتشار برای یوتیوب شورتس نیز هستند @sundarpichai
- پژوهشگران متا فناوری دستبند کنترلشده با ژست را توسعه دادند که سیگنالهای عصبی از عضلات مچ دست را به فرمانهای کامپیوتری تبدیل میکند و در نشریهی Nature منتشر شده است @AIatMeta
- انویدیا «عاملهای هوش مصنوعی بینایی» (Vision AI agents) را به نمایش میگذارد که کارایی را در صنایع مختلف، از تحلیل ورزشی گرفته تا واکنش به حوادث شهری و کنترل کیفیت تولید، افزایش میدهند @NVIDIAAI
- انویدیا «Climate in a Bottle» را معرفی کرد؛ ابزار تعاملی مبتنی بر هوش مصنوعی که به کاربران امکان میدهد با تنظیم پارامترهایی مانند فصل و دمای اقیانوس، سیستمهای اقلیمی را کاوش کنند تا حالتهای اقلیمی با وضوح بالا را فوراً تولید کنند @NVIDIAAI
پژوهشها
- گوگل دیپمایند مدل هوش مصنوعی Aeneas را منتشر کرد که به مورخان کمک میکند تا کتیبههای باستانی لاتین را با ایجاد «اثرانگشتهای تاریخی» منحصر به فرد و شناسایی شباهتها در ۱۷۶,۰۰۰ کتیبه تفسیر کنند و اعتماد مورخان را تا ۴۴ درصد بهبود بخشد @GoogleDeepMind
- پژوهشها نشان میدهد که Llama 3.1 70B میتواند نسخههای تقریباً دقیق از کل کتابهای دارای حق چاپ مانند «Harry Potter & the Sorcerer's Stone» را هنگام دریافت عبارات تحریککنندهی خاص مانند «Mr and Mrs. D» تولید کند @AhmedSQRD
- هگینگفیس بنچمارک جدیدی را برای آزمایش توانایی مدلهای زبانی بزرگ بینایی (vision LLMs) در پردازش ورودیهای ویدیویی طولانی با تقسیم آنها به هزاران تصویر منتشر کرد، که محدودیتهای عملکردی در مدلهای فعلی را آشکار میسازد @andimarafioti
- پژوهشگران CMU با بومشناسان حفاظت از محیط زیست همکاری میکنند تا از هوش مصنوعی برای مطالعه و ریشهکن کردن گیاهان مهاجم «Leafy Spurge» استفاده کنند و مجموعهدادهی منحصربهفردی از تصاویر پهپادی با وضوح بالا و تأییدشده از زمین را منتشر کردهاند @rsalakhu
- پژوهشی در مورد «ترکیب برنامهی عصبی هدایتشده با اجرا» (execution-guided neural program synthesis) برای ARC-AGI، قابلیتهای تعمیم ترکیبی (compositional generalization) برتری را در مقایسه با جایگزینهایی مانند «تنظیم دقیق در زمان تست» (test-time fine-tuning) نشان میدهد @SimonOuellette6
- امآیتی فناوری «پوست الکترونیکی» (electronic skin) انعطافپذیری را توسعه داد که میتواند بینایی شبانهی فوقنازک و پوشیدنی به سبکی عینک آفتابی را امکانپذیر سازد @MIT