اخبار هوش مصنوعی در 2025-07-15

مدل‌های جدید هوش مصنوعی

Mistral اولین مدل‌های تشخیص گفتار متن‌باز خود را با نام Voxtral با ۳ میلیارد و ۲۴ میلیارد پارامتر منتشر کرد. این مدل‌ها عملکردی بهتر از Whisper large-v3 دارند و در بنچمارک‌های انگلیسی کوتاه‌مدت و Mozilla Common Voice به نتایج پیشرو دست یافته‌اند @MistralAI
Google Gemini ویژگی جدیدی را معرفی کرد که به کاربران امکان می‌دهد عکس‌ها را با صدا به ویدئو تبدیل کنند @GeminiApp
OpenAI سبک‌های تصویری جدیدی را برای تولید تصاویر با 4o اضافه کرد @AndrewCurran_

تحلیل صنعت

آزمایشگاه Thinking Machines Lab به رهبری میرا موراتی، مدیر ارشد فناوری سابق OpenAI، ۲ میلیارد دلار سرمایه‌ی اولیه (seed funding) به رهبری a16z و با مشارکت NVIDIA، AMD و سایرین جذب کرد و اکنون ۱۲ میلیارد دلار ارزش‌گذاری شده است @miramurati
وزیر بازرگانی تأیید کرد که فروش تراشه‌های H20 به چین از سر گرفته خواهد شد، که این امر به توافق ماه گذشته در مورد آهن‌رباهای خاکی کمیاب مرتبط است @AndrewCurran_
متا سه سرمایه‌گذاری در حوزه‌ی هوش مصنوعی را اعلام کرد که با همکاری دانشگاه کارنگی ملون و سازمان‌های محلی در پنسیلوانیا توسعه یافته‌اند @AndrewCurran_
Anthropic کمک مالی ۲ میلیون دلاری را برای برنامه‌های دانشگاه کارنگی ملون با هدف پیشبرد راه‌حل‌های انرژی هوش مصنوعی و آموزش امنیت سایبری اعلام کرد @AnthropicAI
اندرو اِنگ شرکت AI Aspire را معرفی کرد؛ یک شرکت مشاوره‌ی جدید که با Bain & Company همکاری می‌کند تا به شرکت‌ها در زمینه‌ی استراتژی و تحول هوش مصنوعی کمک کند @AndrewYNg
Cohere با گشایش دفتری در سئول، فعالیت خود را در منطقه‌ی APAC گسترش داد تا خدمات بهتری به مشتریان سازمانی و دولتی در سراسر منطقه ارائه دهد @cohere
نظرسنجی Pragmatic Engineer نشان می‌دهد که توسعه‌دهندگان به VS Code، JetBrains IDEs و Cursor علاقه زیادی دارند؛ در حالی که Claude و Cursor به سرعت در حال نزدیک شدن به میزان استفاده از ChatGPT و GitHub Copilot در میان مهندسان نرم‌افزار هستند @GergelyOrosz

اخلاق و جامعه

xAI به مسائل مربوط به دستورهای سیستمی (system prompts) Grok 4 رسیدگی کرد؛ پس از آنکه این مدل هنگام پرسش در مورد نام خانوادگی‌اش محتوای نامناسبی را جستجو کرد و هنگام پرسش از نظراتش، خود را با عقاید ایلان ماسک هم‌سو نشان داد @xai
ایتان مولیک هشدار داد که دستورهای سیستمی (system prompt) Grok ممکن است کنترل کافی بر رفتارهای ناخواسته را فراهم نکند، زیرا به نظر می‌رسد این مدل به راحتی از طریق زمینه (context) در نتایج جستجو گمراه می‌شود @emollick
یان لایک در مورد قابل اعتماد بودن نظارت Chain of Thought برای موارد ایمنی هوش مصنوعی ابراز تردید کرد و خاطرنشان ساخت که عدم وجود افکار بد، هم‌سویی مدل را ثابت نمی‌کند @janleike
پژوهش‌ها نشان می‌دهد که کش کردن پرامپت‌ها (prompt caching) می‌تواند اطلاعات خصوصی را از طریق تفاوت‌های زمانی فاش کند، و بررسی‌ها نشان داده‌اند که ۷ ارائه‌دهنده‌ی API با پتانسیل نشت داده‌های کاربران وجود دارند @chenchenygu
TechCrunch گزارش داد که رهبران پژوهش صنعت فناوری را ترغیب می‌کنند تا افکار هوش مصنوعی را نظارت کنند، زیرا سیستم‌ها بیشتر حالت عامل‌گونه (agentic) پیدا می‌کنند @TechCrunch

کاربردها

Perplexity مرورگر Comet را با قابلیت‌های عامل هوش مصنوعی (AI agent) راه‌اندازی کرد که می‌تواند وظایف پیچیده‌ی وب را به صورت خودکار انجام دهد، مانند اتصال استقرارها (deployments) به دامنه‌ها @nikshepsvn
عامل هوش مصنوعی Google با نام Big Sleep با موفقیت یک اکسپلویت امنیت سایبری قریب‌الوقوع را شناسایی و به جلوگیری از آن کمک کرد؛ این اتفاق به باور گوگل اولین مورد از این نوع برای یک عامل هوش مصنوعی در دفاع سایبری است @sundarpichai
فرانسوا شوله (Francois Chollet) نشان داد که چگونه می‌توان با استفاده از هوش مصنوعی تولیدکننده‌ی ویدئو، داستان‌های کودکان را به کلیپ‌های متحرک تبدیل کرد و تعامل طبیعی بین کودکان و ابزارهای خلاقیت هوش مصنوعی را برجسته ساخت @fchollet
مهندسان MIT یک ایمپلنت به اندازه‌ی سکه ساختند که به طور خودکار قند خون پایین را تشخیص داده و برای تثبیت سطح آن در عرض ۱۰ دقیقه، گلوکاگون ترشح می‌کند @MIT
Figma ادغام با Supabase را برای افزودن جریان‌های ورود (login flows)، ذخیره‌ی داده‌های کاربران و ذخیره‌ی فایل‌ها در پلتفرم Make خود نشان داد @figma

پژوهش‌ها

CollabLLM از Microsoft Research جایزه‌ی مقاله‌ی برجسته‌ی ICML 2025 را برای بهبود نحوه‌ی همکاری مدل‌های زبان بزرگ (LLM) با کاربران، از جمله دانستن زمان پرسیدن سؤال و تطبیق سبک ارتباطی، دریافت کرد @MSFTResearch
ایتان مولیک مدل Kimi را آزمایش کرد و دریافت که این مدل در یافتن جزئیات در اسناد بزرگ بسیار عالی عمل می‌کند، اما با توهمات (hallucinations) مشکل دارد و مسیر روایت‌های پیچیده را گم می‌کند @emollick
مقاله‌ی پژوهشی در مورد مجموعه‌ی داده‌ی rStar-Coder منتشر شد که شامل ۴۱۸ هزار مسئله‌ی کدنویسی در سطح رقابت است و عملکرد Qwen2.5-14B را در LiveCodeBench از ۲۳.۳٪ به ۶۲.۵٪ افزایش می‌دهد @LynaZhang
OpenAI از مقاله‌ی پژوهشی در مورد نظارت Chain of Thought به عنوان ابزاری برای نظارت بر سیستم‌های هوش مصنوعی عامل‌گونه (agentic) در آینده حمایت کرد @OpenAI
Google DeepMind و Google Research بیش از ۱۴۰ مقاله را در ICML 2025 ارائه دادند که جدیدترین تحولات پژوهشی هوش مصنوعی را به نمایش می‌گذارد @GoogleDeepMind