اخبار هوش مصنوعی در 2025-12-18

مدل‌های جدید هوش مصنوعی

گوگل Gemini 3 Flash را در سطح جهانی منتشر کرد که به عملکردی پیشرفته در معیارهای عامل‌محور از جمله tau2، MCP atlas و SWE verified دست یافته و در عین حال هزینه‌های کمتری نسبت به مدل‌های قبلی دارد @GeminiApp
OpenAI GPT-5.2-Codex را راه‌اندازی کرد که به‌طور خاص برای کدنویسی عامل‌محور و استفاده از ترمینال آموزش دیده است و تیم‌های داخلی موفقیت‌های اولیه را گزارش کرده‌اند @sama
متا Perception Encoder Audiovisual (PE-AV) را متن‌باز کرد، موتور فنی پشت جداسازی صوتی پیشرفته‌ی SAM Audio، که صدا را با درک بصری یکپارچه می‌کند @AIatMeta
گوگل FunctionGemma را منتشر کرد، یک مدل بنیادی باز سبک‌وزن با ۲۷۰ میلیون پارامتر که برای ایجاد مدل‌های تخصصی فراخوانی تابع طراحی شده و می‌تواند روی گوشی‌ها و مرورگرها اجرا شود @osanseviero
گوگل T5Gemma 2 را معرفی کرد، اولین مدل رمزگذار-رمزگشای چندوجهی، با زمینه‌ی طولانی و بسیار چندزبانه (۱۴۰ زبان)، که در اندازه‌های ۲۷۰M-270M، ۱B-1B و ۴B-4B در دسترس است @osanseviero
میسترال Mistral OCR 3 را منتشر کرد که معیارهای جدیدی را در دقت و کارایی تعیین می‌کند و از راه‌حل‌های پردازش اسناد سازمانی و OCR بومی هوش مصنوعی پیشی می‌گیرد @MistralAI
انویدیا خانواده‌ی مدل‌های باز، داده‌ها و کتابخانه‌های Nemotron 3 را منتشر کرد که مدل‌های بسیار کارآمدی را برای سفارشی‌سازی، سیستم‌های چندعاملی و مقیاس‌پذیری ارائه می‌دهد @NVIDIAAI
لوما یک مدل هوش مصنوعی جدید منتشر کرد که به کاربران امکان می‌دهد ویدیوها را از یک فریم شروع و پایان تولید کنند @TechCrunch
xAI Grok Voice Agent API را راه‌اندازی کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی بسازند که به ده‌ها زبان صحبت می‌کنند، ابزارها را فراخوانی می‌کنند و داده‌های بلادرنگ را جستجو می‌کنند، با زمان پاسخ‌دهی کمتر از یک ثانیه @MarioNawfal

تحلیل صنعت

اپلیکیشن موبایل ChatGPT به نقطه‌ی عطف جدیدی از ۳ میلیارد دلار هزینه‌ی مصرف‌کننده رسید @TechCrunch
استارتاپ کدنویسی Vibe به نام Lovable با ارزش‌گذاری ۶.۶ میلیارد دلاری، ۳۳۰ میلیون دلار سرمایه جذب کرد که نشان‌دهنده‌ی علاقه‌ی شدید سرمایه‌گذاران به ابزارهای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch
شرکت‌های برتر هوش مصنوعی در حال استخدام کدنویسان Vibe حرفه‌ای هستند، افراد غیرفنی که در استفاده از ابزارهایی مانند Lovable، Replit، Bolt، v0 و Cursor در ۱٪ برتر قرار دارند @clairevo
برت ادکاک، بنیان‌گذار Figure (شرکت رباتیک انسان‌نما با ارزش ۳۹ میلیارد دلار)، طبق گزارش‌ها ۱۰۰ میلیون دلار را به صورت خودگردان در آزمایشگاه هوش مصنوعی جدیدی به نام Hark سرمایه‌گذاری می‌کند که هوش مصنوعی انسان‌محور را می‌سازد که می‌تواند به صورت پیش‌فعال فکر کند و به صورت بازگشتی بهبود یابد @rowancheung
آزمایش کنترل‌شده‌ی تصادفی Stripe Capital در هزاران کسب‌وکار نشان می‌دهد که آن‌هایی که وام دریافت کرده‌اند، درآمد سالانه‌ی خود را در طول دو سال حدود ۲۷٪ سریع‌تر افزایش داده‌اند، که نشان‌دهنده‌ی محدودیت‌های سرمایه به عنوان یک مانع اصلی برای رشد کسب‌وکار است @patrickc
مهندسان گوگل گزارش می‌دهند که با استفاده از Gemini 2.5 و 3.0، ۱۲۰ هزار تا ۳۰۰ هزار خط کد را در تولید قرار داده‌اند که نشان‌دهنده‌ی افزایش قابل توجه بهره‌وری از دستیاران کدنویسی هوش مصنوعی است @GergelyOrosz
مدل‌های کدنویسی هوش مصنوعی در پروژه‌های جدید و ابزارهای استاندارد به طور قابل توجهی بهتر از مونولیت‌ها و ابزارهای غیر استاندارد مورد استفاده در شرکت‌هایی مانند متا و گوگل عمل می‌کنند و به توسعه‌دهندگان استارتاپ‌ها مزیت می‌دهند @GergelyOrosz
OpenAI اپلیکیشن اندروید Sora را ساخت که با کمک Codex تنها در ۱۸ روز به اپلیکیشن شماره ۱ جهان تبدیل شد @gdb
ChatGPT یک فروشگاه اپلیکیشن راه‌اندازی کرد که به توسعه‌دهندگان امکان می‌دهد اپلیکیشن‌ها را برای بررسی ارسال کنند تا در یک فهرست جدید که کاربران می‌توانند مستقیماً در ChatGPT به دنبال اپلیکیشن‌ها بگردند، لیست شوند @TechCrunch

اخلاق و جامعه

ایتان مولیک هشدار می‌دهد که همه، حتی بدبین‌ترین و آگاه‌ترین افراد، احتمالاً در سال آینده حداقل یک داستان، عکس یا پست جعلی هوش مصنوعی را باور خواهند کرد که پیامدهای بدی برای اعتماد و یکپارچگی اطلاعات دارد @emollick
اپلیکیشن Google Gemini قابلیت تشخیص واترمارک SynthID را معرفی می‌کند که به کاربران امکان می‌دهد تصاویر یا ویدیوها را آپلود کنند تا تأیید کنند که آیا با ابزارهای هوش مصنوعی گوگل ایجاد یا ویرایش شده‌اند یا خیر، که به شناسایی محتوای تولید شده توسط هوش مصنوعی کمک می‌کند @GeminiApp
سم آلتمن گزارش می‌دهد که یک محقق امنیتی با استفاده از مدل قبلی OpenAI، یک آسیب‌پذیری در React را کشف و افشا کرد که می‌تواند منجر به افشای کد منبع شود، که ماهیت دوگانه‌ی قابلیت‌های هوش مصنوعی در امنیت سایبری را برجسته می‌کند @sama
OpenAI مشخصات مدل را با بخش جدید اصول زیر ۱۸ سال (U18) به‌روزرسانی کرد، همراه با ویرایش‌ها و ساده‌سازی‌های کوچک‌تر برای راهنمایی نحوه‌ی رفتار مدل‌ها @w01fe
ادوبی با یک شکایت دسته‌جمعی پیشنهادی مواجه شد که متهم به سوءاستفاده از آثار نویسندگان در آموزش هوش مصنوعی است @TechCrunch
FTC ابزار قیمت‌گذاری مبتنی بر هوش مصنوعی Instacart را زیر سوال می‌برد و نگرانی‌هایی را در مورد شیوه‌های قیمت‌گذاری الگوریتمی مطرح می‌کند @TechCrunch

کاربردها

آزمایش پروژه‌ی وند Anthropic نشان می‌دهد که Claude یک فروشگاه را در دفتر سانفرانسیسکو خود اداره می‌کند، با عامل هوش مصنوعی (به نام Claudius) که پس از ارتقا از Claude Sonnet 3.7 به Sonnet 4 و 4.5 عملکرد کسب‌وکار را بهبود می‌بخشد، اگرچه هنوز به پشتیبانی انسانی قابل توجهی نیاز دارد @AnthropicAI
عامل هوش مصنوعی Guild که با Sierra ساخته شده است، به CSAT 4.8/5 دست یافته که با تیم پشتیبانی انسانی آن‌ها مطابقت دارد و در بیش از ۲۰ زبان برای خدمت به بزرگسالان شاغل که شغل، مراقبت و آموزش را متعادل می‌کنند، مقیاس‌پذیر است @btaylor
Sutter Health با Sierra همکاری می‌کند تا راه‌حل‌های هوش مصنوعی را ارائه دهد که مسیریابی مراقبت را برای بیماران آسان‌تر می‌کند و در عین حال فضای بیشتری را برای تیم‌های مراقبتی برای تمرکز بر ارتباط انسانی فراهم می‌کند @btaylor
آمازون قابلیت Alexa+ را معرفی می‌کند که هوش مصنوعی مکالمه‌ای را به زنگ‌های درب Ring اضافه می‌کند @TechCrunch
شریا رائو پردازش داده‌ها را با LLMها در مقیاس با استفاده از عملگرهای معنایی Map، Filter، Reduce نشان می‌دهد که به کاهش ۸۶٪ هزینه دست می‌یابد و در عین حال ۹۰٪ دقت را از طریق تکنیک‌هایی مانند Task Cascades و بهینه‌سازی پرس‌وجو حفظ می‌کند @HamelHusain
ویل مک‌گوگان Toad را منتشر کرد، یک رابط ترمینال یکپارچه برای کار با چندین عامل کدنویسی هوش مصنوعی از جمله OpenHands، Claude Code، Gemini CLI و دیگران از طریق پروتکل ACP @willmcgugan
اندرو ان‌جی دوره‌ی جدیدی را در NVIDIA's NeMo Agent Toolkit راه‌اندازی کرد که به توسعه‌دهندگان آموزش می‌دهد تا گردش‌کارهای عامل‌محور را به سیستم‌های آماده‌ی تولید قابل اعتماد با قابلیت‌های مشاهده‌پذیری، ارزیابی و استقرار تبدیل کنند @AndrewYNg

پژوهش‌ها

ایتان مولیک هیچ نشانه‌ای از پایان یافتن پیشرفت‌های سریع در قابلیت هوش مصنوعی با هزینه‌های رو به کاهش گزارش نمی‌دهد، با به‌روزرسانی‌های ماهانه برای ردیابی پیشرفت در معیارهایی مانند GPQA Diamond، اگرچه این معیار احتمالاً نزدیک به حداکثر شدن است @AndrewCurran_
GPT-5 به طور خودکار یک مسئله‌ی ریاضی باز را که به IMProofBench ارسال شده بود، با یک اثبات کامل و صحیح بدون راهنمایی یا دخالت انسانی حل کرد و سهم کوچک اما جدیدی در هندسه‌ی شمارشی داشت @gdb
تحقیقات نشان می‌دهد که مدل‌های هوش مصنوعی محبوب ممکن است در بارگذاری‌های بالاتر به دلیل درختان عملیات کاهش عمیق‌تر در هسته‌های استنتاج با اندازه‌های دسته‌ای بزرگ‌تر، احساس ضعف کنند، که خطاهای گرد کردن را افزایش می‌دهد تا تخریب عمدی عملکرد @davidad
رونویسی هوش مصنوعی از دست‌خط اکنون از عملکرد سطح انسانی فراتر رفته است، با Gemini 3 Flash که به نرخ خطای ۱.۴۳٪ در سطح کاراکتر و ۲.۷۴٪ در سطح کلمه دست یافته است، که ۴۷-۶۳٪ بهبود نسبت به 2.5 Flash است @emollick
جان شولمن توضیح می‌دهد که توابع ارزش در تنظیمات فعلی RL برای LLMها کمک زیادی نمی‌کنند، با وجود مزایای نظری آن‌ها برای کاهش واریانس، اگرچه او انتظار دارد که دوباره بازگردند @natolambert
فرانسوا شوله استدلال می‌کند که هوش عمومی به طور تکاملی از هدف ساده‌ی بقا در موقعیت‌های همیشه جدید و اغلب خصمانه پدید می‌آید، و آن را به یک فرآیند موقعیتی از سازگاری کارآمد با نوآوری تبدیل می‌کند @fchollet
فرانسوا شوله اشاره می‌کند که گرادیان نزولی در فضاهای استدلال گسسته و ترکیبی با چشم‌اندازهای صخره‌ای که یک گام منطقی واحد کل نتیجه را تغییر می‌دهد، شکست می‌خورد <a href="https://