اخبار هوش مصنوعی در 2025-12-18

مدل‌های جدید هوش مصنوعی

  • گوگل Gemini 3 Flash را در سطح جهانی منتشر کرد که به عملکردی پیشرفته در معیارهای عامل‌محور از جمله tau2، MCP atlas و SWE verified دست یافته و در عین حال هزینه‌های کمتری نسبت به مدل‌های قبلی دارد @GeminiApp
  • OpenAI GPT-5.2-Codex را راه‌اندازی کرد که به‌طور خاص برای کدنویسی عامل‌محور و استفاده از ترمینال آموزش دیده است و تیم‌های داخلی موفقیت‌های اولیه را گزارش کرده‌اند @sama
  • متا Perception Encoder Audiovisual (PE-AV) را متن‌باز کرد، موتور فنی پشت جداسازی صوتی پیشرفته‌ی SAM Audio، که صدا را با درک بصری یکپارچه می‌کند @AIatMeta
  • گوگل FunctionGemma را منتشر کرد، یک مدل بنیادی باز سبک‌وزن با ۲۷۰ میلیون پارامتر که برای ایجاد مدل‌های تخصصی فراخوانی تابع طراحی شده و می‌تواند روی گوشی‌ها و مرورگرها اجرا شود @osanseviero
  • گوگل T5Gemma 2 را معرفی کرد، اولین مدل رمزگذار-رمزگشای چندوجهی، با زمینه‌ی طولانی و بسیار چندزبانه (۱۴۰ زبان)، که در اندازه‌های ۲۷۰M-270M، ۱B-1B و ۴B-4B در دسترس است @osanseviero
  • میسترال Mistral OCR 3 را منتشر کرد که معیارهای جدیدی را در دقت و کارایی تعیین می‌کند و از راه‌حل‌های پردازش اسناد سازمانی و OCR بومی هوش مصنوعی پیشی می‌گیرد @MistralAI
  • انویدیا خانواده‌ی مدل‌های باز، داده‌ها و کتابخانه‌های Nemotron 3 را منتشر کرد که مدل‌های بسیار کارآمدی را برای سفارشی‌سازی، سیستم‌های چندعاملی و مقیاس‌پذیری ارائه می‌دهد @NVIDIAAI
  • لوما یک مدل هوش مصنوعی جدید منتشر کرد که به کاربران امکان می‌دهد ویدیوها را از یک فریم شروع و پایان تولید کنند @TechCrunch
  • xAI Grok Voice Agent API را راه‌اندازی کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی بسازند که به ده‌ها زبان صحبت می‌کنند، ابزارها را فراخوانی می‌کنند و داده‌های بلادرنگ را جستجو می‌کنند، با زمان پاسخ‌دهی کمتر از یک ثانیه @MarioNawfal

تحلیل صنعت

  • اپلیکیشن موبایل ChatGPT به نقطه‌ی عطف جدیدی از ۳ میلیارد دلار هزینه‌ی مصرف‌کننده رسید @TechCrunch
  • استارتاپ کدنویسی Vibe به نام Lovable با ارزش‌گذاری ۶.۶ میلیارد دلاری، ۳۳۰ میلیون دلار سرمایه جذب کرد که نشان‌دهنده‌ی علاقه‌ی شدید سرمایه‌گذاران به ابزارهای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch
  • شرکت‌های برتر هوش مصنوعی در حال استخدام کدنویسان Vibe حرفه‌ای هستند، افراد غیرفنی که در استفاده از ابزارهایی مانند Lovable، Replit، Bolt، v0 و Cursor در ۱٪ برتر قرار دارند @clairevo
  • برت ادکاک، بنیان‌گذار Figure (شرکت رباتیک انسان‌نما با ارزش ۳۹ میلیارد دلار)، طبق گزارش‌ها ۱۰۰ میلیون دلار را به صورت خودگردان در آزمایشگاه هوش مصنوعی جدیدی به نام Hark سرمایه‌گذاری می‌کند که هوش مصنوعی انسان‌محور را می‌سازد که می‌تواند به صورت پیش‌فعال فکر کند و به صورت بازگشتی بهبود یابد @rowancheung
  • آزمایش کنترل‌شده‌ی تصادفی Stripe Capital در هزاران کسب‌وکار نشان می‌دهد که آن‌هایی که وام دریافت کرده‌اند، درآمد سالانه‌ی خود را در طول دو سال حدود ۲۷٪ سریع‌تر افزایش داده‌اند، که نشان‌دهنده‌ی محدودیت‌های سرمایه به عنوان یک مانع اصلی برای رشد کسب‌وکار است @patrickc
  • مهندسان گوگل گزارش می‌دهند که با استفاده از Gemini 2.5 و 3.0، ۱۲۰ هزار تا ۳۰۰ هزار خط کد را در تولید قرار داده‌اند که نشان‌دهنده‌ی افزایش قابل توجه بهره‌وری از دستیاران کدنویسی هوش مصنوعی است @GergelyOrosz
  • مدل‌های کدنویسی هوش مصنوعی در پروژه‌های جدید و ابزارهای استاندارد به طور قابل توجهی بهتر از مونولیت‌ها و ابزارهای غیر استاندارد مورد استفاده در شرکت‌هایی مانند متا و گوگل عمل می‌کنند و به توسعه‌دهندگان استارتاپ‌ها مزیت می‌دهند @GergelyOrosz
  • OpenAI اپلیکیشن اندروید Sora را ساخت که با کمک Codex تنها در ۱۸ روز به اپلیکیشن شماره ۱ جهان تبدیل شد @gdb
  • ChatGPT یک فروشگاه اپلیکیشن راه‌اندازی کرد که به توسعه‌دهندگان امکان می‌دهد اپلیکیشن‌ها را برای بررسی ارسال کنند تا در یک فهرست جدید که کاربران می‌توانند مستقیماً در ChatGPT به دنبال اپلیکیشن‌ها بگردند، لیست شوند @TechCrunch

اخلاق و جامعه

  • ایتان مولیک هشدار می‌دهد که همه، حتی بدبین‌ترین و آگاه‌ترین افراد، احتمالاً در سال آینده حداقل یک داستان، عکس یا پست جعلی هوش مصنوعی را باور خواهند کرد که پیامدهای بدی برای اعتماد و یکپارچگی اطلاعات دارد @emollick
  • اپلیکیشن Google Gemini قابلیت تشخیص واترمارک SynthID را معرفی می‌کند که به کاربران امکان می‌دهد تصاویر یا ویدیوها را آپلود کنند تا تأیید کنند که آیا با ابزارهای هوش مصنوعی گوگل ایجاد یا ویرایش شده‌اند یا خیر، که به شناسایی محتوای تولید شده توسط هوش مصنوعی کمک می‌کند @GeminiApp
  • سم آلتمن گزارش می‌دهد که یک محقق امنیتی با استفاده از مدل قبلی OpenAI، یک آسیب‌پذیری در React را کشف و افشا کرد که می‌تواند منجر به افشای کد منبع شود، که ماهیت دوگانه‌ی قابلیت‌های هوش مصنوعی در امنیت سایبری را برجسته می‌کند @sama
  • OpenAI مشخصات مدل را با بخش جدید اصول زیر ۱۸ سال (U18) به‌روزرسانی کرد، همراه با ویرایش‌ها و ساده‌سازی‌های کوچک‌تر برای راهنمایی نحوه‌ی رفتار مدل‌ها @w01fe
  • ادوبی با یک شکایت دسته‌جمعی پیشنهادی مواجه شد که متهم به سوءاستفاده از آثار نویسندگان در آموزش هوش مصنوعی است @TechCrunch
  • FTC ابزار قیمت‌گذاری مبتنی بر هوش مصنوعی Instacart را زیر سوال می‌برد و نگرانی‌هایی را در مورد شیوه‌های قیمت‌گذاری الگوریتمی مطرح می‌کند @TechCrunch

کاربردها

  • آزمایش پروژه‌ی وند Anthropic نشان می‌دهد که Claude یک فروشگاه را در دفتر سانفرانسیسکو خود اداره می‌کند، با عامل هوش مصنوعی (به نام Claudius) که پس از ارتقا از Claude Sonnet 3.7 به Sonnet 4 و 4.5 عملکرد کسب‌وکار را بهبود می‌بخشد، اگرچه هنوز به پشتیبانی انسانی قابل توجهی نیاز دارد @AnthropicAI
  • عامل هوش مصنوعی Guild که با Sierra ساخته شده است، به CSAT 4.8/5 دست یافته که با تیم پشتیبانی انسانی آن‌ها مطابقت دارد و در بیش از ۲۰ زبان برای خدمت به بزرگسالان شاغل که شغل، مراقبت و آموزش را متعادل می‌کنند، مقیاس‌پذیر است @btaylor
  • Sutter Health با Sierra همکاری می‌کند تا راه‌حل‌های هوش مصنوعی را ارائه دهد که مسیریابی مراقبت را برای بیماران آسان‌تر می‌کند و در عین حال فضای بیشتری را برای تیم‌های مراقبتی برای تمرکز بر ارتباط انسانی فراهم می‌کند @btaylor
  • آمازون قابلیت Alexa+ را معرفی می‌کند که هوش مصنوعی مکالمه‌ای را به زنگ‌های درب Ring اضافه می‌کند @TechCrunch
  • شریا رائو پردازش داده‌ها را با LLMها در مقیاس با استفاده از عملگرهای معنایی Map، Filter، Reduce نشان می‌دهد که به کاهش ۸۶٪ هزینه دست می‌یابد و در عین حال ۹۰٪ دقت را از طریق تکنیک‌هایی مانند Task Cascades و بهینه‌سازی پرس‌وجو حفظ می‌کند @HamelHusain
  • ویل مک‌گوگان Toad را منتشر کرد، یک رابط ترمینال یکپارچه برای کار با چندین عامل کدنویسی هوش مصنوعی از جمله OpenHands، Claude Code، Gemini CLI و دیگران از طریق پروتکل ACP @willmcgugan
  • اندرو ان‌جی دوره‌ی جدیدی را در NVIDIA's NeMo Agent Toolkit راه‌اندازی کرد که به توسعه‌دهندگان آموزش می‌دهد تا گردش‌کارهای عامل‌محور را به سیستم‌های آماده‌ی تولید قابل اعتماد با قابلیت‌های مشاهده‌پذیری، ارزیابی و استقرار تبدیل کنند @AndrewYNg

پژوهش‌ها

  • ایتان مولیک هیچ نشانه‌ای از پایان یافتن پیشرفت‌های سریع در قابلیت هوش مصنوعی با هزینه‌های رو به کاهش گزارش نمی‌دهد، با به‌روزرسانی‌های ماهانه برای ردیابی پیشرفت در معیارهایی مانند GPQA Diamond، اگرچه این معیار احتمالاً نزدیک به حداکثر شدن است @AndrewCurran_
  • GPT-5 به طور خودکار یک مسئله‌ی ریاضی باز را که به IMProofBench ارسال شده بود، با یک اثبات کامل و صحیح بدون راهنمایی یا دخالت انسانی حل کرد و سهم کوچک اما جدیدی در هندسه‌ی شمارشی داشت @gdb
  • تحقیقات نشان می‌دهد که مدل‌های هوش مصنوعی محبوب ممکن است در بارگذاری‌های بالاتر به دلیل درختان عملیات کاهش عمیق‌تر در هسته‌های استنتاج با اندازه‌های دسته‌ای بزرگ‌تر، احساس ضعف کنند، که خطاهای گرد کردن را افزایش می‌دهد تا تخریب عمدی عملکرد @davidad
  • رونویسی هوش مصنوعی از دست‌خط اکنون از عملکرد سطح انسانی فراتر رفته است، با Gemini 3 Flash که به نرخ خطای ۱.۴۳٪ در سطح کاراکتر و ۲.۷۴٪ در سطح کلمه دست یافته است، که ۴۷-۶۳٪ بهبود نسبت به 2.5 Flash است @emollick
  • جان شولمن توضیح می‌دهد که توابع ارزش در تنظیمات فعلی RL برای LLMها کمک زیادی نمی‌کنند، با وجود مزایای نظری آن‌ها برای کاهش واریانس، اگرچه او انتظار دارد که دوباره بازگردند @natolambert
  • فرانسوا شوله استدلال می‌کند که هوش عمومی به طور تکاملی از هدف ساده‌ی بقا در موقعیت‌های همیشه جدید و اغلب خصمانه پدید می‌آید، و آن را به یک فرآیند موقعیتی از سازگاری کارآمد با نوآوری تبدیل می‌کند @fchollet
  • فرانسوا شوله اشاره می‌کند که گرادیان نزولی در فضاهای استدلال گسسته و ترکیبی با چشم‌اندازهای صخره‌ای که یک گام منطقی واحد کل نتیجه را تغییر می‌دهد، شکست می‌خورد <a href="https://