اخبار هوش مصنوعی در 2025-12-18
مدلهای جدید هوش مصنوعی
- گوگل Gemini 3 Flash را در سطح جهانی منتشر کرد که به عملکردی پیشرفته در معیارهای عاملمحور از جمله tau2، MCP atlas و SWE verified دست یافته و در عین حال هزینههای کمتری نسبت به مدلهای قبلی دارد @GeminiApp
- OpenAI GPT-5.2-Codex را راهاندازی کرد که بهطور خاص برای کدنویسی عاملمحور و استفاده از ترمینال آموزش دیده است و تیمهای داخلی موفقیتهای اولیه را گزارش کردهاند @sama
- متا Perception Encoder Audiovisual (PE-AV) را متنباز کرد، موتور فنی پشت جداسازی صوتی پیشرفتهی SAM Audio، که صدا را با درک بصری یکپارچه میکند @AIatMeta
- گوگل FunctionGemma را منتشر کرد، یک مدل بنیادی باز سبکوزن با ۲۷۰ میلیون پارامتر که برای ایجاد مدلهای تخصصی فراخوانی تابع طراحی شده و میتواند روی گوشیها و مرورگرها اجرا شود @osanseviero
- گوگل T5Gemma 2 را معرفی کرد، اولین مدل رمزگذار-رمزگشای چندوجهی، با زمینهی طولانی و بسیار چندزبانه (۱۴۰ زبان)، که در اندازههای ۲۷۰M-270M، ۱B-1B و ۴B-4B در دسترس است @osanseviero
- میسترال Mistral OCR 3 را منتشر کرد که معیارهای جدیدی را در دقت و کارایی تعیین میکند و از راهحلهای پردازش اسناد سازمانی و OCR بومی هوش مصنوعی پیشی میگیرد @MistralAI
- انویدیا خانوادهی مدلهای باز، دادهها و کتابخانههای Nemotron 3 را منتشر کرد که مدلهای بسیار کارآمدی را برای سفارشیسازی، سیستمهای چندعاملی و مقیاسپذیری ارائه میدهد @NVIDIAAI
- لوما یک مدل هوش مصنوعی جدید منتشر کرد که به کاربران امکان میدهد ویدیوها را از یک فریم شروع و پایان تولید کنند @TechCrunch
- xAI Grok Voice Agent API را راهاندازی کرد که به توسعهدهندگان امکان میدهد عاملهای صوتی بسازند که به دهها زبان صحبت میکنند، ابزارها را فراخوانی میکنند و دادههای بلادرنگ را جستجو میکنند، با زمان پاسخدهی کمتر از یک ثانیه @MarioNawfal
تحلیل صنعت
- اپلیکیشن موبایل ChatGPT به نقطهی عطف جدیدی از ۳ میلیارد دلار هزینهی مصرفکننده رسید @TechCrunch
- استارتاپ کدنویسی Vibe به نام Lovable با ارزشگذاری ۶.۶ میلیارد دلاری، ۳۳۰ میلیون دلار سرمایه جذب کرد که نشاندهندهی علاقهی شدید سرمایهگذاران به ابزارهای توسعهی مبتنی بر هوش مصنوعی است @TechCrunch
- شرکتهای برتر هوش مصنوعی در حال استخدام کدنویسان Vibe حرفهای هستند، افراد غیرفنی که در استفاده از ابزارهایی مانند Lovable، Replit، Bolt، v0 و Cursor در ۱٪ برتر قرار دارند @clairevo
- برت ادکاک، بنیانگذار Figure (شرکت رباتیک انساننما با ارزش ۳۹ میلیارد دلار)، طبق گزارشها ۱۰۰ میلیون دلار را به صورت خودگردان در آزمایشگاه هوش مصنوعی جدیدی به نام Hark سرمایهگذاری میکند که هوش مصنوعی انسانمحور را میسازد که میتواند به صورت پیشفعال فکر کند و به صورت بازگشتی بهبود یابد @rowancheung
- آزمایش کنترلشدهی تصادفی Stripe Capital در هزاران کسبوکار نشان میدهد که آنهایی که وام دریافت کردهاند، درآمد سالانهی خود را در طول دو سال حدود ۲۷٪ سریعتر افزایش دادهاند، که نشاندهندهی محدودیتهای سرمایه به عنوان یک مانع اصلی برای رشد کسبوکار است @patrickc
- مهندسان گوگل گزارش میدهند که با استفاده از Gemini 2.5 و 3.0، ۱۲۰ هزار تا ۳۰۰ هزار خط کد را در تولید قرار دادهاند که نشاندهندهی افزایش قابل توجه بهرهوری از دستیاران کدنویسی هوش مصنوعی است @GergelyOrosz
- مدلهای کدنویسی هوش مصنوعی در پروژههای جدید و ابزارهای استاندارد به طور قابل توجهی بهتر از مونولیتها و ابزارهای غیر استاندارد مورد استفاده در شرکتهایی مانند متا و گوگل عمل میکنند و به توسعهدهندگان استارتاپها مزیت میدهند @GergelyOrosz
- OpenAI اپلیکیشن اندروید Sora را ساخت که با کمک Codex تنها در ۱۸ روز به اپلیکیشن شماره ۱ جهان تبدیل شد @gdb
- ChatGPT یک فروشگاه اپلیکیشن راهاندازی کرد که به توسعهدهندگان امکان میدهد اپلیکیشنها را برای بررسی ارسال کنند تا در یک فهرست جدید که کاربران میتوانند مستقیماً در ChatGPT به دنبال اپلیکیشنها بگردند، لیست شوند @TechCrunch
اخلاق و جامعه
- ایتان مولیک هشدار میدهد که همه، حتی بدبینترین و آگاهترین افراد، احتمالاً در سال آینده حداقل یک داستان، عکس یا پست جعلی هوش مصنوعی را باور خواهند کرد که پیامدهای بدی برای اعتماد و یکپارچگی اطلاعات دارد @emollick
- اپلیکیشن Google Gemini قابلیت تشخیص واترمارک SynthID را معرفی میکند که به کاربران امکان میدهد تصاویر یا ویدیوها را آپلود کنند تا تأیید کنند که آیا با ابزارهای هوش مصنوعی گوگل ایجاد یا ویرایش شدهاند یا خیر، که به شناسایی محتوای تولید شده توسط هوش مصنوعی کمک میکند @GeminiApp
- سم آلتمن گزارش میدهد که یک محقق امنیتی با استفاده از مدل قبلی OpenAI، یک آسیبپذیری در React را کشف و افشا کرد که میتواند منجر به افشای کد منبع شود، که ماهیت دوگانهی قابلیتهای هوش مصنوعی در امنیت سایبری را برجسته میکند @sama
- OpenAI مشخصات مدل را با بخش جدید اصول زیر ۱۸ سال (U18) بهروزرسانی کرد، همراه با ویرایشها و سادهسازیهای کوچکتر برای راهنمایی نحوهی رفتار مدلها @w01fe
- ادوبی با یک شکایت دستهجمعی پیشنهادی مواجه شد که متهم به سوءاستفاده از آثار نویسندگان در آموزش هوش مصنوعی است @TechCrunch
- FTC ابزار قیمتگذاری مبتنی بر هوش مصنوعی Instacart را زیر سوال میبرد و نگرانیهایی را در مورد شیوههای قیمتگذاری الگوریتمی مطرح میکند @TechCrunch
کاربردها
- آزمایش پروژهی وند Anthropic نشان میدهد که Claude یک فروشگاه را در دفتر سانفرانسیسکو خود اداره میکند، با عامل هوش مصنوعی (به نام Claudius) که پس از ارتقا از Claude Sonnet 3.7 به Sonnet 4 و 4.5 عملکرد کسبوکار را بهبود میبخشد، اگرچه هنوز به پشتیبانی انسانی قابل توجهی نیاز دارد @AnthropicAI
- عامل هوش مصنوعی Guild که با Sierra ساخته شده است، به CSAT 4.8/5 دست یافته که با تیم پشتیبانی انسانی آنها مطابقت دارد و در بیش از ۲۰ زبان برای خدمت به بزرگسالان شاغل که شغل، مراقبت و آموزش را متعادل میکنند، مقیاسپذیر است @btaylor
- Sutter Health با Sierra همکاری میکند تا راهحلهای هوش مصنوعی را ارائه دهد که مسیریابی مراقبت را برای بیماران آسانتر میکند و در عین حال فضای بیشتری را برای تیمهای مراقبتی برای تمرکز بر ارتباط انسانی فراهم میکند @btaylor
- آمازون قابلیت Alexa+ را معرفی میکند که هوش مصنوعی مکالمهای را به زنگهای درب Ring اضافه میکند @TechCrunch
- شریا رائو پردازش دادهها را با LLMها در مقیاس با استفاده از عملگرهای معنایی Map، Filter، Reduce نشان میدهد که به کاهش ۸۶٪ هزینه دست مییابد و در عین حال ۹۰٪ دقت را از طریق تکنیکهایی مانند Task Cascades و بهینهسازی پرسوجو حفظ میکند @HamelHusain
- ویل مکگوگان Toad را منتشر کرد، یک رابط ترمینال یکپارچه برای کار با چندین عامل کدنویسی هوش مصنوعی از جمله OpenHands، Claude Code، Gemini CLI و دیگران از طریق پروتکل ACP @willmcgugan
- اندرو انجی دورهی جدیدی را در NVIDIA's NeMo Agent Toolkit راهاندازی کرد که به توسعهدهندگان آموزش میدهد تا گردشکارهای عاملمحور را به سیستمهای آمادهی تولید قابل اعتماد با قابلیتهای مشاهدهپذیری، ارزیابی و استقرار تبدیل کنند @AndrewYNg
پژوهشها
- ایتان مولیک هیچ نشانهای از پایان یافتن پیشرفتهای سریع در قابلیت هوش مصنوعی با هزینههای رو به کاهش گزارش نمیدهد، با بهروزرسانیهای ماهانه برای ردیابی پیشرفت در معیارهایی مانند GPQA Diamond، اگرچه این معیار احتمالاً نزدیک به حداکثر شدن است @AndrewCurran_
- GPT-5 به طور خودکار یک مسئلهی ریاضی باز را که به IMProofBench ارسال شده بود، با یک اثبات کامل و صحیح بدون راهنمایی یا دخالت انسانی حل کرد و سهم کوچک اما جدیدی در هندسهی شمارشی داشت @gdb
- تحقیقات نشان میدهد که مدلهای هوش مصنوعی محبوب ممکن است در بارگذاریهای بالاتر به دلیل درختان عملیات کاهش عمیقتر در هستههای استنتاج با اندازههای دستهای بزرگتر، احساس ضعف کنند، که خطاهای گرد کردن را افزایش میدهد تا تخریب عمدی عملکرد @davidad
- رونویسی هوش مصنوعی از دستخط اکنون از عملکرد سطح انسانی فراتر رفته است، با Gemini 3 Flash که به نرخ خطای ۱.۴۳٪ در سطح کاراکتر و ۲.۷۴٪ در سطح کلمه دست یافته است، که ۴۷-۶۳٪ بهبود نسبت به 2.5 Flash است @emollick
- جان شولمن توضیح میدهد که توابع ارزش در تنظیمات فعلی RL برای LLMها کمک زیادی نمیکنند، با وجود مزایای نظری آنها برای کاهش واریانس، اگرچه او انتظار دارد که دوباره بازگردند @natolambert
- فرانسوا شوله استدلال میکند که هوش عمومی به طور تکاملی از هدف سادهی بقا در موقعیتهای همیشه جدید و اغلب خصمانه پدید میآید، و آن را به یک فرآیند موقعیتی از سازگاری کارآمد با نوآوری تبدیل میکند @fchollet
- فرانسوا شوله اشاره میکند که گرادیان نزولی در فضاهای استدلال گسسته و ترکیبی با چشماندازهای صخرهای که یک گام منطقی واحد کل نتیجه را تغییر میدهد، شکست میخورد <a href="https://