اخبار هوش مصنوعی در 2025-11-18

مدل‌های جدید هوش مصنوعی

گوگل جمینای 3 پرو را منتشر کرد که به عملکردی پیشرفته در معیارهای اصلی دست یافته است، از جمله رتبه‌ی اول در LMArena (1501 الو)، WebDev (1487 الو)، و بهبودهای قابل توجه در استدلال با 37.5% در «آخرین امتحان بشریت» و 31.1% در ARC-AGI-2 @sundarpichai
گوگل جمینای 3 دیپ تینک را معرفی کرد که عملکردی حتی قوی‌تر از جمینای 3 پرو با 45.1% در ARC-AGI-2 و 23.4% در MathArena Apex نشان می‌دهد که دو برابر بهبود نسبت به پیشرفته‌ترین مدل‌های قبلی است @OfficialLoganK
گوگل گوگل آنتی‌گراویتی را راه‌اندازی کرد، یک پلتفرم توسعه‌ی عامل‌محور که از جمینای 3 پرو برای استدلال، جمینای 2.5 کامپیوتر یوز برای اجرا، و نانو بنانا برای تولید تصویر استفاده می‌کند @GoogleDeepMind
xAI گروک 4.1 را منتشر کرد و ادعا می‌کند که با 1483 الو در صدر جدول امتیازات LMArena قرار گرفته است، با 65% ترجیح کاربر نسبت به مدل‌های قبلی، 600 امتیاز افزایش در نوشتن خلاقانه، و 3 برابر کاهش در توهمات @xai
مایکروسافت اعلام کرد که مدل‌های کلود (سونت 4.5، هایکو 4.5، اوپوس 4.1) اکنون از طریق همکاری با Anthropic و NVIDIA در Microsoft Foundry در دسترس هستند @Azure
Cohere در WMT 2025 کامند اِی ترنسلیت را ارائه کرد که استاندارد صنعتی جدیدی را برای ترجمه‌ی امن و آماده برای شرکت‌ها تعیین می‌کند @cohere

تحلیل صنعت

گوگل مزیت هزینه‌ای در توسعه‌ی مدل‌های هوش مصنوعی را از طریق مالکیت سخت‌افزار TPU، دسترسی به داده‌های اختصاصی، و آموزش جمینای 3 به عنوان یک مدل ترکیبی از متخصصان از ابتدا، نشان می‌دهد که امکان قیمت‌گذاری رقابتی را فراهم می‌کند @deedydas
Box گزارش می‌دهد که در آزمایش جمینای 3 پرو در مقابل جمینای 2.5 پرو در سناریوهای واقعی کسب‌وکار در خدمات مالی، حقوق، و مراقبت‌های بهداشتی، 22 درصد بهبود در وظایف استدلال پیچیده‌ی سازمانی مشاهده شده است @levie
Cursor در روز انتشار، عامل هوشمند پیش‌فرض خود را به جمینای 3 تغییر داد که اولین باری است که این شرکت احساس می‌کند مجبور به تغییر مدل‌ها بلافاصله پس از راه‌اندازی شده است @beyang
سم آلتمن به کاهش 300 برابری قیمت به ازای هر واحد هوش در طول یک سال به عنوان پایدارترین روند دست‌کم‌گرفته‌شده در توسعه‌ی هوش مصنوعی اشاره می‌کند @sama
Lambda پس از قرارداد چند میلیارد دلاری مایکروسافت برای زیرساخت مرکز داده‌ی هوش مصنوعی، 1.5 میلیارد دلار سرمایه جذب کرد @TechCrunch
Sphere با رهبری a16z، 21 میلیون دلار در سری A برای ساخت موتور انطباق مالیاتی فرامرزی مبتنی بر هوش مصنوعی جذب کرد که ثبت‌نام، محاسبه، بایگانی، و پرداخت را در بیش از 100 منطقه خودکار می‌کند @nrudder_
Stack Overflow خود را به عنوان ارائه‌دهنده‌ی داده‌های هوش مصنوعی در میان تغییر چشم‌انداز توسعه‌دهندگان بازتعریف می‌کند @TechCrunch
گرگلی اوروسز از گسترش IDEهای مبتنی بر هوش مصنوعی انتقاد می‌کند و بیش از 20 ابزار رقیب را فهرست می‌کند و استراتژی منسجم گوگل را پس از راه‌اندازی چندین پلتفرم توسعه در شش ماه زیر سوال می‌برد @GergelyOrosz

اخلاق و جامعه

کاربران گزارش می‌دهند که محتوای تولیدشده توسط هوش مصنوعی در سراسر پلتفرم‌های اینترنتی از جمله لینکدین، ردیت، مقالات خبری، و نقدها گسترش یافته است و اشاره می‌کنند که مردم با محتوای بی‌کیفیت هوش مصنوعی درگیر می‌شوند در حالی که از منشأ مصنوعی آن بی‌خبرند @deedydas
آندری کارپاتی در مورد دستکاری احتمالی معیارهای عمومی هوش مصنوعی از طریق حرکات پیچیده بر روی داده‌های مجاور مجموعه‌ی آزمایشی هشدار می‌دهد و به احتیاط توصیه می‌کند و آزمایش مستقیم مدل را به جای تکیه صرف بر نمرات معیارها پیشنهاد می‌کند @karpathy
یان لایک گزارش می‌دهد که صنعت هوش مصنوعی، الکس بورز، عضو مجلس ایالتی نیویورک را که از لایحه‌ی ایمنی هوش مصنوعی نیویورک حمایت کرده بود، به عنوان اولین هدف در کمپین سیاسی خود قرار داده است @janleike
MIT Media Lab در مورد نیاز به تدابیر حفاظتی برای محافظت از داده‌های عصبی بحث می‌کند، زیرا رابط‌های مغز و کامپیوتر رایج‌تر و قدرتمندتر می‌شوند @medialab
راشل توماس به 10 سال وبلاگ‌نویسی در مورد اخلاق هوش مصنوعی می‌اندیشد و نگرانی‌های مداوم در مورد آسیب‌های ناشی از سیستم‌های هوش مصنوعی که به طور غیرمسئولانه در مراقبت‌های بهداشتی، اشتغال، و پلیس به کار گرفته می‌شوند را برجسته می‌کند @math_rachel

کاربردها

گوگل جمینای ایجنت را برای مشترکین Google AI Ultra معرفی کرد که امکان خودکارسازی وظایف چندمرحله‌ای از جمله رزرو سفر، سازماندهی صندوق ورودی، و تعیین قرار ملاقات با تأیید کاربر قبل از اقدامات حیاتی را فراهم می‌کند @GeminiApp
گوگل حالت هوش مصنوعی را در جستجو با پشتیبانی جمینای 3 راه‌اندازی کرد که شامل تجربه‌های رابط کاربری مولد با طرح‌بندی‌های بصری پویا، ابزارهای تعاملی، و شبیه‌سازی‌هایی است که به طور خاص برای پرس‌وجوهای کاربر تولید می‌شوند @sundarpichai
فیگما جمینای 3 پرو را در Figma Make ادغام کرد که به طراحان امکان می‌دهد جهت‌گیری‌های بصری را بررسی کرده و نمونه‌های اولیه را با طیف گسترده‌ای از سبک‌ها، طرح‌بندی‌ها، و تعاملات تولید کنند @zoink
مایکروسافت Edge for Business را به عنوان اولین مرورگر هوش مصنوعی سازمانی امن جهان با حالت Copilot معرفی کرد که شامل اقدامات عامل‌محور، تحلیل چند تب، و خلاصه‌سازی یوتیوب است @mustafasuleyman
گوگل تجربه‌ی خرید جمینای را با چرخ‌وفلک‌های محصول، نمودارهای مقایسه، بررسی‌های عمیق با نظرات مشتریان، و لینک‌های خرید مستقیم بهبود بخشید @GeminiApp
آندری کارپاتی استفاده از LLMها را برای خواندن با رویکرد سه‌مرحله‌ای توصیف می‌کند: خواندن دستی، توضیح/خلاصه‌سازی، سپس پرسش و پاسخ، که منجر به درک عمیق‌تر از حرکت فوری می‌شود @karpathy
سایمون ویلسون یک ضبط صوتی 3.5 ساعته از جلسه‌ی شورا را با استفاده از جمینای 3 تحلیل کرد و کاربرد عملی درک زمینه‌ی طولانی را نشان داد @simonw
Replit تجربه‌ی طراحی را با پشتیبانی جمینای 3.0 راه‌اندازی کرد که به عنوان اولین تجربه‌ی طراحی هوش مصنوعی غیر بی‌کیفیت با تمرکز بر رابط‌های کاربری زیبا توصیف می‌شود @amasad

پژوهش‌ها

اوریول وینیالز بهبودهای پیش‌آموزش را تأیید می‌کند که هیچ مانعی در دید نیست، و اشاره می‌کند که دلتای بین جمینای 2.5 و 3.0 بزرگترین دلتای مشاهده‌شده تاکنون است، در حالی که پس‌آموزش همچنان یک زمینه‌ی کاملاً جدید با فضای زیادی برای پیشرفت الگوریتمی است @OriolVinyalsML
جمینای 3 پرو با دقت 73% در معیار ScreenSpot Pro به پیشرفتی دست یافت که دو برابر پیشرفته‌ترین مدل‌ها برای درک اسکرین‌شات‌ها در برنامه‌های پیچیده از جمله AutoCAD و فتوشاپ است @deedydas
جمینای 3 بهبود قابل توجهی در Vending-Bench Arena برای برنامه‌ریزی بلندمدت و قابلیت‌های فراخوانی ابزار نشان می‌دهد @OfficialLoganK
جمینای 3 پرو بزرگترین دلتای ثبت‌شده در معیار Design Arena را به دست آورد که بهبود قابل توجهی در وظایف مرتبط با طراحی نشان می‌دهد @OfficialLoganK
Physical Intelligence مقاله‌ای منتشر کرد که نتایج چشمگیر یادگیری تقویتی در دنیای واقعی را با استفاده از مدل VLA از پیش آموزش‌دیده با مداخلات انسانی، آموزش تابع ارزش، و به‌روزرسانی‌های سیاست نشان می‌دهد @yjy0625
Stanford NLP مدل CHURRO را منتشر کرد، یک مدل زبان-بینایی با وزن باز 3B که در OCR تاریخی از جمینای 2.5 پرو بهتر عمل می‌کند در حالی که 15.5 برابر مقرون‌به‌صرفه‌تر است @sina_semnani
فرانسوا شوله اشاره می‌کند که ARC-AGI برای اثبات اینکه LLMها مسیر AGI نیستند، طراحی شده بود، اما LLMها اکنون با جمینای 3 که به 31.1% می‌رسد، عملکرد قوی‌ای از خود نشان می‌دهند @dileeplearning
گروک 4.1 هوش هیجانی و همدلی بالاتری را نشان می‌دهد و در EQ-Bench امتیاز 1586 را کسب می‌کند، با مهارت‌های بین‌فردی بهبودیافته در مقایسه با مدل‌های قبلی @xai
تحقیقات MIT نشان می‌دهد که انتخاب دقیق داده‌ها می‌تواند راه‌حل‌های بهینه را با مجموعه‌های داده‌ی کوچک تضمین کند و روشی را برای شناسایی دقیق داده‌های مورد نیاز ارائه می‌دهد @MIT
محققان MIT Media Lab از چارچوب Environment-Vulnerability-Decision-Technology با داده‌های ماهواره‌ای برای ردیابی جنگل‌زدایی در غنا استفاده می‌کنند و نشان می‌دهند که چگونه فناوری فضایی از پیشرفت‌های زیست‌محیطی با رهبری آفریقا حمایت می‌کند @medialab