اخبار هوش مصنوعی در 2025-11-18

مدل‌های جدید هوش مصنوعی

  • گوگل جمینای 3 پرو را منتشر کرد که به عملکردی پیشرفته در معیارهای اصلی دست یافته است، از جمله رتبه‌ی اول در LMArena (1501 الو)، WebDev (1487 الو)، و بهبودهای قابل توجه در استدلال با 37.5% در «آخرین امتحان بشریت» و 31.1% در ARC-AGI-2 @sundarpichai
  • گوگل جمینای 3 دیپ تینک را معرفی کرد که عملکردی حتی قوی‌تر از جمینای 3 پرو با 45.1% در ARC-AGI-2 و 23.4% در MathArena Apex نشان می‌دهد که دو برابر بهبود نسبت به پیشرفته‌ترین مدل‌های قبلی است @OfficialLoganK
  • گوگل گوگل آنتی‌گراویتی را راه‌اندازی کرد، یک پلتفرم توسعه‌ی عامل‌محور که از جمینای 3 پرو برای استدلال، جمینای 2.5 کامپیوتر یوز برای اجرا، و نانو بنانا برای تولید تصویر استفاده می‌کند @GoogleDeepMind
  • xAI گروک 4.1 را منتشر کرد و ادعا می‌کند که با 1483 الو در صدر جدول امتیازات LMArena قرار گرفته است، با 65% ترجیح کاربر نسبت به مدل‌های قبلی، 600 امتیاز افزایش در نوشتن خلاقانه، و 3 برابر کاهش در توهمات @xai
  • مایکروسافت اعلام کرد که مدل‌های کلود (سونت 4.5، هایکو 4.5، اوپوس 4.1) اکنون از طریق همکاری با Anthropic و NVIDIA در Microsoft Foundry در دسترس هستند @Azure
  • Cohere در WMT 2025 کامند اِی ترنسلیت را ارائه کرد که استاندارد صنعتی جدیدی را برای ترجمه‌ی امن و آماده برای شرکت‌ها تعیین می‌کند @cohere

تحلیل صنعت

  • گوگل مزیت هزینه‌ای در توسعه‌ی مدل‌های هوش مصنوعی را از طریق مالکیت سخت‌افزار TPU، دسترسی به داده‌های اختصاصی، و آموزش جمینای 3 به عنوان یک مدل ترکیبی از متخصصان از ابتدا، نشان می‌دهد که امکان قیمت‌گذاری رقابتی را فراهم می‌کند @deedydas
  • Box گزارش می‌دهد که در آزمایش جمینای 3 پرو در مقابل جمینای 2.5 پرو در سناریوهای واقعی کسب‌وکار در خدمات مالی، حقوق، و مراقبت‌های بهداشتی، 22 درصد بهبود در وظایف استدلال پیچیده‌ی سازمانی مشاهده شده است @levie
  • Cursor در روز انتشار، عامل هوشمند پیش‌فرض خود را به جمینای 3 تغییر داد که اولین باری است که این شرکت احساس می‌کند مجبور به تغییر مدل‌ها بلافاصله پس از راه‌اندازی شده است @beyang
  • سم آلتمن به کاهش 300 برابری قیمت به ازای هر واحد هوش در طول یک سال به عنوان پایدارترین روند دست‌کم‌گرفته‌شده در توسعه‌ی هوش مصنوعی اشاره می‌کند @sama
  • Lambda پس از قرارداد چند میلیارد دلاری مایکروسافت برای زیرساخت مرکز داده‌ی هوش مصنوعی، 1.5 میلیارد دلار سرمایه جذب کرد @TechCrunch
  • Sphere با رهبری a16z، 21 میلیون دلار در سری A برای ساخت موتور انطباق مالیاتی فرامرزی مبتنی بر هوش مصنوعی جذب کرد که ثبت‌نام، محاسبه، بایگانی، و پرداخت را در بیش از 100 منطقه خودکار می‌کند @nrudder_
  • Stack Overflow خود را به عنوان ارائه‌دهنده‌ی داده‌های هوش مصنوعی در میان تغییر چشم‌انداز توسعه‌دهندگان بازتعریف می‌کند @TechCrunch
  • گرگلی اوروسز از گسترش IDEهای مبتنی بر هوش مصنوعی انتقاد می‌کند و بیش از 20 ابزار رقیب را فهرست می‌کند و استراتژی منسجم گوگل را پس از راه‌اندازی چندین پلتفرم توسعه در شش ماه زیر سوال می‌برد @GergelyOrosz

اخلاق و جامعه

  • کاربران گزارش می‌دهند که محتوای تولیدشده توسط هوش مصنوعی در سراسر پلتفرم‌های اینترنتی از جمله لینکدین، ردیت، مقالات خبری، و نقدها گسترش یافته است و اشاره می‌کنند که مردم با محتوای بی‌کیفیت هوش مصنوعی درگیر می‌شوند در حالی که از منشأ مصنوعی آن بی‌خبرند @deedydas
  • آندری کارپاتی در مورد دستکاری احتمالی معیارهای عمومی هوش مصنوعی از طریق حرکات پیچیده بر روی داده‌های مجاور مجموعه‌ی آزمایشی هشدار می‌دهد و به احتیاط توصیه می‌کند و آزمایش مستقیم مدل را به جای تکیه صرف بر نمرات معیارها پیشنهاد می‌کند @karpathy
  • یان لایک گزارش می‌دهد که صنعت هوش مصنوعی، الکس بورز، عضو مجلس ایالتی نیویورک را که از لایحه‌ی ایمنی هوش مصنوعی نیویورک حمایت کرده بود، به عنوان اولین هدف در کمپین سیاسی خود قرار داده است @janleike
  • MIT Media Lab در مورد نیاز به تدابیر حفاظتی برای محافظت از داده‌های عصبی بحث می‌کند، زیرا رابط‌های مغز و کامپیوتر رایج‌تر و قدرتمندتر می‌شوند @medialab
  • راشل توماس به 10 سال وبلاگ‌نویسی در مورد اخلاق هوش مصنوعی می‌اندیشد و نگرانی‌های مداوم در مورد آسیب‌های ناشی از سیستم‌های هوش مصنوعی که به طور غیرمسئولانه در مراقبت‌های بهداشتی، اشتغال، و پلیس به کار گرفته می‌شوند را برجسته می‌کند @math_rachel

کاربردها

  • گوگل جمینای ایجنت را برای مشترکین Google AI Ultra معرفی کرد که امکان خودکارسازی وظایف چندمرحله‌ای از جمله رزرو سفر، سازماندهی صندوق ورودی، و تعیین قرار ملاقات با تأیید کاربر قبل از اقدامات حیاتی را فراهم می‌کند @GeminiApp
  • گوگل حالت هوش مصنوعی را در جستجو با پشتیبانی جمینای 3 راه‌اندازی کرد که شامل تجربه‌های رابط کاربری مولد با طرح‌بندی‌های بصری پویا، ابزارهای تعاملی، و شبیه‌سازی‌هایی است که به طور خاص برای پرس‌وجوهای کاربر تولید می‌شوند @sundarpichai
  • فیگما جمینای 3 پرو را در Figma Make ادغام کرد که به طراحان امکان می‌دهد جهت‌گیری‌های بصری را بررسی کرده و نمونه‌های اولیه را با طیف گسترده‌ای از سبک‌ها، طرح‌بندی‌ها، و تعاملات تولید کنند @zoink
  • مایکروسافت Edge for Business را به عنوان اولین مرورگر هوش مصنوعی سازمانی امن جهان با حالت Copilot معرفی کرد که شامل اقدامات عامل‌محور، تحلیل چند تب، و خلاصه‌سازی یوتیوب است @mustafasuleyman
  • گوگل تجربه‌ی خرید جمینای را با چرخ‌وفلک‌های محصول، نمودارهای مقایسه، بررسی‌های عمیق با نظرات مشتریان، و لینک‌های خرید مستقیم بهبود بخشید @GeminiApp
  • آندری کارپاتی استفاده از LLMها را برای خواندن با رویکرد سه‌مرحله‌ای توصیف می‌کند: خواندن دستی، توضیح/خلاصه‌سازی، سپس پرسش و پاسخ، که منجر به درک عمیق‌تر از حرکت فوری می‌شود @karpathy
  • سایمون ویلسون یک ضبط صوتی 3.5 ساعته از جلسه‌ی شورا را با استفاده از جمینای 3 تحلیل کرد و کاربرد عملی درک زمینه‌ی طولانی را نشان داد @simonw
  • Replit تجربه‌ی طراحی را با پشتیبانی جمینای 3.0 راه‌اندازی کرد که به عنوان اولین تجربه‌ی طراحی هوش مصنوعی غیر بی‌کیفیت با تمرکز بر رابط‌های کاربری زیبا توصیف می‌شود @amasad

پژوهش‌ها

  • اوریول وینیالز بهبودهای پیش‌آموزش را تأیید می‌کند که هیچ مانعی در دید نیست، و اشاره می‌کند که دلتای بین جمینای 2.5 و 3.0 بزرگترین دلتای مشاهده‌شده تاکنون است، در حالی که پس‌آموزش همچنان یک زمینه‌ی کاملاً جدید با فضای زیادی برای پیشرفت الگوریتمی است @OriolVinyalsML
  • جمینای 3 پرو با دقت 73% در معیار ScreenSpot Pro به پیشرفتی دست یافت که دو برابر پیشرفته‌ترین مدل‌ها برای درک اسکرین‌شات‌ها در برنامه‌های پیچیده از جمله AutoCAD و فتوشاپ است @deedydas
  • جمینای 3 بهبود قابل توجهی در Vending-Bench Arena برای برنامه‌ریزی بلندمدت و قابلیت‌های فراخوانی ابزار نشان می‌دهد @OfficialLoganK
  • جمینای 3 پرو بزرگترین دلتای ثبت‌شده در معیار Design Arena را به دست آورد که بهبود قابل توجهی در وظایف مرتبط با طراحی نشان می‌دهد @OfficialLoganK
  • Physical Intelligence مقاله‌ای منتشر کرد که نتایج چشمگیر یادگیری تقویتی در دنیای واقعی را با استفاده از مدل VLA از پیش آموزش‌دیده با مداخلات انسانی، آموزش تابع ارزش، و به‌روزرسانی‌های سیاست نشان می‌دهد @yjy0625
  • Stanford NLP مدل CHURRO را منتشر کرد، یک مدل زبان-بینایی با وزن باز 3B که در OCR تاریخی از جمینای 2.5 پرو بهتر عمل می‌کند در حالی که 15.5 برابر مقرون‌به‌صرفه‌تر است @sina_semnani
  • فرانسوا شوله اشاره می‌کند که ARC-AGI برای اثبات اینکه LLMها مسیر AGI نیستند، طراحی شده بود، اما LLMها اکنون با جمینای 3 که به 31.1% می‌رسد، عملکرد قوی‌ای از خود نشان می‌دهند @dileeplearning
  • گروک 4.1 هوش هیجانی و همدلی بالاتری را نشان می‌دهد و در EQ-Bench امتیاز 1586 را کسب می‌کند، با مهارت‌های بین‌فردی بهبودیافته در مقایسه با مدل‌های قبلی @xai
  • تحقیقات MIT نشان می‌دهد که انتخاب دقیق داده‌ها می‌تواند راه‌حل‌های بهینه را با مجموعه‌های داده‌ی کوچک تضمین کند و روشی را برای شناسایی دقیق داده‌های مورد نیاز ارائه می‌دهد @MIT
  • محققان MIT Media Lab از چارچوب Environment-Vulnerability-Decision-Technology با داده‌های ماهواره‌ای برای ردیابی جنگل‌زدایی در غنا استفاده می‌کنند و نشان می‌دهند که چگونه فناوری فضایی از پیشرفت‌های زیست‌محیطی با رهبری آفریقا حمایت می‌کند @medialab