اخبار هوش مصنوعی در 2025-11-18
مدلهای جدید هوش مصنوعی
- گوگل جمینای 3 پرو را منتشر کرد که به عملکردی پیشرفته در معیارهای اصلی دست یافته است، از جمله رتبهی اول در LMArena (1501 الو)، WebDev (1487 الو)، و بهبودهای قابل توجه در استدلال با 37.5% در «آخرین امتحان بشریت» و 31.1% در ARC-AGI-2 @sundarpichai
- گوگل جمینای 3 دیپ تینک را معرفی کرد که عملکردی حتی قویتر از جمینای 3 پرو با 45.1% در ARC-AGI-2 و 23.4% در MathArena Apex نشان میدهد که دو برابر بهبود نسبت به پیشرفتهترین مدلهای قبلی است @OfficialLoganK
- گوگل گوگل آنتیگراویتی را راهاندازی کرد، یک پلتفرم توسعهی عاملمحور که از جمینای 3 پرو برای استدلال، جمینای 2.5 کامپیوتر یوز برای اجرا، و نانو بنانا برای تولید تصویر استفاده میکند @GoogleDeepMind
- xAI گروک 4.1 را منتشر کرد و ادعا میکند که با 1483 الو در صدر جدول امتیازات LMArena قرار گرفته است، با 65% ترجیح کاربر نسبت به مدلهای قبلی، 600 امتیاز افزایش در نوشتن خلاقانه، و 3 برابر کاهش در توهمات @xai
- مایکروسافت اعلام کرد که مدلهای کلود (سونت 4.5، هایکو 4.5، اوپوس 4.1) اکنون از طریق همکاری با Anthropic و NVIDIA در Microsoft Foundry در دسترس هستند @Azure
- Cohere در WMT 2025 کامند اِی ترنسلیت را ارائه کرد که استاندارد صنعتی جدیدی را برای ترجمهی امن و آماده برای شرکتها تعیین میکند @cohere
تحلیل صنعت
- گوگل مزیت هزینهای در توسعهی مدلهای هوش مصنوعی را از طریق مالکیت سختافزار TPU، دسترسی به دادههای اختصاصی، و آموزش جمینای 3 به عنوان یک مدل ترکیبی از متخصصان از ابتدا، نشان میدهد که امکان قیمتگذاری رقابتی را فراهم میکند @deedydas
- Box گزارش میدهد که در آزمایش جمینای 3 پرو در مقابل جمینای 2.5 پرو در سناریوهای واقعی کسبوکار در خدمات مالی، حقوق، و مراقبتهای بهداشتی، 22 درصد بهبود در وظایف استدلال پیچیدهی سازمانی مشاهده شده است @levie
- Cursor در روز انتشار، عامل هوشمند پیشفرض خود را به جمینای 3 تغییر داد که اولین باری است که این شرکت احساس میکند مجبور به تغییر مدلها بلافاصله پس از راهاندازی شده است @beyang
- سم آلتمن به کاهش 300 برابری قیمت به ازای هر واحد هوش در طول یک سال به عنوان پایدارترین روند دستکمگرفتهشده در توسعهی هوش مصنوعی اشاره میکند @sama
- Lambda پس از قرارداد چند میلیارد دلاری مایکروسافت برای زیرساخت مرکز دادهی هوش مصنوعی، 1.5 میلیارد دلار سرمایه جذب کرد @TechCrunch
- Sphere با رهبری a16z، 21 میلیون دلار در سری A برای ساخت موتور انطباق مالیاتی فرامرزی مبتنی بر هوش مصنوعی جذب کرد که ثبتنام، محاسبه، بایگانی، و پرداخت را در بیش از 100 منطقه خودکار میکند @nrudder_
- Stack Overflow خود را به عنوان ارائهدهندهی دادههای هوش مصنوعی در میان تغییر چشمانداز توسعهدهندگان بازتعریف میکند @TechCrunch
- گرگلی اوروسز از گسترش IDEهای مبتنی بر هوش مصنوعی انتقاد میکند و بیش از 20 ابزار رقیب را فهرست میکند و استراتژی منسجم گوگل را پس از راهاندازی چندین پلتفرم توسعه در شش ماه زیر سوال میبرد @GergelyOrosz
اخلاق و جامعه
- کاربران گزارش میدهند که محتوای تولیدشده توسط هوش مصنوعی در سراسر پلتفرمهای اینترنتی از جمله لینکدین، ردیت، مقالات خبری، و نقدها گسترش یافته است و اشاره میکنند که مردم با محتوای بیکیفیت هوش مصنوعی درگیر میشوند در حالی که از منشأ مصنوعی آن بیخبرند @deedydas
- آندری کارپاتی در مورد دستکاری احتمالی معیارهای عمومی هوش مصنوعی از طریق حرکات پیچیده بر روی دادههای مجاور مجموعهی آزمایشی هشدار میدهد و به احتیاط توصیه میکند و آزمایش مستقیم مدل را به جای تکیه صرف بر نمرات معیارها پیشنهاد میکند @karpathy
- یان لایک گزارش میدهد که صنعت هوش مصنوعی، الکس بورز، عضو مجلس ایالتی نیویورک را که از لایحهی ایمنی هوش مصنوعی نیویورک حمایت کرده بود، به عنوان اولین هدف در کمپین سیاسی خود قرار داده است @janleike
- MIT Media Lab در مورد نیاز به تدابیر حفاظتی برای محافظت از دادههای عصبی بحث میکند، زیرا رابطهای مغز و کامپیوتر رایجتر و قدرتمندتر میشوند @medialab
- راشل توماس به 10 سال وبلاگنویسی در مورد اخلاق هوش مصنوعی میاندیشد و نگرانیهای مداوم در مورد آسیبهای ناشی از سیستمهای هوش مصنوعی که به طور غیرمسئولانه در مراقبتهای بهداشتی، اشتغال، و پلیس به کار گرفته میشوند را برجسته میکند @math_rachel
کاربردها
- گوگل جمینای ایجنت را برای مشترکین Google AI Ultra معرفی کرد که امکان خودکارسازی وظایف چندمرحلهای از جمله رزرو سفر، سازماندهی صندوق ورودی، و تعیین قرار ملاقات با تأیید کاربر قبل از اقدامات حیاتی را فراهم میکند @GeminiApp
- گوگل حالت هوش مصنوعی را در جستجو با پشتیبانی جمینای 3 راهاندازی کرد که شامل تجربههای رابط کاربری مولد با طرحبندیهای بصری پویا، ابزارهای تعاملی، و شبیهسازیهایی است که به طور خاص برای پرسوجوهای کاربر تولید میشوند @sundarpichai
- فیگما جمینای 3 پرو را در Figma Make ادغام کرد که به طراحان امکان میدهد جهتگیریهای بصری را بررسی کرده و نمونههای اولیه را با طیف گستردهای از سبکها، طرحبندیها، و تعاملات تولید کنند @zoink
- مایکروسافت Edge for Business را به عنوان اولین مرورگر هوش مصنوعی سازمانی امن جهان با حالت Copilot معرفی کرد که شامل اقدامات عاملمحور، تحلیل چند تب، و خلاصهسازی یوتیوب است @mustafasuleyman
- گوگل تجربهی خرید جمینای را با چرخوفلکهای محصول، نمودارهای مقایسه، بررسیهای عمیق با نظرات مشتریان، و لینکهای خرید مستقیم بهبود بخشید @GeminiApp
- آندری کارپاتی استفاده از LLMها را برای خواندن با رویکرد سهمرحلهای توصیف میکند: خواندن دستی، توضیح/خلاصهسازی، سپس پرسش و پاسخ، که منجر به درک عمیقتر از حرکت فوری میشود @karpathy
- سایمون ویلسون یک ضبط صوتی 3.5 ساعته از جلسهی شورا را با استفاده از جمینای 3 تحلیل کرد و کاربرد عملی درک زمینهی طولانی را نشان داد @simonw
- Replit تجربهی طراحی را با پشتیبانی جمینای 3.0 راهاندازی کرد که به عنوان اولین تجربهی طراحی هوش مصنوعی غیر بیکیفیت با تمرکز بر رابطهای کاربری زیبا توصیف میشود @amasad
پژوهشها
- اوریول وینیالز بهبودهای پیشآموزش را تأیید میکند که هیچ مانعی در دید نیست، و اشاره میکند که دلتای بین جمینای 2.5 و 3.0 بزرگترین دلتای مشاهدهشده تاکنون است، در حالی که پسآموزش همچنان یک زمینهی کاملاً جدید با فضای زیادی برای پیشرفت الگوریتمی است @OriolVinyalsML
- جمینای 3 پرو با دقت 73% در معیار ScreenSpot Pro به پیشرفتی دست یافت که دو برابر پیشرفتهترین مدلها برای درک اسکرینشاتها در برنامههای پیچیده از جمله AutoCAD و فتوشاپ است @deedydas
- جمینای 3 بهبود قابل توجهی در Vending-Bench Arena برای برنامهریزی بلندمدت و قابلیتهای فراخوانی ابزار نشان میدهد @OfficialLoganK
- جمینای 3 پرو بزرگترین دلتای ثبتشده در معیار Design Arena را به دست آورد که بهبود قابل توجهی در وظایف مرتبط با طراحی نشان میدهد @OfficialLoganK
- Physical Intelligence مقالهای منتشر کرد که نتایج چشمگیر یادگیری تقویتی در دنیای واقعی را با استفاده از مدل VLA از پیش آموزشدیده با مداخلات انسانی، آموزش تابع ارزش، و بهروزرسانیهای سیاست نشان میدهد @yjy0625
- Stanford NLP مدل CHURRO را منتشر کرد، یک مدل زبان-بینایی با وزن باز 3B که در OCR تاریخی از جمینای 2.5 پرو بهتر عمل میکند در حالی که 15.5 برابر مقرونبهصرفهتر است @sina_semnani
- فرانسوا شوله اشاره میکند که ARC-AGI برای اثبات اینکه LLMها مسیر AGI نیستند، طراحی شده بود، اما LLMها اکنون با جمینای 3 که به 31.1% میرسد، عملکرد قویای از خود نشان میدهند @dileeplearning
- گروک 4.1 هوش هیجانی و همدلی بالاتری را نشان میدهد و در EQ-Bench امتیاز 1586 را کسب میکند، با مهارتهای بینفردی بهبودیافته در مقایسه با مدلهای قبلی @xai
- تحقیقات MIT نشان میدهد که انتخاب دقیق دادهها میتواند راهحلهای بهینه را با مجموعههای دادهی کوچک تضمین کند و روشی را برای شناسایی دقیق دادههای مورد نیاز ارائه میدهد @MIT
- محققان MIT Media Lab از چارچوب Environment-Vulnerability-Decision-Technology با دادههای ماهوارهای برای ردیابی جنگلزدایی در غنا استفاده میکنند و نشان میدهند که چگونه فناوری فضایی از پیشرفتهای زیستمحیطی با رهبری آفریقا حمایت میکند @medialab