اخبار هوش مصنوعی در 2025-12-17

مدل‌های جدید هوش مصنوعی

  • گوگل دیپ‌مایند جمینای 3 فلش را منتشر کرد که استدلال در سطح حرفه‌ای را با تأخیر و کارایی در سطح فلش ترکیب می‌کند. هزینه‌ی آن 0.50 دلار ورودی و 3.00 دلار خروجی به ازای هر میلیون توکن است و در اکثر معیارهای ارزیابی از جمینای 2.5 پرو بهتر عمل می‌کند، در حالی که 3 برابر سریع‌تر است @GoogleDeepMind
  • جمینای 3 فلش در ARC-AGI-1 به امتیاز 84.7% و در ARC-AGI-2 به امتیاز 33.6% دست یافت که با هزینه‌ی بسیار کمتری نسبت به سایر مدل‌های پیشرفته، مرز جدیدی را در نسبت امتیاز به هزینه ایجاد می‌کند @arcprize
  • جمینای 3 فلش در شاخص هوش تحلیل مصنوعی (Artificial Analysis Intelligence Index) امتیاز 71 را کسب کرد که 13 امتیاز بهبود نسبت به جمینای 2.5 فلش است و آن را به باهوش‌ترین مدل در محدوده‌ی قیمتی خود تبدیل می‌کند، با وجود اینکه از 160 میلیون توکن (بیش از دو برابر 2.5 فلش) استفاده می‌کند @ArtificialAnlys
  • جمینای 3 فلش در جدول رده‌بندی LMArena رتبه‌ی 3 را کسب کرد و در بین 5 مدل برتر در دسته‌های متن، بینایی و توسعه‌ی وب قرار گرفت و آن را به مقرون‌به‌صرفه‌ترین مدل پیشرفته تبدیل کرد @arena
  • جمینای 3 فلش در SWE-bench Verified به عملکردی پیشرفته دست یافت و در وظایف کدنویسی از هر دو سری 2.5 و جمینای 3 پرو بهتر عمل کرد @GoogleDeepMind
  • جمینای 3 فلش در آزمون مربع ساتور کره‌ای (Korean Sator Square Test) امتیاز 161.8/190 را کسب کرد و در بین تمام مدل‌های آزمایش‌شده در رتبه‌ی دوم یا سوم قرار گرفت، با 60 امتیاز بهبود در استدلال نسبت به جمینای 2.5 فلش @Hangsiin
  • xAI رابط برنامه‌نویسی کاربردی (API) عامل صوتی Grok را راه‌اندازی کرد که با دقت 92.3% در Big Bench Audio رتبه‌ی 1 را کسب کرد و تقریباً 5 برابر سریع‌تر از نزدیک‌ترین رقیب خود با نرخ ثابت 0.05 دلار در دقیقه است @xai
  • اوپن‌ای‌آی ChatGPT Images را با پشتیبانی از GPT Image 1.5 منتشر کرد که دارای قابلیت‌های قوی‌تر در پیروی از دستورالعمل‌ها، ویرایش دقیق، حفظ جزئیات و 4 برابر سرعت بیشتر در تولید است و اکنون در صدر جدول رده‌بندی Image Arena قرار دارد @OpenAI
  • GPT-5 پرو طبق جدول رده‌بندی SEAL شرکت Scale AI، به عنوان بهترین مدل استدلالی سال 2025 رتبه‌بندی شد و در پاسخ به سؤالات پیچیده و حل مسائل چندمرحله‌ای عالی عمل می‌کند @scale_AI
  • GPT-5.2-xhigh بهبودهای کیفی قابل توجهی در Codex نشان می‌دهد که نشان‌دهنده‌ی جهشی بزرگ در قابلیت‌های کدنویسی است @jam3scampbell
  • مایکروسافت TRELLIS 2 را منتشر کرد، یک ترانسفورمر تطبیق جریان 4 میلیارد پارامتری که تصاویر تکی را به مش‌های سه‌بعدی با بافت تا رزولوشن 1536³ تبدیل می‌کند و با مجوز MIT به صورت متن‌باز منتشر شده است @_akhaliq
  • Browser Use مدل متن‌باز BU-30B-A3B-Preview را با 30 میلیارد پارامتر و 3 میلیارد پارامتر فعال منتشر کرد که به کیفیت پیشرفته‌ای برای عوامل وب با سرعت بی‌درنگ دست می‌یابد و صدها وظیفه‌ی مرورگر را با 1 دلار محاسبات امکان‌پذیر می‌سازد @gregpr07
  • اپل مدل Sharp را منتشر کرد که تصاویر را به پاشش‌های سه‌بعدی تبدیل می‌کند و به Hugging Face Enterprise با بیش از 150 مدل، مجموعه داده و برنامه‌ی به اشتراک گذاشته شده در پلتفرم پیوست @jeffboudier

تحلیل صنعت

  • آمازون تغییرات عمده‌ای در رهبری هوش مصنوعی خود اعلام کرد: پیتر دیسانتیس سازمان جدید هوش مصنوعی آمازون را شامل تیم AGI، توسعه‌ی سیلیکون و محاسبات کوانتومی رهبری خواهد کرد، در حالی که رئیس فعلی هوش مصنوعی، روهیت پراساد، از سمت خود کناره‌گیری می‌کند؛ پیتر آبیل به عنوان رئیس جدید AGI منصوب شد @haydenfield
  • آمازون طبق گزارش‌ها در حال مذاکره برای سرمایه‌گذاری 10 میلیارد دلاری در اوپن‌ای‌آی است، زیرا معاملات چرخشی بین شرکت‌های فناوری همچنان محبوب هستند @TechCrunch
  • کورسیرا و یودمی توافقنامه‌ی ادغام به ارزش حدود 2.5 میلیارد دلار را امضا کردند @TechCrunch
  • گیت‌هاب با واکنش منفی توسعه‌دهندگان به دلیل برنامه‌ی خود برای دریافت هزینه از اجراکننده‌های GitHub Actions خودمیزبان مواجه شد و بعداً تغییر صورت‌حساب را به تعویق انداخت تا رویکرد خود را پس از بازخورد جامعه بازنگری کند @github
  • گیت‌هاب بدون مدیرعامل فعالیت می‌کند پس از اینکه مایکروسافت هرگز توماس دومکه را جایگزین نکرد و اکنون به گروه "CoreAI" گزارش می‌دهد، که نگرانی‌هایی را در مورد از دست دادن ارتباط با جامعه‌ی توسعه‌دهندگان ایجاد می‌کند @GergelyOrosz
  • ورشو به عنوان یک مرکز مهندسی بزرگ اروپایی با دفاتر اوپن‌ای‌آی، میسترال ای‌آی، ElevenLabs، گوگل، انویدیا، نتفلیکس، متا و سایر شرکت‌های برتر فناوری ظاهر می‌شود @michuk
  • پرپلکسیتی اپلیکیشن بومی آی‌پد را منتشر کرد که برای iPadOS بهینه‌سازی شده است و برای کارهای واقعی با ویژگی‌های دسکتاپ از جمله پشتیبانی از چندوظیفگی از طریق Stage Manager طراحی شده است @perplexity_ai
  • Cursor جمینای 3 فلش را به پلتفرم خود اضافه کرد و دریافت که برای بررسی سریع باگ‌ها به خوبی کار می‌کند @cursor_ai
  • فیگما جمینای 3 فلش را در Figma Make ادغام کرد و نتایج فوق‌العاده سریعی را ارائه می‌دهد که اکثر درخواست‌ها در 30-60 ثانیه بازگردانده می‌شوند @figma
  • هیئت مدیره‌ی مونزو طبق گزارش‌ها، مدیرعامل آنیل را به دلیل اختلاف نظر در مورد زمان‌بندی عرضه‌ی اولیه‌ی سهام (IPO) برکنار کرد @TechCrunch
  • Rad Power Bikes اعلام ورشکستگی کرد و به دنبال فروش کسب‌وکار است @TechCrunch
  • متا برنامه‌ی خود را برای به اشتراک گذاشتن Horizon OS کوئست با تولیدکنندگان هدست‌های شخص ثالث متوقف کرد @TechCrunch
  • یوتیوب از سال 2029 به طور انحصاری اسکار را پخش خواهد کرد @TechCrunch
  • یان لکون در پایان سال متا را ترک می‌کند تا استارتاپی را با تمرکز بر مدل‌های جهانی راه‌اندازی کند - سیستم‌های هوش مصنوعی که با مشاهده و شبیه‌سازی محیط‌های فیزیکی یاد می‌گیرند @NYUDataScience

کاربردها

  • 67% از پزشکان روزانه از هوش مصنوعی استفاده می‌کنند، 84% می‌گویند که هوش مصنوعی آن‌ها را به پزشکان بهتری تبدیل می‌کند و 42% می‌گویند که هوش مصنوعی باعث می‌شود بیشتر بخواهند در پزشکی بمانند، با موارد استفاده‌ی اصلی که وظایف اداری و کمک به تحقیق هستند @emollick
  • GPT-5 در بهینه‌سازی آزمایش‌های آزمایشگاهی مرطوب ارزیابی شد و توانایی بهبود پروتکل‌های تجربی را با خلبان ربات خودمختار برای اجرای پروتکل‌های شبیه‌سازی گیبسون از زبان طبیعی نشان داد @MilesKWang
  • Product Intelligence شرکت Linear در ماه‌های اخیر 350 هزار پیشنهاد پذیرفته شده را تکمیل کرده و 26 هزار مسئله را اختصاص داده است که به تیم‌ها در یافتن موارد تکراری، افزودن ویژگی‌ها و هدایت مسائل به فرد مناسب کمک می‌کند @karrisaarinen
  • لئونا 14 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z برای ساخت سیستم عامل بومی هوش مصنوعی برای ارائه‌دهندگان مراقبت‌های بهداشتی که در واتس‌اپ تعبیه شده است، جمع‌آوری کرد و میلیون‌ها تعامل بیمار را در سراسر آمریکای لاتین پردازش می‌کند @Leona_health
  • فیسیا (توزیع‌کننده‌ی نایکی در برزیل) با استفاده از فناوری امتحان مجازی مبتنی بر انویدیا، 150% افزایش در تبدیل‌های درون فروشگاهی، 45% افزایش در اندازه‌ی متوسط سفارش و 128% بازگشت سرمایه (ROI) را به دست آورد @NVIDIAAI
  • محققان MIT سیستم گفتار به واقعیت را توسعه دادند که هوش مصنوعی مولد را با مونتاژ رباتیک ترکیب می‌کند تا اشیاء فیزیکی از جمله مبلمان و دکور را در عرض چند دقیقه ایجاد کند @medialab
  • Marble شرکت World Labs به محققان امکان می‌دهد محیط‌های رباتیک آماده‌ی شبیه‌سازی را تولید کنند که با NVIDIA Isaac Sim برای آموزش و ارزیابی بدون نیاز به تنظیم دستی ادغام می‌شوند @theworldlabs
  • Arcway موتور سه‌بعدی بی‌درنگ را راه‌اندازی کرد که در آن هر کسی می‌تواند خانه‌ها را طراحی کند و به خریداران امکان می‌دهد فضاها را کاوش کنند، مواد را تغییر دهند، مبلمان را بچینند و پروژه‌های ساختمانی را تجسم کنند @calebarclay

پژوهش‌ها

  • پژوهش متا چارچوب Parallel-Distill-Refine (PDR) را معرفی می‌کند که نشان می‌دهد موازی‌سازی و تقطیر استراتژیک می‌تواند از گسترش توالی با نیروی بی‌رحمانه بهتر عمل کند و به دقت 93.3% در AIME 2024 در مقابل 79.4% برای زنجیره‌ی فکری طولانی استاندارد با تأخیر یکسان دست یابد @prfsanjeevarora
  • Physical Intelligence خاصیت نوظهوری را در VLAها (π0/π0.5/π0.6) کشف می‌کند: با افزایش مقیاس پیش‌آموزش، مدل‌ها یاد می‌گیرند که ویدئوهای انسانی و داده‌های ربات را هم‌تراز کنند و پس از برقراری کنترل ربات، یادگیری طبیعی از ویدئوهای انسانی را امکان‌پذیر می‌سازند <a href="https://x.com/physical_int/status/200109620045669211