اخبار هوش مصنوعی در 2025-12-17
مدلهای جدید هوش مصنوعی
- گوگل دیپمایند جمینای 3 فلش را منتشر کرد که استدلال در سطح حرفهای را با تأخیر و کارایی در سطح فلش ترکیب میکند. هزینهی آن 0.50 دلار ورودی و 3.00 دلار خروجی به ازای هر میلیون توکن است و در اکثر معیارهای ارزیابی از جمینای 2.5 پرو بهتر عمل میکند، در حالی که 3 برابر سریعتر است @GoogleDeepMind
- جمینای 3 فلش در ARC-AGI-1 به امتیاز 84.7% و در ARC-AGI-2 به امتیاز 33.6% دست یافت که با هزینهی بسیار کمتری نسبت به سایر مدلهای پیشرفته، مرز جدیدی را در نسبت امتیاز به هزینه ایجاد میکند @arcprize
- جمینای 3 فلش در شاخص هوش تحلیل مصنوعی (Artificial Analysis Intelligence Index) امتیاز 71 را کسب کرد که 13 امتیاز بهبود نسبت به جمینای 2.5 فلش است و آن را به باهوشترین مدل در محدودهی قیمتی خود تبدیل میکند، با وجود اینکه از 160 میلیون توکن (بیش از دو برابر 2.5 فلش) استفاده میکند @ArtificialAnlys
- جمینای 3 فلش در جدول ردهبندی LMArena رتبهی 3 را کسب کرد و در بین 5 مدل برتر در دستههای متن، بینایی و توسعهی وب قرار گرفت و آن را به مقرونبهصرفهترین مدل پیشرفته تبدیل کرد @arena
- جمینای 3 فلش در SWE-bench Verified به عملکردی پیشرفته دست یافت و در وظایف کدنویسی از هر دو سری 2.5 و جمینای 3 پرو بهتر عمل کرد @GoogleDeepMind
- جمینای 3 فلش در آزمون مربع ساتور کرهای (Korean Sator Square Test) امتیاز 161.8/190 را کسب کرد و در بین تمام مدلهای آزمایششده در رتبهی دوم یا سوم قرار گرفت، با 60 امتیاز بهبود در استدلال نسبت به جمینای 2.5 فلش @Hangsiin
- xAI رابط برنامهنویسی کاربردی (API) عامل صوتی Grok را راهاندازی کرد که با دقت 92.3% در Big Bench Audio رتبهی 1 را کسب کرد و تقریباً 5 برابر سریعتر از نزدیکترین رقیب خود با نرخ ثابت 0.05 دلار در دقیقه است @xai
- اوپنایآی ChatGPT Images را با پشتیبانی از GPT Image 1.5 منتشر کرد که دارای قابلیتهای قویتر در پیروی از دستورالعملها، ویرایش دقیق، حفظ جزئیات و 4 برابر سرعت بیشتر در تولید است و اکنون در صدر جدول ردهبندی Image Arena قرار دارد @OpenAI
- GPT-5 پرو طبق جدول ردهبندی SEAL شرکت Scale AI، به عنوان بهترین مدل استدلالی سال 2025 رتبهبندی شد و در پاسخ به سؤالات پیچیده و حل مسائل چندمرحلهای عالی عمل میکند @scale_AI
- GPT-5.2-xhigh بهبودهای کیفی قابل توجهی در Codex نشان میدهد که نشاندهندهی جهشی بزرگ در قابلیتهای کدنویسی است @jam3scampbell
- مایکروسافت TRELLIS 2 را منتشر کرد، یک ترانسفورمر تطبیق جریان 4 میلیارد پارامتری که تصاویر تکی را به مشهای سهبعدی با بافت تا رزولوشن 1536³ تبدیل میکند و با مجوز MIT به صورت متنباز منتشر شده است @_akhaliq
- Browser Use مدل متنباز BU-30B-A3B-Preview را با 30 میلیارد پارامتر و 3 میلیارد پارامتر فعال منتشر کرد که به کیفیت پیشرفتهای برای عوامل وب با سرعت بیدرنگ دست مییابد و صدها وظیفهی مرورگر را با 1 دلار محاسبات امکانپذیر میسازد @gregpr07
- اپل مدل Sharp را منتشر کرد که تصاویر را به پاششهای سهبعدی تبدیل میکند و به Hugging Face Enterprise با بیش از 150 مدل، مجموعه داده و برنامهی به اشتراک گذاشته شده در پلتفرم پیوست @jeffboudier
تحلیل صنعت
- آمازون تغییرات عمدهای در رهبری هوش مصنوعی خود اعلام کرد: پیتر دیسانتیس سازمان جدید هوش مصنوعی آمازون را شامل تیم AGI، توسعهی سیلیکون و محاسبات کوانتومی رهبری خواهد کرد، در حالی که رئیس فعلی هوش مصنوعی، روهیت پراساد، از سمت خود کنارهگیری میکند؛ پیتر آبیل به عنوان رئیس جدید AGI منصوب شد @haydenfield
- آمازون طبق گزارشها در حال مذاکره برای سرمایهگذاری 10 میلیارد دلاری در اوپنایآی است، زیرا معاملات چرخشی بین شرکتهای فناوری همچنان محبوب هستند @TechCrunch
- کورسیرا و یودمی توافقنامهی ادغام به ارزش حدود 2.5 میلیارد دلار را امضا کردند @TechCrunch
- گیتهاب با واکنش منفی توسعهدهندگان به دلیل برنامهی خود برای دریافت هزینه از اجراکنندههای GitHub Actions خودمیزبان مواجه شد و بعداً تغییر صورتحساب را به تعویق انداخت تا رویکرد خود را پس از بازخورد جامعه بازنگری کند @github
- گیتهاب بدون مدیرعامل فعالیت میکند پس از اینکه مایکروسافت هرگز توماس دومکه را جایگزین نکرد و اکنون به گروه "CoreAI" گزارش میدهد، که نگرانیهایی را در مورد از دست دادن ارتباط با جامعهی توسعهدهندگان ایجاد میکند @GergelyOrosz
- ورشو به عنوان یک مرکز مهندسی بزرگ اروپایی با دفاتر اوپنایآی، میسترال ایآی، ElevenLabs، گوگل، انویدیا، نتفلیکس، متا و سایر شرکتهای برتر فناوری ظاهر میشود @michuk
- پرپلکسیتی اپلیکیشن بومی آیپد را منتشر کرد که برای iPadOS بهینهسازی شده است و برای کارهای واقعی با ویژگیهای دسکتاپ از جمله پشتیبانی از چندوظیفگی از طریق Stage Manager طراحی شده است @perplexity_ai
- Cursor جمینای 3 فلش را به پلتفرم خود اضافه کرد و دریافت که برای بررسی سریع باگها به خوبی کار میکند @cursor_ai
- فیگما جمینای 3 فلش را در Figma Make ادغام کرد و نتایج فوقالعاده سریعی را ارائه میدهد که اکثر درخواستها در 30-60 ثانیه بازگردانده میشوند @figma
- هیئت مدیرهی مونزو طبق گزارشها، مدیرعامل آنیل را به دلیل اختلاف نظر در مورد زمانبندی عرضهی اولیهی سهام (IPO) برکنار کرد @TechCrunch
- Rad Power Bikes اعلام ورشکستگی کرد و به دنبال فروش کسبوکار است @TechCrunch
- متا برنامهی خود را برای به اشتراک گذاشتن Horizon OS کوئست با تولیدکنندگان هدستهای شخص ثالث متوقف کرد @TechCrunch
- یوتیوب از سال 2029 به طور انحصاری اسکار را پخش خواهد کرد @TechCrunch
- یان لکون در پایان سال متا را ترک میکند تا استارتاپی را با تمرکز بر مدلهای جهانی راهاندازی کند - سیستمهای هوش مصنوعی که با مشاهده و شبیهسازی محیطهای فیزیکی یاد میگیرند @NYUDataScience
کاربردها
- 67% از پزشکان روزانه از هوش مصنوعی استفاده میکنند، 84% میگویند که هوش مصنوعی آنها را به پزشکان بهتری تبدیل میکند و 42% میگویند که هوش مصنوعی باعث میشود بیشتر بخواهند در پزشکی بمانند، با موارد استفادهی اصلی که وظایف اداری و کمک به تحقیق هستند @emollick
- GPT-5 در بهینهسازی آزمایشهای آزمایشگاهی مرطوب ارزیابی شد و توانایی بهبود پروتکلهای تجربی را با خلبان ربات خودمختار برای اجرای پروتکلهای شبیهسازی گیبسون از زبان طبیعی نشان داد @MilesKWang
- Product Intelligence شرکت Linear در ماههای اخیر 350 هزار پیشنهاد پذیرفته شده را تکمیل کرده و 26 هزار مسئله را اختصاص داده است که به تیمها در یافتن موارد تکراری، افزودن ویژگیها و هدایت مسائل به فرد مناسب کمک میکند @karrisaarinen
- لئونا 14 میلیون دلار سرمایهی اولیه را به رهبری a16z برای ساخت سیستم عامل بومی هوش مصنوعی برای ارائهدهندگان مراقبتهای بهداشتی که در واتساپ تعبیه شده است، جمعآوری کرد و میلیونها تعامل بیمار را در سراسر آمریکای لاتین پردازش میکند @Leona_health
- فیسیا (توزیعکنندهی نایکی در برزیل) با استفاده از فناوری امتحان مجازی مبتنی بر انویدیا، 150% افزایش در تبدیلهای درون فروشگاهی، 45% افزایش در اندازهی متوسط سفارش و 128% بازگشت سرمایه (ROI) را به دست آورد @NVIDIAAI
- محققان MIT سیستم گفتار به واقعیت را توسعه دادند که هوش مصنوعی مولد را با مونتاژ رباتیک ترکیب میکند تا اشیاء فیزیکی از جمله مبلمان و دکور را در عرض چند دقیقه ایجاد کند @medialab
- Marble شرکت World Labs به محققان امکان میدهد محیطهای رباتیک آمادهی شبیهسازی را تولید کنند که با NVIDIA Isaac Sim برای آموزش و ارزیابی بدون نیاز به تنظیم دستی ادغام میشوند @theworldlabs
- Arcway موتور سهبعدی بیدرنگ را راهاندازی کرد که در آن هر کسی میتواند خانهها را طراحی کند و به خریداران امکان میدهد فضاها را کاوش کنند، مواد را تغییر دهند، مبلمان را بچینند و پروژههای ساختمانی را تجسم کنند @calebarclay
پژوهشها
- پژوهش متا چارچوب Parallel-Distill-Refine (PDR) را معرفی میکند که نشان میدهد موازیسازی و تقطیر استراتژیک میتواند از گسترش توالی با نیروی بیرحمانه بهتر عمل کند و به دقت 93.3% در AIME 2024 در مقابل 79.4% برای زنجیرهی فکری طولانی استاندارد با تأخیر یکسان دست یابد @prfsanjeevarora
- Physical Intelligence خاصیت نوظهوری را در VLAها (π0/π0.5/π0.6) کشف میکند: با افزایش مقیاس پیشآموزش، مدلها یاد میگیرند که ویدئوهای انسانی و دادههای ربات را همتراز کنند و پس از برقراری کنترل ربات، یادگیری طبیعی از ویدئوهای انسانی را امکانپذیر میسازند <a href="https://x.com/physical_int/status/200109620045669211