اخبار هوش مصنوعی در 2025-12-17

مدل‌های جدید هوش مصنوعی

  • گوگل دیپ‌مایند جمینای 3 فلش را منتشر کرد که استدلال در سطح حرفه‌ای را با تأخیر و کارایی در سطح فلش ترکیب می‌کند. هزینه‌ی آن 0.50 دلار ورودی و 3.00 دلار خروجی به ازای هر میلیون توکن است و در اکثر معیارهای ارزیابی از جمینای 2.5 پرو بهتر عمل می‌کند، در حالی که 3 برابر سریع‌تر است @GoogleDeepMind
  • جمینای 3 فلش در ARC-AGI-1 به امتیاز 84.7% و در ARC-AGI-2 به امتیاز 33.6% دست یافت که با هزینه‌ی بسیار کمتری نسبت به سایر مدل‌های پیشرفته، مرز جدیدی را در نسبت امتیاز به هزینه ایجاد می‌کند @arcprize
  • جمینای 3 فلش در شاخص هوش تحلیل مصنوعی (Artificial Analysis Intelligence Index) امتیاز 71 را کسب کرد که 13 امتیاز بهبود نسبت به جمینای 2.5 فلش است و آن را به باهوش‌ترین مدل در محدوده‌ی قیمتی خود تبدیل می‌کند، با وجود اینکه از 160 میلیون توکن (بیش از دو برابر 2.5 فلش) استفاده می‌کند @ArtificialAnlys
  • جمینای 3 فلش در جدول رده‌بندی LMArena رتبه‌ی 3 را کسب کرد و در بین 5 مدل برتر در دسته‌های متن، بینایی و توسعه‌ی وب قرار گرفت و آن را به مقرون‌به‌صرفه‌ترین مدل پیشرفته تبدیل کرد @arena
  • جمینای 3 فلش در SWE-bench Verified به عملکردی پیشرفته دست یافت و در وظایف کدنویسی از هر دو سری 2.5 و جمینای 3 پرو بهتر عمل کرد @GoogleDeepMind
  • جمینای 3 فلش در آزمون مربع ساتور کره‌ای (Korean Sator Square Test) امتیاز 161.8/190 را کسب کرد و در بین تمام مدل‌های آزمایش‌شده در رتبه‌ی دوم یا سوم قرار گرفت، با 60 امتیاز بهبود در استدلال نسبت به جمینای 2.5 فلش @Hangsiin
  • xAI رابط برنامه‌نویسی کاربردی (API) عامل صوتی Grok را راه‌اندازی کرد که با دقت 92.3% در Big Bench Audio رتبه‌ی 1 را کسب کرد و تقریباً 5 برابر سریع‌تر از نزدیک‌ترین رقیب خود با نرخ ثابت 0.05 دلار در دقیقه است @xai
  • اوپن‌ای‌آی ChatGPT Images را با پشتیبانی از GPT Image 1.5 منتشر کرد که دارای قابلیت‌های قوی‌تر در پیروی از دستورالعمل‌ها، ویرایش دقیق، حفظ جزئیات و 4 برابر سرعت بیشتر در تولید است و اکنون در صدر جدول رده‌بندی Image Arena قرار دارد @OpenAI
  • GPT-5 پرو طبق جدول رده‌بندی SEAL شرکت Scale AI، به عنوان بهترین مدل استدلالی سال 2025 رتبه‌بندی شد و در پاسخ به سؤالات پیچیده و حل مسائل چندمرحله‌ای عالی عمل می‌کند @scale_AI
  • GPT-5.2-xhigh بهبودهای کیفی قابل توجهی در Codex نشان می‌دهد که نشان‌دهنده‌ی جهشی بزرگ در قابلیت‌های کدنویسی است @jam3scampbell
  • مایکروسافت TRELLIS 2 را منتشر کرد، یک ترانسفورمر تطبیق جریان 4 میلیارد پارامتری که تصاویر تکی را به مش‌های سه‌بعدی با بافت تا رزولوشن 1536³ تبدیل می‌کند و با مجوز MIT به صورت متن‌باز منتشر شده است @_akhaliq
  • Browser Use مدل متن‌باز BU-30B-A3B-Preview را با 30 میلیارد پارامتر و 3 میلیارد پارامتر فعال منتشر کرد که به کیفیت پیشرفته‌ای برای عوامل وب با سرعت بی‌درنگ دست می‌یابد و صدها وظیفه‌ی مرورگر را با 1 دلار محاسبات امکان‌پذیر می‌سازد @gregpr07
  • اپل مدل Sharp را منتشر کرد که تصاویر را به پاشش‌های سه‌بعدی تبدیل می‌کند و به Hugging Face Enterprise با بیش از 150 مدل، مجموعه داده و برنامه‌ی به اشتراک گذاشته شده در پلتفرم پیوست @jeffboudier

تحلیل صنعت

  • آمازون تغییرات عمده‌ای در رهبری هوش مصنوعی خود اعلام کرد: پیتر دیسانتیس سازمان جدید هوش مصنوعی آمازون را شامل تیم AGI، توسعه‌ی سیلیکون و محاسبات کوانتومی رهبری خواهد کرد، در حالی که رئیس فعلی هوش مصنوعی، روهیت پراساد، از سمت خود کناره‌گیری می‌کند؛ پیتر آبیل به عنوان رئیس جدید AGI منصوب شد @haydenfield
  • آمازون طبق گزارش‌ها در حال مذاکره برای سرمایه‌گذاری 10 میلیارد دلاری در اوپن‌ای‌آی است، زیرا معاملات چرخشی بین شرکت‌های فناوری همچنان محبوب هستند @TechCrunch
  • کورسیرا و یودمی توافقنامه‌ی ادغام به ارزش حدود 2.5 میلیارد دلار را امضا کردند @TechCrunch
  • گیت‌هاب با واکنش منفی توسعه‌دهندگان به دلیل برنامه‌ی خود برای دریافت هزینه از اجراکننده‌های GitHub Actions خودمیزبان مواجه شد و بعداً تغییر صورت‌حساب را به تعویق انداخت تا رویکرد خود را پس از بازخورد جامعه بازنگری کند @github
  • گیت‌هاب بدون مدیرعامل فعالیت می‌کند پس از اینکه مایکروسافت هرگز توماس دومکه را جایگزین نکرد و اکنون به گروه "CoreAI" گزارش می‌دهد، که نگرانی‌هایی را در مورد از دست دادن ارتباط با جامعه‌ی توسعه‌دهندگان ایجاد می‌کند @GergelyOrosz
  • ورشو به عنوان یک مرکز مهندسی بزرگ اروپایی با دفاتر اوپن‌ای‌آی، میسترال ای‌آی، ElevenLabs، گوگل، انویدیا، نتفلیکس، متا و سایر شرکت‌های برتر فناوری ظاهر می‌شود @michuk
  • پرپلکسیتی اپلیکیشن بومی آی‌پد را منتشر کرد که برای iPadOS بهینه‌سازی شده است و برای کارهای واقعی با ویژگی‌های دسکتاپ از جمله پشتیبانی از چندوظیفگی از طریق Stage Manager طراحی شده است @perplexity_ai
  • Cursor جمینای 3 فلش را به پلتفرم خود اضافه کرد و دریافت که برای بررسی سریع باگ‌ها به خوبی کار می‌کند @cursor_ai
  • فیگما جمینای 3 فلش را در Figma Make ادغام کرد و نتایج فوق‌العاده سریعی را ارائه می‌دهد که اکثر درخواست‌ها در 30-60 ثانیه بازگردانده می‌شوند @figma
  • هیئت مدیره‌ی مونزو طبق گزارش‌ها، مدیرعامل آنیل را به دلیل اختلاف نظر در مورد زمان‌بندی عرضه‌ی اولیه‌ی سهام (IPO) برکنار کرد @TechCrunch
  • Rad Power Bikes اعلام ورشکستگی کرد و به دنبال فروش کسب‌وکار است @TechCrunch
  • متا برنامه‌ی خود را برای به اشتراک گذاشتن Horizon OS کوئست با تولیدکنندگان هدست‌های شخص ثالث متوقف کرد @TechCrunch
  • یوتیوب از سال 2029 به طور انحصاری اسکار را پخش خواهد کرد @TechCrunch
  • یان لکون در پایان سال متا را ترک می‌کند تا استارتاپی را با تمرکز بر مدل‌های جهانی راه‌اندازی کند - سیستم‌های هوش مصنوعی که با مشاهده و شبیه‌سازی محیط‌های فیزیکی یاد می‌گیرند @NYUDataScience

کاربردها

  • 67% از پزشکان روزانه از هوش مصنوعی استفاده می‌کنند، 84% می‌گویند که هوش مصنوعی آن‌ها را به پزشکان بهتری تبدیل می‌کند و 42% می‌گویند که هوش مصنوعی باعث می‌شود بیشتر بخواهند در پزشکی بمانند، با موارد استفاده‌ی اصلی که وظایف اداری و کمک به تحقیق هستند @emollick
  • GPT-5 در بهینه‌سازی آزمایش‌های آزمایشگاهی مرطوب ارزیابی شد و توانایی بهبود پروتکل‌های تجربی را با خلبان ربات خودمختار برای اجرای پروتکل‌های شبیه‌سازی گیبسون از زبان طبیعی نشان داد @MilesKWang
  • Product Intelligence شرکت Linear در ماه‌های اخیر 350 هزار پیشنهاد پذیرفته شده را تکمیل کرده و 26 هزار مسئله را اختصاص داده است که به تیم‌ها در یافتن موارد تکراری، افزودن ویژگی‌ها و هدایت مسائل به فرد مناسب کمک می‌کند @karrisaarinen
  • لئونا 14 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z برای ساخت سیستم عامل بومی هوش مصنوعی برای ارائه‌دهندگان مراقبت‌های بهداشتی که در واتس‌اپ تعبیه شده است، جمع‌آوری کرد و میلیون‌ها تعامل بیمار را در سراسر آمریکای لاتین پردازش می‌کند @Leona_health
  • فیسیا (توزیع‌کننده‌ی نایکی در برزیل) با استفاده از فناوری امتحان مجازی مبتنی بر انویدیا، 150% افزایش در تبدیل‌های درون فروشگاهی، 45% افزایش در اندازه‌ی متوسط سفارش و 128% بازگشت سرمایه (ROI) را به دست آورد @NVIDIAAI
  • محققان MIT سیستم گفتار به واقعیت را توسعه دادند که هوش مصنوعی مولد را با مونتاژ رباتیک ترکیب می‌کند تا اشیاء فیزیکی از جمله مبلمان و دکور را در عرض چند دقیقه ایجاد کند @medialab
  • Marble شرکت World Labs به محققان امکان می‌دهد محیط‌های رباتیک آماده‌ی شبیه‌سازی را تولید کنند که با NVIDIA Isaac Sim برای آموزش و ارزیابی بدون نیاز به تنظیم دستی ادغام می‌شوند @theworldlabs
  • Arcway موتور سه‌بعدی بی‌درنگ را راه‌اندازی کرد که در آن هر کسی می‌تواند خانه‌ها را طراحی کند و به خریداران امکان می‌دهد فضاها را کاوش کنند، مواد را تغییر دهند، مبلمان را بچینند و پروژه‌های ساختمانی را تجسم کنند @calebarclay

پژوهش‌ها

  • پژوهش متا چارچوب Parallel-Distill-Refine (PDR) را معرفی می‌کند که نشان می‌دهد موازی‌سازی و تقطیر استراتژیک می‌تواند از گسترش توالی با نیروی بی‌رحمانه بهتر عمل کند و به دقت 93.3% در AIME 2024 در مقابل 79.4% برای زنجیره‌ی فکری طولانی استاندارد با تأخیر یکسان دست یابد @prfsanjeevarora
  • Physical Intelligence خاصیت نوظهوری را در VLAها (π0/π0.5/π0.6) کشف می‌کند: با افزایش مقیاس پیش‌آموزش، مدل‌ها یاد می‌گیرند که ویدئوهای انسانی و داده‌های ربات را هم‌تراز کنند و پس از برقراری کنترل ربات، یادگیری طبیعی از ویدئوهای انسانی را امکان‌پذیر می‌سازند <a href="https://x.com/physical_int/status/200109620045669211

اخبار هوش مصنوعی در 2025-12-16

مدل‌های جدید هوش مصنوعی

  • متا (Meta) مدل SAM Audio را منتشر کرد؛ اولین مدل یکپارچه که هر صدایی را از ترکیب‌های صوتی پیچیده با استفاده از دستورات متنی، بصری یا بازه‌ای جدا می‌کند و از مدل‌های قبلی در معیارهای مختلف بهتر عمل می‌کند. @AIatMeta
  • گوگل دیپ‌مایند (Google DeepMind) مدل به‌روزرسانی‌شده‌ی Gemini 2.5 Flash Native Audio را برای عامل‌های صوتی زنده با قابلیت پیروی از دستورات بهبودیافته و مکالمات طبیعی‌تر منتشر کرد. @GoogleDeepMind
  • اوپن‌ای‌آی (OpenAI) ChatGPT Images 1.5 را با قابلیت پیروی از دستورات قوی‌تر، ویرایش دقیق، حفظ جزئیات و سرعت تولید ۴ برابر سریع‌تر معرفی کرد. @OpenAI
  • انویدیا (NVIDIA) خانواده‌ی مدل‌های استدلالی Nemotron-Cascade را منتشر کرد که با یادگیری تقویتی آبشاری و دامنه‌ای آموزش دیده‌اند. مدل ۱۴B این خانواده از DeepSeek-R1-0528 (671B) در LiveCodeBench پیشی گرفته و عملکرد مدال نقره را در IOI 2025 کسب کرده است. @_weiping
  • Ai2 مدل Molmo 2 را منتشر کرد که قابلیت‌های چندوجهی مبتنی بر ویدئو را به ارمغان می‌آورد و در بسیاری از معیارهای چالش‌برانگیز ویدئویی صنعتی، از مدل‌های باز پیشی می‌گیرد. @allen_ai
  • شیائومی (Xiaomi) مدل MiMo-V2-Flash را منتشر کرد که از طریق تقطیر چندمعلمی بر اساس سیاست (MOPD) آموزش دیده و با استفاده از ۱/۵۰ توان محاسباتی، عملکردی هم‌تراز با تمام معلم‌های متخصص در حوزه‌های خود به دست آورده است. @XiaomiMiMo

تحلیل صنعت

  • دور جدید سرمایه‌گذاری استارتاپ کدنویسی احساسی سوئدی Lovable، ارزش آن را به ۶.۶ میلیارد دلار رساند که بیش از سه برابر ارزش آن در پنج ماه پیش است. @AndrewCurran_
  • دیتابریکس (Databricks) با داغ شدن کسب‌وکار هوش مصنوعی خود، ۴ میلیارد دلار با ارزش ۱۳۴ میلیارد دلار جذب سرمایه کرد. @TechCrunch
  • Adaptive Security از جذب ۸۱ میلیون دلار در سری B با مشارکت انویدیا، Bain Capital VC و دیگران برای محافظت از سازمان‌ها در برابر حملات سایبری مبتنی بر هوش مصنوعی خبر داد. @AdaptiveSec
  • جورج آزبورن (George Osborne) به عنوان مدیر عامل و رئیس OpenAI برای کشورها، مستقر در لندن، به اوپن‌ای‌آی پیوست تا به جوامع در سراسر جهان در به اشتراک گذاشتن فرصت‌های هوش مصنوعی کمک کند. @George_Osborne
  • تخمین زده می‌شود که آزمایشگاه‌های پیشرو، توان محاسباتی پژوهشی بیشتری نسبت به مجموع تمام مؤسسات دانشگاهی در ایالات متحده دارند که نشان‌دهنده‌ی رویکرد نیروی بی‌رحمانه به جای استفاده‌ی کارآمد از محاسبات است. @natolambert
  • شرکت‌های فناوری به طور فزاینده‌ای برای نقش‌های «داستان‌گویی» استخدام می‌کنند، با دو برابر شدن موقعیت‌ها در پست‌های شغلی لینکدین از سال گذشته، که نشان‌دهنده‌ی تغییر به سمت توزیع روایت‌های اختصاصی است. @N_Sportelli
  • خبرنگاران در برخی رسانه‌ها با حداقل سهمیه‌ی ۳ «خبر اختصاصی» در هفته در صنعت هوش مصنوعی مواجه هستند که منجر به چارچوب‌بندی دراماتیک داستان‌های پیش‌پاافتاده می‌شود. @joannejang

اخلاق و جامعه

  • ایتان مولیک (Ethan Mollick) نشان می‌دهد که تمایز تصاویر تولیدشده توسط هوش مصنوعی از محتوای واقعی همچنان بسیار دشوار است، با این حال مردم همچنان بدون تأیید، تصاویری را که از دیدگاه‌هایشان حمایت می‌کنند، باور می‌کنند. @emollick
  • محققان استنفورد از هوش مصنوعی برای تجزیه و تحلیل تصاویر گوگل استریت ویو در ۱۶ ایالت استفاده کردند و نشان دادند که ۳۷ درصد از ساختمان‌های آسیب‌دیده در مناطق فقیرنشین برای سال‌ها به زمین‌های خالی تبدیل شدند، در حالی که ۸۲ درصد در مناطق ثروتمندتر، بزرگ‌تر و بهتر بازسازی شدند. @StanfordHAI
  • عادات مطالعه تغییر چشمگیری را نشان می‌دهد، به طوری که اکنون تعداد غیرخوانندگان ۳ به ۱ از خوانندگان بیشتر است، که نسبت ۲ به ۱ قبلی به نفع خوانندگان را معکوس کرده است. @paulg
  • یک سوم دختران کلاس هشتم، ۷ ساعت یا بیشتر در روز را در شبکه‌های اجتماعی می‌گذرانند که تقریباً تمام فعالیت روزانه‌ی آن‌ها را تشکیل می‌دهد. @JonHaidt

کاربردها

  • GPT-5 اوپن‌ای‌آی با Red Queen Bio همکاری کرد تا پروتکل‌های کلونینگ مولکولی را در آزمایشگاه بهینه کند و از طریق آزمایش‌های تکراری، از جمله یک رویکرد جدید مبتنی بر آنزیم، ۷۹ برابر افزایش کارایی به دست آورد. @OpenAI
  • سایمون ویلیسون (Simon Willison) یک کتابخانه‌ی پایتون را که یک تجزیه‌کننده‌ی کامل HTML5 را پیاده‌سازی می‌کند، با استفاده از GPT-5.2 و Codex CLI در ۴.۵ ساعت و در حین تماشای یک فیلم به جاوااسکریپت پورت کرد. @simonw
  • گوگل لبز (Google Labs) CC را معرفی کرد، یک عامل بهره‌وری هوش مصنوعی آزمایشی در جیمیل که خلاصه‌های «روز پیش رو» و کمک ایمیلی را برای مشترکین Google AI Ultra ارائه می‌دهد. @GoogleLabs
  • مایکروسافت کوپایلوت (Microsoft Copilot) حالت Eggnog را برای Mico راه‌اندازی کرد و شخصیت با تم تعطیلات را در ایالات متحده، بریتانیا و کانادا در دسترس قرار داد. @mustafasuleyman
  • عینک‌های هوش مصنوعی متا اکنون با قابلیت‌های صوتی پیشرفته به کاربران کمک می‌کنند تا مکالمات را بهتر بشنوند. @TechCrunch
  • DoorDash اپلیکیشن اجتماعی هوش مصنوعی Zesty را برای کشف رستوران‌های جدید عرضه کرد. @TechCrunch
  • v0 اکنون به فضای کاری Linear متصل می‌شود و به کاربران امکان می‌دهد مستقیماً از بک‌لاگ خود بسازند. @v0

پژوهش‌ها

  • اوپن‌ای‌آی بنچمارک FrontierScience را منتشر کرد که استدلال علمی در سطح دکترا را در فیزیک، شیمی و زیست‌شناسی با وظایف سبک المپیاد و پژوهشی که توسط متخصصان نوشته شده‌اند، اندازه‌گیری می‌کند و GPT-5.2 را به عنوان قوی‌ترین عملکردکننده نشان می‌دهد، در حالی که شکاف‌هایی را در استدلال باز آشکار می‌کند. @OpenAI
  • GPT-5.2 مسئله‌ی باز COLT 2022 را در مورد «پیچیدگی زمان اجرا‌ی PageRank منظم‌شده‌ی L1 شتاب‌یافته» با استفاده از الگوریتم گرادیان شتاب‌یافته‌ی استاندارد حل کرد، با تمام اثبات‌های تولیدشده‌ی خودکار و رسمی‌شده در Lean. @kfountou
  • گوگل ریسرچ (Google Research) از Gemini 2.5 Deep Think پیشرفته برای تأیید مقالات نظری علوم کامپیوتر استفاده کرد، به طوری که ۹۷ درصد از نویسندگان STOC2026 بازخورد را برای یافتن خطاها و بهبود وضوح مفید دانستند. @GoogleResearch
  • Claude Opus 4.5 با حل خلاقانه‌ی تضادهای وابستگی و دور زدن موانع محیطی، CORE-Bench را حل کرد، در حالی که Opus 4.1 و Sonnet 4 با توسل به داده‌های شبیه‌سازی‌شده شکست خوردند. @PKirgis
  • Ai2 مدل Olmo 3 Think را با خط لوله‌ی کاملاً باز برای یادگیری تقویتی منتشر کرد، با استفاده از تنظیم دقیق نظارت‌شده، DPO و RLVR با GRPO، که پس از ۳ هفته آموزش بدون ناپایداری به بهبود خود ادامه می‌دهد. @cwolferesearch
  • متا VL-JEPA را معرفی کرد، اولین مدل غیرتولیدی برای وظایف بینایی-زبان در زمان واقعی، از جمله تشخیص عمل جریانی، بازیابی، VQA و طبقه‌بندی، که با کارایی بهتر از VLMها پیشی می‌گیرد. @pascalefung
  • پژوهش در مورد ترانسفورمرهای با عمق رشدیافته نشان می‌دهد که انباشت تدریجی لایه‌ها در طول آموزش می‌تواند بر مشکل «نفرین عمق» که در آن لایه‌های عمیق‌تر کمتر مورد استفاده قرار می‌گیرند، غلبه کند. @KaplFer
  • آزمایشگاه هوش مصنوعی استنفورد سؤالات معیوب را در بنچمارک‌های هوش مصنوعی پرکاربرد شناسایی کرد و نگرانی‌هایی را در مورد قابلیت اطمینان در طراحی بنچمارک برجسته کرد. @StanfordAILab
  • محققان چارچوب MUPI (هوش پیش‌بینی‌کننده‌ی جهانی تعبیه‌شده) را معرفی کردند که مبنای نظری برای راه‌حل‌های مشارکتی در یادگیری تقویتی را با درک شباهت خود-دیگری فراهم می‌کند. @tyrell_turing
  • Latent Labs مدل Latent-X2 را برای آنتی‌بادی‌های تولیدشده توسط هوش مصنوعی با قابلیت توسعه‌پذیری شبیه به دارو و ایمنی‌زایی پایین در پنل‌های انسانی، به صورت صفر-شات، منتشر کرد. @saakohl
  • ترنس تائو (Terence Tao) مفهوم هوش عمومی مصنوعی (Artificial General Cleverness) را متمایز از AGI مورد بحث قرار داد. @AndrewCurran_
  • دمیس هاسابیس (Demis Hassabis)، مدیر عامل گوگل دیپ‌مایند، در مورد کار بر روی «مسائل گره‌ی ریشه» - چالش‌های علمی بنیادی از همجوشی و ابررساناها تا کشف مواد جدید - صحبت کرد. @GoogleDeepMind
  • محققان نشان دادند که شکست در اکتشاف، نه توانایی مدل‌سازی، معمولاً دلیل عدم موفقیت انسان‌ها در حل محیط‌های ARC 3 است، که اکتشاف را هم دشوار و هم مهم برجسته می‌کند. @fchollet
  • Stanford HAI خلاصه‌ی مسئله‌ای را منتشر کرد که اکوسیستم متنوع مدل‌های هوش مصنوعی با وزن باز چین و پیامدهای سیاستی انتشار جهانی آن‌ها را تحلیل می‌کند. <a href="https://x.com/StanfordHAI/status/200097460346072304

اخبار هوش مصنوعی در 2025-12-15

مدل‌های جدید هوش مصنوعی

  • NVIDIA مدل Nemotron 3 Nano را منتشر کرد، یک مدل استدلال ترکیبی 30B با معماری ترکیب متخصصان که طراحی مامبا-ترنسفورمر را ترکیب می‌کند. این مدل دارای پنجره‌ی متنی 1M و عملکرد پیشرو در معیارهای SWE-Bench، استدلال و چت است @ctnzr
  • NVIDIA خانواده‌ی کامل Nemotron 3 را با شفافیت بی‌سابقه معرفی کرد و داده‌های آموزشی، کتابخانه‌ی یادگیری تقویتی NeMo Gym و کد آموزشی کامل را در کنار مدل‌ها منتشر کرد. نسخه‌های Super و Ultra در ماه‌های آینده عرضه خواهند شد @nvidianewsroom
  • علی‌بابا Qwen Code v0.5.0 را با یکپارچه‌سازی VSCode، SDK بومی TypeScript، پشتیبانی از مدل‌های استدلال سازگار با OpenAI از جمله DeepSeek V3.2 و Kimi-K2 و پشتیبانی از زبان روسی منتشر کرد @Alibaba_Qwen
  • اپل Sharp را منتشر کرد، یک مدل سنتز دید تک‌چشمی که قادر به تولید نماها در کمتر از یک ثانیه است @_akhaliq
  • AI2 مدل Bolmo را معرفی کرد، اولین مدل زبان کاملاً باز در سطح بایت که با بایت‌سازی Olmo 3 ساخته شده است و در طیف وسیعی از وظایف با مدل‌های زیرکلمه‌ای پیشرفته برابری می‌کند یا از آن‌ها پیشی می‌گیرد @allen_ai

تحلیل صنعت

  • مهندسان ارشد در شرکت‌های برتر فناوری گزارش می‌دهند که وظایف آن‌ها اکنون عمدتاً شامل پرامپت‌نویسی برای Cursor یا Claude Code با Opus 4.5 و بررسی صحت خروجی است، که نشان می‌دهد هوش مصنوعی از آستانه‌ی تعمیم به اکثر وظایف نرم‌افزاری عبور کرده است @deedydas
  • یک توسعه‌دهنده گزارش می‌دهد که 260 دلار توکن برای تکمیل یک مهاجرت سه‌روزه که تخمین زده می‌شد هفته‌ها طول بکشد، هزینه کرده است. این موضوع این سؤال را مطرح می‌کند که آیا شرکت‌ها هزینه‌های سالانه‌ی 12 تا 35 هزار دلاری توکن به ازای هر توسعه‌دهنده را علاوه بر حقوق جذب خواهند کرد یا خیر @GergelyOrosz
  • شرکت‌ها برای توجیه هزینه‌های هوش مصنوعی، به دنبال افزایش 20 درصدی بهره‌وری هستند، و عدم پیش‌بینی‌پذیری هزینه‌های اندازه‌گیری‌شده، ترجیح برنامه‌های کدنویسی هوش مصنوعی با قیمت ثابت را بر مدل‌های پرداخت به ازای استفاده، افزایش می‌دهد @GergelyOrosz
  • توسعه‌دهندگان باتجربه ارزش بسیار بیشتری از ابزارهای هوش مصنوعی نسبت به توسعه‌دهندگان کم‌تجربه استخراج می‌کنند، زیرا آن‌ها می‌توانند وظایف را به طور دقیق مشخص کنند، نه اینکه از پرامپت‌های عمومی استفاده کنند @GergelyOrosz
  • رئیس‌جمهور ترامپ US Tech Force را راه‌اندازی کرد که 1000 مهندس را با همکاری OpenAI، Oracle، Palantir، Anduril، Apple، Amazon، Google، Microsoft، NVIDIA و xAI برای ابتکارات فناوری با تأثیر بالا استخدام می‌کند @AndrewCurran_
  • Mirelo 41 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z و Index برای مدل بنیادی متمرکز بر لایه‌ی صوتی برای تولید ویدئو جذب کرد @a16z
  • First Voyage 2.5 میلیون دلار برای یک همراه هوش مصنوعی که به کاربران در ساخت عادت‌ها کمک می‌کند، جذب کرد @TechCrunch
  • Sierra دفتر جدیدی در پاریس راه‌اندازی کرد زیرا این شرکت در حال گسترش بین‌المللی است @btaylor

پژوهش‌ها

  • انتشار Olmo 3 استاندارد جدیدی را برای شفافیت با انتشار کامل داده‌ها، گزارش 100 صفحه‌ای، زیرساخت آموزشی باز و ارزیابی‌های قابل تکرار تعیین می‌کند و آزمایش‌های دقیق را با مانع صفر برای ورود امکان‌پذیر می‌سازد @cwolferesearch
  • Nemotron 3 Nano با تنها 3.6B پارامتر فعال از 31.6B کل، به امتیاز شاخص هوش 52 دست می‌یابد که 6 امتیاز از Qwen3 30B با اندازه‌ی مشابه و 15 امتیاز بهبود نسبت به Nemotron Nano 9B V2 قبلی دارد @ArtificialAnlys
  • همه‌ی مدل‌های هوش مصنوعی پیشرفته اکنون همه‌ی سطوح آزمون دشوار تحلیلگر مالی خبره (CFA) را با استفاده از آزمون‌های آزمایشی پولی برای کاهش خطر نشت، پشت سر می‌گذارند، با استراتژی پرامپت‌نویسی که تأثیر حداقلی بر اکثر انواع سؤالات نشان می‌دهد @emollick
  • DisCIPL MIT از LLM برای هدایت مدل‌های زبان کوچک‌تر برای همکاری در وظایف باز با محدودیت‌هایی مانند پازل‌های پیشرفته و اثبات‌های ریاضی استفاده می‌کند و به دقت و کارایی قابل مقایسه با مدل‌های پیشرو دست می‌یابد @MIT_CSAIL
  • استادی که از نظر تاریخی نسبت به مفید بودن مدل‌ها شکاک بود، گزارش می‌دهد که GPT 5.2 Pro گام بزرگی در مفید بودن برای کاربردهای پژوهشی هندسه‌ی جبری و نظریه‌ی اعداد است @AndrewCurran_
  • چارچوب Parallel-Distill-Refine انویدیا به دقت 93.3% در AIME 2024 دست می‌یابد در مقایسه با 79.4% برای زنجیره‌ی فکری طولانی استاندارد با تأخیر یکسان، که نشان می‌دهد تکرار حافظه‌ی محدود می‌تواند جایگزین ردیابی‌های استدلالی طولانی شود @rsalakhu
  • Prime Intellect با NVIDIA همکاری می‌کند تا محیط‌های RL NeMo Gym را در Environments Hub خود ادغام کند و مقیاس‌بندی یادگیری تقویتی را برای تیم‌ها آسان‌تر کند @AndrewCurran_

کاربردها

  • Gemini Agent گوگل اکنون برای کاربران Google AI Ultra در ایالات متحده در دسترس است و قادر به انجام وظایفی مانند اجاره‌ی خودرو با مقایسه‌ی قیمت‌ها، جمع‌آوری اطلاعات صندوق ورودی و رزرو در محدودیت‌های بودجه است @GeminiApp
  • Figma Slides و Figma Buzz اکنون در ChatGPT برای ایجاد ارائه‌ها و دعوت‌نامه‌ها از طریق رابط مکالمه‌ای در دسترس هستند @figma
  • IBM CUGA را منتشر کرد، یک عامل سازمانی متن‌باز که وظایف را با نوشتن و اجرای کد با توجه به فایل‌های فضای کاری خودکار می‌کند، با ابزارهای داخلی برای وظایف سازمانی و پشتیبانی MCP @huggingface
  • شریک تجاری اجرایی Zapier، عامل آماده‌سازی جلسات مبتنی بر هوش مصنوعی، مربی جلسات برای هماهنگی تیم اجرایی و سیستم بررسی پیش‌نویس اسناد را پیاده‌سازی می‌کند که امکان بازخورد در سطح مدیرعامل را قبل از جلسات فراهم می‌کند @clairevo
  • یک توسعه‌دهنده گزارش می‌دهد که وظایف پیچیده را از طریق Codex با GPT 5.2 Extra High به ترتیب برای 2.5 و 1.75 ساعت اجرا کرده است و همه‌ی معیارهای پذیرش را با پوشش کامل تست و بدون کد خراب تکمیل کرده است @gdb
  • Zoom دستیار هوش مصنوعی را به وب می‌آورد و دسترسی را برای کاربران رایگان فراهم می‌کند @TechCrunch

اخلاق و جامعه

  • Merriam-Webster کلمه‌ی slop را به عنوان کلمه‌ی سال 2025 نامگذاری کرد که منعکس‌کننده‌ی نگرانی‌ها در مورد کیفیت محتوای تولیدشده توسط هوش مصنوعی است @TechCrunch
  • چت‌بات‌ها در مدیریت فایل به گونه‌ای مشکل دارند که نسخه‌های CLI ندارند، به طوری که Gemini اغلب فایل‌های ارجاع‌شده را اشتباه می‌گیرد و ChatGPT اغلب فایل‌های تولیدشده را اشتباه قرار می‌دهد @emollick
  • ویژگی فشرده‌سازی مکالمه‌ی Claude برای کارهای دانشی به خوبی کدنویسی کار نمی‌کند و برخلاف پنجره‌های متنی چرخشی، لحن و جریان را به طور ناگهانی بازنشانی می‌کند @emollick

اخبار هوش مصنوعی در 2025-12-14

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2 Pro را با قابلیت‌های تفکر گسترده‌تر منتشر کرد که پیشرفت‌های قابل‌توجهی نسبت به 5.1 Pro نشان می‌دهد، مشابه جهش از o1 Pro به o3 Pro @MParakhin
  • گوگل از ترجمه‌ی هم‌زمان گفتار به گفتار با پشتیبانی Gemini خبر داد که اکنون در Google Translate در دسترس است و اوایل سال آینده برای توسعه‌دهندگان عرضه خواهد شد @OfficialLoganK
  • Gemini 2.5 و Gemini 3 Pro عملکرد بهبودیافته‌ای را در وظایف مختلف استدلال نشان می‌دهند، به‌طوری که Gemini 3 Pro بالاترین امتیاز 9.1% را در معیار استدلال فیزیک CritPt کسب کرده است @mark_k

تحلیل صنعت

  • هوش مصنوعی این امکان را برای بنیان‌گذاران فراهم کرده است که ارائه‌های بی‌نقصی را در مقیاس بزرگ ایجاد کنند، که باعث شده سرمایه‌گذاران خطرپذیر نتوانند تنها به ایمیل‌های سرد ورودی تکیه کنند و این امر نحوه‌ی نفوذ استارتاپ‌ها به سرمایه‌گذاران را به‌طور اساسی تغییر داده است @TechCrunch
  • ابزارهای بازبینی کد فعلی برای کدهای تولیدشده توسط هوش مصنوعی ناکافی هستند و توسعه‌دهندگان نیاز دارند که پرامپت اصلی، اصلاحات انسانی انجام‌شده و علامت‌گذاری واضح بخش‌های بدون تغییر تولیدشده توسط هوش مصنوعی را بدانند @GergelyOrosz
  • تیمی از مهندسان نرم‌افزار قوی که به کیفیت و قابلیت نگهداری کد اهمیت می‌دهند، از تیم‌هایی که از عوامل کدنویسی هوش مصنوعی قدرتمند به‌طور بی‌فکرانه استفاده می‌کنند، بهتر عمل می‌کنند، زیرا ابزارهای هوش مصنوعی توسعه‌دهندگان را وسوسه می‌کنند تا کدهای پرحرف و با قابلیت نگهداری کمتر را ارائه دهند @GergelyOrosz
  • مهندسان ارشد گزارش می‌دهند که هوش مصنوعی به آن‌ها امکان می‌دهد بدون ترس از قضاوت، آزادانه‌تر سؤال بپرسند، که منجر به یادگیری سریع‌تر در مقایسه با پویایی‌های سنتی تیم می‌شود که در آن عناوین ارشد مانع از پرسیدن سؤالات اساسی می‌شوند @GergelyOrosz
  • سیستم‌های هوش مصنوعی آینده در 10-15 سال آینده 4-5 مرتبه از نظر انرژی کارآمدتر از هوش مصنوعی فعلی خواهند بود و سخت‌افزار به جای برق، به گلوگاه اصلی استقرار تبدیل خواهد شد @fchollet
  • مراکز داده در فضا از نظر اقتصادی مقرون‌به‌صرفه نیستند و با در نظر گرفتن هزینه‌های پرتاب، پیچیدگی نگهداری و ارتباطات با پهنای باند بالا، 50-100 برابر گران‌تر از مراکز داده زمینی با انرژی هسته‌ای یا تجدیدپذیر هستند @fchollet

اخلاق و جامعه

  • اطلاعات نادرست تولیدشده توسط هوش مصنوعی در حال حاضر برای انتشار روایت‌های دروغین استفاده می‌شود، با ایجاد داستان‌های ساختگی و نام‌ها برای افراد واقعی درگیر در رویدادهای خبری، که تهدید فوری برای یکپارچگی اطلاعات را نشان می‌دهد @Nrg8000
  • سرگئی برین اعتراف می‌کند که گوگل در معماری ترانسفورمر که خود اختراع کرده بود، کمتر سرمایه‌گذاری کرد زیرا شرکت بیش از حد می‌ترسید چت‌بات‌هایی را منتشر کند که حرف‌های احمقانه می‌زنند، و این امر به OpenAI اجازه داد تا محاسبات را مقیاس‌بندی کرده و با این فناوری پیش برود @slow_developer
  • گرفتن پاسخ‌های دقیق از هوش مصنوعی فعلی با فریب دادن یک دروغگوی حرفه‌ای برای گفتن حقیقت مقایسه می‌شود، که از کاربران می‌خواهد سیستم را به گوشه‌ی درست هدایت کنند یا پرامپت‌های صحیح را ارائه دهند @paulg

کاربردها

  • JustHTML، یک کتابخانه‌ی جدید پایتون بدون وابستگی، عمدتاً توسط عوامل کدنویسی در طی چند ماه ساخته شد، که شامل 3000 خط کد است که HTML را مطابق با مشخصات HTML5 تجزیه می‌کند و 9200 تست html5lib را با موفقیت پشت سر می‌گذارد @simonw
  • یک راهنمای 17 مرحله‌ای نحوه‌ی استفاده از حالت عامل VS Code با Claude 3.7 Sonnet، Gemini Pro 3 و Claude Opus را برای ساخت کد با کیفیت تولیدی نشان می‌دهد، که مهندسی جدی را به جای کدنویسی حسی به نمایش می‌گذارد @simonw
  • تیم Codex پشتیبانی آزمایشی از مهارت‌ها را اضافه می‌کند که با GPT-5.2 به‌خوبی ترکیب می‌شود و امکان تنظیم دقیق Qwen3-0.6B را برای دستیابی به بهبود +6 در معیار HumanEval فراهم می‌کند @thsottiaux
  • Comet Assistant در حال انتقال محاسبات به سمت مدل‌های سریع و سبک‌وزن است که می‌توانند به‌صورت محلی اجرا شوند و امکان تحلیل عمیق‌تر هر مقاله، ویدئو یا وب‌سایتی را بدون تغییر زمینه فراهم می‌کنند @AravSrinivas

پژوهش‌ها

  • GPT-5.2 Pro در CritPt، یک معیار استدلال فیزیک در سطح پژوهش که برای آزمایش استدلال فیزیک نظری در سطح متخصص طراحی شده است، امتیاز 0% را کسب می‌کند، در حالی که Gemini 3 Pro بالاترین امتیاز 9.1% را به دست می‌آورد @mark_k
  • همه‌ی مدل‌های هوش مصنوعی اخیر اکنون معمای جراح را در اولین تلاش به‌درستی حل می‌کنند، که پیشرفت در مدیریت سوگیری جنسیتی در وظایف استدلال را نشان می‌دهد @emollick
  • بررسی سالانه‌ی مدل‌های باز، DeepSeek R1، خانواده‌ی Qwen 3 و خانواده‌ی Kimi K2 را به‌عنوان بهترین عملکردها شناسایی می‌کند، با پیش‌بینی‌هایی مبنی بر اینکه مقیاس‌بندی ادامه خواهد یافت و شکاف مرز باز-بسته در معیارهای عمومی در سال 2026 تقریباً یکسان باقی خواهد ماند @natolambert
  • شاخص شفافیت مدل بنیاد استنفورد نشان می‌دهد که شفافیت صنعت از 58 به 40.69 کاهش یافته است، به‌طوری که تنها IBM و Writer شفافیت را حفظ کرده‌اند در حالی که دیگران افشاگری را کاهش داده‌اند @JesseDLandry

اخبار هوش مصنوعی در 2025-12-13

مدل‌های جدید هوش مصنوعی

  • GPT-5.2 از OpenAI در اولین روز عرضه‌اش، از یک تریلیون توکن در API فراتر رفت و به سرعت در حال رشد است @sama
  • گوگل مدل به‌روز شده‌ی Gemini Native Audio را با دقت بالاتر در فراخوانی توابع، پیروی بهتر از دستورالعمل‌ها در زمان واقعی و قابلیت‌های مکالمه‌ی روان‌تر عرضه کرد که اکنون در API جیمنای در دسترس توسعه‌دهندگان است @OfficialLoganK
  • گوگل Gemini 3 Pro را با قابلیت‌های جدید برای یکپارچه‌سازی نتایج جستجوی محلی با Google Maps، نمایش عکس‌ها، رتبه‌بندی‌ها و اطلاعات دنیای واقعی در قالبی بصری و غنی راه‌اندازی کرد @GeminiApp
  • سورا سه سبک جدید تولید ویدئو را منتشر کرد: Handheld، Retro و Festive که برای همه‌ی کاربران در وب، iOS و اندروید در دسترس است @soraofficialapp

تحلیل صنعت

  • گزارش‌ها حاکی از آن است که Anthropic در حال مذاکره با گوگل برای یک قرارداد محاسباتی به ارزش ده‌ها میلیارد دلار است و سفارش‌هایی به ارزش 21 میلیارد دلار برای TPUs جهت آموزش مدل‌های بزرگ‌تر پیشنهاد شده است @AndrewCurran_
  • OpenAI و دیزنی همکاری خود را عمیق‌تر کردند و دیزنی حق خرید سهام بیشتر OpenAI را با ارزش‌گذاری فعلی دریافت کرد که به طور بالقوه می‌تواند روابط آینده‌ی قوی‌تری بین شرکت‌ها ایجاد کند @AndrewCurran_
  • وزارت صنعت و فناوری اطلاعات چین ظاهراً دستورالعمل‌هایی را صادر کرده است که واردات GPUهای H200 را برای شرکت‌هایی مانند Alibaba، Tencent، ByteDance و DeepSeek که قادر به آموزش مدل‌ها هستند، در اولویت قرار می‌دهد، در حالی که دسترسی را برای فروشندگان مجدد و شرکت‌های سنتی که استنتاج انجام می‌دهند، محدود می‌کند @jukan05
  • تحقیقات در مورد قیمت‌گذاری LLMها نشان داد که کشش کوتاه‌مدت حدود 1 است، که نشان‌دهنده‌ی عدم وجود پارادوکس جونس فوری است، اما قیمت‌ها در دو سال 1000 برابر کاهش یافتند در حالی که تقاضا به شدت افزایش یافت، که نشان می‌دهد این پارادوکس با گذشت زمان و با پذیرش تدریجی هوش مصنوعی توسط شرکت‌ها با قیمت‌های پایین‌تر رخ می‌دهد @emollick
  • مطالعه‌ای تخمین می‌زند که ChatGPT منجر به افزایش 6 درصدی در استارت‌آپ‌های جدید بین مناطق با پذیرش بالای هوش مصنوعی و مناطق با پذیرش پایین هوش مصنوعی در چین شده است، که نشان‌دهنده‌ی تأثیر اقتصادی قابل اندازه‌گیری بر کارآفرینی است @emollick
  • اعتبار گارتنر در تحلیل هوش مصنوعی پس از گزارش دستیاران کدنویسی هوش مصنوعی آن‌ها که آمازون، گیت‌لب و GCP را بالاتر از Cursor رتبه‌بندی کرد و Claude Code و OpenAI Codex را به طور کامل حذف کرد، زیر سوال رفته است، با ادعاهایی مبنی بر اینکه فروشندگان برای رتبه‌بندی‌های مطلوب پول پرداخت می‌کنند @GergelyOrosz
  • بازار دستیاران کدنویسی هوش مصنوعی رقابت پویایی را با تغییرات مکرر رهبری در فضاهای مختلف نشان می‌دهد، در حالی که بسیاری از شرکت‌ها هنوز از مدل‌های قدرتمند هوش مصنوعی خارج از کدنویسی و فناوری استفاده نکرده‌اند و اغلب گزینه‌های ارزان‌تر را انتخاب می‌کنند @emollick
  • Hugging Face در حال ارسال 3000 ربات Reachy Mini در سراسر جهان است که به عنوان یکی از بزرگترین محموله‌های ربات هوش مصنوعی در سال توصیف شده است و به عنوان یک پلتفرم رباتیک DIY متن‌باز برای سازندگان هوش مصنوعی طراحی شده است @ClementDelangue
  • قابلیت‌های سطح GPT-4 که در 2 سال 1000 برابر ارزان‌تر می‌شوند، برای تأثیرات اقتصادی کوتاه‌مدت حیاتی است، زیرا قابلیت‌های هوش مصنوعی بسیار ارزان فعلی برای بسیاری از کاربردهای مفید که اکثر مردم به طور کامل از آن‌ها استفاده نمی‌کنند، کافی است @RishiBommasani

کاربردها

  • OpenAI مکانیسم مهارت‌های Anthropic را در ChatGPT و ابزار Codex CLI خود به کار گرفت، به طوری که ChatGPT اکنون دارای مهارت‌هایی برای ایجاد و دستکاری صفحات گسترده، فایل‌های docx و PDF در یک پوشه‌ی جدید /home/oai/skills است @simonw
  • از مهارت جدید PDF در ChatGPT برای ایجاد یک گزارش دقیق در مورد فصل تولید مثل کاکاپو در سال استفاده شد، که 11 دقیقه طول کشید زیرا به طور مکرر مشکلات مانند رندر کاراکترهای خاص را رندر و رفع می‌کرد @simonw
  • Cursor بهبودهای ابزار طراحی سریع را شامل انتخاب عناصر بدون انیمیشن، گرد کردن اسلایدر بلور، بک‌اسپیس برای حذف عناصر، میانبرهای undo/redo و انتخاب چند عنصری متنی را عرضه کرد @cursor_ai
  • گوگل Android Emergency Live Video را راه‌اندازی کرد که به کاربران امکان می‌دهد اطلاعات بصری حیاتی را با یک ضربه با خدمات اضطراری به اشتراک بگذارند تا ارزیابی سریع‌تر وضعیت و راهنمایی‌های نجات‌بخش ارائه شود @sundarpichai
  • کاربران به طور فزاینده‌ای به LLMهایی مانند Perplexity برای جستجوی دستور پخت روی می‌آورند به جای گوگل، که قبل از دستور پخت واقعی، متن و تبلیغات بی‌پایان را برمی‌گرداند، که نشان می‌دهد چگونه جستجوی هوش مصنوعی نتایج تمیزتر و مستقیم‌تری را مشابه وب اوایل دهه 2000 ارائه می‌دهد @GergelyOrosz
  • توسعه‌دهنده از عامل‌های خودمختار با استفاده از یک مهار سفارشی با ابزارهای متعدد، GPT 5.2 برای نظرات دوم، 7.5 هزار پرامپت سیستمی و تزریق مجدد متناوب زمینه برای حل مشکلات عجیب و دشوار که نیاز به افق‌های طولانی دارند، استفاده کرد @Suhail
  • GPT-5.2 یک صفحه‌ی گسترده‌ی تعاملی اکسل برای شبیه‌سازی مبارزه‌ی هیولاهای D&D شامل توانایی‌های ویژه را پس از 60 دقیقه زمان فکر کردن ایجاد کرد، در حالی که Claude 4.5 Opus این کار را به سرعت انجام داد اما با حذف توانایی‌های ویژه آن را ساده کرد @emollick
  • Claude 4.5 Opus تفکر جانبی پیشرفته‌ای را نشان داد که نه تنها یک تک‌شاخ را در TikZ ترسیم کرد، بلکه آن را در LaTeX کامپایل کرد، به PDF تبدیل کرد، سپس به PNG و تصویر نهایی را با عناصر تزئینی ارائه داد @emollick
  • shadcn/create راه‌اندازی شد که به توسعه‌دهندگان امکان می‌دهد پیاده‌سازی‌های سفارشی shadcn/ui را با انتخاب کتابخانه‌های کامپوننت، آیکون‌ها، رنگ‌ها، تم‌ها و فونت‌ها بسازند، با بازنویسی کد کامپوننت برای مطابقت با ترجیحات فراتر از صرفاً تم‌سازی @shadcn

پژوهش‌ها

  • DeepMind اولین مقاله‌ی آموزش ربات‌ها را با مدل‌های جهانی تولید شده توسط Veo منتشر کرد که به همبستگی 0.88 با نرخ موفقیت در دنیای واقعی در بیش از 1600 آزمایش بر روی ربات‌های دو دستی ALOHA 2 دست یافت و به سناریوهای خارج از توزیع بدون آزمایش سخت‌افزاری در دنیای واقعی تعمیم یافت @deedydas
  • DeepMind یک عامل Gemini Deep Research را برای توسعه‌دهندگان از طریق Interactions API منتشر کرد که امکان جاسازی پیشرفته‌ترین قابلیت‌های تحقیقاتی خودمختار گوگل را مستقیماً در برنامه‌ها فراهم می‌کند @GoogleAI
  • Google Research و DeepMind DeepSearchQA را معرفی کردند، یک معیار جدید عامل تحقیقات وب متن‌باز که برای آزمایش عامل‌ها در وظایف پیچیده‌ی تحقیقات وب طراحی شده است @GoogleAI
  • Google Research و DeepMind مجموعه‌ی معیار FACTS را راه‌اندازی کردند، اولین آزمایش جامع صنعت که واقعیت LLM را در چهار بعد ارزیابی می‌کند: دانش مدل داخلی، جستجوی وب، مبناگذاری و ورودی‌های چندوجهی @GoogleAI
  • مدل‌های هوش مصنوعی مرزی واگرایی بسیار کمی در توانایی‌ها، پایبندی به پرامپت و سایر عوامل نشان می‌دهند، به طوری که مدل‌های متن‌بسته‌ی آمریکایی، مدل‌های چینی و مدل‌های متن‌باز فرانسوی همگی عملکرد بسیار مشابهی با یکدیگر دارند @emollick
  • رهبر تیم عامل‌های استفاده از کامپیوتر متا پس از 1.45 سال ساخت زیرساخت CUA، خطوط لوله‌ی داده، ارزیابی‌ها و مدل‌ها از ابتدا برای دستیابی به عملکرد عامل استفاده از کامپیوتر در سطح مرزی، استعفا داد @kohjingyu

اخبار هوش مصنوعی در 2025-12-12

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2 را با به‌روزرسانی دانش تا اوت 2025 منتشر کرد. قیمت این مدل 1.4 برابر GPT-5.1 است و بهبودهای قابل‌توجهی در مدیریت متن‌های طولانی و وظایف «سوزن در انبار کاه» (needle-in-haystack) نشان می‌دهد @simonw
  • GPT-5.2 Pro (X-High) به امتیاز 90.5% در ARC-AGI-1 با هزینه 11.64 دلار به ازای هر وظیفه دست یافت که نشان‌دهنده‌ی بهبود 390 برابری در کارایی نسبت به نسخه‌ی منتشرنشده‌ی o3 (High) از یک سال پیش است که با امتیاز 88% و هزینه 4.5 هزار دلار به ازای هر وظیفه عمل می‌کرد @simonw
  • Ai2 مدل Olmo 3.1 را با مدل‌های 32B Think و 32B Instruct منتشر کرد که اجرای RL آن‌ها را برای سه هفته‌ی دیگر تمدید کرده و بهبودهای مستمری در عملکرد AIME و معیارهای کدنویسی با هزینه‌ی کلی تقریباً 250 هزار دلار به دست آورده است @natolambert
  • گوگل مدل به‌روزرسانی‌شده‌ی Gemini 2.5 Flash Native Audio را با بهبودهایی برای مدیریت گردش‌کارهای پیچیده، هدایت دستورالعمل‌های کاربر و مکالمات طبیعی منتشر کرد @GoogleAI
  • مدل‌های پیش‌نمایش تبدیل متن به گفتار Gemini 2.5 Flash و 2.5 Pro بهبودهایی در رعایت دستورات سبک، تنظیم دقیق سرعت با تنظیمات سرعت آگاه از متن و ثبات صدای شخصیت برای سناریوهای چند گوینده به ارمغان می‌آورند @GoogleAI
  • Moonshoot AI مدل Kimi K2 Thinking را منتشر کرد که اکنون در پلتفرم Tinker با قابلیت‌های جستجوی گسترده در دسترس است @AndrewCurran_
  • ByteDance مدل Dolphin-v2 را منتشر کرد، یک مدل 3B برای تجزیه‌ی اسناد با مجوز MIT که روی PDFها، اسکن‌ها و عکس‌ها کار می‌کند و 21 نوع محتوا را با دقت پیکسلی درک می‌کند @AdinaYakup
  • OpenAI مدل circuit-sparsity را در Hugging Face منتشر کرد @_akhaliq

تحلیل صنعت

  • Anthropic به عنوان مشتری 10 میلیارد دلاری مرموز Broadcom از سپتامبر فاش شد، با سفارش 11 میلیارد دلاری اضافی برای زیرساخت‌های هوش مصنوعی @AndrewCurran_
  • OpenAI همکاری با BBVA را برای گسترش استقرار ChatGPT Enterprise به 120,000 کارمند اعلام کرد که از تغییر BBVA به سمت بانکداری مبتنی بر هوش مصنوعی حمایت می‌کند @gdb
  • سم آلتمن، مدیرعامل OpenAI، اعلام کرد که هوش مصنوعی سازمانی در سال 2026 اولویت بزرگی برای OpenAI خواهد بود که نشان‌دهنده‌ی یک تغییر استراتژیک عمده است @gdb
  • مدیرعامل Pinterest گزارش داد که با استفاده از مدل‌های متن‌باز، تنظیم دقیق آن‌ها و دستیابی به عملکردی مشابه بهترین مدل‌های اختصاصی با کمتر از 10% هزینه، به نتایج مشابهی دست یافته است @jeffboudier
  • NVIDIA به دلیل تقاضای قوی چین، با وجود محدودیت‌های صادراتی، افزایش تولید تراشه‌ی H200 را در نظر دارد @AndrewCurran_
  • اتان مولیک اطمینان خود را ابراز کرد که حتی اگر توسعه‌ی هوش مصنوعی امروز متوقف شود، جامعه برای ده سال آینده با اختلالات گسترده‌ای مواجه خواهد شد، زیرا مردم در تلاش برای بهره‌برداری از قابلیت‌های مدل‌های موجود هستند @emollick
  • ناظران صنعت به پتانسیل خستگی مدل در LLMها مشابه خستگی نصب برنامه در برنامه‌های موبایل اشاره می‌کنند، جایی که حتی محصولات برتر نیز برای پذیرش با مشکل مواجه می‌شوند @GergelyOrosz
  • تحلیل‌ها نشان می‌دهد که صنعت به اوج APIهای اختصاصی رسیده و وارد دنیایی متعادل‌تر می‌شود که در آن متن‌باز، آموزش و پلتفرم‌های جایگزین سهم بیشتری از توجه، استفاده و درآمد را به دست خواهند آورد @ClementDelangue
  • پست طنزآمیز چالش‌های پذیرش هوش مصنوعی سازمانی را برجسته می‌کند و استقرار 1.4 میلیون دلاری Microsoft Copilot را با حداقل استفاده‌ی واقعی اما گزارش‌دهی موفقیت‌آمیز معیارها برای ارائه‌های هیئت‌مدیره توصیف می‌کند @gothburz

اخلاق و جامعه

  • رئیس‌جمهور ترامپ فرمان اجرایی چارچوب سیاست ملی برای هوش مصنوعی را امضا کرد و اعلام کرد که ایالات متحده باید یک استاندارد ملی با حداقل بار برای هوش مصنوعی داشته باشد، نه 50 قانون ایالتی متناقض @AndrewCurran_
  • این فرمان اجرایی شامل ابزارهایی مانند کارگروه دعاوی DOJ، توقف بودجه‌ی فدرال از ایالت‌هایی با قوانین هوش مصنوعی دست‌وپاگیر، تلاش‌های FTC برای مهار تلاش‌های ایالت‌ها برای مجبور کردن مدل‌های هوش مصنوعی به تغییر خروجی‌های واقعی، و تلاش‌های FCC برای مهار الزامات افشاگری است @AndrewCurran_
  • یوتیوب سیستم تأیید سن مبتنی بر هوش مصنوعی را با استفاده از Gemini برای تعیین خودکار سن کاربر با تجزیه و تحلیل الگوهای مشاهده اعلام کرد، با کاربران که به اشتباه زیر 18 سال تخمین زده می‌شوند، ملزم به تأیید از طریق کارت اعتباری یا شناسه‌ی دولتی هستند @AndrewCurran_
  • آرویند نارایانان، محقق پرینستون، مقاله‌ای منتشر کرد که در آن استدلال می‌کند که عدالت الگوریتمی یک خطای دسته‌بندی است و از مطالعه‌ی کل سیستم‌های اجتماعی-فنی به جای فقط زیرسیستم‌های فنی هنگام طراحی بوروکراسی‌های الگوریتمی حمایت می‌کند @random_walker
  • تحلیل‌ها نشان می‌دهد که اگر افراد زمان کوتاهی تا هوش مصنوعی تحول‌آفرین داشته باشند و معتقد باشند که برخی از ارزش‌های انسانی اساساً آشتی‌ناپذیر هستند، اطمینان از اینکه مدل برنده چارچوب اخلاقی آن‌ها را در بر می‌گیرد، به طور فزاینده‌ای مهم‌ترین چیز در جهان به نظر خواهد رسید @AndrewCurran_

کاربردها

  • Comet Android از Perplexity توانایی اشکال‌زدایی کد از طریق تلفن را با تجزیه و تحلیل لاگ‌های CI، ردیابی خطاها، یافتن راه‌حل‌ها و باز کردن درخواست‌های کشش آماده برای ادغام نشان می‌دهد @AravSrinivas
  • ChatGPT اکنون شامل یک پوشه‌ی /home/oai/skills با تعاریف مهارت برای PDFها، اسناد و صفحات گسترده است، با پشتیبانی آزمایشی نیز به Codex CLI اضافه شده است @simonw
  • گوگل ترنسلیت ترجمه‌ی گفتار به گفتار زنده با پشتیبانی از Gemini را در نسخه‌ی بتا منتشر کرد که ترجمه‌ی صوتی بلادرنگ را با درک ظرافت‌های گفتار انسانی به ارمغان می‌آورد @TechCrunch
  • ادوبی برنامه‌های رایگان یکپارچه با ChatGPT را برای فتوشاپ، آکروبات و اکسپرس در دسکتاپ، وب و iOS راه‌اندازی کرد که به کاربران امکان می‌دهد مستقیماً از داخل ChatGPT به برنامه‌های ادوبی دسترسی داشته باشند @gdb
  • OpenAI همکاری با دیزنی را برای آوردن Sora و قابلیت‌های تولید تصویر برای شخصیت‌های دیزنی اعلام کرد که به کاربران امکان می‌دهد محتوا را با IP دیزنی تولید کنند @sama
  • مایکروسافت همکاری هوش مصنوعی MahaCrimeOS را با ماهاراشترا برای حمایت از قربانیان جرایم سایبری و کلاهبرداری مالی اعلام کرد @satyanadella
  • Moonlake مدل Reverie را معرفی کرد، یک مدل انتشار قابل برنامه‌ریزی بلادرنگ که برای بازی‌ها آموزش دیده است و قادر به شرطی‌سازی فراتر از پیکسل‌ها است و به گیم‌پلی اجازه می‌دهد تا با حفظ مکانیک بازی به هر زیبایی‌شناسی بازسازی شود @chrmanning
  • کاربر گزارش می‌دهد که GPT-5.2 تحلیل طولانی و چشمگیری از اسکریپت‌های بازی ارائه می‌دهد، جزئیات ظریف را درک می‌کند و تفسیرهایی مشابه کسی که بازی را عمیقاً بازی کرده است، با تقریباً بدون توهم، ارائه می‌دهد @AndrewCurran_
  • Kimi K2 رفتار جستجوی گسترده‌ای را در طول استدلال نشان می‌دهد، بارها برای حمایت از ادعاها، بررسی مثال‌های نقض و تأیید اطلاعات قبل از ارائه‌ی پاسخ‌های نهایی جستجو می‌کند @AndrewCurran_

پژوهش‌ها

  • Olmo 3.1 32B Think از Ai2 نشان می‌دهد که مقیاس‌بندی RL می‌تواند بسیار فراتر از انتظارات اولیه ادامه یابد، با افزایش عملکرد بیش از 125 هزار ساعت H100 با هزینه‌ی تقریباً 250 هزار دلار، قابل مقایسه با مصرف منابع DeepSeek R1 @natolambert
  • پژوهش Fast Flow Joint Distillation (F2D2) را معرفی می‌کند که NFEs را برای نمونه‌برداری و ارزیابی احتمال به میزان دو مرتبه در مدل‌های مبتنی بر جریان کاهش می‌دهد و در عین حال کیفیت نمونه را حفظ می‌کند @rsalakhu
  • Google DeepMind پژوهشی را در مورد ارزیابی سیاست‌های رباتیک Gemini در شبیه‌ساز Veo World ارائه می‌دهد و یک ارزیاب عمومی برای آزمایش ایمنی ربات بدون شکستن اشیاء فیزیکی معرفی می‌کند @Majumdar_Ani
  • فرانسوا شوله استدلال می‌کند که هوش مصنوعی از ماشین اتوماسیون به ماشین اختراع تکامل خواهد یافت و به یک پارادایم اساساً جدید با جستجوی نمادین به عنوان هسته‌ی آن به جای برازش منحنی نیاز دارد @fchollet
  • شوله توضیح می‌دهد که هوش سیال اندازه‌گیری‌شده توسط ARC با قابلیت‌های اکتشاف، تعیین هدف و برنامه‌ریزی مورد نیاز برای عوامل خودمختار متفاوت است، با اکتشاف سخت‌ترین و برنامه‌ریزی آسان‌ترین در میان این مشکلات باز @fchollet
  • اولین LLM آموزش‌دیده در فضا با استفاده از NVIDIA H100 در Starcloud-1، همچنین اولین بار است که نسخه‌ای از Gemini گوگل در فضا اجرا می‌شود، با استفاده از مدل‌های متن‌باز بسیار کارآمد Gemma @demishassabis
  • روش جدید جاسازی متن با استفاده از شبکه‌ی کوچک ReLU برای تقریب ترانسفورمر بزرگ از ویژگی

اخبار هوش مصنوعی در 2025-12-11

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2 را منتشر کرد که به عنوان هوشمندترین مدل در دسترس عموم در جهان توصیف می‌شود، به ویژه در کارهای دانش‌محور دنیای واقعی از جمله صفحات گسترده، ارائه‌ها و کدنویسی بسیار قوی است. این مدل در سه نسخه عرضه می‌شود: GPT-5.2 Instant برای کارهای روزمره، GPT-5.2 Thinking برای استدلال پیچیده و وظایف با زمینه طولانی، و GPT-5.2 Pro برای سوالات دشوار و کارهای علمی @OpenAI
  • GPT-5.2 در SWE-Bench Pro به امتیاز 55.6%، در ARC-AGI-2 به 52.9% و در Frontier Math به 40.3% دست یافت، با نرخ برد/تساوی 70.9% در برابر کارشناسان صنعت در معیار GDPval که وظایف دانش‌محور را در 44 شغل اندازه‌گیری می‌کند @sama
  • GPT-5.2 Pro با هزینه 11.64 دلار به ازای هر وظیفه، به امتیاز 90.5% در ARC-AGI-1 دست یافت که نشان‌دهنده‌ی بهبود کارایی 390 برابری نسبت به پیش‌نمایش o3 سال گذشته است که با هزینه 4500 دلار به ازای هر وظیفه، 88% امتیاز کسب کرده بود @arcprize
  • علی‌بابا Qwen Learn Mode را معرفی کرد که توسط Qwen3-Max پشتیبانی می‌شود و دارای گفت‌وگوی سقراطی و مسیرهای یادگیری تطبیقی مبتنی بر روان‌شناسی شناختی است @Alibaba_Qwen
  • Cohere مدل Rerank 4 را در دو نسخه (Fast و Pro) عرضه کرد که دارای بزرگترین پنجره‌ی متنی در سری Rerank خود، قابلیت‌های خودآموزی بدون داده‌ی برچسب‌گذاری‌شده، و پشتیبانی از بیش از 100 زبان با بازیابی پیشرفته در 10 زبان اصلی تجاری است @cohere
  • گوگل عامل Gemini Deep Research را برای توسعه‌دهندگان معرفی کرد که بر اساس Gemini 3 Pro ساخته شده و با استفاده از یادگیری تقویتی چندمرحله‌ای آموزش دیده تا به طور خودکار در وب گشت‌وگذار کند و گزارش‌های دقیق با ارجاعات تولید کند. این عامل در معیار DeepSearchQA به عملکرد پیشرفته و در BrowseComp به بالاترین امتیاز دست یافت @GoogleDeepMind
  • گوگل مدل‌های Gemini TTS را با تنوع لحن غنی‌تر، پایبندی دقیق‌تر به دستورات سبک، تنظیمات سرعت هوشمندتر و آگاه از زمینه، و صداهای ثابت شخصیت در سناریوهای چندگوینده به‌روزرسانی کرد @OfficialLoganK
  • Mistral AI اعلام کرد که Devstral 2 در OpenRouter رتبه‌ی اول را دارد و از عرضه‌ی مدل دیگری در چند روز آینده خبر داد @MistralAI
  • گوگل از ادغام Gemini با Google Maps خبر داد که نتایج محلی را در قالبی بصری غنی با عکس‌ها، رتبه‌بندی‌ها و اطلاعات واقعی ارائه می‌دهد @GeminiApp

تحلیل صنعت

  • جمع‌آوری سرمایه‌ی خطرپذیر از اوج سال 2022 به میزان 75% کاهش یافته و در سه‌ماهه‌ی سوم 2025 به تقریباً 45 میلیارد دلار رسیده است که به سطح 8 سال پیش بازگشته است، در حالی که استقرار سرمایه در 4 سه‌ماهه‌ی گذشته در حدود 330 میلیارد دلار بالا باقی مانده است. شکاف رو به رشد بین سرمایه‌های مستقر شده و سرمایه‌های جمع‌آوری شده نشان می‌دهد که یافتن سرمایه برای استارت‌آپ‌ها به طور قابل توجهی دشوارتر خواهد شد @deedydas
  • برای اولین بار در تاریخ، بیش از یک‌سوم استارت‌آپ‌های سال 2025 توسط یک نفر تأسیس شده‌اند و بنیان‌گذاران انفرادی به طور فزاینده‌ای رایج شده‌اند @julianweisser
  • Perplexity اعلام کرد که توسط شرکت حقوقی Gunderson Dettmer برای خدمات حقوقی به کار گرفته شده است، که نیاز وکلا به هوش مصنوعی دقیق که بتواند مراجع را به طور قابل اعتماد استخراج کند، برجسته می‌کند @AravSrinivas
  • دیزنی با OpenAI قرارداد مجوز سه‌ساله‌ای امضا کرد که به Sora اجازه می‌دهد ویدئوهای هوش مصنوعی با حضور 200 شخصیت خود تولید کند، با انحصار برای سال اول. دیزنی برای استفاده از شخصیت‌ها محدودیت‌هایی تعیین خواهد کرد و ویدئوها را برای Disney+ انتخاب خواهد کرد @TechCrunch
  • Harness با ارزش 5.5 میلیارد دلار، 240 میلیون دلار سرمایه جذب کرد تا "شکاف پس از کد" هوش مصنوعی را در تحویل نرم‌افزار خودکار کند @TechCrunch
  • Runware در سری A خود 50 میلیون دلار سرمایه جذب کرد تا تولید تصویر و ویدئو را برای توسعه‌دهندگان آسان‌تر کند @TechCrunch
  • Port با ارزش 800 میلیون دلار، 100 میلیون دلار سرمایه جذب کرد تا با Backstage اسپاتیفای برای پورتال‌های توسعه‌دهنده رقابت کند @TechCrunch
  • Opera مرورگر Neon را با قابلیت‌های هوش مصنوعی و قیمت 20 دلار در ماه راه‌اندازی کرد @TechCrunch
  • Worktrace با رهبری 8VC، 9 میلیون دلار سرمایه‌ی اولیه جذب کرد تا به کسب‌وکارها در کشف فرصت‌های اتوماسیون کمک کند. این شرکت توسط آنجلا جیانگ، مدیر محصول سابق OpenAI و دیپاک واسیست، استاد علوم کامپیوتر UIUC تأسیس شده است @worktrace_ai
  • Vybe با رهبری First Round، 10 میلیون دلار سرمایه‌ی اولیه جذب کرد تا کدنویسی حسی را برای برنامه‌های کاربردی تجاری داخلی با ادغام داده‌های تولیدی امکان‌پذیر کند @qhoang09
  • Oboe با رهبری a16z، 16 میلیون دلار در سری A برای پلتفرم یادگیری شخصی‌سازی‌شده جذب کرد @NirZicherman
  • Unconventional AI با رهبری مشترک a16z، 475 میلیون دلار سرمایه‌ی اولیه جذب کرد تا تراشه‌های هوش مصنوعی بسیار کارآمد را با استفاده از رویکردهای محاسبات آنالوگ الهام‌گرفته از مغزهای بیولوژیکی توسعه دهد @a16z
  • Hugging Face اعلام کرد که text-generation-inference در حالت نگهداری قرار گرفته است و به کاربران توصیه می‌کند برای استنتاج بهینه به vLLM، SGLang، llama.cpp یا MLX مهاجرت کنند @LysandreJik
  • Cursor ویرایش بصری طراحی را مستقیماً در پایگاه کد معرفی کرد که به کاربران امکان می‌دهد عناصر را انتخاب کرده، آن‌ها را به صورت بصری تغییر دهند و Cursor کد را بنویسد، با هدف ایجاد پلی بین گردش کار طراحی و مهندسی @cursor_ai
  • Runway اولین مدل جهانی خود را منتشر کرد و صدای بومی را به آخرین مدل ویدئویی خود اضافه کرد @TechCrunch
  • Rivian از یک حرکت بزرگ در زمینه‌ی خودمختاری با سیلیکون سفارشی، لیدار و اشاره به ربات‌تاکسی‌ها خبر داد، با دستیار هوش مصنوعی که در اوایل سال 2026 به خودروهای برقی می‌آید @TechCrunch

اخلاق و جامعه

  • ایتان مولیک نشان داد که GPT-5.2 Pro کد شیدر بصری پیچیده را در یک مرحله ایجاد می‌کند، که دشواری تمایز محتوای تولید شده توسط هوش مصنوعی از کار ساخته شده توسط انسان را برجسته می‌کند @emollick
  • OpenAI از سرمایه‌گذاری در آمادگی امنیت سایبری با افزایش قابلیت‌های مدل‌ها خبر داد و با کارشناسان جهانی برای تقویت اقدامات حفاظتی و دادن مزیت به مدافعان همکاری می‌کند @OpenAI
  • دیزنی به گوگل اخطار توقف و انصراف داد و ادعای نقض گسترده‌ی حق کپی‌رایت را مطرح کرد @TechCrunch
  • مجله‌ی TIME "معماران هوش مصنوعی" را به عنوان شخصیت سال 2025 معرفی کرد، از جمله فی‌فی لی، که تأثیر تحول‌آفرین هوش مصنوعی بر بشریت را به رسمیت می‌شناسد @drfeifei
  • xAI با السالوادور همکاری می‌کند تا آموزش خصوصی Grok شخصی‌سازی‌شده را به بیش از 1 میلیون دانش‌آموز مدارس دولتی ارائه دهد و اولین برنامه‌ی ملی معلم خصوصی هوش مصنوعی در جهان را ایجاد کند @xai
  • Anthropic اعلام کرد که پروتکل زمینه‌ی مدل (MCP) اکنون بخشی از بنیاد Agentic AI تحت بنیاد لینوکس است، با OpenAI، Anthropic و Block به عنوان بنیان‌گذاران مشترک @AnthropicAI
  • ICML 2026 سیاست جدیدی را اعلام کرد که به داوران و نویسندگان اجازه می‌دهد بین استفاده‌ی محافظه‌کارانه یا آزادانه از LLM انتخاب کنند، با تطبیق بر اساس ترجیحات @icmlconf
  • ایتان مولیک اشاره کرد که مدل‌های هوش مصنوعی با وزن‌های باز، اقتصاد مشابه نرم‌افزار متن‌باز را ندارند، بدون مسیر مشخصی برای کسب ارزش با وجود افزایش هزینه‌های مدل، که سوالاتی را در مورد پایداری مطرح می‌کند @emollick
  • محققان استنفورد دریافتند که 1 از 20 معیار هوش مصنوعی دارای نقص‌های جدی است، به این معنی که صنعت به دلیل روش‌های ارزیابی معیوب، مدل‌های کم‌کارایی را تبلیغ کرده و مدل‌های بهتر را جریمه کرده است @StanfordHAI

کاربردها

  • Linear ادغام عامل هوش مصنوعی را با Intercom، Zendesk، Gong و Slack Workflows معرفی کرد که امکان ایجاد خودکار مشکل از تماس‌ها و تیکت‌های مشتری را با یک کلیک فراهم می‌کند @karrisaarinen
  • گوگل Disco را معرفی کرد، ابزاری مبتنی بر Gemini برای ساخت برنامه‌های وب از تب‌های مرورگر @TechCrunch
  • گوگل قابلیت امتحان لباس با هوش مصنوعی را راه‌اندازی کرد که تنها با یک سلفی کار می‌کند @TechCrunch
  • اندرو ان‌جی دستورالعملی برای ساخت عوامل بسیار خودمختار با استفاده از بسته‌ی متن‌باز aisuite به اشتراک گذاشت که به LLMهای پیشرفته اجازه می‌دهد از ابزارهایی مانند دسترسی به دیسک و جستجوی وب برای کارهای پیچیده استفاده کنند، اگرچه اشاره کرد که اکثر عوامل عملی به داربست‌بندی بیشتری نیاز دارند @AndrewYNg
  • سایمون ویلسون راهنمای جامعی در مورد الگوهای کدنویسی حسی برای ابزارهای HTML تک‌فایلی منتشر کرد که شامل APIهای فعال‌شده با CORS، localStorage،

اخبار هوش مصنوعی در 2025-12-10

مدل‌های جدید هوش مصنوعی

  • علی‌بابا نسخه‌ی ارتقایافته‌ی Qwen3-Omni-Flash (نسخه‌ی 2025-12-01) را با قابلیت‌های بهبودیافته‌ی درک چندمرحله‌ای ویدئو/صوت، شخصیت هوش مصنوعی قابل تنظیم از طریق دستورات سیستمی، پشتیبانی از 119 زبان متنی و 19 زبان گفتاری، و کیفیت صدای شبیه به انسان منتشر کرد. @Alibaba_Qwen
  • میسترال مدل‌های Devstral 2 و Devstral Small 2 را به ترتیب با 123 میلیارد و 24 میلیارد پارامتر منتشر کرد، هرچند با مجوزهای محدودکننده‌ای که استفاده از آن‌ها را برای شرکت‌هایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع می‌کند. @simonw
  • میسترال محدودیت کانتکست Vibe را از 100 هزار به 200 هزار توکن افزایش داد. @MistralAI
  • نوس ریسرچ (Nous Research) مدل Nomos 1 را به صورت متن‌باز منتشر کرد؛ این مدل 30 میلیارد پارامتری در مسابقه‌ی ریاضی پاتنام 2024 امتیاز 87 از 120 را کسب کرد و در بین 3,988 شرکت‌کننده رتبه‌ی دوم را به دست آورد. @NousResearch
  • استپ‌فان (StepFun) سیستم استدلال هماهنگ موازی (PaCoRe) را معرفی کرد که به یک مدل 8 میلیارد پارامتری امکان می‌دهد با زمان محاسباتی چند میلیون توکنی، به امتیاز 94.5% در HMMT25 (که از 93.2% GPT-5 بیشتر است) و 78.2% در LiveCodeBench دست یابد. @StepFun_ai

تحلیل صنعت

  • بلومبرگ گزارش می‌دهد که آزمایشگاه ابرهوش متا از جما (Gemma)، مدل متن‌باز OpenAI، و کیو‌ون (Qwen) برای آموزش مدل بزرگ بعدی خود با نام رمز آووکادو استفاده می‌کند که نشان‌دهنده‌ی تغییر احتمالی از استراتژی متن‌باز است. @AndrewCurran_
  • چت‌جی‌پی‌تی به پردانلودترین اپلیکیشن اپل در سال 2025 در ایالات متحده تبدیل شد؛ طبق گزارش پیو ریسرچ، 64% از نوجوانان آمریکایی از چت‌بات‌های هوش مصنوعی استفاده می‌کنند و 33% از آن‌ها روزانه از این چت‌بات‌ها بهره می‌برند. @AndrewCurran_
  • غول‌های فناوری بزرگ حدود 68 میلیارد دلار سرمایه‌گذاری در هند طی 5 سال آینده را اعلام کردند که هند را پس از ایالات متحده به دومین محرک بزرگ درآمد برای توسعه‌ی هوش مصنوعی تبدیل می‌کند. @deedydas
  • هاگینگ فیس (Hugging Face) اکنون میزبان بیش از 2.2 میلیون مدل است که بیش از 50,000 مدل دارای ارائه‌دهنده‌ی API هستند و این نشان‌دهنده‌ی رشد سریع در اکوسیستم هوش مصنوعی متن‌باز است. @_akhaliq
  • گوگل طرح هوش مصنوعی پلاس (AI Plus) با قیمت کمتر از 5 دلار را در هند برای رقابت با چت‌جی‌پی‌تی گو (ChatGPT Go) راه‌اندازی کرد. @TechCrunch
  • اوبو (Oboe) 16 میلیون دلار در سری A به رهبری a16z برای پلتفرم تولید دوره‌های آموزشی مبتنی بر هوش مصنوعی خود که تجربه‌های یادگیری شخصی‌سازی‌شده ایجاد می‌کند، جذب سرمایه کرد. @TechCrunch
  • کرسر (Cursor) نسخه‌ی 2.2 را با حالت دیباگ (Debug Mode) منتشر کرد که کد را ابزاربندی می‌کند و داده‌های زمان اجرا را به عامل‌ها ارسال می‌کند، به علاوه بهبودهایی در حالت برنامه‌ریزی (Plan Mode) و قابلیت‌های داوری چندعاملی. @cursor_ai

اخلاق و جامعه

  • OpenAI اعلام کرد که مدل‌های آینده‌ی آن تحت چارچوب آمادگی (Preparedness Framework) برای امنیت سایبری به قابلیت «بالا» خواهند رسید و این امر مستلزم تقویت تدابیر حفاظتی و همکاری با کارشناسان جهانی برای برتری مدافعان است. @OpenAI
  • ایتان مولیک هشدار داد که مجوزهای محدودکننده‌ی مدل‌های میسترال (که استفاده از آن‌ها را برای شرکت‌هایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع می‌کند) می‌تواند مشارکت‌های متن‌باز را محدود کند، زیرا از لحاظ تاریخی بخش زیادی از کار از شرکت‌های انتفاعی می‌آید. @emollick
  • گرگلی اوروس (Gergelyi Orosz) مشاهده کرد که لینکدین به شدت محصولات هوش مصنوعی را در همه جا تبلیغ می‌کند، با محتوای تولیدشده توسط هوش مصنوعی که پلتفرم را پر کرده و درخواست‌های شغلی ورودی را تقریباً بی‌فایده کرده است. @GergelyOrosz
  • برایان لاوین (Brian Lovin) گزارش داد که حساب‌های جدید X محتوای تولیدشده توسط هوش مصنوعی با کیفیت بسیار پایین، مطالب سیاسی و پست‌های بی‌ارزش را به عنوان فید پیش‌فرض مشاهده می‌کنند. @brian_lovin
  • ایتان مولیک اشاره کرد که روتر خودکار GPT-5 مشکلات ادراکی ایجاد می‌کند، زیرا بسیاری از نمونه‌های «چت‌جی‌پی‌تی X را اشتباه انجام داد» در واقع «چت‌جی‌پی‌تی-5 اینستنت اشتباه انجام داد» هستند که منجر به باورهای نادرست در مورد قابلیت‌های هوش مصنوعی می‌شود. @emollick
  • جان کارمک پیشنهاد کرد که از تاریخچه‌ی چت LLM به عنوان مرجع شغلی استفاده شود، با این استدلال که تاریخچه‌های چت چندساله سیگنال‌های بهتری نسبت به رزومه‌های سنتی ارائه می‌دهند و می‌توانند تناسب بین افراد و مشاغل را هم برای کارفرمایان و هم برای کارمندان بهینه کنند. @ID_AA_Carmack

کاربردها

  • گوگل با چندین ناشر از جمله در اشپیگل، گاردین، تایمز آو ایندیا و واشنگتن پست برای آزمایش ویژگی‌های تعامل هوش مصنوعی از جمله خلاصه‌های صوتی توسط جمینی در اخبار گوگل همکاری می‌کند. @AndrewCurran_
  • گوگل سرورهای مدیریت‌شده‌ی MCP را راه‌اندازی کرد که به عامل‌های هوش مصنوعی امکان می‌دهد به ابزارهای آن متصل شوند، به علاوه ویژگی «منابع ترجیحی» (Preferred Sources) در جستجو برای سفارشی‌سازی «اخبار برتر» (Top Stories) از منابع معتبر. @TechCrunch
  • فیگما ابزارهای حذف شیء و گسترش تصویر مبتنی بر هوش مصنوعی را در Design و Draw راه‌اندازی کرد که به کاربران امکان می‌دهد حواس‌پرتی‌ها را پاک کنند، پس‌زمینه‌ها را گسترش دهند و اشیاء را جدا کنند. @figma
  • میخائیل پاراخین (Mikhail Parakhin) سیستم SimGym را معرفی کرد که «مشتریان دیجیتال» ایجاد می‌کند که مانند مشتریان واقعی رفتار می‌کنند تا فرصت‌های بهینه‌سازی را آشکار کرده و امکان آزمایش A/B را با ترافیک زنده صفر فراهم کند. @MParakhin
  • ایتان مولیک نشان داد که نانو بنانا پرو (Nano Banana Pro) در NotebookLM می‌تواند ارائه‌های با کیفیت بالا را از مواد منبع با توهمات نادر تولید کند و آن را به عنوان جایگزینی بالقوه برای پاورپوینت معرفی کرد. @emollick
  • آندری کارپاتی (Andrej Karpathy) سیستم خودکار نمره‌دهی را با استفاده از API GPT 5.1 Thinking ایجاد کرد تا 930 بحث هکر نیوز (Hacker News) از دسامبر 2015 را با نگاهی به گذشته تحلیل کند و پربیننده‌ترین نظرات را با 60 دلار در 1 ساعت شناسایی کند. @karpathy
  • لینیر (Linear) گزارش داد که عامل هوش مصنوعی آن‌ها یکی از محبوب‌ترین ویژگی‌هایشان بوده است، با افزایش قابل توجهی در تعداد مسائل جدید ایجاد شده پس از راه‌اندازی. @karrisaarinen
  • ساتیا نادلا (Satya Nadella) بر همکاری مایکروسافت با وزارت کار هند برای استفاده از هوش مصنوعی برای اتصال بیش از 300 میلیون کارگر غیررسمی به مشاغل بهتر و تامین اجتماعی تاکید کرد. @satyanadella
  • CTGT منتات (Mentat) را راه‌اندازی کرد، یک API سازگار با OpenAI که از قابلیت تفسیر مکانیکی (mechanistic interpretability) برای ارائه‌ی کنترل قطعی بر رفتار LLM به شرکت‌ها استفاده می‌کند و تضمین‌های سیاست ایمنی را بدون نیاز به آموزش مجدد اضافه می‌کند. @CyrilGorlla
  • اسپاتیفای ویژگی «لیست‌های پخش پیشنهادی» (Prompted Playlists) مبتنی بر هوش مصنوعی و شخصی‌سازی‌شده‌تر را آزمایش می‌کند. @TechCrunch

پژوهش‌ها

  • گوگل دیپ‌مایند و گوگل ریسرچ مجموعه‌ی بنچمارک FACTS را توسعه دادند، اولین تست جامع صنعت که واقعیت‌سنجی LLM را در چهار بعد ارزیابی می‌کند: دانش مدل داخلی، جستجوی وب، زمینه‌سازی و ورودی‌های چندوجهی، با کسب امتیاز 68.8% توسط جمینی 3 پرو. @GoogleDeepMind
  • گوگل کلود AlphaEvolve را معرفی کرد، یک عامل کدنویسی مبتنی بر جمینی برای طراحی الگوریتم‌های پیشرفته که از LLMها برای پیشنهاد اصلاحات کد هوشمندانه در یک حلقه‌ی بازخورد استفاده می‌کند. @GoogleCloudTech
  • محققان استنفورد دریافتند که 1 از هر 20 بنچمارک هوش مصنوعی دارای نقص‌های جدی است، به این معنی که صنعت مدل‌های کم‌کارایی را تبلیغ کرده و مدل‌های بهتر را جریمه کرده است. @StanfordHAI
  • مایکروسافت ریسرچ Promptions را معرفی کرد که به توسعه‌دهندگان کمک می‌کند کنترل‌های پویا و آگاه به کانتکست را به رابط‌های چت اضافه کنند تا کاربران بتوانند پاسخ‌های هوش مصنوعی مولد را بدون نوشتن دستورالعمل‌های طولانی هدایت کنند. @MSFTResearch
  • ناتان لمبرت (Nathan Lambert) سخنرانی جامعی را منتشر کرد که تمام مراحل ساخت Olmo 3 Think را پوشش می‌دهد، از جمله تغییرات در پیش‌آموزش، ارزیابی و پس‌آموزش با تمرکز بر زیرساخت یادگیری تقویتی. @natolambert
  • LeRobot Community Datasets v3 تعداد 50 هزار اپیزود را در 46 نوع ربات از 235 مشارکت‌کننده در سراسر جهان منتشر کرد که یکی از بزرگترین مجموعه‌های نمایش ربات‌های متن‌باز و جمع‌سپاری‌شده است. @danaaubakir
  • آدی اولتین (Adi Oltean) آموزش اولین LLM در فضا را با استفاده از NVIDIA H100 در Starcloud-1 اعلام کرد و مدل nanoGPT را با موفقیت بر روی آثار کامل شکسپیر آموزش داد و استنتاج را اجرا کرد. <a href="https://x.com/AdiOltean/status/19987699974310

اخبار هوش مصنوعی در 2025-12-09

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen Code v0.2.2-v0.3.0 را با پشتیبانی از JSON جریانی، بین‌المللی‌سازی کامل و ویژگی‌های امنیتی پیشرفته شامل محدودیت‌های بافر 20 مگابایتی و سازگاری بهبودیافته بین پلتفرم‌ها منتشر کرد. @Alibaba_Qwen
  • علی‌بابا بهینه‌سازی سیاست تطبیقی نرم (SAPO) را معرفی کرد، یک روش یادگیری تقویتی برای آموزش مدل‌های زبان بزرگ که برش سخت را با گیت‌های کنترل‌شده با دما جایگزین می‌کند تا پایداری و عملکرد را بهبود بخشد، به‌ویژه در مدل‌های MoE. @Alibaba_Qwen
  • میسترال خانواده‌ی مدل کدنویسی Devstral 2 را در دو اندازه (123B تحت مجوز MIT اصلاح‌شده و 24B تحت Apache 2.0) منتشر کرد که هر دو متن‌باز و پیشرفته هستند، در کنار CLI Mistral Vibe برای اتوماسیون سرتاسری. @MistralAI
  • جانشین لاما متا با نام رمز Avocado، که در ابتدا برای انتشار در کریسمس برنامه‌ریزی شده بود، به اوایل سال 2026 موکول شد، با این احتمال که به‌جای متن‌باز بودن، اختصاصی باشد. @AndrewCurran_
  • گوگل Gemini 3 را با قابلیت‌های استدلال پیشرفته منتشر کرد که امکان ایجاد بازی‌های سه‌بعدی تعاملی، تحلیل بازخورد ارائه‌ها و تولید ابزار درخواستی در حالت هوش مصنوعی جستجو را فراهم می‌کند. @GoogleAI
  • اپلیکیشن Gemini گالری قالب‌های آزمایشی برای ایجاد ویدئو را معرفی کرد که به کاربران امکان می‌دهد قالب‌ها را انتخاب کرده یا با تصاویر خود سفارشی‌سازی کنند. @GeminiApp

تحلیل صنعت

  • گزارش «وضعیت هوش مصنوعی در شرکت‌ها» از OpenAI نشان می‌دهد که حجم پیام‌رسانی سازمانی 8 برابر نسبت به سال گذشته افزایش یافته است، به‌طوری که کارمندان به‌طور متوسط 30 درصد پیام‌های بیشتری ارسال می‌کنند و کارگران گزارش می‌دهند که روزانه 40 تا 60 دقیقه صرفه‌جویی می‌کنند. @OpenAI
  • گزارش Menlo Ventures نشان می‌دهد که Anthropic با 40 درصد از 37 میلیارد دلار هزینه، بازار هوش مصنوعی سازمانی را رهبری می‌کند و از OpenAI به‌عنوان ارائه‌دهنده‌ی مدل شماره 1 پیشی گرفته است، با هوش مصنوعی مولد که 6 درصد از هزینه‌های نرم‌افزار را به خود اختصاص داده و سالانه 3.2 برابر رشد می‌کند. @deedydas
  • پذیرش هوش مصنوعی سازمانی نشان‌دهنده‌ی تغییر از ساخت راه‌حل‌های سفارشی به خرید مدل‌های آماده است، به‌طوری که شرکت‌هایی که راه‌حل‌های هوش مصنوعی خود را می‌سازند از نیمی به یک‌چهارم کاهش یافته‌اند. @deedydas
  • کدنویسی با اختلاف قابل‌توجهی بر هزینه‌های هوش مصنوعی دپارتمانی غالب است، در حالی که مراقبت‌های بهداشتی در کاربردهای هوش مصنوعی عمودی پیشتاز است و پس از آن بخش‌های حقوقی، خلاقان و دولتی با فاصله قرار دارند. @deedydas
  • OpenAI دنیس درسِر، مدیرعامل سابق Slack، را به‌عنوان مدیر ارشد درآمد منصوب کرد تا استراتژی درآمد جهانی و پشتیبانی مشتری در مقیاس را رهبری کند. @OpenAI
  • مایکروسافت از سرمایه‌گذاری 17.5 میلیارد دلاری در هند تا سال 2029 خبر داد، بزرگترین سرمایه‌گذاری خود در آسیا، برای ساخت زیرساخت‌های هوش مصنوعی، مهارت‌ها و قابلیت‌های حاکمیتی. @satyanadella
  • Anthropic همکاری خود را با Accenture گسترش داد و گروه تجاری Accenture Anthropic را با 30,000 متخصص آموزش‌دیده در Claude ایجاد کرد تا به شرکت‌ها در انتقال از پروژه‌های آزمایشی هوش مصنوعی به تولید کمک کند. @AnthropicAI
  • چین در حال بررسی اجازه دسترسی محدود به تراشه‌های H200 انویدیا با الزامات توجیه، محدودیت در خریدهای بخش دولتی و یارانه‌ها فقط برای تراشه‌های داخلی است. @AndrewCurran_
  • تراشه‌های H200 انویدیا که برای صادرات به چین آزاد شده‌اند، ابتدا تحت بررسی امنیت ملی در ایالات متحده قرار خواهند گرفت و 25 درصد از هزینه به‌عنوان مالیات واردات به‌جای مالیات صادرات طبقه‌بندی می‌شود. @AndrewCurran_
  • OpenAI، Anthropic و Block بنیاد Agentic AI را تحت بنیاد لینوکس تأسیس کردند تا از استانداردهای باز و قابل همکاری برای هوش مصنوعی عامل‌محور حمایت کنند، با اهدای پروتکل Model Context توسط Anthropic. @OpenAINewsroom
  • شاخص شفافیت مدل بنیاد 2025 استنفورد نشان می‌دهد که شفافیت در صنعت هوش مصنوعی در حال پسرفت است و دستاوردهای سال گذشته را معکوس می‌کند، به‌طوری که IBM امتیاز 95/100 و xAI امتیاز 14/100 را کسب کرده است. @StanfordHAI
  • سه نفر از هر ده نوجوان آمریکایی روزانه از چت‌بات‌های هوش مصنوعی استفاده می‌کنند، اما نگرانی‌های ایمنی در میان والدین و مربیان در حال افزایش است. @TechCrunch
  • توسعه‌ی مبتنی بر ارتقا در شرکت‌های بزرگ فناوری، در حالی که مورد انتقاد قرار گرفته است، به سازمان‌ها کمک می‌کند تا چابک و قادر به نوآوری سریع باقی بمانند، همانطور که با ارسال سریع گوگل با Gemini و هوش مصنوعی مشهود است. @GergelyOrosz
  • داده‌های استفاده از OpenAI نشان می‌دهد که 5 درصد برتر کاربران 6 برابر بیشتر از میانگین پیام ارسال می‌کنند، با کدنویسی، نوشتن و تحلیل که بزرگترین شکاف‌ها را بین کاربران قدرتمند و کاربران عادی نشان می‌دهد. @soleio
  • Boom Supersonic 300 میلیون دلار برای ساخت توربین‌های گاز طبیعی برای مراکز داده Crusoe جمع‌آوری کرد و از فناوری مافوق صوت برای تأمین مالی توسعه‌ی هواپیما از طریق سود توربین‌ها استفاده می‌کند. @TechCrunch

اخلاق و جامعه

  • محققان Anthropic Selective Gradient Masking (SGTM) را توسعه دادند تا دانش پرخطر را در پارامترهای مدل جداگانه ایزوله کنند که می‌توانند بدون تأثیر گسترده بر عملکرد حذف شوند، که برای بازیابی دانش فراموش‌شده در مقایسه با روش‌های قبلی فراموشی، 7 برابر بیشتر به تنظیم دقیق نیاز دارد. @AnthropicAI
  • هیئت کالیفرنیا پیشنهاد می‌کند که شرکت‌های هوش مصنوعی به یک نهاد دولتی مرکزی که نماینده‌ی دارندگان حق تکثیر است، حق امتیاز پرداخت کنند و مدل فعلی انصراف را برای محافظت از آثار خلاقانه ناکارآمد می‌داند. @AndrewCurran_
  • اتحادیه‌ی اروپا تحقیقات ضد انحصار را در مورد ابزارهای جستجوی هوش مصنوعی گوگل آغاز کرد و اقدامات بالقوه ضد رقابتی در ویژگی‌های جستجوی مبتنی بر هوش مصنوعی را بررسی می‌کند. @TechCrunch
  • Ring آمازون ویژگی تشخیص چهره‌ی مبتنی بر هوش مصنوعی بحث‌برانگیز را برای زنگ‌های ویدئویی خود عرضه کرد که نگرانی‌هایی را در مورد حریم خصوصی در میان کاربران و مدافعان ایجاد کرده است. @TechCrunch
  • آرویند نارایانان هشدار می‌دهد که ردیاب‌های هوش مصنوعی مانند Pangram، با وجود ادعای نرخ مثبت کاذب 1 در 10,000، اگر به‌طور سیستماتیک استفاده شوند، همچنان 5 تا 10 درصد از دانش‌آموزان را در طول چهار سال به‌طور کاذب به تقلب متهم خواهند کرد. @random_walker
  • لوایح هوش مصنوعی کالیفرنیا ابهامات تعریفی را در مورد اصطلاحاتی مانند مدل‌های مرزی و اقدامات معقول ایجاد می‌کنند، با پتانسیل اینکه شرکت‌های ناخواسته را در بر بگیرند یا امکان دور زدن از طریق تنظیم دقیق را فراهم کنند. @random_walker
  • وزارت دفاع ایالات متحده پلتفرم GenAi.mil را راه‌اندازی کرد که مدل‌های هوش مصنوعی پیشرفته را مستقیماً در اختیار پرسنل نظامی قرار می‌دهد، با شروع ادغام Gemini. @AndrewCurran_

کاربردها

  • تحقیقات Perplexity با تحلیل صدها میلیون تعامل کاربر نشان می‌دهد که 55 درصد از پرس‌وجوهای عامل از استفاده‌ی شخصی، 30 درصد حرفه‌ای و 16 درصد آموزشی است، با کار شناختی که با 36 درصد بهره‌وری و 21 درصد وظایف یادگیری غالب است. @perplexity_ai
  • مایکروسافت و شرکا GigaTIME را در مجله‌ی Cell منتشر کردند، یک ابزار هوش مصنوعی که پروتئومیکس فضایی را از اسلایدهای پاتولوژی روتین برای تحقیقات سرطان در مقیاس جمعیتی در ده‌ها نوع سرطان شبیه‌سازی می‌کند. @satyanadella
  • Waymo پیشرفته‌ترین کاربرد در مقیاس بزرگ هوش مصنوعی تجسم‌یافته را در رانندگی خودران نشان می‌دهد، با استفاده از تقطیر از مدل‌های بزرگتر برای ایجاد مدل‌های کارآمد محاسباتی در خودرو. @JeffDean
  • Stripe با Instacart همکاری می‌کند تا پرداخت مستقیم در ChatGPT را با استفاده از پروتکل Agentic Commerce و توکن‌های پرداخت مشترک Stripe برای مدیریت پرداخت امن فعال کند. @gdb
  • OpenAI با دویچه تلکام همکاری می‌کند تا هوش مصنوعی را به میلیون‌ها مشتری و کسب‌وکار در سراسر اروپا بیاورد. @gdb
  • Linker Vision از NVIDIA Metropolis، NVIDIA Cosmos و Omniverse در گردش کار شبیه‌سازی-آموزش-استقرار استفاده می‌کند تا به شهرها کمک کند با بینش‌های ویدئویی بلادرنگ از عوامل هوش مصنوعی هوشمندتر شوند. @NVIDIAAI
  • Fireworks AI با Kimi K2 که بر روی سیستم‌های NVIDIA GB200 NVL72 اجرا می‌شود، به بالاترین عملکرد در جدول رده‌بندی Artificial Analysis دست یافت و ارائه‌ی MoE عظیم را متحول کرد. @NVIDIAAI
  • Pryzm 12 میلیون دلار سری A را به رهبری a16z برای ساخت سیستم عامل هوش مصنوعی برای تدارکات فدرال جمع‌آوری کرد و ماه‌ها کار را در چند دقیقه با مجوز IL5 و FedRAMP High فشرده کرد. @a16z
  • Aradigm Health سری A را برای ساخت آینده‌ی پوشش مراقبت‌های بهداشتی با اولویت درمان جمع‌آوری کرد و درمان‌های سلولی و ژنی میلیون دلاری را با تجمیع ریسک و هماهنگی مسیرهای بیمار قابل دسترس کرد. @a16z
  • تح

اخبار هوش مصنوعی در 2025-12-08

مدل‌های جدید هوش مصنوعی

  • Gemini 3 Flash اکنون در LM Arena در دسترس است @legit_api
  • Zhipu AI سری GLM-4.6V را در Hugging Face منتشر کرد که شامل یک مدل زبان-بینایی پرچم‌دار 106B با 128K کانتکست و یک نسخه 9B Flash است و اولین قابلیت بومی فراخوانی تابع (Function Calling) را در خانواده مدل‌های بینایی GLM ارائه می‌دهد @Zai_org

تحلیل صنعت

  • OpenAI در گزارش هوش مصنوعی سازمانی خود اعلام کرد که حجم پیام‌های ChatGPT هشت برابر و مصرف توکن استدلال API به ازای هر سازمان 320 برابر نسبت به سال گذشته افزایش یافته است @AndrewCurran_
  • ChatGPT اکنون روزانه 2.5 میلیارد درخواست را پردازش می‌کند که تنها چند ماه پیش 1 میلیارد بود، و 70% از مصرف‌کنندگان اکنون ابزارهای هوش مصنوعی را برای توصیه‌ی محصول به جستجوی سنتی ترجیح می‌دهند @mehdiyarix
  • ترافیک جستجوی هوش مصنوعی 527% نسبت به سال گذشته رشد کرده است در حالی که جستجوی سنتی ثابت مانده است، که نگرانی‌هایی را برای برندهایی که دید هوش مصنوعی خود را ردیابی نمی‌کنند، ایجاد می‌کند @mehdiyarix
  • Skild AI، با حمایت آمازون و تأسیس‌شده توسط محققان سابق متا، در حال جذب دور جدیدی از سرمایه‌گذاری از NVIDIA و SoftBank با ارزش 14 میلیارد دلار است که ارزش آن از ماه ژوئن سه برابر شده است @AndrewCurran_
  • Anthropic و OpenAI به شدت در اروپا استخدام می‌کنند و 2 تا 3 برابر حقوق پایه مهندسان و محققان هوش مصنوعی در استارتاپ‌های هوش مصنوعی اتحادیه‌ی اروپا را با دفاتر در لندن و سوئیس ارائه می‌دهند @GergelyOrosz
  • Linear در حال تجربه‌ی رشد عظیمی در موارد استفاده‌ای است که توسعه‌دهندگان وظایف را به عامل‌های هوش مصنوعی مانند Cursor و Codex برای پیاده‌سازی واگذار می‌کنند و ردیاب‌های مسائل را به مراکز عامل هوش مصنوعی تبدیل می‌کنند @GergelyOrosz
  • Clay پس از شش سال به 100 میلیون دلار ARR می‌رسد، که در تنها دو سال از 1 میلیون دلار به 100 میلیون دلار رشد کرده است، با صفر ریزش مشتری سازمانی، بیش از 200% NRR سازمانی، و 15 برابر بازگشت سرمایه به ازای هر دلار سرمایه‌گذاری‌شده @vxanand
  • رشد استارتاپ Linear نشان می‌دهد که وقتی کارها درست پیش می‌روند، واقعاً درست پیش می‌روند، و درآمد امسال به تنهایی از تمام سال‌های گذشته بیشتر است @karrisaarinen
  • AWS S3 Vectors را برای ذخیره و استفاده از وکتورها در مقیاس عظیم راه‌اندازی می‌کند، که به طور بالقوه پایگاه‌های داده‌ی فقط وکتور را به چالش می‌کشد زیرا پایگاه‌های داده‌ی رابطه‌ای نیز از وکتور پشتیبانی می‌کنند @GergelyOrosz
  • وزارت بازرگانی صادرات H200 GPU به چین را با حمایت وزیر بازرگانی، هاوارد لوت‌نیک، تأیید کرد @AndrewCurran_
  • IBM Confluent را به مبلغ 11 میلیارد دلار برای تقویت ارائه‌ی داده‌های خود خریداری می‌کند @TechCrunch
  • Tiger Global آینده‌ی سرمایه‌گذاری خطرپذیر محتاطانه‌ای را با یک صندوق 2.2 میلیارد دلاری جدید برنامه‌ریزی می‌کند @TechCrunch
  • مطالعه‌ی آزمایشگاه بودجه‌ی ییل نشان می‌دهد که هوش مصنوعی بر اساس 33 ماه داده پس از انتشار ChatGPT، هیچ اختلال قابل توجهی در بازار کار ایجاد نکرده است، و هوش مصنوعی مسئول نیمی از رشد تولید ناخالص داخلی ایالات متحده است @DavidSacks
  • گزارش Challenger Gray در نوامبر نشان می‌دهد که اخراج‌های مرتبط با هوش مصنوعی 53% نسبت به اکتبر کاهش یافته است، که تنها 6,280 اخراج و فقط 4.7% از کل اخراج‌ها را در سال جاری تشکیل می‌دهد @DavidSacks
  • شکاف بهره‌وری بین دانشگاهیان مرد و زن پس از ChatGPT افزایش یافته است، که احتمالاً به دلیل استفاده‌ی بیشتر مردان از LLMها است @MishaTeplitskiy

اخلاق و جامعه

  • آزمایشگاه‌های هوش مصنوعی نگران استفاده از مدل‌های ویدیویی برای فریب سیاسی بودند، اما اصلی‌ترین استفاده‌ی گمراه‌کننده‌ی آن‌ها نشان دادن حیواناتی است که به روش‌های غیرممکن یا غیرطبیعی رفتار می‌کنند، و اکثر مردم این ویدیوها را واقعی می‌دانند @AndrewCurran_
  • رئیس جمهور ترامپ تأیید می‌کند که یک فرمان اجرایی «یک قانون هوش مصنوعی» این هفته برای ایجاد اولویت فدرال بر قوانین هوش مصنوعی ایالتی صادر خواهد شد، با هدف جلوگیری از مجموعه‌ای از 50 رژیم نظارتی مختلف @AndrewCurran_
  • دیوید ساکس، مدیر ارشد هوش مصنوعی، از رویکرد «یک کتاب قانون» دفاع می‌کند و استدلال می‌کند که بیش از 1200 لایحه در مجالس ایالتی معرفی شده است و بیش از 100 اقدام قبلاً تصویب شده است، که هرج و مرج نظارتی ایجاد می‌کند که می‌تواند نوآوری را متوقف کرده و به چین اجازه دهد پیشتاز شود @AndrewCurran_
  • ایالت‌هایی مانند کلرادو، کالیفرنیا و ایلینوی توسعه‌دهندگان هوش مصنوعی را مسئول تبعیض الگوریتمی تعریف‌شده به عنوان تأثیر نامتناسب بر گروه‌های محافظت‌شده قرار داده‌اند، که لیست کلرادو شامل مهارت زبان انگلیسی نیز می‌شود @AndrewCurran_
  • گروه‌های محیط زیست خواستار توقف ساخت مراکز داده‌ی جدید شده‌اند و نگرانی‌هایی را در مورد تأثیر زیست محیطی زیرساخت‌های هوش مصنوعی مطرح کرده‌اند @TechCrunch
  • سخنرانی کوری دکترو در مورد شک و تردید نسبت به هوش مصنوعی مفهوم سانتور در مقابل سانتور معکوس را معرفی می‌کند: سانتور به معنای انسانی است که هوش مصنوعی را برای افزایش مهارت‌ها کنترل می‌کند، در حالی که سانتور معکوس به معنای سیستمی از هوش مصنوعی است که انسان را هدایت و کنترل می‌کند @simonw
  • وزارت جنگ یک کمیته‌ی راهبری آینده‌ی هوش مصنوعی را با هدف صریح توسعه‌ی پیش‌بینی‌ها، برنامه‌ها و سیاست‌های AGI تأسیس می‌کند @deanwball

کاربردها

  • Google DeepMind اپلیکیشن Lyria Camera را راه‌اندازی می‌کند که از Gemini برای توصیف محیط اطراف استفاده می‌کند در حالی که مدل Lyria RealTime آن درخواست‌ها را به جریان‌های موسیقی در حال تکامل مداوم تبدیل می‌کند @GoogleDeepMind
  • Instacart با ChatGPT ادغام می‌شود و به کاربران امکان می‌دهد بدون خروج از رابط ChatGPT مواد غذایی بخرند @TechCrunch
  • Hinge ویژگی جدید هوش مصنوعی را برای کمک به قرار ملاقات‌کنندگان برای فراتر رفتن از صحبت‌های کوچک خسته‌کننده راه‌اندازی می‌کند @TechCrunch
  • Adobe مرکز ایجاد محتوا را در Premiere mobile برای سازندگان YouTube Shorts راه‌اندازی می‌کند @TechCrunch
  • Anthropic اعلام می‌کند که Claude Code به Slack می‌آید، که نشان‌دهنده‌ی یک ادغام مهم برای گردش کارهای سازمانی است @TechCrunch
  • Thales با Cohere برای توسعه‌ی راه‌حل‌های پیشرفته‌ی هوش مصنوعی برای پشتیبانی در خدمت نیروی دریایی و دریایی در کانادا همکاری می‌کند، با استفاده از ابزارهای هوش مصنوعی عامل‌محور برای تجزیه و تحلیل و انطباق با محیط‌های پیچیده و پویا در زمان واقعی @ThalesCanada
  • پادکست WonderWise از هوش مصنوعی برای تبدیل سوالات علمی کودکان به آهنگ‌های آموزشی استفاده می‌کند، با ترکیب محتوای تولیدشده توسط هوش مصنوعی با روایت انسانی برای ایجاد تجربه‌های یادگیری جذاب @Aalefsrajabali
  • هکاتون xAI کاربردهای متنوع هوش مصنوعی را به نمایش می‌گذارد، از جمله Halftime که به طور پویا تبلیغات تولیدشده توسط هوش مصنوعی را در صحنه‌ها می‌بافد، GrokMarks برای سازماندهی خودکار نشانک‌های X، و Haggle یک عامل صوتی خودمختار برای مذاکره با ارائه‌دهندگان خدمات @xai
  • Clay یک مسیر شغلی و اقتصاد جدید در اطراف مهندسی GTM ایجاد می‌کند، با هزاران شغل باز و صدها آژانس که حول آن ساخته شده‌اند، بسیاری از کارآفرینان برای اولین بار کسب و کارهای 7 رقمی می‌سازند @vxanand
  • Nano Banana Pro جیمینی می‌تواند تصاویر را با آپلود ساده و تعیین نسبت ابعاد دلخواه تغییر اندازه دهد، که کاربرد عملی هوش مصنوعی را نشان می‌دهد @GeminiApp

پژوهش‌ها

  • AxiomProver به طور خودمختار 8 از 12 مسئله‌ی Putnam 2025 را در Lean تا ساعت 3:58 بعد از ظهر در روز مسابقه حل کرد، نمره‌ای که رتبه‌ی 4 را از حدود 4000 شرکت‌کننده کسب می‌کرد و وضعیت Putnam Fellow را به دست می‌آورد @CarinaLHong
  • تحقیقات در مورد پرامپتینگ شخصیت نشان می‌دهد که گفتن به هوش مصنوعی که «شما یک فیزیکدان بزرگ هستید» دقت آن را در پاسخ به سوالات فیزیک به طور قابل توجهی افزایش نمی‌دهد، که نشان می‌دهد شخصیت‌ها دقت را بهبود نمی‌بخشند اما ممکن است فرمت خروجی را تغییر دهند @emollick
  • مطالعه نشان می‌دهد که LLMهای بالینی می‌توانند امتحانات پزشکی را با 84-90% دقت با موفقیت پشت سر بگذارند، اما در وظایف بالینی واقعی با 45-69% و ارزیابی‌های ایمنی با 40-50% عملکرد ضعیفی دارند، که نشان می‌دهد معیارهای سبک امتحان، معیارهای گمراه‌کننده‌ای برای آمادگی بالینی هستند @rohanpaul_ai
  • Unconventional AI 475 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z برای مقابله با هدف بزرگ ساخت تراشه‌های هوش مصنوعی-محور که 1000 برابر کارآمدتر هستند، با هدف کارایی در مقیاس بیولوژیکی در 20 سال آینده، جذب می‌کند <a href="https://x.com/N