اخبار هوش مصنوعی در 2025-12-10

مدل‌های جدید هوش مصنوعی

  • علی‌بابا نسخه‌ی ارتقایافته‌ی Qwen3-Omni-Flash (نسخه‌ی 2025-12-01) را با قابلیت‌های بهبودیافته‌ی درک چندمرحله‌ای ویدئو/صوت، شخصیت هوش مصنوعی قابل تنظیم از طریق دستورات سیستمی، پشتیبانی از 119 زبان متنی و 19 زبان گفتاری، و کیفیت صدای شبیه به انسان منتشر کرد. @Alibaba_Qwen
  • میسترال مدل‌های Devstral 2 و Devstral Small 2 را به ترتیب با 123 میلیارد و 24 میلیارد پارامتر منتشر کرد، هرچند با مجوزهای محدودکننده‌ای که استفاده از آن‌ها را برای شرکت‌هایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع می‌کند. @simonw
  • میسترال محدودیت کانتکست Vibe را از 100 هزار به 200 هزار توکن افزایش داد. @MistralAI
  • نوس ریسرچ (Nous Research) مدل Nomos 1 را به صورت متن‌باز منتشر کرد؛ این مدل 30 میلیارد پارامتری در مسابقه‌ی ریاضی پاتنام 2024 امتیاز 87 از 120 را کسب کرد و در بین 3,988 شرکت‌کننده رتبه‌ی دوم را به دست آورد. @NousResearch
  • استپ‌فان (StepFun) سیستم استدلال هماهنگ موازی (PaCoRe) را معرفی کرد که به یک مدل 8 میلیارد پارامتری امکان می‌دهد با زمان محاسباتی چند میلیون توکنی، به امتیاز 94.5% در HMMT25 (که از 93.2% GPT-5 بیشتر است) و 78.2% در LiveCodeBench دست یابد. @StepFun_ai

تحلیل صنعت

  • بلومبرگ گزارش می‌دهد که آزمایشگاه ابرهوش متا از جما (Gemma)، مدل متن‌باز OpenAI، و کیو‌ون (Qwen) برای آموزش مدل بزرگ بعدی خود با نام رمز آووکادو استفاده می‌کند که نشان‌دهنده‌ی تغییر احتمالی از استراتژی متن‌باز است. @AndrewCurran_
  • چت‌جی‌پی‌تی به پردانلودترین اپلیکیشن اپل در سال 2025 در ایالات متحده تبدیل شد؛ طبق گزارش پیو ریسرچ، 64% از نوجوانان آمریکایی از چت‌بات‌های هوش مصنوعی استفاده می‌کنند و 33% از آن‌ها روزانه از این چت‌بات‌ها بهره می‌برند. @AndrewCurran_
  • غول‌های فناوری بزرگ حدود 68 میلیارد دلار سرمایه‌گذاری در هند طی 5 سال آینده را اعلام کردند که هند را پس از ایالات متحده به دومین محرک بزرگ درآمد برای توسعه‌ی هوش مصنوعی تبدیل می‌کند. @deedydas
  • هاگینگ فیس (Hugging Face) اکنون میزبان بیش از 2.2 میلیون مدل است که بیش از 50,000 مدل دارای ارائه‌دهنده‌ی API هستند و این نشان‌دهنده‌ی رشد سریع در اکوسیستم هوش مصنوعی متن‌باز است. @_akhaliq
  • گوگل طرح هوش مصنوعی پلاس (AI Plus) با قیمت کمتر از 5 دلار را در هند برای رقابت با چت‌جی‌پی‌تی گو (ChatGPT Go) راه‌اندازی کرد. @TechCrunch
  • اوبو (Oboe) 16 میلیون دلار در سری A به رهبری a16z برای پلتفرم تولید دوره‌های آموزشی مبتنی بر هوش مصنوعی خود که تجربه‌های یادگیری شخصی‌سازی‌شده ایجاد می‌کند، جذب سرمایه کرد. @TechCrunch
  • کرسر (Cursor) نسخه‌ی 2.2 را با حالت دیباگ (Debug Mode) منتشر کرد که کد را ابزاربندی می‌کند و داده‌های زمان اجرا را به عامل‌ها ارسال می‌کند، به علاوه بهبودهایی در حالت برنامه‌ریزی (Plan Mode) و قابلیت‌های داوری چندعاملی. @cursor_ai

اخلاق و جامعه

  • OpenAI اعلام کرد که مدل‌های آینده‌ی آن تحت چارچوب آمادگی (Preparedness Framework) برای امنیت سایبری به قابلیت «بالا» خواهند رسید و این امر مستلزم تقویت تدابیر حفاظتی و همکاری با کارشناسان جهانی برای برتری مدافعان است. @OpenAI
  • ایتان مولیک هشدار داد که مجوزهای محدودکننده‌ی مدل‌های میسترال (که استفاده از آن‌ها را برای شرکت‌هایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع می‌کند) می‌تواند مشارکت‌های متن‌باز را محدود کند، زیرا از لحاظ تاریخی بخش زیادی از کار از شرکت‌های انتفاعی می‌آید. @emollick
  • گرگلی اوروس (Gergelyi Orosz) مشاهده کرد که لینکدین به شدت محصولات هوش مصنوعی را در همه جا تبلیغ می‌کند، با محتوای تولیدشده توسط هوش مصنوعی که پلتفرم را پر کرده و درخواست‌های شغلی ورودی را تقریباً بی‌فایده کرده است. @GergelyOrosz
  • برایان لاوین (Brian Lovin) گزارش داد که حساب‌های جدید X محتوای تولیدشده توسط هوش مصنوعی با کیفیت بسیار پایین، مطالب سیاسی و پست‌های بی‌ارزش را به عنوان فید پیش‌فرض مشاهده می‌کنند. @brian_lovin
  • ایتان مولیک اشاره کرد که روتر خودکار GPT-5 مشکلات ادراکی ایجاد می‌کند، زیرا بسیاری از نمونه‌های «چت‌جی‌پی‌تی X را اشتباه انجام داد» در واقع «چت‌جی‌پی‌تی-5 اینستنت اشتباه انجام داد» هستند که منجر به باورهای نادرست در مورد قابلیت‌های هوش مصنوعی می‌شود. @emollick
  • جان کارمک پیشنهاد کرد که از تاریخچه‌ی چت LLM به عنوان مرجع شغلی استفاده شود، با این استدلال که تاریخچه‌های چت چندساله سیگنال‌های بهتری نسبت به رزومه‌های سنتی ارائه می‌دهند و می‌توانند تناسب بین افراد و مشاغل را هم برای کارفرمایان و هم برای کارمندان بهینه کنند. @ID_AA_Carmack

کاربردها

  • گوگل با چندین ناشر از جمله در اشپیگل، گاردین، تایمز آو ایندیا و واشنگتن پست برای آزمایش ویژگی‌های تعامل هوش مصنوعی از جمله خلاصه‌های صوتی توسط جمینی در اخبار گوگل همکاری می‌کند. @AndrewCurran_
  • گوگل سرورهای مدیریت‌شده‌ی MCP را راه‌اندازی کرد که به عامل‌های هوش مصنوعی امکان می‌دهد به ابزارهای آن متصل شوند، به علاوه ویژگی «منابع ترجیحی» (Preferred Sources) در جستجو برای سفارشی‌سازی «اخبار برتر» (Top Stories) از منابع معتبر. @TechCrunch
  • فیگما ابزارهای حذف شیء و گسترش تصویر مبتنی بر هوش مصنوعی را در Design و Draw راه‌اندازی کرد که به کاربران امکان می‌دهد حواس‌پرتی‌ها را پاک کنند، پس‌زمینه‌ها را گسترش دهند و اشیاء را جدا کنند. @figma
  • میخائیل پاراخین (Mikhail Parakhin) سیستم SimGym را معرفی کرد که «مشتریان دیجیتال» ایجاد می‌کند که مانند مشتریان واقعی رفتار می‌کنند تا فرصت‌های بهینه‌سازی را آشکار کرده و امکان آزمایش A/B را با ترافیک زنده صفر فراهم کند. @MParakhin
  • ایتان مولیک نشان داد که نانو بنانا پرو (Nano Banana Pro) در NotebookLM می‌تواند ارائه‌های با کیفیت بالا را از مواد منبع با توهمات نادر تولید کند و آن را به عنوان جایگزینی بالقوه برای پاورپوینت معرفی کرد. @emollick
  • آندری کارپاتی (Andrej Karpathy) سیستم خودکار نمره‌دهی را با استفاده از API GPT 5.1 Thinking ایجاد کرد تا 930 بحث هکر نیوز (Hacker News) از دسامبر 2015 را با نگاهی به گذشته تحلیل کند و پربیننده‌ترین نظرات را با 60 دلار در 1 ساعت شناسایی کند. @karpathy
  • لینیر (Linear) گزارش داد که عامل هوش مصنوعی آن‌ها یکی از محبوب‌ترین ویژگی‌هایشان بوده است، با افزایش قابل توجهی در تعداد مسائل جدید ایجاد شده پس از راه‌اندازی. @karrisaarinen
  • ساتیا نادلا (Satya Nadella) بر همکاری مایکروسافت با وزارت کار هند برای استفاده از هوش مصنوعی برای اتصال بیش از 300 میلیون کارگر غیررسمی به مشاغل بهتر و تامین اجتماعی تاکید کرد. @satyanadella
  • CTGT منتات (Mentat) را راه‌اندازی کرد، یک API سازگار با OpenAI که از قابلیت تفسیر مکانیکی (mechanistic interpretability) برای ارائه‌ی کنترل قطعی بر رفتار LLM به شرکت‌ها استفاده می‌کند و تضمین‌های سیاست ایمنی را بدون نیاز به آموزش مجدد اضافه می‌کند. @CyrilGorlla
  • اسپاتیفای ویژگی «لیست‌های پخش پیشنهادی» (Prompted Playlists) مبتنی بر هوش مصنوعی و شخصی‌سازی‌شده‌تر را آزمایش می‌کند. @TechCrunch

پژوهش‌ها

  • گوگل دیپ‌مایند و گوگل ریسرچ مجموعه‌ی بنچمارک FACTS را توسعه دادند، اولین تست جامع صنعت که واقعیت‌سنجی LLM را در چهار بعد ارزیابی می‌کند: دانش مدل داخلی، جستجوی وب، زمینه‌سازی و ورودی‌های چندوجهی، با کسب امتیاز 68.8% توسط جمینی 3 پرو. @GoogleDeepMind
  • گوگل کلود AlphaEvolve را معرفی کرد، یک عامل کدنویسی مبتنی بر جمینی برای طراحی الگوریتم‌های پیشرفته که از LLMها برای پیشنهاد اصلاحات کد هوشمندانه در یک حلقه‌ی بازخورد استفاده می‌کند. @GoogleCloudTech
  • محققان استنفورد دریافتند که 1 از هر 20 بنچمارک هوش مصنوعی دارای نقص‌های جدی است، به این معنی که صنعت مدل‌های کم‌کارایی را تبلیغ کرده و مدل‌های بهتر را جریمه کرده است. @StanfordHAI
  • مایکروسافت ریسرچ Promptions را معرفی کرد که به توسعه‌دهندگان کمک می‌کند کنترل‌های پویا و آگاه به کانتکست را به رابط‌های چت اضافه کنند تا کاربران بتوانند پاسخ‌های هوش مصنوعی مولد را بدون نوشتن دستورالعمل‌های طولانی هدایت کنند. @MSFTResearch
  • ناتان لمبرت (Nathan Lambert) سخنرانی جامعی را منتشر کرد که تمام مراحل ساخت Olmo 3 Think را پوشش می‌دهد، از جمله تغییرات در پیش‌آموزش، ارزیابی و پس‌آموزش با تمرکز بر زیرساخت یادگیری تقویتی. @natolambert
  • LeRobot Community Datasets v3 تعداد 50 هزار اپیزود را در 46 نوع ربات از 235 مشارکت‌کننده در سراسر جهان منتشر کرد که یکی از بزرگترین مجموعه‌های نمایش ربات‌های متن‌باز و جمع‌سپاری‌شده است. @danaaubakir
  • آدی اولتین (Adi Oltean) آموزش اولین LLM در فضا را با استفاده از NVIDIA H100 در Starcloud-1 اعلام کرد و مدل nanoGPT را با موفقیت بر روی آثار کامل شکسپیر آموزش داد و استنتاج را اجرا کرد. <a href="https://x.com/AdiOltean/status/19987699974310