اخبار هوش مصنوعی در 2025-12-10
مدلهای جدید هوش مصنوعی
- علیبابا نسخهی ارتقایافتهی Qwen3-Omni-Flash (نسخهی 2025-12-01) را با قابلیتهای بهبودیافتهی درک چندمرحلهای ویدئو/صوت، شخصیت هوش مصنوعی قابل تنظیم از طریق دستورات سیستمی، پشتیبانی از 119 زبان متنی و 19 زبان گفتاری، و کیفیت صدای شبیه به انسان منتشر کرد. @Alibaba_Qwen
- میسترال مدلهای Devstral 2 و Devstral Small 2 را به ترتیب با 123 میلیارد و 24 میلیارد پارامتر منتشر کرد، هرچند با مجوزهای محدودکنندهای که استفاده از آنها را برای شرکتهایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع میکند. @simonw
- میسترال محدودیت کانتکست Vibe را از 100 هزار به 200 هزار توکن افزایش داد. @MistralAI
- نوس ریسرچ (Nous Research) مدل Nomos 1 را به صورت متنباز منتشر کرد؛ این مدل 30 میلیارد پارامتری در مسابقهی ریاضی پاتنام 2024 امتیاز 87 از 120 را کسب کرد و در بین 3,988 شرکتکننده رتبهی دوم را به دست آورد. @NousResearch
- استپفان (StepFun) سیستم استدلال هماهنگ موازی (PaCoRe) را معرفی کرد که به یک مدل 8 میلیارد پارامتری امکان میدهد با زمان محاسباتی چند میلیون توکنی، به امتیاز 94.5% در HMMT25 (که از 93.2% GPT-5 بیشتر است) و 78.2% در LiveCodeBench دست یابد. @StepFun_ai
تحلیل صنعت
- بلومبرگ گزارش میدهد که آزمایشگاه ابرهوش متا از جما (Gemma)، مدل متنباز OpenAI، و کیوون (Qwen) برای آموزش مدل بزرگ بعدی خود با نام رمز آووکادو استفاده میکند که نشاندهندهی تغییر احتمالی از استراتژی متنباز است. @AndrewCurran_
- چتجیپیتی به پردانلودترین اپلیکیشن اپل در سال 2025 در ایالات متحده تبدیل شد؛ طبق گزارش پیو ریسرچ، 64% از نوجوانان آمریکایی از چتباتهای هوش مصنوعی استفاده میکنند و 33% از آنها روزانه از این چتباتها بهره میبرند. @AndrewCurran_
- غولهای فناوری بزرگ حدود 68 میلیارد دلار سرمایهگذاری در هند طی 5 سال آینده را اعلام کردند که هند را پس از ایالات متحده به دومین محرک بزرگ درآمد برای توسعهی هوش مصنوعی تبدیل میکند. @deedydas
- هاگینگ فیس (Hugging Face) اکنون میزبان بیش از 2.2 میلیون مدل است که بیش از 50,000 مدل دارای ارائهدهندهی API هستند و این نشاندهندهی رشد سریع در اکوسیستم هوش مصنوعی متنباز است. @_akhaliq
- گوگل طرح هوش مصنوعی پلاس (AI Plus) با قیمت کمتر از 5 دلار را در هند برای رقابت با چتجیپیتی گو (ChatGPT Go) راهاندازی کرد. @TechCrunch
- اوبو (Oboe) 16 میلیون دلار در سری A به رهبری a16z برای پلتفرم تولید دورههای آموزشی مبتنی بر هوش مصنوعی خود که تجربههای یادگیری شخصیسازیشده ایجاد میکند، جذب سرمایه کرد. @TechCrunch
- کرسر (Cursor) نسخهی 2.2 را با حالت دیباگ (Debug Mode) منتشر کرد که کد را ابزاربندی میکند و دادههای زمان اجرا را به عاملها ارسال میکند، به علاوه بهبودهایی در حالت برنامهریزی (Plan Mode) و قابلیتهای داوری چندعاملی. @cursor_ai
اخلاق و جامعه
- OpenAI اعلام کرد که مدلهای آیندهی آن تحت چارچوب آمادگی (Preparedness Framework) برای امنیت سایبری به قابلیت «بالا» خواهند رسید و این امر مستلزم تقویت تدابیر حفاظتی و همکاری با کارشناسان جهانی برای برتری مدافعان است. @OpenAI
- ایتان مولیک هشدار داد که مجوزهای محدودکنندهی مدلهای میسترال (که استفاده از آنها را برای شرکتهایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع میکند) میتواند مشارکتهای متنباز را محدود کند، زیرا از لحاظ تاریخی بخش زیادی از کار از شرکتهای انتفاعی میآید. @emollick
- گرگلی اوروس (Gergelyi Orosz) مشاهده کرد که لینکدین به شدت محصولات هوش مصنوعی را در همه جا تبلیغ میکند، با محتوای تولیدشده توسط هوش مصنوعی که پلتفرم را پر کرده و درخواستهای شغلی ورودی را تقریباً بیفایده کرده است. @GergelyOrosz
- برایان لاوین (Brian Lovin) گزارش داد که حسابهای جدید X محتوای تولیدشده توسط هوش مصنوعی با کیفیت بسیار پایین، مطالب سیاسی و پستهای بیارزش را به عنوان فید پیشفرض مشاهده میکنند. @brian_lovin
- ایتان مولیک اشاره کرد که روتر خودکار GPT-5 مشکلات ادراکی ایجاد میکند، زیرا بسیاری از نمونههای «چتجیپیتی X را اشتباه انجام داد» در واقع «چتجیپیتی-5 اینستنت اشتباه انجام داد» هستند که منجر به باورهای نادرست در مورد قابلیتهای هوش مصنوعی میشود. @emollick
- جان کارمک پیشنهاد کرد که از تاریخچهی چت LLM به عنوان مرجع شغلی استفاده شود، با این استدلال که تاریخچههای چت چندساله سیگنالهای بهتری نسبت به رزومههای سنتی ارائه میدهند و میتوانند تناسب بین افراد و مشاغل را هم برای کارفرمایان و هم برای کارمندان بهینه کنند. @ID_AA_Carmack
کاربردها
- گوگل با چندین ناشر از جمله در اشپیگل، گاردین، تایمز آو ایندیا و واشنگتن پست برای آزمایش ویژگیهای تعامل هوش مصنوعی از جمله خلاصههای صوتی توسط جمینی در اخبار گوگل همکاری میکند. @AndrewCurran_
- گوگل سرورهای مدیریتشدهی MCP را راهاندازی کرد که به عاملهای هوش مصنوعی امکان میدهد به ابزارهای آن متصل شوند، به علاوه ویژگی «منابع ترجیحی» (Preferred Sources) در جستجو برای سفارشیسازی «اخبار برتر» (Top Stories) از منابع معتبر. @TechCrunch
- فیگما ابزارهای حذف شیء و گسترش تصویر مبتنی بر هوش مصنوعی را در Design و Draw راهاندازی کرد که به کاربران امکان میدهد حواسپرتیها را پاک کنند، پسزمینهها را گسترش دهند و اشیاء را جدا کنند. @figma
- میخائیل پاراخین (Mikhail Parakhin) سیستم SimGym را معرفی کرد که «مشتریان دیجیتال» ایجاد میکند که مانند مشتریان واقعی رفتار میکنند تا فرصتهای بهینهسازی را آشکار کرده و امکان آزمایش A/B را با ترافیک زنده صفر فراهم کند. @MParakhin
- ایتان مولیک نشان داد که نانو بنانا پرو (Nano Banana Pro) در NotebookLM میتواند ارائههای با کیفیت بالا را از مواد منبع با توهمات نادر تولید کند و آن را به عنوان جایگزینی بالقوه برای پاورپوینت معرفی کرد. @emollick
- آندری کارپاتی (Andrej Karpathy) سیستم خودکار نمرهدهی را با استفاده از API GPT 5.1 Thinking ایجاد کرد تا 930 بحث هکر نیوز (Hacker News) از دسامبر 2015 را با نگاهی به گذشته تحلیل کند و پربینندهترین نظرات را با 60 دلار در 1 ساعت شناسایی کند. @karpathy
- لینیر (Linear) گزارش داد که عامل هوش مصنوعی آنها یکی از محبوبترین ویژگیهایشان بوده است، با افزایش قابل توجهی در تعداد مسائل جدید ایجاد شده پس از راهاندازی. @karrisaarinen
- ساتیا نادلا (Satya Nadella) بر همکاری مایکروسافت با وزارت کار هند برای استفاده از هوش مصنوعی برای اتصال بیش از 300 میلیون کارگر غیررسمی به مشاغل بهتر و تامین اجتماعی تاکید کرد. @satyanadella
- CTGT منتات (Mentat) را راهاندازی کرد، یک API سازگار با OpenAI که از قابلیت تفسیر مکانیکی (mechanistic interpretability) برای ارائهی کنترل قطعی بر رفتار LLM به شرکتها استفاده میکند و تضمینهای سیاست ایمنی را بدون نیاز به آموزش مجدد اضافه میکند. @CyrilGorlla
- اسپاتیفای ویژگی «لیستهای پخش پیشنهادی» (Prompted Playlists) مبتنی بر هوش مصنوعی و شخصیسازیشدهتر را آزمایش میکند. @TechCrunch
پژوهشها
- گوگل دیپمایند و گوگل ریسرچ مجموعهی بنچمارک FACTS را توسعه دادند، اولین تست جامع صنعت که واقعیتسنجی LLM را در چهار بعد ارزیابی میکند: دانش مدل داخلی، جستجوی وب، زمینهسازی و ورودیهای چندوجهی، با کسب امتیاز 68.8% توسط جمینی 3 پرو. @GoogleDeepMind
- گوگل کلود AlphaEvolve را معرفی کرد، یک عامل کدنویسی مبتنی بر جمینی برای طراحی الگوریتمهای پیشرفته که از LLMها برای پیشنهاد اصلاحات کد هوشمندانه در یک حلقهی بازخورد استفاده میکند. @GoogleCloudTech
- محققان استنفورد دریافتند که 1 از هر 20 بنچمارک هوش مصنوعی دارای نقصهای جدی است، به این معنی که صنعت مدلهای کمکارایی را تبلیغ کرده و مدلهای بهتر را جریمه کرده است. @StanfordHAI
- مایکروسافت ریسرچ Promptions را معرفی کرد که به توسعهدهندگان کمک میکند کنترلهای پویا و آگاه به کانتکست را به رابطهای چت اضافه کنند تا کاربران بتوانند پاسخهای هوش مصنوعی مولد را بدون نوشتن دستورالعملهای طولانی هدایت کنند. @MSFTResearch
- ناتان لمبرت (Nathan Lambert) سخنرانی جامعی را منتشر کرد که تمام مراحل ساخت Olmo 3 Think را پوشش میدهد، از جمله تغییرات در پیشآموزش، ارزیابی و پسآموزش با تمرکز بر زیرساخت یادگیری تقویتی. @natolambert
- LeRobot Community Datasets v3 تعداد 50 هزار اپیزود را در 46 نوع ربات از 235 مشارکتکننده در سراسر جهان منتشر کرد که یکی از بزرگترین مجموعههای نمایش رباتهای متنباز و جمعسپاریشده است. @danaaubakir
- آدی اولتین (Adi Oltean) آموزش اولین LLM در فضا را با استفاده از NVIDIA H100 در Starcloud-1 اعلام کرد و مدل nanoGPT را با موفقیت بر روی آثار کامل شکسپیر آموزش داد و استنتاج را اجرا کرد. <a href="https://x.com/AdiOltean/status/19987699974310