اخبار هوش مصنوعی در 2025-12-15

مدل‌های جدید هوش مصنوعی

NVIDIA مدل Nemotron 3 Nano را منتشر کرد، یک مدل استدلال ترکیبی 30B با معماری ترکیب متخصصان که طراحی مامبا-ترنسفورمر را ترکیب می‌کند. این مدل دارای پنجره‌ی متنی 1M و عملکرد پیشرو در معیارهای SWE-Bench، استدلال و چت است @ctnzr
NVIDIA خانواده‌ی کامل Nemotron 3 را با شفافیت بی‌سابقه معرفی کرد و داده‌های آموزشی، کتابخانه‌ی یادگیری تقویتی NeMo Gym و کد آموزشی کامل را در کنار مدل‌ها منتشر کرد. نسخه‌های Super و Ultra در ماه‌های آینده عرضه خواهند شد @nvidianewsroom
علی‌بابا Qwen Code v0.5.0 را با یکپارچه‌سازی VSCode، SDK بومی TypeScript، پشتیبانی از مدل‌های استدلال سازگار با OpenAI از جمله DeepSeek V3.2 و Kimi-K2 و پشتیبانی از زبان روسی منتشر کرد @Alibaba_Qwen
اپل Sharp را منتشر کرد، یک مدل سنتز دید تک‌چشمی که قادر به تولید نماها در کمتر از یک ثانیه است @_akhaliq
AI2 مدل Bolmo را معرفی کرد، اولین مدل زبان کاملاً باز در سطح بایت که با بایت‌سازی Olmo 3 ساخته شده است و در طیف وسیعی از وظایف با مدل‌های زیرکلمه‌ای پیشرفته برابری می‌کند یا از آن‌ها پیشی می‌گیرد @allen_ai

تحلیل صنعت

مهندسان ارشد در شرکت‌های برتر فناوری گزارش می‌دهند که وظایف آن‌ها اکنون عمدتاً شامل پرامپت‌نویسی برای Cursor یا Claude Code با Opus 4.5 و بررسی صحت خروجی است، که نشان می‌دهد هوش مصنوعی از آستانه‌ی تعمیم به اکثر وظایف نرم‌افزاری عبور کرده است @deedydas
یک توسعه‌دهنده گزارش می‌دهد که 260 دلار توکن برای تکمیل یک مهاجرت سه‌روزه که تخمین زده می‌شد هفته‌ها طول بکشد، هزینه کرده است. این موضوع این سؤال را مطرح می‌کند که آیا شرکت‌ها هزینه‌های سالانه‌ی 12 تا 35 هزار دلاری توکن به ازای هر توسعه‌دهنده را علاوه بر حقوق جذب خواهند کرد یا خیر @GergelyOrosz
شرکت‌ها برای توجیه هزینه‌های هوش مصنوعی، به دنبال افزایش 20 درصدی بهره‌وری هستند، و عدم پیش‌بینی‌پذیری هزینه‌های اندازه‌گیری‌شده، ترجیح برنامه‌های کدنویسی هوش مصنوعی با قیمت ثابت را بر مدل‌های پرداخت به ازای استفاده، افزایش می‌دهد @GergelyOrosz
توسعه‌دهندگان باتجربه ارزش بسیار بیشتری از ابزارهای هوش مصنوعی نسبت به توسعه‌دهندگان کم‌تجربه استخراج می‌کنند، زیرا آن‌ها می‌توانند وظایف را به طور دقیق مشخص کنند، نه اینکه از پرامپت‌های عمومی استفاده کنند @GergelyOrosz
رئیس‌جمهور ترامپ US Tech Force را راه‌اندازی کرد که 1000 مهندس را با همکاری OpenAI، Oracle، Palantir، Anduril، Apple، Amazon، Google، Microsoft، NVIDIA و xAI برای ابتکارات فناوری با تأثیر بالا استخدام می‌کند @AndrewCurran_
Mirelo 41 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z و Index برای مدل بنیادی متمرکز بر لایه‌ی صوتی برای تولید ویدئو جذب کرد @a16z
First Voyage 2.5 میلیون دلار برای یک همراه هوش مصنوعی که به کاربران در ساخت عادت‌ها کمک می‌کند، جذب کرد @TechCrunch
Sierra دفتر جدیدی در پاریس راه‌اندازی کرد زیرا این شرکت در حال گسترش بین‌المللی است @btaylor

پژوهش‌ها

انتشار Olmo 3 استاندارد جدیدی را برای شفافیت با انتشار کامل داده‌ها، گزارش 100 صفحه‌ای، زیرساخت آموزشی باز و ارزیابی‌های قابل تکرار تعیین می‌کند و آزمایش‌های دقیق را با مانع صفر برای ورود امکان‌پذیر می‌سازد @cwolferesearch
Nemotron 3 Nano با تنها 3.6B پارامتر فعال از 31.6B کل، به امتیاز شاخص هوش 52 دست می‌یابد که 6 امتیاز از Qwen3 30B با اندازه‌ی مشابه و 15 امتیاز بهبود نسبت به Nemotron Nano 9B V2 قبلی دارد @ArtificialAnlys
همه‌ی مدل‌های هوش مصنوعی پیشرفته اکنون همه‌ی سطوح آزمون دشوار تحلیلگر مالی خبره (CFA) را با استفاده از آزمون‌های آزمایشی پولی برای کاهش خطر نشت، پشت سر می‌گذارند، با استراتژی پرامپت‌نویسی که تأثیر حداقلی بر اکثر انواع سؤالات نشان می‌دهد @emollick
DisCIPL MIT از LLM برای هدایت مدل‌های زبان کوچک‌تر برای همکاری در وظایف باز با محدودیت‌هایی مانند پازل‌های پیشرفته و اثبات‌های ریاضی استفاده می‌کند و به دقت و کارایی قابل مقایسه با مدل‌های پیشرو دست می‌یابد @MIT_CSAIL
استادی که از نظر تاریخی نسبت به مفید بودن مدل‌ها شکاک بود، گزارش می‌دهد که GPT 5.2 Pro گام بزرگی در مفید بودن برای کاربردهای پژوهشی هندسه‌ی جبری و نظریه‌ی اعداد است @AndrewCurran_
چارچوب Parallel-Distill-Refine انویدیا به دقت 93.3% در AIME 2024 دست می‌یابد در مقایسه با 79.4% برای زنجیره‌ی فکری طولانی استاندارد با تأخیر یکسان، که نشان می‌دهد تکرار حافظه‌ی محدود می‌تواند جایگزین ردیابی‌های استدلالی طولانی شود @rsalakhu
Prime Intellect با NVIDIA همکاری می‌کند تا محیط‌های RL NeMo Gym را در Environments Hub خود ادغام کند و مقیاس‌بندی یادگیری تقویتی را برای تیم‌ها آسان‌تر کند @AndrewCurran_

کاربردها

Gemini Agent گوگل اکنون برای کاربران Google AI Ultra در ایالات متحده در دسترس است و قادر به انجام وظایفی مانند اجاره‌ی خودرو با مقایسه‌ی قیمت‌ها، جمع‌آوری اطلاعات صندوق ورودی و رزرو در محدودیت‌های بودجه است @GeminiApp
Figma Slides و Figma Buzz اکنون در ChatGPT برای ایجاد ارائه‌ها و دعوت‌نامه‌ها از طریق رابط مکالمه‌ای در دسترس هستند @figma
IBM CUGA را منتشر کرد، یک عامل سازمانی متن‌باز که وظایف را با نوشتن و اجرای کد با توجه به فایل‌های فضای کاری خودکار می‌کند، با ابزارهای داخلی برای وظایف سازمانی و پشتیبانی MCP @huggingface
شریک تجاری اجرایی Zapier، عامل آماده‌سازی جلسات مبتنی بر هوش مصنوعی، مربی جلسات برای هماهنگی تیم اجرایی و سیستم بررسی پیش‌نویس اسناد را پیاده‌سازی می‌کند که امکان بازخورد در سطح مدیرعامل را قبل از جلسات فراهم می‌کند @clairevo
یک توسعه‌دهنده گزارش می‌دهد که وظایف پیچیده را از طریق Codex با GPT 5.2 Extra High به ترتیب برای 2.5 و 1.75 ساعت اجرا کرده است و همه‌ی معیارهای پذیرش را با پوشش کامل تست و بدون کد خراب تکمیل کرده است @gdb
Zoom دستیار هوش مصنوعی را به وب می‌آورد و دسترسی را برای کاربران رایگان فراهم می‌کند @TechCrunch

اخلاق و جامعه

Merriam-Webster کلمه‌ی slop را به عنوان کلمه‌ی سال 2025 نامگذاری کرد که منعکس‌کننده‌ی نگرانی‌ها در مورد کیفیت محتوای تولیدشده توسط هوش مصنوعی است @TechCrunch
چت‌بات‌ها در مدیریت فایل به گونه‌ای مشکل دارند که نسخه‌های CLI ندارند، به طوری که Gemini اغلب فایل‌های ارجاع‌شده را اشتباه می‌گیرد و ChatGPT اغلب فایل‌های تولیدشده را اشتباه قرار می‌دهد @emollick
ویژگی فشرده‌سازی مکالمه‌ی Claude برای کارهای دانشی به خوبی کدنویسی کار نمی‌کند و برخلاف پنجره‌های متنی چرخشی، لحن و جریان را به طور ناگهانی بازنشانی می‌کند @emollick