اخبار هوش مصنوعی در 2025-12-15
مدلهای جدید هوش مصنوعی
- NVIDIA مدل Nemotron 3 Nano را منتشر کرد، یک مدل استدلال ترکیبی 30B با معماری ترکیب متخصصان که طراحی مامبا-ترنسفورمر را ترکیب میکند. این مدل دارای پنجرهی متنی 1M و عملکرد پیشرو در معیارهای SWE-Bench، استدلال و چت است @ctnzr
- NVIDIA خانوادهی کامل Nemotron 3 را با شفافیت بیسابقه معرفی کرد و دادههای آموزشی، کتابخانهی یادگیری تقویتی NeMo Gym و کد آموزشی کامل را در کنار مدلها منتشر کرد. نسخههای Super و Ultra در ماههای آینده عرضه خواهند شد @nvidianewsroom
- علیبابا Qwen Code v0.5.0 را با یکپارچهسازی VSCode، SDK بومی TypeScript، پشتیبانی از مدلهای استدلال سازگار با OpenAI از جمله DeepSeek V3.2 و Kimi-K2 و پشتیبانی از زبان روسی منتشر کرد @Alibaba_Qwen
- اپل Sharp را منتشر کرد، یک مدل سنتز دید تکچشمی که قادر به تولید نماها در کمتر از یک ثانیه است @_akhaliq
- AI2 مدل Bolmo را معرفی کرد، اولین مدل زبان کاملاً باز در سطح بایت که با بایتسازی Olmo 3 ساخته شده است و در طیف وسیعی از وظایف با مدلهای زیرکلمهای پیشرفته برابری میکند یا از آنها پیشی میگیرد @allen_ai
تحلیل صنعت
- مهندسان ارشد در شرکتهای برتر فناوری گزارش میدهند که وظایف آنها اکنون عمدتاً شامل پرامپتنویسی برای Cursor یا Claude Code با Opus 4.5 و بررسی صحت خروجی است، که نشان میدهد هوش مصنوعی از آستانهی تعمیم به اکثر وظایف نرمافزاری عبور کرده است @deedydas
- یک توسعهدهنده گزارش میدهد که 260 دلار توکن برای تکمیل یک مهاجرت سهروزه که تخمین زده میشد هفتهها طول بکشد، هزینه کرده است. این موضوع این سؤال را مطرح میکند که آیا شرکتها هزینههای سالانهی 12 تا 35 هزار دلاری توکن به ازای هر توسعهدهنده را علاوه بر حقوق جذب خواهند کرد یا خیر @GergelyOrosz
- شرکتها برای توجیه هزینههای هوش مصنوعی، به دنبال افزایش 20 درصدی بهرهوری هستند، و عدم پیشبینیپذیری هزینههای اندازهگیریشده، ترجیح برنامههای کدنویسی هوش مصنوعی با قیمت ثابت را بر مدلهای پرداخت به ازای استفاده، افزایش میدهد @GergelyOrosz
- توسعهدهندگان باتجربه ارزش بسیار بیشتری از ابزارهای هوش مصنوعی نسبت به توسعهدهندگان کمتجربه استخراج میکنند، زیرا آنها میتوانند وظایف را به طور دقیق مشخص کنند، نه اینکه از پرامپتهای عمومی استفاده کنند @GergelyOrosz
- رئیسجمهور ترامپ US Tech Force را راهاندازی کرد که 1000 مهندس را با همکاری OpenAI، Oracle، Palantir، Anduril، Apple، Amazon، Google، Microsoft، NVIDIA و xAI برای ابتکارات فناوری با تأثیر بالا استخدام میکند @AndrewCurran_
- Mirelo 41 میلیون دلار سرمایهی اولیه را به رهبری a16z و Index برای مدل بنیادی متمرکز بر لایهی صوتی برای تولید ویدئو جذب کرد @a16z
- First Voyage 2.5 میلیون دلار برای یک همراه هوش مصنوعی که به کاربران در ساخت عادتها کمک میکند، جذب کرد @TechCrunch
- Sierra دفتر جدیدی در پاریس راهاندازی کرد زیرا این شرکت در حال گسترش بینالمللی است @btaylor
پژوهشها
- انتشار Olmo 3 استاندارد جدیدی را برای شفافیت با انتشار کامل دادهها، گزارش 100 صفحهای، زیرساخت آموزشی باز و ارزیابیهای قابل تکرار تعیین میکند و آزمایشهای دقیق را با مانع صفر برای ورود امکانپذیر میسازد @cwolferesearch
- Nemotron 3 Nano با تنها 3.6B پارامتر فعال از 31.6B کل، به امتیاز شاخص هوش 52 دست مییابد که 6 امتیاز از Qwen3 30B با اندازهی مشابه و 15 امتیاز بهبود نسبت به Nemotron Nano 9B V2 قبلی دارد @ArtificialAnlys
- همهی مدلهای هوش مصنوعی پیشرفته اکنون همهی سطوح آزمون دشوار تحلیلگر مالی خبره (CFA) را با استفاده از آزمونهای آزمایشی پولی برای کاهش خطر نشت، پشت سر میگذارند، با استراتژی پرامپتنویسی که تأثیر حداقلی بر اکثر انواع سؤالات نشان میدهد @emollick
- DisCIPL MIT از LLM برای هدایت مدلهای زبان کوچکتر برای همکاری در وظایف باز با محدودیتهایی مانند پازلهای پیشرفته و اثباتهای ریاضی استفاده میکند و به دقت و کارایی قابل مقایسه با مدلهای پیشرو دست مییابد @MIT_CSAIL
- استادی که از نظر تاریخی نسبت به مفید بودن مدلها شکاک بود، گزارش میدهد که GPT 5.2 Pro گام بزرگی در مفید بودن برای کاربردهای پژوهشی هندسهی جبری و نظریهی اعداد است @AndrewCurran_
- چارچوب Parallel-Distill-Refine انویدیا به دقت 93.3% در AIME 2024 دست مییابد در مقایسه با 79.4% برای زنجیرهی فکری طولانی استاندارد با تأخیر یکسان، که نشان میدهد تکرار حافظهی محدود میتواند جایگزین ردیابیهای استدلالی طولانی شود @rsalakhu
- Prime Intellect با NVIDIA همکاری میکند تا محیطهای RL NeMo Gym را در Environments Hub خود ادغام کند و مقیاسبندی یادگیری تقویتی را برای تیمها آسانتر کند @AndrewCurran_
کاربردها
- Gemini Agent گوگل اکنون برای کاربران Google AI Ultra در ایالات متحده در دسترس است و قادر به انجام وظایفی مانند اجارهی خودرو با مقایسهی قیمتها، جمعآوری اطلاعات صندوق ورودی و رزرو در محدودیتهای بودجه است @GeminiApp
- Figma Slides و Figma Buzz اکنون در ChatGPT برای ایجاد ارائهها و دعوتنامهها از طریق رابط مکالمهای در دسترس هستند @figma
- IBM CUGA را منتشر کرد، یک عامل سازمانی متنباز که وظایف را با نوشتن و اجرای کد با توجه به فایلهای فضای کاری خودکار میکند، با ابزارهای داخلی برای وظایف سازمانی و پشتیبانی MCP @huggingface
- شریک تجاری اجرایی Zapier، عامل آمادهسازی جلسات مبتنی بر هوش مصنوعی، مربی جلسات برای هماهنگی تیم اجرایی و سیستم بررسی پیشنویس اسناد را پیادهسازی میکند که امکان بازخورد در سطح مدیرعامل را قبل از جلسات فراهم میکند @clairevo
- یک توسعهدهنده گزارش میدهد که وظایف پیچیده را از طریق Codex با GPT 5.2 Extra High به ترتیب برای 2.5 و 1.75 ساعت اجرا کرده است و همهی معیارهای پذیرش را با پوشش کامل تست و بدون کد خراب تکمیل کرده است @gdb
- Zoom دستیار هوش مصنوعی را به وب میآورد و دسترسی را برای کاربران رایگان فراهم میکند @TechCrunch
اخلاق و جامعه
- Merriam-Webster کلمهی slop را به عنوان کلمهی سال 2025 نامگذاری کرد که منعکسکنندهی نگرانیها در مورد کیفیت محتوای تولیدشده توسط هوش مصنوعی است @TechCrunch
- چتباتها در مدیریت فایل به گونهای مشکل دارند که نسخههای CLI ندارند، به طوری که Gemini اغلب فایلهای ارجاعشده را اشتباه میگیرد و ChatGPT اغلب فایلهای تولیدشده را اشتباه قرار میدهد @emollick
- ویژگی فشردهسازی مکالمهی Claude برای کارهای دانشی به خوبی کدنویسی کار نمیکند و برخلاف پنجرههای متنی چرخشی، لحن و جریان را به طور ناگهانی بازنشانی میکند @emollick