اخبار هوش مصنوعی در 2025-12-20

مدل‌های جدید هوش مصنوعی

علی‌بابا مدل Qwen-Image-Layered را منتشر کرد؛ یک مدل متن‌باز برای تجزیه‌ی بومی تصاویر با لایه‌بندی در حد فتوشاپ، لایه‌های RGBA با جداسازی فیزیکی و ساختار کنترل‌شده با پرامپت که از 3 تا 10 لایه با عمق تجزیه‌ی بی‌نهایت پشتیبانی می‌کند @Alibaba_Qwen
گوگل مدل Gemini 3 Flash را منتشر کرد که عملکردی در سطح پیشرفته با سرعتی 3 برابر سریع‌تر از 2.5 Pro و با کسری از هزینه ارائه می‌دهد و اکنون در اپلیکیشن Gemini، حالت هوش مصنوعی در جستجوی گوگل، Google AI Studio و Vertex AI در دسترس است @GoogleAI
Anthropic ابزار متن‌باز Bloom را برای تولید ارزیابی‌های عدم هم‌ترازی رفتاری برای مدل‌های پیشرفته‌ی هوش مصنوعی منتشر کرد که به محققان اجازه می‌دهد رفتارها را مشخص کرده و فراوانی و شدت آن‌ها را در سناریوهای تولیدشده‌ی خودکار اندازه‌گیری کنند @AnthropicAI
گوگل چندین به‌روزرسانی از خانواده‌ی Gemma را منتشر کرد، از جمله FunctionGemma (نسخه‌ی تخصصی مدل Gemma 3 270M)، T5Gemma 2 (تکامل بعدی مدل‌های رمزگذار-رمزگشا) و Gemma Scope 2 (مجموعه‌ی ابزارهای متن‌باز برای تفسیرپذیری مدل‌های زبانی) @GoogleAI
واترمارک SynthID گوگل اکنون می‌تواند علاوه بر تصاویر، ویدئوهای تولیدشده با هوش مصنوعی را نیز تأیید کند و تأییدیه مستقیماً در اپلیکیشن Gemini در دسترس است @GoogleAI
OpenAI تنظیمات شخصی‌سازی را در ChatGPT معرفی کرد که به کاربران امکان می‌دهد ویژگی‌های خاصی مانند گرمی، اشتیاق و استفاده از ایموجی را تنظیم کنند، با این توضیح که تغییرات لحن بر دقت خروجی تأثیری نمی‌گذارد @OpenAI
OpenAI قابلیت «بلوک‌های نوشتاری» را در ChatGPT برای سهولت در نگارش ایمیل منتشر کرد که به کاربران امکان می‌دهد متن را در چت به‌روزرسانی و قالب‌بندی کنند، برای تغییرات برجسته کنند، پیشنهادات را بپذیرند یا رد کنند و مستقیماً در کلاینت‌های ایمیل باز کنند @jamesfzhang
Codex اکنون رسماً از مهارت‌ها بر اساس استاندارد agentskills.io پشتیبانی می‌کند و بسته‌های قابل استفاده‌ی مجدد از دستورالعمل‌ها، اسکریپت‌ها و منابع را فعال می‌کند که می‌توانند مستقیماً فراخوانی شوند یا به‌طور خودکار بر اساس پرامپت‌ها انتخاب شوند @OpenAIDevs
NotebookLM اکنون بر روی Gemini 3 ساخته شده است که بهبودهای قابل توجهی در استدلال و درک چندوجهی به ارمغان می‌آورد @NotebookLM
Google Labs ابزار CC را منتشر کرد، یک عامل بهره‌وری هوش مصنوعی آزمایشی در Gmail برای خلاصه‌های روزانه‌ی شخصی‌سازی‌شده و کمک ایمیل سفارشی @GoogleAI
NotebookLM «جداول داده» را به عنوان یک خروجی استودیویی جدید برای سازماندهی و ترکیب آسان داده‌ها در منابع مختلف اضافه کرد @GoogleAI
Playables Builder گوگل به عنوان یک اپلیکیشن وب نمونه اولیه در YouTube که با Gemini 3 Pro ساخته شده است، راه‌اندازی شد و امکان توسعه‌ی بازی از متن کوتاه، ویدئو یا پرامپت‌های تصویری را فراهم می‌کند که قابل بازی در YouTube هستند @GoogleAI

تحلیل صنعت

گرگ اوروسز مشاهده می‌کند که با وجود اینکه LLMها کد را 100 برابر سریع‌تر و 100 برابر بیشتر از توسعه‌دهندگان انسانی می‌نویسند، ایجاد نرم‌افزار با کیفیت همچنان دشوار است و تأکید می‌کند که بخش دشوار توسعه‌ی نرم‌افزار هرگز فقط نوشتن کد نبوده، بلکه مدیریت پیچیدگی، آزمایش و حفظ کیفیت بوده است @GergelyOrosz
Cursor در ادامه‌ی موج خرید خود، Graphite را تصاحب کرد که نشان‌دهنده‌ی یکپارچگی در بازار ابزارهای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch
سرمایه‌گذاران برای سال آینده روی هوش مصنوعی شرط‌بندی می‌کنند و طبق تحلیل صنعت، هوش مصنوعی بر تمرکز سرمایه‌گذاری غالب است @TechCrunch
استارتاپ Resolve AI که توسط مدیران سابق Splunk تأسیس شده، با تأمین مالی سری A به ارزش 1 میلیارد دلار رسید که نشان‌دهنده‌ی اشتیاق قوی و مداوم سرمایه‌گذاران به شرکت‌های زیرساخت هوش مصنوعی است @TechCrunch
گرگ اوروسز نوشتن تست‌های واحد و یکپارچه‌سازی را به عنوان یک مورد استفاده‌ی عالی برای هوش مصنوعی در کدنویسی شناسایی می‌کند و خاطرنشان می‌کند که هوش مصنوعی کارهای خسته‌کننده‌ی راه‌اندازی را انجام می‌دهد در حالی که توسعه‌دهندگان می‌توانند بر بررسی موارد خاص و اطمینان از کیفیت تست تمرکز کنند @GergelyOrosz
مدیران Salesforce گزارش می‌دهند که مدل‌های زبانی بزرگ را نمی‌توان برای اتوماسیون کامل مورد اعتماد قرار داد، که باعث شده آن‌ها یک سیستم ترکیبی با ویژگی‌های قطعی «اگر-آنگاه» توسعه دهند که نشان‌دهنده‌ی بازگشت به رویکردهای سیستم‌های خبره از دهه‌ی 1980 است @amir
گرگ اوروسز پیشنهاد می‌کند که گیت ممکن است با رقابت به عنوان سیستم کنترل نسخه‌ی غالب برای آینده مواجه شود، و خاطرنشان می‌کند که گیت از مسیرهای عامل پشتیبانی نمی‌کند و ممکن است برای مخازن عظیمی که عوامل هوش مصنوعی تولید می‌کنند، کارآمد نباشد @GergelyOrosz
آمازون طبق گزارش‌ها قصد دارد تا 10 میلیارد دلار در OpenAI سرمایه‌گذاری کند، با نگرانی‌هایی در مورد درآمد چرخشی، زیرا OpenAI از این پول برای خرید محصولات آمازون استفاده خواهد کرد @TechCrunch

اخلاق و جامعه

کتی هوکول، فرماندار نیویورک، قانون RAISE را برای تنظیم ایمنی هوش مصنوعی امضا کرد که نشان‌دهنده‌ی یک مقررات مهم هوش مصنوعی در سطح ایالتی است @TechCrunch
مقاله پژوهشی نشان می‌دهد که 25 مدل هوش مصنوعی مختلف که از آن‌ها خواسته شد استعاره‌ای درباره‌ی زمان بنویسند، تقریباً همگی «زمان یک رودخانه است» یا «زمان یک بافنده است» را تولید کردند، که احتمالاً به دلیل هم‌پوشانی آموزش، فرآیندهای هم‌ترازی و آلودگی داده‌های مصنوعی است و نگرانی‌هایی را در مورد عدم تنوع ایده ایجاد می‌کند @MParakhin
مؤسسه‌ی سانتافه اولین چارچوب دقیق ریاضی را برای اینکه یک جهان چه معنایی برای شبیه‌سازی جهان دیگر دارد، منتشر کرد و نشان داد که چندین ادعای دیرینه در مورد شبیه‌سازی‌ها تحت تعریف دقیق از بین می‌روند و امکان اینکه یک جهان قادر به شبیه‌سازی جهان دیگر باشد، می‌تواند به طور کامل در داخل آن شبیه‌سازی بازتولید شود @sfiscience

کاربردها

NVIDIA مدل متن‌باز NitroGen را منتشر کرد، یک مدل بنیادی که برای بازی در بیش از 1000 بازی در ژانرهای RPG، پلتفرمر، بتل رویال، مسابقه‌ای، 2D و 3D آموزش دیده است و معماری رباتیک GR00T N1.5 را برای بازی با بیش از 40 هزار ساعت داده‌ی گیم‌پلی برای توسعه‌ی استدلال تجسمی، درک و هماهنگی حرکتی تطبیق می‌دهد @DrJimFan
قابلیت‌های استفاده از کامپیوتر Antigravity با Gemini 3 Flash به شدت ارتقا یافت و هم سریع‌تر و هم بهتر در انجام وظایف عامل طولانی با استفاده از مرورگر، از جمله تحقیقات عمیق و تجسم کد، عمل می‌کند @_mohansolo
Nano Banana Pro گوگل به طور غیرمنتظره‌ای عملکرد قوی در ایجاد ارائه‌های پاورپوینت از خود نشان داد که نمونه‌ای از توانایی‌های ناهموار هوش مصنوعی است که منجر به پیشرفت‌هایی در زمینه‌های غیرمنتظره می‌شود @emollick
Claude Code قابلیت‌هایی فراتر از توسعه‌ی نرم‌افزار را نشان می‌دهد و برای هر وظیفه‌ای که با اجرای دستورات روی کامپیوتر قابل انجام است، مؤثر است که نشان‌دهنده‌ی تغییر از ابزارهای خاص برنامه به عملیات هوش مصنوعی مبتنی بر حالت است @simonw
کاربران ChatGPT Pro اکنون می‌توانند به دوستان خود 3 ماه دسترسی به ChatGPT Plus را بدهند، با لینک‌های اشتراک‌گذاری که از طریق ایمیل یا اعلان برای کاربرانی که از 1 دسامبر عضو Pro بودند، در دسترس است @nickaturley
SmolVLM از Hugging Face قابلیت‌های وب‌کم بلادرنگ را نشان می‌دهد که به طور کامل محلی روی MacBook M3 با استفاده از llama.cpp اجرا می‌شود @DataChaz
Sierra قابلیت‌های جدیدی را با تمرکز بر روابط مشتری به جای مکالمات فردی اعلام کرد و بر واحد اتمی تجربه‌ی مشتری به عنوان یک رابطه تأکید کرد @btaylor

پژوهش‌ها

ارزیابی METR نشان می‌دهد که Opus 4.5 در آستانه‌ی موفقیت 50% به مدت 4 ساعت و 49 دقیقه برای مدت زمان وظیفه‌ی خودکار دست یافته است که بسیار فراتر از روند است، اگرچه افق زمانی 80% آن 27 دقیقه باقی می‌ماند که مشابه مدل‌های گذشته و کمتر از 32 دقیقه‌ی GPT-5.1-Codex-Max است، با این تفاوت که این شکاف نشان‌دهنده‌ی یک منحنی موفقیت لجستیکی مسطح‌تر است زیرا Opus به طور متفاوتی در وظایف طولانی‌تر موفق می‌شود @METR_Evals
تحلیل‌ها نشان می‌دهد که قابلیت‌های عامل هوش مصنوعی برای وظایف کدنویسی در مقایسه با متخصصان انسانی تقریباً هر 4 ماه دو برابر می‌شود، و Opus 4.5 پیشرفت را تقریباً به این روند نمایی بازگردانده است @aidigest_
محقق davidad پیش‌بینی می‌کند که تا دسامبر 2026، حلقه‌ی خودبهبودی بازگشتی بر روی الگوریتم‌ها احتمالاً بسته خواهد شد، که منجر به یک نقطه‌ی عطف دیگر به سرعتی حتی سریع‌تر با زمان دو برابر شدن شاید حدود 70-80 روز خواهد شد @davidad
استفان مک‌الیر تمرکز تحقیقاتی خود را به تحقیقات هم‌ترازی خودکار تغییر می‌دهد و بر اهمیت اینکه هم‌ترازی بتواند در طول انفجار هوش مصنوعی با ورود قریب‌الوقوع تحقیقات هوش مصنوعی خودکار، همگام باشد، تأکید می‌کند @McaleerStephen
کاربران گزارش می‌دهند که GPT-5.2 در Codex یک تغییر چشمگیر را نشان می‌دهد که احساس می‌شود مهم‌تر از انتقال از 3.5 به 4 است، با عملکرد قوی در پایگاه‌های کد بزرگ و واقعی و رویکرد روشمند به وظایف @Javi
پژوهش MMGR (استدلال مولد