اخبار هوش مصنوعی در 2025-12-20
مدلهای جدید هوش مصنوعی
- علیبابا مدل Qwen-Image-Layered را منتشر کرد؛ یک مدل متنباز برای تجزیهی بومی تصاویر با لایهبندی در حد فتوشاپ، لایههای RGBA با جداسازی فیزیکی و ساختار کنترلشده با پرامپت که از 3 تا 10 لایه با عمق تجزیهی بینهایت پشتیبانی میکند @Alibaba_Qwen
- گوگل مدل Gemini 3 Flash را منتشر کرد که عملکردی در سطح پیشرفته با سرعتی 3 برابر سریعتر از 2.5 Pro و با کسری از هزینه ارائه میدهد و اکنون در اپلیکیشن Gemini، حالت هوش مصنوعی در جستجوی گوگل، Google AI Studio و Vertex AI در دسترس است @GoogleAI
- Anthropic ابزار متنباز Bloom را برای تولید ارزیابیهای عدم همترازی رفتاری برای مدلهای پیشرفتهی هوش مصنوعی منتشر کرد که به محققان اجازه میدهد رفتارها را مشخص کرده و فراوانی و شدت آنها را در سناریوهای تولیدشدهی خودکار اندازهگیری کنند @AnthropicAI
- گوگل چندین بهروزرسانی از خانوادهی Gemma را منتشر کرد، از جمله FunctionGemma (نسخهی تخصصی مدل Gemma 3 270M)، T5Gemma 2 (تکامل بعدی مدلهای رمزگذار-رمزگشا) و Gemma Scope 2 (مجموعهی ابزارهای متنباز برای تفسیرپذیری مدلهای زبانی) @GoogleAI
- واترمارک SynthID گوگل اکنون میتواند علاوه بر تصاویر، ویدئوهای تولیدشده با هوش مصنوعی را نیز تأیید کند و تأییدیه مستقیماً در اپلیکیشن Gemini در دسترس است @GoogleAI
- OpenAI تنظیمات شخصیسازی را در ChatGPT معرفی کرد که به کاربران امکان میدهد ویژگیهای خاصی مانند گرمی، اشتیاق و استفاده از ایموجی را تنظیم کنند، با این توضیح که تغییرات لحن بر دقت خروجی تأثیری نمیگذارد @OpenAI
- OpenAI قابلیت «بلوکهای نوشتاری» را در ChatGPT برای سهولت در نگارش ایمیل منتشر کرد که به کاربران امکان میدهد متن را در چت بهروزرسانی و قالببندی کنند، برای تغییرات برجسته کنند، پیشنهادات را بپذیرند یا رد کنند و مستقیماً در کلاینتهای ایمیل باز کنند @jamesfzhang
- Codex اکنون رسماً از مهارتها بر اساس استاندارد agentskills.io پشتیبانی میکند و بستههای قابل استفادهی مجدد از دستورالعملها، اسکریپتها و منابع را فعال میکند که میتوانند مستقیماً فراخوانی شوند یا بهطور خودکار بر اساس پرامپتها انتخاب شوند @OpenAIDevs
- NotebookLM اکنون بر روی Gemini 3 ساخته شده است که بهبودهای قابل توجهی در استدلال و درک چندوجهی به ارمغان میآورد @NotebookLM
- Google Labs ابزار CC را منتشر کرد، یک عامل بهرهوری هوش مصنوعی آزمایشی در Gmail برای خلاصههای روزانهی شخصیسازیشده و کمک ایمیل سفارشی @GoogleAI
- NotebookLM «جداول داده» را به عنوان یک خروجی استودیویی جدید برای سازماندهی و ترکیب آسان دادهها در منابع مختلف اضافه کرد @GoogleAI
- Playables Builder گوگل به عنوان یک اپلیکیشن وب نمونه اولیه در YouTube که با Gemini 3 Pro ساخته شده است، راهاندازی شد و امکان توسعهی بازی از متن کوتاه، ویدئو یا پرامپتهای تصویری را فراهم میکند که قابل بازی در YouTube هستند @GoogleAI
تحلیل صنعت
- گرگ اوروسز مشاهده میکند که با وجود اینکه LLMها کد را 100 برابر سریعتر و 100 برابر بیشتر از توسعهدهندگان انسانی مینویسند، ایجاد نرمافزار با کیفیت همچنان دشوار است و تأکید میکند که بخش دشوار توسعهی نرمافزار هرگز فقط نوشتن کد نبوده، بلکه مدیریت پیچیدگی، آزمایش و حفظ کیفیت بوده است @GergelyOrosz
- Cursor در ادامهی موج خرید خود، Graphite را تصاحب کرد که نشاندهندهی یکپارچگی در بازار ابزارهای توسعهی مبتنی بر هوش مصنوعی است @TechCrunch
- سرمایهگذاران برای سال آینده روی هوش مصنوعی شرطبندی میکنند و طبق تحلیل صنعت، هوش مصنوعی بر تمرکز سرمایهگذاری غالب است @TechCrunch
- استارتاپ Resolve AI که توسط مدیران سابق Splunk تأسیس شده، با تأمین مالی سری A به ارزش 1 میلیارد دلار رسید که نشاندهندهی اشتیاق قوی و مداوم سرمایهگذاران به شرکتهای زیرساخت هوش مصنوعی است @TechCrunch
- گرگ اوروسز نوشتن تستهای واحد و یکپارچهسازی را به عنوان یک مورد استفادهی عالی برای هوش مصنوعی در کدنویسی شناسایی میکند و خاطرنشان میکند که هوش مصنوعی کارهای خستهکنندهی راهاندازی را انجام میدهد در حالی که توسعهدهندگان میتوانند بر بررسی موارد خاص و اطمینان از کیفیت تست تمرکز کنند @GergelyOrosz
- مدیران Salesforce گزارش میدهند که مدلهای زبانی بزرگ را نمیتوان برای اتوماسیون کامل مورد اعتماد قرار داد، که باعث شده آنها یک سیستم ترکیبی با ویژگیهای قطعی «اگر-آنگاه» توسعه دهند که نشاندهندهی بازگشت به رویکردهای سیستمهای خبره از دههی 1980 است @amir
- گرگ اوروسز پیشنهاد میکند که گیت ممکن است با رقابت به عنوان سیستم کنترل نسخهی غالب برای آینده مواجه شود، و خاطرنشان میکند که گیت از مسیرهای عامل پشتیبانی نمیکند و ممکن است برای مخازن عظیمی که عوامل هوش مصنوعی تولید میکنند، کارآمد نباشد @GergelyOrosz
- آمازون طبق گزارشها قصد دارد تا 10 میلیارد دلار در OpenAI سرمایهگذاری کند، با نگرانیهایی در مورد درآمد چرخشی، زیرا OpenAI از این پول برای خرید محصولات آمازون استفاده خواهد کرد @TechCrunch
اخلاق و جامعه
- کتی هوکول، فرماندار نیویورک، قانون RAISE را برای تنظیم ایمنی هوش مصنوعی امضا کرد که نشاندهندهی یک مقررات مهم هوش مصنوعی در سطح ایالتی است @TechCrunch
- مقاله پژوهشی نشان میدهد که 25 مدل هوش مصنوعی مختلف که از آنها خواسته شد استعارهای دربارهی زمان بنویسند، تقریباً همگی «زمان یک رودخانه است» یا «زمان یک بافنده است» را تولید کردند، که احتمالاً به دلیل همپوشانی آموزش، فرآیندهای همترازی و آلودگی دادههای مصنوعی است و نگرانیهایی را در مورد عدم تنوع ایده ایجاد میکند @MParakhin
- مؤسسهی سانتافه اولین چارچوب دقیق ریاضی را برای اینکه یک جهان چه معنایی برای شبیهسازی جهان دیگر دارد، منتشر کرد و نشان داد که چندین ادعای دیرینه در مورد شبیهسازیها تحت تعریف دقیق از بین میروند و امکان اینکه یک جهان قادر به شبیهسازی جهان دیگر باشد، میتواند به طور کامل در داخل آن شبیهسازی بازتولید شود @sfiscience
کاربردها
- NVIDIA مدل متنباز NitroGen را منتشر کرد، یک مدل بنیادی که برای بازی در بیش از 1000 بازی در ژانرهای RPG، پلتفرمر، بتل رویال، مسابقهای، 2D و 3D آموزش دیده است و معماری رباتیک GR00T N1.5 را برای بازی با بیش از 40 هزار ساعت دادهی گیمپلی برای توسعهی استدلال تجسمی، درک و هماهنگی حرکتی تطبیق میدهد @DrJimFan
- قابلیتهای استفاده از کامپیوتر Antigravity با Gemini 3 Flash به شدت ارتقا یافت و هم سریعتر و هم بهتر در انجام وظایف عامل طولانی با استفاده از مرورگر، از جمله تحقیقات عمیق و تجسم کد، عمل میکند @_mohansolo
- Nano Banana Pro گوگل به طور غیرمنتظرهای عملکرد قوی در ایجاد ارائههای پاورپوینت از خود نشان داد که نمونهای از تواناییهای ناهموار هوش مصنوعی است که منجر به پیشرفتهایی در زمینههای غیرمنتظره میشود @emollick
- Claude Code قابلیتهایی فراتر از توسعهی نرمافزار را نشان میدهد و برای هر وظیفهای که با اجرای دستورات روی کامپیوتر قابل انجام است، مؤثر است که نشاندهندهی تغییر از ابزارهای خاص برنامه به عملیات هوش مصنوعی مبتنی بر حالت است @simonw
- کاربران ChatGPT Pro اکنون میتوانند به دوستان خود 3 ماه دسترسی به ChatGPT Plus را بدهند، با لینکهای اشتراکگذاری که از طریق ایمیل یا اعلان برای کاربرانی که از 1 دسامبر عضو Pro بودند، در دسترس است @nickaturley
- SmolVLM از Hugging Face قابلیتهای وبکم بلادرنگ را نشان میدهد که به طور کامل محلی روی MacBook M3 با استفاده از llama.cpp اجرا میشود @DataChaz
- Sierra قابلیتهای جدیدی را با تمرکز بر روابط مشتری به جای مکالمات فردی اعلام کرد و بر واحد اتمی تجربهی مشتری به عنوان یک رابطه تأکید کرد @btaylor
پژوهشها
- ارزیابی METR نشان میدهد که Opus 4.5 در آستانهی موفقیت 50% به مدت 4 ساعت و 49 دقیقه برای مدت زمان وظیفهی خودکار دست یافته است که بسیار فراتر از روند است، اگرچه افق زمانی 80% آن 27 دقیقه باقی میماند که مشابه مدلهای گذشته و کمتر از 32 دقیقهی GPT-5.1-Codex-Max است، با این تفاوت که این شکاف نشاندهندهی یک منحنی موفقیت لجستیکی مسطحتر است زیرا Opus به طور متفاوتی در وظایف طولانیتر موفق میشود @METR_Evals
- تحلیلها نشان میدهد که قابلیتهای عامل هوش مصنوعی برای وظایف کدنویسی در مقایسه با متخصصان انسانی تقریباً هر 4 ماه دو برابر میشود، و Opus 4.5 پیشرفت را تقریباً به این روند نمایی بازگردانده است @aidigest_
- محقق davidad پیشبینی میکند که تا دسامبر 2026، حلقهی خودبهبودی بازگشتی بر روی الگوریتمها احتمالاً بسته خواهد شد، که منجر به یک نقطهی عطف دیگر به سرعتی حتی سریعتر با زمان دو برابر شدن شاید حدود 70-80 روز خواهد شد @davidad
- استفان مکالیر تمرکز تحقیقاتی خود را به تحقیقات همترازی خودکار تغییر میدهد و بر اهمیت اینکه همترازی بتواند در طول انفجار هوش مصنوعی با ورود قریبالوقوع تحقیقات هوش مصنوعی خودکار، همگام باشد، تأکید میکند @McaleerStephen
- کاربران گزارش میدهند که GPT-5.2 در Codex یک تغییر چشمگیر را نشان میدهد که احساس میشود مهمتر از انتقال از 3.5 به 4 است، با عملکرد قوی در پایگاههای کد بزرگ و واقعی و رویکرد روشمند به وظایف @Javi
- پژوهش MMGR (استدلال مولد