اخبار هوش مصنوعی در 2025-11-24

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Opus 4.5 را منتشر کرد که «بهترین مدل در جهان برای کدنویسی، عامل‌ها و استفاده از کامپیوتر» توصیف شده است. این مدل در بنچمارک‌های SWE-Bench و ARC-AGI-1+2 بهترین عملکرد را داشته و در عین حال ۳ برابر ارزان‌تر از Opus 4.1 است، با قیمت ۵ دلار به ازای هر میلیون توکن ورودی و ۲۵ دلار به ازای هر میلیون توکن خروجی @claudeai
Opus 4.5 با عملکرد بهتر در SWE-Bench بدون نیاز به تفکر طولانی‌تر نسبت به حالت استفاده از ۶۴ هزار توکن استدلالی، کارایی توکن برتری را نشان می‌دهد و در یک آزمون مهندسی عملکرد دشوار، در مدت زمان ۲ ساعت، نمره‌ای بالاتر از هر داوطلب انسانی کسب کرده است @AndrewCurran_
متا SAM 3 را با قابلیت‌های پیشرفته‌ی تشخیص و ردیابی اشیاء منتشر کرد و با ConservationX برای ایجاد مجموعه‌داده‌ی SA-FARI همکاری کرد که شامل بیش از ۱۰ هزار ویدیوی حاشیه‌نویسی‌شده از بیش از ۱۰۰ گونه‌ی حیوانی برای تلاش‌های حفاظتی است @AIatMeta
مایکروسافت ریسرچ Fara-7B را معرفی کرد، یک مدل زبان کوچک عامل بومی که برای استفاده از کامپیوتر طراحی شده و در عین حفظ حریم خصوصی، عملکردی پیشرو در وظایف اتوماسیون وب دارد. این مدل اکنون در Microsoft Foundry و Hugging Face در دسترس است @peteratmsr
OpenAI قابلیت تحقیق خرید را در ChatGPT راه‌اندازی کرد که تحقیقات عمیق اینترنتی انجام می‌دهد، سؤالات توضیحی می‌پرسد و راهنمای خرید شخصی‌سازی‌شده ایجاد می‌کند، با استفاده‌ی تقریباً نامحدود در طول تعطیلات برای همه‌ی سطوح اشتراک @OpenAI
گوگل قابلیت Sora styles را معرفی کرد که ۶ سبک بصری مختلف (شکرگزاری، وینتیج، اخبار، سلفی، کمیک، انیمه) را برای تولید ویدیو ارائه می‌دهد و برای همه‌ی کاربران Sora در وب و iOS در حال انتشار است @soraofficialapp
گوگل قابلیت‌های Nano Banana Pro را برای تولید تصویر با کیفیت بالا با دقت و ثبات از دستورات و طرح‌های ساده به نمایش گذاشت @GeminiApp

تحلیل صنعت

بر اساس داده‌های SimilarWeb که بازدیدهای وب دسکتاپ و موبایل را ردیابی می‌کند، راه‌اندازی Gemini 3 سهم بازار را از ۲۳٪ به ۳۰٪ افزایش داد که نشان‌دهنده‌ی دستاوردهای رقابتی قابل توجهی است @deedydas
Cursor دسترسی به Claude Opus 4.5 را با قیمت Sonnet (۳ برابر ارزان‌تر از Opus 4.1) تا ۵ دسامبر اعلام کرد که قابلیت‌های مدل‌های پیشرو را برای توسعه‌دهندگان قابل دسترس‌تر می‌کند @cursor_ai
AWS مبلغ ۵۰ میلیارد دلار را برای ساخت زیرساخت هوش مصنوعی به‌طور خاص برای کاربردهای دولت ایالات متحده اختصاص می‌دهد که نشان‌دهنده‌ی سرمایه‌گذاری عمده در استقرار هوش مصنوعی در بخش عمومی است @TechCrunch
Revolut در افزایش سرمایه‌ی جدید به ارزش ۷۵ میلیارد دلار دست یافت، با تحقیقات بازار که نشان می‌دهد این شرکت ۲۰-۴۰٪ از همه‌ی افتتاح حساب‌های بانکی جدید را در ۶ بازار اروپایی به خود اختصاص داده و هر ۱۷ روز ۱ میلیون مشتری جدید اضافه می‌کند @aleximm
X-energy مبلغ ۷۰۰ میلیون دلار در دور سرمایه‌گذاری سری D جذب کرد و از موج انرژی هسته‌ای که توسط تقاضای برق زیرساخت‌های هوش مصنوعی هدایت می‌شود، بهره‌مند شد @TechCrunch

اخلاق و جامعه

Anthropic یک کارت سیستم ۱۵۰ صفحه‌ای برای Opus 4.5 منتشر کرد که شامل ۵۰ صفحه اختصاص‌یافته به تحقیقات هم‌ترازی است و به گفته‌ی محققان، جامع‌ترین درک مدل در زمان راه‌اندازی را نشان می‌دهد @sleepinyourhat
آزمون بنچمارک جدید هوش مصنوعی بررسی می‌کند که آیا چت‌بات‌ها از رفاه انسان محافظت می‌کنند یا خیر، که به نگرانی‌های فزاینده در مورد ایمنی هوش مصنوعی و حفاظت از کاربر می‌پردازد @TechCrunch
تحقیقاتی در مورد سوگیری نژادی، روش آزمایشی مبتنی بر ادراکات ناسازگار از نژاد را پیشنهاد می‌کند و بررسی می‌کند که آیا یک فرد در صورت درک شدن به عنوان نژادهای مختلف، رفتار متفاوتی دریافت می‌کند یا خیر، که در Science Advances منتشر شده است @2plus2make5

کاربردها

اندرو ان‌جی Agentic Reviewer را برای مقالات پژوهشی در paperreview.ai منتشر کرد که همبستگی اسپیرمن ۰.۴۲ بین هوش مصنوعی و داوران انسانی را در مقایسه با ۰.۴۱ بین دو داور انسانی به دست آورد و عملکردی نزدیک به سطح انسانی را در تسریع حلقه‌های بازخورد پژوهشی نشان می‌دهد @AndrewYNg
Claude Opus 4.5 قابلیت‌های عملی از جمله ایجاد ارائه‌های پاورپوینت از داده‌های اکسل و دستیابی به بهترین نتایج در آزمون‌های تولید شعر در یک تلاش را نشان می‌دهد @emollick
SAM 3 متا به ConservationX امکان می‌دهد تا نرخ بقای گونه‌های حیوانی را در سطح جهانی با دقت اندازه‌گیری کند و از تلاش‌های جلوگیری از انقراض از طریق تشخیص و ردیابی پیشرفته‌ی اشیاء حمایت کند @AIatMeta
گوگل Gemini 3 را در حال کدنویسی یک وب‌سایت کامل شب رقص با تم رترو از یک دستور ساده به نمایش گذاشت که قابلیت‌های توسعه‌ی سرتاسری را نشان می‌دهد @GoogleDeepMind
یک توسعه‌دهنده رابط متنی برای Notion AI ایجاد کرد که ادغام عملی دستیارهای هوش مصنوعی را در جریان‌های کاری بهره‌وری موجود نشان می‌دهد @brian_lovin
مهندسان MIT یک سیستم اولتراسونیک برای تکان دادن آب از برداشت‌کننده‌های آب اتمسفری طراحی کردند که کارایی فناوری جمع‌آوری آب را بهبود می‌بخشد @MIT

پژوهش‌ها

مطالعه‌ای بر روی GPT-4o و GPT-3.5 نشان می‌دهد که هوش مصنوعی به عنوان یک تقویت‌کننده عمل می‌کند، جایی که کاربران با توانایی خلاقانه و شناختی بالاتر بدون هوش مصنوعی، با هوش مصنوعی کار بهتری تولید می‌کنند، با توانایی پایه که ۴۰٪ از واریانس در عملکرد خلاقانه با کمک هوش مصنوعی را پیش‌بینی می‌کند @emollick
تحقیقاتی در مورد مدل‌های چندوجهی کوچک، تنگناهای ادراک و استدلال را هنگام کاهش اندازه‌ی مدل بررسی می‌کند و بینش‌هایی در مورد آنچه در طول فشرده‌سازی مدل از بین می‌رود، ارائه می‌دهد @mark_endo1
مقاله‌ی Google DeepMind در مورد پیش‌آموزش فضای پیکسل خام پیش‌بینی می‌کند که مدل‌سازی پیکسل بعدی در عرض پنج سال به طبقه‌بندی ImageNet رقابتی (بیش از ۸۰٪ دقت Top-1) و معیارهای تولید (۹۰ فاصله‌ی فرشه) دست خواهد یافت @skywalkeryxc
محققان اشاره می‌کنند که حذف واگرایی KL از تابع زیان GRPO در حال تبدیل شدن به یک استاندارد برای خطوط لوله‌ی استدلال و آموزش RL است بدون اینکه باعث بی‌ثباتی آموزش شود، که تفاوت‌های بین RL برای LLMها و RL عمیق سنتی را برجسته می‌کند @cwolferesearch
تحقیقات RL چندوظیفه‌ای BRC را معرفی می‌کند، یک دستورالعمل ساده که از عامل‌های تک‌وظیفه‌ای پیشرفته با استفاده از محاسبات کمتر بهتر عمل می‌کند و قابلیت‌های انتقال و تنظیم دقیق به سبک LLM را باز می‌کند @mic_nau
یک توسعه‌دهنده نشان می‌دهد که با افزودن دستورالعمل استفاده از ابزار mgrep تازه منتشر شده، تحلیل کد Claude را ۲ برابر سریع‌تر کرده و از نصف توکن‌ها استفاده می‌کند که بهبودهای قابل توجهی در سرعت، کارایی و کیفیت را نشان می‌دهد @isaac_flath