اخبار هوش مصنوعی در 2025-11-24
مدلهای جدید هوش مصنوعی
- Anthropic مدل Claude Opus 4.5 را منتشر کرد که «بهترین مدل در جهان برای کدنویسی، عاملها و استفاده از کامپیوتر» توصیف شده است. این مدل در بنچمارکهای SWE-Bench و ARC-AGI-1+2 بهترین عملکرد را داشته و در عین حال ۳ برابر ارزانتر از Opus 4.1 است، با قیمت ۵ دلار به ازای هر میلیون توکن ورودی و ۲۵ دلار به ازای هر میلیون توکن خروجی @claudeai
- Opus 4.5 با عملکرد بهتر در SWE-Bench بدون نیاز به تفکر طولانیتر نسبت به حالت استفاده از ۶۴ هزار توکن استدلالی، کارایی توکن برتری را نشان میدهد و در یک آزمون مهندسی عملکرد دشوار، در مدت زمان ۲ ساعت، نمرهای بالاتر از هر داوطلب انسانی کسب کرده است @AndrewCurran_
- متا SAM 3 را با قابلیتهای پیشرفتهی تشخیص و ردیابی اشیاء منتشر کرد و با ConservationX برای ایجاد مجموعهدادهی SA-FARI همکاری کرد که شامل بیش از ۱۰ هزار ویدیوی حاشیهنویسیشده از بیش از ۱۰۰ گونهی حیوانی برای تلاشهای حفاظتی است @AIatMeta
- مایکروسافت ریسرچ Fara-7B را معرفی کرد، یک مدل زبان کوچک عامل بومی که برای استفاده از کامپیوتر طراحی شده و در عین حفظ حریم خصوصی، عملکردی پیشرو در وظایف اتوماسیون وب دارد. این مدل اکنون در Microsoft Foundry و Hugging Face در دسترس است @peteratmsr
- OpenAI قابلیت تحقیق خرید را در ChatGPT راهاندازی کرد که تحقیقات عمیق اینترنتی انجام میدهد، سؤالات توضیحی میپرسد و راهنمای خرید شخصیسازیشده ایجاد میکند، با استفادهی تقریباً نامحدود در طول تعطیلات برای همهی سطوح اشتراک @OpenAI
- گوگل قابلیت Sora styles را معرفی کرد که ۶ سبک بصری مختلف (شکرگزاری، وینتیج، اخبار، سلفی، کمیک، انیمه) را برای تولید ویدیو ارائه میدهد و برای همهی کاربران Sora در وب و iOS در حال انتشار است @soraofficialapp
- گوگل قابلیتهای Nano Banana Pro را برای تولید تصویر با کیفیت بالا با دقت و ثبات از دستورات و طرحهای ساده به نمایش گذاشت @GeminiApp
تحلیل صنعت
- بر اساس دادههای SimilarWeb که بازدیدهای وب دسکتاپ و موبایل را ردیابی میکند، راهاندازی Gemini 3 سهم بازار را از ۲۳٪ به ۳۰٪ افزایش داد که نشاندهندهی دستاوردهای رقابتی قابل توجهی است @deedydas
- Cursor دسترسی به Claude Opus 4.5 را با قیمت Sonnet (۳ برابر ارزانتر از Opus 4.1) تا ۵ دسامبر اعلام کرد که قابلیتهای مدلهای پیشرو را برای توسعهدهندگان قابل دسترستر میکند @cursor_ai
- AWS مبلغ ۵۰ میلیارد دلار را برای ساخت زیرساخت هوش مصنوعی بهطور خاص برای کاربردهای دولت ایالات متحده اختصاص میدهد که نشاندهندهی سرمایهگذاری عمده در استقرار هوش مصنوعی در بخش عمومی است @TechCrunch
- Revolut در افزایش سرمایهی جدید به ارزش ۷۵ میلیارد دلار دست یافت، با تحقیقات بازار که نشان میدهد این شرکت ۲۰-۴۰٪ از همهی افتتاح حسابهای بانکی جدید را در ۶ بازار اروپایی به خود اختصاص داده و هر ۱۷ روز ۱ میلیون مشتری جدید اضافه میکند @aleximm
- X-energy مبلغ ۷۰۰ میلیون دلار در دور سرمایهگذاری سری D جذب کرد و از موج انرژی هستهای که توسط تقاضای برق زیرساختهای هوش مصنوعی هدایت میشود، بهرهمند شد @TechCrunch
اخلاق و جامعه
- Anthropic یک کارت سیستم ۱۵۰ صفحهای برای Opus 4.5 منتشر کرد که شامل ۵۰ صفحه اختصاصیافته به تحقیقات همترازی است و به گفتهی محققان، جامعترین درک مدل در زمان راهاندازی را نشان میدهد @sleepinyourhat
- آزمون بنچمارک جدید هوش مصنوعی بررسی میکند که آیا چتباتها از رفاه انسان محافظت میکنند یا خیر، که به نگرانیهای فزاینده در مورد ایمنی هوش مصنوعی و حفاظت از کاربر میپردازد @TechCrunch
- تحقیقاتی در مورد سوگیری نژادی، روش آزمایشی مبتنی بر ادراکات ناسازگار از نژاد را پیشنهاد میکند و بررسی میکند که آیا یک فرد در صورت درک شدن به عنوان نژادهای مختلف، رفتار متفاوتی دریافت میکند یا خیر، که در Science Advances منتشر شده است @2plus2make5
کاربردها
- اندرو انجی Agentic Reviewer را برای مقالات پژوهشی در paperreview.ai منتشر کرد که همبستگی اسپیرمن ۰.۴۲ بین هوش مصنوعی و داوران انسانی را در مقایسه با ۰.۴۱ بین دو داور انسانی به دست آورد و عملکردی نزدیک به سطح انسانی را در تسریع حلقههای بازخورد پژوهشی نشان میدهد @AndrewYNg
- Claude Opus 4.5 قابلیتهای عملی از جمله ایجاد ارائههای پاورپوینت از دادههای اکسل و دستیابی به بهترین نتایج در آزمونهای تولید شعر در یک تلاش را نشان میدهد @emollick
- SAM 3 متا به ConservationX امکان میدهد تا نرخ بقای گونههای حیوانی را در سطح جهانی با دقت اندازهگیری کند و از تلاشهای جلوگیری از انقراض از طریق تشخیص و ردیابی پیشرفتهی اشیاء حمایت کند @AIatMeta
- گوگل Gemini 3 را در حال کدنویسی یک وبسایت کامل شب رقص با تم رترو از یک دستور ساده به نمایش گذاشت که قابلیتهای توسعهی سرتاسری را نشان میدهد @GoogleDeepMind
- یک توسعهدهنده رابط متنی برای Notion AI ایجاد کرد که ادغام عملی دستیارهای هوش مصنوعی را در جریانهای کاری بهرهوری موجود نشان میدهد @brian_lovin
- مهندسان MIT یک سیستم اولتراسونیک برای تکان دادن آب از برداشتکنندههای آب اتمسفری طراحی کردند که کارایی فناوری جمعآوری آب را بهبود میبخشد @MIT
پژوهشها
- مطالعهای بر روی GPT-4o و GPT-3.5 نشان میدهد که هوش مصنوعی به عنوان یک تقویتکننده عمل میکند، جایی که کاربران با توانایی خلاقانه و شناختی بالاتر بدون هوش مصنوعی، با هوش مصنوعی کار بهتری تولید میکنند، با توانایی پایه که ۴۰٪ از واریانس در عملکرد خلاقانه با کمک هوش مصنوعی را پیشبینی میکند @emollick
- تحقیقاتی در مورد مدلهای چندوجهی کوچک، تنگناهای ادراک و استدلال را هنگام کاهش اندازهی مدل بررسی میکند و بینشهایی در مورد آنچه در طول فشردهسازی مدل از بین میرود، ارائه میدهد @mark_endo1
- مقالهی Google DeepMind در مورد پیشآموزش فضای پیکسل خام پیشبینی میکند که مدلسازی پیکسل بعدی در عرض پنج سال به طبقهبندی ImageNet رقابتی (بیش از ۸۰٪ دقت Top-1) و معیارهای تولید (۹۰ فاصلهی فرشه) دست خواهد یافت @skywalkeryxc
- محققان اشاره میکنند که حذف واگرایی KL از تابع زیان GRPO در حال تبدیل شدن به یک استاندارد برای خطوط لولهی استدلال و آموزش RL است بدون اینکه باعث بیثباتی آموزش شود، که تفاوتهای بین RL برای LLMها و RL عمیق سنتی را برجسته میکند @cwolferesearch
- تحقیقات RL چندوظیفهای BRC را معرفی میکند، یک دستورالعمل ساده که از عاملهای تکوظیفهای پیشرفته با استفاده از محاسبات کمتر بهتر عمل میکند و قابلیتهای انتقال و تنظیم دقیق به سبک LLM را باز میکند @mic_nau
- یک توسعهدهنده نشان میدهد که با افزودن دستورالعمل استفاده از ابزار mgrep تازه منتشر شده، تحلیل کد Claude را ۲ برابر سریعتر کرده و از نصف توکنها استفاده میکند که بهبودهای قابل توجهی در سرعت، کارایی و کیفیت را نشان میدهد @isaac_flath