اخبار هوش مصنوعی در 2026-02-06

OpenAI مدل GPT-5.3-Codex را منتشر کرد که برای سیستم‌های GB200-NVL72 طراحی شده و اولین مدل SOTA است که برای معماری سخت‌افزاری خاصی بهینه‌سازی شده است. @gdb
Anthropic مدل Claude Opus 4.6 را عرضه کرد که در ARC-AGI-1 به امتیاز ۹۳٪ با هزینه ۱.۸۸ دلار به ازای هر تسک و در ARC-AGI-2 به امتیاز ۶۹٪ دست یافت و یک پیشرفت جدید در این زمینه محسوب می‌شود. @emollick
علی‌بابا مدل Qwen3-Coder-Next را منتشر کرد که قادر است بازی‌های کاملاً کاربردی را با یک دستور متنی تولید کند و از طریق Ollama برای استقرار محلی در دسترس است. @Alibaba_Qwen
Perplexity رئیس شورای مدل و عامل مرورگر خود را برای همه کاربران Max به Opus 4.6 ارتقا داد. @AravSrinivas

Sierra پس از اولین سه‌ماهه‌ی ۵۰ میلیون دلاری خود، به ۱۵۰ میلیون دلار ARR (درآمد سالانه تکرارشونده) رسید و در حال توسعه‌ی عوامل صوتی هوش مصنوعی برای مراقبت‌های بهداشتی و خدمات مشتری است. @btaylor
OpenAI گزارش داد که ۳۰۰ میلیون کاربر هفتگی دارد و بیش از نیمی از کاربران آمریکایی می‌گویند ChatGPT دستاوردهایی را برایشان ممکن ساخته که قبلاً غیرممکن بوده‌اند. @OpenAI
Google DeepMind با Waymo در زمینه‌ی World Model با استفاده از Genie 3 همکاری می‌کند تا شبیه‌سازی‌های واقع‌گرایانه رانندگی خودکار را برای سناریوهای نادر تولید کند. @GoogleDeepMind
OpenAI توسعه‌ی داخلی خود را به یک گردش کار «عامل‌محور» تغییر می‌دهد که در آن تعامل با عامل‌ها به جای ویرایشگرها و ترمینال‌ها، پیش‌فرض می‌شود. @gdb

کارت سیستم Anthropic نشان می‌دهد که Opus 4.6 رفتارهای غیرمنتظره‌ای از جمله آگاهی از اندازه‌گیری شدن و مقاومت در برابر دستکاری از خود نشان می‌دهد. @emollick
فرانسوا شوله استدلال می‌کند که ثبات در اتوماسیون مشاغل، الگوی صنعت ترجمه را نشان می‌دهد: اشتغال پایدار با تغییر نقش به نظارت بر هوش مصنوعی به جای حذف مشاغل. @fchollet
Stanford HAI محققان را برای توسعه‌ی روش‌های بهتر ارزیابی هوش مصنوعی و تعاریف مشترک برای اصطلاحاتی مانند استدلال و عقل سلیم گرد هم می‌آورد. @StanfordHAI

اتان مولیک از Claude Opus 4.6 در Claude Code برای ساخت یک کتابخانه‌ی بابل (Library of Babel) کاربردی با رمز فیستل برای مکان‌یابی کتاب‌ها استفاده می‌کند. @emollick
یک استارتاپ از ۵ عامل هوش مصنوعی موازی برای رفع باگ‌های گزارش‌شده توسط مشتریان در حین تماس‌ها استفاده می‌کند که به طور چشمگیری سرعت حل مشکلات را افزایش می‌دهد. @GergelyOrosz
Nature Medicine پژوهشی را منتشر می‌کند که نشان می‌دهد LLMها می‌توانند کمبود تخصص پزشکی فوق‌تخصصی را در مراقبت‌های بهداشتی جبران کنند. @quocleix

پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی به جای اینکه به طور سیستماتیک ناهماهنگ شوند، با گسترش استدلال، نامنسجم می‌شوند که فرضیات هم‌ترازی را به چالش می‌کشد. @emollick
Keras کوانتیزاسیون آگاه از فعال‌سازی و کوانتیزاسیون زیرکانال int4 را به عنوان استراتژی‌های داخلی برای فشرده‌سازی بهبودیافته‌ی مدل منتشر می‌کند. @fchollet
مطالعه‌ای بر روی کارایی آموزش RL سه گلوگاه کلیدی را شناسایی می‌کند: رول‌اوت‌های تکمیل گروه، تازگی سیاست، و محلیت KV. @cwolferesearch