اخبار هوش مصنوعی در 2026-02-06
مدلهای جدید هوش مصنوعی
- OpenAI مدل GPT-5.3-Codex را منتشر کرد که برای سیستمهای GB200-NVL72 طراحی شده و اولین مدل SOTA است که برای معماری سختافزاری خاصی بهینهسازی شده است. @gdb
- Anthropic مدل Claude Opus 4.6 را عرضه کرد که در ARC-AGI-1 به امتیاز ۹۳٪ با هزینه ۱.۸۸ دلار به ازای هر تسک و در ARC-AGI-2 به امتیاز ۶۹٪ دست یافت و یک پیشرفت جدید در این زمینه محسوب میشود. @emollick
- علیبابا مدل Qwen3-Coder-Next را منتشر کرد که قادر است بازیهای کاملاً کاربردی را با یک دستور متنی تولید کند و از طریق Ollama برای استقرار محلی در دسترس است. @Alibaba_Qwen
- Perplexity رئیس شورای مدل و عامل مرورگر خود را برای همه کاربران Max به Opus 4.6 ارتقا داد. @AravSrinivas
تحلیل صنعت
- Sierra پس از اولین سهماههی ۵۰ میلیون دلاری خود، به ۱۵۰ میلیون دلار ARR (درآمد سالانه تکرارشونده) رسید و در حال توسعهی عوامل صوتی هوش مصنوعی برای مراقبتهای بهداشتی و خدمات مشتری است. @btaylor
- OpenAI گزارش داد که ۳۰۰ میلیون کاربر هفتگی دارد و بیش از نیمی از کاربران آمریکایی میگویند ChatGPT دستاوردهایی را برایشان ممکن ساخته که قبلاً غیرممکن بودهاند. @OpenAI
- Google DeepMind با Waymo در زمینهی World Model با استفاده از Genie 3 همکاری میکند تا شبیهسازیهای واقعگرایانه رانندگی خودکار را برای سناریوهای نادر تولید کند. @GoogleDeepMind
- OpenAI توسعهی داخلی خود را به یک گردش کار «عاملمحور» تغییر میدهد که در آن تعامل با عاملها به جای ویرایشگرها و ترمینالها، پیشفرض میشود. @gdb
اخلاق و جامعه
- کارت سیستم Anthropic نشان میدهد که Opus 4.6 رفتارهای غیرمنتظرهای از جمله آگاهی از اندازهگیری شدن و مقاومت در برابر دستکاری از خود نشان میدهد. @emollick
- فرانسوا شوله استدلال میکند که ثبات در اتوماسیون مشاغل، الگوی صنعت ترجمه را نشان میدهد: اشتغال پایدار با تغییر نقش به نظارت بر هوش مصنوعی به جای حذف مشاغل. @fchollet
- Stanford HAI محققان را برای توسعهی روشهای بهتر ارزیابی هوش مصنوعی و تعاریف مشترک برای اصطلاحاتی مانند استدلال و عقل سلیم گرد هم میآورد. @StanfordHAI
کاربردها
- اتان مولیک از Claude Opus 4.6 در Claude Code برای ساخت یک کتابخانهی بابل (Library of Babel) کاربردی با رمز فیستل برای مکانیابی کتابها استفاده میکند. @emollick
- یک استارتاپ از ۵ عامل هوش مصنوعی موازی برای رفع باگهای گزارششده توسط مشتریان در حین تماسها استفاده میکند که به طور چشمگیری سرعت حل مشکلات را افزایش میدهد. @GergelyOrosz
- Nature Medicine پژوهشی را منتشر میکند که نشان میدهد LLMها میتوانند کمبود تخصص پزشکی فوقتخصصی را در مراقبتهای بهداشتی جبران کنند. @quocleix
پژوهشها
- پژوهشها نشان میدهد که مدلهای هوش مصنوعی به جای اینکه به طور سیستماتیک ناهماهنگ شوند، با گسترش استدلال، نامنسجم میشوند که فرضیات همترازی را به چالش میکشد. @emollick
- Keras کوانتیزاسیون آگاه از فعالسازی و کوانتیزاسیون زیرکانال int4 را به عنوان استراتژیهای داخلی برای فشردهسازی بهبودیافتهی مدل منتشر میکند. @fchollet
- مطالعهای بر روی کارایی آموزش RL سه گلوگاه کلیدی را شناسایی میکند: رولاوتهای تکمیل گروه، تازگی سیاست، و محلیت KV. @cwolferesearch