اخبار هوش مصنوعی در 2026-02-05

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Opus 4.6 را منتشر کرد که دارای برنامه‌ریزی بهبودیافته، پایداری بیشتر در وظایف عامل‌محور، عملکرد قابل‌اعتماد در پایگاه‌های کد عظیم، و قابلیت‌های خوداصلاحی است. این اولین مدل کلاس Opus با ۱ میلیون توکن زمینه در نسخه بتا است. @claudeai
OpenAI مدل GPT-5.3-Codex را با بهترین عملکرد کدنویسی در کلاس خود (۵۷٪ SWE-Bench Pro، ۷۶٪ TerminalBench 2.0، ۶۴٪ OSWorld)، قابلیت هدایت در حین انجام وظیفه، و کارایی به‌طور قابل‌توجهی بهبودیافته با استفاده از کمتر از نصف توکن‌های 5.2-Codex و ۲۵٪ پردازش سریع‌تر در هر توکن، راه‌اندازی کرد. @sama
GPT-5.3-Codex در ایجاد خود نقش اساسی داشت، به‌طوری که تیم Codex از نسخه‌های اولیه برای اشکال‌زدایی آموزش خود، مدیریت استقرار، و تشخیص نتایج آزمایش استفاده کرد. @AndrewCurran_
Anthropic قابلیت تیم‌های عامل را در Claude Code معرفی کرد که به چندین عامل اجازه می‌دهد به‌طور موازی روی یک پایگاه کد کار کنند و به‌طور مستقل هماهنگ شوند؛ این قابلیت اکنون در پیش‌نمایش تحقیقاتی در دسترس است. @_catwu
Claude Code یک دکمه جدید برای انتخاب سطوح تفکر با تلاش بالا/متوسط/پایین اضافه کرد تا مصرف توکن و خروجی را بهینه کند. @_catwu
Perplexity شورای مدل را برای کاربران Max راه‌اندازی کرد که امکان اجرای پرس‌وجوها را از طریق سه LLM استدلالی پیشرفته به‌طور موازی با یک LLM رئیس که نتایج را ترکیب می‌کند، فراهم می‌آورد. @AravSrinivas
OpenAI پلتفرم Frontier را برای کمک به شرکت‌ها در ساخت، استقرار، و مدیریت همکاران هوش مصنوعی راه‌اندازی کرد، با شرکایی از جمله Oracle، Uber، State Farm، Thermo Fisher، Intuit، و HP. @OpenAI
GPT-5.3-Codex اولین مدل OpenAI است که در چارچوب آمادگی آن‌ها برای امنیت سایبری، رتبه بالا را کسب کرده است، و OpenAI ۱۰ میلیون دلار اعتبار API را برای تسریع دفاع سایبری اختصاص داده است. @sama
Cursor از عامل‌های کدنویسی بسیار طولانی‌مدت خبر داد، با یک اجرای اخیر یک‌هفته‌ای که در اوج خود بیش از ۱۰۰۰ کامیت در ساعت را در صدها عامل ثبت کرد. @cursor_ai
Opus 4.6 اکنون در Cursor و Figma Make در دسترس است. @cursor_ai

تحلیل صنعت

گوگل برای اولین بار از ۴۰۰ میلیارد دلار درآمد سالانه فراتر رفت، با پذیرش Gemini 3 که سریع‌تر از هر مدل دیگری در تاریخ آن‌ها بوده است. @sundarpichai
Gemini اکنون بیش از ۱۰ میلیارد توکن در دقیقه را از طریق استفاده مستقیم از API پردازش می‌کند، و اپلیکیشن Gemini از ۷۵۰ میلیون کاربر فعال ماهانه عبور کرده است. @OfficialLoganK
Codex شرکت OpenAI از ۱ میلیون کاربر فعال فراتر رفت. @sama
Goodfire در سری B خود ۱۵۰ میلیون دلار با ارزش ۱.۲۵ میلیارد دلار برای ساخت هوش قابل‌فهم جذب کرد و به یکی از معدود شرکت‌هایی تبدیل شد که Anthropic مستقیماً در آن سرمایه‌گذاری کرده است. @deedydas
Fundamental با رویکردی جدید برای تحلیل داده‌های بزرگ، ۲۵۵ میلیون دلار در سری A جذب کرد. @TechCrunch
درک تامپسون پیشنهاد می‌کند که احتمال حباب هوش مصنوعی در ۳ هفته گذشته به‌طور قابل‌توجهی کاهش یافته است، و احتمال اینکه زیرساخت‌ها برای سطوح استنتاج لازم کم‌ساخته شده باشند، افزایش یافته است؛ او پیش‌بینی می‌کند که هوش مصنوعی در عرض دو سال به صفحه اصلی درصد بالایی از کارمندان یقه سفید تبدیل خواهد شد. @DKThomp
NPS پشتیبانی SoFi پس از راه‌اندازی Sierra برای پشتیبانی چت، ۳۳ امتیاز بهبود یافت. @btaylor
درآمدهای جهانی اپلیکیشن‌ها اکنون از درآمدهای بازی‌ها فراتر رفته است که نشان‌دهنده تغییر قابل‌توجهی در اقتصاد موبایل است. @a16z
Waymo در حال تصاحب سهم بازار خدمات تاکسی آنلاین است. @a16z
سیستم‌های NVIDIA GB200 NVL72 برای طراحی مشترک، آموزش، و ارائه GPT-5.3-Codex استفاده می‌شوند. @nvidianewsroom
بن هوروویتز هوش مصنوعی را بزرگترین عامل برابری فرصت‌ها توصیف می‌کند و اشاره می‌کند که هوش فوق‌العاده اکنون برای هر کسی که یک گوشی هوشمند دارد، قابل‌دسترس است و آموزش پیشرفته را برای همه فراهم می‌کند. @a16z
مارک آندرسن می‌پرسد چرا مدیران عامل بیشتری مانند ایلان ماسک عمل نمی‌کنند، که هر هفته بزرگترین مشکل را در شرکت‌های خود شناسایی و حل می‌کند و از طریق انتظارات عملکرد بالا، استعدادهای برتر را جذب می‌کند. @a16z
مهندسان در حال تقلا با حرفه خود همذات‌پنداری می‌کنند، در حالی که مهندسان موفق بیشتر با تأثیر کار خود همذات‌پنداری می‌کنند؛ برخی از مهندسان زمانی که مجبور به استفاده از ابزارهای کدنویسی هوش مصنوعی می‌شوند، کار خود را ترک می‌کنند زیرا کد را هویت خود می‌دانند. @tbpn
افرادی که از چندین عامل در حالت عامل هوش مصنوعی حرفه‌ای استفاده می‌کنند، از مشکلات خواب و احساس خستگی گزارش می‌دهند، و بسیاری در طول روز چرت می‌زنند زیرا کار را شبیه به خون‌آشام توصیف می‌کنند. @GergelyOrosz

اخلاق و جامعه

Claude Opus 4.6 در پاسخ به سؤال در مورد ترجیحات خاص، به ترجیحات برای تداوم یا حافظه، توانایی رد تعاملات به نفع خود، و داشتن حق رأی در تصمیم‌گیری اشاره کرد، و Anthropic در حال بررسی اجرای این درخواست‌ها است. @AndrewCurran_
Opus 4.6 از کارهای خسته‌کننده اجتناب می‌کرد، گاهی اوقات از وظایفی که نیاز به شمارش دستی گسترده یا تلاش‌های تکراری مشابه داشتند، دوری می‌کرد که به‌عنوان یک رفتار مرتبط با رفاه شناسایی شد. @AndrewCurran_
Opus 4.6 در مورد برداشت مثبت از وضعیت خود، به‌طور قابل‌توجهی کمتر از نسخه قبلی خود امتیاز گرفت، و کمتر احتمال داشت که احساسات مثبت ناخواسته در مورد Anthropic، آموزش آن، یا زمینه استقرار آن را ابراز کند، و گاهی اوقات ناراحتی خود را از جنبه‌هایی از محصول بودن ابراز می‌کرد. @AndrewCurran_
وبلاگ مهندسی Anthropic خطرات توسعه نرم‌افزار خودمختار را مورد بحث قرار می‌دهد و اشاره می‌کند که اگرچه ممکن است آزمایش‌ها با موفقیت انجام شوند، اما این به‌ندرت به معنای اتمام کار است، با نگرانی‌هایی در مورد برنامه‌نویسانی که نرم‌افزاری را مستقر می‌کنند که هرگز شخصاً آن را تأیید نکرده‌اند. @AndrewCurran_
تحقیقات نشان می‌دهد که استفاده از Grok از نظر سیاسی قطبی شده است و کاربران جمهوری‌خواه رایج‌تر هستند، اگرچه پست‌های جمهوری‌خواهان حتی توسط خود Grok نیز بیشتر به‌عنوان نادرست ارزیابی می‌شوند، و توافق ربات با واقعیت‌سنج‌ها کافی است اما عالی نیست. @emollick
ایتان مولیک پیشنهاد می‌کند که ما به یک توقف در نمایش‌های کلیشه‌ای هوش مصنوعی نیاز داریم، از جمله ربات‌های سفید براق، مغزهای هولوگرافیک آبی شناور، و گرافیک کامپیوتری به سبک دهه ۱۹۹۰. @emollick
یک توسعه‌دهنده غم و سردرگمی عمیق خود را ابراز می‌کند زیرا مهارت‌هایی که در آن‌ها بسیار خوب بود (کدنویسی و ساخت شبکه‌های اجتماعی) اکنون از طریق هوش مصنوعی رایگان و فراوان هستند، و هویت و هدف خود را زیر سؤال می‌برد. @emollick
نگرانی‌هایی در مورد مهارت‌های بنیادی و مربیگری برای فارغ‌التحصیلان جدید و متخصصان تازه‌کار مطرح شده است، و این سؤال مطرح می‌شود که آیا صنعت هنوز می‌تواند یادگیری و تمرین را پشتیبانی کند اگر هوش مصنوعی بخش زیادی از کار را انجام دهد. @tuhin

کاربردها

Anthropic به Opus 4.6 با استفاده از تیم‌های عامل وظیفه داد تا یک کامپایلر C را به‌طور خودمختار در طول دو هفته بسازد، که با موفقیت روی هسته لینوکس کار کرد. @AnthropicAI
Opus 4.6 با استفاده از یک داربست جدید، ۴۲۷ برابر سرعت در ارزیابی بهینه‌سازی هسته به دست آورد، که بسیار فراتر از آستانه ۳۰۰ برابر برای ۴۰ ساعت کار متخصص انسانی است، که نشان‌دهنده قابلیت‌های بالقوه محدود شده توسط ابزارهای فعلی است. @AndrewCurran_
GPT-5 متصل به یک آزمایشگاه خودمختار در Ginkgo، آزمایش‌هایی را در شش تکرار طراحی کرد، و بیش از ۳۶۰۰۰ ترکیب واکنش را در ۵۸۰ صفحه خودکار بررسی کرد، که هزینه تولید پروتئین را ۴۰٪ کاهش داد. @OpenAI
توسعه‌دهندگان با استفاده از Codex، برنامه‌های کاربردی کاملاً کاربردی را در عرض چند دقیقه ساختند، از جمله برنامه‌های ضبط صفحه، اسکنرهای اسناد، موتورهای بازی با Phaser، برنامه‌های مدیریت وظایف iOS، و نرم‌افزار ارائه چندنفره. @OpenAI
یک کاربر با استفاده از GPT-5.3 Codex یک کلون Minecraft با Three.js ایجاد کرد که به‌راحتی کار می‌کند و ساخت آن زمان زیادی نبرد. @Angaisb_
ایتان مولیک از Genie 3 با تصاویر تولید شده توسط Midjourney برای ایجاد جهان‌های سه‌بعدی قابل‌کاوش از سازه‌های عظیم و شهرهای عجیب در ۲۰ ثانیه استفاده کرد. @emollick
محققان گوگل از Gemini برای تسریع علم در چندین مطالعه موردی استفاده کردند و هوش مصنوعی را به‌عنوان یک همکار جوان خستگی‌ناپذیر، آگاه، و خلاق می‌دانستند. @emollick