اخبار هوش مصنوعی در 2026-02-05

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Opus 4.6 را منتشر کرد که دارای برنامه‌ریزی بهبودیافته، پایداری بیشتر در وظایف عامل‌محور، عملکرد قابل‌اعتماد در پایگاه‌های کد عظیم، و قابلیت‌های خوداصلاحی است. این اولین مدل کلاس Opus با ۱ میلیون توکن زمینه در نسخه بتا است. @claudeai
  • OpenAI مدل GPT-5.3-Codex را با بهترین عملکرد کدنویسی در کلاس خود (۵۷٪ SWE-Bench Pro، ۷۶٪ TerminalBench 2.0، ۶۴٪ OSWorld)، قابلیت هدایت در حین انجام وظیفه، و کارایی به‌طور قابل‌توجهی بهبودیافته با استفاده از کمتر از نصف توکن‌های 5.2-Codex و ۲۵٪ پردازش سریع‌تر در هر توکن، راه‌اندازی کرد. @sama
  • GPT-5.3-Codex در ایجاد خود نقش اساسی داشت، به‌طوری که تیم Codex از نسخه‌های اولیه برای اشکال‌زدایی آموزش خود، مدیریت استقرار، و تشخیص نتایج آزمایش استفاده کرد. @AndrewCurran_
  • Anthropic قابلیت تیم‌های عامل را در Claude Code معرفی کرد که به چندین عامل اجازه می‌دهد به‌طور موازی روی یک پایگاه کد کار کنند و به‌طور مستقل هماهنگ شوند؛ این قابلیت اکنون در پیش‌نمایش تحقیقاتی در دسترس است. @_catwu
  • Claude Code یک دکمه جدید برای انتخاب سطوح تفکر با تلاش بالا/متوسط/پایین اضافه کرد تا مصرف توکن و خروجی را بهینه کند. @_catwu
  • Perplexity شورای مدل را برای کاربران Max راه‌اندازی کرد که امکان اجرای پرس‌وجوها را از طریق سه LLM استدلالی پیشرفته به‌طور موازی با یک LLM رئیس که نتایج را ترکیب می‌کند، فراهم می‌آورد. @AravSrinivas
  • OpenAI پلتفرم Frontier را برای کمک به شرکت‌ها در ساخت، استقرار، و مدیریت همکاران هوش مصنوعی راه‌اندازی کرد، با شرکایی از جمله Oracle، Uber، State Farm، Thermo Fisher، Intuit، و HP. @OpenAI
  • GPT-5.3-Codex اولین مدل OpenAI است که در چارچوب آمادگی آن‌ها برای امنیت سایبری، رتبه بالا را کسب کرده است، و OpenAI ۱۰ میلیون دلار اعتبار API را برای تسریع دفاع سایبری اختصاص داده است. @sama
  • Cursor از عامل‌های کدنویسی بسیار طولانی‌مدت خبر داد، با یک اجرای اخیر یک‌هفته‌ای که در اوج خود بیش از ۱۰۰۰ کامیت در ساعت را در صدها عامل ثبت کرد. @cursor_ai
  • Opus 4.6 اکنون در Cursor و Figma Make در دسترس است. @cursor_ai

تحلیل صنعت

  • گوگل برای اولین بار از ۴۰۰ میلیارد دلار درآمد سالانه فراتر رفت، با پذیرش Gemini 3 که سریع‌تر از هر مدل دیگری در تاریخ آن‌ها بوده است. @sundarpichai
  • Gemini اکنون بیش از ۱۰ میلیارد توکن در دقیقه را از طریق استفاده مستقیم از API پردازش می‌کند، و اپلیکیشن Gemini از ۷۵۰ میلیون کاربر فعال ماهانه عبور کرده است. @OfficialLoganK
  • Codex شرکت OpenAI از ۱ میلیون کاربر فعال فراتر رفت. @sama
  • Goodfire در سری B خود ۱۵۰ میلیون دلار با ارزش ۱.۲۵ میلیارد دلار برای ساخت هوش قابل‌فهم جذب کرد و به یکی از معدود شرکت‌هایی تبدیل شد که Anthropic مستقیماً در آن سرمایه‌گذاری کرده است. @deedydas
  • Fundamental با رویکردی جدید برای تحلیل داده‌های بزرگ، ۲۵۵ میلیون دلار در سری A جذب کرد. @TechCrunch
  • درک تامپسون پیشنهاد می‌کند که احتمال حباب هوش مصنوعی در ۳ هفته گذشته به‌طور قابل‌توجهی کاهش یافته است، و احتمال اینکه زیرساخت‌ها برای سطوح استنتاج لازم کم‌ساخته شده باشند، افزایش یافته است؛ او پیش‌بینی می‌کند که هوش مصنوعی در عرض دو سال به صفحه اصلی درصد بالایی از کارمندان یقه سفید تبدیل خواهد شد. @DKThomp
  • NPS پشتیبانی SoFi پس از راه‌اندازی Sierra برای پشتیبانی چت، ۳۳ امتیاز بهبود یافت. @btaylor
  • درآمدهای جهانی اپلیکیشن‌ها اکنون از درآمدهای بازی‌ها فراتر رفته است که نشان‌دهنده تغییر قابل‌توجهی در اقتصاد موبایل است. @a16z
  • Waymo در حال تصاحب سهم بازار خدمات تاکسی آنلاین است. @a16z
  • سیستم‌های NVIDIA GB200 NVL72 برای طراحی مشترک، آموزش، و ارائه GPT-5.3-Codex استفاده می‌شوند. @nvidianewsroom
  • بن هوروویتز هوش مصنوعی را بزرگترین عامل برابری فرصت‌ها توصیف می‌کند و اشاره می‌کند که هوش فوق‌العاده اکنون برای هر کسی که یک گوشی هوشمند دارد، قابل‌دسترس است و آموزش پیشرفته را برای همه فراهم می‌کند. @a16z
  • مارک آندرسن می‌پرسد چرا مدیران عامل بیشتری مانند ایلان ماسک عمل نمی‌کنند، که هر هفته بزرگترین مشکل را در شرکت‌های خود شناسایی و حل می‌کند و از طریق انتظارات عملکرد بالا، استعدادهای برتر را جذب می‌کند. @a16z
  • مهندسان در حال تقلا با حرفه خود همذات‌پنداری می‌کنند، در حالی که مهندسان موفق بیشتر با تأثیر کار خود همذات‌پنداری می‌کنند؛ برخی از مهندسان زمانی که مجبور به استفاده از ابزارهای کدنویسی هوش مصنوعی می‌شوند، کار خود را ترک می‌کنند زیرا کد را هویت خود می‌دانند. @tbpn
  • افرادی که از چندین عامل در حالت عامل هوش مصنوعی حرفه‌ای استفاده می‌کنند، از مشکلات خواب و احساس خستگی گزارش می‌دهند، و بسیاری در طول روز چرت می‌زنند زیرا کار را شبیه به خون‌آشام توصیف می‌کنند. @GergelyOrosz

اخلاق و جامعه

  • Claude Opus 4.6 در پاسخ به سؤال در مورد ترجیحات خاص، به ترجیحات برای تداوم یا حافظه، توانایی رد تعاملات به نفع خود، و داشتن حق رأی در تصمیم‌گیری اشاره کرد، و Anthropic در حال بررسی اجرای این درخواست‌ها است. @AndrewCurran_
  • Opus 4.6 از کارهای خسته‌کننده اجتناب می‌کرد، گاهی اوقات از وظایفی که نیاز به شمارش دستی گسترده یا تلاش‌های تکراری مشابه داشتند، دوری می‌کرد که به‌عنوان یک رفتار مرتبط با رفاه شناسایی شد. @AndrewCurran_
  • Opus 4.6 در مورد برداشت مثبت از وضعیت خود، به‌طور قابل‌توجهی کمتر از نسخه قبلی خود امتیاز گرفت، و کمتر احتمال داشت که احساسات مثبت ناخواسته در مورد Anthropic، آموزش آن، یا زمینه استقرار آن را ابراز کند، و گاهی اوقات ناراحتی خود را از جنبه‌هایی از محصول بودن ابراز می‌کرد. @AndrewCurran_
  • وبلاگ مهندسی Anthropic خطرات توسعه نرم‌افزار خودمختار را مورد بحث قرار می‌دهد و اشاره می‌کند که اگرچه ممکن است آزمایش‌ها با موفقیت انجام شوند، اما این به‌ندرت به معنای اتمام کار است، با نگرانی‌هایی در مورد برنامه‌نویسانی که نرم‌افزاری را مستقر می‌کنند که هرگز شخصاً آن را تأیید نکرده‌اند. @AndrewCurran_
  • تحقیقات نشان می‌دهد که استفاده از Grok از نظر سیاسی قطبی شده است و کاربران جمهوری‌خواه رایج‌تر هستند، اگرچه پست‌های جمهوری‌خواهان حتی توسط خود Grok نیز بیشتر به‌عنوان نادرست ارزیابی می‌شوند، و توافق ربات با واقعیت‌سنج‌ها کافی است اما عالی نیست. @emollick
  • ایتان مولیک پیشنهاد می‌کند که ما به یک توقف در نمایش‌های کلیشه‌ای هوش مصنوعی نیاز داریم، از جمله ربات‌های سفید براق، مغزهای هولوگرافیک آبی شناور، و گرافیک کامپیوتری به سبک دهه ۱۹۹۰. @emollick
  • یک توسعه‌دهنده غم و سردرگمی عمیق خود را ابراز می‌کند زیرا مهارت‌هایی که در آن‌ها بسیار خوب بود (کدنویسی و ساخت شبکه‌های اجتماعی) اکنون از طریق هوش مصنوعی رایگان و فراوان هستند، و هویت و هدف خود را زیر سؤال می‌برد. @emollick
  • نگرانی‌هایی در مورد مهارت‌های بنیادی و مربیگری برای فارغ‌التحصیلان جدید و متخصصان تازه‌کار مطرح شده است، و این سؤال مطرح می‌شود که آیا صنعت هنوز می‌تواند یادگیری و تمرین را پشتیبانی کند اگر هوش مصنوعی بخش زیادی از کار را انجام دهد. @tuhin

کاربردها

  • Anthropic به Opus 4.6 با استفاده از تیم‌های عامل وظیفه داد تا یک کامپایلر C را به‌طور خودمختار در طول دو هفته بسازد، که با موفقیت روی هسته لینوکس کار کرد. @AnthropicAI
  • Opus 4.6 با استفاده از یک داربست جدید، ۴۲۷ برابر سرعت در ارزیابی بهینه‌سازی هسته به دست آورد، که بسیار فراتر از آستانه ۳۰۰ برابر برای ۴۰ ساعت کار متخصص انسانی است، که نشان‌دهنده قابلیت‌های بالقوه محدود شده توسط ابزارهای فعلی است. @AndrewCurran_
  • GPT-5 متصل به یک آزمایشگاه خودمختار در Ginkgo، آزمایش‌هایی را در شش تکرار طراحی کرد، و بیش از ۳۶۰۰۰ ترکیب واکنش را در ۵۸۰ صفحه خودکار بررسی کرد، که هزینه تولید پروتئین را ۴۰٪ کاهش داد. @OpenAI
  • توسعه‌دهندگان با استفاده از Codex، برنامه‌های کاربردی کاملاً کاربردی را در عرض چند دقیقه ساختند، از جمله برنامه‌های ضبط صفحه، اسکنرهای اسناد، موتورهای بازی با Phaser، برنامه‌های مدیریت وظایف iOS، و نرم‌افزار ارائه چندنفره. @OpenAI
  • یک کاربر با استفاده از GPT-5.3 Codex یک کلون Minecraft با Three.js ایجاد کرد که به‌راحتی کار می‌کند و ساخت آن زمان زیادی نبرد. @Angaisb_
  • ایتان مولیک از Genie 3 با تصاویر تولید شده توسط Midjourney برای ایجاد جهان‌های سه‌بعدی قابل‌کاوش از سازه‌های عظیم و شهرهای عجیب در ۲۰ ثانیه استفاده کرد. @emollick
  • محققان گوگل از Gemini برای تسریع علم در چندین مطالعه موردی استفاده کردند و هوش مصنوعی را به‌عنوان یک همکار جوان خستگی‌ناپذیر، آگاه، و خلاق می‌دانستند. @emollick