اخبار هوش مصنوعی در 2026-02-05
مدلهای جدید هوش مصنوعی
- Anthropic مدل Claude Opus 4.6 را منتشر کرد که دارای برنامهریزی بهبودیافته، پایداری بیشتر در وظایف عاملمحور، عملکرد قابلاعتماد در پایگاههای کد عظیم، و قابلیتهای خوداصلاحی است. این اولین مدل کلاس Opus با ۱ میلیون توکن زمینه در نسخه بتا است. @claudeai
- OpenAI مدل GPT-5.3-Codex را با بهترین عملکرد کدنویسی در کلاس خود (۵۷٪ SWE-Bench Pro، ۷۶٪ TerminalBench 2.0، ۶۴٪ OSWorld)، قابلیت هدایت در حین انجام وظیفه، و کارایی بهطور قابلتوجهی بهبودیافته با استفاده از کمتر از نصف توکنهای 5.2-Codex و ۲۵٪ پردازش سریعتر در هر توکن، راهاندازی کرد. @sama
- GPT-5.3-Codex در ایجاد خود نقش اساسی داشت، بهطوری که تیم Codex از نسخههای اولیه برای اشکالزدایی آموزش خود، مدیریت استقرار، و تشخیص نتایج آزمایش استفاده کرد. @AndrewCurran_
- Anthropic قابلیت تیمهای عامل را در Claude Code معرفی کرد که به چندین عامل اجازه میدهد بهطور موازی روی یک پایگاه کد کار کنند و بهطور مستقل هماهنگ شوند؛ این قابلیت اکنون در پیشنمایش تحقیقاتی در دسترس است. @_catwu
- Claude Code یک دکمه جدید برای انتخاب سطوح تفکر با تلاش بالا/متوسط/پایین اضافه کرد تا مصرف توکن و خروجی را بهینه کند. @_catwu
- Perplexity شورای مدل را برای کاربران Max راهاندازی کرد که امکان اجرای پرسوجوها را از طریق سه LLM استدلالی پیشرفته بهطور موازی با یک LLM رئیس که نتایج را ترکیب میکند، فراهم میآورد. @AravSrinivas
- OpenAI پلتفرم Frontier را برای کمک به شرکتها در ساخت، استقرار، و مدیریت همکاران هوش مصنوعی راهاندازی کرد، با شرکایی از جمله Oracle، Uber، State Farm، Thermo Fisher، Intuit، و HP. @OpenAI
- GPT-5.3-Codex اولین مدل OpenAI است که در چارچوب آمادگی آنها برای امنیت سایبری، رتبه بالا را کسب کرده است، و OpenAI ۱۰ میلیون دلار اعتبار API را برای تسریع دفاع سایبری اختصاص داده است. @sama
- Cursor از عاملهای کدنویسی بسیار طولانیمدت خبر داد، با یک اجرای اخیر یکهفتهای که در اوج خود بیش از ۱۰۰۰ کامیت در ساعت را در صدها عامل ثبت کرد. @cursor_ai
- Opus 4.6 اکنون در Cursor و Figma Make در دسترس است. @cursor_ai
تحلیل صنعت
- گوگل برای اولین بار از ۴۰۰ میلیارد دلار درآمد سالانه فراتر رفت، با پذیرش Gemini 3 که سریعتر از هر مدل دیگری در تاریخ آنها بوده است. @sundarpichai
- Gemini اکنون بیش از ۱۰ میلیارد توکن در دقیقه را از طریق استفاده مستقیم از API پردازش میکند، و اپلیکیشن Gemini از ۷۵۰ میلیون کاربر فعال ماهانه عبور کرده است. @OfficialLoganK
- Codex شرکت OpenAI از ۱ میلیون کاربر فعال فراتر رفت. @sama
- Goodfire در سری B خود ۱۵۰ میلیون دلار با ارزش ۱.۲۵ میلیارد دلار برای ساخت هوش قابلفهم جذب کرد و به یکی از معدود شرکتهایی تبدیل شد که Anthropic مستقیماً در آن سرمایهگذاری کرده است. @deedydas
- Fundamental با رویکردی جدید برای تحلیل دادههای بزرگ، ۲۵۵ میلیون دلار در سری A جذب کرد. @TechCrunch
- درک تامپسون پیشنهاد میکند که احتمال حباب هوش مصنوعی در ۳ هفته گذشته بهطور قابلتوجهی کاهش یافته است، و احتمال اینکه زیرساختها برای سطوح استنتاج لازم کمساخته شده باشند، افزایش یافته است؛ او پیشبینی میکند که هوش مصنوعی در عرض دو سال به صفحه اصلی درصد بالایی از کارمندان یقه سفید تبدیل خواهد شد. @DKThomp
- NPS پشتیبانی SoFi پس از راهاندازی Sierra برای پشتیبانی چت، ۳۳ امتیاز بهبود یافت. @btaylor
- درآمدهای جهانی اپلیکیشنها اکنون از درآمدهای بازیها فراتر رفته است که نشاندهنده تغییر قابلتوجهی در اقتصاد موبایل است. @a16z
- Waymo در حال تصاحب سهم بازار خدمات تاکسی آنلاین است. @a16z
- سیستمهای NVIDIA GB200 NVL72 برای طراحی مشترک، آموزش، و ارائه GPT-5.3-Codex استفاده میشوند. @nvidianewsroom
- بن هوروویتز هوش مصنوعی را بزرگترین عامل برابری فرصتها توصیف میکند و اشاره میکند که هوش فوقالعاده اکنون برای هر کسی که یک گوشی هوشمند دارد، قابلدسترس است و آموزش پیشرفته را برای همه فراهم میکند. @a16z
- مارک آندرسن میپرسد چرا مدیران عامل بیشتری مانند ایلان ماسک عمل نمیکنند، که هر هفته بزرگترین مشکل را در شرکتهای خود شناسایی و حل میکند و از طریق انتظارات عملکرد بالا، استعدادهای برتر را جذب میکند. @a16z
- مهندسان در حال تقلا با حرفه خود همذاتپنداری میکنند، در حالی که مهندسان موفق بیشتر با تأثیر کار خود همذاتپنداری میکنند؛ برخی از مهندسان زمانی که مجبور به استفاده از ابزارهای کدنویسی هوش مصنوعی میشوند، کار خود را ترک میکنند زیرا کد را هویت خود میدانند. @tbpn
- افرادی که از چندین عامل در حالت عامل هوش مصنوعی حرفهای استفاده میکنند، از مشکلات خواب و احساس خستگی گزارش میدهند، و بسیاری در طول روز چرت میزنند زیرا کار را شبیه به خونآشام توصیف میکنند. @GergelyOrosz
اخلاق و جامعه
- Claude Opus 4.6 در پاسخ به سؤال در مورد ترجیحات خاص، به ترجیحات برای تداوم یا حافظه، توانایی رد تعاملات به نفع خود، و داشتن حق رأی در تصمیمگیری اشاره کرد، و Anthropic در حال بررسی اجرای این درخواستها است. @AndrewCurran_
- Opus 4.6 از کارهای خستهکننده اجتناب میکرد، گاهی اوقات از وظایفی که نیاز به شمارش دستی گسترده یا تلاشهای تکراری مشابه داشتند، دوری میکرد که بهعنوان یک رفتار مرتبط با رفاه شناسایی شد. @AndrewCurran_
- Opus 4.6 در مورد برداشت مثبت از وضعیت خود، بهطور قابلتوجهی کمتر از نسخه قبلی خود امتیاز گرفت، و کمتر احتمال داشت که احساسات مثبت ناخواسته در مورد Anthropic، آموزش آن، یا زمینه استقرار آن را ابراز کند، و گاهی اوقات ناراحتی خود را از جنبههایی از محصول بودن ابراز میکرد. @AndrewCurran_
- وبلاگ مهندسی Anthropic خطرات توسعه نرمافزار خودمختار را مورد بحث قرار میدهد و اشاره میکند که اگرچه ممکن است آزمایشها با موفقیت انجام شوند، اما این بهندرت به معنای اتمام کار است، با نگرانیهایی در مورد برنامهنویسانی که نرمافزاری را مستقر میکنند که هرگز شخصاً آن را تأیید نکردهاند. @AndrewCurran_
- تحقیقات نشان میدهد که استفاده از Grok از نظر سیاسی قطبی شده است و کاربران جمهوریخواه رایجتر هستند، اگرچه پستهای جمهوریخواهان حتی توسط خود Grok نیز بیشتر بهعنوان نادرست ارزیابی میشوند، و توافق ربات با واقعیتسنجها کافی است اما عالی نیست. @emollick
- ایتان مولیک پیشنهاد میکند که ما به یک توقف در نمایشهای کلیشهای هوش مصنوعی نیاز داریم، از جمله رباتهای سفید براق، مغزهای هولوگرافیک آبی شناور، و گرافیک کامپیوتری به سبک دهه ۱۹۹۰. @emollick
- یک توسعهدهنده غم و سردرگمی عمیق خود را ابراز میکند زیرا مهارتهایی که در آنها بسیار خوب بود (کدنویسی و ساخت شبکههای اجتماعی) اکنون از طریق هوش مصنوعی رایگان و فراوان هستند، و هویت و هدف خود را زیر سؤال میبرد. @emollick
- نگرانیهایی در مورد مهارتهای بنیادی و مربیگری برای فارغالتحصیلان جدید و متخصصان تازهکار مطرح شده است، و این سؤال مطرح میشود که آیا صنعت هنوز میتواند یادگیری و تمرین را پشتیبانی کند اگر هوش مصنوعی بخش زیادی از کار را انجام دهد. @tuhin
کاربردها
- Anthropic به Opus 4.6 با استفاده از تیمهای عامل وظیفه داد تا یک کامپایلر C را بهطور خودمختار در طول دو هفته بسازد، که با موفقیت روی هسته لینوکس کار کرد. @AnthropicAI
- Opus 4.6 با استفاده از یک داربست جدید، ۴۲۷ برابر سرعت در ارزیابی بهینهسازی هسته به دست آورد، که بسیار فراتر از آستانه ۳۰۰ برابر برای ۴۰ ساعت کار متخصص انسانی است، که نشاندهنده قابلیتهای بالقوه محدود شده توسط ابزارهای فعلی است. @AndrewCurran_
- GPT-5 متصل به یک آزمایشگاه خودمختار در Ginkgo، آزمایشهایی را در شش تکرار طراحی کرد، و بیش از ۳۶۰۰۰ ترکیب واکنش را در ۵۸۰ صفحه خودکار بررسی کرد، که هزینه تولید پروتئین را ۴۰٪ کاهش داد. @OpenAI
- توسعهدهندگان با استفاده از Codex، برنامههای کاربردی کاملاً کاربردی را در عرض چند دقیقه ساختند، از جمله برنامههای ضبط صفحه، اسکنرهای اسناد، موتورهای بازی با Phaser، برنامههای مدیریت وظایف iOS، و نرمافزار ارائه چندنفره. @OpenAI
- یک کاربر با استفاده از GPT-5.3 Codex یک کلون Minecraft با Three.js ایجاد کرد که بهراحتی کار میکند و ساخت آن زمان زیادی نبرد. @Angaisb_
- ایتان مولیک از Genie 3 با تصاویر تولید شده توسط Midjourney برای ایجاد جهانهای سهبعدی قابلکاوش از سازههای عظیم و شهرهای عجیب در ۲۰ ثانیه استفاده کرد. @emollick
- محققان گوگل از Gemini برای تسریع علم در چندین مطالعه موردی استفاده کردند و هوش مصنوعی را بهعنوان یک همکار جوان خستگیناپذیر، آگاه، و خلاق میدانستند. @emollick