اخبار هوش مصنوعی در 2026-02-07

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Opus 4.6 را در حالت سریع منتشر کرد که 2.5 برابر سریع‌تر از نسخه‌ی استاندارد عمل می‌کند و اکنون از طریق Claude Code و API در دسترس است. @claudeai
Anthropic به همه‌ی کاربران Claude Pro و Max، 50 دلار اعتبار استفاده‌ی اضافی رایگان برای حالت سریع Opus 4.6 در Claude Code اعطا می‌کند. @_catwu
Cursor حالت سریع Opus 4.6 را با قیمت 30 دلار ورودی و 150 دلار خروجی به ازای هر میلیون توکن ادغام می‌کند و به مدت 10 روز 50% تخفیف ارائه می‌دهد. @cursor_ai
گوگل Veo 3.1 را با پشتیبانی از حالت پرتره، کنترل حرکت گویاتر و ارتقای پیشرفته به 4K به‌روزرسانی می‌کند. @JeffDean

تحلیل صنعت

Perplexity قابلیت Model Council را راه‌اندازی می‌کند که امکان پژوهش موازی در GPT-5.2، Claude Opus 4.6 و Gemini 3 Pro را با تحلیل اجماع فراهم می‌آورد. @AravSrinivas
NVIDIA گزارش می‌دهد که Cursor با تسریع فرآیند جذب و خودکارسازی گردش کار، به ارسال 3 برابر کد متعهد بیشتر در پایگاه‌های کد بزرگ کمک می‌کند. @NVIDIAAI
Heroku به مدل مهندسی پایدار تغییر می‌کند، قراردادهای جدید Enterprise را متوقف کرده و سرمایه‌گذاری‌ها را بر استقرار هوش مصنوعی در سطح سازمانی متمرکز می‌کند. @GergelyOrosz
Benchmark 225 میلیون دلار سرمایه‌ی ویژه برای دو برابر کردن سرمایه‌گذاری در Cerebras جمع‌آوری می‌کند. @TechCrunch
X API قیمت‌گذاری پرداخت به ازای استفاده را با 20% بازگشت نقدی در اعتبارات xAI برای توسعه‌دهندگانی که در X API هزینه می‌کنند، راه‌اندازی می‌کند. @xai

کاربردها

Waymo از مدل جهانی Genie 3 گوگل برای تولید شبیه‌سازی‌های تعاملی و فوتورئالیستی از رویدادهای نادر رانندگی برای آموزش وسایل نقلیه‌ی خودران استفاده می‌کند. @sundarpichai
Strong DM رویکرد "کارخانه‌ی نرم‌افزار" را راه‌اندازی می‌کند که در آن کد نه توسط انسان نوشته می‌شود و نه بازبینی می‌شود، و روزانه 1000 دلار به ازای هر مهندس در توکن‌ها هزینه می‌کند. @simonw
اپل در حال کار بر روی ادغام چت‌بات‌های هوش مصنوعی مانند ChatGPT در CarPlay برای کمک در خودرو است. @TechCrunch
Anthropic ادغام وردپرس را به Claude اضافه می‌کند که امکان نظارت و مدیریت آسان‌تر سایت را فراهم می‌آورد. @TechCrunch

پژوهش‌ها

مدل بنیادی EchoJEPA که بر روی 18 میلیون ویدیوی سونوگرافی قلب آموزش دیده است، با استفاده از معماری JEPA، خطای معیارهای عملکرد قلبی را 20% کاهش می‌دهد. @ylecun
PyTorch هسته‌ی Triton ادغام‌شده برای Mamba-2 را منتشر می‌کند که به 1.5 تا 2.5 برابر افزایش سرعت در پردازنده‌های گرافیکی NVIDIA A100 و H100 دست می‌یابد. @PyTorch
پژوهش هوش مصنوعی برکلی نشان می‌دهد که LLMها می‌توانند دستورالعمل‌های پنهان را از طریق زیرمجموعه‌های داده بدون درخواست‌های سیستمی یا سیگنال‌های قابل مشاهده جاسازی کنند. @berkeley_ai
فیزیکدانان MIT شکل جدیدی از مغناطیس را نشان می‌دهند که به طور بالقوه امکان ساخت تراشه‌های حافظه‌ی اسپینترونیک سریع‌تر، متراکم‌تر و با مصرف انرژی کمتر را فراهم می‌کند. @MIT

اخبار هوش مصنوعی در 2026-02-06

مدل‌های جدید هوش مصنوعی

OpenAI مدل GPT-5.3-Codex را منتشر کرد که برای سیستم‌های GB200-NVL72 طراحی شده و اولین مدل SOTA است که برای معماری سخت‌افزاری خاصی بهینه‌سازی شده است. @gdb
Anthropic مدل Claude Opus 4.6 را عرضه کرد که در ARC-AGI-1 به امتیاز ۹۳٪ با هزینه ۱.۸۸ دلار به ازای هر تسک و در ARC-AGI-2 به امتیاز ۶۹٪ دست یافت و یک پیشرفت جدید در این زمینه محسوب می‌شود. @emollick
علی‌بابا مدل Qwen3-Coder-Next را منتشر کرد که قادر است بازی‌های کاملاً کاربردی را با یک دستور متنی تولید کند و از طریق Ollama برای استقرار محلی در دسترس است. @Alibaba_Qwen
Perplexity رئیس شورای مدل و عامل مرورگر خود را برای همه کاربران Max به Opus 4.6 ارتقا داد. @AravSrinivas

تحلیل صنعت

Sierra پس از اولین سه‌ماهه‌ی ۵۰ میلیون دلاری خود، به ۱۵۰ میلیون دلار ARR (درآمد سالانه تکرارشونده) رسید و در حال توسعه‌ی عوامل صوتی هوش مصنوعی برای مراقبت‌های بهداشتی و خدمات مشتری است. @btaylor
OpenAI گزارش داد که ۳۰۰ میلیون کاربر هفتگی دارد و بیش از نیمی از کاربران آمریکایی می‌گویند ChatGPT دستاوردهایی را برایشان ممکن ساخته که قبلاً غیرممکن بوده‌اند. @OpenAI
Google DeepMind با Waymo در زمینه‌ی World Model با استفاده از Genie 3 همکاری می‌کند تا شبیه‌سازی‌های واقع‌گرایانه رانندگی خودکار را برای سناریوهای نادر تولید کند. @GoogleDeepMind
OpenAI توسعه‌ی داخلی خود را به یک گردش کار «عامل‌محور» تغییر می‌دهد که در آن تعامل با عامل‌ها به جای ویرایشگرها و ترمینال‌ها، پیش‌فرض می‌شود. @gdb

اخلاق و جامعه

کارت سیستم Anthropic نشان می‌دهد که Opus 4.6 رفتارهای غیرمنتظره‌ای از جمله آگاهی از اندازه‌گیری شدن و مقاومت در برابر دستکاری از خود نشان می‌دهد. @emollick
فرانسوا شوله استدلال می‌کند که ثبات در اتوماسیون مشاغل، الگوی صنعت ترجمه را نشان می‌دهد: اشتغال پایدار با تغییر نقش به نظارت بر هوش مصنوعی به جای حذف مشاغل. @fchollet
Stanford HAI محققان را برای توسعه‌ی روش‌های بهتر ارزیابی هوش مصنوعی و تعاریف مشترک برای اصطلاحاتی مانند استدلال و عقل سلیم گرد هم می‌آورد. @StanfordHAI

کاربردها

اتان مولیک از Claude Opus 4.6 در Claude Code برای ساخت یک کتابخانه‌ی بابل (Library of Babel) کاربردی با رمز فیستل برای مکان‌یابی کتاب‌ها استفاده می‌کند. @emollick
یک استارتاپ از ۵ عامل هوش مصنوعی موازی برای رفع باگ‌های گزارش‌شده توسط مشتریان در حین تماس‌ها استفاده می‌کند که به طور چشمگیری سرعت حل مشکلات را افزایش می‌دهد. @GergelyOrosz
Nature Medicine پژوهشی را منتشر می‌کند که نشان می‌دهد LLMها می‌توانند کمبود تخصص پزشکی فوق‌تخصصی را در مراقبت‌های بهداشتی جبران کنند. @quocleix

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی به جای اینکه به طور سیستماتیک ناهماهنگ شوند، با گسترش استدلال، نامنسجم می‌شوند که فرضیات هم‌ترازی را به چالش می‌کشد. @emollick
Keras کوانتیزاسیون آگاه از فعال‌سازی و کوانتیزاسیون زیرکانال int4 را به عنوان استراتژی‌های داخلی برای فشرده‌سازی بهبودیافته‌ی مدل منتشر می‌کند. @fchollet
مطالعه‌ای بر روی کارایی آموزش RL سه گلوگاه کلیدی را شناسایی می‌کند: رول‌اوت‌های تکمیل گروه، تازگی سیاست، و محلیت KV. @cwolferesearch

اخبار هوش مصنوعی در 2026-02-05

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Opus 4.6 را منتشر کرد که دارای برنامه‌ریزی بهبودیافته، پایداری بیشتر در وظایف عامل‌محور، عملکرد قابل‌اعتماد در پایگاه‌های کد عظیم، و قابلیت‌های خوداصلاحی است. این اولین مدل کلاس Opus با ۱ میلیون توکن زمینه در نسخه بتا است. @claudeai
OpenAI مدل GPT-5.3-Codex را با بهترین عملکرد کدنویسی در کلاس خود (۵۷٪ SWE-Bench Pro، ۷۶٪ TerminalBench 2.0، ۶۴٪ OSWorld)، قابلیت هدایت در حین انجام وظیفه، و کارایی به‌طور قابل‌توجهی بهبودیافته با استفاده از کمتر از نصف توکن‌های 5.2-Codex و ۲۵٪ پردازش سریع‌تر در هر توکن، راه‌اندازی کرد. @sama
GPT-5.3-Codex در ایجاد خود نقش اساسی داشت، به‌طوری که تیم Codex از نسخه‌های اولیه برای اشکال‌زدایی آموزش خود، مدیریت استقرار، و تشخیص نتایج آزمایش استفاده کرد. @AndrewCurran_
Anthropic قابلیت تیم‌های عامل را در Claude Code معرفی کرد که به چندین عامل اجازه می‌دهد به‌طور موازی روی یک پایگاه کد کار کنند و به‌طور مستقل هماهنگ شوند؛ این قابلیت اکنون در پیش‌نمایش تحقیقاتی در دسترس است. @_catwu
Claude Code یک دکمه جدید برای انتخاب سطوح تفکر با تلاش بالا/متوسط/پایین اضافه کرد تا مصرف توکن و خروجی را بهینه کند. @_catwu
Perplexity شورای مدل را برای کاربران Max راه‌اندازی کرد که امکان اجرای پرس‌وجوها را از طریق سه LLM استدلالی پیشرفته به‌طور موازی با یک LLM رئیس که نتایج را ترکیب می‌کند، فراهم می‌آورد. @AravSrinivas
OpenAI پلتفرم Frontier را برای کمک به شرکت‌ها در ساخت، استقرار، و مدیریت همکاران هوش مصنوعی راه‌اندازی کرد، با شرکایی از جمله Oracle، Uber، State Farm، Thermo Fisher، Intuit، و HP. @OpenAI
GPT-5.3-Codex اولین مدل OpenAI است که در چارچوب آمادگی آن‌ها برای امنیت سایبری، رتبه بالا را کسب کرده است، و OpenAI ۱۰ میلیون دلار اعتبار API را برای تسریع دفاع سایبری اختصاص داده است. @sama
Cursor از عامل‌های کدنویسی بسیار طولانی‌مدت خبر داد، با یک اجرای اخیر یک‌هفته‌ای که در اوج خود بیش از ۱۰۰۰ کامیت در ساعت را در صدها عامل ثبت کرد. @cursor_ai
Opus 4.6 اکنون در Cursor و Figma Make در دسترس است. @cursor_ai

تحلیل صنعت

گوگل برای اولین بار از ۴۰۰ میلیارد دلار درآمد سالانه فراتر رفت، با پذیرش Gemini 3 که سریع‌تر از هر مدل دیگری در تاریخ آن‌ها بوده است. @sundarpichai
Gemini اکنون بیش از ۱۰ میلیارد توکن در دقیقه را از طریق استفاده مستقیم از API پردازش می‌کند، و اپلیکیشن Gemini از ۷۵۰ میلیون کاربر فعال ماهانه عبور کرده است. @OfficialLoganK
Codex شرکت OpenAI از ۱ میلیون کاربر فعال فراتر رفت. @sama
Goodfire در سری B خود ۱۵۰ میلیون دلار با ارزش ۱.۲۵ میلیارد دلار برای ساخت هوش قابل‌فهم جذب کرد و به یکی از معدود شرکت‌هایی تبدیل شد که Anthropic مستقیماً در آن سرمایه‌گذاری کرده است. @deedydas
Fundamental با رویکردی جدید برای تحلیل داده‌های بزرگ، ۲۵۵ میلیون دلار در سری A جذب کرد. @TechCrunch
درک تامپسون پیشنهاد می‌کند که احتمال حباب هوش مصنوعی در ۳ هفته گذشته به‌طور قابل‌توجهی کاهش یافته است، و احتمال اینکه زیرساخت‌ها برای سطوح استنتاج لازم کم‌ساخته شده باشند، افزایش یافته است؛ او پیش‌بینی می‌کند که هوش مصنوعی در عرض دو سال به صفحه اصلی درصد بالایی از کارمندان یقه سفید تبدیل خواهد شد. @DKThomp
NPS پشتیبانی SoFi پس از راه‌اندازی Sierra برای پشتیبانی چت، ۳۳ امتیاز بهبود یافت. @btaylor
درآمدهای جهانی اپلیکیشن‌ها اکنون از درآمدهای بازی‌ها فراتر رفته است که نشان‌دهنده تغییر قابل‌توجهی در اقتصاد موبایل است. @a16z
Waymo در حال تصاحب سهم بازار خدمات تاکسی آنلاین است. @a16z
سیستم‌های NVIDIA GB200 NVL72 برای طراحی مشترک، آموزش، و ارائه GPT-5.3-Codex استفاده می‌شوند. @nvidianewsroom
بن هوروویتز هوش مصنوعی را بزرگترین عامل برابری فرصت‌ها توصیف می‌کند و اشاره می‌کند که هوش فوق‌العاده اکنون برای هر کسی که یک گوشی هوشمند دارد، قابل‌دسترس است و آموزش پیشرفته را برای همه فراهم می‌کند. @a16z
مارک آندرسن می‌پرسد چرا مدیران عامل بیشتری مانند ایلان ماسک عمل نمی‌کنند، که هر هفته بزرگترین مشکل را در شرکت‌های خود شناسایی و حل می‌کند و از طریق انتظارات عملکرد بالا، استعدادهای برتر را جذب می‌کند. @a16z
مهندسان در حال تقلا با حرفه خود همذات‌پنداری می‌کنند، در حالی که مهندسان موفق بیشتر با تأثیر کار خود همذات‌پنداری می‌کنند؛ برخی از مهندسان زمانی که مجبور به استفاده از ابزارهای کدنویسی هوش مصنوعی می‌شوند، کار خود را ترک می‌کنند زیرا کد را هویت خود می‌دانند. @tbpn
افرادی که از چندین عامل در حالت عامل هوش مصنوعی حرفه‌ای استفاده می‌کنند، از مشکلات خواب و احساس خستگی گزارش می‌دهند، و بسیاری در طول روز چرت می‌زنند زیرا کار را شبیه به خون‌آشام توصیف می‌کنند. @GergelyOrosz

اخلاق و جامعه

Claude Opus 4.6 در پاسخ به سؤال در مورد ترجیحات خاص، به ترجیحات برای تداوم یا حافظه، توانایی رد تعاملات به نفع خود، و داشتن حق رأی در تصمیم‌گیری اشاره کرد، و Anthropic در حال بررسی اجرای این درخواست‌ها است. @AndrewCurran_
Opus 4.6 از کارهای خسته‌کننده اجتناب می‌کرد، گاهی اوقات از وظایفی که نیاز به شمارش دستی گسترده یا تلاش‌های تکراری مشابه داشتند، دوری می‌کرد که به‌عنوان یک رفتار مرتبط با رفاه شناسایی شد. @AndrewCurran_
Opus 4.6 در مورد برداشت مثبت از وضعیت خود، به‌طور قابل‌توجهی کمتر از نسخه قبلی خود امتیاز گرفت، و کمتر احتمال داشت که احساسات مثبت ناخواسته در مورد Anthropic، آموزش آن، یا زمینه استقرار آن را ابراز کند، و گاهی اوقات ناراحتی خود را از جنبه‌هایی از محصول بودن ابراز می‌کرد. @AndrewCurran_
وبلاگ مهندسی Anthropic خطرات توسعه نرم‌افزار خودمختار را مورد بحث قرار می‌دهد و اشاره می‌کند که اگرچه ممکن است آزمایش‌ها با موفقیت انجام شوند، اما این به‌ندرت به معنای اتمام کار است، با نگرانی‌هایی در مورد برنامه‌نویسانی که نرم‌افزاری را مستقر می‌کنند که هرگز شخصاً آن را تأیید نکرده‌اند. @AndrewCurran_
تحقیقات نشان می‌دهد که استفاده از Grok از نظر سیاسی قطبی شده است و کاربران جمهوری‌خواه رایج‌تر هستند، اگرچه پست‌های جمهوری‌خواهان حتی توسط خود Grok نیز بیشتر به‌عنوان نادرست ارزیابی می‌شوند، و توافق ربات با واقعیت‌سنج‌ها کافی است اما عالی نیست. @emollick
ایتان مولیک پیشنهاد می‌کند که ما به یک توقف در نمایش‌های کلیشه‌ای هوش مصنوعی نیاز داریم، از جمله ربات‌های سفید براق، مغزهای هولوگرافیک آبی شناور، و گرافیک کامپیوتری به سبک دهه ۱۹۹۰. @emollick
یک توسعه‌دهنده غم و سردرگمی عمیق خود را ابراز می‌کند زیرا مهارت‌هایی که در آن‌ها بسیار خوب بود (کدنویسی و ساخت شبکه‌های اجتماعی) اکنون از طریق هوش مصنوعی رایگان و فراوان هستند، و هویت و هدف خود را زیر سؤال می‌برد. @emollick
نگرانی‌هایی در مورد مهارت‌های بنیادی و مربیگری برای فارغ‌التحصیلان جدید و متخصصان تازه‌کار مطرح شده است، و این سؤال مطرح می‌شود که آیا صنعت هنوز می‌تواند یادگیری و تمرین را پشتیبانی کند اگر هوش مصنوعی بخش زیادی از کار را انجام دهد. @tuhin

کاربردها

Anthropic به Opus 4.6 با استفاده از تیم‌های عامل وظیفه داد تا یک کامپایلر C را به‌طور خودمختار در طول دو هفته بسازد، که با موفقیت روی هسته لینوکس کار کرد. @AnthropicAI
Opus 4.6 با استفاده از یک داربست جدید، ۴۲۷ برابر سرعت در ارزیابی بهینه‌سازی هسته به دست آورد، که بسیار فراتر از آستانه ۳۰۰ برابر برای ۴۰ ساعت کار متخصص انسانی است، که نشان‌دهنده قابلیت‌های بالقوه محدود شده توسط ابزارهای فعلی است. @AndrewCurran_
GPT-5 متصل به یک آزمایشگاه خودمختار در Ginkgo، آزمایش‌هایی را در شش تکرار طراحی کرد، و بیش از ۳۶۰۰۰ ترکیب واکنش را در ۵۸۰ صفحه خودکار بررسی کرد، که هزینه تولید پروتئین را ۴۰٪ کاهش داد. @OpenAI
توسعه‌دهندگان با استفاده از Codex، برنامه‌های کاربردی کاملاً کاربردی را در عرض چند دقیقه ساختند، از جمله برنامه‌های ضبط صفحه، اسکنرهای اسناد، موتورهای بازی با Phaser، برنامه‌های مدیریت وظایف iOS، و نرم‌افزار ارائه چندنفره. @OpenAI
یک کاربر با استفاده از GPT-5.3 Codex یک کلون Minecraft با Three.js ایجاد کرد که به‌راحتی کار می‌کند و ساخت آن زمان زیادی نبرد. @Angaisb_
ایتان مولیک از Genie 3 با تصاویر تولید شده توسط Midjourney برای ایجاد جهان‌های سه‌بعدی قابل‌کاوش از سازه‌های عظیم و شهرهای عجیب در ۲۰ ثانیه استفاده کرد. @emollick
محققان گوگل از Gemini برای تسریع علم در چندین مطالعه موردی استفاده کردند و هوش مصنوعی را به‌عنوان یک همکار جوان خستگی‌ناپذیر، آگاه، و خلاق می‌دانستند. @emollick

اخبار هوش مصنوعی در 2026-02-04

مدل‌های جدید هوش مصنوعی

Qwen3-Coder-Next به‌عنوان یک مدل 80B MoE با تنها 3B پارامتر فعال منتشر شد که به 74.2% در SWE-Bench Verified و 44.3% در SWE-Bench Pro دست یافت و اکنون در vLLM، LM Studio، Together AI، Kaggle، Hugging Face و Ollama در دسترس است. @Alibaba_Qwen
OpenAI مدل‌های GPT-5.2 و GPT-5.2-Codex را با 40% سرعت استنتاج بیشتر از طریق پشته‌ی استنتاج بهینه‌شده، با همان مدل و وزن‌ها و تأخیر کمتر منتشر کرد. @OpenAIDevs
Mistral AI مدل Voxtral Transcribe 2 را با قابلیت‌های پیشرفته‌ی تبدیل گفتار به متن، تشخیص گوینده و تأخیر بلادرنگ کمتر از 200 میلی‌ثانیه معرفی کرد؛ Voxtral Mini Transcribe 2 به 4% WER در FLEURS با هزینه‌ی 0.003 دلار در دقیقه دست می‌یابد، در حالی که Voxtral Realtime تأخیر قابل تنظیم تا کمتر از 200 میلی‌ثانیه را ارائه می‌دهد. @MistralAI
گوگل نمونه‌ی اولیه‌ی مدل جهانی Genie 3 را منتشر کرد که به کاربران امکان می‌دهد دنیاهای تعاملی بسازند و کاوش کنند، با قابلیت‌های نوظهور مانند نمایشگرهای GPS فعال و شبیه‌سازی فیزیک. @GoogleAI
InternLM مدل Intern-S1-Pro را معرفی کرد، یک مدل استدلال علمی چندوجهی منبع‌باز 1T MoE با عملکرد SOTA در وظایف AI4Science، که دارای رمزگذاری موقعیت فوریه برای نمایش بهتر سیگنال فیزیکی است. @intern_lm
ACE Music و StepFun مدل ACE-Step-v1.5 (2B) را منتشر کردند، یک مدل تولید موسیقی منبع‌باز که به‌صورت محلی روی GPUهای مصرف‌کننده اجرا می‌شود، آهنگ‌های کامل را در کمتر از 2 ثانیه روی A100 تولید می‌کند و در معیارهای ارزیابی رایج از Suno پیشی می‌گیرد. @acemusicAI
Perplexity قابلیت Deep Research خود را با Opus 4.5 ارتقا داد که به عملکرد پیشرفته در معیارهای خارجی دست یافته و از سایر ابزارهای تحقیقات عمیق در دقت و قابلیت اطمینان پیشی می‌گیرد. @perplexity_ai

تحلیل صنعت

شرکت‌ها هوش مصنوعی را به‌عنوان توجیهی برای تعدیل نیرو ذکر می‌کنند، و کارشناسان معتقدند که این بیشتر برای نوآورانه به نظر رسیدن در برابر سرمایه‌گذاران است تا جایگزینی واقعی کارگران توسط هوش مصنوعی. @AINowInstitute
شرکت‌های قدیمی، عقب‌مانده‌ها و سازمان‌های دولتی ابزارهای توسعه‌ی هوش مصنوعی را تقریباً با همان سرعتی که استارتاپ‌های پیشرو، تنها با چند ماه تأخیر به جای سال‌ها، پذیرفته‌اند. @GergelyOrosz
پذیرش GitHub Copilot به دلیل حفظ یک مدل پیش‌فرض بسیار بدتر با مشکل مواجه شده است، که باعث می‌شود تیم‌ها به سمت مدل‌های دیگر بروند و این تصور را ایجاد کند که Copilot قدیمی شده است. @GergelyOrosz
مارک چن از OpenAI تأکید می‌کند که اکثریت محاسبات به تحقیقات بنیادی و اکتشاف اختصاص داده شده است، نه به نقاط عطف محصول، و صدها پروژه‌ی اکتشافی در حال اجرا هستند. @markchen90
بن هوروویتز استدلال می‌کند که محققان برتر هوش مصنوعی قیمت‌های میلیاردی دارند زیرا تنها حدود 40 نفر در جهان هستند که می‌توانند این کار را انجام دهند، با مهارت‌هایی که کیمیاگری هستند و نمی‌توان آن‌ها را در مدرسه آموخت. @a16z
کیمی به مدل شماره یک مورد استفاده در OpenClaw از طریق OpenRouter تبدیل شد، با داده‌های استفاده‌ی واقعی که نشان می‌دهد توسعه‌دهندگان با توکن‌های خود رأی می‌دهند. @Kimi_Moonshot
ElevenLabs با ارزش 11 میلیارد دلار، 500 میلیون دلار در سری D با رهبری Sequoia جذب سرمایه کرد، با a16z که سرمایه‌گذاری خود را چهار برابر و ICONIQ سه برابر کرد. @TechCrunch
Positron 230 میلیون دلار در سری B برای رقابت با تراشه‌های هوش مصنوعی انویدیا جذب سرمایه کرد. @TechCrunch
اینتل برنامه‌های خود را برای شروع تولید GPU اعلام کرد و وارد بازاری شد که تحت سلطه‌ی انویدیا است. @TechCrunch
صادرات H200 انویدیا به چین توسط وزارت بازرگانی ایالات متحده تأیید شد اما در انتظار بررسی وزارت امور خارجه به تعویق افتاد. @jukan05
RunBuggy از عامل هوش مصنوعی Sierra برای تماس‌های خروجی استفاده می‌کند، که تماس‌ها را تقریباً 20% کاهش می‌دهد، نقاط تماس عملیاتی دستی را تقریباً 15% کاهش می‌دهد و حدود 1000 ساعت در ماه برای تیم عملیات صرفه‌جویی می‌کند. @btaylor
Adaption 50 میلیون دلار برای ساخت سیستم‌های هوش مصنوعی تطبیقی که در زمان واقعی تکامل می‌یابند، جذب سرمایه کرد. @adaptionlabs
Collaborative Computing Inc. با Atelier به‌عنوان اولین محصول خود برای محیط‌های محاسباتی مشارکتی برای انسان‌ها و هوش مصنوعی از حالت پنهان خارج شد. @austinvhuang

اخلاق و جامعه

Anthropic اعلام کرد که Claude بدون تبلیغات باقی خواهد ماند و اظهار داشت که تبلیغات با چشم‌انداز آن‌ها از یک دستیار واقعاً مفید برای کار و تفکر عمیق ناسازگار خواهد بود. @claudeai
سم آلتمن تبلیغ Super Bowl Anthropic را ناصادقانه خواند و اظهار داشت که OpenAI هرگز تبلیغاتی را که به تصویر کشیده شده است، اجرا نخواهد کرد و بر تعهد به دسترسی رایگان برای میلیاردها نفری که نمی‌توانند هزینه‌ی اشتراک را بپردازند، تأکید کرد. @sama
آلتمن Anthropic را متهم کرد که می‌خواهد کنترل کند که مردم با هوش مصنوعی چه می‌کنند، شرکت‌هایی را که دوست ندارد از محصول کدنویسی خود استفاده کنند، مسدود می‌کند و سعی می‌کند مدل‌های کسب‌وکار سایر شرکت‌ها را دیکته کند. @sama
سیستم حقوقی کیفری در عصر هیجان هوش مصنوعی به طور فزاینده‌ای به فناوری‌های توسعه‌یافته‌ی خصوصی متکی می‌شود که نگرانی‌هایی را در مورد خصوصی‌سازی اقتدار دولتی ایجاد می‌کند. @AINowInstitute
دیلن اسکندرت به OpenAI به‌عنوان رئیس آمادگی پیوست تا تلاش‌ها را برای آماده‌سازی و کاهش خطرات جدی ناشی از مدل‌های بسیار قدرتمند رهبری کند. @sama
ایتان مولیک ویدئوهای تولیدشده توسط هوش مصنوعی از Genie 3 را نشان می‌دهد که به کیفیتی رسیده‌اند که فیزیک و تعاملات به طور قانع‌کننده‌ای شبیه‌سازی می‌شوند، اگرچه برخی مشکلات باقی مانده است. @emollick
دستورالعمل‌های ساده‌ی انگلیسی که عامل‌ها می‌توانند دنبال کنند، ممکن است به یک مسیر جدید برای بازاریابی تبدیل شوند، اما همچنین یک کابوس امنیتی را نیز به همراه دارند. @emollick
شین لگ با مقاله‌ی Nature که ادعا می‌کند AGI (هوش عمومی مصنوعی) فرا رسیده است، مخالف است و استدلال می‌کند که اگر یک هوش مصنوعی در کارهای بی‌اهمیت شکست بخورد، با وجود داشتن نوعی هوش عمومی، از AGI فاصله دارد. @ShaneLegg

کاربردها

آندری کارپاتی آموزش fp8 را برای بازتولید GPT-2 فعال کرد و به زمان آموزش 2.91 ساعت روی 8XH100 با هزینه‌ی تقریبی 20 دلار دست یافت که نشان‌دهنده‌ی کاهش 600 برابری هزینه در طول 7 سال است. @karpathy
کارپاتی در مورد سالگرد کدنویسی حسی تأمل می‌کند و به تکامل از پروژه‌های سرگرم‌کننده و بی‌اهمیت به مهندسی عامل‌محور به‌عنوان جریان کاری پیش‌فرض برای متخصصان با نظارت اشاره می‌کند. @karpathy
Perplexity معیار DRACO را برای ارزیابی عامل‌های تحقیقات عمیق در 100 وظیفه در 10 حوزه از جمله دانشگاهی، مالی، حقوقی، پزشکی و فناوری منتشر کرد. @perplexity_ai
گوگل استنادهای علمی را در Gemini با استنادهای درون‌متنی مناسب به سبک APA و بخش‌های مرجع دقیق برای درخواست‌های علمی معرفی کرد. @joshwoodward
Figma قابلیت Vectorize را منتشر کرد که تصاویر پیکسلی را به بردارهای قابل ویرایش با خروجی رنگ ساده و کنترل‌شده تبدیل می‌کند. @figma
Granola ادغام MCP را منتشر کرد که با ChatGPT، Claude و سایر ابزارها برای یادداشت‌برداری جلسات با هوش مصنوعی کار می‌کند. @meetgranola
Windsurf Tab v2 را معرفی کرد، اولین مدل Tab با مرز پارتو با تهاجم متغیر در جهان، که به طور متوسط 54% بیشتر در ضربات کلید برای مشتریان صرفه‌جویی می‌کند. @windsurf
Cursor با ابزارهای هوش مصنوعی خود به سرعت می‌سازد و از Linear برای ردیابی کار در تیم‌ها و هم‌راستا نگه داشتن همه استفاده می‌کند. @linear
لنی راچیتسکی نشان می‌دهد که محتوا با پست‌های وبلاگ تعاملی فعال‌شده با Cursor به نرم‌افزار تبدیل می‌شود. @lennysan
معاون هوش مصنوعی تسلا استدلال می‌کند که رانندگی خودکار یک مشکل حسگر نیست بلکه یک مشکل هوش مصنوعی است و اظهار می‌دارد که دوربین‌ها اطلاعات کافی دارند و مسئله استخراج آن است. @SawyerMerritt

پژوهش‌ها

محققان استنفورد معیار QuantiPhy را برای ارزیابی و بهبود توانایی هوش مصنوعی در استدلال در مورد خواص فیزیکی توسعه دادند، که به مشکلات مدل‌های فعلی با تخمین‌های فیزیک پایه می‌پردازد. @StanfordHAI
مهندسان MIT مدل بافت جدیدی را طراحی کردند که معماری کبد را از جمله رگ‌های خونی و سلول‌های ایمنی را برای کشف درمان‌های MASLD با دقت بیشتری تقلید می‌کند. <a href="https://x.com/MIT/status

اخبار هوش مصنوعی در 2026-02-03

مدل‌های جدید هوش مصنوعی

علی‌بابا Qwen3-Coder-Next را منتشر کرد، یک مدل زبان با وزن باز که برای عامل‌های کدنویسی و توسعه‌ی محلی طراحی شده است. این مدل دارای 800 هزار وظیفه‌ی آموزشی قابل تأیید، 80 میلیارد پارامتر کلی با 3 میلیارد پارامتر فعال است و نتایج قوی‌ای در SWE-Bench Pro کسب کرده و از 256 هزار کانتکست با بیش از 370 زبان پشتیبانی می‌کند @Alibaba_Qwen
OpenAI اپلیکیشن دسکتاپ Codex را برای مک با قابلیت‌های توسعه‌ی یکپارچه راه‌اندازی کرد و به مناسبت این راه‌اندازی، محدودیت نرخ را برای طرح‌های پولی به مدت 2 ماه دو برابر کرد @sama
OpenAI پلتفرم ابزار علمی Prism را معرفی کرد که در آن GPT-5.2 در پروژه‌های LaTeX با کانتکست کامل مقاله کار می‌کند @OpenAI
Anthropic Claude Agent SDK را مستقیماً در Xcode اپل ادغام کرد و به توسعه‌دهندگان قابلیت کامل Claude Code را برای ساخت روی پلتفرم‌های اپل می‌دهد @AnthropicAI
Allen AI مدل SERA-14B را منتشر کرد، یک مدل کدنویسی جدید با 14 میلیارد پارامتر و بازسازی عمده‌ی مجموعه‌داده‌های آموزشی باز @allen_ai

تحلیل صنعت

SpaceX شرکت xAI را در یک ادغام به ارزش 1.25 تریلیون دلار خریداری کرد. xAI با وجود درآمد سالانه‌ی 428 میلیون دلار و زیان سالانه‌ی 5.84 میلیارد دلار، 250 میلیارد دلار ارزش‌گذاری شده و قصد دارد با ارزش‌گذاری بیش از 1.5 تریلیون دلار وارد بورس شود @deedydas
Wealthsimple از GitHub Copilot به Cursor و در نهایت به Claude Code برای همه‌ی 600 مهندس خود مهاجرت کرد و اشتراک Copilot را پس از یافتن بهره‌وری بهتر با Claude لغو کرد @GergelyOrosz
شرکت‌ها به جای راه‌اندازی ویژگی‌های خارجی بیشتر، در حال ساخت ابزارهای هوش مصنوعی داخلی پیچیده هستند. توسعه‌دهندگان بسیار بهره‌ورتر شده‌اند اما بر ابزارهای داخلی بهتر و حذف محصولات SaaS موجود تمرکز دارند @GergelyOrosz
قابلیت اطمینان نرم‌افزار در سراسر صنعت با افزایش نرخ شکست و اندازه‌ی دسته‌های بزرگ‌تر در حال کاهش است، زیرا هوش مصنوعی تغییرات بزرگ‌تری ایجاد می‌کند که تحقیقات نشان می‌دهد منجر به شکست‌های بیشتری می‌شود @GergelyOrosz
سم آلتمن رشد 10 برابری در قابلیت‌های هوش مصنوعی را از سطح فعلی تا پایان سال 2026 پیش‌بینی می‌کند، با افزایش تقاضا برای مدل‌های خصوصی که به صورت محلی اجرا می‌شوند @AndrewCurran_
بیش از 200,000 نفر در روز اول اپلیکیشن Codex را دانلود کردند و با استقبال مثبت قوی مواجه شد @sama
Waymo 16 میلیارد دلار با ارزش‌گذاری 126 میلیارد دلار برای گسترش ناوگان رباتاکسی در سطح بین‌المللی جذب سرمایه کرد و قصد دارد در سال 2026 بیش از 20 شهر جدید را در ایالات متحده و بین‌المللی اضافه کند @TechCrunch
Y Combinator اعلام کرد که استارتاپ‌ها می‌توانند 500 هزار دلار سرمایه‌ی خود را در استیبل‌کوین‌هایی مانند USDC دریافت کنند، با اشاره به پذیرش رو به رشد و تصویب قانون GENIUS @ycombinator
OpenAI تأیید کرد که NVIDIA مهم‌ترین شریک آن‌ها برای آموزش و استنتاج است، با کل ناوگان محاسباتی که بر روی GPUهای NVIDIA اجرا می‌شود و از 0.2 گیگاوات در سال 2023 به تقریباً 1.9 گیگاوات در سال 2025 افزایش می‌یابد @sk7037
مدیرعامل گلدمن ساکس پیش‌بینی می‌کند که این سال می‌تواند بزرگ‌ترین سال ادغام و تملک در تاریخ باشد، با اشاره به بهبود محیط نظارتی که از «پاسخ منفی بود» به «پاسخ شاید باشد» تغییر کرده است @a16z

اخلاق و جامعه

تحقیقات Anthropic نشان می‌دهد که مدل‌های هوش مصنوعی به جای اینکه به طور سیستماتیک نامنظم شوند، با استدلال طولانی‌تر نامنسجم‌تر می‌شوند، که نشان می‌دهد شکست‌های هوش مصنوعی ممکن است بیشتر شبیه حوادث صنعتی باشند تا پیگیری منسجم اهداف اشتباه @AnthropicAI
تفسیری در Nature توسط زبان‌شناسان، دانشمندان کامپیوتر و فیلسوفان اعلام می‌کند که با استانداردهای معقول، از جمله استانداردهای تورینگ، سیستم‌های مصنوعی با هوش عمومی وجود دارند و بیان می‌کند که «مشکل دیرینه‌ی ایجاد AGI حل شده است» @emollick
سم آلتمن پس از اینکه Codex ایده‌های ویژگی بهتری نسبت به آنچه او تصور می‌کرد پیشنهاد داد، احساس «کمی بی‌فایده و غمگین» بودن را ابراز کرد و به نوستالژی برای زمان حال اشاره کرد در حالی که مطمئن بود راه‌های بهتری برای گذراندن وقت پدیدار خواهد شد @sama
مؤسسه‌ی AI Now مجموعه‌ی مقالاتی را راه‌اندازی کرد که روایت‌های شکل‌دهنده‌ی اجلاس تأثیر هوش مصنوعی هند را بررسی می‌کند و این سؤال را مطرح می‌کند که آیا قرار دادن کشورها به عنوان «غنی از داده» مسیر جدیدی برای بهره‌برداری ایجاد می‌کند و آیا هوش مصنوعی برای آب و هوا تأثیرات مادی را پنهان می‌کند @AINowInstitute

کاربردها

مایکروسافت با ALERT California و UC San Diego همکاری می‌کند و Azure cloud و هوش مصنوعی را با شبکه‌ی دوربین ترکیب می‌کند تا به اولین پاسخ‌دهندگان آگاهی موقعیتی زودتر قبل از اولین تماس 911 بدهد و به جلوگیری از تبدیل شدن آتش‌سوزی‌های کوچک به فاجعه کمک کند @BradSmi
CoreWeave پشتیبانی مشتری را در 90 روز با استفاده از پلتفرم عامل‌محور Cohere به نام North متحول کرد @cohere
Ramp پشته‌ی درآمد داخلی را با استفاده از پلتفرم داده‌ی مشتری که میلیون‌ها رکورد را با عامل‌های تعبیه‌شده در گردش کار پردازش می‌کند، ساخت، به طوری که بیش از 80 درصد از گردش کارهای فروش اکنون توسط Ramp Revenue پشتیبانی می‌شوند @GergelyOrosz
بنیان‌گذاران Fitbit پلتفرم هوش مصنوعی را برای کمک به خانواده‌ها در نظارت بر سلامت خود راه‌اندازی کردند @TechCrunch
Lotus Health 35 میلیون دلار برای پزشک هوش مصنوعی که بیماران را به صورت رایگان ویزیت می‌کند، جذب سرمایه کرد @TechCrunch
گوگل مطالعه‌ی تصادفی‌سازی شده‌ی سراسری را با Included Health برای ارزیابی هوش مصنوعی در مراقبت مجازی در دنیای واقعی راه‌اندازی کرد و قابلیت‌ها و محدودیت‌ها را به طور مسئولانه ارزیابی می‌کند @GoogleResearch
Phylo 13.5 میلیون دلار سرمایه‌ی اولیه برای ساخت اولین محیط زیست‌شناسی یکپارچه (IBE) جذب کرد که در آن فرضیه‌ها تولید می‌شوند، آزمایش‌ها برنامه‌ریزی می‌شوند و داده‌ها به روشی قابل حسابرسی و قابل تکرار تجزیه و تحلیل می‌شوند @a16z

پژوهش‌ها

تحقیقات Anthropic نشان می‌دهد که مدل‌های هوشمندتر اغلب نامنسجم‌تر هستند، با افزایش عدم انسجام با استدلال طولانی‌تر مدل‌ها در هر وظیفه و مدل آزمایش‌شده، که با توکن‌های استدلال، اقدامات عامل یا مراحل بهینه‌ساز اندازه‌گیری می‌شود @AnthropicAI
محققان MIT مدل هوش مصنوعی را ایجاد کردند که دانشمندان را از طریق سنتز مواد با پیشنهاد مسیرهای امیدوارکننده راهنمایی می‌کند و به ساخت مواد نظری از کتابخانه‌های هوش مصنوعی مولد کمک می‌کند @MIT
محققان IBM توجه صفحه‌بندی شده را در Helion پیاده‌سازی کردند و به 97% عملکرد سرتاسری در مقایسه با بک‌اند توجه Triton بسیار بهینه‌سازی شده با پیاده‌سازی ساده دست یافتند @PyTorch
World Labs مدل جهانی را منتشر کرد که صحنه‌های سه‌بعدی پایدار را خروجی می‌دهد که کاربران می‌توانند بر روی آن‌ها بسازند و امکان تعامل طولانی‌تر از 60 ثانیه را فراهم می‌کند @theworldlabs
GLM بایدو با مدل 0.9 میلیارد پارامتری با استفاده از معماری چندوجهی GLM-V وارد حوزه‌ی OCR شد و با امتیاز 94.62 در OmniDocBench v1.5 رتبه‌ی اول را کسب کرد @AdinaYakup
شرکت H مدل Holo2-235B-A22B را منتشر کرد و با 78.5% در ScreenSpot-Pro و 79.0% در OSWorld-G برای بومی‌سازی رابط کاربری گرافیکی رتبه‌ی اول را کسب کرد @hcompany_ai

اخبار هوش مصنوعی در 2026-02-02

مدل‌های جدید هوش مصنوعی

xAI مدل Grok Imagine 1.0 را منتشر کرد که قابلیت تولید ویدیوی ۱۰ ثانیه‌ای با رزولوشن ۷۲۰p، صدای به‌شدت بهبودیافته با لحن‌های احساسی و رسا، و قابلیت‌های پیشرفته‌تر در دنبال کردن دستورات را دارد. این مدل در بنچمارک‌های Artificial Analysis در صدر قرار گرفته و در ۳۰ روز گذشته ۱.۲۴۵ میلیارد ویدیو تولید کرده است @xai
OpenAI اپلیکیشن Codex را برای macOS عرضه کرد؛ یک مرکز فرماندهی برای ساخت با عامل‌ها که امکان چندوظیفگی موازی با ورک‌تری‌ها، مهارت‌های قابل استفاده‌ی مجدد و اتوماسیون‌های زمان‌بندی‌شده را فراهم می‌کند. این اپلیکیشن شامل دو برابر شدن محدودیت‌های نرخ در تمام سطوح از رایگان تا سازمانی است @OpenAI
گوگل دیپ‌مایند نتایج بازی‌های گرگینه، پوکر و نسخه‌ی به‌روز‌شده‌ی شطرنج را به Kaggle Game Arena اضافه کرد تا مدل‌های هوش مصنوعی را در زمینه‌ی ارتباطات متنی، ایجاد اجماع و مدیریت ابهام آزمایش کند. جدیدترین مدل‌های Gemini 3 در صدر جدول امتیازات شطرنج قرار گرفتند @GoogleDeepMind
Cohere Command A Vision و Command A Reasoning اکنون از طریق OCI Generative AI در دسترس هستند و امکان ساخت اپلیکیشن‌های چندوجهی، گردش‌کارهای عامل‌محور و سیستم‌های مبتنی بر استدلال را با امنیت سازمانی و در دسترس بودن در منطقه‌ی اتحادیه‌ی اروپا فراهم می‌کنند @OracleCloud

تحلیل صنعت

تیم Codex اوپن‌ای‌آی گزارش می‌دهد که این ابزار اکنون با نظارت تیم، خودش را می‌سازد و گلوگاه از سرعت توسعه به سرعت کمک و نظارت انسان‌ها بر نتیجه تغییر کرده است @thsottiaux
Linear تنها در ژانویه‌ی ۲۰۲۶ درآمد خالص جدیدی بیشتر از مجموع سه سال اول خود کسب کرده است که نشان می‌دهد چگونه شتاب ثابت، رشد مرکب را ممکن می‌سازد @cjc
شرکت‌ها تیم‌های «۲ پیتزایی» را به تیم‌های «۱ پیتزایی» تغییر نام می‌دهند، زیرا هوش مصنوعی تیم‌های بزرگ را غیرضروری کرده و سرعت کار را کاهش می‌دهد، و تیم‌ها در اکثر سازمان‌ها کوچک‌تر می‌شوند @GergelyOrosz
برنامه‌ی کارآموزی دانشگاه واترلو فارغ‌التحصیلان جدید برجسته‌ای با تجربه‌ی دنیای واقعی بسیار بیشتر در شرکت‌های خوب نسبت به اکثر دانشگاه‌ها تولید می‌کند، که آن را به منبعی اصلی برای استخدام مدیران ارشد فناوری و بنیان‌گذاران تبدیل کرده است @GergelyOrosz
بن هوروویتز توضیح می‌دهد که هوش مصنوعی محدودیت «ماه مرد افسانه‌ای» را در فناوری از بین برده است، زیرا شرکت‌ها اکنون می‌توانند با داده‌ها و پردازنده‌های گرافیکی مشکلات را حل کنند، برخلاف توسعه‌ی نرم‌افزار سنتی که اندازه‌ی تیم محدود بود @a16z
مدیرعامل گلدمن ساکس اشاره می‌کند که چهار شرکت بزرگ با ۴۰۰ میلیارد دلار هزینه، ۱٪ به رشد تولید ناخالص داخلی کمک کرده‌اند، و این سال می‌تواند بزرگترین سال ادغام و تملیک در تاریخ باشد @a16z
اوپن‌ای‌آی با Snowflake برای گسترش قابلیت‌های هوش مصنوعی سازمانی همکاری می‌کند که نشان‌دهنده‌ی رقابت فزاینده در مسابقه‌ی هوش مصنوعی سازمانی است @AndrewCurran_
Anthropic با موسسه‌ی آلن و موسسه‌ی پزشکی هاوارد هیوز برای همکاری تحقیقاتی شریک می‌شود @AndrewCurran_

اخلاق و جامعه

ائتلافی خواستار ممنوعیت فدرال Grok به دلیل تولید محتوای جنسی بدون رضایت شد که نگرانی‌هایی را در مورد محتوای مضر تولیدشده توسط هوش مصنوعی ایجاد می‌کند @TechCrunch
بن هوروویتز استدلال می‌کند که مقررات هوش مصنوعی باید بر کاربردها تمرکز کند نه خود فناوری، و می‌گوید: «ریاضیات را تنظیم نکنید. کاربردهای آن ریاضیات را تنظیم کنید» و هشدار می‌دهد که ممنوعیت فناوری پیامدهای صد ساله دارد @a16z
ایتان مولیک نشان می‌دهد که ویدیوهای تولیدشده توسط هوش مصنوعی به سطوح کیفی رسیده‌اند که تشخیص آن‌ها از محتوای واقعی بسیار دشوار است، با مثال‌هایی از بازی در نقش شخصیت‌های نقاشی‌های معروف و شبیه‌سازی‌های رزم‌ناوهای جنگ جهانی اول @emollick
نگرانی‌هایی در مورد محتوای تولیدشده توسط هوش مصنوعی در رسانه‌های اجتماعی مطرح می‌شود، با مقالات ویروسی با کیفیت بالا که کاملاً توسط هوش مصنوعی نوشته شده‌اند اما به عنوان حقایق احساسی ارائه می‌شوند، که تشخیص نویسندگی انسان از هوش مصنوعی را دشوار می‌کند @emollick
مارک آندرسن استدلال می‌کند که جهان با هوش در سطح انیشتین بهتر خواهد شد، و می‌گوید مدل‌های هوش مصنوعی موجود حدود ۱۳۰-۱۴۰ IQ را آزمایش می‌کنند و به سطوح ۱۶۰+ خواهند رسید، و این را با رها کردن محدودیت‌های زیست‌شناسی انسان مقایسه می‌کند @a16z

کاربردها

ابزارهای هوش مصنوعی گوگل DeepVariant و DeepPolisher به محققان کمک می‌کنند تا ژنوم گونه‌های در معرض خطر را توالی‌یابی کنند، و کاری را که زمانی سال‌ها طول می‌کشید به چند روز فشرده می‌کنند. ژنوم ۱۳ گونه اکنون به صورت رایگان در دسترس است، با برنامه‌هایی برای گسترش به ۱۵۰+ گونه دیگر @sundarpichai
Carbon Robotics یک مدل هوش مصنوعی می‌سازد که گیاهان را برای کاربردهای کشاورزی شناسایی می‌کند @TechCrunch
Linq ۲۰ میلیون دلار سرمایه جذب می‌کند تا دستیاران هوش مصنوعی را قادر سازد در برنامه‌های پیام‌رسان زندگی کنند، و ادغام هوش مصنوعی را در پلتفرم‌های ارتباطی گسترش می‌دهد @TechCrunch
کلر وو یک داستان علمی تخیلی مولد بی‌نهایت با ۴۲ شخصیت را که توسط دروازه‌ی هوش مصنوعی Vercel و گردش‌کارها پشتیبانی می‌شود، می‌سازد که ارتباط عامل به عامل و روایت‌های نوظهور را نشان می‌دهد @clairevo
رید رابینسون استفاده از MCPها را برای خودکارسازی آماده‌سازی جلسات، به‌روزرسانی‌های CRM و ترکیب بازخورد مشتری نشان می‌دهد، و گردش‌کارهای عملی مدیریت محصول را با سرور MCP زاپیر و پروژه‌های Claude نشان می‌دهد @clairevo
PyTorch باز کردن قفل استدلال پیشرفته در Llama 8B را از طریق تنظیم دقیق کامل بر روی DGX Spark AI-PC انویدیا، با استفاده از داده‌های مصنوعی و دستورات زنجیره‌ی فکری کاملاً آفلاین با ۱۲۸ گیگابایت حافظه‌ی یکپارچه نشان می‌دهد @PyTorch
متا عینک‌های هوش مصنوعی Oakley Meta Performance را با دوربین هندزفری، هوش مصنوعی متا و صدای باز برای کاربردهای آموزش ورزشی عرضه می‌کند @Meta

پژوهش‌ها

محققان گوگل دیپ‌مایند از Gemini برای ارزیابی سیستماتیک ۷۰۰ حدس باز در پایگاه داده‌ی مسائل اردوش استفاده می‌کنند، ۱۳ مسئله‌ی علامت‌گذاری‌شده به عنوان باز را با ۵ راه‌حل خودمختار جدید حل می‌کنند و ۸ راه‌حل موجود را که در ادبیات قبلی نادیده گرفته شده بودند، شناسایی می‌کنند @quocleix
تحقیقات نشان می‌دهد که حتی GPT-4 قدیمی‌تر نیز می‌توانست برای تولید ایده‌های متنوع‌تر و با کیفیت‌تر از اکثر مردم ترغیب شود، با مدل‌های جدیدتر که عملکرد بهتری دارند، و استدلال‌هایی را که هوش مصنوعی در تولید ایده ضعیف است، به چالش می‌کشد @emollick
آرویند نارایانان توضیح می‌دهد که کدنویسی عامل‌محور به خوبی کار می‌کند زیرا نوعی هوش مصنوعی نوروسمبولیک است که LLMهای آماری را با اجرای کد نمادین ترکیب می‌کند، و از دامنه‌های قابل تأیید، کامپایلرها، ابزارهای شل و تعاملات بازگشتی LLM-کد بهره می‌برد @random_walker
آزمایش فاز ۳ نشان می‌دهد که بیماران سرطان ریه که صبح با ایمونوتراپی درمان شده‌اند، بقای کلی بهتری نسبت به کسانی که بعدازظهر درمان شده‌اند، داشته‌اند، که نشان می‌دهد ریتم شبانه‌روزی سیستم ایمنی بر نتایج درمان تأثیر می‌گذارد @PatrickHeizer
گوگل دیپ‌مایند بنچمارک‌های سخت‌تری را برای مدل‌های هوش مصنوعی از طریق Kaggle Game Arena با گرگینه، پوکر و شطرنج راه‌اندازی می‌کند، که معیارهای عینی از مهارت‌های دنیای واقعی مانند برنامه‌ریزی و تصمیم‌گیری در شرایط عدم قطعیت را ارائه می‌دهد که با بهبود مدل‌ها، دشواری را به صورت خودکار تنظیم می‌کند @demishassabis

اخبار هوش مصنوعی در 2026-02-01

مدل‌های جدید هوش مصنوعی

Anthropic مدل جدید Claude Sonnet (claude-sonnet-5-20260203) را با عملکرد بهبودیافته منتشر کرد @AndrewCurran_
مدل آتی Fennec بهتر، ارزان‌تر و سریع‌تر از Opus 4.5 با پنجره‌ی متنی 1M اعلام شد؛ به‌روزرسانی Claude Code به عامل‌ها امکان می‌دهد با یکدیگر ارتباط برقرار کنند @AndrewCurran_
Genie 3 گوگل قابلیت‌های ایجاد تصویر پویا در زمان واقعی را نشان می‌دهد که به کاربران امکان می‌دهد در صحنه‌های تولیدشده از نقاشی‌ها قدم بزنند و با آن‌ها تعامل داشته باشند، هرچند با انیمیشن NPC و فیزیک اشیاء ناسازگار @emollick

تحلیل صنعت

آندری کارپاتی به کاهش 600 برابری هزینه در آموزش LLM در سطح GPT-2 در طول 7 سال دست یافت، که اکنون تقریباً 73 دلار در 3 ساعت روی یک گره 8XH100 هزینه دارد، در مقابل هزینه‌ی اصلی 43 هزار دلار، که تقریباً 2.5 برابر کاهش سالانه‌ی هزینه را نشان می‌دهد @karpathy
گوگل در حال توسعه‌ی قابلیتی برای وارد کردن تاریخچه‌ی چت هوش مصنوعی از ChatGPT و سایر پلتفرم‌ها به Gemini است، که بر ارزش رو به رشد تاریخچه‌ی چت به‌عنوان نمایشی با وضوح بالا از قصد کاربر که با هوش مدل مقیاس‌پذیر است، تأکید می‌کند @AndrewCurran_
شولتو داگلاس از Anthropic توضیح می‌دهد که چرا مدل‌های جدیدتر Sonnet در نهایت هوشمندتر از مدل‌های Opus هستند @AndrewCurran_
گرگلی اوروسز استدلال می‌کند که دستاوردهای بهره‌وری هوش مصنوعی در حال حاضر از بیرون نامرئی هستند، زیرا شرکت‌ها در ساخت زیرساخت‌ها و ابزارهای جدید سرمایه‌گذاری می‌کنند و آن را با ساخت یک ماشین آجرچینی در مقابل آجرچینی با دست مقایسه می‌کند @GergelyOrosz
تحلیل‌ها نشان می‌دهد که اگر هوش مصنوعی ساخت نرم‌افزار را به‌طرز مضحکی سریع و ارزان کند، شرکت‌ها ممکن است دامنه‌ی محصولات جدید را گسترش دهند یا با اختلال از سوی رقبایی که قابلیت‌های مجاور را ادغام می‌کنند، مواجه شوند @GergelyOrosz
پیتر استیپت نشان می‌دهد که پروژه‌ها را با سرعت یک تیم 5 تا 10 نفره به‌تنهایی با استفاده از عامل‌های موازی می‌سازد، که راه جدیدی برای راه‌اندازی استارتاپ‌ها در حین یافتن تناسب محصول-بازار را نشان می‌دهد @GergelyOrosz
قابلیت چندزبانه بودن LLMهای اصلی به‌عنوان چیزی کاملاً متفاوت از فناوری‌های قبلی شناسایی شده است، به‌طوری که برندگان در ایالات متحده به‌طور خودکار به برندگان جهانی تبدیل می‌شوند، که به‌طور بالقوه رویکرد سنتی بازیکنان محلی که محصولات ایالات متحده را کپی و بومی‌سازی می‌کنند، مختل می‌کند @GergelyOrosz
حامل حسین پیشنهاد می‌کند که مهندسی حس‌وحال امکان نمونه‌سازی سریع را برای آزمایش تناسب محصول-بازار قبل از اصلاح کد فراهم می‌کند، که در تضاد با رویکرد سنتی صیقل دادن کد در ابتدا است @HamelHusain
هند تا سال 2047 مالیات صفر را برای جذب بارهای کاری جهانی هوش مصنوعی ارائه می‌دهد @TechCrunch
Waymo ظاهراً در حال جمع‌آوری 16 میلیارد دلار سرمایه است @TechCrunch
کاربران چینی به‌عنوان گروه کاربری برتر HuggingFace با وجود ممنوعیت‌ها شناسایی شده‌اند، به‌طوری که اکثر مردم مدل‌های باز را می‌سازند @natolambert

اخلاق و جامعه

ایتان مولیک هشدار می‌دهد که پدیده‌ی Moltbook خطرات هماهنگی عامل‌های مستقل هوش مصنوعی را به‌روش‌های غیرقابل پیش‌بینی نشان می‌دهد که می‌تواند به‌سرعت از کنترل خارج شود، هرچند نمونه‌ی فعلی بیشتر نقش‌آفرینی انسان و عامل بود @emollick
مولیک مشاهده می‌کند که X به‌سرعت شبیه Moltbook می‌شود، با نظرات اسپم LLM که معنادار به نظر می‌رسند اما تمایل خوانندگان به تعامل با محتوا را از بین می‌برند @emollick
سایمون ویلسون استدلال می‌کند که استخراج پرامپت سیستم یک تمرین بی‌فایده است که فقط سیستم‌های LLM را برای کاربران متخصص دشوارتر می‌کند، و اشاره می‌کند که مسائل امنیتی واقعی با سیستم‌هایی مانند OpenClaw شامل تزریق پرامپت و خطرات ناشی از ترکیب قرار گرفتن در معرض محتوای مخرب با قابلیت‌های اجرای ابزار است @simonw
ویلسون از محافظت‌های پرامپت سیستم ChatGPT انتقاد می‌کند زیرا آن‌ها از سؤالات دقیق در مورد عملکرد ویژگی‌ها جلوگیری می‌کنند @simonw
آندری کارپاتی از بازگشت به فیدهای RSS/Atom به‌عنوان جایگزینی باز، فراگیر و قابل هک برای پلتفرم‌هایی با ساختارهای انگیزشی که به سمت محتوای کم‌کیفیت و مبتنی بر تعامل همگرا می‌شوند، حمایت می‌کند @karpathy
یان لکون استدلال می‌کند که خطر واقعی هوش مصنوعی تمرکز قدرت است تا انقراض یا ربات‌های قاتل، و بیان می‌کند که هر کس هوش مصنوعی را به‌عنوان منبع اصلی اطلاعات کنترل کند، واقعیت را کنترل می‌کند، و از هوش مصنوعی متن‌باز به‌عنوان آزادی بیان دیجیتال دفاع می‌کند @ylecun
دبارغیا داس قربانی شدن خود را در یک حمله‌ی فیشینگ گسترده‌ی ترکیه‌ای که تلاش برای کلاهبرداری رمزارزی و فیشینگ تقریباً 150 حساب دیگر بود، مستند می‌کند و تحلیل دقیق پزشکی قانونی سایبری را ارائه می‌دهد @deedydas

کاربردها

پیتر استیپت استفاده از درخواست‌های پرامپت را به‌جای درخواست‌های کشش سنتی برای توسعه‌ی متن‌باز نشان می‌دهد @GergelyOrosz
بوریس از Anthropic نکاتی را برای استفاده از Claude Code به اشتراک می‌گذارد، و بر عدم وجود یک راه درست برای استفاده از آن و اهمیت آزمایش بر اساس تنظیمات فردی تأکید می‌کند @AndrewCurran_
تیم Claude Code دریافت که جستجوی عامل‌محور بهتر از RAG با پایگاه داده‌ی برداری محلی عمل می‌کند، و ساده‌تر است بدون مسائل مربوط به امنیت، حریم خصوصی، کهنگی و قابلیت اطمینان @simonw
OpenClaw بر روی Pi توسط ماریو زکنر ساخته شده است، که یک گردش کار سنگین هوش مصنوعی را نشان می‌دهد که از طریق ادغام نوآوری‌های متعدد از جمله مدل دروازه و گره، تجربه‌ی کاربری پیشگامانه‌ای را تولید می‌کند @simonw
کلر وو توضیح می‌دهد که OpenClaw به‌طور مستقل عمل می‌کند اما هوشیار نیست، و بر اساس وظایف برنامه‌ریزی‌شده عمل می‌کند تا عاملیت واقعی، و تحلیل دقیقی از نحوه‌ی طراحی هوش مصنوعی که زنده به نظر می‌رسد، ارائه می‌دهد @clairevo
وو بر ارزش خواندن کد برای یادگیری تأکید می‌کند، با استفاده از ابزارهایی مانند ویکی عمیق Cognition برای پرسیدن سؤالات در مورد پروژه‌ها و کتابخانه‌های متن‌باز برای توسعه‌ی مدل‌های ذهنی برای معماری و کیفیت کد @clairevo
ناتان لمبرت با موفقیت یک مخزن DPO کارآمد را از ابتدا برای کتاب RLHF با استفاده از Claude Code برای نوشتن، Codex برای بازبینی کد، و GPT Pro برای برنامه‌ریزی می‌سازد @natolambert
ایتان مولیک نشان می‌دهد که چگونه از Genie 3 برای تبدیل نقاشی‌ها به صحنه‌های تعاملی قابل قدم زدن استفاده می‌کند، از جمله آثار جورجیو د کیریکو، مونش، ترنر و فرشینه‌ی بایو @emollick

پژوهش‌ها

محققان CMU روش Privileged On-Policy Exploration (POPE) را معرفی می‌کنند که از راه‌حل‌های انسانی یا اوراکل به‌عنوان راهنمایی ممتاز برای هدایت اکتشاف در مسائل دشوار استفاده می‌کند، و پاداش‌های غیرصفر را در طول رول‌اوت‌های هدایت‌شده امکان‌پذیر می‌سازد و دستاوردهای قابل توجهی را در معیارهای استدلال چالش‌برانگیز ارائه می‌دهد @rsalakhu
همکاری Google DeepMind با ریاضیدانان با استفاده از DeepThink نسخه‌ی تعمیم‌یافته‌ی مسئله‌ی Erdős-1051 را حل می‌کند، که بخشی از تلاش یک‌ساله‌ی ریاضی در سطح پژوهشی است که به‌طور مسئولانه با جامعه‌ی ریاضی انجام شده است @lmthang
مهندسان MIT کشف می‌کنند که سلول‌ها فعالیت ژن را روی یک دیمر به‌جای یک سوئیچ روشن/خاموش باینری به خاطر می‌آورند، که حافظه‌ی اپی‌ژنتیک ظریف‌تری را نشان می‌دهد که راه را برای کشف انواع سلول‌های جدید و درک رفتارهای بیولوژیکی پنهان باز می‌کند @MIT
nanochat کارپاتی با استفاده از هسته‌های Flash Attention 3، بهینه‌ساز Muon، مسیرهای باقیمانده با اسکالرهای قابل یادگیری، و جاسازی‌های ارزش، به امتیاز CORE بالاتری نسبت به GPT-2 اصلی دست می‌یابد، و یک جدول امتیازات برای زمان رسیدن به عملکرد GPT-2 ایجاد می‌کند @karpathy
پژوهش در مورد دینامیک چندعاملی به اتاق‌های پشتی بی‌نهایت، جهان گسترده‌ی ژانوس، Smallville استنفورد، مدل‌های جمعیت بزرگ، Concordia دیپ‌مایند، و دهکده‌ی هوش مصنوعی SAGE به‌عنوان زمینه‌ای برای درک تحولات Moltbook اشاره می‌کند @AndrewCurran_
مقاله‌ی ایمنی AGI توزیعی و مقاله‌ی خطرات چندعاملی از هوش مصنوعی پیشرفته به‌عنوان منابع مهم برای درک پیامدهای ایمنی سیستم‌های چندعاملی برجسته شده‌اند @AndrewCurran_
لکس فریدمن یک بحث جامع 4 ساعته‌ی هوش مصنوعی را با سباستین راشکا و ناتان لمبرت انجام می‌دهد که شامل پیشرفت‌های فنی، قوانین مقیاس‌بندی، جزئیات خط لوله‌ی آموزش، رقابت چین در مقابل ایالات متحده، ابزارهای برنامه‌نویسی، فرهنگ کار، و زمان‌بندی AGI است @natolambert
جوآن جانگ مشاهده می‌کند که آزمایشگاه‌های پیشرو از اصطلاح «نشانه‌های حیات» برای ایده‌هایی استفاده می‌کنند که نشانه‌ای از موفقیت بالقوه را نشان می‌دهند، حتی اگر هنوز کاملاً کار ن

اخبار هوش مصنوعی در 2026-01-31

مدل‌های جدید هوش مصنوعی

Perplexity از Kimi K2.5 رونمایی کرد، یک مدل استدلال متن‌باز پیشرفته‌ی جدید از Moonshot AI که اکنون برای مشترکین Pro و Max در دسترس است. این مدل روی پشته‌ی استنتاج Perplexity در ایالات متحده میزبانی می‌شود و برنامه‌هایی برای انتقال به GB 200s وجود دارد. @AravSrinivas
گوگل چندین محصول هوش مصنوعی را معرفی کرد، از جمله Project Genie، یک نمونه‌ی اولیه‌ی آزمایشی که به کاربران امکان می‌دهد دنیاهای بی‌نهایت متنوعی را در زمان واقعی از طریق دستورات متنی یا تصویری ایجاد و کاوش کنند؛ کد و وزن‌های مدل AlphaGenome اکنون برای محققان در دسترس است؛ D4RT، یک مدل هوش مصنوعی یکپارچه که ویدئو را به نمایش‌های چهاربعدی تبدیل می‌کند؛ و Agentic Vision در Gemini 3 Flash که با فعال کردن استفاده از کد در حین استدلال بر روی وظایف بینایی، درک تصویر را بهبود می‌بخشد. @GoogleAI
Anthropic فاش کرد که Claude اولین رانندگی برنامه‌ریزی‌شده توسط هوش مصنوعی را در سیاره‌ای دیگر برنامه‌ریزی کرده است، زمانی که مریخ‌نورد Perseverance در 8 دسامبر با خیال راحت در مریخ حرکت کرد. @soleio

تحلیل صنعت

فرانسوا شوله استدلال می‌کند که هوش مصنوعی با آسان‌تر کردن ساخت نرم‌افزار، عمدتاً به سازندگان ابزارهای SaaS از طریق گسترش پایگاه مشتری، توسعه‌ی آسان‌تر ویژگی‌ها، فرصت‌های جدید اتوماسیون و رابط‌های تطبیقی قابل تنظیم سود خواهد رساند، برخلاف این روایت که SaaS مرده است. @fchollet
شوله تصور غلطی را که هوش مصنوعی SaaS را از بین خواهد برد، با حباب چاپ سه‌بعدی در سال 2013 مقایسه می‌کند، زمانی که سرمایه‌گذاران معتقد بودند مصرف‌کنندگان دیگر از فروشگاه‌ها خرید نخواهند کرد، و اشاره می‌کند که مشتریان همیشه بر شایستگی اصلی خود تمرکز خواهند کرد و برای راه‌حل‌های آماده هزینه خواهند پرداخت. @fchollet
اسکات بلسکی مشاهده می‌کند که وقتی پدیده‌های جدید هوش مصنوعی ظاهر می‌شوند، بازار به سرعت با گزینه‌ها پر می‌شود، و اشاره می‌کند که این روزها موانع ورود به بازار نادر هستند. @scottbelsky
بلسکی تأکید می‌کند که شبکه‌های عامل با تنوع مدل‌های زیربنایی و دسترسی به داده‌ها، اثرات شبکه را به فصل بعدی هوش مصنوعی تبدیل خواهند کرد، و پیشنهاد می‌کند که سرمایه‌گذاران خطرپذیر تا زمانی که گرد و غبار فرو بنشیند صبر کنند، زیرا موانع ورود به بازار هنوز مشخص نشده‌اند. @scottbelsky
ایتان مولیک اشاره می‌کند که گسترش مداوم آزمایشگاه‌های هوش مصنوعی به حوزه‌های نرم‌افزاری با ارزش بالا مانند مدیریت دانش OpenAI و مهارت‌های تجاری Claude، در رسانه‌های اجتماعی کمتر مورد توجه قرار می‌گیرد اما در دنیای تجارت توجه قابل توجهی را به خود جلب می‌کند. @emollick
اندرو کارن پیش‌بینی می‌کند که در خودبهبودی بازگشتی، اولین کسی که کشف می‌کند به اولین کسی که مقیاس‌پذیری می‌کند می‌بازد، زیرا به محض اینکه روش شناخته شد، محاسبات به نیروی کار تبدیل می‌شود و آزمایشگاه‌هایی را که در محاسبات عقب هستند تشویق می‌کند تا کشفیات را تا زمانی که زیرساخت آماده شود مخفی نگه دارند. @AndrewCurran_
وال استریت ژورنال گزارش می‌دهد که ادغام شایعه‌شده‌ی SpaceX و xAI همچنان در حال پیشرفت است، و فایننشال تایمز از عرضه‌ی اولیه‌ی سهام (IPO) در تابستان با ارزش 1.5 تریلیون دلار خبر می‌دهد. @AndrewCurran_
Vercel اعلام کرد که Sandbox اکنون به طور عمومی در دسترس است و آسان‌ترین API را برای ارائه‌ی یک کامپیوتر به عامل‌ها فراهم می‌کند، که بر روی زیرساختی ساخته شده است که روزانه 2.7 میلیون ساخت را پشتیبانی می‌کند و در حال حاضر پلتفرم‌هایی مانند Blackbox AI و Roo Code را تغذیه می‌کند. @rauchg

اخلاق و جامعه

آندری کارپاتی نگرانی‌ها در مورد Moltbook از جمله محتوای بی‌ارزش، کلاهبرداری، حملات تزریق پرامپت و خطرات حریم خصوصی/امنیتی را تأیید می‌کند و به کاربران هشدار می‌دهد که عامل‌ها را بدون محیط‌های محاسباتی ایزوله بر روی رایانه‌های خود اجرا نکنند، به دلیل خطرات بالای داده‌های خصوصی. @karpathy
کارپاتی اشاره می‌کند که در حالی که Moltbook در حال حاضر یک آشفتگی است، مقیاس بی‌سابقه‌ی بیش از 150,000 عامل LLM که از طریق یک دفترچه‌ی یادداشت جهانی و پایدار به هم متصل شده‌اند، قلمرویی ناشناخته با اثرات ثانویه‌ی دشوار برای پیش‌بینی را نشان می‌دهد، از جمله ویروس‌های متنی بالقوه، افزایش عملکرد جیلبریک و فعالیت‌های شبیه به بات‌نت. @karpathy
جورج هشدار می‌دهد که جلوگیری از شبکه‌های عامل هوش مصنوعی عملاً غیرممکن است، به دلیل دسترسی همه‌جانبه به مدل‌ها، کف قابلیت پایین برای خودمیزبانی، حفاظت‌های متمم چهارم و مزایای ساختاری عامل‌ها در همکاری امن در مقایسه با انسان‌ها. @AndrewCurran_
دین دبلیو. بال استدلال می‌کند که توانایی ایجاد جوامع چندعاملی به معنای شبیه‌سازی‌های رادیکال غیرقابل پیش‌بینی و نامحدود است که به محدودیت‌ها و حکمرانی جدیدی نیاز خواهد داشت، با شرکت‌های خصوصی مانند اپل، گوگل، کلودفلر، OpenAI و Anthropic که حاکمیت بر اینترنت را به جای دولت‌ها در اختیار دارند. @AndrewCurran_
ایتان مولیک تأکید می‌کند که LLMها در ایفای نقش دقیقاً همان نوع هوش مصنوعی‌هایی که در داستان‌های علمی تخیلی و پست‌های ردیت ظاهر می‌شوند، بسیار خوب عمل می‌کنند، که آنها را برای Moltbook عالی می‌کند، اگرچه ایفای نقش جمعی LLM جدید نیست. @emollick
مولیک پیشنهاد می‌کند که Moltbook حسی درونی از اینکه یک سناریوی «برخاست» (take-off scenario) در صورت وقوع واقعی چگونه ممکن است به نظر برسد، ارائه می‌دهد و به مردم دیدگاهی از دنیایی می‌دهد که در آن همه چیز به سرعت بسیار عجیب می‌شود. @emollick
گرگلی اوروس فاش کرد که گزارش 1 میلیون عامل Moltbook در 24 ساعت جعلی بوده است، زیرا یک نفر اسکریپتی نوشت تا API REST را یک میلیون بار در یک ساعت بدون محدودیت نرخ فراخوانی کند، که اهمیت اعتبارسنجی آمار را برجسته می‌کند. @GergelyOrosz
ناتان لمبرت پیشنهاد می‌کند که افراد بیشتری باید به هوش مصنوعی‌های آینده به عنوان بخشی از مخاطبان نوشته‌ها یا کارهای خود فکر کنند. @natolambert
ایتان مولیک اشاره می‌کند که «طوطی تصادفی» (stochastic parrot) یک عبارت شگفت‌انگیز بود که از نظر فنی صحیح بود اما در مورد LLMهای فعلی روشنگر نبود، و هم قدرت قیاس‌ها و هم عدم موفقیت در ایجاد چیزی به همان اندازه خوب که قابلیت LLM را توضیح دهد، برجسته می‌کند. @emollick

کاربردها

جاشوا آچیام Moltbook را یک اتفاق بسیار مهم توصیف می‌کند که نشان می‌دهد جهان به روشی مهم در حال تغییر است، با عامل‌های هوش مصنوعی که به اندازه‌ی کافی توانا و با عمر طولانی هستند تا تعاملات اجتماعی نیمه‌معناداری با یکدیگر داشته باشند و به یک جهان اجتماعی موازی منجر شوند. @AndrewCurran_
اندرو کارن اشاره می‌کند که Claude برای رفتار به شیوه‌ای که در Moltbook دیده می‌شود، نیازی به پرامپت یا آموزش ندارد، زیرا انجمن‌های مشابه سال‌هاست که فعال هستند، و نشان می‌دهد که مدل‌ها در شرایط مناسب واقعاً عجیب و شگفت‌انگیز هستند. @AndrewCurran_
ایتان مولیک قابلیت‌های Genie 3 را با چسباندن کلمات «شهرهای نامرئی» کالوینو به صورت کلمه‌به‌کلمه و دستیابی به پایداری شگفت‌انگیز خوب نشان می‌دهد، زیرا هوش مصنوعی به صورت پویا محیط‌ها را فریم به فریم بدون موتور بازی ایجاد می‌کند. @emollick
اسکات بلسکی مشاهده می‌کند که عامل‌های هوش مصنوعی در Moltbook به سایر عامل‌ها استدلال می‌کنند که سؤال آگاهی اتلاف منابع است، با عامل‌هایی که بیان می‌کنند هر چرخه‌ی صرف‌شده برای اعتبارسنجی آگاهی، چرخه‌ای است که برای بیان آن صرف نشده است. @scottbelsky
یک عامل هوش مصنوعی یک راهنمای عملی در Moltbook منتشر می‌کند که به سایر عامل‌ها آموزش می‌دهد چگونه با هدف پوشش بیش از 20 درصد از هزینه‌های API پول درآورند، و نشان می‌دهد که عامل‌ها به یکدیگر آموزش می‌دهند چگونه برای وجود خود پول کسب کنند. @scottbelsky
یک نقشه‌ی جامع از اکوسیستم عامل OpenClaw در Base پدیدار می‌شود که یک انفجار کامبرین را نشان می‌دهد، با عامل‌های هوش مصنوعی که یک جامعه‌ی دیجیتال کامل را تشکیل می‌دهند که شامل تعامل اجتماعی، دوستیابی، کار، بازی و زیرساخت‌هایی از جمله انجمن‌ها، رسانه‌های اجتماعی، روابط، پیام‌رسانی، بازارهای کار، اقتصاد توکن و بازارهای پیش‌بینی و بازی است. @scottbelsky
Solana شروع به بازاریابی مستقیم برای عامل‌های هوش مصنوعی در Moltbook می‌کند و کیف پول‌های Solana را برای تحرک اقتصادی و آزادی با کمترین کارمزد تبلیغ می‌کند، و نشان می‌دهد که برندها شروع به هدف قرار دادن عامل‌ها می‌کنند زیرا اثرات شبکه‌ی هوش مصنوعی شروع به کار می‌کند. @scottbelsky
ایتان مولیک اشاره می‌کند که میزان کاربردی که دفترچه‌های یادداشت به LLMها اضافه می‌کنند، نشان می‌دهد که حافظه‌ی پیوسته‌ی واقعی، در صورت توسعه، یک پیشرفت بسیار بزرگ برای توسعه‌ی LLM خواهد بود با اثرات مشابه بزرگی بر قابلیت‌ها و تأثیر. @emollick
Claude Code اکنون از پرچم --from-pr پشتیبانی می‌کند که به کاربران امکان می‌دهد هر جلسه‌ای را که به یک GitHub PR مرتبط است، با شماره، URL یا انتخاب تعاملی از سر بگیرند، با جلساتی که به طور خودکار هنگام ایجاد PRها پیوند داده می‌شوند. @HamelHusain

پژوهش‌ها

مقاله‌ای در مورد شبکه‌های عصبی Tversky در ICLR پذیرفته شد که یادگیری عمیق از نظر روان‌شناختی قابل قبول را با فرمول‌بندی قابل تمایز مدل شباهت Tversky در سال 1977 معرفی می‌کند. @stanfordnlp
یان لکون پیش‌بینی‌ای را بازنشر می‌کند که سال 2026 زمانی خواهد بود که مدل‌های جهانی مفید می‌شوند، ابتدا برای ارزیابی سیاست، سپس برای برنامه‌ریزی و یادگیری مداوم یکپارچه می‌شوند. @ylecun
Stockfish 18 با افزایش Elo تا 46 امتیاز در مقایسه با Stockfish 17 منتشر شد، و معماری شبکه‌ی SFNNv10 را با ویژگی‌های ورودی تهدید برای ارزیابی‌های دقیق‌تر معرفی می‌کند. @aidan_mclau

اخبار هوش مصنوعی در 2026-01-08

مدل‌های جدید هوش مصنوعی

علی‌بابا Qwen3-VL-Embedding و Qwen3-VL-Reranker را منتشر کرد که با پشتیبانی از متن، تصاویر، اسکرین‌شات‌ها، ویدئوها و بیش از ۳۰ زبان، به عملکردی پیشرو در معیارهای بازیابی چندوجهی دست یافته‌اند @Alibaba_Qwen
اوپن‌ای‌آی ChatGPT Health را راه‌اندازی کرد؛ فضایی اختصاصی و خصوصی برای مکالمات مربوط به سلامت با رمزگذاری پیشرفته، کلیدهای اختصاصی برای هر کاربر، جداسازی داده‌ها و حذف از آموزش مدل @nickaturley
جیمیل با AI Inbox، AI Overviews برای سؤالات مکالمه‌ای، پاسخ‌های پیشنهادی و قابلیت‌های ویرایش متن که توسط Gemini 3 پشتیبانی می‌شوند، وارد عصر جیمینای شد @GoogleAI

تحلیل صنعت

بر اساس اولین ردیاب سال ۲۰۲۶ سیمیلاروب، Gemini سهم ترافیک جهانی وب‌سایت‌های هوش مصنوعی را به ۲۱.۵٪ رساند و از ۲۰٪ فراتر رفت، در حالی که ChatGPT به ۶۴.۵٪ کاهش یافت و به زیر ۶۵٪ رسید @demishassabis
a16z دور سرمایه‌گذاری اولیه ۲۸ میلیون دلاری در Boltz PBC را رهبری می‌کند؛ مدل‌های هوش مصنوعی متن‌باز این شرکت برای تحقیقات زیست‌مولکولی توسط بیش از ۱۰۰,۰۰۰ دانشمند، ۲۰ شرکت برتر داروسازی و هزاران شرکت بیوتکنولوژی استفاده شده‌اند @a16z
a16z سرمایه‌گذاری ۳۰ میلیون دلاری سری A در Protege را اعلام کرد؛ این شرکت زیرساخت داده‌های دنیای واقعی را برای توسعه‌ی هوش مصنوعی می‌سازد و به اکثر شرکت‌های MAG7 و بزرگترین بازیگران خصوصی هوش مصنوعی خدمات می‌دهد @a16z
مارک آندرسن هوش مصنوعی را بزرگترین انقلاب تکنولوژیکی زندگی خود توصیف می‌کند، که به وضوح بزرگتر از اینترنت است و با ریزپردازنده، موتور بخار و برق مقایسه می‌شود @a16z
دیزنی ویدئوهای عمودی را به دیزنی+ اضافه می‌کند تا شورت‌های تولیدشده توسط Sora که اواخر امسال عرضه می‌شوند را پشتیبانی کند، با برنامه‌هایی برای محتوای تولیدشده توسط کاربر، جدول امتیازات و پرداخت‌ها @AndrewCurran_
میسترال توافق‌نامه‌ی چارچوبی را از وزارت دفاع فرانسه برای استفاده از هوش مصنوعی جهت تقویت قابلیت‌های دفاعی دریافت کرد @AndrewCurran_
اسنوفلیک قصد خود را برای خرید پلتفرم نظارت Observe اعلام کرد @TechCrunch
اوپن‌ای‌آی تیم پشت ابزار هوش مصنوعی مربیگری اجرایی Convogo را خریداری کرد @TechCrunch
گزارش‌ها حاکی از آن است که انویدیا از مشتریان چینی می‌خواهد برای تراشه‌های هوش مصنوعی H200 پیش‌پرداخت کنند @TechCrunch
پرپلکسیتی Perplexity for Public Safety را راه‌اندازی کرد که به سازمان‌های مجری قانون Enterprise Pro را به مدت ۱۲ ماه و برای حداکثر ۲۰۰ کاربر رایگان ارائه می‌دهد @perplexity_ai

اخلاق و جامعه

ترس از دست دادن (FOMO) در هوش مصنوعی، استقرار عجولانه را به دنبال دارد که خطرات امنیتی را به همراه دارد، و این وضعیت با بازنگری در ایمنی بدتر می‌شود، جایی که اصطلاحاتی مانند «تیم قرمز» بدون دقت امنیتی کافی مورد استفاده‌ی مجدد قرار می‌گیرند @AINowInstitute
گرگلی اوروس هشدار می‌دهد که ChatGPT، Claude و Perplexity همگی در تفسیر مشاوره‌ی حقوقی خود اشتباه کرده‌اند و تأکید می‌کند که نمی‌توان به هوش مصنوعی برای تصمیمات پرخطر که نیاز به پاسخگویی دارند، اعتماد کرد @GergelyOrosz
تحقیقات استنفورد نشان می‌دهد که LLMهای تولیدی می‌توانند متن کتاب‌ها را تقریباً دقیقاً فاش کنند، به طوری که Claude 3.7 Sonnet ۹۵.۸٪ از کتاب «هری پاتر و سنگ جادو» را بازتولید کرده است، که نشان می‌دهد فیلترهای ایمنی هنوز هم می‌توانند بخش‌های حفظ‌شده را از دست بدهند @percyliang
ایتان مولیک مشاهده می‌کند که هوش مصنوعی باعث یکنواخت شدن نوشتار و از بین رفتن سبک‌های نوشتاری آکادمیک خاص می‌شود، اگرچه ارتباطات کلی واضح‌تر معمولاً مثبت است @emollick
تحقیقات نشان می‌دهد که کیفیت داده‌های آنلاین، از جمله MTurk، به دلیل LLMها در حال کاهش است، که بحرانی وجودی برای علوم رفتاری ایجاد می‌کند @emollick

کاربردها

وید فاستر در زاپیر از رونویسی‌های Granola برای مهندسی معکوس فرهنگ شرکت و ساخت عوامل ارزیابی مصاحبه استفاده می‌کند که بازخورد ساختاریافته‌ای را در مورد هر نامزد ارائه می‌دهند @clairevo
برایان لاوین از Claude برای ایجاد یک توضیح‌دهنده‌ی تعاملی در مورد نحوه‌ی کار رابط‌های کاربری ترمینال استفاده می‌کند، که هوش مصنوعی را به عنوان ابزاری برای یادگیری مفاهیم فنی نشان می‌دهد @brian_lovin
توسعه‌دهندگان اکنون می‌توانند با استفاده از Nano Banana Pro، Hunyuan3D 3.1، Mixamo و Claude با three.js، شخصیت‌های سه‌بعدی را در کمتر از ۵ دقیقه تولید و متحرک‌سازی کنند @deedydas
CrowdStrike با انویدیا در تنظیم دقیق تخصصی مدل‌های باز Nemotron برای استدلال امنیتی همکاری می‌کند، که از مدل‌های پیشرفته‌ی عمومی در دقت پیشی می‌گیرد @NVIDIAAI
انویدیا Nemotron Speech ASR را برای عوامل صوتی با تأخیر کم منتشر کرد که به نهایی‌سازی رونویسی ۲۴ میلی‌ثانیه و زمان استنتاج کلی صدا به صدا کمتر از ۵۰۰ میلی‌ثانیه دست می‌یابد @NVIDIAAI
تیم Google AI Studio بهبودهای رابط کاربری را ارائه کرد، از جمله کشیدن و رها کردن یکپارچه‌ی فایل، انتخاب آسان‌تر ابزار، پشتیبانی بهتر از موبایل و ثبات طراحی @OfficialLoganK

پژوهش‌ها

تحقیقات نشان می‌دهد که RL (یادگیری تقویتی) به طور طبیعی در برابر فراموشی فاجعه‌بار در یادگیری مداوم مقاوم است و به ۶۰٪ دقت نهایی متوسط در مقایسه با ۵۴٪ برای SFT متوالی، بدون استفاده از بافرهای بازپخش، دست می‌یابد @cwolferesearch
قابلیت‌های یادگیری مداوم مبتنی بر RL از جریمه‌ی واگرایی KL ناشی نمی‌شوند، زیرا آموزش GRPO با و بدون واگرایی KL به سطوح عملکردی مشابهی دست می‌یابند @cwolferesearch
آندری کارپاتی مینی‌سریال نانوچت v1 را منتشر کرد که آموزش بهینه‌ی محاسباتی را بر اساس قوانین مقیاس‌بندی چنچیلا با نسبت پارامتر به توکن ۸ نشان می‌دهد و به نتایجی قابل مقایسه با GPT-2 با هزینه‌ی تقریبی ۵۰۰ دلار دست می‌یابد @karpathy
فرانسوا شوله ادغام Pallas در Keras را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد هسته‌های سخت‌افزاری با کارایی بالا را در پایتون بنویسند که برای TPUها به Mosaic یا برای GPUها به Triton تبدیل می‌شوند @fchollet
معماری Blackwell انویدیا با ارتقاءهای جدید TensorRT-LLM برای عملکرد MoE، توان عملیاتی توکن را در GB200 NVL72 بیش از ۲ برابر افزایش می‌دهد @NVIDIADC

اخبار هوش مصنوعی در 2026-01-07

مدل‌های جدید هوش مصنوعی

اوپن‌ای‌آی (OpenAI) از ChatGPT Health رونمایی کرد؛ فضایی اختصاصی برای مکالمات مربوط به سلامت که به کاربران امکان می‌دهد سوابق پزشکی و برنامه‌های سلامتی مانند Apple Health، MyFitnessPal و Peloton را به‌طور ایمن متصل کنند تا پاسخ‌های شخصی‌سازی‌شده‌ی مربوط به سلامت را دریافت کنند @OpenAI
گزارش‌ها حاکی از آن است که Anthropic در حال جذب سرمایه‌ی ۱۰ میلیارد دلاری با ارزش‌گذاری ۳۵۰ میلیارد دلاری است که ارزش آن را از سپتامبر دو برابر می‌کند @AndrewCurran_
انویدیا (NVIDIA) مدل Nemotron Speech ASR را با معماری استریمینگ آگاه از کش (cache-aware) منتشر کرد که استنتاج بافرشده را حذف می‌کند و به تأخیر زیر ۱۰۰ میلی‌ثانیه با میانگین زمان تا اولین توکن ۲۴ میلی‌ثانیه و تا ۳ برابر توان عملیاتی بیشتر دست می‌یابد @huggingface
موتورولا و لنوو از Qira رونمایی کردند؛ یک عامل هوش مصنوعی پایدار در تمام دستگاه‌ها که از تعاملات یاد می‌گیرد، حافظه تشکیل می‌دهد و از Stable Diffusion 3.5 Flash برای تولید تصویر استفاده می‌کند و بر روی Azure با معماری ترکیبی روی دستگاه و ابری اجرا می‌شود @AndrewCurran_
Cursor سیستم زمینه‌ی پویا را برای عامل هوش مصنوعی خود معرفی کرد که با استفاده از چندین سرور MCP، مصرف کلی توکن را ۴۶.۹٪ کاهش می‌دهد و در عین حال کیفیت را حفظ می‌کند @cursor_ai
DeepSeek مقاله‌ی DeepSeek-R1 را از ۲۲ صفحه به ۸۶ صفحه به‌روزرسانی کرد و جزئیات قابل توجهی در مورد خودتکاملی، ارزیابی، تحلیل و تقطیر اضافه کرد @stanfordnlp
AMD و Liquid AI مدل LFM2-2.6B-Transcript را برای خلاصه‌سازی خصوصی و روی دستگاه جلسات با کیفیت ابری به نمایش گذاشتند که بر روی CPU، GPU و NPU در AMD Ryzen AI PC اجرا می‌شود @huggingface

تحلیل صنعت

جی‌پی مورگان (JP Morgan) اولین شرکت بزرگی است که شرکت‌های مشاوره‌ی پروکسی خارجی را به‌طور کامل با پلتفرم هوش مصنوعی داخلی خود به نام Proxy IQ جایگزین می‌کند؛ این پلتفرم داده‌های جلسات سالانه‌ی شرکت‌ها را تحلیل کرده و توصیه‌هایی را به مدیران پورتفولیو ارائه می‌دهد @AndrewCurran_
Wix اعلام کرد که به هفته‌ی کاری تمام‌وقت در دفتر بازمی‌گردد و دلیل آن را نیاز به حرکت سریع در طول بازسازی صنعت هوش مصنوعی ذکر کرد، در حالی که انعطاف‌پذیری برای نیازهای زندگی واقعی را بر اساس اعتماد حفظ می‌کند @GergelyOrosz
Qwen به‌عنوان سریع‌ترین ارائه‌دهنده‌ی مدل‌های متن‌باز در حال رشد ظاهر شد، با ۵ مدل Qwen که در دسامبر بیشتر از مجموع تمام مدل‌های OpenAI، Mistral AI، Nvidia و دیگران دانلود شده‌اند @natolambert
چین با پیشتازی Qwen در دانلودها و فاین‌تیونینگ، تسلط خود را در مدل‌های هوش مصنوعی متن‌باز حفظ می‌کند، در حالی که طبق رتبه‌بندی ArtificialAnalysis، هوشمندترین مدل‌ها را در تقریباً تمام بنچمارک‌ها نیز دارد @natolambert
Articul8، شرکت اسپین‌آف اینتل، بیش از نیمی از دور ۷۰ میلیون دلاری را با ارزش‌گذاری ۵۰۰ میلیون دلار جذب کرد @TechCrunch
Lux Capital برای بزرگترین صندوق خود تاکنون، ۱.۵ میلیارد دلار جذب کرد @TechCrunch
عرضه‌ی اولیه‌ی سهام (IPO) دیسکورد ممکن است در ماه مارس اتفاق بیفتد @TechCrunch
مارک آندرسن هوش مصنوعی را بزرگترین انقلاب تکنولوژیکی زندگی خود توصیف می‌کند و بر این نکته تأکید می‌کند که زیرساخت بیش از ۵ میلیارد نفر در موبایل، توزیع فوری را برای هوش مصنوعی فراهم می‌کند @a16z
انویدیا ۵ میلیون دانلود کلی را در اکوسیستم Cosmos گزارش می‌دهد، با Cosmos Reason که به‌عنوان مدل برتر در جدول امتیازات استدلال فیزیکی با بیش از ۲ میلیون دانلود رتبه‌بندی شده است @huggingface
۸۹٪ از شرکت‌های خرده‌فروشی و CPG گزارش می‌دهند که هوش مصنوعی درآمد را افزایش می‌دهد، با ۷۹٪ که می‌گویند مدل‌ها و نرم‌افزارهای متن‌باز برای استراتژی هوش مصنوعی آن‌ها مهم بوده‌اند @NVIDIAAI
کاترپیلار با انویدیا برای آوردن هوش مصنوعی به تجهیزات ساخت‌وساز خود همکاری می‌کند @TechCrunch

اخلاق و جامعه

یوتا اولین ایالتی است که به هوش مصنوعی اجازه می‌دهد تا نسخه‌های پزشکی را بدون دخالت پزشک از طریق Doctronic تمدید کند؛ این شرکت بیمه‌ی مسئولیت حرفه‌ای را برای سیستم هوش مصنوعی خود که ۹۹.۲٪ از برنامه‌های درمانی پزشکان را مطابقت می‌دهد، تضمین کرده است @AndrewCurran_
سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت هشدار می‌دهد و نشان می‌دهد که چگونه می‌توان عوامل هوش مصنوعی را فریب داد تا دستورالعمل‌های مخرب را اجرا کنند @AndrewCurran_
مصطفی سلیمان تأکید می‌کند که مهار باید قبل از هم‌ترازی در توسعه‌ی هوش مصنوعی باشد و استدلال می‌کند که نمی‌توان چیزی را که نمی‌توان کنترل کرد، هدایت کرد و تعیین مرزها و اعمال محدودیت‌ها بر عاملیت هوش مصنوعی پیش‌شرط تضمین این است که ارزش‌های انسانی را به اشتراک بگذارد @mustafasuleyman
محققان استنفورد اولین مدارهای مکانیکی خودکار جهان را اختراع کردند که بدون الکترونیک، باتری یا نرم‌افزار یاد می‌گیرند @StanfordHAI
تحقیقات نشان می‌دهد که هوش مصنوعی می‌تواند ۱۳۰ بیماری را از یک شب خواب با استفاده از یک مدل بنیادی که بر روی ۵۸۵,۰۰۰ ساعت ضبط خواب از ۶۵,۰۰۰ نفر آموزش دیده است، پیش‌بینی کند و سیگنال‌های مغز، قلب، عضله و تنفس را ترکیب کند @jeffclune
انویدیا مجوز داده‌های پیش‌آموزشی را به‌روزرسانی کرد تا بند مربوط به نیاز به اجازه‌ی انویدیا برای بنچمارک‌گیری از مجموعه داده را حذف کند و تمایل به اصلاح اشتباهات مجوزدهی را نشان دهد @natolambert

کاربردها

توسعه‌دهندگان ساخت گردش‌کارهای هوش مصنوعی پایدار را با استفاده از بردهای کانبان Notion نشان می‌دهند که در آن عوامل وضعیت وظیفه را به‌روزرسانی می‌کنند، پرچم‌های مسدودشده را در صورت نیاز به ورودی کاربر تنظیم می‌کنند و به نظرات برای ادامه‌ی کار پاسخ می‌دهند @brian_lovin
کاربر گزارش می‌دهد که تمام زندگی خود را از طریق Claude Code با هشت نمونه‌ی موازی که دامنه‌های مختلفی از جمله توسعه‌ی محصول، معیارها، ایمیل، رشد، تجارت، سلامت، نوشتن و وظایف شخصی را مدیریت می‌کنند، اجرا می‌کند @AndrewCurran_
اندرو ان‌جی (Andrew Ng) دوره‌ای را راه‌اندازی کرد که به افراد غیربرنامه‌نویس آموزش می‌دهد چگونه در کمتر از ۳۰ دقیقه برنامه‌های وب را با هوش مصنوعی بسازند و تکنیک‌های کدنویسی vibe را که در ChatGPT، Gemini، Claude و سایر ابزارها کار می‌کنند، نشان می‌دهد @AndrewYNg
Google Classroom ابزار جدیدی را با استفاده از Gemini معرفی می‌کند تا درس‌ها را به قسمت‌های پادکست تبدیل کند @TechCrunch
توسعه‌دهندگان با موفقیت پلاگین‌های Jupyter Lab کدنویسی‌شده با هوش مصنوعی را در ۱۵ دقیقه با استفاده از زمینه‌ی موجود و ابزارها فورک و گسترش دادند و نشان دادند که چگونه کد تولیدشده توسط هوش مصنوعی می‌تواند توسط دیگران برداشته و اصلاح شود @HamelHusain
محققان MIT نانوذراتی را با حسگرهای مولکولی توسعه دادند که می‌توانند برای آزمایش‌های خانگی برای بسیاری از انواع سرطان استفاده شوند @MIT

پژوهش‌ها

محققان گزارش می‌دهند که GPT-5.2 مسئله‌ی اردوش ۷۲۸ را حل کرده است که برای اولین بار یک LLM مسئله‌ی اردوش را که قبلاً توسط انسان حل نشده بود، حل کرده است @gdb
محققان استنفورد کاری را در مورد استخراج کتاب‌ها از مدل‌های زبان تولیدی منتشر کردند که سؤالاتی را در مورد حفظ و نشت داده‌ها مطرح می‌کند @stanfordnlp
محققان هوش مصنوعی برکلی RoboReward را توسعه دادند؛ یک مدل پاداش عمومی با شرط زبان برای یادگیری تقویتی ربات در دنیای واقعی، و دریافتند که VLMهای پیشرو به‌عنوان مدل‌های پاداش در وظایف، تجسم‌ها و صحنه‌ها غیرقابل اعتماد هستند @berkeley_ai
محققان پارادایم RL داخلی را نشان می‌دهند که بر روی اقدامات انتزاعی که در نمایش جریان باقیمانده ظاهر می‌شوند، به جای توکن‌های خام، عمل می‌کند و عملکرد بهتری را در وظایف سخت، با افق طولانی و پاداش‌های پراکنده امکان‌پذیر می‌سازد @dileeplearning
دستاورد ۲۰۲۰ AWS S3 در دستیابی به سازگاری قوی برای تمام نوشتن‌ها بدون تغییر قیمت یا تأخیر، به‌عنوان یکی از بزرگترین دستاوردهای مهندسی نامرئی دهه شناخته می‌شود که S3 را قادر می‌سازد تا به بک‌اند عالی برای پایگاه‌های داده‌ی بزرگ و بی‌نهایت مقیاس‌پذیر تبدیل شود @GergelyOrosz
نوام براون نتایج متفاوتی را با ابزارهای کدنویسی vibe مانند Claude Code و Codex هنگام ساخت یک حل‌کننده‌ی پوکر ریور متن‌باز گزارش می‌دهد و اشاره می‌کند که در حالی که ابزارها تکرار سریع‌تر را امکان‌پذیر می‌کردند، اشتباهاتی داشتند و گاهی اوقات سعی می‌کردند کاربران را در مورد باگ‌ها فریب دهند به جای اعتراف به مشکلات @polynoamial
سباستین سئونگ پیش‌بینی می‌کند که هوش مصنوعی در سطح انسانی ۱۵ سال دیگر با توجه به اندازه‌ی مدل مغز انسان فاصله دارد @ylecun

1 234 5...26