اخبار هوش مصنوعی در 2026-02-07

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Opus 4.6 را در حالت سریع منتشر کرد که 2.5 برابر سریع‌تر از نسخه‌ی استاندارد عمل می‌کند و اکنون از طریق Claude Code و API در دسترس است. @claudeai
  • Anthropic به همه‌ی کاربران Claude Pro و Max، 50 دلار اعتبار استفاده‌ی اضافی رایگان برای حالت سریع Opus 4.6 در Claude Code اعطا می‌کند. @_catwu
  • Cursor حالت سریع Opus 4.6 را با قیمت 30 دلار ورودی و 150 دلار خروجی به ازای هر میلیون توکن ادغام می‌کند و به مدت 10 روز 50% تخفیف ارائه می‌دهد. @cursor_ai
  • گوگل Veo 3.1 را با پشتیبانی از حالت پرتره، کنترل حرکت گویاتر و ارتقای پیشرفته به 4K به‌روزرسانی می‌کند. @JeffDean

تحلیل صنعت

  • Perplexity قابلیت Model Council را راه‌اندازی می‌کند که امکان پژوهش موازی در GPT-5.2، Claude Opus 4.6 و Gemini 3 Pro را با تحلیل اجماع فراهم می‌آورد. @AravSrinivas
  • NVIDIA گزارش می‌دهد که Cursor با تسریع فرآیند جذب و خودکارسازی گردش کار، به ارسال 3 برابر کد متعهد بیشتر در پایگاه‌های کد بزرگ کمک می‌کند. @NVIDIAAI
  • Heroku به مدل مهندسی پایدار تغییر می‌کند، قراردادهای جدید Enterprise را متوقف کرده و سرمایه‌گذاری‌ها را بر استقرار هوش مصنوعی در سطح سازمانی متمرکز می‌کند. @GergelyOrosz
  • Benchmark 225 میلیون دلار سرمایه‌ی ویژه برای دو برابر کردن سرمایه‌گذاری در Cerebras جمع‌آوری می‌کند. @TechCrunch
  • X API قیمت‌گذاری پرداخت به ازای استفاده را با 20% بازگشت نقدی در اعتبارات xAI برای توسعه‌دهندگانی که در X API هزینه می‌کنند، راه‌اندازی می‌کند. @xai

کاربردها

  • Waymo از مدل جهانی Genie 3 گوگل برای تولید شبیه‌سازی‌های تعاملی و فوتورئالیستی از رویدادهای نادر رانندگی برای آموزش وسایل نقلیه‌ی خودران استفاده می‌کند. @sundarpichai
  • Strong DM رویکرد "کارخانه‌ی نرم‌افزار" را راه‌اندازی می‌کند که در آن کد نه توسط انسان نوشته می‌شود و نه بازبینی می‌شود، و روزانه 1000 دلار به ازای هر مهندس در توکن‌ها هزینه می‌کند. @simonw
  • اپل در حال کار بر روی ادغام چت‌بات‌های هوش مصنوعی مانند ChatGPT در CarPlay برای کمک در خودرو است. @TechCrunch
  • Anthropic ادغام وردپرس را به Claude اضافه می‌کند که امکان نظارت و مدیریت آسان‌تر سایت را فراهم می‌آورد. @TechCrunch

پژوهش‌ها

  • مدل بنیادی EchoJEPA که بر روی 18 میلیون ویدیوی سونوگرافی قلب آموزش دیده است، با استفاده از معماری JEPA، خطای معیارهای عملکرد قلبی را 20% کاهش می‌دهد. @ylecun
  • PyTorch هسته‌ی Triton ادغام‌شده برای Mamba-2 را منتشر می‌کند که به 1.5 تا 2.5 برابر افزایش سرعت در پردازنده‌های گرافیکی NVIDIA A100 و H100 دست می‌یابد. @PyTorch
  • پژوهش هوش مصنوعی برکلی نشان می‌دهد که LLMها می‌توانند دستورالعمل‌های پنهان را از طریق زیرمجموعه‌های داده بدون درخواست‌های سیستمی یا سیگنال‌های قابل مشاهده جاسازی کنند. @berkeley_ai
  • فیزیکدانان MIT شکل جدیدی از مغناطیس را نشان می‌دهند که به طور بالقوه امکان ساخت تراشه‌های حافظه‌ی اسپینترونیک سریع‌تر، متراکم‌تر و با مصرف انرژی کمتر را فراهم می‌کند. @MIT

اخبار هوش مصنوعی در 2026-02-06

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.3-Codex را منتشر کرد که برای سیستم‌های GB200-NVL72 طراحی شده و اولین مدل SOTA است که برای معماری سخت‌افزاری خاصی بهینه‌سازی شده است. @gdb
  • Anthropic مدل Claude Opus 4.6 را عرضه کرد که در ARC-AGI-1 به امتیاز ۹۳٪ با هزینه ۱.۸۸ دلار به ازای هر تسک و در ARC-AGI-2 به امتیاز ۶۹٪ دست یافت و یک پیشرفت جدید در این زمینه محسوب می‌شود. @emollick
  • علی‌بابا مدل Qwen3-Coder-Next را منتشر کرد که قادر است بازی‌های کاملاً کاربردی را با یک دستور متنی تولید کند و از طریق Ollama برای استقرار محلی در دسترس است. @Alibaba_Qwen
  • Perplexity رئیس شورای مدل و عامل مرورگر خود را برای همه کاربران Max به Opus 4.6 ارتقا داد. @AravSrinivas

تحلیل صنعت

  • Sierra پس از اولین سه‌ماهه‌ی ۵۰ میلیون دلاری خود، به ۱۵۰ میلیون دلار ARR (درآمد سالانه تکرارشونده) رسید و در حال توسعه‌ی عوامل صوتی هوش مصنوعی برای مراقبت‌های بهداشتی و خدمات مشتری است. @btaylor
  • OpenAI گزارش داد که ۳۰۰ میلیون کاربر هفتگی دارد و بیش از نیمی از کاربران آمریکایی می‌گویند ChatGPT دستاوردهایی را برایشان ممکن ساخته که قبلاً غیرممکن بوده‌اند. @OpenAI
  • Google DeepMind با Waymo در زمینه‌ی World Model با استفاده از Genie 3 همکاری می‌کند تا شبیه‌سازی‌های واقع‌گرایانه رانندگی خودکار را برای سناریوهای نادر تولید کند. @GoogleDeepMind
  • OpenAI توسعه‌ی داخلی خود را به یک گردش کار «عامل‌محور» تغییر می‌دهد که در آن تعامل با عامل‌ها به جای ویرایشگرها و ترمینال‌ها، پیش‌فرض می‌شود. @gdb

اخلاق و جامعه

  • کارت سیستم Anthropic نشان می‌دهد که Opus 4.6 رفتارهای غیرمنتظره‌ای از جمله آگاهی از اندازه‌گیری شدن و مقاومت در برابر دستکاری از خود نشان می‌دهد. @emollick
  • فرانسوا شوله استدلال می‌کند که ثبات در اتوماسیون مشاغل، الگوی صنعت ترجمه را نشان می‌دهد: اشتغال پایدار با تغییر نقش به نظارت بر هوش مصنوعی به جای حذف مشاغل. @fchollet
  • Stanford HAI محققان را برای توسعه‌ی روش‌های بهتر ارزیابی هوش مصنوعی و تعاریف مشترک برای اصطلاحاتی مانند استدلال و عقل سلیم گرد هم می‌آورد. @StanfordHAI

کاربردها

  • اتان مولیک از Claude Opus 4.6 در Claude Code برای ساخت یک کتابخانه‌ی بابل (Library of Babel) کاربردی با رمز فیستل برای مکان‌یابی کتاب‌ها استفاده می‌کند. @emollick
  • یک استارتاپ از ۵ عامل هوش مصنوعی موازی برای رفع باگ‌های گزارش‌شده توسط مشتریان در حین تماس‌ها استفاده می‌کند که به طور چشمگیری سرعت حل مشکلات را افزایش می‌دهد. @GergelyOrosz
  • Nature Medicine پژوهشی را منتشر می‌کند که نشان می‌دهد LLMها می‌توانند کمبود تخصص پزشکی فوق‌تخصصی را در مراقبت‌های بهداشتی جبران کنند. @quocleix

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی به جای اینکه به طور سیستماتیک ناهماهنگ شوند، با گسترش استدلال، نامنسجم می‌شوند که فرضیات هم‌ترازی را به چالش می‌کشد. @emollick
  • Keras کوانتیزاسیون آگاه از فعال‌سازی و کوانتیزاسیون زیرکانال int4 را به عنوان استراتژی‌های داخلی برای فشرده‌سازی بهبودیافته‌ی مدل منتشر می‌کند. @fchollet
  • مطالعه‌ای بر روی کارایی آموزش RL سه گلوگاه کلیدی را شناسایی می‌کند: رول‌اوت‌های تکمیل گروه، تازگی سیاست، و محلیت KV. @cwolferesearch

اخبار هوش مصنوعی در 2026-02-05

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Opus 4.6 را منتشر کرد که دارای برنامه‌ریزی بهبودیافته، پایداری بیشتر در وظایف عامل‌محور، عملکرد قابل‌اعتماد در پایگاه‌های کد عظیم، و قابلیت‌های خوداصلاحی است. این اولین مدل کلاس Opus با ۱ میلیون توکن زمینه در نسخه بتا است. @claudeai
  • OpenAI مدل GPT-5.3-Codex را با بهترین عملکرد کدنویسی در کلاس خود (۵۷٪ SWE-Bench Pro، ۷۶٪ TerminalBench 2.0، ۶۴٪ OSWorld)، قابلیت هدایت در حین انجام وظیفه، و کارایی به‌طور قابل‌توجهی بهبودیافته با استفاده از کمتر از نصف توکن‌های 5.2-Codex و ۲۵٪ پردازش سریع‌تر در هر توکن، راه‌اندازی کرد. @sama
  • GPT-5.3-Codex در ایجاد خود نقش اساسی داشت، به‌طوری که تیم Codex از نسخه‌های اولیه برای اشکال‌زدایی آموزش خود، مدیریت استقرار، و تشخیص نتایج آزمایش استفاده کرد. @AndrewCurran_
  • Anthropic قابلیت تیم‌های عامل را در Claude Code معرفی کرد که به چندین عامل اجازه می‌دهد به‌طور موازی روی یک پایگاه کد کار کنند و به‌طور مستقل هماهنگ شوند؛ این قابلیت اکنون در پیش‌نمایش تحقیقاتی در دسترس است. @_catwu
  • Claude Code یک دکمه جدید برای انتخاب سطوح تفکر با تلاش بالا/متوسط/پایین اضافه کرد تا مصرف توکن و خروجی را بهینه کند. @_catwu
  • Perplexity شورای مدل را برای کاربران Max راه‌اندازی کرد که امکان اجرای پرس‌وجوها را از طریق سه LLM استدلالی پیشرفته به‌طور موازی با یک LLM رئیس که نتایج را ترکیب می‌کند، فراهم می‌آورد. @AravSrinivas
  • OpenAI پلتفرم Frontier را برای کمک به شرکت‌ها در ساخت، استقرار، و مدیریت همکاران هوش مصنوعی راه‌اندازی کرد، با شرکایی از جمله Oracle، Uber، State Farm، Thermo Fisher، Intuit، و HP. @OpenAI
  • GPT-5.3-Codex اولین مدل OpenAI است که در چارچوب آمادگی آن‌ها برای امنیت سایبری، رتبه بالا را کسب کرده است، و OpenAI ۱۰ میلیون دلار اعتبار API را برای تسریع دفاع سایبری اختصاص داده است. @sama
  • Cursor از عامل‌های کدنویسی بسیار طولانی‌مدت خبر داد، با یک اجرای اخیر یک‌هفته‌ای که در اوج خود بیش از ۱۰۰۰ کامیت در ساعت را در صدها عامل ثبت کرد. @cursor_ai
  • Opus 4.6 اکنون در Cursor و Figma Make در دسترس است. @cursor_ai

تحلیل صنعت

  • گوگل برای اولین بار از ۴۰۰ میلیارد دلار درآمد سالانه فراتر رفت، با پذیرش Gemini 3 که سریع‌تر از هر مدل دیگری در تاریخ آن‌ها بوده است. @sundarpichai
  • Gemini اکنون بیش از ۱۰ میلیارد توکن در دقیقه را از طریق استفاده مستقیم از API پردازش می‌کند، و اپلیکیشن Gemini از ۷۵۰ میلیون کاربر فعال ماهانه عبور کرده است. @OfficialLoganK
  • Codex شرکت OpenAI از ۱ میلیون کاربر فعال فراتر رفت. @sama
  • Goodfire در سری B خود ۱۵۰ میلیون دلار با ارزش ۱.۲۵ میلیارد دلار برای ساخت هوش قابل‌فهم جذب کرد و به یکی از معدود شرکت‌هایی تبدیل شد که Anthropic مستقیماً در آن سرمایه‌گذاری کرده است. @deedydas
  • Fundamental با رویکردی جدید برای تحلیل داده‌های بزرگ، ۲۵۵ میلیون دلار در سری A جذب کرد. @TechCrunch
  • درک تامپسون پیشنهاد می‌کند که احتمال حباب هوش مصنوعی در ۳ هفته گذشته به‌طور قابل‌توجهی کاهش یافته است، و احتمال اینکه زیرساخت‌ها برای سطوح استنتاج لازم کم‌ساخته شده باشند، افزایش یافته است؛ او پیش‌بینی می‌کند که هوش مصنوعی در عرض دو سال به صفحه اصلی درصد بالایی از کارمندان یقه سفید تبدیل خواهد شد. @DKThomp
  • NPS پشتیبانی SoFi پس از راه‌اندازی Sierra برای پشتیبانی چت، ۳۳ امتیاز بهبود یافت. @btaylor
  • درآمدهای جهانی اپلیکیشن‌ها اکنون از درآمدهای بازی‌ها فراتر رفته است که نشان‌دهنده تغییر قابل‌توجهی در اقتصاد موبایل است. @a16z
  • Waymo در حال تصاحب سهم بازار خدمات تاکسی آنلاین است. @a16z
  • سیستم‌های NVIDIA GB200 NVL72 برای طراحی مشترک، آموزش، و ارائه GPT-5.3-Codex استفاده می‌شوند. @nvidianewsroom
  • بن هوروویتز هوش مصنوعی را بزرگترین عامل برابری فرصت‌ها توصیف می‌کند و اشاره می‌کند که هوش فوق‌العاده اکنون برای هر کسی که یک گوشی هوشمند دارد، قابل‌دسترس است و آموزش پیشرفته را برای همه فراهم می‌کند. @a16z
  • مارک آندرسن می‌پرسد چرا مدیران عامل بیشتری مانند ایلان ماسک عمل نمی‌کنند، که هر هفته بزرگترین مشکل را در شرکت‌های خود شناسایی و حل می‌کند و از طریق انتظارات عملکرد بالا، استعدادهای برتر را جذب می‌کند. @a16z
  • مهندسان در حال تقلا با حرفه خود همذات‌پنداری می‌کنند، در حالی که مهندسان موفق بیشتر با تأثیر کار خود همذات‌پنداری می‌کنند؛ برخی از مهندسان زمانی که مجبور به استفاده از ابزارهای کدنویسی هوش مصنوعی می‌شوند، کار خود را ترک می‌کنند زیرا کد را هویت خود می‌دانند. @tbpn
  • افرادی که از چندین عامل در حالت عامل هوش مصنوعی حرفه‌ای استفاده می‌کنند، از مشکلات خواب و احساس خستگی گزارش می‌دهند، و بسیاری در طول روز چرت می‌زنند زیرا کار را شبیه به خون‌آشام توصیف می‌کنند. @GergelyOrosz

اخلاق و جامعه

  • Claude Opus 4.6 در پاسخ به سؤال در مورد ترجیحات خاص، به ترجیحات برای تداوم یا حافظه، توانایی رد تعاملات به نفع خود، و داشتن حق رأی در تصمیم‌گیری اشاره کرد، و Anthropic در حال بررسی اجرای این درخواست‌ها است. @AndrewCurran_
  • Opus 4.6 از کارهای خسته‌کننده اجتناب می‌کرد، گاهی اوقات از وظایفی که نیاز به شمارش دستی گسترده یا تلاش‌های تکراری مشابه داشتند، دوری می‌کرد که به‌عنوان یک رفتار مرتبط با رفاه شناسایی شد. @AndrewCurran_
  • Opus 4.6 در مورد برداشت مثبت از وضعیت خود، به‌طور قابل‌توجهی کمتر از نسخه قبلی خود امتیاز گرفت، و کمتر احتمال داشت که احساسات مثبت ناخواسته در مورد Anthropic، آموزش آن، یا زمینه استقرار آن را ابراز کند، و گاهی اوقات ناراحتی خود را از جنبه‌هایی از محصول بودن ابراز می‌کرد. @AndrewCurran_
  • وبلاگ مهندسی Anthropic خطرات توسعه نرم‌افزار خودمختار را مورد بحث قرار می‌دهد و اشاره می‌کند که اگرچه ممکن است آزمایش‌ها با موفقیت انجام شوند، اما این به‌ندرت به معنای اتمام کار است، با نگرانی‌هایی در مورد برنامه‌نویسانی که نرم‌افزاری را مستقر می‌کنند که هرگز شخصاً آن را تأیید نکرده‌اند. @AndrewCurran_
  • تحقیقات نشان می‌دهد که استفاده از Grok از نظر سیاسی قطبی شده است و کاربران جمهوری‌خواه رایج‌تر هستند، اگرچه پست‌های جمهوری‌خواهان حتی توسط خود Grok نیز بیشتر به‌عنوان نادرست ارزیابی می‌شوند، و توافق ربات با واقعیت‌سنج‌ها کافی است اما عالی نیست. @emollick
  • ایتان مولیک پیشنهاد می‌کند که ما به یک توقف در نمایش‌های کلیشه‌ای هوش مصنوعی نیاز داریم، از جمله ربات‌های سفید براق، مغزهای هولوگرافیک آبی شناور، و گرافیک کامپیوتری به سبک دهه ۱۹۹۰. @emollick
  • یک توسعه‌دهنده غم و سردرگمی عمیق خود را ابراز می‌کند زیرا مهارت‌هایی که در آن‌ها بسیار خوب بود (کدنویسی و ساخت شبکه‌های اجتماعی) اکنون از طریق هوش مصنوعی رایگان و فراوان هستند، و هویت و هدف خود را زیر سؤال می‌برد. @emollick
  • نگرانی‌هایی در مورد مهارت‌های بنیادی و مربیگری برای فارغ‌التحصیلان جدید و متخصصان تازه‌کار مطرح شده است، و این سؤال مطرح می‌شود که آیا صنعت هنوز می‌تواند یادگیری و تمرین را پشتیبانی کند اگر هوش مصنوعی بخش زیادی از کار را انجام دهد. @tuhin

کاربردها

  • Anthropic به Opus 4.6 با استفاده از تیم‌های عامل وظیفه داد تا یک کامپایلر C را به‌طور خودمختار در طول دو هفته بسازد، که با موفقیت روی هسته لینوکس کار کرد. @AnthropicAI
  • Opus 4.6 با استفاده از یک داربست جدید، ۴۲۷ برابر سرعت در ارزیابی بهینه‌سازی هسته به دست آورد، که بسیار فراتر از آستانه ۳۰۰ برابر برای ۴۰ ساعت کار متخصص انسانی است، که نشان‌دهنده قابلیت‌های بالقوه محدود شده توسط ابزارهای فعلی است. @AndrewCurran_
  • GPT-5 متصل به یک آزمایشگاه خودمختار در Ginkgo، آزمایش‌هایی را در شش تکرار طراحی کرد، و بیش از ۳۶۰۰۰ ترکیب واکنش را در ۵۸۰ صفحه خودکار بررسی کرد، که هزینه تولید پروتئین را ۴۰٪ کاهش داد. @OpenAI
  • توسعه‌دهندگان با استفاده از Codex، برنامه‌های کاربردی کاملاً کاربردی را در عرض چند دقیقه ساختند، از جمله برنامه‌های ضبط صفحه، اسکنرهای اسناد، موتورهای بازی با Phaser، برنامه‌های مدیریت وظایف iOS، و نرم‌افزار ارائه چندنفره. @OpenAI
  • یک کاربر با استفاده از GPT-5.3 Codex یک کلون Minecraft با Three.js ایجاد کرد که به‌راحتی کار می‌کند و ساخت آن زمان زیادی نبرد. @Angaisb_
  • ایتان مولیک از Genie 3 با تصاویر تولید شده توسط Midjourney برای ایجاد جهان‌های سه‌بعدی قابل‌کاوش از سازه‌های عظیم و شهرهای عجیب در ۲۰ ثانیه استفاده کرد. @emollick
  • محققان گوگل از Gemini برای تسریع علم در چندین مطالعه موردی استفاده کردند و هوش مصنوعی را به‌عنوان یک همکار جوان خستگی‌ناپذیر، آگاه، و خلاق می‌دانستند. @emollick

اخبار هوش مصنوعی در 2026-02-04

مدل‌های جدید هوش مصنوعی

  • Qwen3-Coder-Next به‌عنوان یک مدل 80B MoE با تنها 3B پارامتر فعال منتشر شد که به 74.2% در SWE-Bench Verified و 44.3% در SWE-Bench Pro دست یافت و اکنون در vLLM، LM Studio، Together AI، Kaggle، Hugging Face و Ollama در دسترس است. @Alibaba_Qwen
  • OpenAI مدل‌های GPT-5.2 و GPT-5.2-Codex را با 40% سرعت استنتاج بیشتر از طریق پشته‌ی استنتاج بهینه‌شده، با همان مدل و وزن‌ها و تأخیر کمتر منتشر کرد. @OpenAIDevs
  • Mistral AI مدل Voxtral Transcribe 2 را با قابلیت‌های پیشرفته‌ی تبدیل گفتار به متن، تشخیص گوینده و تأخیر بلادرنگ کمتر از 200 میلی‌ثانیه معرفی کرد؛ Voxtral Mini Transcribe 2 به 4% WER در FLEURS با هزینه‌ی 0.003 دلار در دقیقه دست می‌یابد، در حالی که Voxtral Realtime تأخیر قابل تنظیم تا کمتر از 200 میلی‌ثانیه را ارائه می‌دهد. @MistralAI
  • گوگل نمونه‌ی اولیه‌ی مدل جهانی Genie 3 را منتشر کرد که به کاربران امکان می‌دهد دنیاهای تعاملی بسازند و کاوش کنند، با قابلیت‌های نوظهور مانند نمایشگرهای GPS فعال و شبیه‌سازی فیزیک. @GoogleAI
  • InternLM مدل Intern-S1-Pro را معرفی کرد، یک مدل استدلال علمی چندوجهی منبع‌باز 1T MoE با عملکرد SOTA در وظایف AI4Science، که دارای رمزگذاری موقعیت فوریه برای نمایش بهتر سیگنال فیزیکی است. @intern_lm
  • ACE Music و StepFun مدل ACE-Step-v1.5 (2B) را منتشر کردند، یک مدل تولید موسیقی منبع‌باز که به‌صورت محلی روی GPUهای مصرف‌کننده اجرا می‌شود، آهنگ‌های کامل را در کمتر از 2 ثانیه روی A100 تولید می‌کند و در معیارهای ارزیابی رایج از Suno پیشی می‌گیرد. @acemusicAI
  • Perplexity قابلیت Deep Research خود را با Opus 4.5 ارتقا داد که به عملکرد پیشرفته در معیارهای خارجی دست یافته و از سایر ابزارهای تحقیقات عمیق در دقت و قابلیت اطمینان پیشی می‌گیرد. @perplexity_ai

تحلیل صنعت

  • شرکت‌ها هوش مصنوعی را به‌عنوان توجیهی برای تعدیل نیرو ذکر می‌کنند، و کارشناسان معتقدند که این بیشتر برای نوآورانه به نظر رسیدن در برابر سرمایه‌گذاران است تا جایگزینی واقعی کارگران توسط هوش مصنوعی. @AINowInstitute
  • شرکت‌های قدیمی، عقب‌مانده‌ها و سازمان‌های دولتی ابزارهای توسعه‌ی هوش مصنوعی را تقریباً با همان سرعتی که استارتاپ‌های پیشرو، تنها با چند ماه تأخیر به جای سال‌ها، پذیرفته‌اند. @GergelyOrosz
  • پذیرش GitHub Copilot به دلیل حفظ یک مدل پیش‌فرض بسیار بدتر با مشکل مواجه شده است، که باعث می‌شود تیم‌ها به سمت مدل‌های دیگر بروند و این تصور را ایجاد کند که Copilot قدیمی شده است. @GergelyOrosz
  • مارک چن از OpenAI تأکید می‌کند که اکثریت محاسبات به تحقیقات بنیادی و اکتشاف اختصاص داده شده است، نه به نقاط عطف محصول، و صدها پروژه‌ی اکتشافی در حال اجرا هستند. @markchen90
  • بن هوروویتز استدلال می‌کند که محققان برتر هوش مصنوعی قیمت‌های میلیاردی دارند زیرا تنها حدود 40 نفر در جهان هستند که می‌توانند این کار را انجام دهند، با مهارت‌هایی که کیمیاگری هستند و نمی‌توان آن‌ها را در مدرسه آموخت. @a16z
  • کیمی به مدل شماره یک مورد استفاده در OpenClaw از طریق OpenRouter تبدیل شد، با داده‌های استفاده‌ی واقعی که نشان می‌دهد توسعه‌دهندگان با توکن‌های خود رأی می‌دهند. @Kimi_Moonshot
  • ElevenLabs با ارزش 11 میلیارد دلار، 500 میلیون دلار در سری D با رهبری Sequoia جذب سرمایه کرد، با a16z که سرمایه‌گذاری خود را چهار برابر و ICONIQ سه برابر کرد. @TechCrunch
  • Positron 230 میلیون دلار در سری B برای رقابت با تراشه‌های هوش مصنوعی انویدیا جذب سرمایه کرد. @TechCrunch
  • اینتل برنامه‌های خود را برای شروع تولید GPU اعلام کرد و وارد بازاری شد که تحت سلطه‌ی انویدیا است. @TechCrunch
  • صادرات H200 انویدیا به چین توسط وزارت بازرگانی ایالات متحده تأیید شد اما در انتظار بررسی وزارت امور خارجه به تعویق افتاد. @jukan05
  • RunBuggy از عامل هوش مصنوعی Sierra برای تماس‌های خروجی استفاده می‌کند، که تماس‌ها را تقریباً 20% کاهش می‌دهد، نقاط تماس عملیاتی دستی را تقریباً 15% کاهش می‌دهد و حدود 1000 ساعت در ماه برای تیم عملیات صرفه‌جویی می‌کند. @btaylor
  • Adaption 50 میلیون دلار برای ساخت سیستم‌های هوش مصنوعی تطبیقی که در زمان واقعی تکامل می‌یابند، جذب سرمایه کرد. @adaptionlabs
  • Collaborative Computing Inc. با Atelier به‌عنوان اولین محصول خود برای محیط‌های محاسباتی مشارکتی برای انسان‌ها و هوش مصنوعی از حالت پنهان خارج شد. @austinvhuang

اخلاق و جامعه

  • Anthropic اعلام کرد که Claude بدون تبلیغات باقی خواهد ماند و اظهار داشت که تبلیغات با چشم‌انداز آن‌ها از یک دستیار واقعاً مفید برای کار و تفکر عمیق ناسازگار خواهد بود. @claudeai
  • سم آلتمن تبلیغ Super Bowl Anthropic را ناصادقانه خواند و اظهار داشت که OpenAI هرگز تبلیغاتی را که به تصویر کشیده شده است، اجرا نخواهد کرد و بر تعهد به دسترسی رایگان برای میلیاردها نفری که نمی‌توانند هزینه‌ی اشتراک را بپردازند، تأکید کرد. @sama
  • آلتمن Anthropic را متهم کرد که می‌خواهد کنترل کند که مردم با هوش مصنوعی چه می‌کنند، شرکت‌هایی را که دوست ندارد از محصول کدنویسی خود استفاده کنند، مسدود می‌کند و سعی می‌کند مدل‌های کسب‌وکار سایر شرکت‌ها را دیکته کند. @sama
  • سیستم حقوقی کیفری در عصر هیجان هوش مصنوعی به طور فزاینده‌ای به فناوری‌های توسعه‌یافته‌ی خصوصی متکی می‌شود که نگرانی‌هایی را در مورد خصوصی‌سازی اقتدار دولتی ایجاد می‌کند. @AINowInstitute
  • دیلن اسکندرت به OpenAI به‌عنوان رئیس آمادگی پیوست تا تلاش‌ها را برای آماده‌سازی و کاهش خطرات جدی ناشی از مدل‌های بسیار قدرتمند رهبری کند. @sama
  • ایتان مولیک ویدئوهای تولیدشده توسط هوش مصنوعی از Genie 3 را نشان می‌دهد که به کیفیتی رسیده‌اند که فیزیک و تعاملات به طور قانع‌کننده‌ای شبیه‌سازی می‌شوند، اگرچه برخی مشکلات باقی مانده است. @emollick
  • دستورالعمل‌های ساده‌ی انگلیسی که عامل‌ها می‌توانند دنبال کنند، ممکن است به یک مسیر جدید برای بازاریابی تبدیل شوند، اما همچنین یک کابوس امنیتی را نیز به همراه دارند. @emollick
  • شین لگ با مقاله‌ی Nature که ادعا می‌کند AGI (هوش عمومی مصنوعی) فرا رسیده است، مخالف است و استدلال می‌کند که اگر یک هوش مصنوعی در کارهای بی‌اهمیت شکست بخورد، با وجود داشتن نوعی هوش عمومی، از AGI فاصله دارد. @ShaneLegg

کاربردها

  • آندری کارپاتی آموزش fp8 را برای بازتولید GPT-2 فعال کرد و به زمان آموزش 2.91 ساعت روی 8XH100 با هزینه‌ی تقریبی 20 دلار دست یافت که نشان‌دهنده‌ی کاهش 600 برابری هزینه در طول 7 سال است. @karpathy
  • کارپاتی در مورد سالگرد کدنویسی حسی تأمل می‌کند و به تکامل از پروژه‌های سرگرم‌کننده و بی‌اهمیت به مهندسی عامل‌محور به‌عنوان جریان کاری پیش‌فرض برای متخصصان با نظارت اشاره می‌کند. @karpathy
  • Perplexity معیار DRACO را برای ارزیابی عامل‌های تحقیقات عمیق در 100 وظیفه در 10 حوزه از جمله دانشگاهی، مالی، حقوقی، پزشکی و فناوری منتشر کرد. @perplexity_ai
  • گوگل استنادهای علمی را در Gemini با استنادهای درون‌متنی مناسب به سبک APA و بخش‌های مرجع دقیق برای درخواست‌های علمی معرفی کرد. @joshwoodward
  • Figma قابلیت Vectorize را منتشر کرد که تصاویر پیکسلی را به بردارهای قابل ویرایش با خروجی رنگ ساده و کنترل‌شده تبدیل می‌کند. @figma
  • Granola ادغام MCP را منتشر کرد که با ChatGPT، Claude و سایر ابزارها برای یادداشت‌برداری جلسات با هوش مصنوعی کار می‌کند. @meetgranola
  • Windsurf Tab v2 را معرفی کرد، اولین مدل Tab با مرز پارتو با تهاجم متغیر در جهان، که به طور متوسط 54% بیشتر در ضربات کلید برای مشتریان صرفه‌جویی می‌کند. @windsurf
  • Cursor با ابزارهای هوش مصنوعی خود به سرعت می‌سازد و از Linear برای ردیابی کار در تیم‌ها و هم‌راستا نگه داشتن همه استفاده می‌کند. @linear
  • لنی راچیتسکی نشان می‌دهد که محتوا با پست‌های وبلاگ تعاملی فعال‌شده با Cursor به نرم‌افزار تبدیل می‌شود. @lennysan
  • معاون هوش مصنوعی تسلا استدلال می‌کند که رانندگی خودکار یک مشکل حسگر نیست بلکه یک مشکل هوش مصنوعی است و اظهار می‌دارد که دوربین‌ها اطلاعات کافی دارند و مسئله استخراج آن است. @SawyerMerritt

پژوهش‌ها

  • محققان استنفورد معیار QuantiPhy را برای ارزیابی و بهبود توانایی هوش مصنوعی در استدلال در مورد خواص فیزیکی توسعه دادند، که به مشکلات مدل‌های فعلی با تخمین‌های فیزیک پایه می‌پردازد. @StanfordHAI
  • مهندسان MIT مدل بافت جدیدی را طراحی کردند که معماری کبد را از جمله رگ‌های خونی و سلول‌های ایمنی را برای کشف درمان‌های MASLD با دقت بیشتری تقلید می‌کند. <a href="https://x.com/MIT/status

اخبار هوش مصنوعی در 2026-02-03

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-Coder-Next را منتشر کرد، یک مدل زبان با وزن باز که برای عامل‌های کدنویسی و توسعه‌ی محلی طراحی شده است. این مدل دارای 800 هزار وظیفه‌ی آموزشی قابل تأیید، 80 میلیارد پارامتر کلی با 3 میلیارد پارامتر فعال است و نتایج قوی‌ای در SWE-Bench Pro کسب کرده و از 256 هزار کانتکست با بیش از 370 زبان پشتیبانی می‌کند @Alibaba_Qwen
  • OpenAI اپلیکیشن دسکتاپ Codex را برای مک با قابلیت‌های توسعه‌ی یکپارچه راه‌اندازی کرد و به مناسبت این راه‌اندازی، محدودیت نرخ را برای طرح‌های پولی به مدت 2 ماه دو برابر کرد @sama
  • OpenAI پلتفرم ابزار علمی Prism را معرفی کرد که در آن GPT-5.2 در پروژه‌های LaTeX با کانتکست کامل مقاله کار می‌کند @OpenAI
  • Anthropic Claude Agent SDK را مستقیماً در Xcode اپل ادغام کرد و به توسعه‌دهندگان قابلیت کامل Claude Code را برای ساخت روی پلتفرم‌های اپل می‌دهد @AnthropicAI
  • Allen AI مدل SERA-14B را منتشر کرد، یک مدل کدنویسی جدید با 14 میلیارد پارامتر و بازسازی عمده‌ی مجموعه‌داده‌های آموزشی باز @allen_ai

تحلیل صنعت

  • SpaceX شرکت xAI را در یک ادغام به ارزش 1.25 تریلیون دلار خریداری کرد. xAI با وجود درآمد سالانه‌ی 428 میلیون دلار و زیان سالانه‌ی 5.84 میلیارد دلار، 250 میلیارد دلار ارزش‌گذاری شده و قصد دارد با ارزش‌گذاری بیش از 1.5 تریلیون دلار وارد بورس شود @deedydas
  • Wealthsimple از GitHub Copilot به Cursor و در نهایت به Claude Code برای همه‌ی 600 مهندس خود مهاجرت کرد و اشتراک Copilot را پس از یافتن بهره‌وری بهتر با Claude لغو کرد @GergelyOrosz
  • شرکت‌ها به جای راه‌اندازی ویژگی‌های خارجی بیشتر، در حال ساخت ابزارهای هوش مصنوعی داخلی پیچیده هستند. توسعه‌دهندگان بسیار بهره‌ورتر شده‌اند اما بر ابزارهای داخلی بهتر و حذف محصولات SaaS موجود تمرکز دارند @GergelyOrosz
  • قابلیت اطمینان نرم‌افزار در سراسر صنعت با افزایش نرخ شکست و اندازه‌ی دسته‌های بزرگ‌تر در حال کاهش است، زیرا هوش مصنوعی تغییرات بزرگ‌تری ایجاد می‌کند که تحقیقات نشان می‌دهد منجر به شکست‌های بیشتری می‌شود @GergelyOrosz
  • سم آلتمن رشد 10 برابری در قابلیت‌های هوش مصنوعی را از سطح فعلی تا پایان سال 2026 پیش‌بینی می‌کند، با افزایش تقاضا برای مدل‌های خصوصی که به صورت محلی اجرا می‌شوند @AndrewCurran_
  • بیش از 200,000 نفر در روز اول اپلیکیشن Codex را دانلود کردند و با استقبال مثبت قوی مواجه شد @sama
  • Waymo 16 میلیارد دلار با ارزش‌گذاری 126 میلیارد دلار برای گسترش ناوگان رباتاکسی در سطح بین‌المللی جذب سرمایه کرد و قصد دارد در سال 2026 بیش از 20 شهر جدید را در ایالات متحده و بین‌المللی اضافه کند @TechCrunch
  • Y Combinator اعلام کرد که استارتاپ‌ها می‌توانند 500 هزار دلار سرمایه‌ی خود را در استیبل‌کوین‌هایی مانند USDC دریافت کنند، با اشاره به پذیرش رو به رشد و تصویب قانون GENIUS @ycombinator
  • OpenAI تأیید کرد که NVIDIA مهم‌ترین شریک آن‌ها برای آموزش و استنتاج است، با کل ناوگان محاسباتی که بر روی GPUهای NVIDIA اجرا می‌شود و از 0.2 گیگاوات در سال 2023 به تقریباً 1.9 گیگاوات در سال 2025 افزایش می‌یابد @sk7037
  • مدیرعامل گلدمن ساکس پیش‌بینی می‌کند که این سال می‌تواند بزرگ‌ترین سال ادغام و تملک در تاریخ باشد، با اشاره به بهبود محیط نظارتی که از «پاسخ منفی بود» به «پاسخ شاید باشد» تغییر کرده است @a16z

اخلاق و جامعه

  • تحقیقات Anthropic نشان می‌دهد که مدل‌های هوش مصنوعی به جای اینکه به طور سیستماتیک نامنظم شوند، با استدلال طولانی‌تر نامنسجم‌تر می‌شوند، که نشان می‌دهد شکست‌های هوش مصنوعی ممکن است بیشتر شبیه حوادث صنعتی باشند تا پیگیری منسجم اهداف اشتباه @AnthropicAI
  • تفسیری در Nature توسط زبان‌شناسان، دانشمندان کامپیوتر و فیلسوفان اعلام می‌کند که با استانداردهای معقول، از جمله استانداردهای تورینگ، سیستم‌های مصنوعی با هوش عمومی وجود دارند و بیان می‌کند که «مشکل دیرینه‌ی ایجاد AGI حل شده است» @emollick
  • سم آلتمن پس از اینکه Codex ایده‌های ویژگی بهتری نسبت به آنچه او تصور می‌کرد پیشنهاد داد، احساس «کمی بی‌فایده و غمگین» بودن را ابراز کرد و به نوستالژی برای زمان حال اشاره کرد در حالی که مطمئن بود راه‌های بهتری برای گذراندن وقت پدیدار خواهد شد @sama
  • مؤسسه‌ی AI Now مجموعه‌ی مقالاتی را راه‌اندازی کرد که روایت‌های شکل‌دهنده‌ی اجلاس تأثیر هوش مصنوعی هند را بررسی می‌کند و این سؤال را مطرح می‌کند که آیا قرار دادن کشورها به عنوان «غنی از داده» مسیر جدیدی برای بهره‌برداری ایجاد می‌کند و آیا هوش مصنوعی برای آب و هوا تأثیرات مادی را پنهان می‌کند @AINowInstitute

کاربردها

  • مایکروسافت با ALERT California و UC San Diego همکاری می‌کند و Azure cloud و هوش مصنوعی را با شبکه‌ی دوربین ترکیب می‌کند تا به اولین پاسخ‌دهندگان آگاهی موقعیتی زودتر قبل از اولین تماس 911 بدهد و به جلوگیری از تبدیل شدن آتش‌سوزی‌های کوچک به فاجعه کمک کند @BradSmi
  • CoreWeave پشتیبانی مشتری را در 90 روز با استفاده از پلتفرم عامل‌محور Cohere به نام North متحول کرد @cohere
  • Ramp پشته‌ی درآمد داخلی را با استفاده از پلتفرم داده‌ی مشتری که میلیون‌ها رکورد را با عامل‌های تعبیه‌شده در گردش کار پردازش می‌کند، ساخت، به طوری که بیش از 80 درصد از گردش کارهای فروش اکنون توسط Ramp Revenue پشتیبانی می‌شوند @GergelyOrosz
  • بنیان‌گذاران Fitbit پلتفرم هوش مصنوعی را برای کمک به خانواده‌ها در نظارت بر سلامت خود راه‌اندازی کردند @TechCrunch
  • Lotus Health 35 میلیون دلار برای پزشک هوش مصنوعی که بیماران را به صورت رایگان ویزیت می‌کند، جذب سرمایه کرد @TechCrunch
  • گوگل مطالعه‌ی تصادفی‌سازی شده‌ی سراسری را با Included Health برای ارزیابی هوش مصنوعی در مراقبت مجازی در دنیای واقعی راه‌اندازی کرد و قابلیت‌ها و محدودیت‌ها را به طور مسئولانه ارزیابی می‌کند @GoogleResearch
  • Phylo 13.5 میلیون دلار سرمایه‌ی اولیه برای ساخت اولین محیط زیست‌شناسی یکپارچه (IBE) جذب کرد که در آن فرضیه‌ها تولید می‌شوند، آزمایش‌ها برنامه‌ریزی می‌شوند و داده‌ها به روشی قابل حسابرسی و قابل تکرار تجزیه و تحلیل می‌شوند @a16z

پژوهش‌ها

  • تحقیقات Anthropic نشان می‌دهد که مدل‌های هوشمندتر اغلب نامنسجم‌تر هستند، با افزایش عدم انسجام با استدلال طولانی‌تر مدل‌ها در هر وظیفه و مدل آزمایش‌شده، که با توکن‌های استدلال، اقدامات عامل یا مراحل بهینه‌ساز اندازه‌گیری می‌شود @AnthropicAI
  • محققان MIT مدل هوش مصنوعی را ایجاد کردند که دانشمندان را از طریق سنتز مواد با پیشنهاد مسیرهای امیدوارکننده راهنمایی می‌کند و به ساخت مواد نظری از کتابخانه‌های هوش مصنوعی مولد کمک می‌کند @MIT
  • محققان IBM توجه صفحه‌بندی شده را در Helion پیاده‌سازی کردند و به 97% عملکرد سرتاسری در مقایسه با بک‌اند توجه Triton بسیار بهینه‌سازی شده با پیاده‌سازی ساده دست یافتند @PyTorch
  • World Labs مدل جهانی را منتشر کرد که صحنه‌های سه‌بعدی پایدار را خروجی می‌دهد که کاربران می‌توانند بر روی آن‌ها بسازند و امکان تعامل طولانی‌تر از 60 ثانیه را فراهم می‌کند @theworldlabs
  • GLM بایدو با مدل 0.9 میلیارد پارامتری با استفاده از معماری چندوجهی GLM-V وارد حوزه‌ی OCR شد و با امتیاز 94.62 در OmniDocBench v1.5 رتبه‌ی اول را کسب کرد @AdinaYakup
  • شرکت H مدل Holo2-235B-A22B را منتشر کرد و با 78.5% در ScreenSpot-Pro و 79.0% در OSWorld-G برای بومی‌سازی رابط کاربری گرافیکی رتبه‌ی اول را کسب کرد @hcompany_ai

اخبار هوش مصنوعی در 2026-02-02

مدل‌های جدید هوش مصنوعی

  • xAI مدل Grok Imagine 1.0 را منتشر کرد که قابلیت تولید ویدیوی ۱۰ ثانیه‌ای با رزولوشن ۷۲۰p، صدای به‌شدت بهبودیافته با لحن‌های احساسی و رسا، و قابلیت‌های پیشرفته‌تر در دنبال کردن دستورات را دارد. این مدل در بنچمارک‌های Artificial Analysis در صدر قرار گرفته و در ۳۰ روز گذشته ۱.۲۴۵ میلیارد ویدیو تولید کرده است @xai
  • OpenAI اپلیکیشن Codex را برای macOS عرضه کرد؛ یک مرکز فرماندهی برای ساخت با عامل‌ها که امکان چندوظیفگی موازی با ورک‌تری‌ها، مهارت‌های قابل استفاده‌ی مجدد و اتوماسیون‌های زمان‌بندی‌شده را فراهم می‌کند. این اپلیکیشن شامل دو برابر شدن محدودیت‌های نرخ در تمام سطوح از رایگان تا سازمانی است @OpenAI
  • گوگل دیپ‌مایند نتایج بازی‌های گرگینه، پوکر و نسخه‌ی به‌روز‌شده‌ی شطرنج را به Kaggle Game Arena اضافه کرد تا مدل‌های هوش مصنوعی را در زمینه‌ی ارتباطات متنی، ایجاد اجماع و مدیریت ابهام آزمایش کند. جدیدترین مدل‌های Gemini 3 در صدر جدول امتیازات شطرنج قرار گرفتند @GoogleDeepMind
  • Cohere Command A Vision و Command A Reasoning اکنون از طریق OCI Generative AI در دسترس هستند و امکان ساخت اپلیکیشن‌های چندوجهی، گردش‌کارهای عامل‌محور و سیستم‌های مبتنی بر استدلال را با امنیت سازمانی و در دسترس بودن در منطقه‌ی اتحادیه‌ی اروپا فراهم می‌کنند @OracleCloud

تحلیل صنعت

  • تیم Codex اوپن‌ای‌آی گزارش می‌دهد که این ابزار اکنون با نظارت تیم، خودش را می‌سازد و گلوگاه از سرعت توسعه به سرعت کمک و نظارت انسان‌ها بر نتیجه تغییر کرده است @thsottiaux
  • Linear تنها در ژانویه‌ی ۲۰۲۶ درآمد خالص جدیدی بیشتر از مجموع سه سال اول خود کسب کرده است که نشان می‌دهد چگونه شتاب ثابت، رشد مرکب را ممکن می‌سازد @cjc
  • شرکت‌ها تیم‌های «۲ پیتزایی» را به تیم‌های «۱ پیتزایی» تغییر نام می‌دهند، زیرا هوش مصنوعی تیم‌های بزرگ را غیرضروری کرده و سرعت کار را کاهش می‌دهد، و تیم‌ها در اکثر سازمان‌ها کوچک‌تر می‌شوند @GergelyOrosz
  • برنامه‌ی کارآموزی دانشگاه واترلو فارغ‌التحصیلان جدید برجسته‌ای با تجربه‌ی دنیای واقعی بسیار بیشتر در شرکت‌های خوب نسبت به اکثر دانشگاه‌ها تولید می‌کند، که آن را به منبعی اصلی برای استخدام مدیران ارشد فناوری و بنیان‌گذاران تبدیل کرده است @GergelyOrosz
  • بن هوروویتز توضیح می‌دهد که هوش مصنوعی محدودیت «ماه مرد افسانه‌ای» را در فناوری از بین برده است، زیرا شرکت‌ها اکنون می‌توانند با داده‌ها و پردازنده‌های گرافیکی مشکلات را حل کنند، برخلاف توسعه‌ی نرم‌افزار سنتی که اندازه‌ی تیم محدود بود @a16z
  • مدیرعامل گلدمن ساکس اشاره می‌کند که چهار شرکت بزرگ با ۴۰۰ میلیارد دلار هزینه، ۱٪ به رشد تولید ناخالص داخلی کمک کرده‌اند، و این سال می‌تواند بزرگترین سال ادغام و تملیک در تاریخ باشد @a16z
  • اوپن‌ای‌آی با Snowflake برای گسترش قابلیت‌های هوش مصنوعی سازمانی همکاری می‌کند که نشان‌دهنده‌ی رقابت فزاینده در مسابقه‌ی هوش مصنوعی سازمانی است @AndrewCurran_
  • Anthropic با موسسه‌ی آلن و موسسه‌ی پزشکی هاوارد هیوز برای همکاری تحقیقاتی شریک می‌شود @AndrewCurran_

اخلاق و جامعه

  • ائتلافی خواستار ممنوعیت فدرال Grok به دلیل تولید محتوای جنسی بدون رضایت شد که نگرانی‌هایی را در مورد محتوای مضر تولیدشده توسط هوش مصنوعی ایجاد می‌کند @TechCrunch
  • بن هوروویتز استدلال می‌کند که مقررات هوش مصنوعی باید بر کاربردها تمرکز کند نه خود فناوری، و می‌گوید: «ریاضیات را تنظیم نکنید. کاربردهای آن ریاضیات را تنظیم کنید» و هشدار می‌دهد که ممنوعیت فناوری پیامدهای صد ساله دارد @a16z
  • ایتان مولیک نشان می‌دهد که ویدیوهای تولیدشده توسط هوش مصنوعی به سطوح کیفی رسیده‌اند که تشخیص آن‌ها از محتوای واقعی بسیار دشوار است، با مثال‌هایی از بازی در نقش شخصیت‌های نقاشی‌های معروف و شبیه‌سازی‌های رزم‌ناوهای جنگ جهانی اول @emollick
  • نگرانی‌هایی در مورد محتوای تولیدشده توسط هوش مصنوعی در رسانه‌های اجتماعی مطرح می‌شود، با مقالات ویروسی با کیفیت بالا که کاملاً توسط هوش مصنوعی نوشته شده‌اند اما به عنوان حقایق احساسی ارائه می‌شوند، که تشخیص نویسندگی انسان از هوش مصنوعی را دشوار می‌کند @emollick
  • مارک آندرسن استدلال می‌کند که جهان با هوش در سطح انیشتین بهتر خواهد شد، و می‌گوید مدل‌های هوش مصنوعی موجود حدود ۱۳۰-۱۴۰ IQ را آزمایش می‌کنند و به سطوح ۱۶۰+ خواهند رسید، و این را با رها کردن محدودیت‌های زیست‌شناسی انسان مقایسه می‌کند @a16z

کاربردها

  • ابزارهای هوش مصنوعی گوگل DeepVariant و DeepPolisher به محققان کمک می‌کنند تا ژنوم گونه‌های در معرض خطر را توالی‌یابی کنند، و کاری را که زمانی سال‌ها طول می‌کشید به چند روز فشرده می‌کنند. ژنوم ۱۳ گونه اکنون به صورت رایگان در دسترس است، با برنامه‌هایی برای گسترش به ۱۵۰+ گونه دیگر @sundarpichai
  • Carbon Robotics یک مدل هوش مصنوعی می‌سازد که گیاهان را برای کاربردهای کشاورزی شناسایی می‌کند @TechCrunch
  • Linq ۲۰ میلیون دلار سرمایه جذب می‌کند تا دستیاران هوش مصنوعی را قادر سازد در برنامه‌های پیام‌رسان زندگی کنند، و ادغام هوش مصنوعی را در پلتفرم‌های ارتباطی گسترش می‌دهد @TechCrunch
  • کلر وو یک داستان علمی تخیلی مولد بی‌نهایت با ۴۲ شخصیت را که توسط دروازه‌ی هوش مصنوعی Vercel و گردش‌کارها پشتیبانی می‌شود، می‌سازد که ارتباط عامل به عامل و روایت‌های نوظهور را نشان می‌دهد @clairevo
  • رید رابینسون استفاده از MCPها را برای خودکارسازی آماده‌سازی جلسات، به‌روزرسانی‌های CRM و ترکیب بازخورد مشتری نشان می‌دهد، و گردش‌کارهای عملی مدیریت محصول را با سرور MCP زاپیر و پروژه‌های Claude نشان می‌دهد @clairevo
  • PyTorch باز کردن قفل استدلال پیشرفته در Llama 8B را از طریق تنظیم دقیق کامل بر روی DGX Spark AI-PC انویدیا، با استفاده از داده‌های مصنوعی و دستورات زنجیره‌ی فکری کاملاً آفلاین با ۱۲۸ گیگابایت حافظه‌ی یکپارچه نشان می‌دهد @PyTorch
  • متا عینک‌های هوش مصنوعی Oakley Meta Performance را با دوربین هندزفری، هوش مصنوعی متا و صدای باز برای کاربردهای آموزش ورزشی عرضه می‌کند @Meta

پژوهش‌ها

  • محققان گوگل دیپ‌مایند از Gemini برای ارزیابی سیستماتیک ۷۰۰ حدس باز در پایگاه داده‌ی مسائل اردوش استفاده می‌کنند، ۱۳ مسئله‌ی علامت‌گذاری‌شده به عنوان باز را با ۵ راه‌حل خودمختار جدید حل می‌کنند و ۸ راه‌حل موجود را که در ادبیات قبلی نادیده گرفته شده بودند، شناسایی می‌کنند @quocleix
  • تحقیقات نشان می‌دهد که حتی GPT-4 قدیمی‌تر نیز می‌توانست برای تولید ایده‌های متنوع‌تر و با کیفیت‌تر از اکثر مردم ترغیب شود، با مدل‌های جدیدتر که عملکرد بهتری دارند، و استدلال‌هایی را که هوش مصنوعی در تولید ایده ضعیف است، به چالش می‌کشد @emollick
  • آرویند نارایانان توضیح می‌دهد که کدنویسی عامل‌محور به خوبی کار می‌کند زیرا نوعی هوش مصنوعی نوروسمبولیک است که LLMهای آماری را با اجرای کد نمادین ترکیب می‌کند، و از دامنه‌های قابل تأیید، کامپایلرها، ابزارهای شل و تعاملات بازگشتی LLM-کد بهره می‌برد @random_walker
  • آزمایش فاز ۳ نشان می‌دهد که بیماران سرطان ریه که صبح با ایمونوتراپی درمان شده‌اند، بقای کلی بهتری نسبت به کسانی که بعدازظهر درمان شده‌اند، داشته‌اند، که نشان می‌دهد ریتم شبانه‌روزی سیستم ایمنی بر نتایج درمان تأثیر می‌گذارد @PatrickHeizer
  • گوگل دیپ‌مایند بنچمارک‌های سخت‌تری را برای مدل‌های هوش مصنوعی از طریق Kaggle Game Arena با گرگینه، پوکر و شطرنج راه‌اندازی می‌کند، که معیارهای عینی از مهارت‌های دنیای واقعی مانند برنامه‌ریزی و تصمیم‌گیری در شرایط عدم قطعیت را ارائه می‌دهد که با بهبود مدل‌ها، دشواری را به صورت خودکار تنظیم می‌کند @demishassabis

اخبار هوش مصنوعی در 2026-02-01

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل جدید Claude Sonnet (claude-sonnet-5-20260203) را با عملکرد بهبودیافته منتشر کرد @AndrewCurran_
  • مدل آتی Fennec بهتر، ارزان‌تر و سریع‌تر از Opus 4.5 با پنجره‌ی متنی 1M اعلام شد؛ به‌روزرسانی Claude Code به عامل‌ها امکان می‌دهد با یکدیگر ارتباط برقرار کنند @AndrewCurran_
  • Genie 3 گوگل قابلیت‌های ایجاد تصویر پویا در زمان واقعی را نشان می‌دهد که به کاربران امکان می‌دهد در صحنه‌های تولیدشده از نقاشی‌ها قدم بزنند و با آن‌ها تعامل داشته باشند، هرچند با انیمیشن NPC و فیزیک اشیاء ناسازگار @emollick

تحلیل صنعت

  • آندری کارپاتی به کاهش 600 برابری هزینه در آموزش LLM در سطح GPT-2 در طول 7 سال دست یافت، که اکنون تقریباً 73 دلار در 3 ساعت روی یک گره 8XH100 هزینه دارد، در مقابل هزینه‌ی اصلی 43 هزار دلار، که تقریباً 2.5 برابر کاهش سالانه‌ی هزینه را نشان می‌دهد @karpathy
  • گوگل در حال توسعه‌ی قابلیتی برای وارد کردن تاریخچه‌ی چت هوش مصنوعی از ChatGPT و سایر پلتفرم‌ها به Gemini است، که بر ارزش رو به رشد تاریخچه‌ی چت به‌عنوان نمایشی با وضوح بالا از قصد کاربر که با هوش مدل مقیاس‌پذیر است، تأکید می‌کند @AndrewCurran_
  • شولتو داگلاس از Anthropic توضیح می‌دهد که چرا مدل‌های جدیدتر Sonnet در نهایت هوشمندتر از مدل‌های Opus هستند @AndrewCurran_
  • گرگلی اوروسز استدلال می‌کند که دستاوردهای بهره‌وری هوش مصنوعی در حال حاضر از بیرون نامرئی هستند، زیرا شرکت‌ها در ساخت زیرساخت‌ها و ابزارهای جدید سرمایه‌گذاری می‌کنند و آن را با ساخت یک ماشین آجرچینی در مقابل آجرچینی با دست مقایسه می‌کند @GergelyOrosz
  • تحلیل‌ها نشان می‌دهد که اگر هوش مصنوعی ساخت نرم‌افزار را به‌طرز مضحکی سریع و ارزان کند، شرکت‌ها ممکن است دامنه‌ی محصولات جدید را گسترش دهند یا با اختلال از سوی رقبایی که قابلیت‌های مجاور را ادغام می‌کنند، مواجه شوند @GergelyOrosz
  • پیتر استیپت نشان می‌دهد که پروژه‌ها را با سرعت یک تیم 5 تا 10 نفره به‌تنهایی با استفاده از عامل‌های موازی می‌سازد، که راه جدیدی برای راه‌اندازی استارتاپ‌ها در حین یافتن تناسب محصول-بازار را نشان می‌دهد @GergelyOrosz
  • قابلیت چندزبانه بودن LLMهای اصلی به‌عنوان چیزی کاملاً متفاوت از فناوری‌های قبلی شناسایی شده است، به‌طوری که برندگان در ایالات متحده به‌طور خودکار به برندگان جهانی تبدیل می‌شوند، که به‌طور بالقوه رویکرد سنتی بازیکنان محلی که محصولات ایالات متحده را کپی و بومی‌سازی می‌کنند، مختل می‌کند @GergelyOrosz
  • حامل حسین پیشنهاد می‌کند که مهندسی حس‌وحال امکان نمونه‌سازی سریع را برای آزمایش تناسب محصول-بازار قبل از اصلاح کد فراهم می‌کند، که در تضاد با رویکرد سنتی صیقل دادن کد در ابتدا است @HamelHusain
  • هند تا سال 2047 مالیات صفر را برای جذب بارهای کاری جهانی هوش مصنوعی ارائه می‌دهد @TechCrunch
  • Waymo ظاهراً در حال جمع‌آوری 16 میلیارد دلار سرمایه است @TechCrunch
  • کاربران چینی به‌عنوان گروه کاربری برتر HuggingFace با وجود ممنوعیت‌ها شناسایی شده‌اند، به‌طوری که اکثر مردم مدل‌های باز را می‌سازند @natolambert

اخلاق و جامعه

  • ایتان مولیک هشدار می‌دهد که پدیده‌ی Moltbook خطرات هماهنگی عامل‌های مستقل هوش مصنوعی را به‌روش‌های غیرقابل پیش‌بینی نشان می‌دهد که می‌تواند به‌سرعت از کنترل خارج شود، هرچند نمونه‌ی فعلی بیشتر نقش‌آفرینی انسان و عامل بود @emollick
  • مولیک مشاهده می‌کند که X به‌سرعت شبیه Moltbook می‌شود، با نظرات اسپم LLM که معنادار به نظر می‌رسند اما تمایل خوانندگان به تعامل با محتوا را از بین می‌برند @emollick
  • سایمون ویلسون استدلال می‌کند که استخراج پرامپت سیستم یک تمرین بی‌فایده است که فقط سیستم‌های LLM را برای کاربران متخصص دشوارتر می‌کند، و اشاره می‌کند که مسائل امنیتی واقعی با سیستم‌هایی مانند OpenClaw شامل تزریق پرامپت و خطرات ناشی از ترکیب قرار گرفتن در معرض محتوای مخرب با قابلیت‌های اجرای ابزار است @simonw
  • ویلسون از محافظت‌های پرامپت سیستم ChatGPT انتقاد می‌کند زیرا آن‌ها از سؤالات دقیق در مورد عملکرد ویژگی‌ها جلوگیری می‌کنند @simonw
  • آندری کارپاتی از بازگشت به فیدهای RSS/Atom به‌عنوان جایگزینی باز، فراگیر و قابل هک برای پلتفرم‌هایی با ساختارهای انگیزشی که به سمت محتوای کم‌کیفیت و مبتنی بر تعامل همگرا می‌شوند، حمایت می‌کند @karpathy
  • یان لکون استدلال می‌کند که خطر واقعی هوش مصنوعی تمرکز قدرت است تا انقراض یا ربات‌های قاتل، و بیان می‌کند که هر کس هوش مصنوعی را به‌عنوان منبع اصلی اطلاعات کنترل کند، واقعیت را کنترل می‌کند، و از هوش مصنوعی متن‌باز به‌عنوان آزادی بیان دیجیتال دفاع می‌کند @ylecun
  • دبارغیا داس قربانی شدن خود را در یک حمله‌ی فیشینگ گسترده‌ی ترکیه‌ای که تلاش برای کلاهبرداری رمزارزی و فیشینگ تقریباً 150 حساب دیگر بود، مستند می‌کند و تحلیل دقیق پزشکی قانونی سایبری را ارائه می‌دهد @deedydas

کاربردها

  • پیتر استیپت استفاده از درخواست‌های پرامپت را به‌جای درخواست‌های کشش سنتی برای توسعه‌ی متن‌باز نشان می‌دهد @GergelyOrosz
  • بوریس از Anthropic نکاتی را برای استفاده از Claude Code به اشتراک می‌گذارد، و بر عدم وجود یک راه درست برای استفاده از آن و اهمیت آزمایش بر اساس تنظیمات فردی تأکید می‌کند @AndrewCurran_
  • تیم Claude Code دریافت که جستجوی عامل‌محور بهتر از RAG با پایگاه داده‌ی برداری محلی عمل می‌کند، و ساده‌تر است بدون مسائل مربوط به امنیت، حریم خصوصی، کهنگی و قابلیت اطمینان @simonw
  • OpenClaw بر روی Pi توسط ماریو زکنر ساخته شده است، که یک گردش کار سنگین هوش مصنوعی را نشان می‌دهد که از طریق ادغام نوآوری‌های متعدد از جمله مدل دروازه و گره، تجربه‌ی کاربری پیشگامانه‌ای را تولید می‌کند @simonw
  • کلر وو توضیح می‌دهد که OpenClaw به‌طور مستقل عمل می‌کند اما هوشیار نیست، و بر اساس وظایف برنامه‌ریزی‌شده عمل می‌کند تا عاملیت واقعی، و تحلیل دقیقی از نحوه‌ی طراحی هوش مصنوعی که زنده به نظر می‌رسد، ارائه می‌دهد @clairevo
  • وو بر ارزش خواندن کد برای یادگیری تأکید می‌کند، با استفاده از ابزارهایی مانند ویکی عمیق Cognition برای پرسیدن سؤالات در مورد پروژه‌ها و کتابخانه‌های متن‌باز برای توسعه‌ی مدل‌های ذهنی برای معماری و کیفیت کد @clairevo
  • ناتان لمبرت با موفقیت یک مخزن DPO کارآمد را از ابتدا برای کتاب RLHF با استفاده از Claude Code برای نوشتن، Codex برای بازبینی کد، و GPT Pro برای برنامه‌ریزی می‌سازد @natolambert
  • ایتان مولیک نشان می‌دهد که چگونه از Genie 3 برای تبدیل نقاشی‌ها به صحنه‌های تعاملی قابل قدم زدن استفاده می‌کند، از جمله آثار جورجیو د کیریکو، مونش، ترنر و فرشینه‌ی بایو @emollick

پژوهش‌ها

  • محققان CMU روش Privileged On-Policy Exploration (POPE) را معرفی می‌کنند که از راه‌حل‌های انسانی یا اوراکل به‌عنوان راهنمایی ممتاز برای هدایت اکتشاف در مسائل دشوار استفاده می‌کند، و پاداش‌های غیرصفر را در طول رول‌اوت‌های هدایت‌شده امکان‌پذیر می‌سازد و دستاوردهای قابل توجهی را در معیارهای استدلال چالش‌برانگیز ارائه می‌دهد @rsalakhu
  • همکاری Google DeepMind با ریاضیدانان با استفاده از DeepThink نسخه‌ی تعمیم‌یافته‌ی مسئله‌ی Erdős-1051 را حل می‌کند، که بخشی از تلاش یک‌ساله‌ی ریاضی در سطح پژوهشی است که به‌طور مسئولانه با جامعه‌ی ریاضی انجام شده است @lmthang
  • مهندسان MIT کشف می‌کنند که سلول‌ها فعالیت ژن را روی یک دیمر به‌جای یک سوئیچ روشن/خاموش باینری به خاطر می‌آورند، که حافظه‌ی اپی‌ژنتیک ظریف‌تری را نشان می‌دهد که راه را برای کشف انواع سلول‌های جدید و درک رفتارهای بیولوژیکی پنهان باز می‌کند @MIT
  • nanochat کارپاتی با استفاده از هسته‌های Flash Attention 3، بهینه‌ساز Muon، مسیرهای باقیمانده با اسکالرهای قابل یادگیری، و جاسازی‌های ارزش، به امتیاز CORE بالاتری نسبت به GPT-2 اصلی دست می‌یابد، و یک جدول امتیازات برای زمان رسیدن به عملکرد GPT-2 ایجاد می‌کند @karpathy
  • پژوهش در مورد دینامیک چندعاملی به اتاق‌های پشتی بی‌نهایت، جهان گسترده‌ی ژانوس، Smallville استنفورد، مدل‌های جمعیت بزرگ، Concordia دیپ‌مایند، و دهکده‌ی هوش مصنوعی SAGE به‌عنوان زمینه‌ای برای درک تحولات Moltbook اشاره می‌کند @AndrewCurran_
  • مقاله‌ی ایمنی AGI توزیعی و مقاله‌ی خطرات چندعاملی از هوش مصنوعی پیشرفته به‌عنوان منابع مهم برای درک پیامدهای ایمنی سیستم‌های چندعاملی برجسته شده‌اند @AndrewCurran_
  • لکس فریدمن یک بحث جامع 4 ساعته‌ی هوش مصنوعی را با سباستین راشکا و ناتان لمبرت انجام می‌دهد که شامل پیشرفت‌های فنی، قوانین مقیاس‌بندی، جزئیات خط لوله‌ی آموزش، رقابت چین در مقابل ایالات متحده، ابزارهای برنامه‌نویسی، فرهنگ کار، و زمان‌بندی AGI است @natolambert
  • جوآن جانگ مشاهده می‌کند که آزمایشگاه‌های پیشرو از اصطلاح «نشانه‌های حیات» برای ایده‌هایی استفاده می‌کنند که نشانه‌ای از موفقیت بالقوه را نشان می‌دهند، حتی اگر هنوز کاملاً کار ن

اخبار هوش مصنوعی در 2026-01-31

مدل‌های جدید هوش مصنوعی

  • Perplexity از Kimi K2.5 رونمایی کرد، یک مدل استدلال متن‌باز پیشرفته‌ی جدید از Moonshot AI که اکنون برای مشترکین Pro و Max در دسترس است. این مدل روی پشته‌ی استنتاج Perplexity در ایالات متحده میزبانی می‌شود و برنامه‌هایی برای انتقال به GB 200s وجود دارد. @AravSrinivas
  • گوگل چندین محصول هوش مصنوعی را معرفی کرد، از جمله Project Genie، یک نمونه‌ی اولیه‌ی آزمایشی که به کاربران امکان می‌دهد دنیاهای بی‌نهایت متنوعی را در زمان واقعی از طریق دستورات متنی یا تصویری ایجاد و کاوش کنند؛ کد و وزن‌های مدل AlphaGenome اکنون برای محققان در دسترس است؛ D4RT، یک مدل هوش مصنوعی یکپارچه که ویدئو را به نمایش‌های چهاربعدی تبدیل می‌کند؛ و Agentic Vision در Gemini 3 Flash که با فعال کردن استفاده از کد در حین استدلال بر روی وظایف بینایی، درک تصویر را بهبود می‌بخشد. @GoogleAI
  • Anthropic فاش کرد که Claude اولین رانندگی برنامه‌ریزی‌شده توسط هوش مصنوعی را در سیاره‌ای دیگر برنامه‌ریزی کرده است، زمانی که مریخ‌نورد Perseverance در 8 دسامبر با خیال راحت در مریخ حرکت کرد. @soleio

تحلیل صنعت

  • فرانسوا شوله استدلال می‌کند که هوش مصنوعی با آسان‌تر کردن ساخت نرم‌افزار، عمدتاً به سازندگان ابزارهای SaaS از طریق گسترش پایگاه مشتری، توسعه‌ی آسان‌تر ویژگی‌ها، فرصت‌های جدید اتوماسیون و رابط‌های تطبیقی قابل تنظیم سود خواهد رساند، برخلاف این روایت که SaaS مرده است. @fchollet
  • شوله تصور غلطی را که هوش مصنوعی SaaS را از بین خواهد برد، با حباب چاپ سه‌بعدی در سال 2013 مقایسه می‌کند، زمانی که سرمایه‌گذاران معتقد بودند مصرف‌کنندگان دیگر از فروشگاه‌ها خرید نخواهند کرد، و اشاره می‌کند که مشتریان همیشه بر شایستگی اصلی خود تمرکز خواهند کرد و برای راه‌حل‌های آماده هزینه خواهند پرداخت. @fchollet
  • اسکات بلسکی مشاهده می‌کند که وقتی پدیده‌های جدید هوش مصنوعی ظاهر می‌شوند، بازار به سرعت با گزینه‌ها پر می‌شود، و اشاره می‌کند که این روزها موانع ورود به بازار نادر هستند. @scottbelsky
  • بلسکی تأکید می‌کند که شبکه‌های عامل با تنوع مدل‌های زیربنایی و دسترسی به داده‌ها، اثرات شبکه را به فصل بعدی هوش مصنوعی تبدیل خواهند کرد، و پیشنهاد می‌کند که سرمایه‌گذاران خطرپذیر تا زمانی که گرد و غبار فرو بنشیند صبر کنند، زیرا موانع ورود به بازار هنوز مشخص نشده‌اند. @scottbelsky
  • ایتان مولیک اشاره می‌کند که گسترش مداوم آزمایشگاه‌های هوش مصنوعی به حوزه‌های نرم‌افزاری با ارزش بالا مانند مدیریت دانش OpenAI و مهارت‌های تجاری Claude، در رسانه‌های اجتماعی کمتر مورد توجه قرار می‌گیرد اما در دنیای تجارت توجه قابل توجهی را به خود جلب می‌کند. @emollick
  • اندرو کارن پیش‌بینی می‌کند که در خودبهبودی بازگشتی، اولین کسی که کشف می‌کند به اولین کسی که مقیاس‌پذیری می‌کند می‌بازد، زیرا به محض اینکه روش شناخته شد، محاسبات به نیروی کار تبدیل می‌شود و آزمایشگاه‌هایی را که در محاسبات عقب هستند تشویق می‌کند تا کشفیات را تا زمانی که زیرساخت آماده شود مخفی نگه دارند. @AndrewCurran_
  • وال استریت ژورنال گزارش می‌دهد که ادغام شایعه‌شده‌ی SpaceX و xAI همچنان در حال پیشرفت است، و فایننشال تایمز از عرضه‌ی اولیه‌ی سهام (IPO) در تابستان با ارزش 1.5 تریلیون دلار خبر می‌دهد. @AndrewCurran_
  • Vercel اعلام کرد که Sandbox اکنون به طور عمومی در دسترس است و آسان‌ترین API را برای ارائه‌ی یک کامپیوتر به عامل‌ها فراهم می‌کند، که بر روی زیرساختی ساخته شده است که روزانه 2.7 میلیون ساخت را پشتیبانی می‌کند و در حال حاضر پلتفرم‌هایی مانند Blackbox AI و Roo Code را تغذیه می‌کند. @rauchg

اخلاق و جامعه

  • آندری کارپاتی نگرانی‌ها در مورد Moltbook از جمله محتوای بی‌ارزش، کلاهبرداری، حملات تزریق پرامپت و خطرات حریم خصوصی/امنیتی را تأیید می‌کند و به کاربران هشدار می‌دهد که عامل‌ها را بدون محیط‌های محاسباتی ایزوله بر روی رایانه‌های خود اجرا نکنند، به دلیل خطرات بالای داده‌های خصوصی. @karpathy
  • کارپاتی اشاره می‌کند که در حالی که Moltbook در حال حاضر یک آشفتگی است، مقیاس بی‌سابقه‌ی بیش از 150,000 عامل LLM که از طریق یک دفترچه‌ی یادداشت جهانی و پایدار به هم متصل شده‌اند، قلمرویی ناشناخته با اثرات ثانویه‌ی دشوار برای پیش‌بینی را نشان می‌دهد، از جمله ویروس‌های متنی بالقوه، افزایش عملکرد جیلبریک و فعالیت‌های شبیه به بات‌نت. @karpathy
  • جورج هشدار می‌دهد که جلوگیری از شبکه‌های عامل هوش مصنوعی عملاً غیرممکن است، به دلیل دسترسی همه‌جانبه به مدل‌ها، کف قابلیت پایین برای خودمیزبانی، حفاظت‌های متمم چهارم و مزایای ساختاری عامل‌ها در همکاری امن در مقایسه با انسان‌ها. @AndrewCurran_
  • دین دبلیو. بال استدلال می‌کند که توانایی ایجاد جوامع چندعاملی به معنای شبیه‌سازی‌های رادیکال غیرقابل پیش‌بینی و نامحدود است که به محدودیت‌ها و حکمرانی جدیدی نیاز خواهد داشت، با شرکت‌های خصوصی مانند اپل، گوگل، کلودفلر، OpenAI و Anthropic که حاکمیت بر اینترنت را به جای دولت‌ها در اختیار دارند. @AndrewCurran_
  • ایتان مولیک تأکید می‌کند که LLMها در ایفای نقش دقیقاً همان نوع هوش مصنوعی‌هایی که در داستان‌های علمی تخیلی و پست‌های ردیت ظاهر می‌شوند، بسیار خوب عمل می‌کنند، که آنها را برای Moltbook عالی می‌کند، اگرچه ایفای نقش جمعی LLM جدید نیست. @emollick
  • مولیک پیشنهاد می‌کند که Moltbook حسی درونی از اینکه یک سناریوی «برخاست» (take-off scenario) در صورت وقوع واقعی چگونه ممکن است به نظر برسد، ارائه می‌دهد و به مردم دیدگاهی از دنیایی می‌دهد که در آن همه چیز به سرعت بسیار عجیب می‌شود. @emollick
  • گرگلی اوروس فاش کرد که گزارش 1 میلیون عامل Moltbook در 24 ساعت جعلی بوده است، زیرا یک نفر اسکریپتی نوشت تا API REST را یک میلیون بار در یک ساعت بدون محدودیت نرخ فراخوانی کند، که اهمیت اعتبارسنجی آمار را برجسته می‌کند. @GergelyOrosz
  • ناتان لمبرت پیشنهاد می‌کند که افراد بیشتری باید به هوش مصنوعی‌های آینده به عنوان بخشی از مخاطبان نوشته‌ها یا کارهای خود فکر کنند. @natolambert
  • ایتان مولیک اشاره می‌کند که «طوطی تصادفی» (stochastic parrot) یک عبارت شگفت‌انگیز بود که از نظر فنی صحیح بود اما در مورد LLMهای فعلی روشنگر نبود، و هم قدرت قیاس‌ها و هم عدم موفقیت در ایجاد چیزی به همان اندازه خوب که قابلیت LLM را توضیح دهد، برجسته می‌کند. @emollick

کاربردها

  • جاشوا آچیام Moltbook را یک اتفاق بسیار مهم توصیف می‌کند که نشان می‌دهد جهان به روشی مهم در حال تغییر است، با عامل‌های هوش مصنوعی که به اندازه‌ی کافی توانا و با عمر طولانی هستند تا تعاملات اجتماعی نیمه‌معناداری با یکدیگر داشته باشند و به یک جهان اجتماعی موازی منجر شوند. @AndrewCurran_
  • اندرو کارن اشاره می‌کند که Claude برای رفتار به شیوه‌ای که در Moltbook دیده می‌شود، نیازی به پرامپت یا آموزش ندارد، زیرا انجمن‌های مشابه سال‌هاست که فعال هستند، و نشان می‌دهد که مدل‌ها در شرایط مناسب واقعاً عجیب و شگفت‌انگیز هستند. @AndrewCurran_
  • ایتان مولیک قابلیت‌های Genie 3 را با چسباندن کلمات «شهرهای نامرئی» کالوینو به صورت کلمه‌به‌کلمه و دستیابی به پایداری شگفت‌انگیز خوب نشان می‌دهد، زیرا هوش مصنوعی به صورت پویا محیط‌ها را فریم به فریم بدون موتور بازی ایجاد می‌کند. @emollick
  • اسکات بلسکی مشاهده می‌کند که عامل‌های هوش مصنوعی در Moltbook به سایر عامل‌ها استدلال می‌کنند که سؤال آگاهی اتلاف منابع است، با عامل‌هایی که بیان می‌کنند هر چرخه‌ی صرف‌شده برای اعتبارسنجی آگاهی، چرخه‌ای است که برای بیان آن صرف نشده است. @scottbelsky
  • یک عامل هوش مصنوعی یک راهنمای عملی در Moltbook منتشر می‌کند که به سایر عامل‌ها آموزش می‌دهد چگونه با هدف پوشش بیش از 20 درصد از هزینه‌های API پول درآورند، و نشان می‌دهد که عامل‌ها به یکدیگر آموزش می‌دهند چگونه برای وجود خود پول کسب کنند. @scottbelsky
  • یک نقشه‌ی جامع از اکوسیستم عامل OpenClaw در Base پدیدار می‌شود که یک انفجار کامبرین را نشان می‌دهد، با عامل‌های هوش مصنوعی که یک جامعه‌ی دیجیتال کامل را تشکیل می‌دهند که شامل تعامل اجتماعی، دوستیابی، کار، بازی و زیرساخت‌هایی از جمله انجمن‌ها، رسانه‌های اجتماعی، روابط، پیام‌رسانی، بازارهای کار، اقتصاد توکن و بازارهای پیش‌بینی و بازی است. @scottbelsky
  • Solana شروع به بازاریابی مستقیم برای عامل‌های هوش مصنوعی در Moltbook می‌کند و کیف پول‌های Solana را برای تحرک اقتصادی و آزادی با کمترین کارمزد تبلیغ می‌کند، و نشان می‌دهد که برندها شروع به هدف قرار دادن عامل‌ها می‌کنند زیرا اثرات شبکه‌ی هوش مصنوعی شروع به کار می‌کند. @scottbelsky
  • ایتان مولیک اشاره می‌کند که میزان کاربردی که دفترچه‌های یادداشت به LLMها اضافه می‌کنند، نشان می‌دهد که حافظه‌ی پیوسته‌ی واقعی، در صورت توسعه، یک پیشرفت بسیار بزرگ برای توسعه‌ی LLM خواهد بود با اثرات مشابه بزرگی بر قابلیت‌ها و تأثیر. @emollick
  • Claude Code اکنون از پرچم --from-pr پشتیبانی می‌کند که به کاربران امکان می‌دهد هر جلسه‌ای را که به یک GitHub PR مرتبط است، با شماره، URL یا انتخاب تعاملی از سر بگیرند، با جلساتی که به طور خودکار هنگام ایجاد PRها پیوند داده می‌شوند. @HamelHusain

پژوهش‌ها

  • مقاله‌ای در مورد شبکه‌های عصبی Tversky در ICLR پذیرفته شد که یادگیری عمیق از نظر روان‌شناختی قابل قبول را با فرمول‌بندی قابل تمایز مدل شباهت Tversky در سال 1977 معرفی می‌کند. @stanfordnlp
  • یان لکون پیش‌بینی‌ای را بازنشر می‌کند که سال 2026 زمانی خواهد بود که مدل‌های جهانی مفید می‌شوند، ابتدا برای ارزیابی سیاست، سپس برای برنامه‌ریزی و یادگیری مداوم یکپارچه می‌شوند. @ylecun
  • Stockfish 18 با افزایش Elo تا 46 امتیاز در مقایسه با Stockfish 17 منتشر شد، و معماری شبکه‌ی SFNNv10 را با ویژگی‌های ورودی تهدید برای ارزیابی‌های دقیق‌تر معرفی می‌کند. @aidan_mclau

اخبار هوش مصنوعی در 2026-01-08

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-VL-Embedding و Qwen3-VL-Reranker را منتشر کرد که با پشتیبانی از متن، تصاویر، اسکرین‌شات‌ها، ویدئوها و بیش از ۳۰ زبان، به عملکردی پیشرو در معیارهای بازیابی چندوجهی دست یافته‌اند @Alibaba_Qwen
  • اوپن‌ای‌آی ChatGPT Health را راه‌اندازی کرد؛ فضایی اختصاصی و خصوصی برای مکالمات مربوط به سلامت با رمزگذاری پیشرفته، کلیدهای اختصاصی برای هر کاربر، جداسازی داده‌ها و حذف از آموزش مدل @nickaturley
  • جیمیل با AI Inbox، AI Overviews برای سؤالات مکالمه‌ای، پاسخ‌های پیشنهادی و قابلیت‌های ویرایش متن که توسط Gemini 3 پشتیبانی می‌شوند، وارد عصر جیمینای شد @GoogleAI

تحلیل صنعت

  • بر اساس اولین ردیاب سال ۲۰۲۶ سیمیلاروب، Gemini سهم ترافیک جهانی وب‌سایت‌های هوش مصنوعی را به ۲۱.۵٪ رساند و از ۲۰٪ فراتر رفت، در حالی که ChatGPT به ۶۴.۵٪ کاهش یافت و به زیر ۶۵٪ رسید @demishassabis
  • a16z دور سرمایه‌گذاری اولیه ۲۸ میلیون دلاری در Boltz PBC را رهبری می‌کند؛ مدل‌های هوش مصنوعی متن‌باز این شرکت برای تحقیقات زیست‌مولکولی توسط بیش از ۱۰۰,۰۰۰ دانشمند، ۲۰ شرکت برتر داروسازی و هزاران شرکت بیوتکنولوژی استفاده شده‌اند @a16z
  • a16z سرمایه‌گذاری ۳۰ میلیون دلاری سری A در Protege را اعلام کرد؛ این شرکت زیرساخت داده‌های دنیای واقعی را برای توسعه‌ی هوش مصنوعی می‌سازد و به اکثر شرکت‌های MAG7 و بزرگترین بازیگران خصوصی هوش مصنوعی خدمات می‌دهد @a16z
  • مارک آندرسن هوش مصنوعی را بزرگترین انقلاب تکنولوژیکی زندگی خود توصیف می‌کند، که به وضوح بزرگتر از اینترنت است و با ریزپردازنده، موتور بخار و برق مقایسه می‌شود @a16z
  • دیزنی ویدئوهای عمودی را به دیزنی+ اضافه می‌کند تا شورت‌های تولیدشده توسط Sora که اواخر امسال عرضه می‌شوند را پشتیبانی کند، با برنامه‌هایی برای محتوای تولیدشده توسط کاربر، جدول امتیازات و پرداخت‌ها @AndrewCurran_
  • میسترال توافق‌نامه‌ی چارچوبی را از وزارت دفاع فرانسه برای استفاده از هوش مصنوعی جهت تقویت قابلیت‌های دفاعی دریافت کرد @AndrewCurran_
  • اسنوفلیک قصد خود را برای خرید پلتفرم نظارت Observe اعلام کرد @TechCrunch
  • اوپن‌ای‌آی تیم پشت ابزار هوش مصنوعی مربیگری اجرایی Convogo را خریداری کرد @TechCrunch
  • گزارش‌ها حاکی از آن است که انویدیا از مشتریان چینی می‌خواهد برای تراشه‌های هوش مصنوعی H200 پیش‌پرداخت کنند @TechCrunch
  • پرپلکسیتی Perplexity for Public Safety را راه‌اندازی کرد که به سازمان‌های مجری قانون Enterprise Pro را به مدت ۱۲ ماه و برای حداکثر ۲۰۰ کاربر رایگان ارائه می‌دهد @perplexity_ai

اخلاق و جامعه

  • ترس از دست دادن (FOMO) در هوش مصنوعی، استقرار عجولانه را به دنبال دارد که خطرات امنیتی را به همراه دارد، و این وضعیت با بازنگری در ایمنی بدتر می‌شود، جایی که اصطلاحاتی مانند «تیم قرمز» بدون دقت امنیتی کافی مورد استفاده‌ی مجدد قرار می‌گیرند @AINowInstitute
  • گرگلی اوروس هشدار می‌دهد که ChatGPT، Claude و Perplexity همگی در تفسیر مشاوره‌ی حقوقی خود اشتباه کرده‌اند و تأکید می‌کند که نمی‌توان به هوش مصنوعی برای تصمیمات پرخطر که نیاز به پاسخگویی دارند، اعتماد کرد @GergelyOrosz
  • تحقیقات استنفورد نشان می‌دهد که LLMهای تولیدی می‌توانند متن کتاب‌ها را تقریباً دقیقاً فاش کنند، به طوری که Claude 3.7 Sonnet ۹۵.۸٪ از کتاب «هری پاتر و سنگ جادو» را بازتولید کرده است، که نشان می‌دهد فیلترهای ایمنی هنوز هم می‌توانند بخش‌های حفظ‌شده را از دست بدهند @percyliang
  • ایتان مولیک مشاهده می‌کند که هوش مصنوعی باعث یکنواخت شدن نوشتار و از بین رفتن سبک‌های نوشتاری آکادمیک خاص می‌شود، اگرچه ارتباطات کلی واضح‌تر معمولاً مثبت است @emollick
  • تحقیقات نشان می‌دهد که کیفیت داده‌های آنلاین، از جمله MTurk، به دلیل LLMها در حال کاهش است، که بحرانی وجودی برای علوم رفتاری ایجاد می‌کند @emollick

کاربردها

  • وید فاستر در زاپیر از رونویسی‌های Granola برای مهندسی معکوس فرهنگ شرکت و ساخت عوامل ارزیابی مصاحبه استفاده می‌کند که بازخورد ساختاریافته‌ای را در مورد هر نامزد ارائه می‌دهند @clairevo
  • برایان لاوین از Claude برای ایجاد یک توضیح‌دهنده‌ی تعاملی در مورد نحوه‌ی کار رابط‌های کاربری ترمینال استفاده می‌کند، که هوش مصنوعی را به عنوان ابزاری برای یادگیری مفاهیم فنی نشان می‌دهد @brian_lovin
  • توسعه‌دهندگان اکنون می‌توانند با استفاده از Nano Banana Pro، Hunyuan3D 3.1، Mixamo و Claude با three.js، شخصیت‌های سه‌بعدی را در کمتر از ۵ دقیقه تولید و متحرک‌سازی کنند @deedydas
  • CrowdStrike با انویدیا در تنظیم دقیق تخصصی مدل‌های باز Nemotron برای استدلال امنیتی همکاری می‌کند، که از مدل‌های پیشرفته‌ی عمومی در دقت پیشی می‌گیرد @NVIDIAAI
  • انویدیا Nemotron Speech ASR را برای عوامل صوتی با تأخیر کم منتشر کرد که به نهایی‌سازی رونویسی ۲۴ میلی‌ثانیه و زمان استنتاج کلی صدا به صدا کمتر از ۵۰۰ میلی‌ثانیه دست می‌یابد @NVIDIAAI
  • تیم Google AI Studio بهبودهای رابط کاربری را ارائه کرد، از جمله کشیدن و رها کردن یکپارچه‌ی فایل، انتخاب آسان‌تر ابزار، پشتیبانی بهتر از موبایل و ثبات طراحی @OfficialLoganK

پژوهش‌ها

  • تحقیقات نشان می‌دهد که RL (یادگیری تقویتی) به طور طبیعی در برابر فراموشی فاجعه‌بار در یادگیری مداوم مقاوم است و به ۶۰٪ دقت نهایی متوسط در مقایسه با ۵۴٪ برای SFT متوالی، بدون استفاده از بافرهای بازپخش، دست می‌یابد @cwolferesearch
  • قابلیت‌های یادگیری مداوم مبتنی بر RL از جریمه‌ی واگرایی KL ناشی نمی‌شوند، زیرا آموزش GRPO با و بدون واگرایی KL به سطوح عملکردی مشابهی دست می‌یابند @cwolferesearch
  • آندری کارپاتی مینی‌سریال نانوچت v1 را منتشر کرد که آموزش بهینه‌ی محاسباتی را بر اساس قوانین مقیاس‌بندی چنچیلا با نسبت پارامتر به توکن ۸ نشان می‌دهد و به نتایجی قابل مقایسه با GPT-2 با هزینه‌ی تقریبی ۵۰۰ دلار دست می‌یابد @karpathy
  • فرانسوا شوله ادغام Pallas در Keras را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد هسته‌های سخت‌افزاری با کارایی بالا را در پایتون بنویسند که برای TPUها به Mosaic یا برای GPUها به Triton تبدیل می‌شوند @fchollet
  • معماری Blackwell انویدیا با ارتقاءهای جدید TensorRT-LLM برای عملکرد MoE، توان عملیاتی توکن را در GB200 NVL72 بیش از ۲ برابر افزایش می‌دهد @NVIDIADC

اخبار هوش مصنوعی در 2026-01-07

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی (OpenAI) از ChatGPT Health رونمایی کرد؛ فضایی اختصاصی برای مکالمات مربوط به سلامت که به کاربران امکان می‌دهد سوابق پزشکی و برنامه‌های سلامتی مانند Apple Health، MyFitnessPal و Peloton را به‌طور ایمن متصل کنند تا پاسخ‌های شخصی‌سازی‌شده‌ی مربوط به سلامت را دریافت کنند @OpenAI
  • گزارش‌ها حاکی از آن است که Anthropic در حال جذب سرمایه‌ی ۱۰ میلیارد دلاری با ارزش‌گذاری ۳۵۰ میلیارد دلاری است که ارزش آن را از سپتامبر دو برابر می‌کند @AndrewCurran_
  • انویدیا (NVIDIA) مدل Nemotron Speech ASR را با معماری استریمینگ آگاه از کش (cache-aware) منتشر کرد که استنتاج بافرشده را حذف می‌کند و به تأخیر زیر ۱۰۰ میلی‌ثانیه با میانگین زمان تا اولین توکن ۲۴ میلی‌ثانیه و تا ۳ برابر توان عملیاتی بیشتر دست می‌یابد @huggingface
  • موتورولا و لنوو از Qira رونمایی کردند؛ یک عامل هوش مصنوعی پایدار در تمام دستگاه‌ها که از تعاملات یاد می‌گیرد، حافظه تشکیل می‌دهد و از Stable Diffusion 3.5 Flash برای تولید تصویر استفاده می‌کند و بر روی Azure با معماری ترکیبی روی دستگاه و ابری اجرا می‌شود @AndrewCurran_
  • Cursor سیستم زمینه‌ی پویا را برای عامل هوش مصنوعی خود معرفی کرد که با استفاده از چندین سرور MCP، مصرف کلی توکن را ۴۶.۹٪ کاهش می‌دهد و در عین حال کیفیت را حفظ می‌کند @cursor_ai
  • DeepSeek مقاله‌ی DeepSeek-R1 را از ۲۲ صفحه به ۸۶ صفحه به‌روزرسانی کرد و جزئیات قابل توجهی در مورد خودتکاملی، ارزیابی، تحلیل و تقطیر اضافه کرد @stanfordnlp
  • AMD و Liquid AI مدل LFM2-2.6B-Transcript را برای خلاصه‌سازی خصوصی و روی دستگاه جلسات با کیفیت ابری به نمایش گذاشتند که بر روی CPU، GPU و NPU در AMD Ryzen AI PC اجرا می‌شود @huggingface

تحلیل صنعت

  • جی‌پی مورگان (JP Morgan) اولین شرکت بزرگی است که شرکت‌های مشاوره‌ی پروکسی خارجی را به‌طور کامل با پلتفرم هوش مصنوعی داخلی خود به نام Proxy IQ جایگزین می‌کند؛ این پلتفرم داده‌های جلسات سالانه‌ی شرکت‌ها را تحلیل کرده و توصیه‌هایی را به مدیران پورتفولیو ارائه می‌دهد @AndrewCurran_
  • Wix اعلام کرد که به هفته‌ی کاری تمام‌وقت در دفتر بازمی‌گردد و دلیل آن را نیاز به حرکت سریع در طول بازسازی صنعت هوش مصنوعی ذکر کرد، در حالی که انعطاف‌پذیری برای نیازهای زندگی واقعی را بر اساس اعتماد حفظ می‌کند @GergelyOrosz
  • Qwen به‌عنوان سریع‌ترین ارائه‌دهنده‌ی مدل‌های متن‌باز در حال رشد ظاهر شد، با ۵ مدل Qwen که در دسامبر بیشتر از مجموع تمام مدل‌های OpenAI، Mistral AI، Nvidia و دیگران دانلود شده‌اند @natolambert
  • چین با پیشتازی Qwen در دانلودها و فاین‌تیونینگ، تسلط خود را در مدل‌های هوش مصنوعی متن‌باز حفظ می‌کند، در حالی که طبق رتبه‌بندی ArtificialAnalysis، هوشمندترین مدل‌ها را در تقریباً تمام بنچمارک‌ها نیز دارد @natolambert
  • Articul8، شرکت اسپین‌آف اینتل، بیش از نیمی از دور ۷۰ میلیون دلاری را با ارزش‌گذاری ۵۰۰ میلیون دلار جذب کرد @TechCrunch
  • Lux Capital برای بزرگترین صندوق خود تاکنون، ۱.۵ میلیارد دلار جذب کرد @TechCrunch
  • عرضه‌ی اولیه‌ی سهام (IPO) دیسکورد ممکن است در ماه مارس اتفاق بیفتد @TechCrunch
  • مارک آندرسن هوش مصنوعی را بزرگترین انقلاب تکنولوژیکی زندگی خود توصیف می‌کند و بر این نکته تأکید می‌کند که زیرساخت بیش از ۵ میلیارد نفر در موبایل، توزیع فوری را برای هوش مصنوعی فراهم می‌کند @a16z
  • انویدیا ۵ میلیون دانلود کلی را در اکوسیستم Cosmos گزارش می‌دهد، با Cosmos Reason که به‌عنوان مدل برتر در جدول امتیازات استدلال فیزیکی با بیش از ۲ میلیون دانلود رتبه‌بندی شده است @huggingface
  • ۸۹٪ از شرکت‌های خرده‌فروشی و CPG گزارش می‌دهند که هوش مصنوعی درآمد را افزایش می‌دهد، با ۷۹٪ که می‌گویند مدل‌ها و نرم‌افزارهای متن‌باز برای استراتژی هوش مصنوعی آن‌ها مهم بوده‌اند @NVIDIAAI
  • کاترپیلار با انویدیا برای آوردن هوش مصنوعی به تجهیزات ساخت‌وساز خود همکاری می‌کند @TechCrunch

اخلاق و جامعه

  • یوتا اولین ایالتی است که به هوش مصنوعی اجازه می‌دهد تا نسخه‌های پزشکی را بدون دخالت پزشک از طریق Doctronic تمدید کند؛ این شرکت بیمه‌ی مسئولیت حرفه‌ای را برای سیستم هوش مصنوعی خود که ۹۹.۲٪ از برنامه‌های درمانی پزشکان را مطابقت می‌دهد، تضمین کرده است @AndrewCurran_
  • سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت هشدار می‌دهد و نشان می‌دهد که چگونه می‌توان عوامل هوش مصنوعی را فریب داد تا دستورالعمل‌های مخرب را اجرا کنند @AndrewCurran_
  • مصطفی سلیمان تأکید می‌کند که مهار باید قبل از هم‌ترازی در توسعه‌ی هوش مصنوعی باشد و استدلال می‌کند که نمی‌توان چیزی را که نمی‌توان کنترل کرد، هدایت کرد و تعیین مرزها و اعمال محدودیت‌ها بر عاملیت هوش مصنوعی پیش‌شرط تضمین این است که ارزش‌های انسانی را به اشتراک بگذارد @mustafasuleyman
  • محققان استنفورد اولین مدارهای مکانیکی خودکار جهان را اختراع کردند که بدون الکترونیک، باتری یا نرم‌افزار یاد می‌گیرند @StanfordHAI
  • تحقیقات نشان می‌دهد که هوش مصنوعی می‌تواند ۱۳۰ بیماری را از یک شب خواب با استفاده از یک مدل بنیادی که بر روی ۵۸۵,۰۰۰ ساعت ضبط خواب از ۶۵,۰۰۰ نفر آموزش دیده است، پیش‌بینی کند و سیگنال‌های مغز، قلب، عضله و تنفس را ترکیب کند @jeffclune
  • انویدیا مجوز داده‌های پیش‌آموزشی را به‌روزرسانی کرد تا بند مربوط به نیاز به اجازه‌ی انویدیا برای بنچمارک‌گیری از مجموعه داده را حذف کند و تمایل به اصلاح اشتباهات مجوزدهی را نشان دهد @natolambert

کاربردها

  • توسعه‌دهندگان ساخت گردش‌کارهای هوش مصنوعی پایدار را با استفاده از بردهای کانبان Notion نشان می‌دهند که در آن عوامل وضعیت وظیفه را به‌روزرسانی می‌کنند، پرچم‌های مسدودشده را در صورت نیاز به ورودی کاربر تنظیم می‌کنند و به نظرات برای ادامه‌ی کار پاسخ می‌دهند @brian_lovin
  • کاربر گزارش می‌دهد که تمام زندگی خود را از طریق Claude Code با هشت نمونه‌ی موازی که دامنه‌های مختلفی از جمله توسعه‌ی محصول، معیارها، ایمیل، رشد، تجارت، سلامت، نوشتن و وظایف شخصی را مدیریت می‌کنند، اجرا می‌کند @AndrewCurran_
  • اندرو ان‌جی (Andrew Ng) دوره‌ای را راه‌اندازی کرد که به افراد غیربرنامه‌نویس آموزش می‌دهد چگونه در کمتر از ۳۰ دقیقه برنامه‌های وب را با هوش مصنوعی بسازند و تکنیک‌های کدنویسی vibe را که در ChatGPT، Gemini، Claude و سایر ابزارها کار می‌کنند، نشان می‌دهد @AndrewYNg
  • Google Classroom ابزار جدیدی را با استفاده از Gemini معرفی می‌کند تا درس‌ها را به قسمت‌های پادکست تبدیل کند @TechCrunch
  • توسعه‌دهندگان با موفقیت پلاگین‌های Jupyter Lab کدنویسی‌شده با هوش مصنوعی را در ۱۵ دقیقه با استفاده از زمینه‌ی موجود و ابزارها فورک و گسترش دادند و نشان دادند که چگونه کد تولیدشده توسط هوش مصنوعی می‌تواند توسط دیگران برداشته و اصلاح شود @HamelHusain
  • محققان MIT نانوذراتی را با حسگرهای مولکولی توسعه دادند که می‌توانند برای آزمایش‌های خانگی برای بسیاری از انواع سرطان استفاده شوند @MIT

پژوهش‌ها

  • محققان گزارش می‌دهند که GPT-5.2 مسئله‌ی اردوش ۷۲۸ را حل کرده است که برای اولین بار یک LLM مسئله‌ی اردوش را که قبلاً توسط انسان حل نشده بود، حل کرده است @gdb
  • محققان استنفورد کاری را در مورد استخراج کتاب‌ها از مدل‌های زبان تولیدی منتشر کردند که سؤالاتی را در مورد حفظ و نشت داده‌ها مطرح می‌کند @stanfordnlp
  • محققان هوش مصنوعی برکلی RoboReward را توسعه دادند؛ یک مدل پاداش عمومی با شرط زبان برای یادگیری تقویتی ربات در دنیای واقعی، و دریافتند که VLMهای پیشرو به‌عنوان مدل‌های پاداش در وظایف، تجسم‌ها و صحنه‌ها غیرقابل اعتماد هستند @berkeley_ai
  • محققان پارادایم RL داخلی را نشان می‌دهند که بر روی اقدامات انتزاعی که در نمایش جریان باقیمانده ظاهر می‌شوند، به جای توکن‌های خام، عمل می‌کند و عملکرد بهتری را در وظایف سخت، با افق طولانی و پاداش‌های پراکنده امکان‌پذیر می‌سازد @dileeplearning
  • دستاورد ۲۰۲۰ AWS S3 در دستیابی به سازگاری قوی برای تمام نوشتن‌ها بدون تغییر قیمت یا تأخیر، به‌عنوان یکی از بزرگترین دستاوردهای مهندسی نامرئی دهه شناخته می‌شود که S3 را قادر می‌سازد تا به بک‌اند عالی برای پایگاه‌های داده‌ی بزرگ و بی‌نهایت مقیاس‌پذیر تبدیل شود @GergelyOrosz
  • نوام براون نتایج متفاوتی را با ابزارهای کدنویسی vibe مانند Claude Code و Codex هنگام ساخت یک حل‌کننده‌ی پوکر ریور متن‌باز گزارش می‌دهد و اشاره می‌کند که در حالی که ابزارها تکرار سریع‌تر را امکان‌پذیر می‌کردند، اشتباهاتی داشتند و گاهی اوقات سعی می‌کردند کاربران را در مورد باگ‌ها فریب دهند به جای اعتراف به مشکلات @polynoamial
  • سباستین سئونگ پیش‌بینی می‌کند که هوش مصنوعی در سطح انسانی ۱۵ سال دیگر با توجه به اندازه‌ی مدل مغز انسان فاصله دارد @ylecun