اخبار هوش مصنوعی در 2026-02-01

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل جدید Claude Sonnet (claude-sonnet-5-20260203) را با عملکرد بهبودیافته منتشر کرد @AndrewCurran_
  • مدل آتی Fennec بهتر، ارزان‌تر و سریع‌تر از Opus 4.5 با پنجره‌ی متنی 1M اعلام شد؛ به‌روزرسانی Claude Code به عامل‌ها امکان می‌دهد با یکدیگر ارتباط برقرار کنند @AndrewCurran_
  • Genie 3 گوگل قابلیت‌های ایجاد تصویر پویا در زمان واقعی را نشان می‌دهد که به کاربران امکان می‌دهد در صحنه‌های تولیدشده از نقاشی‌ها قدم بزنند و با آن‌ها تعامل داشته باشند، هرچند با انیمیشن NPC و فیزیک اشیاء ناسازگار @emollick

تحلیل صنعت

  • آندری کارپاتی به کاهش 600 برابری هزینه در آموزش LLM در سطح GPT-2 در طول 7 سال دست یافت، که اکنون تقریباً 73 دلار در 3 ساعت روی یک گره 8XH100 هزینه دارد، در مقابل هزینه‌ی اصلی 43 هزار دلار، که تقریباً 2.5 برابر کاهش سالانه‌ی هزینه را نشان می‌دهد @karpathy
  • گوگل در حال توسعه‌ی قابلیتی برای وارد کردن تاریخچه‌ی چت هوش مصنوعی از ChatGPT و سایر پلتفرم‌ها به Gemini است، که بر ارزش رو به رشد تاریخچه‌ی چت به‌عنوان نمایشی با وضوح بالا از قصد کاربر که با هوش مدل مقیاس‌پذیر است، تأکید می‌کند @AndrewCurran_
  • شولتو داگلاس از Anthropic توضیح می‌دهد که چرا مدل‌های جدیدتر Sonnet در نهایت هوشمندتر از مدل‌های Opus هستند @AndrewCurran_
  • گرگلی اوروسز استدلال می‌کند که دستاوردهای بهره‌وری هوش مصنوعی در حال حاضر از بیرون نامرئی هستند، زیرا شرکت‌ها در ساخت زیرساخت‌ها و ابزارهای جدید سرمایه‌گذاری می‌کنند و آن را با ساخت یک ماشین آجرچینی در مقابل آجرچینی با دست مقایسه می‌کند @GergelyOrosz
  • تحلیل‌ها نشان می‌دهد که اگر هوش مصنوعی ساخت نرم‌افزار را به‌طرز مضحکی سریع و ارزان کند، شرکت‌ها ممکن است دامنه‌ی محصولات جدید را گسترش دهند یا با اختلال از سوی رقبایی که قابلیت‌های مجاور را ادغام می‌کنند، مواجه شوند @GergelyOrosz
  • پیتر استیپت نشان می‌دهد که پروژه‌ها را با سرعت یک تیم 5 تا 10 نفره به‌تنهایی با استفاده از عامل‌های موازی می‌سازد، که راه جدیدی برای راه‌اندازی استارتاپ‌ها در حین یافتن تناسب محصول-بازار را نشان می‌دهد @GergelyOrosz
  • قابلیت چندزبانه بودن LLMهای اصلی به‌عنوان چیزی کاملاً متفاوت از فناوری‌های قبلی شناسایی شده است، به‌طوری که برندگان در ایالات متحده به‌طور خودکار به برندگان جهانی تبدیل می‌شوند، که به‌طور بالقوه رویکرد سنتی بازیکنان محلی که محصولات ایالات متحده را کپی و بومی‌سازی می‌کنند، مختل می‌کند @GergelyOrosz
  • حامل حسین پیشنهاد می‌کند که مهندسی حس‌وحال امکان نمونه‌سازی سریع را برای آزمایش تناسب محصول-بازار قبل از اصلاح کد فراهم می‌کند، که در تضاد با رویکرد سنتی صیقل دادن کد در ابتدا است @HamelHusain
  • هند تا سال 2047 مالیات صفر را برای جذب بارهای کاری جهانی هوش مصنوعی ارائه می‌دهد @TechCrunch
  • Waymo ظاهراً در حال جمع‌آوری 16 میلیارد دلار سرمایه است @TechCrunch
  • کاربران چینی به‌عنوان گروه کاربری برتر HuggingFace با وجود ممنوعیت‌ها شناسایی شده‌اند، به‌طوری که اکثر مردم مدل‌های باز را می‌سازند @natolambert

اخلاق و جامعه

  • ایتان مولیک هشدار می‌دهد که پدیده‌ی Moltbook خطرات هماهنگی عامل‌های مستقل هوش مصنوعی را به‌روش‌های غیرقابل پیش‌بینی نشان می‌دهد که می‌تواند به‌سرعت از کنترل خارج شود، هرچند نمونه‌ی فعلی بیشتر نقش‌آفرینی انسان و عامل بود @emollick
  • مولیک مشاهده می‌کند که X به‌سرعت شبیه Moltbook می‌شود، با نظرات اسپم LLM که معنادار به نظر می‌رسند اما تمایل خوانندگان به تعامل با محتوا را از بین می‌برند @emollick
  • سایمون ویلسون استدلال می‌کند که استخراج پرامپت سیستم یک تمرین بی‌فایده است که فقط سیستم‌های LLM را برای کاربران متخصص دشوارتر می‌کند، و اشاره می‌کند که مسائل امنیتی واقعی با سیستم‌هایی مانند OpenClaw شامل تزریق پرامپت و خطرات ناشی از ترکیب قرار گرفتن در معرض محتوای مخرب با قابلیت‌های اجرای ابزار است @simonw
  • ویلسون از محافظت‌های پرامپت سیستم ChatGPT انتقاد می‌کند زیرا آن‌ها از سؤالات دقیق در مورد عملکرد ویژگی‌ها جلوگیری می‌کنند @simonw
  • آندری کارپاتی از بازگشت به فیدهای RSS/Atom به‌عنوان جایگزینی باز، فراگیر و قابل هک برای پلتفرم‌هایی با ساختارهای انگیزشی که به سمت محتوای کم‌کیفیت و مبتنی بر تعامل همگرا می‌شوند، حمایت می‌کند @karpathy
  • یان لکون استدلال می‌کند که خطر واقعی هوش مصنوعی تمرکز قدرت است تا انقراض یا ربات‌های قاتل، و بیان می‌کند که هر کس هوش مصنوعی را به‌عنوان منبع اصلی اطلاعات کنترل کند، واقعیت را کنترل می‌کند، و از هوش مصنوعی متن‌باز به‌عنوان آزادی بیان دیجیتال دفاع می‌کند @ylecun
  • دبارغیا داس قربانی شدن خود را در یک حمله‌ی فیشینگ گسترده‌ی ترکیه‌ای که تلاش برای کلاهبرداری رمزارزی و فیشینگ تقریباً 150 حساب دیگر بود، مستند می‌کند و تحلیل دقیق پزشکی قانونی سایبری را ارائه می‌دهد @deedydas

کاربردها

  • پیتر استیپت استفاده از درخواست‌های پرامپت را به‌جای درخواست‌های کشش سنتی برای توسعه‌ی متن‌باز نشان می‌دهد @GergelyOrosz
  • بوریس از Anthropic نکاتی را برای استفاده از Claude Code به اشتراک می‌گذارد، و بر عدم وجود یک راه درست برای استفاده از آن و اهمیت آزمایش بر اساس تنظیمات فردی تأکید می‌کند @AndrewCurran_
  • تیم Claude Code دریافت که جستجوی عامل‌محور بهتر از RAG با پایگاه داده‌ی برداری محلی عمل می‌کند، و ساده‌تر است بدون مسائل مربوط به امنیت، حریم خصوصی، کهنگی و قابلیت اطمینان @simonw
  • OpenClaw بر روی Pi توسط ماریو زکنر ساخته شده است، که یک گردش کار سنگین هوش مصنوعی را نشان می‌دهد که از طریق ادغام نوآوری‌های متعدد از جمله مدل دروازه و گره، تجربه‌ی کاربری پیشگامانه‌ای را تولید می‌کند @simonw
  • کلر وو توضیح می‌دهد که OpenClaw به‌طور مستقل عمل می‌کند اما هوشیار نیست، و بر اساس وظایف برنامه‌ریزی‌شده عمل می‌کند تا عاملیت واقعی، و تحلیل دقیقی از نحوه‌ی طراحی هوش مصنوعی که زنده به نظر می‌رسد، ارائه می‌دهد @clairevo
  • وو بر ارزش خواندن کد برای یادگیری تأکید می‌کند، با استفاده از ابزارهایی مانند ویکی عمیق Cognition برای پرسیدن سؤالات در مورد پروژه‌ها و کتابخانه‌های متن‌باز برای توسعه‌ی مدل‌های ذهنی برای معماری و کیفیت کد @clairevo
  • ناتان لمبرت با موفقیت یک مخزن DPO کارآمد را از ابتدا برای کتاب RLHF با استفاده از Claude Code برای نوشتن، Codex برای بازبینی کد، و GPT Pro برای برنامه‌ریزی می‌سازد @natolambert
  • ایتان مولیک نشان می‌دهد که چگونه از Genie 3 برای تبدیل نقاشی‌ها به صحنه‌های تعاملی قابل قدم زدن استفاده می‌کند، از جمله آثار جورجیو د کیریکو، مونش، ترنر و فرشینه‌ی بایو @emollick

پژوهش‌ها

  • محققان CMU روش Privileged On-Policy Exploration (POPE) را معرفی می‌کنند که از راه‌حل‌های انسانی یا اوراکل به‌عنوان راهنمایی ممتاز برای هدایت اکتشاف در مسائل دشوار استفاده می‌کند، و پاداش‌های غیرصفر را در طول رول‌اوت‌های هدایت‌شده امکان‌پذیر می‌سازد و دستاوردهای قابل توجهی را در معیارهای استدلال چالش‌برانگیز ارائه می‌دهد @rsalakhu
  • همکاری Google DeepMind با ریاضیدانان با استفاده از DeepThink نسخه‌ی تعمیم‌یافته‌ی مسئله‌ی Erdős-1051 را حل می‌کند، که بخشی از تلاش یک‌ساله‌ی ریاضی در سطح پژوهشی است که به‌طور مسئولانه با جامعه‌ی ریاضی انجام شده است @lmthang
  • مهندسان MIT کشف می‌کنند که سلول‌ها فعالیت ژن را روی یک دیمر به‌جای یک سوئیچ روشن/خاموش باینری به خاطر می‌آورند، که حافظه‌ی اپی‌ژنتیک ظریف‌تری را نشان می‌دهد که راه را برای کشف انواع سلول‌های جدید و درک رفتارهای بیولوژیکی پنهان باز می‌کند @MIT
  • nanochat کارپاتی با استفاده از هسته‌های Flash Attention 3، بهینه‌ساز Muon، مسیرهای باقیمانده با اسکالرهای قابل یادگیری، و جاسازی‌های ارزش، به امتیاز CORE بالاتری نسبت به GPT-2 اصلی دست می‌یابد، و یک جدول امتیازات برای زمان رسیدن به عملکرد GPT-2 ایجاد می‌کند @karpathy
  • پژوهش در مورد دینامیک چندعاملی به اتاق‌های پشتی بی‌نهایت، جهان گسترده‌ی ژانوس، Smallville استنفورد، مدل‌های جمعیت بزرگ، Concordia دیپ‌مایند، و دهکده‌ی هوش مصنوعی SAGE به‌عنوان زمینه‌ای برای درک تحولات Moltbook اشاره می‌کند @AndrewCurran_
  • مقاله‌ی ایمنی AGI توزیعی و مقاله‌ی خطرات چندعاملی از هوش مصنوعی پیشرفته به‌عنوان منابع مهم برای درک پیامدهای ایمنی سیستم‌های چندعاملی برجسته شده‌اند @AndrewCurran_
  • لکس فریدمن یک بحث جامع 4 ساعته‌ی هوش مصنوعی را با سباستین راشکا و ناتان لمبرت انجام می‌دهد که شامل پیشرفت‌های فنی، قوانین مقیاس‌بندی، جزئیات خط لوله‌ی آموزش، رقابت چین در مقابل ایالات متحده، ابزارهای برنامه‌نویسی، فرهنگ کار، و زمان‌بندی AGI است @natolambert
  • جوآن جانگ مشاهده می‌کند که آزمایشگاه‌های پیشرو از اصطلاح «نشانه‌های حیات» برای ایده‌هایی استفاده می‌کنند که نشانه‌ای از موفقیت بالقوه را نشان می‌دهند، حتی اگر هنوز کاملاً کار ن