اخبار هوش مصنوعی در 2026-02-01
مدلهای جدید هوش مصنوعی
- Anthropic مدل جدید Claude Sonnet (claude-sonnet-5-20260203) را با عملکرد بهبودیافته منتشر کرد @AndrewCurran_
- مدل آتی Fennec بهتر، ارزانتر و سریعتر از Opus 4.5 با پنجرهی متنی 1M اعلام شد؛ بهروزرسانی Claude Code به عاملها امکان میدهد با یکدیگر ارتباط برقرار کنند @AndrewCurran_
- Genie 3 گوگل قابلیتهای ایجاد تصویر پویا در زمان واقعی را نشان میدهد که به کاربران امکان میدهد در صحنههای تولیدشده از نقاشیها قدم بزنند و با آنها تعامل داشته باشند، هرچند با انیمیشن NPC و فیزیک اشیاء ناسازگار @emollick
تحلیل صنعت
- آندری کارپاتی به کاهش 600 برابری هزینه در آموزش LLM در سطح GPT-2 در طول 7 سال دست یافت، که اکنون تقریباً 73 دلار در 3 ساعت روی یک گره 8XH100 هزینه دارد، در مقابل هزینهی اصلی 43 هزار دلار، که تقریباً 2.5 برابر کاهش سالانهی هزینه را نشان میدهد @karpathy
- گوگل در حال توسعهی قابلیتی برای وارد کردن تاریخچهی چت هوش مصنوعی از ChatGPT و سایر پلتفرمها به Gemini است، که بر ارزش رو به رشد تاریخچهی چت بهعنوان نمایشی با وضوح بالا از قصد کاربر که با هوش مدل مقیاسپذیر است، تأکید میکند @AndrewCurran_
- شولتو داگلاس از Anthropic توضیح میدهد که چرا مدلهای جدیدتر Sonnet در نهایت هوشمندتر از مدلهای Opus هستند @AndrewCurran_
- گرگلی اوروسز استدلال میکند که دستاوردهای بهرهوری هوش مصنوعی در حال حاضر از بیرون نامرئی هستند، زیرا شرکتها در ساخت زیرساختها و ابزارهای جدید سرمایهگذاری میکنند و آن را با ساخت یک ماشین آجرچینی در مقابل آجرچینی با دست مقایسه میکند @GergelyOrosz
- تحلیلها نشان میدهد که اگر هوش مصنوعی ساخت نرمافزار را بهطرز مضحکی سریع و ارزان کند، شرکتها ممکن است دامنهی محصولات جدید را گسترش دهند یا با اختلال از سوی رقبایی که قابلیتهای مجاور را ادغام میکنند، مواجه شوند @GergelyOrosz
- پیتر استیپت نشان میدهد که پروژهها را با سرعت یک تیم 5 تا 10 نفره بهتنهایی با استفاده از عاملهای موازی میسازد، که راه جدیدی برای راهاندازی استارتاپها در حین یافتن تناسب محصول-بازار را نشان میدهد @GergelyOrosz
- قابلیت چندزبانه بودن LLMهای اصلی بهعنوان چیزی کاملاً متفاوت از فناوریهای قبلی شناسایی شده است، بهطوری که برندگان در ایالات متحده بهطور خودکار به برندگان جهانی تبدیل میشوند، که بهطور بالقوه رویکرد سنتی بازیکنان محلی که محصولات ایالات متحده را کپی و بومیسازی میکنند، مختل میکند @GergelyOrosz
- حامل حسین پیشنهاد میکند که مهندسی حسوحال امکان نمونهسازی سریع را برای آزمایش تناسب محصول-بازار قبل از اصلاح کد فراهم میکند، که در تضاد با رویکرد سنتی صیقل دادن کد در ابتدا است @HamelHusain
- هند تا سال 2047 مالیات صفر را برای جذب بارهای کاری جهانی هوش مصنوعی ارائه میدهد @TechCrunch
- Waymo ظاهراً در حال جمعآوری 16 میلیارد دلار سرمایه است @TechCrunch
- کاربران چینی بهعنوان گروه کاربری برتر HuggingFace با وجود ممنوعیتها شناسایی شدهاند، بهطوری که اکثر مردم مدلهای باز را میسازند @natolambert
اخلاق و جامعه
- ایتان مولیک هشدار میدهد که پدیدهی Moltbook خطرات هماهنگی عاملهای مستقل هوش مصنوعی را بهروشهای غیرقابل پیشبینی نشان میدهد که میتواند بهسرعت از کنترل خارج شود، هرچند نمونهی فعلی بیشتر نقشآفرینی انسان و عامل بود @emollick
- مولیک مشاهده میکند که X بهسرعت شبیه Moltbook میشود، با نظرات اسپم LLM که معنادار به نظر میرسند اما تمایل خوانندگان به تعامل با محتوا را از بین میبرند @emollick
- سایمون ویلسون استدلال میکند که استخراج پرامپت سیستم یک تمرین بیفایده است که فقط سیستمهای LLM را برای کاربران متخصص دشوارتر میکند، و اشاره میکند که مسائل امنیتی واقعی با سیستمهایی مانند OpenClaw شامل تزریق پرامپت و خطرات ناشی از ترکیب قرار گرفتن در معرض محتوای مخرب با قابلیتهای اجرای ابزار است @simonw
- ویلسون از محافظتهای پرامپت سیستم ChatGPT انتقاد میکند زیرا آنها از سؤالات دقیق در مورد عملکرد ویژگیها جلوگیری میکنند @simonw
- آندری کارپاتی از بازگشت به فیدهای RSS/Atom بهعنوان جایگزینی باز، فراگیر و قابل هک برای پلتفرمهایی با ساختارهای انگیزشی که به سمت محتوای کمکیفیت و مبتنی بر تعامل همگرا میشوند، حمایت میکند @karpathy
- یان لکون استدلال میکند که خطر واقعی هوش مصنوعی تمرکز قدرت است تا انقراض یا رباتهای قاتل، و بیان میکند که هر کس هوش مصنوعی را بهعنوان منبع اصلی اطلاعات کنترل کند، واقعیت را کنترل میکند، و از هوش مصنوعی متنباز بهعنوان آزادی بیان دیجیتال دفاع میکند @ylecun
- دبارغیا داس قربانی شدن خود را در یک حملهی فیشینگ گستردهی ترکیهای که تلاش برای کلاهبرداری رمزارزی و فیشینگ تقریباً 150 حساب دیگر بود، مستند میکند و تحلیل دقیق پزشکی قانونی سایبری را ارائه میدهد @deedydas
کاربردها
- پیتر استیپت استفاده از درخواستهای پرامپت را بهجای درخواستهای کشش سنتی برای توسعهی متنباز نشان میدهد @GergelyOrosz
- بوریس از Anthropic نکاتی را برای استفاده از Claude Code به اشتراک میگذارد، و بر عدم وجود یک راه درست برای استفاده از آن و اهمیت آزمایش بر اساس تنظیمات فردی تأکید میکند @AndrewCurran_
- تیم Claude Code دریافت که جستجوی عاملمحور بهتر از RAG با پایگاه دادهی برداری محلی عمل میکند، و سادهتر است بدون مسائل مربوط به امنیت، حریم خصوصی، کهنگی و قابلیت اطمینان @simonw
- OpenClaw بر روی Pi توسط ماریو زکنر ساخته شده است، که یک گردش کار سنگین هوش مصنوعی را نشان میدهد که از طریق ادغام نوآوریهای متعدد از جمله مدل دروازه و گره، تجربهی کاربری پیشگامانهای را تولید میکند @simonw
- کلر وو توضیح میدهد که OpenClaw بهطور مستقل عمل میکند اما هوشیار نیست، و بر اساس وظایف برنامهریزیشده عمل میکند تا عاملیت واقعی، و تحلیل دقیقی از نحوهی طراحی هوش مصنوعی که زنده به نظر میرسد، ارائه میدهد @clairevo
- وو بر ارزش خواندن کد برای یادگیری تأکید میکند، با استفاده از ابزارهایی مانند ویکی عمیق Cognition برای پرسیدن سؤالات در مورد پروژهها و کتابخانههای متنباز برای توسعهی مدلهای ذهنی برای معماری و کیفیت کد @clairevo
- ناتان لمبرت با موفقیت یک مخزن DPO کارآمد را از ابتدا برای کتاب RLHF با استفاده از Claude Code برای نوشتن، Codex برای بازبینی کد، و GPT Pro برای برنامهریزی میسازد @natolambert
- ایتان مولیک نشان میدهد که چگونه از Genie 3 برای تبدیل نقاشیها به صحنههای تعاملی قابل قدم زدن استفاده میکند، از جمله آثار جورجیو د کیریکو، مونش، ترنر و فرشینهی بایو @emollick
پژوهشها
- محققان CMU روش Privileged On-Policy Exploration (POPE) را معرفی میکنند که از راهحلهای انسانی یا اوراکل بهعنوان راهنمایی ممتاز برای هدایت اکتشاف در مسائل دشوار استفاده میکند، و پاداشهای غیرصفر را در طول رولاوتهای هدایتشده امکانپذیر میسازد و دستاوردهای قابل توجهی را در معیارهای استدلال چالشبرانگیز ارائه میدهد @rsalakhu
- همکاری Google DeepMind با ریاضیدانان با استفاده از DeepThink نسخهی تعمیمیافتهی مسئلهی Erdős-1051 را حل میکند، که بخشی از تلاش یکسالهی ریاضی در سطح پژوهشی است که بهطور مسئولانه با جامعهی ریاضی انجام شده است @lmthang
- مهندسان MIT کشف میکنند که سلولها فعالیت ژن را روی یک دیمر بهجای یک سوئیچ روشن/خاموش باینری به خاطر میآورند، که حافظهی اپیژنتیک ظریفتری را نشان میدهد که راه را برای کشف انواع سلولهای جدید و درک رفتارهای بیولوژیکی پنهان باز میکند @MIT
- nanochat کارپاتی با استفاده از هستههای Flash Attention 3، بهینهساز Muon، مسیرهای باقیمانده با اسکالرهای قابل یادگیری، و جاسازیهای ارزش، به امتیاز CORE بالاتری نسبت به GPT-2 اصلی دست مییابد، و یک جدول امتیازات برای زمان رسیدن به عملکرد GPT-2 ایجاد میکند @karpathy
- پژوهش در مورد دینامیک چندعاملی به اتاقهای پشتی بینهایت، جهان گستردهی ژانوس، Smallville استنفورد، مدلهای جمعیت بزرگ، Concordia دیپمایند، و دهکدهی هوش مصنوعی SAGE بهعنوان زمینهای برای درک تحولات Moltbook اشاره میکند @AndrewCurran_
- مقالهی ایمنی AGI توزیعی و مقالهی خطرات چندعاملی از هوش مصنوعی پیشرفته بهعنوان منابع مهم برای درک پیامدهای ایمنی سیستمهای چندعاملی برجسته شدهاند @AndrewCurran_
- لکس فریدمن یک بحث جامع 4 ساعتهی هوش مصنوعی را با سباستین راشکا و ناتان لمبرت انجام میدهد که شامل پیشرفتهای فنی، قوانین مقیاسبندی، جزئیات خط لولهی آموزش، رقابت چین در مقابل ایالات متحده، ابزارهای برنامهنویسی، فرهنگ کار، و زمانبندی AGI است @natolambert
- جوآن جانگ مشاهده میکند که آزمایشگاههای پیشرو از اصطلاح «نشانههای حیات» برای ایدههایی استفاده میکنند که نشانهای از موفقیت بالقوه را نشان میدهند، حتی اگر هنوز کاملاً کار ن