اخبار هوش مصنوعی در 2025-08-09
مدلهای جدید هوش مصنوعی
- اوپنایآی (OpenAI) عرضهی GPT-5 را به ۱۰۰٪ کاربران پلاس، پرو، تیم، و رایگان تکمیل کرد، با محدودیتهای نرخ ۲ برابری برای کاربران پلاس و تیم طی آخر هفته و نسخههای کوچکتر GPT-5 و GPT-5 thinking که هفتهی آینده ارائه خواهند شد @OpenAI
- ایکسایآی (xAI) Grok 4 را با قابلیتهای پیشرفتهی پردازش پیدیاف (PDF) ارتقا میدهد؛ اکنون این مدل قادر به پردازش پیدیافهای حجیم با صدها صفحه و شناسایی محتوای بهبود یافته است @xai
- انتروپیک (Anthropic) قابلیت پردازش وظایف پسزمینه را برای Claude Code منتشر میکند، که به آن اجازه میدهد دستورات بش (bash) را اجرا کند، لاگها (logs) را به صورت بیدرنگ نظارت کند، و در حین انجام وظایف طولانیمدت، مشکلات را اشکالزدایی کند @_catwu
تحلیل صنعت
- سم آلتمن (Sam Altman) به چالشهای عرضهی GPT-5 اذعان میکند و اشاره میکند که آنها دلبستگی کاربران به ویژگیهای GPT-4o را دستکم گرفته بودند و برنامههایی را برای «گرمتر» کردن GPT-5 در حالی که با محدودیتهای شدید ظرفیت مواجه است، اعلام میکند @sama
- نتایج ارزیابی نشان میدهند که GPT-5 در مقایسه با Claude Opus 4.1 هرگز در صدر جدولهای رهبران عاملمحور قرار نمیگیرد، اگرچه مبادلات هزینه-دقت بهتری ارائه میدهد و بسیار ارزانتر از مدلهای مشابه است @sayashk
- گرگلی اوروس (Gergely Orosz) از ارزیابیهای فروشندگان که آیبیام (IBM) را بالاتر از Cursor برای ابزارهای کدنویسی هوش مصنوعی رتبهبندی میکنند، انتقاد میکند و آنها را «پولمحور» مینامد که در آن فروشندگان برای کسب رتبهی بالاتر از واقعیت، هزینهی زیادی پرداخت میکنند @GergelyOrosz
- پل گراهام (Paul Graham) دادههای رشد درآمد Replit را به اشتراک میگذارد و آن را «رشدی به این سرعت در این مقیاس» توصیف میکند که بسیار به ندرت دیده میشود @paulg
- چتپیآردی (ChatPRD) گزارش میدهد که GPT-5 در آزمایشهای آنها، ۵ برابر مصرف توکن، ۳ برابر اسناد طولانیتر، ۳ برابر زمان تولید، و نرخ بازخورد منفی بالاتری از خود نشان داده است، که باعث شده است آنها کاربران را روی مدلهای قبلی نگه دارند @clairevo
اخلاق و جامعه
- سایمون ویلیسون (Simon Willison) در مورد آسیبپذیریهای «تزریق پرامپت» (prompt injection) در پیادهسازی MCP کورسر (Cursor) هشدار میدهد، جایی که مهاجمان میتوانند از طریق مسائل مخرب Jira، اسرار توسعهدهنده را به سرقت ببرند و آن را یک حملهی «سهگانهی مرگبار» میخواند @simonw
- آماندا اسکل (Amanda Askell) از یک روششناسی (متدولوژی) آزمایش ایمنی هوش مصنوعی انتقاد میکند و اشاره میکند که این روششناسی اندازه میگیرد که Claude و Gemini چقدر خوب میتوانند مکالمات چندمرحلهای ChatGPT را اصلاح کنند، به جای آنکه از ابتدا از موقعیتهای مشکلساز اجتناب کنند @AmandaAskell
- ایتان مولیک (Ethan Mollick) تجربهی کاربری ناسازگار GPT-5 را برجسته میکند، جایی که کاربران گاهی بهترین هوش مصنوعی موجود را دریافت میکنند و گاهی یکی از بدترینها را، با امکان جابهجایی در طول یک مکالمه @emollick
کاربردها
- تککرانچ (TechCrunch) نشان میدهد که GPT-5 چگونه دموهای تعاملی را برای توضیح مفاهیم علمی مانند اثر برنولی و کدنویسی «وایب» (vibe coding) برای ساخت اپلیکیشنهای یادگیری زبان ایجاد میکند @TechCrunch
- جرمی هاوارد (Jeremy Howard) نکتهای را به اشتراک میگذارد که اضافه کردن «. think hard» به پرامپتهای ChatGPT GPT-5 منجر به استفاده از مدل شایستهتر در ۱۰۰٪ مواقع میشود، در مقایسه با «مدل ناتوان» در صورت عدم وجود آن @jeremyphoward
- نیتن لمبرت (Nathan Lambert) گزارش میدهد که عملکرد GPT-5 در codex CLI خوب به نظر میرسد و بسیار بهتر از تلاشهای قبلی است، اگرچه Claude Code تجربهی کاربری برتری دارد که از نظر محصول «تمیزتر و بصریتر» است @natolambert
پژوهشها
- پژوهش METR نشان میدهد که در قابلیتهای هوش مصنوعی برای کار پایدار، پیشرفت تصاعدی مستمر وجود دارد، بدون جهشهای غیرمنتظره و همچنین بدون بنبست، طبق آخرین اندازهگیریهای معیار آنها @emollick
- نیتن لمبرت (Nathan Lambert) توضیح میدهد که مقیاسبندی یادگیری تقویتی (RL) اساساً با پیشآموزش (pretraining) متفاوت است زیرا «با RL، میتوانید چکپوینتهای خود را استخراج کنید» در حالی که پیشآموزش نمیتواند صرفاً «جایی که اکنون هستید را در نظر بگیرد» @natolambert
- نیتن لمبرت (Nathan Lambert) استدلال میکند که مقیاسبندی خوشههای آموزشی ۱۰ برابر ممکن است دیگر از نظر مالی بهصرفه نباشد، اما این «درس تلخ» (bitter lesson) را باطل نمیکند، که به ایدههایی اشاره دارد که با محاسبات مقیاسبندیشدهی فعلی، نتایج مؤثرتری میدهند @natolambert