اخبار هوش مصنوعی در 2025-08-09

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی (OpenAI) عرضه‌ی GPT-5 را به ۱۰۰٪ کاربران پلاس، پرو، تیم، و رایگان تکمیل کرد، با محدودیت‌های نرخ ۲ برابری برای کاربران پلاس و تیم طی آخر هفته و نسخه‌های کوچک‌تر GPT-5 و GPT-5 thinking که هفته‌ی آینده ارائه خواهند شد @OpenAI
  • ایکس‌ای‌آی (xAI) Grok 4 را با قابلیت‌های پیشرفته‌ی پردازش پی‌دی‌اف (PDF) ارتقا می‌دهد؛ اکنون این مدل قادر به پردازش پی‌دی‌اف‌های حجیم با صدها صفحه و شناسایی محتوای بهبود یافته است @xai
  • انتروپیک (Anthropic) قابلیت پردازش وظایف پس‌زمینه را برای Claude Code منتشر می‌کند، که به آن اجازه می‌دهد دستورات بش (bash) را اجرا کند، لاگ‌ها (logs) را به صورت بی‌درنگ نظارت کند، و در حین انجام وظایف طولانی‌مدت، مشکلات را اشکال‌زدایی کند @_catwu

تحلیل صنعت

  • سم آلتمن (Sam Altman) به چالش‌های عرضه‌ی GPT-5 اذعان می‌کند و اشاره می‌کند که آن‌ها دلبستگی کاربران به ویژگی‌های GPT-4o را دست‌کم گرفته بودند و برنامه‌هایی را برای «گرم‌تر» کردن GPT-5 در حالی که با محدودیت‌های شدید ظرفیت مواجه است، اعلام می‌کند @sama
  • نتایج ارزیابی نشان می‌دهند که GPT-5 در مقایسه با Claude Opus 4.1 هرگز در صدر جدول‌های رهبران عامل‌محور قرار نمی‌گیرد، اگرچه مبادلات هزینه-دقت بهتری ارائه می‌دهد و بسیار ارزان‌تر از مدل‌های مشابه است @sayashk
  • گرگلی اوروس (Gergely Orosz) از ارزیابی‌های فروشندگان که آی‌بی‌ام (IBM) را بالاتر از Cursor برای ابزارهای کدنویسی هوش مصنوعی رتبه‌بندی می‌کنند، انتقاد می‌کند و آن‌ها را «پول‌محور» می‌نامد که در آن فروشندگان برای کسب رتبه‌ی بالاتر از واقعیت، هزینه‌ی زیادی پرداخت می‌کنند @GergelyOrosz
  • پل گراهام (Paul Graham) داده‌های رشد درآمد Replit را به اشتراک می‌گذارد و آن را «رشدی به این سرعت در این مقیاس» توصیف می‌کند که بسیار به ندرت دیده می‌شود @paulg
  • چت‌پی‌آر‌دی (ChatPRD) گزارش می‌دهد که GPT-5 در آزمایش‌های آن‌ها، ۵ برابر مصرف توکن، ۳ برابر اسناد طولانی‌تر، ۳ برابر زمان تولید، و نرخ بازخورد منفی بالاتری از خود نشان داده است، که باعث شده است آن‌ها کاربران را روی مدل‌های قبلی نگه دارند @clairevo

اخلاق و جامعه

  • سایمون ویلیسون (Simon Willison) در مورد آسیب‌پذیری‌های «تزریق پرامپت» (prompt injection) در پیاده‌سازی MCP کورسر (Cursor) هشدار می‌دهد، جایی که مهاجمان می‌توانند از طریق مسائل مخرب Jira، اسرار توسعه‌دهنده را به سرقت ببرند و آن را یک حمله‌ی «سه‌گانه‌ی مرگبار» می‌خواند @simonw
  • آماندا اسکل (Amanda Askell) از یک روش‌شناسی (متدولوژی) آزمایش ایمنی هوش مصنوعی انتقاد می‌کند و اشاره می‌کند که این روش‌شناسی اندازه‌ می‌گیرد که Claude و Gemini چقدر خوب می‌توانند مکالمات چندمرحله‌ای ChatGPT را اصلاح کنند، به جای آنکه از ابتدا از موقعیت‌های مشکل‌ساز اجتناب کنند @AmandaAskell
  • ایتان مولیک (Ethan Mollick) تجربه‌ی کاربری ناسازگار GPT-5 را برجسته می‌کند، جایی که کاربران گاهی بهترین هوش مصنوعی موجود را دریافت می‌کنند و گاهی یکی از بدترین‌ها را، با امکان جابه‌جایی در طول یک مکالمه @emollick

کاربردها

  • تک‌کرانچ (TechCrunch) نشان می‌دهد که GPT-5 چگونه دموهای تعاملی را برای توضیح مفاهیم علمی مانند اثر برنولی و کدنویسی «وایب» (vibe coding) برای ساخت اپلیکیشن‌های یادگیری زبان ایجاد می‌کند @TechCrunch
  • جرمی هاوارد (Jeremy Howard) نکته‌ای را به اشتراک می‌گذارد که اضافه کردن «. think hard» به پرامپت‌های ChatGPT GPT-5 منجر به استفاده از مدل شایسته‌تر در ۱۰۰٪ مواقع می‌شود، در مقایسه با «مدل ناتوان» در صورت عدم وجود آن @jeremyphoward
  • نیتن لمبرت (Nathan Lambert) گزارش می‌دهد که عملکرد GPT-5 در codex CLI خوب به نظر می‌رسد و بسیار بهتر از تلاش‌های قبلی است، اگرچه Claude Code تجربه‌ی کاربری برتری دارد که از نظر محصول «تمیزتر و بصری‌تر» است @natolambert

پژوهش‌ها

  • پژوهش METR نشان می‌دهد که در قابلیت‌های هوش مصنوعی برای کار پایدار، پیشرفت تصاعدی مستمر وجود دارد، بدون جهش‌های غیرمنتظره و همچنین بدون بن‌بست، طبق آخرین اندازه‌گیری‌های معیار آن‌ها @emollick
  • نیتن لمبرت (Nathan Lambert) توضیح می‌دهد که مقیاس‌بندی یادگیری تقویتی (RL) اساساً با پیش‌آموزش (pretraining) متفاوت است زیرا «با RL، می‌توانید چک‌پوینت‌های خود را استخراج کنید» در حالی که پیش‌آموزش نمی‌تواند صرفاً «جایی که اکنون هستید را در نظر بگیرد» @natolambert
  • نیتن لمبرت (Nathan Lambert) استدلال می‌کند که مقیاس‌بندی خوشه‌های آموزشی ۱۰ برابر ممکن است دیگر از نظر مالی به‌صرفه نباشد، اما این «درس تلخ» (bitter lesson) را باطل نمی‌کند، که به ایده‌هایی اشاره دارد که با محاسبات مقیاس‌بندی‌شده‌ی فعلی، نتایج مؤثرتری می‌دهند @natolambert