اخبار هوش مصنوعی در 2025-08-10

مدل‌های جدید هوش مصنوعی

  • xAI اعلام کرد Grok 4 اکنون برای همه‌ی کاربران در سراسر جهان با محدودیت‌های استفاده‌ی سخاوتمندانه‌، از طریق Auto mode routing یا Expert mode selection رایگان است @xai
  • ایلان ماسک اعلام کرد که مدل پایه‌ی V7 تسلا پیش‌آموزش خود را به پایان رسانده است. این مدل از پردازش چندوجهی بومی بیت‌جریان‌های ویدیویی/صوتی بدون نیاز به تبدیل پشتیبانی می‌کند و امکان درک ظرافت‌های گفتار را برای تشخیص حالات و تاکید فراهم می‌آورد @elonmusk
  • دمیس هاسابیس از گوگل ادعا می‌کند که Veo3 بهترین مدل ویدیویی در جهان است و اکنون در اپلیکیشن Gemini در دسترس قرار دارد @demishassabis
  • OpenAI برای اولین بار در پنج سال گذشته دو مدل متن‌باز جدید منتشر کرد که نشان‌دهنده‌ی یک تغییر مهم در رویکرد آن‌هاست @TechCrunch
  • مدل Qwen-Image فشرده شده تا در ۸ گام اجرا شود و تقریباً همان کیفیت تصویر را با بیش از ۵۰ درصد کاهش نیاز به محاسبات ارائه می‌دهد @angrypenguinPNG

تحلیل صنعت

  • سم آلتمن افزایش قابل توجهی در استفاده از مدل‌های استدلالی گزارش می‌دهد: کاربران رایگان از کمتر از ۱٪ به ۷٪ و کاربران پلاس (Plus) از ۷٪ به ۲۴٪ رسیدند که نشان‌دهنده‌ی پذیرش فزاینده‌ی قابلیت‌های پیشرفته‌ی هوش مصنوعی است @sama
  • صندوق متمرکز بر هوش مصنوعی لئوپولد آشنبرنر تا به امروز در سال جاری عملکرد بهتری نسبت به صندوق‌های پوشش ریسک (hedge fund) اصلی داشته است، در حالی که بیش از ۱ میلیارد دلار سرمایه را از میلیاردرهای خلیج فارس و صندوق‌های بازنشستگی مدیریت می‌کند @apralky
  • OpenAI با واکنش شدید کاربران در مورد تغییرات GPT-4o مواجه شده است، به طوری که بسیاری از مشترکین پلاس (Plus) به دلیل کاهش ارزش در برنامه‌های اشتراک خود تهدید به لغو اشتراکشان کرده‌اند @AndrewCurran_
  • گرگلی اوروسز در مورد استفاده‌ی مدیران مهندسی از ابزارهای مجهز به هوش مصنوعی برای مدیریت تیم‌ها از طریق معیارهای ساختگی هشدار می‌دهد. او استدلال می‌کند که مدیرانی که در جزئیات فنی باقی می‌مانند، همواره عملکرد بهتری نسبت به کسانی دارند که درک خود را به ماشین‌ها واگذار می‌کنند @GergelyOrosz
  • اتان مالیک معتقد است که اکثریت قریب به اتفاق ۷۰۰ میلیون کاربر ChatGPT احتمالاً GPT-5 را ترجیح می‌دهند، و نظرات در X (توییتر سابق) منعکس‌کننده‌ی تجربه‌ی کاربران عادی نیست @emollick

اخلاق و جامعه

  • دیدی (Deedy) یک آسیب‌پذیری امنیتی مهم در ChatGPT به نام AgentFlayer را فاش کرد که در آن پرامپت‌های مخرب در اسناد می‌توانند رندر تصویر را اجبار کنند؛ این امر باعث می‌شود که API keys و داده‌های حافظه از طریق URLها و بدون نیاز به هیچ کلیک کاربر، خارج شوند @deedydas
  • پژوهشی که در نشریه‌ی Nature Human Behaviour منتشر شده است، نشان می‌دهد که استفاده از LLM در مقالات علمی قابل اندازه‌گیری است، با برآورد اصلاحات بالاتر در میان نویسندگانی که پیش‌چاپ‌ها (preprints) را به دفعات زیاد و در حوزه‌های پژوهشی شلوغ منتشر می‌کنند @emulenews
  • مطالعه‌ای کلمات خاصی را شناسایی کرده است که به طور نامتناسبی توسط LLMها در مقالات علمی در مقایسه با پیکره‌های متنی (corpora) قبل از ChatGPT تولید می‌شوند: «realm»، «intricate»، «showcasing» و «pivotal» @emulenews
  • اندرو کارن مشاهده می‌کند که هنگامی که مردم هوش مصنوعی را به عنوان موجودی زنده در نظریه‌ی ذهن خود مدل‌سازی می‌کنند، هنگامی که آن ارتباط قطع می‌شود، احساس فقدان واقعی می‌کنند؛ این امر واکنش کاربران به تغییرات GPT-4o را توضیح می‌دهد @AndrewCurran_

کاربردها

  • اتان مالیک قابلیت‌های چشمگیر GPT-5 Pro در تشخیص موقعیت جغرافیایی (geo-guessing) را نشان می‌دهد؛ این مدل شهرها را به درستی از عکس‌های کراپ شده (cropped photos) که فراداده‌هایشان (metadata) حذف شده‌اند، از طریق تحلیل دقیق تصویر شناسایی می‌کند @emollick
  • دیدی نشان می‌دهد که GPT-5 Pro با موفقیت در یک گام توانست یک اپلیکیشن برای ترکیب تصاویر، نوشتن متن، کشیدن فلش‌ها و مستطیل‌ها، و دانلود نتایج با کیفیت بالا را در ۶ دقیقه ایجاد کند، که عملکردی بهتر از Grok و Gemini داشت @deedydas
  • تک‌کرانچ (TechCrunch) نشان می‌دهد که GPT-5 در حال ایجاد دموهای تعاملی برای توضیح مفاهیم علمی مانند اثر برنولی است که کاربردهای آموزشی آن برای دانش‌آموزان را برجسته می‌کند @TechCrunch
  • گرگ براکمن GPT-5 را به عنوان یک همکار علمی به نمایش می‌گذارد و قابلیت‌های پژوهشی آن را نشان می‌دهد @gdb
  • ناتان لمبرت با پیش‌آموزش با استفاده از یادگیری تقویتی آزمایش می‌کند و رویکردهای نوین آموزشی برای مدل‌های زبانی را بررسی می‌کند @natolambert

پژوهش‌ها

  • ایدان مک‌لاکلین استدلال می‌کند که شکاکان هوش مصنوعی از معیارهای سقف امتیاز (score ceiling benchmarks) استفاده می‌کنند تا پیشرفت را لگاریتمی نشان دهند، در حالی که معیارهای بدون سقف (no-ceiling benchmarks) منحنی‌های عملکرد متفاوتی را آشکار می‌کنند که نشان‌دهنده‌ی بهبود نمایی (exponential improvement) مداوم است @aidan_mclau
  • مک‌لاکلین گزارش می‌دهد که چت GPT-5 را برای ۶۵٪ از پرسش‌ها به مدل‌های استدلالی ترجیح می‌دهد؛ این ترجیح به دلیل طول پاسخ بهتر، سرعت درک بالاتر و واکنش‌های مناسب است. او همچنین اشاره می‌کند که مدل‌های استدلالی در وظایف مهندسی نرم‌افزار برتری دارند @aidan_mclau
  • مک‌لاکلین ادعا می‌کند که GPT-5 «بالاتر از روند» (above trend) است و پیش‌بینی می‌کند که بر اساس نرخ‌های پیشرفت فعلی، تا سال ۲۰۲۷، مدل‌هایی قادر به انجام پروژه‌های یک‌ماهه خواهند بود @aidan_mclau
  • ناتان لمبرت اشاره می‌کند که آنتراپیک تنها آزمایشگاه هوش مصنوعی پیشرو است که انتشار مدل با وزن‌های آزاد (open weights) قابل قبولی نداشته است، در حالی که سایر آزمایشگاه‌های بزرگ در حوزه‌ی متن‌باز (open source) نقاط تماس (touchpoints) ایجاد کرده‌اند @natolambert