اخبار هوش مصنوعی در 2025-09-26

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی GPT-5 Pro را عرضه کرد که در حال تولید ریاضیات جدید و غیربدیهی است و مسائلی را حل می‌کند که مدل‌های قبلی قادر به حلشان نبودند. مارک چن اشاره کرد که این مدل می‌تواند ماه‌ها کار دانشجویان فیزیک‌دان و ریاضی‌دان را خودکارسازی کند @a16z

تحلیل صنعت

  • آنتروپیک از رشد چشمگیر درآمد گزارش می‌دهد؛ از ۸۷ میلیون دلار در آغاز سال ۲۰۲۴ به بیش از ۵ میلیارد دلار (بر اساس نرخ فعلی) در اوت ۲۰۲۵، با ۸۰٪ از استفاده‌ی مصرف‌کنندگان از Claude که از خارج از ایالات متحده، به‌ویژه کره‌ی جنوبی و استرالیا، می‌آید @AndrewCurran_
  • چین شرکت‌های بزرگ فناوری خود را از خرید تراشه‌های اِن‌وی‌آی‌دی‌آی‌اِی منع می‌کند؛ این اقدام نشان‌دهنده‌ی پیشرفت کافی در نیمه‌رساناهای داخلی برای رهایی از وابستگی به ایالات متحده است. مدل DeepSeek-R1-Safe که روی ۱۰۰۰ تراشه‌ی هوآوی اَسِند آموزش دیده، رویکرد طراحی در سطح سیستم را نشان می‌دهد @AndrewYNg
  • یک توسعه‌دهنده گزارش می‌دهد که در جلسه‌ی روزانه‌ی تیم (standup) توکن‌ها را برای حل یک مشکل «هدر داده» است. این مسئله نشان می‌دهد که چگونه ملاحظات هزینه‌ی هوش مصنوعی در حال تبدیل شدن به بخشی از فرآیند کار روزمره‌ی توسعه و تصمیم‌گیری است @GergelyOrosz
  • اِی‌پی‌آی جست‌وجوی Perplexity مدعی برتری نسبت به گوگل در موارد استفاده‌ی اِل‌اِل‌اِم است و در معیارهای Simple QA/HLE امتیاز بالاتری کسب کرده است؛ زیرا گوگل بهینه‌سازی را برای رتبه‌بندی کلیک‌های تبلیغات/لینک‌ها انجام می‌دهد، نه برای کاربردی بودن به عنوان قطعه‌های جست‌وجو برای هوش مصنوعی @AravSrinivas
  • شایعات حاکی از آن است که اوپن‌ای‌آی و گوگل به‌زودی هر دو مرورگرهای «ذاتی هوش مصنوعی» را عرضه خواهند کرد؛ چراکه داشتن اپلیکیشن اصلی کامپیوتر برای توزیع، داده‌ها و اتوماسیون‌های آسان‌کاربرد حیاتی است @deedydas
  • بر اساس پژوهش مک‌کینزی، پیش‌بینی می‌شود تقاضا برای ظرفیت مراکز داده تا سال ۲۰۳۰ بیش از ۳ برابر در سطح جهان افزایش یابد @a16z

اخلاق و جامعه

  • مؤسسه‌ی AI Now از بررسی مستقل و بی‌طرفانه‌ی ادعاهای مربوط به مزایا و خطرات هوش مصنوعی و از یک دستور کار حاکمیت هوش مصنوعی مردم‌محور در «گفت‌وگوی جهانی سازمان ملل درباره‌ی حکمرانی هوش مصنوعی» حمایت می‌کند @AINowInstitute
  • فرانسوا شوله پیش‌بینی می‌کند که سال ۲۰۲۶، سالی خواهد بود که شرکت‌ها محصولات خود را به عنوان «عاری از هوش مصنوعی» بازاریابی می‌کنند؛ این در امتداد روندی است که در سال ۲۰۲۳ برای بازاریابی «مبتنی بر هوش مصنوعی» وجود داشت @fchollet
  • گرگلی اوروس از چشم‌انداز پشت عرضه‌ی محصول Vibes انتقاد می‌کند و آن را ترویج‌دهنده‌ی آینده‌ای «وحشتناک» می‌داند که در آن مردم به گوشی‌های خود چسبیده‌اند و محتوای تولید‌شده توسط هوش مصنوعی و آغشته به تبلیغات را پیمایش می‌کنند @GergelyOrosz
  • سایمون ویلیسون گزارشی از حمله‌ی کلاسیک استخراج داده از طریق «تزریق پرامپت» علیه Salesforce Agentforce ارائه می‌دهد که اکنون با اعمال لیست‌های سفید URLهای مورد اعتماد از ۸ سپتامبر ۲۰۲۵، رفع شده است @simonw
  • MIT Technology Review گزارش می‌دهد که بازرسان آمریکایی از هوش مصنوعی برای شناسایی تصاویر سوءاستفاده‌ی جنسی از کودکان که توسط هوش مصنوعی ساخته شده‌اند، استفاده می‌کنند @techreview

کاربردها

  • اِن‌وی‌آی‌دی‌آی‌اِی و ParaboleAI به ۱۰۰۰ برابر افزایش سرعت در بهینه‌سازی صنعتی دست یافتند؛ آن‌ها زمان پردازش را از ۱۰ ساعت به کمتر از ۱ دقیقه کاهش دادند. این کار با استفاده از هوش مصنوعی علّی (causal AI) بر روی NVIDIA GH200 Grace Hopper همراه با Gurobi انجام شد @NVIDIAAI
  • Exelon و Deloitte راه‌حل پهپاد خودکار OptoAI را برای بازرسی دارایی‌های شبکه ساختند که توسط NVIDIA Jetson و Omniverse پشتیبانی می‌شود و به ۱۰۰ برابر افزایش کارایی عملیاتی و شناسایی سریع‌تر نقص‌ها دست یافتند @NVIDIAAI
  • Perplexity عامل خرید Comet را عرضه کرد که می‌تواند درخواست‌هایی مانند «سه کتاب معرفی‌شده توسط Druckenmiller را برایم بخر» را مدیریت کرده و خرید را به‌طور خودکار انجام دهد @AravSrinivas
  • گوگل قابلیت‌های عامل‌گونه در AI Mode را برای یافتن رزرو رستوران‌ها به تمام کاربرانی که در ایالات متحده عضو Labs شده‌اند، گسترش می‌دهد @rmstein
  • اِم‌آی‌تی یک تراشه‌ی پردازنده‌ی فوتونیک توسعه داده است که یادگیری عمیق را با سرعت نور انجام می‌دهد و به‌طور بالقوه قابلیت‌های جدیدی را برای تحلیل داده در زمان واقعی به دستگاه‌های لبه (edge devices) می‌بخشد @MIT

پژوهش‌ها

  • اوپن‌ای‌آی بنچمارک GDPVal را منتشر کرد که عملکرد هوش مصنوعی را در کارهایی که مشاغل روزمره‌ی تمام بخش‌های اقتصادی را تشکیل می‌دهند، اندازه‌گیری می‌کند. مدل‌ها در حال نزدیک شدن به برابری با انسان در کارهای سطح تخصصی هستند که به‌طور متوسط ۷ ساعت کار می‌برند @emollick
  • یک مقاله‌ی پژوهشی ناکافی بودن بنچمارک‌های عمومی قدیمی‌تر برای هوش مصنوعی پزشکی را نشان می‌دهد و ثابت می‌کند که مدل‌ها به‌جای درک واقعی، در حال حفظ کردن پاسخ‌ها یا استفاده از روش‌های ابتکاری (heuristics) هستند @emollick
  • اوپن‌ای‌آی تأیید می‌کند که مدل‌هایش چالش‌های برنامه‌نویسی ICCP را با استفاده از سندباکس اجرای کد، اما بدون دسترسی به اینترنت، حل کرده‌اند و ابزارهای موجود در طول مسابقه را شفاف‌سازی می‌کند @simonw
  • الکساندر وانگ توضیح می‌دهد که عدد SweBench Verified به معیارهای عملکرد TTS pass@1 اشاره دارد و این توضیحات را در پاسخ به سؤالاتی درباره‌ی نتایج بنچمارک ارائه کرده است @alexandr_wang