اخبار هوش مصنوعی در 2025-09-26
مدلهای جدید هوش مصنوعی
- اوپنایآی GPT-5 Pro را عرضه کرد که در حال تولید ریاضیات جدید و غیربدیهی است و مسائلی را حل میکند که مدلهای قبلی قادر به حلشان نبودند. مارک چن اشاره کرد که این مدل میتواند ماهها کار دانشجویان فیزیکدان و ریاضیدان را خودکارسازی کند @a16z
تحلیل صنعت
- آنتروپیک از رشد چشمگیر درآمد گزارش میدهد؛ از ۸۷ میلیون دلار در آغاز سال ۲۰۲۴ به بیش از ۵ میلیارد دلار (بر اساس نرخ فعلی) در اوت ۲۰۲۵، با ۸۰٪ از استفادهی مصرفکنندگان از Claude که از خارج از ایالات متحده، بهویژه کرهی جنوبی و استرالیا، میآید @AndrewCurran_
- چین شرکتهای بزرگ فناوری خود را از خرید تراشههای اِنویآیدیآیاِی منع میکند؛ این اقدام نشاندهندهی پیشرفت کافی در نیمهرساناهای داخلی برای رهایی از وابستگی به ایالات متحده است. مدل DeepSeek-R1-Safe که روی ۱۰۰۰ تراشهی هوآوی اَسِند آموزش دیده، رویکرد طراحی در سطح سیستم را نشان میدهد @AndrewYNg
- یک توسعهدهنده گزارش میدهد که در جلسهی روزانهی تیم (standup) توکنها را برای حل یک مشکل «هدر داده» است. این مسئله نشان میدهد که چگونه ملاحظات هزینهی هوش مصنوعی در حال تبدیل شدن به بخشی از فرآیند کار روزمرهی توسعه و تصمیمگیری است @GergelyOrosz
- اِیپیآی جستوجوی Perplexity مدعی برتری نسبت به گوگل در موارد استفادهی اِلاِلاِم است و در معیارهای Simple QA/HLE امتیاز بالاتری کسب کرده است؛ زیرا گوگل بهینهسازی را برای رتبهبندی کلیکهای تبلیغات/لینکها انجام میدهد، نه برای کاربردی بودن به عنوان قطعههای جستوجو برای هوش مصنوعی @AravSrinivas
- شایعات حاکی از آن است که اوپنایآی و گوگل بهزودی هر دو مرورگرهای «ذاتی هوش مصنوعی» را عرضه خواهند کرد؛ چراکه داشتن اپلیکیشن اصلی کامپیوتر برای توزیع، دادهها و اتوماسیونهای آسانکاربرد حیاتی است @deedydas
- بر اساس پژوهش مککینزی، پیشبینی میشود تقاضا برای ظرفیت مراکز داده تا سال ۲۰۳۰ بیش از ۳ برابر در سطح جهان افزایش یابد @a16z
اخلاق و جامعه
- مؤسسهی AI Now از بررسی مستقل و بیطرفانهی ادعاهای مربوط به مزایا و خطرات هوش مصنوعی و از یک دستور کار حاکمیت هوش مصنوعی مردممحور در «گفتوگوی جهانی سازمان ملل دربارهی حکمرانی هوش مصنوعی» حمایت میکند @AINowInstitute
- فرانسوا شوله پیشبینی میکند که سال ۲۰۲۶، سالی خواهد بود که شرکتها محصولات خود را به عنوان «عاری از هوش مصنوعی» بازاریابی میکنند؛ این در امتداد روندی است که در سال ۲۰۲۳ برای بازاریابی «مبتنی بر هوش مصنوعی» وجود داشت @fchollet
- گرگلی اوروس از چشمانداز پشت عرضهی محصول Vibes انتقاد میکند و آن را ترویجدهندهی آیندهای «وحشتناک» میداند که در آن مردم به گوشیهای خود چسبیدهاند و محتوای تولیدشده توسط هوش مصنوعی و آغشته به تبلیغات را پیمایش میکنند @GergelyOrosz
- سایمون ویلیسون گزارشی از حملهی کلاسیک استخراج داده از طریق «تزریق پرامپت» علیه Salesforce Agentforce ارائه میدهد که اکنون با اعمال لیستهای سفید URLهای مورد اعتماد از ۸ سپتامبر ۲۰۲۵، رفع شده است @simonw
- MIT Technology Review گزارش میدهد که بازرسان آمریکایی از هوش مصنوعی برای شناسایی تصاویر سوءاستفادهی جنسی از کودکان که توسط هوش مصنوعی ساخته شدهاند، استفاده میکنند @techreview
کاربردها
- اِنویآیدیآیاِی و ParaboleAI به ۱۰۰۰ برابر افزایش سرعت در بهینهسازی صنعتی دست یافتند؛ آنها زمان پردازش را از ۱۰ ساعت به کمتر از ۱ دقیقه کاهش دادند. این کار با استفاده از هوش مصنوعی علّی (causal AI) بر روی NVIDIA GH200 Grace Hopper همراه با Gurobi انجام شد @NVIDIAAI
- Exelon و Deloitte راهحل پهپاد خودکار OptoAI را برای بازرسی داراییهای شبکه ساختند که توسط NVIDIA Jetson و Omniverse پشتیبانی میشود و به ۱۰۰ برابر افزایش کارایی عملیاتی و شناسایی سریعتر نقصها دست یافتند @NVIDIAAI
- Perplexity عامل خرید Comet را عرضه کرد که میتواند درخواستهایی مانند «سه کتاب معرفیشده توسط Druckenmiller را برایم بخر» را مدیریت کرده و خرید را بهطور خودکار انجام دهد @AravSrinivas
- گوگل قابلیتهای عاملگونه در AI Mode را برای یافتن رزرو رستورانها به تمام کاربرانی که در ایالات متحده عضو Labs شدهاند، گسترش میدهد @rmstein
- اِمآیتی یک تراشهی پردازندهی فوتونیک توسعه داده است که یادگیری عمیق را با سرعت نور انجام میدهد و بهطور بالقوه قابلیتهای جدیدی را برای تحلیل داده در زمان واقعی به دستگاههای لبه (edge devices) میبخشد @MIT
پژوهشها
- اوپنایآی بنچمارک GDPVal را منتشر کرد که عملکرد هوش مصنوعی را در کارهایی که مشاغل روزمرهی تمام بخشهای اقتصادی را تشکیل میدهند، اندازهگیری میکند. مدلها در حال نزدیک شدن به برابری با انسان در کارهای سطح تخصصی هستند که بهطور متوسط ۷ ساعت کار میبرند @emollick
- یک مقالهی پژوهشی ناکافی بودن بنچمارکهای عمومی قدیمیتر برای هوش مصنوعی پزشکی را نشان میدهد و ثابت میکند که مدلها بهجای درک واقعی، در حال حفظ کردن پاسخها یا استفاده از روشهای ابتکاری (heuristics) هستند @emollick
- اوپنایآی تأیید میکند که مدلهایش چالشهای برنامهنویسی ICCP را با استفاده از سندباکس اجرای کد، اما بدون دسترسی به اینترنت، حل کردهاند و ابزارهای موجود در طول مسابقه را شفافسازی میکند @simonw
- الکساندر وانگ توضیح میدهد که عدد SweBench Verified به معیارهای عملکرد TTS pass@1 اشاره دارد و این توضیحات را در پاسخ به سؤالاتی دربارهی نتایج بنچمارک ارائه کرده است @alexandr_wang