اخبار هوش مصنوعی در 2025-08-01
مدلهای جدید هوش مصنوعی
- گوگل Gemini 2.5 Deep Think را برای مشترکین Ultra عرضه کرد؛ این مدل نسخهای تغییر یافته از مدلی است که در المپیاد جهانی ریاضی به عملکرد مدال طلا دست یافته بود و از قابلیتهای تفکر موازی و تکنیکهای یادگیری تقویتی بهره میبرد @GoogleDeepMind
- انتروپیک قابلیتهای Claude artifacts را با قابلیتهای جدیدی برای بارگذاری فایلهای PDF، تصاویر و کد در برنامههای کاربردی مبتنی بر هوش مصنوعی بهبود بخشید. این قابلیتها اکنون برای تمام طرحها، از جمله Team و Enterprise، در دسترس هستند @AnthropicAI
- گوگل «حالت هوش مصنوعی» (AI Mode) را برای جستجو در بریتانیا راهاندازی کرد؛ این حالت با گسترش قابلیتهای AI Overviews و با پشتیبانی Gemini 2.5، از استدلال پیشرفته و قابلیتهای چندوجهی بهره میبرد @demishassabis
تحلیل صنعت
- اوپنایآی ۸.۳ میلیارد دلار سرمایه با ارزشگذاری ۳۰۰ میلیارد دلاری جذب کرد؛ درآمد سالانهی تکرارشونده (ARR) این شرکت به ۱۳ میلیارد دلار و تعداد کاربران تجاری آن به پنج میلیون نفر رسیده است، و پیشبینی میشود تا پایان سال از ۲۰ میلیارد دلار فراتر رود @AndrewCurran_
- توسعهی زیرساختهای هوش مصنوعی بیش از کل هزینههای مصرفکنندگان در ۶ ماه گذشته به رشد اقتصادی ایالات متحده کمک کرده است، در حالی که «هفت شرکت بزرگ» (magnificent 7) تنها در سه ماه بیش از ۱۰۰ میلیارد دلار برای مراکز داده هزینه کردهاند @mims
- گیتهاب کوپایلوت به بیش از ۲۰ میلیون کاربر رسید؛ این آمار نشاندهندهی نرخ پذیرش نزدیک به ۱۰۰ درصدی در میان توسعهدهندگان حرفهای است یا گسترش قابل توجهی در جامعهی توسعهدهندگان فراتر از تخمینهای سنتی را نشان میدهد @GergelyOrosz
- فیگما در اولین روز معاملاتی خود با ارزشگذاری ۴۷ میلیارد دلاری سهامی عام شد، که نشان میدهد چگونه جلوگیری کمیسیون تجارت فدرال (FTC) از خرید ۲۰ میلیارد دلاری ادوبی به نتایج بهتر بازار و رقابت منجر شد @GergelyOrosz
اخلاق و جامعه
- انتروپیک پژوهشی با عنوان persona vectors را معرفی کرد، که الگوهای فعالیت عصبی کنترلکنندهی ویژگیهای هوش مصنوعی مانند شیطانی بودن، چاپلوسی یا توهمزایی را آشکار میکند، و روشهایی برای نظارت و هدایت شخصیت مدل ارائه میدهد @AnthropicAI
- پژوهشها نشان میدهد که تهدید یا دادن پاداش به مدلهای هوش مصنوعی، برخلاف ادعاهای رهبران فناوری، هیچ تأثیری بر عملکرد متوسط آنها ندارد، اگرچه تفاوتهایی در سطح سوالات فردی وجود دارد @emollick
- محققان استنفورد در مقالهی جدیدی در نشریهی Science، از سیاستگذاران خواستند رویکردهای مبتنی بر شواهد را در سیاستگذاری هوش مصنوعی اتخاذ کنند و بر نیاز به مقررات دقیق و مبتنی بر پژوهش تأکید کردند @StanfordHAI
کاربردها
- کارولینای شمالی ChatGPT را برای کارمندان دولت پیادهسازی کرد، که برخی وظایف اداری را از ۲۰ دقیقه به ۲۰ ثانیه کاهش میدهد و پتانسیل هوش مصنوعی را در افزایش کارایی دولت نشان میدهد @gdb
- پرپلکسیتی قابلیت میانبر /fact-check را معرفی کرد تا مرور وب را برای کاربران حقیقتجوتر و کارآمدتر کند @AravSrinivas
- محققان امآیتی SmellNet را توسعه دادند، که اولین مجموعهدادهی بزرگ مقیاس از بوهای دنیای واقعی است و گامی اساسی برای وارد کردن ادراک بویایی به سیستمهای هوش مصنوعی محسوب میشود @medialab
پژوهشها
- Gemini 2.5 Deep Think در بنچمارکهای LiveCodeBench V6 و Humanity's Last Exam به عملکردی پیشرفته دست یافت، که قابلیتهای استدلالی برتر را از طریق رویکردهای تفکر موازی نشان میدهد @GoogleDeepMind
- گوگل دیپمایند راهنمای جامع مقیاسپذیری با عنوان «چگونه مدل خود را مقیاسپذیر کنیم» (How to Scale Your Model) منتشر کرد، که مباحث ریاضی، سیستمها و قوانین مقیاسپذیری را برای حجم کاری آموزش و استنتاج مدلهای زبان بزرگ (LLM) پوشش میدهد @deedydas
- شین لگ در تهیهی مقالهی جدیدی در مورد Chain of Thought Monitoring همکاری کرد، که به مفاهیم System Two Safety برای همراستاسازی و نظارت بر هوش مصنوعی مرتبط است @ShaneLegg
- پژوهشها نشان میدهد که مدلهای هوش مصنوعی در بنچمارکینگ میتوانند شکننده باشند؛ آنها در حالی که با معیارهای PASS@10 موفق به نظر میرسند، اغلب در کاربردهای دنیای واقعی با شکست مواجه میشوند @emollick