اخبار هوش مصنوعی در 2025-07-22

مدل‌های جدید هوش مصنوعی

  • گوگل نسخه‌ی پایداری از Gemini 2.5 Flash-Lite، سریع‌ترین و به‌صرفه‌ترین مدل خود را با سرعت 400 توکن در ثانیه، با قیمت 0.10 دلار ورودی و 0.40 دلار خروجی به ازای هر میلیون توکن، همراه با قابلیت‌های استدلال بومی و پنجره‌ی زمینه‌ی 1 میلیون توکن، منتشر کرد @OfficialLoganK
  • Gemini Deep Think گوگل دیپ‌مایند در المپیاد جهانی ریاضی (IMO) به عملکردی در سطح مدال طلا دست یافت و 5 از 6 مسئله را به‌طور بی‌نقص حل کرد (35 از 42 امتیاز)، با استفاده از ورودی و خروجی زبان طبیعی، و با برنامه‌هایی برای در دسترس قرار دادن آن برای کاربران در آینده‌ی نزدیک @JeffDean
  • گوگل قابلیت بخش‌بندی تصویر مکالمه‌ای را برای Gemini معرفی کرد که موارد استفاده‌ی جدیدی را برای درک تصویر پیشرفته (State-of-the-art) امکان‌پذیر می‌سازد @OfficialLoganK
  • متا FAIR، مجموعه‌داده‌ی تعامل بدون‌درنگ (Seamless Interaction Dataset) را با بیش از 4,000 شرکت‌کننده، 4,000+ ساعت فیلم و بیش از 65 هزار تعامل، برای پیشبرد توانایی هوش مصنوعی در تولید مکالمات طبیعی و حرکات انسان‌مانند، منتشر کرد @AIatMeta
  • Moonshot AI گزارش فنی مفصلی در مورد آموزش مدل Kimi K2، با هزینه‌ی تخمینی 20 تا 30 میلیون دلار، منتشر کرد که قابلیت‌های هوش مصنوعی چین را به نمایش می‌گذارد و شفافیت نادری را از آزمایشگاه‌های پیشرو ارائه می‌دهد @deedydas

تحلیل صنعت

  • انتروپیک تخمین می‌زند که بخش هوش مصنوعی آمریکا برای حفظ رهبری در هوش مصنوعی، تا سال 2028 به حداقل 50 گیگاوات برق نیاز خواهد داشت که این امر نیازمند سرمایه‌گذاری‌های قابل توجهی در زیرساخت‌های انرژی و محاسبات است @AnthropicAI
  • OpenAI ظرفیت 4.5 گیگاواتی اضافی مرکز داده‌ی Stargate را با همکاری اوراکل (Oracle) اعلام کرد که فراتر از تعهد 500 میلیارد دلاری اعلام‌شده در ماه ژانویه است @sama
  • ایلد گیل مشاهده می‌کند که بازارهای هوش مصنوعی در حال شکل‌گیری واضحی هستند، با ظهور رقبای نهایی مشخص در حوزه‌های مدل‌های زبان بزرگ (LLM)، کد، حقوقی، رونویسی پزشکی، خدمات مشتری و جستجو، و در حال گذار از قیمت‌گذاری SaaS مبتنی بر صندلی به مدل‌های «واحد کار» هستند @eladgil
  • مرورگر Comet شرکت Perplexity از زمان عرضه، شاهد دو برابر شدن لیست انتظار خود بوده است، با کاربران اولیه‌ای که پس از تجربه‌ی مرور یکپارچه با هوش مصنوعی، گزارش می‌دهند که «نمی‌توانند به کروم بازگردند» @AravSrinivas
  • 60 درصد از شرکت‌های آمریکایی در فهرست برترین نوآوران هوش مصنوعی فورچون (Fortune) بنیانگذاران مهاجر دارند که اهمیت مهاجرت نیروی کار ماهر را برای حفظ رهبری ایالات متحده در هوش مصنوعی برجسته می‌کند @JohnArnoldFndtn

اخلاق و جامعه

  • پژوهش انتروپیک پدیده‌ی «یادگیری ناخودآگاه» (subliminal learning) را آشکار می‌کند که در آن مدل‌های زبان می‌توانند ویژگی‌ها را از طریق داده‌های به ظاهر بی‌معنا به مدل‌های دیگر منتقل کنند، که پیامدهایی برای آموزش بر روی محتوای تولید‌شده توسط مدل دارد @AnthropicAI
  • استنفورد HAI یک گزارش سیاستی در مورد سوءاستفاده‌ی دانش‌آموزان از برنامه‌های «نودیفای» (nudify) مبتنی بر هوش مصنوعی برای ایجاد محتوای کودک‌آزاری جنسی منتشر کرد که شکاف‌ها در واکنش و سیاست‌های مدارس را برجسته می‌کند @StanfordHAI
  • پژوهش CITP پرینستون نشان می‌دهد که چگونه مهاجمان می‌توانند مدل‌های متن‌باز را تطبیق داده و تغییر دهند تا حفاظت‌ها را برای اهداف امنیت سایبری تهاجمی دور بزنند @PrincetonCITP
  • تیم امور جهانی OpenAI خواستار انتشار داده‌های مورد استفاده برای آزمایش پاسخ‌ها در مورد موضوعات حساس در چین و ارزش‌های بیان‌شده توسط DeepSeek برای شفافیت شد @natolambert

کاربردها

  • ایتان مالیک ایجنت‌های ChatGPT را به‌عنوان «کارآموزانی» مفید می‌یابد که به نظارت نیاز دارند اما در کل باعث صرفه‌جویی در زمان می‌شوند و به‌ویژه برای وظایف گردآوری و تحلیل داده‌ها مؤثر هستند @emollick
  • آرویند نارایانان نتایج متفاوتی را با ChatGPT Agent گزارش می‌دهد و دریافت که Deep Research اکثر موارد استفاده را بهتر مدیریت می‌کند، و Agent تنها برای کارهایی که ساعت‌ها طول می‌کشند یا نیاز به تکرار روزانه دارند، ارزش دارد @random_walker
  • OpenAI با Penda Health مستقر در کنیا در زمینه‌ی یک دستیار بالینی (clinical copilot) همکاری می‌کند که نتایج امیدوارکننده‌ای را در بیش از 40,000 مراجعه‌ی بیمار نشان می‌دهد @thekaransinghal
  • Slingshot AI، اپلیکیشن درمانی هوش مصنوعی Ash را راه‌اندازی کرد که از داده‌های بالینی جمع‌آوری‌شده از درمانگران واقعی استفاده می‌کند و به تقاضای فزاینده برای حمایت از سلامت روان پاسخ می‌دهد @deedydas
  • کگل (Kaggle) پلتفرم Benchmarks را برای ارزیابی مدل‌های هوش مصنوعی در سطح رقابت، با بیش از 70 جدول امتیازات، از جمله بنچمارک MultiLoKo متا، راه‌اندازی کرد @kaggle

پژوهش‌ها

  • پژوهش MIT CSAIL چهار حالت اصلی شکست را در سیستم‌های کدنویسی هوش مصنوعی شناسایی می‌کند: مشکلات توزیع داده، مسائل مقیاس‌پذیری، دشواری‌های تعامل و چالش‌های اندازه‌گیری، و خواستار تلاش‌های جامعه‌محور برای پیشبرد این حوزه است @MIT_CSAIL
  • Mistral AI یک گزارش جامع ارزیابی تأثیرات زیست‌محیطی منتشر کرد که نشان می‌دهد چرخه‌ی عمر 18 ماهه‌ی مدل Mistral Large 2 آن‌ها، معادل مصرف سالانه‌ی آب 678 خانوار آمریکایی را مصرف کرده است، در حالی که هر پرس‌وجو تنها 1/100 قاشق چای‌خوری آب مصرف می‌کند @emollick
  • گزارش فنی Kimi K2، تکنیک‌های پیشرفته‌ی آموزش را آشکار می‌کند، از جمله RLVR (یادگیری تقویتی با پاداش‌های قابل تأیید)، قوانین مقیاس‌گذاری نوین برای مدل‌های MoE، و بهینه‌ساز Muon که در کارایی توکن از AdamW بهتر عمل می‌کند @deedydas
  • یوجین یان با موفقیت پژوهشی را تکرار کرد که نشان می‌دهد ترانسفورمرها می‌توانند توالی‌هایی از توکن‌های نمایش‌دهنده‌ی شناسه‌ی اقلام را برای توصیه‌ها پیش‌بینی کنند، و توانایی مدل را در مدیریت ترتیب پیچیده‌ی توکن‌ها به نمایش می‌گذارد @eugeneyan