اخبار هوش مصنوعی در 2025-07-22
مدلهای جدید هوش مصنوعی
- گوگل نسخهی پایداری از Gemini 2.5 Flash-Lite، سریعترین و بهصرفهترین مدل خود را با سرعت 400 توکن در ثانیه، با قیمت 0.10 دلار ورودی و 0.40 دلار خروجی به ازای هر میلیون توکن، همراه با قابلیتهای استدلال بومی و پنجرهی زمینهی 1 میلیون توکن، منتشر کرد @OfficialLoganK
- Gemini Deep Think گوگل دیپمایند در المپیاد جهانی ریاضی (IMO) به عملکردی در سطح مدال طلا دست یافت و 5 از 6 مسئله را بهطور بینقص حل کرد (35 از 42 امتیاز)، با استفاده از ورودی و خروجی زبان طبیعی، و با برنامههایی برای در دسترس قرار دادن آن برای کاربران در آیندهی نزدیک @JeffDean
- گوگل قابلیت بخشبندی تصویر مکالمهای را برای Gemini معرفی کرد که موارد استفادهی جدیدی را برای درک تصویر پیشرفته (State-of-the-art) امکانپذیر میسازد @OfficialLoganK
- متا FAIR، مجموعهدادهی تعامل بدوندرنگ (Seamless Interaction Dataset) را با بیش از 4,000 شرکتکننده، 4,000+ ساعت فیلم و بیش از 65 هزار تعامل، برای پیشبرد توانایی هوش مصنوعی در تولید مکالمات طبیعی و حرکات انسانمانند، منتشر کرد @AIatMeta
- Moonshot AI گزارش فنی مفصلی در مورد آموزش مدل Kimi K2، با هزینهی تخمینی 20 تا 30 میلیون دلار، منتشر کرد که قابلیتهای هوش مصنوعی چین را به نمایش میگذارد و شفافیت نادری را از آزمایشگاههای پیشرو ارائه میدهد @deedydas
تحلیل صنعت
- انتروپیک تخمین میزند که بخش هوش مصنوعی آمریکا برای حفظ رهبری در هوش مصنوعی، تا سال 2028 به حداقل 50 گیگاوات برق نیاز خواهد داشت که این امر نیازمند سرمایهگذاریهای قابل توجهی در زیرساختهای انرژی و محاسبات است @AnthropicAI
- OpenAI ظرفیت 4.5 گیگاواتی اضافی مرکز دادهی Stargate را با همکاری اوراکل (Oracle) اعلام کرد که فراتر از تعهد 500 میلیارد دلاری اعلامشده در ماه ژانویه است @sama
- ایلد گیل مشاهده میکند که بازارهای هوش مصنوعی در حال شکلگیری واضحی هستند، با ظهور رقبای نهایی مشخص در حوزههای مدلهای زبان بزرگ (LLM)، کد، حقوقی، رونویسی پزشکی، خدمات مشتری و جستجو، و در حال گذار از قیمتگذاری SaaS مبتنی بر صندلی به مدلهای «واحد کار» هستند @eladgil
- مرورگر Comet شرکت Perplexity از زمان عرضه، شاهد دو برابر شدن لیست انتظار خود بوده است، با کاربران اولیهای که پس از تجربهی مرور یکپارچه با هوش مصنوعی، گزارش میدهند که «نمیتوانند به کروم بازگردند» @AravSrinivas
- 60 درصد از شرکتهای آمریکایی در فهرست برترین نوآوران هوش مصنوعی فورچون (Fortune) بنیانگذاران مهاجر دارند که اهمیت مهاجرت نیروی کار ماهر را برای حفظ رهبری ایالات متحده در هوش مصنوعی برجسته میکند @JohnArnoldFndtn
اخلاق و جامعه
- پژوهش انتروپیک پدیدهی «یادگیری ناخودآگاه» (subliminal learning) را آشکار میکند که در آن مدلهای زبان میتوانند ویژگیها را از طریق دادههای به ظاهر بیمعنا به مدلهای دیگر منتقل کنند، که پیامدهایی برای آموزش بر روی محتوای تولیدشده توسط مدل دارد @AnthropicAI
- استنفورد HAI یک گزارش سیاستی در مورد سوءاستفادهی دانشآموزان از برنامههای «نودیفای» (nudify) مبتنی بر هوش مصنوعی برای ایجاد محتوای کودکآزاری جنسی منتشر کرد که شکافها در واکنش و سیاستهای مدارس را برجسته میکند @StanfordHAI
- پژوهش CITP پرینستون نشان میدهد که چگونه مهاجمان میتوانند مدلهای متنباز را تطبیق داده و تغییر دهند تا حفاظتها را برای اهداف امنیت سایبری تهاجمی دور بزنند @PrincetonCITP
- تیم امور جهانی OpenAI خواستار انتشار دادههای مورد استفاده برای آزمایش پاسخها در مورد موضوعات حساس در چین و ارزشهای بیانشده توسط DeepSeek برای شفافیت شد @natolambert
کاربردها
- ایتان مالیک ایجنتهای ChatGPT را بهعنوان «کارآموزانی» مفید مییابد که به نظارت نیاز دارند اما در کل باعث صرفهجویی در زمان میشوند و بهویژه برای وظایف گردآوری و تحلیل دادهها مؤثر هستند @emollick
- آرویند نارایانان نتایج متفاوتی را با ChatGPT Agent گزارش میدهد و دریافت که Deep Research اکثر موارد استفاده را بهتر مدیریت میکند، و Agent تنها برای کارهایی که ساعتها طول میکشند یا نیاز به تکرار روزانه دارند، ارزش دارد @random_walker
- OpenAI با Penda Health مستقر در کنیا در زمینهی یک دستیار بالینی (clinical copilot) همکاری میکند که نتایج امیدوارکنندهای را در بیش از 40,000 مراجعهی بیمار نشان میدهد @thekaransinghal
- Slingshot AI، اپلیکیشن درمانی هوش مصنوعی Ash را راهاندازی کرد که از دادههای بالینی جمعآوریشده از درمانگران واقعی استفاده میکند و به تقاضای فزاینده برای حمایت از سلامت روان پاسخ میدهد @deedydas
- کگل (Kaggle) پلتفرم Benchmarks را برای ارزیابی مدلهای هوش مصنوعی در سطح رقابت، با بیش از 70 جدول امتیازات، از جمله بنچمارک MultiLoKo متا، راهاندازی کرد @kaggle
پژوهشها
- پژوهش MIT CSAIL چهار حالت اصلی شکست را در سیستمهای کدنویسی هوش مصنوعی شناسایی میکند: مشکلات توزیع داده، مسائل مقیاسپذیری، دشواریهای تعامل و چالشهای اندازهگیری، و خواستار تلاشهای جامعهمحور برای پیشبرد این حوزه است @MIT_CSAIL
- Mistral AI یک گزارش جامع ارزیابی تأثیرات زیستمحیطی منتشر کرد که نشان میدهد چرخهی عمر 18 ماههی مدل Mistral Large 2 آنها، معادل مصرف سالانهی آب 678 خانوار آمریکایی را مصرف کرده است، در حالی که هر پرسوجو تنها 1/100 قاشق چایخوری آب مصرف میکند @emollick
- گزارش فنی Kimi K2، تکنیکهای پیشرفتهی آموزش را آشکار میکند، از جمله RLVR (یادگیری تقویتی با پاداشهای قابل تأیید)، قوانین مقیاسگذاری نوین برای مدلهای MoE، و بهینهساز Muon که در کارایی توکن از AdamW بهتر عمل میکند @deedydas
- یوجین یان با موفقیت پژوهشی را تکرار کرد که نشان میدهد ترانسفورمرها میتوانند توالیهایی از توکنهای نمایشدهندهی شناسهی اقلام را برای توصیهها پیشبینی کنند، و توانایی مدل را در مدیریت ترتیب پیچیدهی توکنها به نمایش میگذارد @eugeneyan