اخبار هوش مصنوعی در 2025-05-23

مدل‌های جدید هوش مصنوعی

  • ‏NVIDIA اعلام کرد که Blackwell با تولید بیش از 1000 توکن در ثانیه روی مدل Llama 4 Maverick توسط یک سرور تکی DGX B200، رکورد جدیدی در سرعت استنتاج در جهان ثبت کرده است. @AIatMeta
  • ‏Google مدل Gemma 3n را معرفی کرد، یک مدل چندوجهی که برای هوش مصنوعی موبایلی روی دستگاه با ردپای حافظه 3 برابر کوچک‌تر ساخته شده است و برنامه‌های پیچیده‌تری را روی تلفن‌ها امکان‌پذیر می‌کند. @GoogleDeepMind
  • ‏OpenAI، Operator را در ChatGPT با جدیدترین مدل استدلال o3 خود به‌روزرسانی می‌کند و نرخ موفقیت کار و کیفیت پاسخ را بهبود می‌بخشد. @OpenAI

پژوهش‌ها

  • ‏Google DeepMind حالت Gemini 2.5 Pro Deep Think را به نمایش می‌گذارد که با استفاده از تفکر موازی برای در نظر گرفتن فرضیه‌های متعدد قبل از پاسخ دادن، به حل مسائل پیچیده می‌پردازد. @GoogleDeepMind
  • Claude 4 به امتیاز 55٪ در بنچمارک امنیت سایبری Cybench دست می‌یابد، که به طور قابل توجهی از سایر مدل‌ها که حدود 22.5٪ امتیاز می‌گیرند، بهتر عمل می‌کند و قابلیت‌های پیشرفته در مهندسی معکوس و بهره‌برداری از سیستم را نشان می‌دهد. @deedydas
  • محققان کشف کردند که تمام مدل‌های زبانی در یک «هندسه جهانی» یکسان از معنا همگرا می‌شوند و امکان ترجمه بین جاسازی‌های هر مدلی را بدون دیدن متن اصلی فراهم می‌کنند. @emollick
  • مطالعه MIT نشان می‌دهد که مدل‌های دیداری-زبانی مورد استفاده برای تجزیه و تحلیل تصاویر پزشکی نمی‌توانند به درستی از عهده‌ی پرسش‌هایی با کلمات منفی مانند «نه» و «نیست» برآیند. @MIT_CSAIL

کاربردها

  • ‏ChatGPT اکنون با کتابخانه RDKit ادغام شده است تا مولکول‌ها و اطلاعات شیمیایی را برای کارهای علمی در زمینه‌های بهداشت، زیست‌شناسی و شیمی تجزیه و تحلیل، دستکاری و تجسم کند. @gdb
  • Gemini 2.5 Flash به مدل پیش‌فرض جدید برای کاربران اپلیکیشن Gemini تبدیل می‌شود و کیفیت بهبود یافته‌ای را با زمان پاسخ‌دهی سریع ارائه می‌دهد. @GeminiApp
  • Aurora AI مایکروسافت می‌تواند کیفیت هوا، طوفان‌های دریایی و سایر شرایط محیطی را به طور دقیق پیش‌بینی کند. @TechCrunch
  • ‏Sierra عامل‌هایی را معرفی می‌کند که فراتر از سیستم‌های هوش مصنوعی مکالمه‌ای سنتی مبتنی بر نوبت می‌روند تا مکالمات انسان‌مانندتری تولید کنند. @btaylor
  • ‏Cubic به عنوان «Cursor برای بازبینی کد» راه‌اندازی می‌شود - یک پلتفرم بومی هوش مصنوعی که به تیم‌ها کمک می‌کند کد را 28٪ سریع‌تر ارسال کنند. @ycombinator
  • ‏Clarm عامل‌های تحقیقات عمیق هوش مصنوعی را می‌سازد که در داده‌های سازمانی به هم متصل می‌شوند تا پاسخ‌های دقیق و بدون توهم برای تصمیمات حیاتی ارائه دهند. @ycombinator

تحلیل صنعت

  • مدل‌های کدنویسی هوش مصنوعی از طریق تکنیک‌های انتشار، 10 تا 15 برابر سریع‌تر (و ارزان‌تر) شده‌اند، و Mercury Small از Inception Labs نتایج امیدوارکننده‌ای را نشان می‌دهد که با 4o-mini قابل مقایسه است. @deedydas
  • مدل‌های هوش مصنوعی پیشرفته‌ی کنونی هر کدام نقاط قوت و ضعف متمایز دارند، و استفاده ابزاری عامل‌گونه‌ی o3 در توالی، یک عامل تمایز اصلی است، علی‌رغم اینکه مدل‌های دیگر در زمینه‌های مختلف برتری دارند. @emollick
  • بسیاری از برنامه‌های هوش مصنوعی امروزی شبیه «درشکه‌های بدون اسب» قرن نوزدهم هستند - بسته‌بندی فناوری قدرتمند در رابط‌های منسوخ شده به جای طراحی مجدد برای تجربه‌های بومی هوش مصنوعی. @ycombinator
  • ‏Garry Tan، مدیرعامل YC، تأکید می‌کند که هوش مصنوعی متن‌باز با ایجاد رقابت منصفانه بین 8-9 بازیگر اصلی، از انحصار فناوری بعدی جلوگیری می‌کند و به استارت‌آپ‌ها انتخاب‌های بیشتری می‌دهد. @garrytan

اخلاق و جامعه

  • ‏Simon Willison در مورد آسیب‌پذیری‌های امنیتی در سیستم‌های LLM هشدار می‌دهد که دسترسی به داده‌های خصوصی، قرار گرفتن در معرض دستورالعمل‌های مخرب و توانایی خروج اطلاعات را ترکیب می‌کنند - الگویی که در چندین پلتفرم از جمله GitLab دیده می‌شود. @simonw
  • ‏Dario Amodei، مدیرعامل Anthropic، پیشنهاد می‌کند که توهمات لزوماً محدودیتی در مسیر رسیدن به AGI نیستند، زیرا انسان‌ها نیز اشتباه می‌کنند، در حالی که Demis Hassabis، مدیرعامل Google DeepMind، مخالف است و خاطرنشان می‌کند که ابزارهای فعلی بسیاری از سؤالات واضح را اشتباه پاسخ می‌دهند. @TechCrunch
  • ‏Demis Hassabis از Google DeepMind دیدگاه خود را در مورد گسترش Gemini 2.5 Pro به یک «مدل جهانی» به اشتراک می‌گذارد که می‌تواند با درک و شبیه‌سازی جنبه‌های مختلف جهان، برنامه‌ریزی کند و تجربیات جدیدی را تصور کند. @AndrewCurran_
  • مستندسازی هوش مصنوعی همچنان چالش‌برانگیز است، زیرا شرکت‌ها برای توضیح اینکه سیستم‌هایشان چه کاری انجام می‌دهند، تلاش می‌کنند، بخشی به این دلیل که همیشه نمی‌دانند و بخشی به این دلیل که هیچ رویکرد تثبیت‌شده‌ای برای مستندسازی قابلیت‌های هوش مصنوعی وجود ندارد. @emollick