اخبار هوش مصنوعی در 2025-05-24

مدل‌های جدید هوش مصنوعی

  • مدل تولید ویدیوی ‏Veo 3 گوگل اکنون در 71 کشور جدید در دسترس است، مشترکین Pro یک بسته‌ی آزمایشی دریافت می‌کنند و مشترکین Ultra محدودیت‌های تولید بیشتری دریافت می‌کنند @GoogleAI @JeffDean @sundarpichai @demishassabis

پژوهش‌ها

  • ‏Berkeley AI Research مقاله‌ای در مورد شبیه‌سازی کارآمد ‏phylodynamics برای جمعیت‌هایی با میلیاردها نفر منتشر کرد، که در تکامل ویروسی و ژنومیک سرطان کاربرد دارد @berkeley_ai
  • ناتان لمبرت پیشنهاد می‌کند که مقالات ‏RLVR (Reinforcement Learning from Value/Reward) بیشتر بهبودهای قالب‌بندی را نشان می‌دهند تا مهارت‌های جدید، زیرا تخصیص محاسباتی کافی نیست، و تخمین می‌زند که ‏o3 نزدیک به 5٪ از کل محاسبات برای RL استفاده می‌کند @natolambert

کاربردها

  • از ‏o3 برای یافتن یک آسیب‌پذیری امنیتی در هسته لینوکس استفاده شد، که قابلیت‌های پیشرفته در تجزیه و تحلیل کد را نشان می‌دهد @gdb @aidan_mclau
  • گرگ براکمن از قابلیت «پرسش» ‏Codex's برای درک استفاده از تنظیمات در کل پایگاه کد استفاده کرد، و ارزش خواندن کد با هوش مصنوعی را برجسته کرد @gdb
  • ‏Replit مستندات خود را به طور کامل با ویژگی‌های جدید از جمله پشتیبانی از ‏LLM، چت هوش مصنوعی و قابلیت‌های جستجو بازنویسی کرده است @amasad
  • مایکروسافت در حال ساخت یک عامل هوش مصنوعی برای کاهش اولیه هشدارهای آنکال است، و تلاش می‌کند تا یک مشکل دردناک برای توسعه‌دهندگان را حل کند @GergelyOrosz
  • ‏Code Four در حال ساخت یک دستیار هوش مصنوعی برای اجرای قانون است که به طور خودکار گزارش‌ها را تولید می‌کند، روایت‌ها را تأیید می‌کند و شواهد را آشکار می‌کند، و زمان کار دفتری را 60٪ کاهش می‌دهد @ycombinator
  • ‏The LLM Data Company ابزاری را برای نوشتن، نسخه‌بندی و اجرای ارزیابی‌ها برای مدل‌ها و عامل‌ها راه‌اندازی کرده است، که به اندازه‌گیری عملکرد و تعریف پاداش برای یادگیری تقویتی کمک می‌کند @ycombinator
  • ‏Aegis به ارائه‌دهندگان مراقبت‌های بهداشتی کمک می‌کند تا به طور خودکار با استفاده از هوش مصنوعی درخواست تجدیدنظر برای ادعاهای بیمه رد شده را ارائه دهند @ycombinator
  • ‏Kirana AI در حال ساخت یک مدیر کامل برای فروشگاه‌های مواد غذایی است که وظایف پشتیبانی را انجام می‌دهد و با سیستم‌های دوربین برای تشخیص سرقت و مدیریت موجودی ادغام می‌شود @ycombinator
  • ‏Galen AI به عنوان یک دستیار مراقبت‌های بهداشتی 24/7 با استفاده از داده‌های بالینی و پوشیدنی عمل می‌کند @ycombinator

تحلیل صنعت

  • گری تان این سوال را مطرح می‌کند که چرا پیشرفت هوش مصنوعی در چندین آزمایشگاه پیشرو (xAI، OpenAI، Anthropic، Google) با وجود منابع متفاوت، بسیار یکنواخت به نظر می‌رسد، و پیشنهاد می‌کند که نیروهای متعادل‌کننده در حال حاضر نیروهای تورمی را شکست می‌دهند @garrytan
  • یوجین یان پیشنهاد می‌کند که ‏RAG (Retrieval Augmented Generation) می‌تواند یک «سیاهچاله» از منابع برای بهبودهای حاشیه‌ای باشد، و بازیابی مبتنی بر embedding به طور بالقوه یک بن‌بست برای پرسش‌های پیچیده است @eugeneyan
  • آراویند سرینیواس ‏browser agents را برای وظایف خودمختار آزمایش کرد و معتقد است که عامل‌های قابل اعتماد با خودمختاری کامل و حلقه‌های بازخورد بازگشتی با وجود محدودیت‌های فعلی «نزدیک هستند» @AravSrinivas
  • اتان مولیک استدلال می‌کند که شرکت‌ها در مورد ‏agents هیجان‌زده هستند زیرا فکر می‌کنند این به آن‌ها اجازه می‌دهد از وظیفه دشوار ادغام هوش مصنوعی در فرآیندهای کاری صرف نظر کنند، اما ارزش بیشتری از پرداختن مستقیم به این چالش حاصل می‌شود @emollick

اخلاق و جامعه

  • اسکات بلسکی مفهوم «حافظه جمعی» در هوش مصنوعی را بررسی می‌کند، و پیامدهای به اشتراک گذاشتن حافظه هوش مصنوعی از ما با همکاران و خانواده را زیر سوال می‌برد، و نگرانی‌هایی را در مورد حریم خصوصی، موقعیت و اعتماد در دنیای حافظه هوش مصنوعی مشترک ایجاد می‌کند @scottbelsky
  • هامل حسین بینش‌هایی را در مورد تجزیه و تحلیل حالت شکست سیستماتیک برای برنامه‌های ‏LLM به اشتراک می‌گذارد، و بر اهمیت ردیابی‌های متنوع، بررسی دستی و اجازه دادن به دسته‌ها برای ظهور از داده‌ها به جای تحمیل چارچوب‌های از پیش تعیین‌شده تأکید می‌کند @HamelHusain
  • گری تان به همه توصیه می‌کند که «وظایف طاقت‌فرسا» را در کار و زندگی که هوش مصنوعی می‌تواند انجام دهد، شناسایی کنند، و پیشنهاد می‌کند که «آلفای عظیمی» در این وجود دارد که اولین متخصص در زمینه خود باشید که به طور موثر از هوش مصنوعی استفاده می‌کند @garrytan @ycombinator