اخبار هوش مصنوعی در 2025-05-24
مدلهای جدید هوش مصنوعی
- مدل تولید ویدیوی Veo 3 گوگل اکنون در 71 کشور جدید در دسترس است، مشترکین Pro یک بستهی آزمایشی دریافت میکنند و مشترکین Ultra محدودیتهای تولید بیشتری دریافت میکنند @GoogleAI @JeffDean @sundarpichai @demishassabis
پژوهشها
- Berkeley AI Research مقالهای در مورد شبیهسازی کارآمد phylodynamics برای جمعیتهایی با میلیاردها نفر منتشر کرد، که در تکامل ویروسی و ژنومیک سرطان کاربرد دارد @berkeley_ai
- ناتان لمبرت پیشنهاد میکند که مقالات RLVR (Reinforcement Learning from Value/Reward) بیشتر بهبودهای قالببندی را نشان میدهند تا مهارتهای جدید، زیرا تخصیص محاسباتی کافی نیست، و تخمین میزند که o3 نزدیک به 5٪ از کل محاسبات برای RL استفاده میکند @natolambert
کاربردها
- از o3 برای یافتن یک آسیبپذیری امنیتی در هسته لینوکس استفاده شد، که قابلیتهای پیشرفته در تجزیه و تحلیل کد را نشان میدهد @gdb @aidan_mclau
- گرگ براکمن از قابلیت «پرسش» Codex's برای درک استفاده از تنظیمات در کل پایگاه کد استفاده کرد، و ارزش خواندن کد با هوش مصنوعی را برجسته کرد @gdb
- Replit مستندات خود را به طور کامل با ویژگیهای جدید از جمله پشتیبانی از LLM، چت هوش مصنوعی و قابلیتهای جستجو بازنویسی کرده است @amasad
- مایکروسافت در حال ساخت یک عامل هوش مصنوعی برای کاهش اولیه هشدارهای آنکال است، و تلاش میکند تا یک مشکل دردناک برای توسعهدهندگان را حل کند @GergelyOrosz
- Code Four در حال ساخت یک دستیار هوش مصنوعی برای اجرای قانون است که به طور خودکار گزارشها را تولید میکند، روایتها را تأیید میکند و شواهد را آشکار میکند، و زمان کار دفتری را 60٪ کاهش میدهد @ycombinator
- The LLM Data Company ابزاری را برای نوشتن، نسخهبندی و اجرای ارزیابیها برای مدلها و عاملها راهاندازی کرده است، که به اندازهگیری عملکرد و تعریف پاداش برای یادگیری تقویتی کمک میکند @ycombinator
- Aegis به ارائهدهندگان مراقبتهای بهداشتی کمک میکند تا به طور خودکار با استفاده از هوش مصنوعی درخواست تجدیدنظر برای ادعاهای بیمه رد شده را ارائه دهند @ycombinator
- Kirana AI در حال ساخت یک مدیر کامل برای فروشگاههای مواد غذایی است که وظایف پشتیبانی را انجام میدهد و با سیستمهای دوربین برای تشخیص سرقت و مدیریت موجودی ادغام میشود @ycombinator
- Galen AI به عنوان یک دستیار مراقبتهای بهداشتی 24/7 با استفاده از دادههای بالینی و پوشیدنی عمل میکند @ycombinator
تحلیل صنعت
- گری تان این سوال را مطرح میکند که چرا پیشرفت هوش مصنوعی در چندین آزمایشگاه پیشرو (xAI، OpenAI، Anthropic، Google) با وجود منابع متفاوت، بسیار یکنواخت به نظر میرسد، و پیشنهاد میکند که نیروهای متعادلکننده در حال حاضر نیروهای تورمی را شکست میدهند @garrytan
- یوجین یان پیشنهاد میکند که RAG (Retrieval Augmented Generation) میتواند یک «سیاهچاله» از منابع برای بهبودهای حاشیهای باشد، و بازیابی مبتنی بر embedding به طور بالقوه یک بنبست برای پرسشهای پیچیده است @eugeneyan
- آراویند سرینیواس browser agents را برای وظایف خودمختار آزمایش کرد و معتقد است که عاملهای قابل اعتماد با خودمختاری کامل و حلقههای بازخورد بازگشتی با وجود محدودیتهای فعلی «نزدیک هستند» @AravSrinivas
- اتان مولیک استدلال میکند که شرکتها در مورد agents هیجانزده هستند زیرا فکر میکنند این به آنها اجازه میدهد از وظیفه دشوار ادغام هوش مصنوعی در فرآیندهای کاری صرف نظر کنند، اما ارزش بیشتری از پرداختن مستقیم به این چالش حاصل میشود @emollick
اخلاق و جامعه
- اسکات بلسکی مفهوم «حافظه جمعی» در هوش مصنوعی را بررسی میکند، و پیامدهای به اشتراک گذاشتن حافظه هوش مصنوعی از ما با همکاران و خانواده را زیر سوال میبرد، و نگرانیهایی را در مورد حریم خصوصی، موقعیت و اعتماد در دنیای حافظه هوش مصنوعی مشترک ایجاد میکند @scottbelsky
- هامل حسین بینشهایی را در مورد تجزیه و تحلیل حالت شکست سیستماتیک برای برنامههای LLM به اشتراک میگذارد، و بر اهمیت ردیابیهای متنوع، بررسی دستی و اجازه دادن به دستهها برای ظهور از دادهها به جای تحمیل چارچوبهای از پیش تعیینشده تأکید میکند @HamelHusain
- گری تان به همه توصیه میکند که «وظایف طاقتفرسا» را در کار و زندگی که هوش مصنوعی میتواند انجام دهد، شناسایی کنند، و پیشنهاد میکند که «آلفای عظیمی» در این وجود دارد که اولین متخصص در زمینه خود باشید که به طور موثر از هوش مصنوعی استفاده میکند @garrytan @ycombinator