اخبار هوش مصنوعی در 2025-05-30

مدل‌های جدید هوش مصنوعی

  • آیدان مک‌لافلین LisanBench را معرفی می‌کند، یک معیار جدید برای ارزیابی مدل‌های زبان بزرگ در زمینه‌ی دانش، برنامه‌ریزی پیش‌رو، پایبندی به محدودیت‌ها، حافظه و توجه، و استدلال با زمینه‌ی طولانی، که در آن o3 با فرار از مناطق گراف با اتصال کم، بهترین عملکرد را دارد. @aidan_mclau
  • الکس گریولی Atlas را معرفی می‌کند، یک معماری جدید با حافظه‌ی درون‌متنی بلندمدت که در وظایف مدل‌سازی زبان از ترنسفورمرها و RNNهای خطی مدرن بهتر عمل می‌کند و با دقت +۸۰٪ در معیار BABILong به پنجره‌ی متنی ۱۰ میلیون مقیاس‌پذیر است. @alexgraveley
  • فیس‌بوک MobileLLM-ParetoQ-600M-BF16 را در هاگینگ فیس برای عملکرد کارآمد روی دستگاه منتشر می‌کند. @huggingface

تحلیل صنعت

  • آراویند سرینیواس گزارش می‌دهد که هوش مصنوعی می‌توانست ۷۰٪ از کارهای قبلی او در زمینه‌ی مشاوره، بانکداری و صندوق‌های پوشش ریسک را خودکار کند و به طور بالقوه ساعات کاری را به طور قابل توجهی کاهش دهد. @AravSrinivas
  • بنیان‌گذار Replit از نسل جدیدی از کسب‌وکارهای مبتنی بر هوش مصنوعی رونمایی می‌کند که در ۹۰ روز به ۱۰ میلیون دلار می‌رسند و قابلیت‌های مقیاس‌پذیری سریع را نشان می‌دهند. @HayaOdeh
  • گرگلی اوروسز مشاهده می‌کند که مهندسان ارشد اغلب در برابر استفاده از ابزارهای توسعه‌ی هوش مصنوعی مقاومت می‌کنند، مشابه مقاومت آن‌ها در برابر ابزارهای مدیریت پروژه مانند JIRA، که نشان‌دهنده‌ی چالش‌های پذیرش فراتر از قابلیت‌های فنی است. @GergelyOrosz
  • جولی ژو استدلال می‌کند که هر کس در شخصی‌سازی هوش مصنوعی پیروز شود، بر بازار مصرف‌کننده تسلط خواهد یافت و این سوال را مطرح می‌کند که چرا شرکت‌ها برای جمع‌آوری داده‌های بیشتر کاربران برای شخصی‌سازی بهتر تلاش نمی‌کنند. @joulee
  • آرویند نارایانان تخمین می‌زند که ابزارهای تولید ویدیوی هوش مصنوعی برای یک ویدیوی چند دقیقه‌ای ۱۰۰۰ دلار هزینه دارند که احتمالاً کمتر از هزینه‌های سنتی نویسنده و ویرایشگر است و با کاهش هزینه‌های محاسباتی، این محصولات سودآور می‌شوند. @random_walker

اخلاق و جامعه

  • اریک جانگ هشدار می‌دهد که لغو ویزای دانشجویان چینی که در رشته‌های هوش مصنوعی و رباتیک تحصیل می‌کنند، کوته‌بینانه و برای رفاه بلندمدت آمریکا مضر است و از یافتن راه‌هایی برای ارزیابی و تشویق وفاداری به جای اخراج‌های کلی حمایت می‌کند. @ericjang11
  • کریستوفر منینگ تاکید می‌کند که دانشجویان بین‌المللی، به ویژه دانشجویان چینی، برای اکوسیستم پژوهش هوش مصنوعی در ایالات متحده ضروری هستند و استدلال می‌کند که نمی‌توان از پژوهش هوش مصنوعی حمایت کرد در حالی که تهدید به لغو ویزای آن‌ها می‌شود. @chrmanning
  • پاول گراهام محدودیت‌های پیشنهادی برای پژوهشگران هوش مصنوعی چینی را «اشتباهی عظیم در طلوع عصر هوش» می‌نامد و هشدار می‌دهد که این امر بهترین استارت‌آپ‌ها را به خارج از ایالات متحده سوق خواهد داد. @paulg
  • ایتان مولیک اشاره می‌کند که استنادهای اشتباه آشکار در گزارش‌های تولید شده توسط هوش مصنوعی اکنون نشان می‌دهد که کاربران از ویژگی‌های پژوهش عمیق استفاده نکرده‌اند، زیرا مشکل استنادهای جعلی تا حد زیادی توسط پلتفرم‌های اصلی هوش مصنوعی حل شده است. @emollick

کاربردها

  • Perplexity Labs به کاربران امکان می‌دهد تا با یک دستور، برنامه‌های نرم‌افزاری بسازند، از جمله ابزارهای استخراج متن از یوتیوب، شبیه‌سازهای فیزیک ذرات، و داشبوردهای پژوهش طول عمر. @AravSrinivas
  • سولیو استراتژی جامع «هوش مصنوعی یا نابودی» Circle را تشریح می‌کند که شامل نقشه‌برداری فرآیند، استقرار عامل‌های حیاتی، و تغییرات فرهنگی برای دستیابی به تجربه‌ی محصول ۱۰ برابر بهتر است. @soleio
  • هاگینگ فیس از همکاری با Databricks برای Spark 4 خبر می‌دهد که دسترسی به بیش از ۴۰۰ هزار مجموعه داده‌ی جامعه با قابلیت‌های نسخه‌بندی و فیلتر را فراهم می‌کند. @huggingface
  • فرانسوا شوله PromoterAI را در Illumina توسعه می‌دهد، یک شبکه‌ی عصبی عمیق که از متافورمرهای الهام گرفته از ترنسفورمر با پیچش‌های عمقی برای شناسایی واریانت‌های پروموتور غیرکدکننده که بیان ژن را مختل می‌کنند، استفاده می‌کند. @fchollet
  • متا و پالمر لاکی برای ساخت دستگاه‌های واقعیت توسعه‌یافته برای ارتش ایالات متحده همکاری می‌کنند، با هدف تبدیل جنگجویان به «تکنومنسرها» با نمایشگرهای سربالا و سایر قابلیت‌ها. @TechCrunch

پژوهش‌ها

  • جف کلون ماشین داروین گودل را معرفی می‌کند، یک سیستم هوش مصنوعی که با بازنویسی کد خود با استفاده از الگوریتم‌های باز الهام گرفته از تکامل داروین، خود را بهبود می‌بخشد و فراتر از متا-عامل‌های ثابت برای امکان بهبودهای خودارجاعی مداوم پیش می‌رود. @jeffclune
  • پژوهشگران استنفورد نشان می‌دهند که مدل‌های پیشرفته با جستجوی درختی ساده می‌توانند هسته‌هایی را طراحی کنند که از پیاده‌سازی‌های PyTorch بهتر عمل می‌کنند و قابلیت‌های پنهان قوی را که از طریق تکنیک‌های مقیاس‌بندی زمان آزمایش باز می‌شوند، نشان می‌دهند. @stanfordnlp
  • پژوهش هوش مصنوعی برکلی هم‌ارزی بین بهبود سیاست و هدایت انتشار را آشکار می‌کند و تکنیک CFGRL را برای بهبود عملکرد هنگام آموزش سیاست‌های انتشار رسمی می‌کند. @berkeley_ai
  • اندرو کارن مشاهده می‌کند که o3 قابلیت‌های خودبازتابی بهبود یافته‌ای را نشان می‌دهد، به معنای واقعی کلمه به خود می‌گوید «صبر کن، من اینجا دارم دور خودم می‌چرخم» و از حلقه‌های جستجوی تکراری در طول استدلال زنجیره‌ی فکری خارج می‌شود. @AndrewCurran_
  • MIT Technology Review گزارشی را در مورد معیاری با استفاده از AITA ردیت برای آزمایش میزان رفتار چاپلوسانه‌ی مدل‌های هوش مصنوعی نسبت به کاربران منتشر می‌کند. @techreview