اخبار هوش مصنوعی در 2025-05-30
مدلهای جدید هوش مصنوعی
- آیدان مکلافلین LisanBench را معرفی میکند، یک معیار جدید برای ارزیابی مدلهای زبان بزرگ در زمینهی دانش، برنامهریزی پیشرو، پایبندی به محدودیتها، حافظه و توجه، و استدلال با زمینهی طولانی، که در آن o3 با فرار از مناطق گراف با اتصال کم، بهترین عملکرد را دارد. @aidan_mclau
- الکس گریولی Atlas را معرفی میکند، یک معماری جدید با حافظهی درونمتنی بلندمدت که در وظایف مدلسازی زبان از ترنسفورمرها و RNNهای خطی مدرن بهتر عمل میکند و با دقت +۸۰٪ در معیار BABILong به پنجرهی متنی ۱۰ میلیون مقیاسپذیر است. @alexgraveley
- فیسبوک MobileLLM-ParetoQ-600M-BF16 را در هاگینگ فیس برای عملکرد کارآمد روی دستگاه منتشر میکند. @huggingface
تحلیل صنعت
- آراویند سرینیواس گزارش میدهد که هوش مصنوعی میتوانست ۷۰٪ از کارهای قبلی او در زمینهی مشاوره، بانکداری و صندوقهای پوشش ریسک را خودکار کند و به طور بالقوه ساعات کاری را به طور قابل توجهی کاهش دهد. @AravSrinivas
- بنیانگذار Replit از نسل جدیدی از کسبوکارهای مبتنی بر هوش مصنوعی رونمایی میکند که در ۹۰ روز به ۱۰ میلیون دلار میرسند و قابلیتهای مقیاسپذیری سریع را نشان میدهند. @HayaOdeh
- گرگلی اوروسز مشاهده میکند که مهندسان ارشد اغلب در برابر استفاده از ابزارهای توسعهی هوش مصنوعی مقاومت میکنند، مشابه مقاومت آنها در برابر ابزارهای مدیریت پروژه مانند JIRA، که نشاندهندهی چالشهای پذیرش فراتر از قابلیتهای فنی است. @GergelyOrosz
- جولی ژو استدلال میکند که هر کس در شخصیسازی هوش مصنوعی پیروز شود، بر بازار مصرفکننده تسلط خواهد یافت و این سوال را مطرح میکند که چرا شرکتها برای جمعآوری دادههای بیشتر کاربران برای شخصیسازی بهتر تلاش نمیکنند. @joulee
- آرویند نارایانان تخمین میزند که ابزارهای تولید ویدیوی هوش مصنوعی برای یک ویدیوی چند دقیقهای ۱۰۰۰ دلار هزینه دارند که احتمالاً کمتر از هزینههای سنتی نویسنده و ویرایشگر است و با کاهش هزینههای محاسباتی، این محصولات سودآور میشوند. @random_walker
اخلاق و جامعه
- اریک جانگ هشدار میدهد که لغو ویزای دانشجویان چینی که در رشتههای هوش مصنوعی و رباتیک تحصیل میکنند، کوتهبینانه و برای رفاه بلندمدت آمریکا مضر است و از یافتن راههایی برای ارزیابی و تشویق وفاداری به جای اخراجهای کلی حمایت میکند. @ericjang11
- کریستوفر منینگ تاکید میکند که دانشجویان بینالمللی، به ویژه دانشجویان چینی، برای اکوسیستم پژوهش هوش مصنوعی در ایالات متحده ضروری هستند و استدلال میکند که نمیتوان از پژوهش هوش مصنوعی حمایت کرد در حالی که تهدید به لغو ویزای آنها میشود. @chrmanning
- پاول گراهام محدودیتهای پیشنهادی برای پژوهشگران هوش مصنوعی چینی را «اشتباهی عظیم در طلوع عصر هوش» مینامد و هشدار میدهد که این امر بهترین استارتآپها را به خارج از ایالات متحده سوق خواهد داد. @paulg
- ایتان مولیک اشاره میکند که استنادهای اشتباه آشکار در گزارشهای تولید شده توسط هوش مصنوعی اکنون نشان میدهد که کاربران از ویژگیهای پژوهش عمیق استفاده نکردهاند، زیرا مشکل استنادهای جعلی تا حد زیادی توسط پلتفرمهای اصلی هوش مصنوعی حل شده است. @emollick
کاربردها
- Perplexity Labs به کاربران امکان میدهد تا با یک دستور، برنامههای نرمافزاری بسازند، از جمله ابزارهای استخراج متن از یوتیوب، شبیهسازهای فیزیک ذرات، و داشبوردهای پژوهش طول عمر. @AravSrinivas
- سولیو استراتژی جامع «هوش مصنوعی یا نابودی» Circle را تشریح میکند که شامل نقشهبرداری فرآیند، استقرار عاملهای حیاتی، و تغییرات فرهنگی برای دستیابی به تجربهی محصول ۱۰ برابر بهتر است. @soleio
- هاگینگ فیس از همکاری با Databricks برای Spark 4 خبر میدهد که دسترسی به بیش از ۴۰۰ هزار مجموعه دادهی جامعه با قابلیتهای نسخهبندی و فیلتر را فراهم میکند. @huggingface
- فرانسوا شوله PromoterAI را در Illumina توسعه میدهد، یک شبکهی عصبی عمیق که از متافورمرهای الهام گرفته از ترنسفورمر با پیچشهای عمقی برای شناسایی واریانتهای پروموتور غیرکدکننده که بیان ژن را مختل میکنند، استفاده میکند. @fchollet
- متا و پالمر لاکی برای ساخت دستگاههای واقعیت توسعهیافته برای ارتش ایالات متحده همکاری میکنند، با هدف تبدیل جنگجویان به «تکنومنسرها» با نمایشگرهای سربالا و سایر قابلیتها. @TechCrunch
پژوهشها
- جف کلون ماشین داروین گودل را معرفی میکند، یک سیستم هوش مصنوعی که با بازنویسی کد خود با استفاده از الگوریتمهای باز الهام گرفته از تکامل داروین، خود را بهبود میبخشد و فراتر از متا-عاملهای ثابت برای امکان بهبودهای خودارجاعی مداوم پیش میرود. @jeffclune
- پژوهشگران استنفورد نشان میدهند که مدلهای پیشرفته با جستجوی درختی ساده میتوانند هستههایی را طراحی کنند که از پیادهسازیهای PyTorch بهتر عمل میکنند و قابلیتهای پنهان قوی را که از طریق تکنیکهای مقیاسبندی زمان آزمایش باز میشوند، نشان میدهند. @stanfordnlp
- پژوهش هوش مصنوعی برکلی همارزی بین بهبود سیاست و هدایت انتشار را آشکار میکند و تکنیک CFGRL را برای بهبود عملکرد هنگام آموزش سیاستهای انتشار رسمی میکند. @berkeley_ai
- اندرو کارن مشاهده میکند که o3 قابلیتهای خودبازتابی بهبود یافتهای را نشان میدهد، به معنای واقعی کلمه به خود میگوید «صبر کن، من اینجا دارم دور خودم میچرخم» و از حلقههای جستجوی تکراری در طول استدلال زنجیرهی فکری خارج میشود. @AndrewCurran_
- MIT Technology Review گزارشی را در مورد معیاری با استفاده از AITA ردیت برای آزمایش میزان رفتار چاپلوسانهی مدلهای هوش مصنوعی نسبت به کاربران منتشر میکند. @techreview