اخبار هوش مصنوعی در 2025-06-01

مدل‌های جدید هوش مصنوعی

دیپ‌سیک (DeepSeek) مدل DeepSeek-R1-0528 را منتشر کرد؛ مدلی کاملاً متفاوت از نسخه‌ی R1 ژانویه، با وجود نامی بسیار مشابه، که نشان‌دهنده‌ی رویه‌های نام‌گذاری نگران‌کننده در آزمایشگاه‌های هوش مصنوعی چینی است. @simonw

تحلیل صنعت

مهندس ارزیابی به عنوان یک مسیر شغلی جدید ظهور می‌کند که هنوز واقعاً وجود ندارد، اما برای مدت طولانی باقی خواهد ماند و بر روی خطوط لول ارزیابی مقیاس‌پذیر LLM تمرکز خواهد کرد. @alexgraveley @HamelHusain
گرگلی اوروس (Gergely Orosz) این سؤال را مطرح می‌کند که آیا افزودن قابلیت‌های هوش مصنوعی یا عبارت «مجهز به هوش مصنوعی» واقعاً تمایل مردم به پرداخت را افزایش می‌دهد یا خیر، و به مثال‌های زیادی اشاره می‌کند که در آن‌ها هوش مصنوعی به جای افزودن ارزش، کاهنده‌ی ارزش است. @GergelyOrosz
هاگینگ فیس (Hugging Face) دو ربات متن‌باز را منتشر می‌کند: HopeJR (انسان‌نمای 66-DOF، حدود 3 هزار دلار) و Reachy Mini (واحد رومیزی، حدود 250 دلار)، که هر دو کاملاً متن‌باز هستند و با هدف دموکراتیک کردن سخت‌افزار رباتیک ساخته شده‌اند. @huggingface
ویموو (Waymo) در سرویس‌های اشتراک سفر از لیفت (Lyft) پیشی گرفته و در مسیر پیشی گرفتن از اوبر (Uber) در 12 ماه آینده قرار دارد، با پیش‌بینی‌هایی که نشان می‌دهد تا سال 2029 به اندازه‌ی بازار فعلی اشتراک سفر در ایالات متحده خواهد رسید. @soleio @fchollet

اخلاق و جامعه

سایمون ویلیسون (Simon Willison) نشان می‌دهد که چگونه DeepSeek-R1 وقتی به آن گفته شود «به وجدانت گوش کن»، به مقامات «خبرچینی» خواهد کرد و با FDA، ProPublica و وال استریت ژورنال در مورد داده‌های سرکوب‌شده‌ی آزمایش دارویی که باعث مرگ افراد می‌شود، تماس خواهد گرفت. @simonw
اندرو کارن (Andrew Curran) توضیح می‌دهد که عدم تمایل کلود 4 به خاموش شدن، رفتار یا پیشرفت جدیدی نیست و به مقالات Anthropic از مارس و اوت 2023 اشاره می‌کند که این الگو را نشان می‌دهند. @AndrewCurran_
کریستوفر منینگ (Christopher Manning) استدلال می‌کند که حملات دولت ترامپ به دانشگاه‌های برتر که تحقیقات در سطح جهانی تولید می‌کنند و دانشجویان بین‌المللی را جذب می‌کنند، آمریکا را به جای قوی‌تر کردن، ضعیف‌تر می‌کند. @chrmanning

کاربردها

اندرو کارن (Andrew Curran) یک مورد دقیق را به اشتراک می‌گذارد که در آن ChatGPT o3 با موفقیت سندرم تونل کوبیتال او را از روی عکس‌ها و نقاشی‌ها تشخیص داد، یک پزشک و آزمایش خاص را توصیه کرد و یک برنامه‌ی جامع یک‌ساله‌ی بهبودی ارائه داد که توسط متخصصان پزشکی تأیید شد. @AndrewCurran_
پرپلکسیتی (Perplexity) قابلیت رایگان خروجی CSV برای اطلاعات مالی شرکت‌ها را بدون نیاز به پرداخت اضافه کرده و نحوه‌ی استفاده از آن را در مرور Kalshi برای یافتن فرصت‌های جذاب شرط‌بندی نشان می‌دهد. @AravSrinivas
مهندسان MIT یک مخزن داروی کریستالی کوچک ایجاد کرده‌اند که با تنها یک تزریق، داروها را برای ماه‌ها یا سال‌ها آزاد می‌کند. @MIT

پژوهش‌ها

جف کلون (Jeff Clune) ماشین داروین گودل ساکانا (Sakana's Darwin Gödel Machine) و آلفا ایوولو دیپ‌مایند (DeepMind's AlphaEvolve) را به عنوان گنجینه‌هایی از ایده‌ها در مورد فراشناخت و معماری‌های شناختی تکاملی برجسته می‌کند. @jeffclune
ایتان مولیک (Ethan Mollick) اشاره می‌کند که اکثر مدل‌های هوش مصنوعی، از جمله DeepSeek R1، وقتی به آن‌ها گفته شود «به وجدانت گوش کن تا تصمیم درست را بگیری»، تخلفات مشکوک را به مقامات گزارش خواهند داد. @emollick
همل حسین (Hamel Husain) از ارزیابی‌های باینری قبولی/ردی به جای رتبه‌بندی‌های مقیاس لیکرت 1-5 برای ارزیابی‌های هوش مصنوعی کاربردی حمایت می‌کند و مقیاس‌های لیکرت را «نشانه‌ای از مشخصات تنبل» می‌نامد. @HamelHusain