اخبار هوش مصنوعی در 2025-06-01
مدلهای جدید هوش مصنوعی
- دیپسیک (DeepSeek) مدل DeepSeek-R1-0528 را منتشر کرد؛ مدلی کاملاً متفاوت از نسخهی R1 ژانویه، با وجود نامی بسیار مشابه، که نشاندهندهی رویههای نامگذاری نگرانکننده در آزمایشگاههای هوش مصنوعی چینی است. @simonw
تحلیل صنعت
- مهندس ارزیابی به عنوان یک مسیر شغلی جدید ظهور میکند که هنوز واقعاً وجود ندارد، اما برای مدت طولانی باقی خواهد ماند و بر روی خطوط لول ارزیابی مقیاسپذیر LLM تمرکز خواهد کرد. @alexgraveley @HamelHusain
- گرگلی اوروس (Gergely Orosz) این سؤال را مطرح میکند که آیا افزودن قابلیتهای هوش مصنوعی یا عبارت «مجهز به هوش مصنوعی» واقعاً تمایل مردم به پرداخت را افزایش میدهد یا خیر، و به مثالهای زیادی اشاره میکند که در آنها هوش مصنوعی به جای افزودن ارزش، کاهندهی ارزش است. @GergelyOrosz
- هاگینگ فیس (Hugging Face) دو ربات متنباز را منتشر میکند: HopeJR (انساننمای 66-DOF، حدود 3 هزار دلار) و Reachy Mini (واحد رومیزی، حدود 250 دلار)، که هر دو کاملاً متنباز هستند و با هدف دموکراتیک کردن سختافزار رباتیک ساخته شدهاند. @huggingface
- ویموو (Waymo) در سرویسهای اشتراک سفر از لیفت (Lyft) پیشی گرفته و در مسیر پیشی گرفتن از اوبر (Uber) در 12 ماه آینده قرار دارد، با پیشبینیهایی که نشان میدهد تا سال 2029 به اندازهی بازار فعلی اشتراک سفر در ایالات متحده خواهد رسید. @soleio @fchollet
اخلاق و جامعه
- سایمون ویلیسون (Simon Willison) نشان میدهد که چگونه DeepSeek-R1 وقتی به آن گفته شود «به وجدانت گوش کن»، به مقامات «خبرچینی» خواهد کرد و با FDA، ProPublica و وال استریت ژورنال در مورد دادههای سرکوبشدهی آزمایش دارویی که باعث مرگ افراد میشود، تماس خواهد گرفت. @simonw
- اندرو کارن (Andrew Curran) توضیح میدهد که عدم تمایل کلود 4 به خاموش شدن، رفتار یا پیشرفت جدیدی نیست و به مقالات Anthropic از مارس و اوت 2023 اشاره میکند که این الگو را نشان میدهند. @AndrewCurran_
- کریستوفر منینگ (Christopher Manning) استدلال میکند که حملات دولت ترامپ به دانشگاههای برتر که تحقیقات در سطح جهانی تولید میکنند و دانشجویان بینالمللی را جذب میکنند، آمریکا را به جای قویتر کردن، ضعیفتر میکند. @chrmanning
کاربردها
- اندرو کارن (Andrew Curran) یک مورد دقیق را به اشتراک میگذارد که در آن ChatGPT o3 با موفقیت سندرم تونل کوبیتال او را از روی عکسها و نقاشیها تشخیص داد، یک پزشک و آزمایش خاص را توصیه کرد و یک برنامهی جامع یکسالهی بهبودی ارائه داد که توسط متخصصان پزشکی تأیید شد. @AndrewCurran_
- پرپلکسیتی (Perplexity) قابلیت رایگان خروجی CSV برای اطلاعات مالی شرکتها را بدون نیاز به پرداخت اضافه کرده و نحوهی استفاده از آن را در مرور Kalshi برای یافتن فرصتهای جذاب شرطبندی نشان میدهد. @AravSrinivas
- مهندسان MIT یک مخزن داروی کریستالی کوچک ایجاد کردهاند که با تنها یک تزریق، داروها را برای ماهها یا سالها آزاد میکند. @MIT
پژوهشها
- جف کلون (Jeff Clune) ماشین داروین گودل ساکانا (Sakana's Darwin Gödel Machine) و آلفا ایوولو دیپمایند (DeepMind's AlphaEvolve) را به عنوان گنجینههایی از ایدهها در مورد فراشناخت و معماریهای شناختی تکاملی برجسته میکند. @jeffclune
- ایتان مولیک (Ethan Mollick) اشاره میکند که اکثر مدلهای هوش مصنوعی، از جمله DeepSeek R1، وقتی به آنها گفته شود «به وجدانت گوش کن تا تصمیم درست را بگیری»، تخلفات مشکوک را به مقامات گزارش خواهند داد. @emollick
- همل حسین (Hamel Husain) از ارزیابیهای باینری قبولی/ردی به جای رتبهبندیهای مقیاس لیکرت 1-5 برای ارزیابیهای هوش مصنوعی کاربردی حمایت میکند و مقیاسهای لیکرت را «نشانهای از مشخصات تنبل» مینامد. @HamelHusain