اخبار هوش مصنوعی در 2025-06-06

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Gov را معرفی می‌کند؛ این مدل‌های سفارشی برای مشتریان امنیت ملی ایالات متحده ساخته شده‌اند و قبلاً توسط آژانس‌ها در بالاترین سطح امنیت ملی ایالات متحده با دسترسی محدود به محیط‌های طبقه‌بندی‌شده مستقر شده‌اند @AnthropicAI
گوگل به‌روزرسانی Gemini 2.5 Pro را با عملکرد پیشرفته در مدیریت بافت طولانی (long context) منتشر می‌کند، که به‌ویژه در بازیابی تعداد بالای آیتم‌ها توانمند است @OfficialLoganK
مدل تولید ویدیوی Veo 3 گوگل اکنون در هر دو پلتفرم Replicate و FAL در دسترس است @AndrewCurran_

تحلیل صنعت

Cursor با جذب ۹۰۰ میلیون دلار سرمایه‌گذاری سری C، به بیش از ۵۰۰ میلیون دلار ARR رسیده و توسط بیش از نیمی از شرکت‌های Fortune 500، از جمله NVIDIA، Uber و Adobe استفاده می‌شود @cursor_ai
مشخص شد که شرکت Uber، شرکتی است که مهندسانش Cursor را به GitHub Copilot ترجیح می‌دهند، و این امر منجر به صدور مجوز در سطح شرکت برای تمامی توسعه‌دهندگان شده است @GergelyOrosz
استارتاپ‌های هوش مصنوعی در مقایسه با شرکت‌های نرم‌افزاری پیش از دوران هوش مصنوعی، رشد درآمدی به‌طور قابل توجهی سریع‌تری را نشان می‌دهند، و معیارهای جدیدی برای عملکرد شرکت‌های هوش مصنوعی در حال ظهور هستند @omooretweets
مهندسان استقرار (forward deployed engineers) در حال تبدیل شدن به داغ‌ترین شغل در استارتاپ‌ها هستند که نشان‌دهنده‌ی تغییری به سمت رشد مبتنی بر خدمات در عصر هوش مصنوعی است @a16z
موقعیت بازار Waymo در سان‌فرانسیسکو به ۲ تا ۳ برابر زمان انتظار و هزینه‌ی Uber رسیده است، که نشان‌دهنده‌ی تمایل بیشتر مردم برای پرداخت هزینه برای وسایل نقلیه‌ی خودران است @natolambert
نرم‌افزار در حال تبدیل شدن به سومین هزینه‌ی بزرگ مصرف‌کنندگان پس از غذا و اجاره است، در حالی که هوش مصنوعی باعث افزایش هزینه‌کرد مصرف‌کنندگان در محصولات نرم‌افزاری می‌شود @a16z

اخلاق و جامعه

OpenAI با درخواست دادگاه نیویورک تایمز برای جلوگیری از حذف چت‌های کاربران مخالفت می‌کند، با این استدلال که این کار سابقه‌ی بدی ایجاد کرده و حریم خصوصی کاربران را به خطر می‌اندازد؛ در همین حال، سم آلتمن نیاز به «امتیاز هوش مصنوعی» (AI privilege) مشابه محرمانگی وکیل-موکل را مطرح کرده است @sama
سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت (prompt injection) در سرور GitHub MCP هشدار می‌دهد؛ جایی که مهاجمان می‌توانند عوامل هوش مصنوعی را با دستورالعمل‌های مخرب فریب دهند تا داده‌های خصوصی را سرقت کنند @julien_c
کمتر از ۱۰٪ از بینندگان یوتیوب که بر هوش مصنوعی تمرکز دارند، زن هستند، که نشان‌دهنده‌ی شکاف جنسیتی در پذیرش و آموزش هوش مصنوعی است @clairevo

کاربردها

مدل‌های زبان بزرگ (LLM) فعلی می‌توانند بهبودهای قابل توجهی در دقت تصمیم‌گیری‌های انکولوژی بالینی به دست آورند، هنگامی که به ابزارهای پزشکی دسترسی داده می‌شوند؛ به‌طوری که GPT-4 از ۳۰٪ به ۸۷٪ دقت رسیده است @emollick
Perplexity قابلیت ارسال اخبار روزانه را به واتس‌اپ اضافه کرده و ویژگی‌های تحلیل مالی را به صفحات مالی خود می‌افزاید @AravSrinivas
مایکروسافت Copilot قابلیت‌های جستجوی بصری را با تصاویر واقعی، ویدیوها و کارت‌ها معرفی می‌کند تا جستجو را هوشمندتر سازد @Copilot
Hugging Face با Google Colab برای اضافه کردن پشتیبانی «Open in Colab» برای تمامی مدل‌های موجود در Hugging Face Hub همکاری می‌کند و این کار آزمایش مدل‌های هوش مصنوعی را دسترس‌پذیرتر می‌سازد @GoogleColab
Opportunity International از چت‌بات Ulangizi AI برای کمک به کشاورزان خرد در آفریقا استفاده می‌کند تا شیوه‌های کشاورزی خود را با استفاده از خدمات مالی و آموزش بهبود بخشند @Microsoft

پژوهش‌ها

MIT CSAIL و شرکایش Boltz-2 را منتشر می‌کنند، که اولین مدل هوش مصنوعی است که به عملکرد شبیه‌سازی FEP برای پیش‌بینی تمایل اتصال پروتئین‌ها نزدیک می‌شود، در حالی که بیش از ۱۰۰۰ برابر سریع‌تر است و تحت مجوز MIT به صورت متن‌باز منتشر شده است @MIT_CSAIL
فرانسوا شوله ARC-AGI-2 را به عنوان ابزاری بهتر برای اندازه‌گیری پیشرفت قابلیت‌های AGI (هوش عمومی مصنوعی) در سطح جهشی اعلام می‌کند، در حالی که ARC-AGI-1 همچنان برای مقایسه‌ی سیستم‌های هوش مصنوعی و اندازه‌گیری کارایی بهتر است @fchollet
EleutherAI مجموعه‌داده‌ی Common Pile v0.1 را منتشر می‌کند، یک مجموعه‌داده‌ی ۸ ترابایتی از متن‌های دارای مجوز آزاد و مالکیت عمومی، که مدل‌های ۷ میلیاردی آموزش‌دیده بر روی این داده، عملکردی مشابه مدل‌های مشابهی مانند LLaMA 1 و ۲ را از خود نشان می‌دهند @AiEleuther
Hugging Face مجموعه‌ی ارزیابی جامع ScreenSuite را برای عوامل رابط کاربری گرافیکی (GUI Agents) منتشر می‌کند که شامل ارزیابی صرفاً بصری، محیط‌های اوبونتو و اندروید، و پوشش موبایل، دسکتاپ و وب است @amir_mahla
پژوهش‌ها نشان می‌دهند که مدل‌های تخصصی ۱۴ میلیاردی که با آموزش سبک‌تر توسعه یافته‌اند، می‌توانند به‌طور منظم از o3 برای پشتیبانی از عوامل واقعی پیشی بگیرند، که دستاوردهای حاصل از تخصص‌گرایی را برجسته می‌کند @corbtt
دیدگاه کنونی نشان می‌دهد که کار پژوهش‌های عمیق و عامل Codex از طریق آموزش مدل‌ها بر روی وظایف RL با افق کوتاه و پایداری عمومی انجام می‌شود، در حالی که آموزش end-to-end بر روی وظایف RL بسیار پراکنده، هنوز دور از دسترس است @natolambert
MIT یک تکنیک انیمیشن متحول‌کننده توسعه می‌دهد که حرکت نرم و له‌شونده را با فیزیک در سطح پیکسار و به‌صورت بلادرنگ شبیه‌سازی می‌کند، و پتانسیل ایجاد انقلاب در انیمیشن، بازی‌سازی و رباتیک را دارد @MIT