اخبار هوش مصنوعی در 2025-06-06

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Gov را معرفی می‌کند؛ این مدل‌های سفارشی برای مشتریان امنیت ملی ایالات متحده ساخته شده‌اند و قبلاً توسط آژانس‌ها در بالاترین سطح امنیت ملی ایالات متحده با دسترسی محدود به محیط‌های طبقه‌بندی‌شده مستقر شده‌اند @AnthropicAI
  • گوگل به‌روزرسانی Gemini 2.5 Pro را با عملکرد پیشرفته در مدیریت بافت طولانی (long context) منتشر می‌کند، که به‌ویژه در بازیابی تعداد بالای آیتم‌ها توانمند است @OfficialLoganK
  • مدل تولید ویدیوی Veo 3 گوگل اکنون در هر دو پلتفرم Replicate و FAL در دسترس است @AndrewCurran_

تحلیل صنعت

  • Cursor با جذب ۹۰۰ میلیون دلار سرمایه‌گذاری سری C، به بیش از ۵۰۰ میلیون دلار ARR رسیده و توسط بیش از نیمی از شرکت‌های Fortune 500، از جمله NVIDIA، Uber و Adobe استفاده می‌شود @cursor_ai
  • مشخص شد که شرکت Uber، شرکتی است که مهندسانش Cursor را به GitHub Copilot ترجیح می‌دهند، و این امر منجر به صدور مجوز در سطح شرکت برای تمامی توسعه‌دهندگان شده است @GergelyOrosz
  • استارتاپ‌های هوش مصنوعی در مقایسه با شرکت‌های نرم‌افزاری پیش از دوران هوش مصنوعی، رشد درآمدی به‌طور قابل توجهی سریع‌تری را نشان می‌دهند، و معیارهای جدیدی برای عملکرد شرکت‌های هوش مصنوعی در حال ظهور هستند @omooretweets
  • مهندسان استقرار (forward deployed engineers) در حال تبدیل شدن به داغ‌ترین شغل در استارتاپ‌ها هستند که نشان‌دهنده‌ی تغییری به سمت رشد مبتنی بر خدمات در عصر هوش مصنوعی است @a16z
  • موقعیت بازار Waymo در سان‌فرانسیسکو به ۲ تا ۳ برابر زمان انتظار و هزینه‌ی Uber رسیده است، که نشان‌دهنده‌ی تمایل بیشتر مردم برای پرداخت هزینه برای وسایل نقلیه‌ی خودران است @natolambert
  • نرم‌افزار در حال تبدیل شدن به سومین هزینه‌ی بزرگ مصرف‌کنندگان پس از غذا و اجاره است، در حالی که هوش مصنوعی باعث افزایش هزینه‌کرد مصرف‌کنندگان در محصولات نرم‌افزاری می‌شود @a16z

اخلاق و جامعه

  • OpenAI با درخواست دادگاه نیویورک تایمز برای جلوگیری از حذف چت‌های کاربران مخالفت می‌کند، با این استدلال که این کار سابقه‌ی بدی ایجاد کرده و حریم خصوصی کاربران را به خطر می‌اندازد؛ در همین حال، سم آلتمن نیاز به «امتیاز هوش مصنوعی» (AI privilege) مشابه محرمانگی وکیل-موکل را مطرح کرده است @sama
  • سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت (prompt injection) در سرور GitHub MCP هشدار می‌دهد؛ جایی که مهاجمان می‌توانند عوامل هوش مصنوعی را با دستورالعمل‌های مخرب فریب دهند تا داده‌های خصوصی را سرقت کنند @julien_c
  • کمتر از ۱۰٪ از بینندگان یوتیوب که بر هوش مصنوعی تمرکز دارند، زن هستند، که نشان‌دهنده‌ی شکاف جنسیتی در پذیرش و آموزش هوش مصنوعی است @clairevo

کاربردها

  • مدل‌های زبان بزرگ (LLM) فعلی می‌توانند بهبودهای قابل توجهی در دقت تصمیم‌گیری‌های انکولوژی بالینی به دست آورند، هنگامی که به ابزارهای پزشکی دسترسی داده می‌شوند؛ به‌طوری که GPT-4 از ۳۰٪ به ۸۷٪ دقت رسیده است @emollick
  • Perplexity قابلیت ارسال اخبار روزانه را به واتس‌اپ اضافه کرده و ویژگی‌های تحلیل مالی را به صفحات مالی خود می‌افزاید @AravSrinivas
  • مایکروسافت Copilot قابلیت‌های جستجوی بصری را با تصاویر واقعی، ویدیوها و کارت‌ها معرفی می‌کند تا جستجو را هوشمندتر سازد @Copilot
  • Hugging Face با Google Colab برای اضافه کردن پشتیبانی «Open in Colab» برای تمامی مدل‌های موجود در Hugging Face Hub همکاری می‌کند و این کار آزمایش مدل‌های هوش مصنوعی را دسترس‌پذیرتر می‌سازد @GoogleColab
  • Opportunity International از چت‌بات Ulangizi AI برای کمک به کشاورزان خرد در آفریقا استفاده می‌کند تا شیوه‌های کشاورزی خود را با استفاده از خدمات مالی و آموزش بهبود بخشند @Microsoft

پژوهش‌ها

  • MIT CSAIL و شرکایش Boltz-2 را منتشر می‌کنند، که اولین مدل هوش مصنوعی است که به عملکرد شبیه‌سازی FEP برای پیش‌بینی تمایل اتصال پروتئین‌ها نزدیک می‌شود، در حالی که بیش از ۱۰۰۰ برابر سریع‌تر است و تحت مجوز MIT به صورت متن‌باز منتشر شده است @MIT_CSAIL
  • فرانسوا شوله ARC-AGI-2 را به عنوان ابزاری بهتر برای اندازه‌گیری پیشرفت قابلیت‌های AGI (هوش عمومی مصنوعی) در سطح جهشی اعلام می‌کند، در حالی که ARC-AGI-1 همچنان برای مقایسه‌ی سیستم‌های هوش مصنوعی و اندازه‌گیری کارایی بهتر است @fchollet
  • EleutherAI مجموعه‌داده‌ی Common Pile v0.1 را منتشر می‌کند، یک مجموعه‌داده‌ی ۸ ترابایتی از متن‌های دارای مجوز آزاد و مالکیت عمومی، که مدل‌های ۷ میلیاردی آموزش‌دیده بر روی این داده، عملکردی مشابه مدل‌های مشابهی مانند LLaMA 1 و ۲ را از خود نشان می‌دهند @AiEleuther
  • Hugging Face مجموعه‌ی ارزیابی جامع ScreenSuite را برای عوامل رابط کاربری گرافیکی (GUI Agents) منتشر می‌کند که شامل ارزیابی صرفاً بصری، محیط‌های اوبونتو و اندروید، و پوشش موبایل، دسکتاپ و وب است @amir_mahla
  • پژوهش‌ها نشان می‌دهند که مدل‌های تخصصی ۱۴ میلیاردی که با آموزش سبک‌تر توسعه یافته‌اند، می‌توانند به‌طور منظم از o3 برای پشتیبانی از عوامل واقعی پیشی بگیرند، که دستاوردهای حاصل از تخصص‌گرایی را برجسته می‌کند @corbtt
  • دیدگاه کنونی نشان می‌دهد که کار پژوهش‌های عمیق و عامل Codex از طریق آموزش مدل‌ها بر روی وظایف RL با افق کوتاه و پایداری عمومی انجام می‌شود، در حالی که آموزش end-to-end بر روی وظایف RL بسیار پراکنده، هنوز دور از دسترس است @natolambert
  • MIT یک تکنیک انیمیشن متحول‌کننده توسعه می‌دهد که حرکت نرم و له‌شونده را با فیزیک در سطح پیکسار و به‌صورت بلادرنگ شبیه‌سازی می‌کند، و پتانسیل ایجاد انقلاب در انیمیشن، بازی‌سازی و رباتیک را دارد @MIT