اخبار هوش مصنوعی در 2025-06-10

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی (OpenAI) مدل o3-pro را با بهبودهای قابل‌توجه نسبت به o3 معرفی کرد؛ این مدل عملکرد بهتری در علم، آموزش، برنامه‌نویسی، تحلیل داده و نگارش دارد @OpenAI
  • اوپن‌ای‌آی (OpenAI) قیمت o3 را ۸۰٪ کاهش داد و آن را به‌عنوان یک مدل کاربرد روزمره (daily driver) در دسترس‌تر کرد @sama
  • میسترال اِی‌آی (Mistral AI) مدل Magistral، اولین مدل استدلالی خود را منتشر کرد؛ این مدل در دو نسخه موجود است: Magistral Small متن‌باز با ۲۴ میلیارد پارامتر و Magistral Medium سازمانی @MistralAI
  • اپل (Apple) چارچوب Foundation Models را برای دسترسی به مدل‌های زبان بزرگ (LLM) محلی و مدل‌های جدید هوش مصنوعی روی دستگاه خود معرفی کرد، اگرچه بنچمارک‌های عملکردی نشان می‌دهند که آن‌ها از مدل‌های متن‌باز مانند Gemma 3-4B و Qwen 3-4B عقب‌تر هستند @emollick

تحلیل صنعت

  • طبق گزارش‌ها متا (Meta) در حال سرمایه‌گذاری ۱۴ میلیارد دلاری در Scale AI با ۴۹٪ سهام است که احتمالاً استعدادهای کلیدی را به‌عنوان بخشی از این معامله جذب می‌کند @AndrewCurran_
  • متا (Meta) بسته‌های پاداش سالانه‌ی بیش از ۲ میلیون دلاری به استعدادهای هوش مصنوعی پیشنهاد می‌دهد، اما همچنان کاندیداها را به اوپن‌ای‌آی (OpenAI) و آنتروپیک (Anthropic) واگذار می‌کند؛ در حالی که آنتروپیک (Anthropic) با حفظ نرخ ۸۰٪ به‌عنوان مقصد اصلی پژوهشگران هوش مصنوعی باقی مانده است @deedydas
  • Cursor AI از نقطه‌ی عطف درآمد سالانه ۵۰۰ میلیون دلاری (ARR) عبور کرد که نشان‌دهنده‌ی موفقیت عظیم ابزارهای کدنویسی هوش مصنوعی در بازار توسعه‌دهندگان است @GergelyOrosz
  • لینیر (Linear) ۸۲ میلیون دلار در سری C با ارزش‌گذاری ۱.۲۵ میلیارد دلار جذب سرمایه کرد و خود را به‌عنوان ابزار تخصصی‌ای (purpose-built) معرفی می‌کند که در آن تیم‌ها، هوش مصنوعی و عامل‌ها (agents) با هم نرم‌افزار می‌سازند @karrisaarinen
  • استارتاپ هوش مصنوعی سازمانی Glean به ارزش‌گذاری ۷.۲ میلیارد دلاری دست یافت که نشان‌دهنده‌ی تداوم علاقه‌ی سرمایه‌گذاران به راه‌حل‌های سازمانی هوش مصنوعی است @TechCrunch
  • گوگل (Google) در حال افزایش قیمت Google Workspace است و علت آن را ارزش‌افزوده‌های هوش مصنوعی ذکر می‌کند، این در حالی است که کاربران کاربرد محدودی در ویژگی‌هایی مانند یکپارچه‌سازی Gemini پیدا کرده‌اند @GergelyOrosz

اخلاق و جامعه

  • مؤسسه‌ی AI Now (AI Now Institute) تاکید می‌کند که مقاومت در برابر مسیر فعلی هوش مصنوعی شرکت‌های بزرگ فناوری (Big Tech AI) برای هر پروژه‌ی رهایی‌بخش که بر پایه‌ی عدالت و خودتعیین‌گری دموکراتیک استوار باشد، ضروری است @AINowInstitute
  • اتان مولیک (Ethan Mollick) هشدار می‌دهد که مردم به دنبال دلایلی برای رد کردن قابلیت‌های هوش مصنوعی هستند و به الگویی اشاره می‌کند که مقالات با عنوان «هوش مصنوعی باید شکست بخورد» توجه نامتناسبی دریافت می‌کنند، در حالی که پژوهش‌هایی با عنوان «هوش مصنوعی این کار را خوب انجام می‌دهد» نادیده گرفته می‌شوند @emollick
  • نگرانی‌هایی درباره‌ی عملکرد Grok شرکت xAI به‌عنوان داور حقیقت در پلتفرم‌های رسانه‌ی اجتماعی مطرح شده است، همراه با درخواست‌هایی برای شفافیت در مورد نرخ دقت و اثربخشی آن @emollick
  • طبق گزارش‌ها پنتاگون در حال منحل کردن تیمی است که مسئول آزمایش هوش مصنوعی و سامانه‌های تسلیحاتی بود، که نگرانی‌هایی را درباره‌ی نظارت بر ایمنی هوش مصنوعی در کاربردهای نظامی ایجاد می‌کند @techreview

کاربردها

  • شرکت 1X AI مدل Redwood را رونمایی کرد، یک مدل بینایی-زبان-عمل (Vision-Language-Action) با ۱۶۰ میلیون پارامتر که قادر به انجام وظایف دستکاری متحرک سرتاسری (end-to-end mobile manipulation) از جمله بازیابی اشیاء، باز کردن درها و مسیریابی در خانه است @ericjang11
  • پرپلکسیتی (Perplexity) ویژگی Memory را معرفی کرده و دستیار صوتی iOS خود را به‌روزرسانی کرده است؛ پشتیبانی از مدل o3 اکنون برای کاربران Pro در دسترس است @AravSrinivas
  • کلود کد (Claude Code) با یکپارچه‌سازی عمیق‌تر در VS Code و JetBrains IDE راه‌اندازی شد، که به کلود اجازه می‌دهد فایل‌های باز، تشخیص‌های LSP و متن هایلایت‌شده را ببیند @_catwu
  • ویندسرف (Windsurf) حالت برنامه‌ریزی (Planning mode) را برای کدنویسی هوش مصنوعی معرفی کرد؛ این حالت از مدل‌های استدلالی بزرگ‌تر برای تکرار بر روی برنامه‌های بلندمدت استفاده می‌کند، در حالی که مدل‌های انتخاب‌شده اقدامات کوتاه‌مدت را انجام می‌دهند @windsurf_ai
  • یوتوری (Yutori) ابزار Scouts را راه‌اندازی کرد؛ این عامل‌های هوش مصنوعی به‌طور مداوم وب را برای اطلاعات خاص پایش می‌کنند و هشدارهای خودکار ارائه می‌دهند که به‌عنوان نسخه‌ای پیشرفته از Google Alerts عمل می‌کنند @abhshkdz
  • xAI با Polymarket شریک شد تا پیش‌بینی‌های بازار را با داده‌های X و تحلیل گروک (Grok) برای قابلیت‌های پیش‌بینی پیشرفته‌تر ترکیب کند @xai
  • گوگل اِی‌آی (Google AI) سیستم پیش‌بینی سیلاب را توسعه داد که با استفاده از هوش مصنوعی روابط بین بارش و جریان آب را درک می‌کند و امکان پیش‌بینی‌های جهانی سیلاب را برای ساخت جوامع تاب‌آور فراهم می‌کند @GoogleAI

پژوهش‌ها

  • o3-pro به عملکرد ۵۹ درصدی در بنچمارک ARC-AGI-1 با تلاش استدلالی بالا دست یافت و قیمت جدیدی را در مرز دانش (frontier pricing) با ۴.۱۶ دلار برای هر تسک تعیین کرد، در حالی که با ARC-AGI-2 با نرخ موفقیت کمتر از ۵٪ دست‌وپنجه نرم می‌کند @arcprize
  • پژوهش‌ها در مورد RLHF مشکلات بالقوه‌ای را در بهینه‌سازی ترجیحات آشکار می‌کنند و نشان می‌دهند که ممکن است برای یک «کاربر افسانه‌ای» بهینه‌سازی کند که در واقعیت هیچ کس را نمایندگی نمی‌کند @berkeley_ai
  • پژوهشگران استنفورد (Stanford) رویکردی را برای مدل‌های زبان بزرگ (LLM) با زمینه‌ی طولانی (long-context) توسعه دادند که با استفاده از «خودآموزی» برای فشرده‌سازی حافظه‌ی KV-cache، منجر به ۳۹ برابر مصرف حافظه‌ی کمتر و ۲۶ برابر توان عملیاتی (throughput) اوج بالاتر شد، در حالی که کیفیت یادگیری درون‌متن (in-context learning) را حفظ می‌کند @stanfordnlp
  • پژوهش‌گران هوش مصنوعی برکلی (Berkeley AI Research) بهینه‌ساز SPlus را معرفی کردند که با ۴۴٪ مراحل آموزشی، عملکرد آدام (Adam) را در اهداف مختلف مطابقت می‌دهد @berkeley_ai
  • پژوهشگران Stanford HAI از هوش مصنوعی برای تحلیل اسکن مغز دانش‌آموزانی که مسائل ریاضی را حل می‌کنند، استفاده کردند و اولین بینش‌ها را در مورد علوم اعصاب ناتوانی‌های ریاضی ارائه دادند @StanfordHAI
  • پژوهش نشان می‌دهد که مدل‌های استدلالی به‌طور مداوم با همان هدف آموزشی، «ایمن‌تر» یا «محتاط‌تر» به نظر می‌رسند که احتمالاً به دلیل مدل‌سازی پاداش مقیاس‌بندی‌شده در زمان استنتاج (inference-time scaled reward modeling) است @natolambert