اخبار هوش مصنوعی در 2025-06-10
مدلهای جدید هوش مصنوعی
- اوپنایآی (OpenAI) مدل o3-pro را با بهبودهای قابلتوجه نسبت به o3 معرفی کرد؛ این مدل عملکرد بهتری در علم، آموزش، برنامهنویسی، تحلیل داده و نگارش دارد @OpenAI
- اوپنایآی (OpenAI) قیمت o3 را ۸۰٪ کاهش داد و آن را بهعنوان یک مدل کاربرد روزمره (daily driver) در دسترستر کرد @sama
- میسترال اِیآی (Mistral AI) مدل Magistral، اولین مدل استدلالی خود را منتشر کرد؛ این مدل در دو نسخه موجود است: Magistral Small متنباز با ۲۴ میلیارد پارامتر و Magistral Medium سازمانی @MistralAI
- اپل (Apple) چارچوب Foundation Models را برای دسترسی به مدلهای زبان بزرگ (LLM) محلی و مدلهای جدید هوش مصنوعی روی دستگاه خود معرفی کرد، اگرچه بنچمارکهای عملکردی نشان میدهند که آنها از مدلهای متنباز مانند Gemma 3-4B و Qwen 3-4B عقبتر هستند @emollick
تحلیل صنعت
- طبق گزارشها متا (Meta) در حال سرمایهگذاری ۱۴ میلیارد دلاری در Scale AI با ۴۹٪ سهام است که احتمالاً استعدادهای کلیدی را بهعنوان بخشی از این معامله جذب میکند @AndrewCurran_
- متا (Meta) بستههای پاداش سالانهی بیش از ۲ میلیون دلاری به استعدادهای هوش مصنوعی پیشنهاد میدهد، اما همچنان کاندیداها را به اوپنایآی (OpenAI) و آنتروپیک (Anthropic) واگذار میکند؛ در حالی که آنتروپیک (Anthropic) با حفظ نرخ ۸۰٪ بهعنوان مقصد اصلی پژوهشگران هوش مصنوعی باقی مانده است @deedydas
- Cursor AI از نقطهی عطف درآمد سالانه ۵۰۰ میلیون دلاری (ARR) عبور کرد که نشاندهندهی موفقیت عظیم ابزارهای کدنویسی هوش مصنوعی در بازار توسعهدهندگان است @GergelyOrosz
- لینیر (Linear) ۸۲ میلیون دلار در سری C با ارزشگذاری ۱.۲۵ میلیارد دلار جذب سرمایه کرد و خود را بهعنوان ابزار تخصصیای (purpose-built) معرفی میکند که در آن تیمها، هوش مصنوعی و عاملها (agents) با هم نرمافزار میسازند @karrisaarinen
- استارتاپ هوش مصنوعی سازمانی Glean به ارزشگذاری ۷.۲ میلیارد دلاری دست یافت که نشاندهندهی تداوم علاقهی سرمایهگذاران به راهحلهای سازمانی هوش مصنوعی است @TechCrunch
- گوگل (Google) در حال افزایش قیمت Google Workspace است و علت آن را ارزشافزودههای هوش مصنوعی ذکر میکند، این در حالی است که کاربران کاربرد محدودی در ویژگیهایی مانند یکپارچهسازی Gemini پیدا کردهاند @GergelyOrosz
اخلاق و جامعه
- مؤسسهی AI Now (AI Now Institute) تاکید میکند که مقاومت در برابر مسیر فعلی هوش مصنوعی شرکتهای بزرگ فناوری (Big Tech AI) برای هر پروژهی رهاییبخش که بر پایهی عدالت و خودتعیینگری دموکراتیک استوار باشد، ضروری است @AINowInstitute
- اتان مولیک (Ethan Mollick) هشدار میدهد که مردم به دنبال دلایلی برای رد کردن قابلیتهای هوش مصنوعی هستند و به الگویی اشاره میکند که مقالات با عنوان «هوش مصنوعی باید شکست بخورد» توجه نامتناسبی دریافت میکنند، در حالی که پژوهشهایی با عنوان «هوش مصنوعی این کار را خوب انجام میدهد» نادیده گرفته میشوند @emollick
- نگرانیهایی دربارهی عملکرد Grok شرکت xAI بهعنوان داور حقیقت در پلتفرمهای رسانهی اجتماعی مطرح شده است، همراه با درخواستهایی برای شفافیت در مورد نرخ دقت و اثربخشی آن @emollick
- طبق گزارشها پنتاگون در حال منحل کردن تیمی است که مسئول آزمایش هوش مصنوعی و سامانههای تسلیحاتی بود، که نگرانیهایی را دربارهی نظارت بر ایمنی هوش مصنوعی در کاربردهای نظامی ایجاد میکند @techreview
کاربردها
- شرکت 1X AI مدل Redwood را رونمایی کرد، یک مدل بینایی-زبان-عمل (Vision-Language-Action) با ۱۶۰ میلیون پارامتر که قادر به انجام وظایف دستکاری متحرک سرتاسری (end-to-end mobile manipulation) از جمله بازیابی اشیاء، باز کردن درها و مسیریابی در خانه است @ericjang11
- پرپلکسیتی (Perplexity) ویژگی Memory را معرفی کرده و دستیار صوتی iOS خود را بهروزرسانی کرده است؛ پشتیبانی از مدل o3 اکنون برای کاربران Pro در دسترس است @AravSrinivas
- کلود کد (Claude Code) با یکپارچهسازی عمیقتر در VS Code و JetBrains IDE راهاندازی شد، که به کلود اجازه میدهد فایلهای باز، تشخیصهای LSP و متن هایلایتشده را ببیند @_catwu
- ویندسرف (Windsurf) حالت برنامهریزی (Planning mode) را برای کدنویسی هوش مصنوعی معرفی کرد؛ این حالت از مدلهای استدلالی بزرگتر برای تکرار بر روی برنامههای بلندمدت استفاده میکند، در حالی که مدلهای انتخابشده اقدامات کوتاهمدت را انجام میدهند @windsurf_ai
- یوتوری (Yutori) ابزار Scouts را راهاندازی کرد؛ این عاملهای هوش مصنوعی بهطور مداوم وب را برای اطلاعات خاص پایش میکنند و هشدارهای خودکار ارائه میدهند که بهعنوان نسخهای پیشرفته از Google Alerts عمل میکنند @abhshkdz
- xAI با Polymarket شریک شد تا پیشبینیهای بازار را با دادههای X و تحلیل گروک (Grok) برای قابلیتهای پیشبینی پیشرفتهتر ترکیب کند @xai
- گوگل اِیآی (Google AI) سیستم پیشبینی سیلاب را توسعه داد که با استفاده از هوش مصنوعی روابط بین بارش و جریان آب را درک میکند و امکان پیشبینیهای جهانی سیلاب را برای ساخت جوامع تابآور فراهم میکند @GoogleAI
پژوهشها
- o3-pro به عملکرد ۵۹ درصدی در بنچمارک ARC-AGI-1 با تلاش استدلالی بالا دست یافت و قیمت جدیدی را در مرز دانش (frontier pricing) با ۴.۱۶ دلار برای هر تسک تعیین کرد، در حالی که با ARC-AGI-2 با نرخ موفقیت کمتر از ۵٪ دستوپنجه نرم میکند @arcprize
- پژوهشها در مورد RLHF مشکلات بالقوهای را در بهینهسازی ترجیحات آشکار میکنند و نشان میدهند که ممکن است برای یک «کاربر افسانهای» بهینهسازی کند که در واقعیت هیچ کس را نمایندگی نمیکند @berkeley_ai
- پژوهشگران استنفورد (Stanford) رویکردی را برای مدلهای زبان بزرگ (LLM) با زمینهی طولانی (long-context) توسعه دادند که با استفاده از «خودآموزی» برای فشردهسازی حافظهی KV-cache، منجر به ۳۹ برابر مصرف حافظهی کمتر و ۲۶ برابر توان عملیاتی (throughput) اوج بالاتر شد، در حالی که کیفیت یادگیری درونمتن (in-context learning) را حفظ میکند @stanfordnlp
- پژوهشگران هوش مصنوعی برکلی (Berkeley AI Research) بهینهساز SPlus را معرفی کردند که با ۴۴٪ مراحل آموزشی، عملکرد آدام (Adam) را در اهداف مختلف مطابقت میدهد @berkeley_ai
- پژوهشگران Stanford HAI از هوش مصنوعی برای تحلیل اسکن مغز دانشآموزانی که مسائل ریاضی را حل میکنند، استفاده کردند و اولین بینشها را در مورد علوم اعصاب ناتوانیهای ریاضی ارائه دادند @StanfordHAI
- پژوهش نشان میدهد که مدلهای استدلالی بهطور مداوم با همان هدف آموزشی، «ایمنتر» یا «محتاطتر» به نظر میرسند که احتمالاً به دلیل مدلسازی پاداش مقیاسبندیشده در زمان استنتاج (inference-time scaled reward modeling) است @natolambert