اخبار هوش مصنوعی در 2025-08-21

مدل‌های جدید هوش مصنوعی

  • DeepSeek-V3.1 استنتاج ترکیبی را با حالت‌های «تفکر» و «غیرتفکر» معرفی می‌کند و قابلیت‌های تفکر سریع‌تر و مهارت‌های عامل قوی‌تر را با پشتیبانی از ۱۲۸ هزار توکن زمینه ارائه می‌دهد @deepseek_ai
  • Cohere مدل پیشرفته‌ی خود با نام Command A Reasoning را برای کارهای استنتاج سازمانی منتشر کرده است که برای استقرار خصوصی با کمتر از ۲ واحد پردازش گرافیکی (GPU) و بودجه‌های توکن تحت کنترل کاربر طراحی شده است @cohere
  • مدل Seed OSS بایت‌دنس با ۳۶ میلیارد پارامتر اکنون در هاگینگ فیس در دسترس است و دارای لایسنس Apache2، قابلیت داخلی ۵۱۲ هزار توکن زمینه طولانی و بودجه‌ی تفکر منعطف است @Xianbao_QIAN
  • گوگل اعلام کرد که Veo 3 برای آزمایش رایگان در برنامه‌ی جیمینای (Gemini App) در دسترس خواهد بود و واحد‌های پردازش تانسور (TPU) برای راه‌اندازی در حال آماده‌سازی هستند @joshwoodward

تحلیل صنعت

  • Anthropic به دلیل تقاضای بالای سرمایه‌گذاران، هدف جمع‌آوری سرمایه‌ی خود را به ۱۰ میلیارد دلار دو برابر کرد که به طور قابل توجهی از مقدار برنامه‌ریزی‌شده‌ی اولیه افزایش یافته است @AndrewCurran_
  • گزارش شده است که متا ممنوعیت استخدام را در آزمایشگاه‌های ابرهوش متا (Meta Superintelligence Labs) اعمال کرده است، در حالی که در حال بازسازی است که واحد هوش مصنوعی را به چهار گروه جدید تقسیم کرده است @TechCrunch
  • پژوهش‌ها نشان می‌دهد که ۹۵ درصد از پروژه‌های آزمایشی هوش مصنوعی (AI pilots) نتوانسته‌اند در عرض شش ماه به تأثیر پایدار بر سود و زیان (P&L) دست یابند، اگرچه پرسش‌های روش‌شناختی در مورد قابلیت تعمیم یافته‌ها از ۵۲ مصاحبه‌ی نمونه‌گیری‌شده‌ی راحت (convenience-sampled) باقی می‌ماند @emollick
  • علی‌رغم ۵۰ درصد پذیرش مدل‌های زبان بزرگ (LLM) در میان کارگران آمریکایی، رشد بهره‌وری نیروی کار پایین‌تر از سطح سال ۲۰۲۰ باقی مانده است و ادعاهای افزایش ۱۰ برابری بهره‌وری از ابزارهای هوش مصنوعی را به چالش می‌کشد @fchollet
  • هوش مصنوعی دقت ۹۲ درصدی را در مقابل ۷۲ درصد برای وکلای باتجربه در وظایف بررسی فاکتور نشان می‌دهد، در حالی که ۵۰ تا ۱۰۰ برابر سریع‌تر و ۹۹.۹۷ درصد ارزان‌تر است که تأثیر هوش مصنوعی بر خدمات حرفه‌ای سنتی را برجسته می‌کند @deedydas
  • گوگل کاهش ۳۳ برابری در ردپای انرژی و ۴۴ برابری در ردپای کربن را برای درخواست‌های متنی برنامه‌ی جیمینای (Gemini App) از مه ۲۰۲۴ تا مه ۲۰۲۵ گزارش کرده است، در حالی که پاسخ‌های با کیفیت‌تر ارائه می‌دهد @JeffDean

اخلاق و جامعه

  • Anthropic با سازمان ملی امنیت هسته‌ای (NNSA) برای توسعه‌ی تدابیر ایمنی تسلیحات هسته‌ای برای هوش مصنوعی همکاری می‌کند و طبقه‌بندی‌کننده‌هایی ایجاد می‌کند که پرسش‌های نگران‌کننده‌ی هسته‌ای را شناسایی می‌کنند، در حالی که کاربردهای آموزشی و پژوهشی مشروع را حفظ می‌کند @AnthropicAI
  • مصطفی سلیمان در مورد هوش مصنوعی که ظاهراً هوشیار به نظر می‌رسد، هشدار می‌دهد و استدلال می‌کند که ارزش هوش مصنوعی از متفاوت بودن آن از انسان‌ها نشئت می‌گیرد، نه از تقلید احساسات انسانی مانند شرم، حسادت یا ترس @mustafasuleyman
  • Anthropic سه دوره‌ی جدید سواد هوش مصنوعی را که با همکاری مربیان ایجاد شده‌اند، راه‌اندازی می‌کند تا به معلمان و دانش‌آموزان در ساخت مهارت‌های هوش مصنوعی عملی و مسئولانه کمک کند؛ این دوره‌ها به صورت رایگان برای هر موسسه‌ای در دسترس است @AnthropicAI

کاربردها

  • گوگل پلتفرم Gemini for Government را راه‌اندازی می‌کند که ابزارهای هوش مصنوعی از جمله NotebookLM و Veo را به آژانس‌های فدرال تقریباً بدون هیچ هزینه‌ای از طریق همکاری با GSA (سازمان خدمات عمومی) ارائه می‌دهد @sundarpichai
  • گوگل قابلیت‌های عاملیت (agentic capabilities) را در حالت هوش مصنوعی برای جستجو معرفی می‌کند و امکان مرور خودکار چندین سایت را برای یافتن رزرو رستوران با موجودی لحظه‌ای و لینک‌های رزرو مستقیم فراهم می‌کند @GoogleAI
  • Cursor با Linear ادغام می‌شود تا عوامل هوش مصنوعی (AI agents) را فعال کند که می‌توانند مستقیماً از مسائل (issues) راه‌اندازی شوند و بر اساس واگذاری وظایف به زبان ساده، شاخه‌ها را ایجاد کرده و پیش‌نویس درخواست‌های پول (PRs) را تهیه کنند @cursor_ai
  • Perplexity قابلیت بررسی سهام هند را با استفاده از جستجوی زبان طبیعی راه‌اندازی می‌کند که در پلتفرم‌های وب و موبایل برای کاربران رایگان و پولی در دسترس است @AravSrinivas
  • Perplexity Comet توانایی خودکار راه‌اندازی فروشگاه‌های Shopify را نشان می‌دهد و قابلیت‌های پیشرفته‌ی اتوماسیون تجارت الکترونیک را به نمایش می‌گذارد @AravSrinivas
  • Runway، Game Worlds Beta را راه‌اندازی می‌کند که امکان ایجاد محیط‌های بازی تعاملی تولید شده توسط هوش مصنوعی را فراهم می‌کند @AndrewCurran_

پژوهش‌ها

  • DeepSeek-V3.1 در SWE-Bench به امتیاز ۶۶ درصد دست می‌یابد، در حالی که برای توکن‌های ورودی ۲ برابر ارزان‌تر و برای توکن‌های خروجی ۶ برابر ارزان‌تر از GPT-5 است که در همین بنچمارک ۷۰-۷۱ درصد کسب می‌کند @deedydas
  • Buildathon اندرو اِنگ توسعه‌ی سریع با کمک هوش مصنوعی را نشان می‌دهد، با تیم‌هایی که ۵ محصول کاربردی را در ۶.۵ ساعت با استفاده از ابزارهایی مانند Claude Code، GPT-5، Cursor و Windsurf ساختند @AndrewYNg
  • Kaggle نتایج اولین بنچمارک ورودی متن شطرنج را منتشر می‌کند که در آن مدل‌های هوش مصنوعی تنها با استفاده از ورودی‌های متنی، بدون ابزار یا اعتبارسنجی حرکت، شطرنج بازی کردند و رتبه‌بندی‌های شبیه به اِلو (Elo) را در بیش از ۴۰ مسابقه به ازای هر جفت تعیین می‌کند @kaggle
  • ARC-AGI-3 Preview سه بازی دیگر را از مجموعه‌ی نگهداری‌شده‌ی (holdout set) قبلاً خصوصی منتشر می‌کند و تازگی بازی‌های عمومی موجود برای آزمایش قابلیت‌های استدلال هوش مصنوعی را گسترش می‌دهد @arcprize
  • Genie 3 گوگل دیپ‌مایند دنیاهای قابل کاوش تولید شده توسط هوش مصنوعی را برای آزمایش و آموزش ایمن عوامل هوش مصنوعی ایجاد می‌کند، با قابلیت‌هایی برای محیط‌های مجازی متنوع و چالش‌برانگیز @GoogleDeepMind