اخبار هوش مصنوعی در 2025-08-21

مدل‌های جدید هوش مصنوعی

DeepSeek-V3.1 استنتاج ترکیبی را با حالت‌های «تفکر» و «غیرتفکر» معرفی می‌کند و قابلیت‌های تفکر سریع‌تر و مهارت‌های عامل قوی‌تر را با پشتیبانی از ۱۲۸ هزار توکن زمینه ارائه می‌دهد @deepseek_ai
Cohere مدل پیشرفته‌ی خود با نام Command A Reasoning را برای کارهای استنتاج سازمانی منتشر کرده است که برای استقرار خصوصی با کمتر از ۲ واحد پردازش گرافیکی (GPU) و بودجه‌های توکن تحت کنترل کاربر طراحی شده است @cohere
مدل Seed OSS بایت‌دنس با ۳۶ میلیارد پارامتر اکنون در هاگینگ فیس در دسترس است و دارای لایسنس Apache2، قابلیت داخلی ۵۱۲ هزار توکن زمینه طولانی و بودجه‌ی تفکر منعطف است @Xianbao_QIAN
گوگل اعلام کرد که Veo 3 برای آزمایش رایگان در برنامه‌ی جیمینای (Gemini App) در دسترس خواهد بود و واحد‌های پردازش تانسور (TPU) برای راه‌اندازی در حال آماده‌سازی هستند @joshwoodward

تحلیل صنعت

Anthropic به دلیل تقاضای بالای سرمایه‌گذاران، هدف جمع‌آوری سرمایه‌ی خود را به ۱۰ میلیارد دلار دو برابر کرد که به طور قابل توجهی از مقدار برنامه‌ریزی‌شده‌ی اولیه افزایش یافته است @AndrewCurran_
گزارش شده است که متا ممنوعیت استخدام را در آزمایشگاه‌های ابرهوش متا (Meta Superintelligence Labs) اعمال کرده است، در حالی که در حال بازسازی است که واحد هوش مصنوعی را به چهار گروه جدید تقسیم کرده است @TechCrunch
پژوهش‌ها نشان می‌دهد که ۹۵ درصد از پروژه‌های آزمایشی هوش مصنوعی (AI pilots) نتوانسته‌اند در عرض شش ماه به تأثیر پایدار بر سود و زیان (P&L) دست یابند، اگرچه پرسش‌های روش‌شناختی در مورد قابلیت تعمیم یافته‌ها از ۵۲ مصاحبه‌ی نمونه‌گیری‌شده‌ی راحت (convenience-sampled) باقی می‌ماند @emollick
علی‌رغم ۵۰ درصد پذیرش مدل‌های زبان بزرگ (LLM) در میان کارگران آمریکایی، رشد بهره‌وری نیروی کار پایین‌تر از سطح سال ۲۰۲۰ باقی مانده است و ادعاهای افزایش ۱۰ برابری بهره‌وری از ابزارهای هوش مصنوعی را به چالش می‌کشد @fchollet
هوش مصنوعی دقت ۹۲ درصدی را در مقابل ۷۲ درصد برای وکلای باتجربه در وظایف بررسی فاکتور نشان می‌دهد، در حالی که ۵۰ تا ۱۰۰ برابر سریع‌تر و ۹۹.۹۷ درصد ارزان‌تر است که تأثیر هوش مصنوعی بر خدمات حرفه‌ای سنتی را برجسته می‌کند @deedydas
گوگل کاهش ۳۳ برابری در ردپای انرژی و ۴۴ برابری در ردپای کربن را برای درخواست‌های متنی برنامه‌ی جیمینای (Gemini App) از مه ۲۰۲۴ تا مه ۲۰۲۵ گزارش کرده است، در حالی که پاسخ‌های با کیفیت‌تر ارائه می‌دهد @JeffDean

اخلاق و جامعه

Anthropic با سازمان ملی امنیت هسته‌ای (NNSA) برای توسعه‌ی تدابیر ایمنی تسلیحات هسته‌ای برای هوش مصنوعی همکاری می‌کند و طبقه‌بندی‌کننده‌هایی ایجاد می‌کند که پرسش‌های نگران‌کننده‌ی هسته‌ای را شناسایی می‌کنند، در حالی که کاربردهای آموزشی و پژوهشی مشروع را حفظ می‌کند @AnthropicAI
مصطفی سلیمان در مورد هوش مصنوعی که ظاهراً هوشیار به نظر می‌رسد، هشدار می‌دهد و استدلال می‌کند که ارزش هوش مصنوعی از متفاوت بودن آن از انسان‌ها نشئت می‌گیرد، نه از تقلید احساسات انسانی مانند شرم، حسادت یا ترس @mustafasuleyman
Anthropic سه دوره‌ی جدید سواد هوش مصنوعی را که با همکاری مربیان ایجاد شده‌اند، راه‌اندازی می‌کند تا به معلمان و دانش‌آموزان در ساخت مهارت‌های هوش مصنوعی عملی و مسئولانه کمک کند؛ این دوره‌ها به صورت رایگان برای هر موسسه‌ای در دسترس است @AnthropicAI

کاربردها

گوگل پلتفرم Gemini for Government را راه‌اندازی می‌کند که ابزارهای هوش مصنوعی از جمله NotebookLM و Veo را به آژانس‌های فدرال تقریباً بدون هیچ هزینه‌ای از طریق همکاری با GSA (سازمان خدمات عمومی) ارائه می‌دهد @sundarpichai
گوگل قابلیت‌های عاملیت (agentic capabilities) را در حالت هوش مصنوعی برای جستجو معرفی می‌کند و امکان مرور خودکار چندین سایت را برای یافتن رزرو رستوران با موجودی لحظه‌ای و لینک‌های رزرو مستقیم فراهم می‌کند @GoogleAI
Cursor با Linear ادغام می‌شود تا عوامل هوش مصنوعی (AI agents) را فعال کند که می‌توانند مستقیماً از مسائل (issues) راه‌اندازی شوند و بر اساس واگذاری وظایف به زبان ساده، شاخه‌ها را ایجاد کرده و پیش‌نویس درخواست‌های پول (PRs) را تهیه کنند @cursor_ai
Perplexity قابلیت بررسی سهام هند را با استفاده از جستجوی زبان طبیعی راه‌اندازی می‌کند که در پلتفرم‌های وب و موبایل برای کاربران رایگان و پولی در دسترس است @AravSrinivas
Perplexity Comet توانایی خودکار راه‌اندازی فروشگاه‌های Shopify را نشان می‌دهد و قابلیت‌های پیشرفته‌ی اتوماسیون تجارت الکترونیک را به نمایش می‌گذارد @AravSrinivas
Runway، Game Worlds Beta را راه‌اندازی می‌کند که امکان ایجاد محیط‌های بازی تعاملی تولید شده توسط هوش مصنوعی را فراهم می‌کند @AndrewCurran_

پژوهش‌ها

DeepSeek-V3.1 در SWE-Bench به امتیاز ۶۶ درصد دست می‌یابد، در حالی که برای توکن‌های ورودی ۲ برابر ارزان‌تر و برای توکن‌های خروجی ۶ برابر ارزان‌تر از GPT-5 است که در همین بنچمارک ۷۰-۷۱ درصد کسب می‌کند @deedydas
Buildathon اندرو اِنگ توسعه‌ی سریع با کمک هوش مصنوعی را نشان می‌دهد، با تیم‌هایی که ۵ محصول کاربردی را در ۶.۵ ساعت با استفاده از ابزارهایی مانند Claude Code، GPT-5، Cursor و Windsurf ساختند @AndrewYNg
Kaggle نتایج اولین بنچمارک ورودی متن شطرنج را منتشر می‌کند که در آن مدل‌های هوش مصنوعی تنها با استفاده از ورودی‌های متنی، بدون ابزار یا اعتبارسنجی حرکت، شطرنج بازی کردند و رتبه‌بندی‌های شبیه به اِلو (Elo) را در بیش از ۴۰ مسابقه به ازای هر جفت تعیین می‌کند @kaggle
ARC-AGI-3 Preview سه بازی دیگر را از مجموعه‌ی نگهداری‌شده‌ی (holdout set) قبلاً خصوصی منتشر می‌کند و تازگی بازی‌های عمومی موجود برای آزمایش قابلیت‌های استدلال هوش مصنوعی را گسترش می‌دهد @arcprize
Genie 3 گوگل دیپ‌مایند دنیاهای قابل کاوش تولید شده توسط هوش مصنوعی را برای آزمایش و آموزش ایمن عوامل هوش مصنوعی ایجاد می‌کند، با قابلیت‌هایی برای محیط‌های مجازی متنوع و چالش‌برانگیز @GoogleDeepMind