اخبار هوش مصنوعی در 2025-08-21
مدلهای جدید هوش مصنوعی
- DeepSeek-V3.1 استنتاج ترکیبی را با حالتهای «تفکر» و «غیرتفکر» معرفی میکند و قابلیتهای تفکر سریعتر و مهارتهای عامل قویتر را با پشتیبانی از ۱۲۸ هزار توکن زمینه ارائه میدهد @deepseek_ai
- Cohere مدل پیشرفتهی خود با نام Command A Reasoning را برای کارهای استنتاج سازمانی منتشر کرده است که برای استقرار خصوصی با کمتر از ۲ واحد پردازش گرافیکی (GPU) و بودجههای توکن تحت کنترل کاربر طراحی شده است @cohere
- مدل Seed OSS بایتدنس با ۳۶ میلیارد پارامتر اکنون در هاگینگ فیس در دسترس است و دارای لایسنس Apache2، قابلیت داخلی ۵۱۲ هزار توکن زمینه طولانی و بودجهی تفکر منعطف است @Xianbao_QIAN
- گوگل اعلام کرد که Veo 3 برای آزمایش رایگان در برنامهی جیمینای (Gemini App) در دسترس خواهد بود و واحدهای پردازش تانسور (TPU) برای راهاندازی در حال آمادهسازی هستند @joshwoodward
تحلیل صنعت
- Anthropic به دلیل تقاضای بالای سرمایهگذاران، هدف جمعآوری سرمایهی خود را به ۱۰ میلیارد دلار دو برابر کرد که به طور قابل توجهی از مقدار برنامهریزیشدهی اولیه افزایش یافته است @AndrewCurran_
- گزارش شده است که متا ممنوعیت استخدام را در آزمایشگاههای ابرهوش متا (Meta Superintelligence Labs) اعمال کرده است، در حالی که در حال بازسازی است که واحد هوش مصنوعی را به چهار گروه جدید تقسیم کرده است @TechCrunch
- پژوهشها نشان میدهد که ۹۵ درصد از پروژههای آزمایشی هوش مصنوعی (AI pilots) نتوانستهاند در عرض شش ماه به تأثیر پایدار بر سود و زیان (P&L) دست یابند، اگرچه پرسشهای روششناختی در مورد قابلیت تعمیم یافتهها از ۵۲ مصاحبهی نمونهگیریشدهی راحت (convenience-sampled) باقی میماند @emollick
- علیرغم ۵۰ درصد پذیرش مدلهای زبان بزرگ (LLM) در میان کارگران آمریکایی، رشد بهرهوری نیروی کار پایینتر از سطح سال ۲۰۲۰ باقی مانده است و ادعاهای افزایش ۱۰ برابری بهرهوری از ابزارهای هوش مصنوعی را به چالش میکشد @fchollet
- هوش مصنوعی دقت ۹۲ درصدی را در مقابل ۷۲ درصد برای وکلای باتجربه در وظایف بررسی فاکتور نشان میدهد، در حالی که ۵۰ تا ۱۰۰ برابر سریعتر و ۹۹.۹۷ درصد ارزانتر است که تأثیر هوش مصنوعی بر خدمات حرفهای سنتی را برجسته میکند @deedydas
- گوگل کاهش ۳۳ برابری در ردپای انرژی و ۴۴ برابری در ردپای کربن را برای درخواستهای متنی برنامهی جیمینای (Gemini App) از مه ۲۰۲۴ تا مه ۲۰۲۵ گزارش کرده است، در حالی که پاسخهای با کیفیتتر ارائه میدهد @JeffDean
اخلاق و جامعه
- Anthropic با سازمان ملی امنیت هستهای (NNSA) برای توسعهی تدابیر ایمنی تسلیحات هستهای برای هوش مصنوعی همکاری میکند و طبقهبندیکنندههایی ایجاد میکند که پرسشهای نگرانکنندهی هستهای را شناسایی میکنند، در حالی که کاربردهای آموزشی و پژوهشی مشروع را حفظ میکند @AnthropicAI
- مصطفی سلیمان در مورد هوش مصنوعی که ظاهراً هوشیار به نظر میرسد، هشدار میدهد و استدلال میکند که ارزش هوش مصنوعی از متفاوت بودن آن از انسانها نشئت میگیرد، نه از تقلید احساسات انسانی مانند شرم، حسادت یا ترس @mustafasuleyman
- Anthropic سه دورهی جدید سواد هوش مصنوعی را که با همکاری مربیان ایجاد شدهاند، راهاندازی میکند تا به معلمان و دانشآموزان در ساخت مهارتهای هوش مصنوعی عملی و مسئولانه کمک کند؛ این دورهها به صورت رایگان برای هر موسسهای در دسترس است @AnthropicAI
کاربردها
- گوگل پلتفرم Gemini for Government را راهاندازی میکند که ابزارهای هوش مصنوعی از جمله NotebookLM و Veo را به آژانسهای فدرال تقریباً بدون هیچ هزینهای از طریق همکاری با GSA (سازمان خدمات عمومی) ارائه میدهد @sundarpichai
- گوگل قابلیتهای عاملیت (agentic capabilities) را در حالت هوش مصنوعی برای جستجو معرفی میکند و امکان مرور خودکار چندین سایت را برای یافتن رزرو رستوران با موجودی لحظهای و لینکهای رزرو مستقیم فراهم میکند @GoogleAI
- Cursor با Linear ادغام میشود تا عوامل هوش مصنوعی (AI agents) را فعال کند که میتوانند مستقیماً از مسائل (issues) راهاندازی شوند و بر اساس واگذاری وظایف به زبان ساده، شاخهها را ایجاد کرده و پیشنویس درخواستهای پول (PRs) را تهیه کنند @cursor_ai
- Perplexity قابلیت بررسی سهام هند را با استفاده از جستجوی زبان طبیعی راهاندازی میکند که در پلتفرمهای وب و موبایل برای کاربران رایگان و پولی در دسترس است @AravSrinivas
- Perplexity Comet توانایی خودکار راهاندازی فروشگاههای Shopify را نشان میدهد و قابلیتهای پیشرفتهی اتوماسیون تجارت الکترونیک را به نمایش میگذارد @AravSrinivas
- Runway، Game Worlds Beta را راهاندازی میکند که امکان ایجاد محیطهای بازی تعاملی تولید شده توسط هوش مصنوعی را فراهم میکند @AndrewCurran_
پژوهشها
- DeepSeek-V3.1 در SWE-Bench به امتیاز ۶۶ درصد دست مییابد، در حالی که برای توکنهای ورودی ۲ برابر ارزانتر و برای توکنهای خروجی ۶ برابر ارزانتر از GPT-5 است که در همین بنچمارک ۷۰-۷۱ درصد کسب میکند @deedydas
- Buildathon اندرو اِنگ توسعهی سریع با کمک هوش مصنوعی را نشان میدهد، با تیمهایی که ۵ محصول کاربردی را در ۶.۵ ساعت با استفاده از ابزارهایی مانند Claude Code، GPT-5، Cursor و Windsurf ساختند @AndrewYNg
- Kaggle نتایج اولین بنچمارک ورودی متن شطرنج را منتشر میکند که در آن مدلهای هوش مصنوعی تنها با استفاده از ورودیهای متنی، بدون ابزار یا اعتبارسنجی حرکت، شطرنج بازی کردند و رتبهبندیهای شبیه به اِلو (Elo) را در بیش از ۴۰ مسابقه به ازای هر جفت تعیین میکند @kaggle
- ARC-AGI-3 Preview سه بازی دیگر را از مجموعهی نگهداریشدهی (holdout set) قبلاً خصوصی منتشر میکند و تازگی بازیهای عمومی موجود برای آزمایش قابلیتهای استدلال هوش مصنوعی را گسترش میدهد @arcprize
- Genie 3 گوگل دیپمایند دنیاهای قابل کاوش تولید شده توسط هوش مصنوعی را برای آزمایش و آموزش ایمن عوامل هوش مصنوعی ایجاد میکند، با قابلیتهایی برای محیطهای مجازی متنوع و چالشبرانگیز @GoogleDeepMind