اخبار هوش مصنوعی در 2025-10-21

مدل‌های جدید هوش مصنوعی

علی‌بابا مدل‌های Qwen3-VL-2B و Qwen3-VL-32B را منتشر کرد؛ نسخه‌ی ۳۲ میلیارد پارامتری این مدل در زمینه‌های STEM، VQA، OCR، درک ویدئو و وظایف عاملی، از GPT-5 mini و Claude 4 Sonnet عملکرد بهتری دارد و با مدل‌هایی تا ۲۳۵ میلیارد پارامتر برابری می‌کند @Alibaba_Qwen
علی‌بابا Qwen Deep Research را ارتقا داد تا با استفاده از Qwen3-Coder، Qwen-Image و Qwen3-TTS، نه تنها گزارش، بلکه صفحات وب زنده و پادکست نیز تولید کند @Alibaba_Qwen
OpenAI مرورگر ChatGPT Atlas را راه‌اندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی برای macOS که می‌تواند صفحات وب را ببیند، به سؤالات در چارچوب متن پاسخ دهد و وظایف را از طریق حالت عاملی (agent mode) برای کاربران Plus و Pro تکمیل کند @OpenAI
Veo 3.1 گوگل با پیشرفت‌های قابل‌توجه نسبت به Veo 3.0 در زمینه‌ی تولید متن به ویدئو (۳۰+ امتیاز) و تصویر به ویدئو (۷۰+ امتیاز)، در صدر جدول امتیازات ویدئویی LMArena قرار گرفت @demishassabis
گوگل یک تجربه‌ی کدنویسی جدید با اولویت‌بخشی به هوش مصنوعی را در AI Studio راه‌اندازی کرد که برای ساخت اپلیکیشن‌های هوش مصنوعی با Gemini بهینه شده است @OfficialLoganK

تحلیل صنعت

مدیر عامل Airbnb وابستگی شدید این شرکت به مدل Qwen علی‌بابا را برای استفاده در تولید فاش کرد و آن را «بسیار خوب، سریع و ارزان» توصیف کرد، در حالی که به دلیل ملاحظات هزینه‌ای، کمتر از آخرین مدل‌های OpenAI استفاده می‌کند @natolambert
قطعی AWS نشان می‌دهد چگونه وابستگی‌های ابری می‌توانند محصولات به ظاهر محلی را از کار بیندازند؛ به طوری که ابزار توسعه‌ی API پست‌من (Postman) و تخت‌های هوشمند Eight Sleep در طول این قطعی غیرقابل استفاده شدند @GergelyOrosz
مدیر عامل Cloudflare از رگولاتورها خواست تا جلوی اقدامات گوگل در زمینه‌ی هوش مصنوعی را بگیرند و استدلال کرد که سلطه‌ی این غول فناوری در جستجو، به آن یک برتری ناعادلانه در رقابت هوش مصنوعی می‌دهد @TechCrunch
برادران وارنر (Warner Bros) فروش احتمالی دارایی‌های رسانه‌ای خود را پس از ابراز علاقه‌ی چندین طرف از جمله نتفلیکس بررسی می‌کند، که می‌تواند دسترسی به IP (دارایی‌های فکری) اصلی را برای اپلیکیشن‌های رسانه‌ی مولد تحت تأثیر قرار دهد @AndrewCurran_

اخلاق و جامعه

سایمون ویلیسون (Simon Willison) نگرانی‌های خود را در مورد عامل‌های مرورگر (browser agents) ابراز کرد و اظهار داشت که چالش‌های امنیتی و حریم خصوصی برای این دسته از محصولات همچنان حل‌نشدنی باقی مانده‌اند @simonw
استنفورد با چالش‌هایی روبروست که دانشجویان از ChatGPT برای تقلب در امتحانات میان‌ترم استفاده می‌کنند، اما اساتید نمی‌توانند به دلیل سیاست‌های منشور اخلاقی که برای تغییر آن‌ها فرآیندهای بوروکراتیک چندساله لازم است، بر امتحانات نظارت کنند @polynoamial
پژوهش‌ها نشان می‌دهد که ۶۶٪ از آمریکایی‌ها هرگز از ChatGPT استفاده نکرده‌اند؛ و یک مقاله‌ی جدید استدلال می‌کند که پژوهش‌های LLM (مدل‌های زبان بزرگ) بر اساس نیازهای پذیرندگان شکل می‌گیرد، در حالی که نیازهای کاربران غیرپذیرنده نادیده گرفته می‌شوند @KaitlynZhou
یوتیوب فناوری تشخیص شباهت را راه‌اندازی کرد که به تولیدکنندگان محتوا اجازه می‌دهد درخواست حذف محتوای هوش مصنوعی ساخته‌شده با استفاده از چهره و صدای آن‌ها را بدهند @TechCrunch

کاربردها

Anthropic پشتیبانی از sandbox را در Claude Code CLI راه‌اندازی کرد تا CLI را ایمن‌تر و سریع‌تر کند و با دسترسی کنترل‌شده به دایرکتوری و شبکه، درخواست‌های مجوز را تا ۸۴٪ کاهش دهد @_catwu
مایکروسافت ریسرچ (Microsoft Research) SentinelStep را معرفی کرد تا عامل‌های هوش مصنوعی را قادر سازد وظایف نظارتی طولانی‌مدت را مدیریت کنند؛ وظایفی مانند رصد ایمیل‌ها یا ردیابی قیمت‌ها، با مدیریت زمان بررسی عامل‌ها و زمینه‌ی آن‌ها @MSFTResearch
Serval از مدل‌های هوش مصنوعی عاملی (agentic AI) برای خودکارسازی مدیریت خدمات IT استفاده می‌کند؛ با رویکردی منحصربه‌فرد که از قدرت‌های هوش مصنوعی عاملی بهره می‌برد و در عین حال از مشکلات رایج اجتناب می‌کند @TechCrunch
واتس‌اپ و مسنجر (Messenger) قابلیت‌های ایمنی مبتنی بر هوش مصنوعی را پیاده‌سازی کردند؛ به طوری که واتس‌اپ پیش از اشتراک‌گذاری صفحه با مخاطبین ناشناس به کاربران هشدار می‌دهد و مسنجر پیام‌های مشکوک را علامت‌گذاری می‌کند @TechCrunch
گوگل تماس‌های تلفنی را با صدای بهبودیافته توسط هوش مصنوعی ارتقا می‌دهد تا نویز پس‌زمینه را کاهش داده و وضوح صدا را بهبود بخشد، حتی هنگام صحبت با خطوط ثابت یا دستگاه‌های قدیمی‌تر @TechCrunch
ربات خانگی Moflin کاسیو (Casio) از هوش مصنوعی برای توسعه‌ی شخصیت در طول زمان استفاده می‌کند که نشان‌دهنده‌ی پیشرفت‌ها در دستگاه‌های همدم مبتنی بر هوش مصنوعی است @TechCrunch

پژوهش‌ها

پژوهش جدیدی مکانیسم‌های Claude Haiku را برای انجام وظایف ادراکی مهندسی معکوس می‌کند و خانواده‌های ویژگی‌ها، منیفولدها، تبدیل‌های هندسی و الگوریتم‌های توجه توزیع‌شده را کشف می‌کند @wesg52
آندری کارپاتی (Andrej Karpathy) بررسی می‌کند که آیا پیکسل‌ها ورودی‌های بهتری برای LLMها نسبت به توکن‌های متنی هستند یا خیر، و پیشنهاد می‌دهد که رندر کردن متن به عنوان تصویر می‌تواند فشرده‌سازی اطلاعات بهتر، جریان‌های ورودی عمومی‌تر و حذف وابستگی‌های توکن‌ساز را فراهم کند @karpathy
پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی همچنان در معیارهای پزشکی در حال بهبود هستند و در بسیاری از موارد هوش مصنوعی کنونی از پزشکان انسانی پیشی می‌گیرد، اگرچه مطالعات عملکرد در دنیای واقعی همچنان محدود است @emollick
مطالعات، بحث درباره‌ی زمان استفاده از هوش مصنوعی برای برچسب‌گذاری داده‌ها را بررسی می‌کنند، با یافته‌هایی که نشان می‌دهد پاسخ‌های هوش مصنوعی با انسان‌ها متفاوت است اما ممکن است گاهی بهتر باشد، که چالش برچسب‌گذاری داده‌ها در توسعه‌ی هوش مصنوعی را برجسته می‌کند @emollick
هوش مصنوعی برکلی (Berkeley AI) ربات Botany-Bot را در IROS 2025 ارائه می‌کند که مدل‌های سه‌بعدی تقسیم‌بندی‌شده از گیاهان را با استفاده از Gaussian splats ایجاد می‌کند و از بازوهای رباتیک برای آشکار کردن جزئیات پنهان آناتومی گیاه برای فنوتیپینگ استفاده می‌کند @funmilore
تحلیل «خودبازی» (self-play) در هوش مصنوعی نشان می‌دهد که چرا این روش برای بازی‌های دو نفره با مجموع صفر مانند شطرنج و پوکر خوب عمل می‌کند، اما به دلیل اینکه استراتژی‌های تعادلی از مطلوبیت انسانی جدا هستند، در دامنه‌های دنیای واقعی با چالش‌هایی روبرو می‌شود @polynoamial