اخبار هوش مصنوعی در 2025-10-21
مدلهای جدید هوش مصنوعی
- علیبابا مدلهای Qwen3-VL-2B و Qwen3-VL-32B را منتشر کرد؛ نسخهی ۳۲ میلیارد پارامتری این مدل در زمینههای STEM، VQA، OCR، درک ویدئو و وظایف عاملی، از GPT-5 mini و Claude 4 Sonnet عملکرد بهتری دارد و با مدلهایی تا ۲۳۵ میلیارد پارامتر برابری میکند @Alibaba_Qwen
- علیبابا Qwen Deep Research را ارتقا داد تا با استفاده از Qwen3-Coder، Qwen-Image و Qwen3-TTS، نه تنها گزارش، بلکه صفحات وب زنده و پادکست نیز تولید کند @Alibaba_Qwen
- OpenAI مرورگر ChatGPT Atlas را راهاندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی برای macOS که میتواند صفحات وب را ببیند، به سؤالات در چارچوب متن پاسخ دهد و وظایف را از طریق حالت عاملی (agent mode) برای کاربران Plus و Pro تکمیل کند @OpenAI
- Veo 3.1 گوگل با پیشرفتهای قابلتوجه نسبت به Veo 3.0 در زمینهی تولید متن به ویدئو (۳۰+ امتیاز) و تصویر به ویدئو (۷۰+ امتیاز)، در صدر جدول امتیازات ویدئویی LMArena قرار گرفت @demishassabis
- گوگل یک تجربهی کدنویسی جدید با اولویتبخشی به هوش مصنوعی را در AI Studio راهاندازی کرد که برای ساخت اپلیکیشنهای هوش مصنوعی با Gemini بهینه شده است @OfficialLoganK
تحلیل صنعت
- مدیر عامل Airbnb وابستگی شدید این شرکت به مدل Qwen علیبابا را برای استفاده در تولید فاش کرد و آن را «بسیار خوب، سریع و ارزان» توصیف کرد، در حالی که به دلیل ملاحظات هزینهای، کمتر از آخرین مدلهای OpenAI استفاده میکند @natolambert
- قطعی AWS نشان میدهد چگونه وابستگیهای ابری میتوانند محصولات به ظاهر محلی را از کار بیندازند؛ به طوری که ابزار توسعهی API پستمن (Postman) و تختهای هوشمند Eight Sleep در طول این قطعی غیرقابل استفاده شدند @GergelyOrosz
- مدیر عامل Cloudflare از رگولاتورها خواست تا جلوی اقدامات گوگل در زمینهی هوش مصنوعی را بگیرند و استدلال کرد که سلطهی این غول فناوری در جستجو، به آن یک برتری ناعادلانه در رقابت هوش مصنوعی میدهد @TechCrunch
- برادران وارنر (Warner Bros) فروش احتمالی داراییهای رسانهای خود را پس از ابراز علاقهی چندین طرف از جمله نتفلیکس بررسی میکند، که میتواند دسترسی به IP (داراییهای فکری) اصلی را برای اپلیکیشنهای رسانهی مولد تحت تأثیر قرار دهد @AndrewCurran_
اخلاق و جامعه
- سایمون ویلیسون (Simon Willison) نگرانیهای خود را در مورد عاملهای مرورگر (browser agents) ابراز کرد و اظهار داشت که چالشهای امنیتی و حریم خصوصی برای این دسته از محصولات همچنان حلنشدنی باقی ماندهاند @simonw
- استنفورد با چالشهایی روبروست که دانشجویان از ChatGPT برای تقلب در امتحانات میانترم استفاده میکنند، اما اساتید نمیتوانند به دلیل سیاستهای منشور اخلاقی که برای تغییر آنها فرآیندهای بوروکراتیک چندساله لازم است، بر امتحانات نظارت کنند @polynoamial
- پژوهشها نشان میدهد که ۶۶٪ از آمریکاییها هرگز از ChatGPT استفاده نکردهاند؛ و یک مقالهی جدید استدلال میکند که پژوهشهای LLM (مدلهای زبان بزرگ) بر اساس نیازهای پذیرندگان شکل میگیرد، در حالی که نیازهای کاربران غیرپذیرنده نادیده گرفته میشوند @KaitlynZhou
- یوتیوب فناوری تشخیص شباهت را راهاندازی کرد که به تولیدکنندگان محتوا اجازه میدهد درخواست حذف محتوای هوش مصنوعی ساختهشده با استفاده از چهره و صدای آنها را بدهند @TechCrunch
کاربردها
- Anthropic پشتیبانی از sandbox را در Claude Code CLI راهاندازی کرد تا CLI را ایمنتر و سریعتر کند و با دسترسی کنترلشده به دایرکتوری و شبکه، درخواستهای مجوز را تا ۸۴٪ کاهش دهد @_catwu
- مایکروسافت ریسرچ (Microsoft Research) SentinelStep را معرفی کرد تا عاملهای هوش مصنوعی را قادر سازد وظایف نظارتی طولانیمدت را مدیریت کنند؛ وظایفی مانند رصد ایمیلها یا ردیابی قیمتها، با مدیریت زمان بررسی عاملها و زمینهی آنها @MSFTResearch
- Serval از مدلهای هوش مصنوعی عاملی (agentic AI) برای خودکارسازی مدیریت خدمات IT استفاده میکند؛ با رویکردی منحصربهفرد که از قدرتهای هوش مصنوعی عاملی بهره میبرد و در عین حال از مشکلات رایج اجتناب میکند @TechCrunch
- واتساپ و مسنجر (Messenger) قابلیتهای ایمنی مبتنی بر هوش مصنوعی را پیادهسازی کردند؛ به طوری که واتساپ پیش از اشتراکگذاری صفحه با مخاطبین ناشناس به کاربران هشدار میدهد و مسنجر پیامهای مشکوک را علامتگذاری میکند @TechCrunch
- گوگل تماسهای تلفنی را با صدای بهبودیافته توسط هوش مصنوعی ارتقا میدهد تا نویز پسزمینه را کاهش داده و وضوح صدا را بهبود بخشد، حتی هنگام صحبت با خطوط ثابت یا دستگاههای قدیمیتر @TechCrunch
- ربات خانگی Moflin کاسیو (Casio) از هوش مصنوعی برای توسعهی شخصیت در طول زمان استفاده میکند که نشاندهندهی پیشرفتها در دستگاههای همدم مبتنی بر هوش مصنوعی است @TechCrunch
پژوهشها
- پژوهش جدیدی مکانیسمهای Claude Haiku را برای انجام وظایف ادراکی مهندسی معکوس میکند و خانوادههای ویژگیها، منیفولدها، تبدیلهای هندسی و الگوریتمهای توجه توزیعشده را کشف میکند @wesg52
- آندری کارپاتی (Andrej Karpathy) بررسی میکند که آیا پیکسلها ورودیهای بهتری برای LLMها نسبت به توکنهای متنی هستند یا خیر، و پیشنهاد میدهد که رندر کردن متن به عنوان تصویر میتواند فشردهسازی اطلاعات بهتر، جریانهای ورودی عمومیتر و حذف وابستگیهای توکنساز را فراهم کند @karpathy
- پژوهشها نشان میدهد که مدلهای هوش مصنوعی همچنان در معیارهای پزشکی در حال بهبود هستند و در بسیاری از موارد هوش مصنوعی کنونی از پزشکان انسانی پیشی میگیرد، اگرچه مطالعات عملکرد در دنیای واقعی همچنان محدود است @emollick
- مطالعات، بحث دربارهی زمان استفاده از هوش مصنوعی برای برچسبگذاری دادهها را بررسی میکنند، با یافتههایی که نشان میدهد پاسخهای هوش مصنوعی با انسانها متفاوت است اما ممکن است گاهی بهتر باشد، که چالش برچسبگذاری دادهها در توسعهی هوش مصنوعی را برجسته میکند @emollick
- هوش مصنوعی برکلی (Berkeley AI) ربات Botany-Bot را در IROS 2025 ارائه میکند که مدلهای سهبعدی تقسیمبندیشده از گیاهان را با استفاده از Gaussian splats ایجاد میکند و از بازوهای رباتیک برای آشکار کردن جزئیات پنهان آناتومی گیاه برای فنوتیپینگ استفاده میکند @funmilore
- تحلیل «خودبازی» (self-play) در هوش مصنوعی نشان میدهد که چرا این روش برای بازیهای دو نفره با مجموع صفر مانند شطرنج و پوکر خوب عمل میکند، اما به دلیل اینکه استراتژیهای تعادلی از مطلوبیت انسانی جدا هستند، در دامنههای دنیای واقعی با چالشهایی روبرو میشود @polynoamial