اخبار هوش مصنوعی در 2025-10-07

مدل‌های جدید هوش مصنوعی

  • گوگل مدل Gemini 2.5 Computer Use را منتشر کرده است که می‌تواند با کلیک‌کردن، اسکرول‌کردن و تایپ‌کردن در مرورگرها گشت‌و‌گذار کند و معیارهای جدیدی را با سرعت بیشتر و ویژگی‌های ایمنی تعیین می‌کند @GoogleDeepMind
  • اوپن‌ای‌آی gpt-image-1-mini، یک مدل جدید تولید تصویر را معرفی کرده است که ۸۰٪ ارزان‌تر از مدل بزرگ آن‌هاست @simonw
  • ایکس‌ای‌آی مدل تولید ویدیوی Imagine v0.9 را با ارتقاهای چشمگیر در کیفیت بصری، حرکت و قابلیت‌های تولید صدای بومی راه‌اندازی کرده است @xai
  • Qwen3-VL علی‌بابا رتبه‌ی دوم را در جدول رده‌بندی دیداری کسب کرده و به اولین مدل متن‌باز (اوپن‌سورس) تبدیل شده است که هم در جدول رده‌بندی متنی خالص و هم در جدول رده‌بندی دیداری رتبه‌ی اول را دارد @Alibaba_Qwen
  • LiquidAI مدل LFM2-8B-A1B را منتشر کرده است؛ یک مدل MoE با ۸.۳ میلیارد پارامتر و تنها ۱.۵ میلیارد توکن فعال که برای اجرا روی گوشی‌ها و لپ‌تاپ‌ها طراحی شده است @maximelabonne

تحلیل صنعت

  • جی‌پی‌مورگان به «تعادل هوش مصنوعی» (AI equilibrium) رسیده است؛ سالانه ۲ میلیارد دلار برای توسعه‌ی هوش مصنوعی هزینه می‌کند، در حالی که همین مقدار را پس‌انداز می‌کند و قصد دارد از طریق agentic AI در تمامی سطوح، مزیت پیشگامی را به دست آورد @AndrewCurran_
  • پرپلکسیتی در ترافیک وب از گروک پیشی گرفته است و با ۱۶۸ میلیون بازدید در ۲۸ روز گذشته، پویایی‌های رقابتی را در جستجوی هوش مصنوعی نشان می‌دهد @exec_sum
  • اوپن‌ای‌آی از ۳۰ مشتری برتر خود رونمایی کرده است که بیش از ۱ تریلیون توکن استفاده کرده‌اند و این نشان‌دهنده‌ی پذیرش گسترده‌ی سازمانی است @deedydas
  • شرط بزرگ بعدی آنتروپیک، هند است که به‌عنوان یکی از سریع‌ترین بازارهای در حال رشد آن‌ها در سراسر جهان شناسایی شده است @TechCrunch
  • آی‌بی‌ام خانواده‌ی مدل زبان بزرگ Claude آنتروپیک را در محصولات توسعه‌ی نرم‌افزار خود گنجانده است @TechCrunch
  • کوهیر برنامه‌ی شرکا را برای تسریع پذیرش جهانی هوش مصنوعی و ارائه‌ی نتایج تجاری قابل‌اندازه‌گیری از طریق همکاری‌های صنعتی راه‌اندازی کرده است @cohere
  • جامعه‌ی HuggingFace در ۹۰ روز گذشته ۱ میلیون مخزن جدید اضافه کرده است که ۴۰٪ آن‌ها مخازن خصوصی هستند و نشان‌دهنده‌ی افزایش پذیرش سازمانی است @ClementDelangue

اخلاق و جامعه

  • انجمن تصاویر متحرک از اوپن‌ای‌آی تقاضا می‌کند تا اقدامات فوری برای رسیدگی به نقض حق چاپ توسط Sora 2 انجام دهد و اعلام می‌کند که جلوگیری از نقض حق چاپ مسئولیت اوپن‌ای‌آی است @AndrewCurran_
  • مایکروسافت ریسرچ درباره‌ی تلاش «تیم قرمز» (red-teaming) بحث می‌کند که یک آسیب‌پذیری زیست‌امنیتی را در طراحی پروتئین مبتنی بر هوش مصنوعی کشف و ایمن‌سازی کرد و خطرات «دوکاربردی» (dual-use risks) را برجسته می‌کند @MSFTResearch
  • اتان مولیک اشاره می‌کند که ChatGPT اکنون از انجام بسیاری از کارهایی که Claude با کمال میل به آن‌ها رسیدگی می‌کند، خودداری می‌کند و این نشان‌دهنده‌ی رویکردهای ایمنی متفاوت است @emollick

کاربردها

  • تسلا FSD Supervised V14.1 را با گزینه‌های جدید ورود (arrival options) منتشر کرده است که به کاربران امکان می‌دهد محل‌های پارک را انتخاب کنند و همچنین یک حالت جدید «Driver Profile Sloth» برای رانندگی محافظه‌کارانه‌تر ارائه می‌دهد @Tesla
  • Cursor «حالت برنامه‌ریزی» (plan mode) را معرفی می‌کند که در آن هوش مصنوعی می‌تواند قبل از شروع وظایف پیچیده، برنامه‌های دقیقی بنویسد و به عامل‌ها اجازه می‌دهد برای مدت‌زمان‌های بسیار طولانی‌تری اجرا شوند @cursor_ai
  • برنامه‌ی ChatGPT در iOS اکنون از ورودی ویدیویی، از جمله رونویسی صوتی از طریق قابلیت کشیدن و رها کردن (drag and drop) پشتیبانی می‌کند @AndrewCurran_
  • مدل Computer Use گوگل اکنون به‌صورت پیش‌نمایش (preview) از طریق API در دسترس است و امکان گشت‌و‌گذار خودکار در مرورگر را فراهم می‌کند @AndrewCurran_
  • فیگما از ادغام بستر (context integration) با Codex اوپن‌ای‌آی خبر می‌دهد که جریان‌های کاری طراحی به کد (design-to-code workflows) را بهبود می‌بخشد @figma
  • Copilot Vision به کاربران کمک می‌کند تا در زمان واقعی (real-time) در برنامه‌های نرم‌افزاری گشت‌و‌گذار کنند؛ این قابلیت با ویرایش ویدیو در Filmora به نمایش گذاشته شد @yusuf_i_mehdi

پژوهش‌ها

  • گوگل دیپ‌مایند CodeMender را معرفی می‌کند، یک عامل هوش مصنوعی که به‌طور خودکار آسیب‌پذیری‌های حیاتی نرم‌افزاری را برطرف می‌کند و به‌طور بالقوه بهره‌وری توسعه‌دهندگان و امنیت را افزایش می‌دهد @demishassabis
  • مدل‌های «وزن باز» (open-weights) مانند DeepSeek V3.2 Exp در حال کاهش شکاف با مدل‌های پیشگام اختصاصی در جریان‌های کاری agentic هستند؛ به‌طوری که DeepSeek در ارزیابی Terminal-Bench Hard از Gemini 2.5 Pro پیشی گرفته است @ArtificialAnlys
  • مقاله‌ی پژوهشی «Readability ≠ Learnability: Rethinking the Role of Simplicity in Training Small Language Models» خرد متعارف را در مورد رویکردهای آموزش مدل به چالش می‌کشد @chrmanning
  • محققان استنفورد در حال ساخت یک مدل بنیادی چندوجهی از سلول‌ها هستند تا تعاملات پروتئین-ژن و علل بیماری را آشکار کنند @StanfordHAI
  • جامعه‌ی PyTorch در حال بررسی ترکیب quantization با 2:4 sparsity برای فشرده‌سازی بیشتر LLM (مدل‌های زبان بزرگ) با حفظ دقت در استقرار با شتاب سخت‌افزاری است @PyTorch