اخبار هوش مصنوعی در 2025-09-12

مدل‌های جدید هوش مصنوعی

  • بایدو مدل ERNIE-4.5-21B-A3B-Thinking را منتشر کرد که اکنون پرطرفدارترین مدل تولید متن در Hugging Face است، با ۲۱ میلیارد پارامتر کلی، ۳ میلیارد پارامتر فعال به ازای هر توکن و قابلیت‌های بهبودیافته‌ی درک متن طولانی ۱۲۸ هزار توکنی @Baidu_Inc
  • Cursor مدل جدید Tab را منتشر کرد که با یادگیری تقویتی آنلاین آموزش دیده و ۲۱% پیشنهادهای کمتری ارائه می‌دهد، در حالی که نرخ پذیرش پیشنهادها ۲۸% بالاتر است @cursor_ai
  • گوگل ریسرچ VaultGemma را منتشر کرد؛ یک مدل متن‌باز که از پایه با حفظ حریم خصوصی تفاضلی آموزش دیده و قوانین مقیاس‌پذیری را برای مدل‌های زبانی با حفظ حریم خصوصی تفاضلی ارائه می‌دهد @GoogleResearch
  • Qwen مدل Qwen3-Next-80B-A3B را منتشر کرد که از روز اول از SGLang برای دیکدینگ حدسی و از vLLM برای استنتاج کارآمد با هسته‌های شتاب‌یافته پشتیبانی می‌کند @Alibaba_Qwen

تحلیل صنعت

  • OpenAI و مایکروسافت یک تفاهم‌نامه‌ی غیرالزام‌آور برای تبدیل OpenAI به یک شرکت با منافع عمومی امضا کردند، که در آن سهام حقوق صاحبانه‌ی این سازمان غیرانتفاعی از ۱۰۰ میلیارد دلار فراتر می‌رود @AndrewCurran_
  • ۲۵% از فضاهای کاری Linear اکنون از عامل‌های هوش مصنوعی استفاده می‌کنند، با پذیرش بیش از ۵۰% در شرکت‌های بزرگ، و عمدتاً از عامل‌های کدنویسی Cursor، Devin و Codegen بهره می‌برند که مستقیماً از Linear برای رفع اشکالات و بهبودها وظایف دریافت می‌کنند @karrisaarinen
  • Hugging Face با ارائه‌دهندگان متعددی شریک شد تا صدها مدل متن‌باز پیشرفته را مستقیماً به VS Code و GitHub Copilot بیاورد و مدل‌های با وزن باز را با قیمت‌گذاری رقابتی و جابه‌جایی بی‌دردسر ارائه دهد @ClementDelangue
  • Parahelp سرمایه‌ی سری A جذب کرد، و شرکت‌های برتر هوش مصنوعی از جمله Perplexity، Replit، Bolt، و HeyGen از پلتفرم عامل پشتیبانی مشتری هوش مصنوعی آن استفاده می‌کنند @snowmaker
  • Cresta یک تبلیغ پیشگامانه تولید کرد که ۱۰۰% آن در ۵ هفته با هوش مصنوعی ساخته شده است، از فیلم‌نامه تا تولید ویدئو و صداها، و پتانسیل هوش مصنوعی را برای تولید محتوا نشان می‌دهد @cresta

اخلاق و جامعه

  • سنای کالیفرنیا لایحه‌ی SB 243 را تصویب کرد که اپراتورهای همراهان هوش مصنوعی را ملزم به اجرای پروتکل‌های ایمنی می‌کند و شرکت‌ها را از نظر قانونی مسئول می‌داند، که احتمالاً کالیفرنیا را به اولین ایالت با چنین مقرراتی تبدیل می‌کند @TechCrunch
  • خزنده‌ی هوش مصنوعی گوگل نمی‌تواند جداگانه از خزنده‌ی وب آن مسدود شود، که به این غول جستجو اجازه می‌دهد تا محتوا را بدون رضایت ناشران برای آموزش هوش مصنوعی استفاده کند @TechCrunch
  • Anthropic با مرکز استانداردهای و نوآوری هوش مصنوعی ایالات متحده و مؤسسه‌ی امنیت هوش مصنوعی بریتانیا همکاری می‌کند تا مدل‌هایی مانند Claude Opus 4 و 4.1 را قبل از استقرار از نظر آسیب‌پذیری‌ها آزمایش کند @AnthropicAI

کاربردها

  • ایتان مولیک بحث می‌کند که چگونه سیستم‌های هوش مصنوعی در حال تغییر از ابزارهای مشارکتی‌ای هستند که کاربران در آن‌ها فرآیند را شکل می‌دهند، به سیستم‌هایی که کاربران در آن‌ها به دریافت‌کنندگان خروجی‌های مبهم تبدیل می‌شوند @emollick
  • Replit مدل استفاده از رایانه‌ی خود را برای تست مرورگر ساخت، پس از اینکه مدل‌های Computer Use مربوط به Claude و GPT-5 را بسیار کند و گران یافت، و به ۱۵ برابر عملکرد سریع‌تر دست یافت @amasad
  • Qwen Code نسخه‌های v0.0.10 و v0.0.11 را با ویژگی‌های جدید منتشر کرد که شامل زیرعامل‌ها برای تجزیه‌ی وظایف، ابزار Todo Write برای ردیابی وظایف، و خلاصه‌ی پروژه‌های «خوش آمدید دوباره» است @Alibaba_Qwen
  • پاول گراهام گزارش می‌دهد که یک بنیان‌گذار می‌تواند با کمک هوش مصنوعی در یک روز ۱۰ هزار خط کد بنویسد، و اشاره می‌کند که این معادل ۵۰۰ خط در ساعت است که در زبان‌های برنامه‌نویسی پرحرف قابل دستیابی است @paulg

پژوهش‌ها

  • پژوهش‌ها از پدیده‌ی LLM Hacking پرده برداشتند، که در آن استفاده از LLMها به‌عنوان برچسب‌زن داده می‌تواند هر نتیجه‌ی علمی دلخواه را تولید کند، و نگرانی‌هایی را درباره‌ی اعتبار پژوهش‌ها ایجاد می‌کند @joabaum
  • مدل‌های استدلال OpenAI تکامل یافته‌اند، از تفکر در حد چند ثانیه با o1-preview در یک سال پیش به مدل‌های کنونی که می‌توانند ساعت‌ها فکر کنند، وب را مرور کنند و کد بنویسند @polynoamial
  • تحلیل GPT-5 در AssistantBench دقت بالاتر و نرخ حدس پایین‌تر نسبت به o3 را نشان می‌دهد و ادعاهای OpenAI را درباره‌ی توهمات و کالیبراسیون مدل به چالش می‌کشد @PKirgis
  • مدل‌های رباتیک Physical Intelligence تنها با طول زمینه‌ی ۱ ثانیه کار می‌کنند و برای اجرای برنامه‌های پیچیده‌ی چند دقیقه‌ای به وضعیت فعلی جهان تکیه دارند تا حافظه @dwarkesh_sp
  • سرگئی لوین پیش‌بینی می‌کند که ربات‌های خانگی کاملاً خودمختار ظرف ۵ سال آینده ظهور خواهند کرد، و هوش عمومی و دانش پیشین LLMها را به‌عنوان داربست‌های متحول‌کننده‌ای برای مدل‌های رباتیک ذکر می‌کند @dwarkesh_sp
  • پیاده‌سازی تفکیک‌شده‌ی vLLM متا، کارایی استنتاج را در تأخیر و توان عملیاتی در مقایسه با پشته‌ی داخلی آن‌ها بهبود می‌بخشد، و بهینه‌سازی‌ها به جامعه‌ی vLLM منتقل می‌شوند @PyTorch