اخبار هوش مصنوعی در 2025-09-12

مدل‌های جدید هوش مصنوعی

بایدو مدل ERNIE-4.5-21B-A3B-Thinking را منتشر کرد که اکنون پرطرفدارترین مدل تولید متن در Hugging Face است، با ۲۱ میلیارد پارامتر کلی، ۳ میلیارد پارامتر فعال به ازای هر توکن و قابلیت‌های بهبودیافته‌ی درک متن طولانی ۱۲۸ هزار توکنی @Baidu_Inc
Cursor مدل جدید Tab را منتشر کرد که با یادگیری تقویتی آنلاین آموزش دیده و ۲۱% پیشنهادهای کمتری ارائه می‌دهد، در حالی که نرخ پذیرش پیشنهادها ۲۸% بالاتر است @cursor_ai
گوگل ریسرچ VaultGemma را منتشر کرد؛ یک مدل متن‌باز که از پایه با حفظ حریم خصوصی تفاضلی آموزش دیده و قوانین مقیاس‌پذیری را برای مدل‌های زبانی با حفظ حریم خصوصی تفاضلی ارائه می‌دهد @GoogleResearch
Qwen مدل Qwen3-Next-80B-A3B را منتشر کرد که از روز اول از SGLang برای دیکدینگ حدسی و از vLLM برای استنتاج کارآمد با هسته‌های شتاب‌یافته پشتیبانی می‌کند @Alibaba_Qwen

تحلیل صنعت

OpenAI و مایکروسافت یک تفاهم‌نامه‌ی غیرالزام‌آور برای تبدیل OpenAI به یک شرکت با منافع عمومی امضا کردند، که در آن سهام حقوق صاحبانه‌ی این سازمان غیرانتفاعی از ۱۰۰ میلیارد دلار فراتر می‌رود @AndrewCurran_
۲۵% از فضاهای کاری Linear اکنون از عامل‌های هوش مصنوعی استفاده می‌کنند، با پذیرش بیش از ۵۰% در شرکت‌های بزرگ، و عمدتاً از عامل‌های کدنویسی Cursor، Devin و Codegen بهره می‌برند که مستقیماً از Linear برای رفع اشکالات و بهبودها وظایف دریافت می‌کنند @karrisaarinen
Hugging Face با ارائه‌دهندگان متعددی شریک شد تا صدها مدل متن‌باز پیشرفته را مستقیماً به VS Code و GitHub Copilot بیاورد و مدل‌های با وزن باز را با قیمت‌گذاری رقابتی و جابه‌جایی بی‌دردسر ارائه دهد @ClementDelangue
Parahelp سرمایه‌ی سری A جذب کرد، و شرکت‌های برتر هوش مصنوعی از جمله Perplexity، Replit، Bolt، و HeyGen از پلتفرم عامل پشتیبانی مشتری هوش مصنوعی آن استفاده می‌کنند @snowmaker
Cresta یک تبلیغ پیشگامانه تولید کرد که ۱۰۰% آن در ۵ هفته با هوش مصنوعی ساخته شده است، از فیلم‌نامه تا تولید ویدئو و صداها، و پتانسیل هوش مصنوعی را برای تولید محتوا نشان می‌دهد @cresta

اخلاق و جامعه

سنای کالیفرنیا لایحه‌ی SB 243 را تصویب کرد که اپراتورهای همراهان هوش مصنوعی را ملزم به اجرای پروتکل‌های ایمنی می‌کند و شرکت‌ها را از نظر قانونی مسئول می‌داند، که احتمالاً کالیفرنیا را به اولین ایالت با چنین مقرراتی تبدیل می‌کند @TechCrunch
خزنده‌ی هوش مصنوعی گوگل نمی‌تواند جداگانه از خزنده‌ی وب آن مسدود شود، که به این غول جستجو اجازه می‌دهد تا محتوا را بدون رضایت ناشران برای آموزش هوش مصنوعی استفاده کند @TechCrunch
Anthropic با مرکز استانداردهای و نوآوری هوش مصنوعی ایالات متحده و مؤسسه‌ی امنیت هوش مصنوعی بریتانیا همکاری می‌کند تا مدل‌هایی مانند Claude Opus 4 و 4.1 را قبل از استقرار از نظر آسیب‌پذیری‌ها آزمایش کند @AnthropicAI

کاربردها

ایتان مولیک بحث می‌کند که چگونه سیستم‌های هوش مصنوعی در حال تغییر از ابزارهای مشارکتی‌ای هستند که کاربران در آن‌ها فرآیند را شکل می‌دهند، به سیستم‌هایی که کاربران در آن‌ها به دریافت‌کنندگان خروجی‌های مبهم تبدیل می‌شوند @emollick
Replit مدل استفاده از رایانه‌ی خود را برای تست مرورگر ساخت، پس از اینکه مدل‌های Computer Use مربوط به Claude و GPT-5 را بسیار کند و گران یافت، و به ۱۵ برابر عملکرد سریع‌تر دست یافت @amasad
Qwen Code نسخه‌های v0.0.10 و v0.0.11 را با ویژگی‌های جدید منتشر کرد که شامل زیرعامل‌ها برای تجزیه‌ی وظایف، ابزار Todo Write برای ردیابی وظایف، و خلاصه‌ی پروژه‌های «خوش آمدید دوباره» است @Alibaba_Qwen
پاول گراهام گزارش می‌دهد که یک بنیان‌گذار می‌تواند با کمک هوش مصنوعی در یک روز ۱۰ هزار خط کد بنویسد، و اشاره می‌کند که این معادل ۵۰۰ خط در ساعت است که در زبان‌های برنامه‌نویسی پرحرف قابل دستیابی است @paulg

پژوهش‌ها

پژوهش‌ها از پدیده‌ی LLM Hacking پرده برداشتند، که در آن استفاده از LLMها به‌عنوان برچسب‌زن داده می‌تواند هر نتیجه‌ی علمی دلخواه را تولید کند، و نگرانی‌هایی را درباره‌ی اعتبار پژوهش‌ها ایجاد می‌کند @joabaum
مدل‌های استدلال OpenAI تکامل یافته‌اند، از تفکر در حد چند ثانیه با o1-preview در یک سال پیش به مدل‌های کنونی که می‌توانند ساعت‌ها فکر کنند، وب را مرور کنند و کد بنویسند @polynoamial
تحلیل GPT-5 در AssistantBench دقت بالاتر و نرخ حدس پایین‌تر نسبت به o3 را نشان می‌دهد و ادعاهای OpenAI را درباره‌ی توهمات و کالیبراسیون مدل به چالش می‌کشد @PKirgis
مدل‌های رباتیک Physical Intelligence تنها با طول زمینه‌ی ۱ ثانیه کار می‌کنند و برای اجرای برنامه‌های پیچیده‌ی چند دقیقه‌ای به وضعیت فعلی جهان تکیه دارند تا حافظه @dwarkesh_sp
سرگئی لوین پیش‌بینی می‌کند که ربات‌های خانگی کاملاً خودمختار ظرف ۵ سال آینده ظهور خواهند کرد، و هوش عمومی و دانش پیشین LLMها را به‌عنوان داربست‌های متحول‌کننده‌ای برای مدل‌های رباتیک ذکر می‌کند @dwarkesh_sp
پیاده‌سازی تفکیک‌شده‌ی vLLM متا، کارایی استنتاج را در تأخیر و توان عملیاتی در مقایسه با پشته‌ی داخلی آن‌ها بهبود می‌بخشد، و بهینه‌سازی‌ها به جامعه‌ی vLLM منتقل می‌شوند @PyTorch