اخبار هوش مصنوعی در 2025-09-12
مدلهای جدید هوش مصنوعی
- بایدو مدل ERNIE-4.5-21B-A3B-Thinking را منتشر کرد که اکنون پرطرفدارترین مدل تولید متن در Hugging Face است، با ۲۱ میلیارد پارامتر کلی، ۳ میلیارد پارامتر فعال به ازای هر توکن و قابلیتهای بهبودیافتهی درک متن طولانی ۱۲۸ هزار توکنی @Baidu_Inc
- Cursor مدل جدید Tab را منتشر کرد که با یادگیری تقویتی آنلاین آموزش دیده و ۲۱% پیشنهادهای کمتری ارائه میدهد، در حالی که نرخ پذیرش پیشنهادها ۲۸% بالاتر است @cursor_ai
- گوگل ریسرچ VaultGemma را منتشر کرد؛ یک مدل متنباز که از پایه با حفظ حریم خصوصی تفاضلی آموزش دیده و قوانین مقیاسپذیری را برای مدلهای زبانی با حفظ حریم خصوصی تفاضلی ارائه میدهد @GoogleResearch
- Qwen مدل Qwen3-Next-80B-A3B را منتشر کرد که از روز اول از SGLang برای دیکدینگ حدسی و از vLLM برای استنتاج کارآمد با هستههای شتابیافته پشتیبانی میکند @Alibaba_Qwen
تحلیل صنعت
- OpenAI و مایکروسافت یک تفاهمنامهی غیرالزامآور برای تبدیل OpenAI به یک شرکت با منافع عمومی امضا کردند، که در آن سهام حقوق صاحبانهی این سازمان غیرانتفاعی از ۱۰۰ میلیارد دلار فراتر میرود @AndrewCurran_
- ۲۵% از فضاهای کاری Linear اکنون از عاملهای هوش مصنوعی استفاده میکنند، با پذیرش بیش از ۵۰% در شرکتهای بزرگ، و عمدتاً از عاملهای کدنویسی Cursor، Devin و Codegen بهره میبرند که مستقیماً از Linear برای رفع اشکالات و بهبودها وظایف دریافت میکنند @karrisaarinen
- Hugging Face با ارائهدهندگان متعددی شریک شد تا صدها مدل متنباز پیشرفته را مستقیماً به VS Code و GitHub Copilot بیاورد و مدلهای با وزن باز را با قیمتگذاری رقابتی و جابهجایی بیدردسر ارائه دهد @ClementDelangue
- Parahelp سرمایهی سری A جذب کرد، و شرکتهای برتر هوش مصنوعی از جمله Perplexity، Replit، Bolt، و HeyGen از پلتفرم عامل پشتیبانی مشتری هوش مصنوعی آن استفاده میکنند @snowmaker
- Cresta یک تبلیغ پیشگامانه تولید کرد که ۱۰۰% آن در ۵ هفته با هوش مصنوعی ساخته شده است، از فیلمنامه تا تولید ویدئو و صداها، و پتانسیل هوش مصنوعی را برای تولید محتوا نشان میدهد @cresta
اخلاق و جامعه
- سنای کالیفرنیا لایحهی SB 243 را تصویب کرد که اپراتورهای همراهان هوش مصنوعی را ملزم به اجرای پروتکلهای ایمنی میکند و شرکتها را از نظر قانونی مسئول میداند، که احتمالاً کالیفرنیا را به اولین ایالت با چنین مقرراتی تبدیل میکند @TechCrunch
- خزندهی هوش مصنوعی گوگل نمیتواند جداگانه از خزندهی وب آن مسدود شود، که به این غول جستجو اجازه میدهد تا محتوا را بدون رضایت ناشران برای آموزش هوش مصنوعی استفاده کند @TechCrunch
- Anthropic با مرکز استانداردهای و نوآوری هوش مصنوعی ایالات متحده و مؤسسهی امنیت هوش مصنوعی بریتانیا همکاری میکند تا مدلهایی مانند Claude Opus 4 و 4.1 را قبل از استقرار از نظر آسیبپذیریها آزمایش کند @AnthropicAI
کاربردها
- ایتان مولیک بحث میکند که چگونه سیستمهای هوش مصنوعی در حال تغییر از ابزارهای مشارکتیای هستند که کاربران در آنها فرآیند را شکل میدهند، به سیستمهایی که کاربران در آنها به دریافتکنندگان خروجیهای مبهم تبدیل میشوند @emollick
- Replit مدل استفاده از رایانهی خود را برای تست مرورگر ساخت، پس از اینکه مدلهای Computer Use مربوط به Claude و GPT-5 را بسیار کند و گران یافت، و به ۱۵ برابر عملکرد سریعتر دست یافت @amasad
- Qwen Code نسخههای v0.0.10 و v0.0.11 را با ویژگیهای جدید منتشر کرد که شامل زیرعاملها برای تجزیهی وظایف، ابزار Todo Write برای ردیابی وظایف، و خلاصهی پروژههای «خوش آمدید دوباره» است @Alibaba_Qwen
- پاول گراهام گزارش میدهد که یک بنیانگذار میتواند با کمک هوش مصنوعی در یک روز ۱۰ هزار خط کد بنویسد، و اشاره میکند که این معادل ۵۰۰ خط در ساعت است که در زبانهای برنامهنویسی پرحرف قابل دستیابی است @paulg
پژوهشها
- پژوهشها از پدیدهی LLM Hacking پرده برداشتند، که در آن استفاده از LLMها بهعنوان برچسبزن داده میتواند هر نتیجهی علمی دلخواه را تولید کند، و نگرانیهایی را دربارهی اعتبار پژوهشها ایجاد میکند @joabaum
- مدلهای استدلال OpenAI تکامل یافتهاند، از تفکر در حد چند ثانیه با o1-preview در یک سال پیش به مدلهای کنونی که میتوانند ساعتها فکر کنند، وب را مرور کنند و کد بنویسند @polynoamial
- تحلیل GPT-5 در AssistantBench دقت بالاتر و نرخ حدس پایینتر نسبت به o3 را نشان میدهد و ادعاهای OpenAI را دربارهی توهمات و کالیبراسیون مدل به چالش میکشد @PKirgis
- مدلهای رباتیک Physical Intelligence تنها با طول زمینهی ۱ ثانیه کار میکنند و برای اجرای برنامههای پیچیدهی چند دقیقهای به وضعیت فعلی جهان تکیه دارند تا حافظه @dwarkesh_sp
- سرگئی لوین پیشبینی میکند که رباتهای خانگی کاملاً خودمختار ظرف ۵ سال آینده ظهور خواهند کرد، و هوش عمومی و دانش پیشین LLMها را بهعنوان داربستهای متحولکنندهای برای مدلهای رباتیک ذکر میکند @dwarkesh_sp
- پیادهسازی تفکیکشدهی vLLM متا، کارایی استنتاج را در تأخیر و توان عملیاتی در مقایسه با پشتهی داخلی آنها بهبود میبخشد، و بهینهسازیها به جامعهی vLLM منتقل میشوند @PyTorch