اخبار هوش مصنوعی در 2025-11-11

مدل‌های جدید هوش مصنوعی

بایدو مدل ERNIE-4.5-VL-28B-A3B-Thinking را با تنها 3 میلیارد پارامتر فعال منتشر کرد که عملکرد بصری سطح بالایی را در استدلال بصری، حل مسائل STEM، درک بصری و درک ویدئو ارائه می‌دهد و با vLLM، Transformers و FastDeploy کاملاً سازگار است @ErnieforDevs
Cursor مدل Composer-1 را منتشر کرد که بهبودهای قابل‌توجهی را در قابلیت‌های کدنویسی نشان می‌دهد و تقریباً 4 برابر سریع‌تر از نسخه‌های قبلی اجرا می‌شود و از طریق بهبود قابلیت جستجوی فایل‌ها، عملکرد بهتری را در پایگاه‌کد‌های بزرگ ارائه می‌دهد @deedydas

تحلیل صنعت

Gamma با تنها 50 کارمند به بیش از 100 میلیون کاربر و 100 میلیون دلار ARR دست یافته است، که به 2 میلیون دلار ARR به ازای هر کارمند و ارزش‌گذاری 2.1 میلیارد دلاری منجر شده است. این موفقیت از طریق اصول طراحی-محور و تمرکز بر تجربه‌ی کاربری به دست آمده است، نه صرفاً به دلیل تأسیس به عنوان یک شرکت هوش مصنوعی @a16z
مایکل تروئل، مدیرعامل Cursor، هشدار می‌دهد که بازار اتوماسیون نرم‌افزار هنوز در مراحل اولیه است و پیشرفت کنونی را با «لحظه‌ی آی‌پاد» مقایسه می‌کند، با چندین دستاورد در سطح آیفون که هنوز در پیش هستند. او به مدیران اجرایی هشدار می‌دهد که میزان پیشرفت اتوماسیون را دست‌کم نگیرند @a16z
داده‌های مک‌کینزی نرخ‌های نفوذ هوش مصنوعی متفاوتی را در صنایع و عملکردهای تجاری در سال 2025 نشان می‌دهد، با تفاوت‌های قابل‌توجهی در سطوح پذیرش @deedydas
Meta AI طبق داده‌های Similarweb، عملکرد قوی‌ای را در بازار نشان می‌دهد @alexandr_wang
سازمان‌ها با تشکیل تیم‌های کوچک، خودمختار و بین‌رشته‌ای که مهندسان ارشد، متخصصان حوزه و مدیران محصول را ترکیب می‌کنند، با موفقیت برای هوش مصنوعی در حال بازسازی هستند تا به سرعت برنامه‌های کاربردی مفیدی را آزمایش و ایجاد کنند، اگرچه مکانیسم‌های هماهنگی در مقیاس بزرگ هنوز وجود ندارند @emollick
SuperMe با 6.8 میلیون دلار سرمایه‌ی اولیه به رهبری Greylock راه‌اندازی شد تا یک شبکه‌ی متخصص هوش مصنوعی با تمرکز بر اشتراک‌گذاری دانش از 1% برتر عملکردها ایجاد کند @alexrkonrad
شرکت‌هایی که از ابزارهای کدنویسی هوش مصنوعی متن‌باز استفاده می‌کنند، گزارش می‌دهند که نرم‌افزارهای بک‌آفیس به ارزش میلیون‌ها دلار را با کدنویسی سفارشی CRM، CMS، ابزارهای پشتیبانی و پلتفرم‌های مستندسازی خود جایگزین کرده‌اند @clairevo

اخلاق و جامعه

مطالعه‌ی Stanford HAI نشان می‌دهد که شرکت‌های پیشرو هوش مصنوعی ورودی‌های کاربران را به مدل‌های خود بازمی‌گردانند تا قابلیت‌ها را بهبود بخشند، در حالی که کاربران اغلب قادر به انصراف نیستند، که نگرانی‌های قابل‌توجهی در مورد حریم خصوصی ایجاد می‌کند @StanfordHAI
کتی هوچول، فرماندار نیویورک، نامه‌ای به همه‌ی شرکت‌هایی که دستیاران هوش مصنوعی در نیویورک فعالیت می‌کنند ارسال کرد و قوانین موجود ایالتی در مورد ایمنی هوش مصنوعی و حمایت از مصرف‌کننده را یادآور شد @AndrewCurran_
جرمی هاوارد هشدار می‌دهد که سازمان‌هایی که به طور کامل به عامل‌های هوش مصنوعی متکی می‌شوند، خطر ایجاد مقادیر عظیمی از کدی را دارند که افراد کمتری قادر به درک آن هستند، که به طور بالقوه منجر به منسوخ شدن شرکت می‌شود و استدلال می‌کند که برون‌سپاری تمام تفکر به کامپیوترها مانع از ارتقای مهارت و یادگیری می‌شود @math_rachel
مصطفی سلیمان بر ماهیت دوگانه‌ی درک هوش مصنوعی تأکید می‌کند و بیان می‌کند کسانی که از هوش مصنوعی شگفت‌زده نمی‌شوند، آن را واقعاً درک نمی‌کنند، و کسانی که از آن نمی‌ترسند نیز آن را واقعاً درک نمی‌کنند @mustafasuleyman
رید هافمن از دولت‌ها حمایت می‌کند تا به شرکت‌های هوش مصنوعی کمک کنند ابزارهای ارزشمندی مانند دستیاران پزشکی رایگان را سریع‌تر به کار گیرند، نه اینکه مقرراتی را تحمیل کنند که مانع از اجرای موارد استفاده‌ی واقعی شود @reidhoffman

کاربردها

مایکروسافت پروژه‌ی SPARROW را اعلام کرد که از دوربین‌های خورشیدی و هوش مصنوعی برای نظارت بر تنوع زیستی در اکوسیستم‌های دورافتاده از طریق آزمایشگاه AI for Good خود استفاده می‌کند @Microsoft
Microsoft Copilot قابلیت ناوبری مراقبت‌های بهداشتی را راه‌اندازی کرد که با استفاده از منابع معتبری مانند Harvard Health به سؤالات پزشکی پاسخ می‌دهد و به کاربران کمک می‌کند تا پزشکان نزدیک را بر اساس تخصص، جنسیت و ترجیحات زبانی پیدا کنند @Copilot
OpenAI دوازده ماه ChatGPT Plus رایگان را برای نیروهای نظامی در حال خدمت واجد شرایط و کهنه‌سربازانی که در 12 ماه گذشته خدمت خود را به پایان رسانده‌اند، اعلام کرد @gdb
Datalab API اکنون redlines و نظرات را از اسناد حقوقی به فرمت مارک‌داون تمیز استخراج می‌کند و امکان تحلیل بهتر با LLMها را فراهم می‌آورد @VikParuchuri
پروژه‌ی Aella دو مدل سفارشی، Aella-Nemotron-12b و Aella-Qwen-14b را آموزش می‌دهد که عملکرد پیشرفته‌ای را در وظایف استخراج با 98% هزینه‌ی کمتر به دست می‌آورد @samhogan

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که یک سیستم همکاری چندعاملی با استفاده از محاسبات تکاملی در زمان آزمایش، که توسط GPT-5 pro قدرت می‌گیرد، در ARC-AGI v1 به عملکرد سطح انسانی 85% با هزینه‌ی کمتر از 10 هزار دلار در مدت 12 ساعت دست یافت @jerber888
مطالعه‌ی K Arkoudas و S Batzoglou بهبودهای قابل‌توجهی را در قابلیت‌های استدلالی LLM در سال 2025 نشان می‌دهد، به طوری که مدل‌های برتر کنونی از جمله GPT-5، Grok 4 و Gemini 2.5 Pro عملکرد بهتری را در مقایسه با GPT-4o یا Llama 3 به نمایش می‌گذارند @chrmanning
پژوهش‌ها نشان می‌دهد که LLMها می‌توانند معیارهای اطمینان کالیبره‌شده را در بسیاری از تنظیمات به صورت آماده ارائه دهند، با وجود اینکه به دلیل توهم‌زایی و ارائه‌ی پاسخ‌های نادرست اما مطمئن‌کننده بدنام هستند @PreetumNakkiran
مقاله‌ی GDPval بینش‌هایی را در مورد تأثیر آتی هوش مصنوعی بر کار دانش‌محور ارائه می‌دهد، به ویژه با شروع جایگزینی جریان‌های کاری سنتی پرسش و پاسخ توسط سیستم‌های عامل‌محور @emollick
Microsoft Research فریم‌ورک BlueCodeAgent را منتشر کرد؛ یک فریم‌ورک blue-teaming end-to-end که از فرآیندها، داده‌ها و قوانین ایمنی red-teaming خودکار برای هدایت تصمیمات دفاعی LLMها استفاده می‌کند، با آزمایش دینامیک که خطاهای مثبت کاذب را در شناسایی آسیب‌پذیری کاهش می‌دهد @MSFTResearch
پژوهش جدید، پارادایم استدلال بلادرنگ را برای عامل‌های هوش مصنوعی پیشنهاد می‌کند، که به محدودیتِ «توقف دنیا حین استدلال توسط عامل‌های کنونی» می‌پردازد و آن‌ها را قادر می‌سازد تا بدون از دست دادن تغییرات در حال وقوع، عمیقاً فکر کنند @BLeavesYe
Tesla AI از طریق سیستم‌های بینایی خود، درک عمیقی از جهان را نشان می‌دهد @Tesla_AI
پژوهش Aria-Duet برای مسیر هوش مصنوعی خلاق NeurIPS 2025 پذیرفته شد، که نشان‌دهنده‌ی کار مشترک بر روی کاربردهای هوش مصنوعی خلاق است @AlexanderSpangh