اخبار هوش مصنوعی در 2025-11-11
مدلهای جدید هوش مصنوعی
- بایدو مدل ERNIE-4.5-VL-28B-A3B-Thinking را با تنها 3 میلیارد پارامتر فعال منتشر کرد که عملکرد بصری سطح بالایی را در استدلال بصری، حل مسائل STEM، درک بصری و درک ویدئو ارائه میدهد و با vLLM، Transformers و FastDeploy کاملاً سازگار است @ErnieforDevs
- Cursor مدل Composer-1 را منتشر کرد که بهبودهای قابلتوجهی را در قابلیتهای کدنویسی نشان میدهد و تقریباً 4 برابر سریعتر از نسخههای قبلی اجرا میشود و از طریق بهبود قابلیت جستجوی فایلها، عملکرد بهتری را در پایگاهکدهای بزرگ ارائه میدهد @deedydas
تحلیل صنعت
- Gamma با تنها 50 کارمند به بیش از 100 میلیون کاربر و 100 میلیون دلار ARR دست یافته است، که به 2 میلیون دلار ARR به ازای هر کارمند و ارزشگذاری 2.1 میلیارد دلاری منجر شده است. این موفقیت از طریق اصول طراحی-محور و تمرکز بر تجربهی کاربری به دست آمده است، نه صرفاً به دلیل تأسیس به عنوان یک شرکت هوش مصنوعی @a16z
- مایکل تروئل، مدیرعامل Cursor، هشدار میدهد که بازار اتوماسیون نرمافزار هنوز در مراحل اولیه است و پیشرفت کنونی را با «لحظهی آیپاد» مقایسه میکند، با چندین دستاورد در سطح آیفون که هنوز در پیش هستند. او به مدیران اجرایی هشدار میدهد که میزان پیشرفت اتوماسیون را دستکم نگیرند @a16z
- دادههای مککینزی نرخهای نفوذ هوش مصنوعی متفاوتی را در صنایع و عملکردهای تجاری در سال 2025 نشان میدهد، با تفاوتهای قابلتوجهی در سطوح پذیرش @deedydas
- Meta AI طبق دادههای Similarweb، عملکرد قویای را در بازار نشان میدهد @alexandr_wang
- سازمانها با تشکیل تیمهای کوچک، خودمختار و بینرشتهای که مهندسان ارشد، متخصصان حوزه و مدیران محصول را ترکیب میکنند، با موفقیت برای هوش مصنوعی در حال بازسازی هستند تا به سرعت برنامههای کاربردی مفیدی را آزمایش و ایجاد کنند، اگرچه مکانیسمهای هماهنگی در مقیاس بزرگ هنوز وجود ندارند @emollick
- SuperMe با 6.8 میلیون دلار سرمایهی اولیه به رهبری Greylock راهاندازی شد تا یک شبکهی متخصص هوش مصنوعی با تمرکز بر اشتراکگذاری دانش از 1% برتر عملکردها ایجاد کند @alexrkonrad
- شرکتهایی که از ابزارهای کدنویسی هوش مصنوعی متنباز استفاده میکنند، گزارش میدهند که نرمافزارهای بکآفیس به ارزش میلیونها دلار را با کدنویسی سفارشی CRM، CMS، ابزارهای پشتیبانی و پلتفرمهای مستندسازی خود جایگزین کردهاند @clairevo
اخلاق و جامعه
- مطالعهی Stanford HAI نشان میدهد که شرکتهای پیشرو هوش مصنوعی ورودیهای کاربران را به مدلهای خود بازمیگردانند تا قابلیتها را بهبود بخشند، در حالی که کاربران اغلب قادر به انصراف نیستند، که نگرانیهای قابلتوجهی در مورد حریم خصوصی ایجاد میکند @StanfordHAI
- کتی هوچول، فرماندار نیویورک، نامهای به همهی شرکتهایی که دستیاران هوش مصنوعی در نیویورک فعالیت میکنند ارسال کرد و قوانین موجود ایالتی در مورد ایمنی هوش مصنوعی و حمایت از مصرفکننده را یادآور شد @AndrewCurran_
- جرمی هاوارد هشدار میدهد که سازمانهایی که به طور کامل به عاملهای هوش مصنوعی متکی میشوند، خطر ایجاد مقادیر عظیمی از کدی را دارند که افراد کمتری قادر به درک آن هستند، که به طور بالقوه منجر به منسوخ شدن شرکت میشود و استدلال میکند که برونسپاری تمام تفکر به کامپیوترها مانع از ارتقای مهارت و یادگیری میشود @math_rachel
- مصطفی سلیمان بر ماهیت دوگانهی درک هوش مصنوعی تأکید میکند و بیان میکند کسانی که از هوش مصنوعی شگفتزده نمیشوند، آن را واقعاً درک نمیکنند، و کسانی که از آن نمیترسند نیز آن را واقعاً درک نمیکنند @mustafasuleyman
- رید هافمن از دولتها حمایت میکند تا به شرکتهای هوش مصنوعی کمک کنند ابزارهای ارزشمندی مانند دستیاران پزشکی رایگان را سریعتر به کار گیرند، نه اینکه مقرراتی را تحمیل کنند که مانع از اجرای موارد استفادهی واقعی شود @reidhoffman
کاربردها
- مایکروسافت پروژهی SPARROW را اعلام کرد که از دوربینهای خورشیدی و هوش مصنوعی برای نظارت بر تنوع زیستی در اکوسیستمهای دورافتاده از طریق آزمایشگاه AI for Good خود استفاده میکند @Microsoft
- Microsoft Copilot قابلیت ناوبری مراقبتهای بهداشتی را راهاندازی کرد که با استفاده از منابع معتبری مانند Harvard Health به سؤالات پزشکی پاسخ میدهد و به کاربران کمک میکند تا پزشکان نزدیک را بر اساس تخصص، جنسیت و ترجیحات زبانی پیدا کنند @Copilot
- OpenAI دوازده ماه ChatGPT Plus رایگان را برای نیروهای نظامی در حال خدمت واجد شرایط و کهنهسربازانی که در 12 ماه گذشته خدمت خود را به پایان رساندهاند، اعلام کرد @gdb
- Datalab API اکنون redlines و نظرات را از اسناد حقوقی به فرمت مارکداون تمیز استخراج میکند و امکان تحلیل بهتر با LLMها را فراهم میآورد @VikParuchuri
- پروژهی Aella دو مدل سفارشی، Aella-Nemotron-12b و Aella-Qwen-14b را آموزش میدهد که عملکرد پیشرفتهای را در وظایف استخراج با 98% هزینهی کمتر به دست میآورد @samhogan
پژوهشها
- پژوهشها نشان میدهد که یک سیستم همکاری چندعاملی با استفاده از محاسبات تکاملی در زمان آزمایش، که توسط GPT-5 pro قدرت میگیرد، در ARC-AGI v1 به عملکرد سطح انسانی 85% با هزینهی کمتر از 10 هزار دلار در مدت 12 ساعت دست یافت @jerber888
- مطالعهی K Arkoudas و S Batzoglou بهبودهای قابلتوجهی را در قابلیتهای استدلالی LLM در سال 2025 نشان میدهد، به طوری که مدلهای برتر کنونی از جمله GPT-5، Grok 4 و Gemini 2.5 Pro عملکرد بهتری را در مقایسه با GPT-4o یا Llama 3 به نمایش میگذارند @chrmanning
- پژوهشها نشان میدهد که LLMها میتوانند معیارهای اطمینان کالیبرهشده را در بسیاری از تنظیمات به صورت آماده ارائه دهند، با وجود اینکه به دلیل توهمزایی و ارائهی پاسخهای نادرست اما مطمئنکننده بدنام هستند @PreetumNakkiran
- مقالهی GDPval بینشهایی را در مورد تأثیر آتی هوش مصنوعی بر کار دانشمحور ارائه میدهد، به ویژه با شروع جایگزینی جریانهای کاری سنتی پرسش و پاسخ توسط سیستمهای عاملمحور @emollick
- Microsoft Research فریمورک BlueCodeAgent را منتشر کرد؛ یک فریمورک blue-teaming end-to-end که از فرآیندها، دادهها و قوانین ایمنی red-teaming خودکار برای هدایت تصمیمات دفاعی LLMها استفاده میکند، با آزمایش دینامیک که خطاهای مثبت کاذب را در شناسایی آسیبپذیری کاهش میدهد @MSFTResearch
- پژوهش جدید، پارادایم استدلال بلادرنگ را برای عاملهای هوش مصنوعی پیشنهاد میکند، که به محدودیتِ «توقف دنیا حین استدلال توسط عاملهای کنونی» میپردازد و آنها را قادر میسازد تا بدون از دست دادن تغییرات در حال وقوع، عمیقاً فکر کنند @BLeavesYe
- Tesla AI از طریق سیستمهای بینایی خود، درک عمیقی از جهان را نشان میدهد @Tesla_AI
- پژوهش Aria-Duet برای مسیر هوش مصنوعی خلاق NeurIPS 2025 پذیرفته شد، که نشاندهندهی کار مشترک بر روی کاربردهای هوش مصنوعی خلاق است @AlexanderSpangh