اخبار هوش مصنوعی در 2025-10-03

مدل‌های جدید هوش مصنوعی

اوپن‌ای‌آی Sora 2 Pro را با قابلیت‌های رزولوشن بالاتر و کلیپ‌های ۱۵ ثانیه‌ای به جای ۱۰ ثانیه منتشر کرد؛ این نسخه اکنون در حال عرضه برای حساب‌های کاربری حرفه‌ای (Pro) است @AndrewCurran_
آنتروپیک از بهبودهایی در Claude Sonnet 4.5 برای وظایف امنیت سایبری خبر داد؛ این بهبودها آن را قابل مقایسه یا برتر از Opus 4.1 کرده و در عین حال سریع‌تر و ارزان‌تر است @AnthropicAI

تحلیل صنعت

سیرا ایجنت OS نشان می‌دهد که چگونه مدل‌های نظارتی، فیلترینگ و ارزیابی‌ها عملکردی پیشرو در صنعت در کاربردهای هوش مصنوعی سازمانی ارائه می‌دهند @btaylor
گزارش MIT CSAIL نشان می‌دهد که استارتاپ‌های هوش مصنوعی هزینه‌ی زیادی برای دستیارهای عمومی LLM و ابزارهای کدنویسی می‌کنند؛ این موضوع نشان می‌دهد که چگونه هوش مصنوعی برخی از کارمندان را تقویت می‌کند، در حالی که سایر نقش‌ها را به مهارت‌های با استقرار گسترده تبدیل می‌کند @MIT_CSAIL
تحلیل a16z نشان می‌دهد که نرم‌افزار بازار کار ۱۳ تریلیون دلاری ایالات متحده را هدف قرار داده است، در مقایسه با تنها ۳۰۰ میلیارد دلار برای SaaS؛ این در حالی است که هوش مصنوعی نرم‌افزار را قادر می‌سازد تا خود کار را انجام دهد و بر اساس نتایج هزینه دریافت کند @a16z
مایکروسافت بر ساخت زیرساخت هوش مصنوعی قابل تعویض و منعطف برای برآوردن نیازهای دنیای واقعی در استنتاج (Inference) و آموزش (Training) تأکید می‌کند؛ این زیرساخت، بارهای کاری اصلی مانند Copilot و ChatGPT را تأمین می‌کند @satyanadella

اخلاق و جامعه

آنتروپیک هشدار می‌دهد که تأثیر هوش مصنوعی بر امنیت سایبری در نقطه‌ی عطف قرار دارد؛ با توجه به اینکه Claude اکنون در برخی رقابت‌ها بهتر از تیم‌های انسانی عمل می‌کند، در حالی که مهاجمان نیز از هوش مصنوعی برای گسترش عملیات خود استفاده می‌کنند @AnthropicAI
ایتان مالیک مشاهده می‌کند که وقتی ابزارهای خلاقیت به افراد داده می‌شود تا هر چیزی را ایجاد کنند، آن‌ها عمدتاً ویدئوهایی از گربه‌ها، افراد مشهور و شخصیت‌های انیمه می‌سازند؛ این موضوع نشان می‌دهد که ابزارهای خلاقیت هوش مصنوعی ممکن است به رویکردهای تنظیم (Curation) متفاوتی نیاز داشته باشند @emollick
مصطفی سلیمان استدلال می‌کند که حافظه‌ی هوش مصنوعی چیزی فراتر از شخصی‌سازی است و به حافظه‌ی مشترکی (co-memory) تبدیل می‌شود که جهان را همراه با کاربران به خاطر می‌آورد و به طور فعال اطلاعات را بازیابی می‌کند @mustafasuleyman

کاربردها

ایتان مالیک نشان می‌دهد که Sora 2 محتوای بسیار خاصی از جمله ارجاعات آکادمیک ایجاد می‌کند، که نشان می‌دهد یک LLM در خط لوله بین پرامپت و خروجی ویدئو نقش دارد @emollick
مرورگر Comet به سرعت در هر دو پلتفرم ویندوز و مک با یکپارچه‌سازی هوش مصنوعی که یادگیری آن احساس مزاحمت یا اجبار نمی‌دهد، مورد استقبال قرار می‌گیرد @AravSrinivas
Physical Intelligence مدل pi0.5 Vision-Language-Action را در Hugging Face منتشر کرد؛ این مدل برای تعمیم‌پذیری در دنیای باز، در سطوح فیزیکی، معنایی و محیطی از طریق آموزش مشترک بر روی منابع داده‌ی ناهمگون طراحی شده است @ClementDelangue

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که آموزش مدل‌های هوش مصنوعی با ویدئوهای کافی، امکان استدلال در مورد تصاویر را به روش‌هایی فراهم می‌کند که هرگز برای آن‌ها آموزش ندیده‌اند، از جمله حل مارپیچ‌ها و پازل‌ها؛ همچنین، مدل‌های بزرگ‌تر در وظایف خارج از توزیع (Out-of-Distribution) عملکرد بهتری دارند @emollick
Sora 2 در بنچمارک GPQA Diamond به امتیاز ۵۵ درصد رسید، که با عملکرد Claude 3 Opus در زمان عرضه برابری می‌کند؛ این موضوع این سؤال را مطرح می‌کند که آیا این قابلیت‌ها صرفاً از یک مدل ویدئویی خالص نشئت می‌گیرند یا شامل مؤلفه‌های مدل زبان اضافی نیز می‌شوند @AndrewCurran_
GPT-5 Pro قابلیت‌های بهبود یافته‌ی تشخیص خطا را در کارهای آکادمیک نشان می‌دهد و خطاهای جزئی در ارجاعات را که داوران انسانی از دست داده بودند، پیدا می‌کند @emollick
پژوهشگران استنفورد چارچوب RLAD را برای آموزش LLMها به منظور کشف انتزاعات استدلالی معرفی کردند؛ این انتزاعات، سرنخ‌های زبان طبیعی هستند که دانش رویه‌ای را برای کاوش ساختاریافته در مسائل استدلالی پیچیده کدگذاری می‌کنند @Anikait_Singh_