اخبار هوش مصنوعی در 2025-10-03
مدلهای جدید هوش مصنوعی
- اوپنایآی Sora 2 Pro را با قابلیتهای رزولوشن بالاتر و کلیپهای ۱۵ ثانیهای به جای ۱۰ ثانیه منتشر کرد؛ این نسخه اکنون در حال عرضه برای حسابهای کاربری حرفهای (Pro) است @AndrewCurran_
- آنتروپیک از بهبودهایی در Claude Sonnet 4.5 برای وظایف امنیت سایبری خبر داد؛ این بهبودها آن را قابل مقایسه یا برتر از Opus 4.1 کرده و در عین حال سریعتر و ارزانتر است @AnthropicAI
تحلیل صنعت
- سیرا ایجنت OS نشان میدهد که چگونه مدلهای نظارتی، فیلترینگ و ارزیابیها عملکردی پیشرو در صنعت در کاربردهای هوش مصنوعی سازمانی ارائه میدهند @btaylor
- گزارش MIT CSAIL نشان میدهد که استارتاپهای هوش مصنوعی هزینهی زیادی برای دستیارهای عمومی LLM و ابزارهای کدنویسی میکنند؛ این موضوع نشان میدهد که چگونه هوش مصنوعی برخی از کارمندان را تقویت میکند، در حالی که سایر نقشها را به مهارتهای با استقرار گسترده تبدیل میکند @MIT_CSAIL
- تحلیل a16z نشان میدهد که نرمافزار بازار کار ۱۳ تریلیون دلاری ایالات متحده را هدف قرار داده است، در مقایسه با تنها ۳۰۰ میلیارد دلار برای SaaS؛ این در حالی است که هوش مصنوعی نرمافزار را قادر میسازد تا خود کار را انجام دهد و بر اساس نتایج هزینه دریافت کند @a16z
- مایکروسافت بر ساخت زیرساخت هوش مصنوعی قابل تعویض و منعطف برای برآوردن نیازهای دنیای واقعی در استنتاج (Inference) و آموزش (Training) تأکید میکند؛ این زیرساخت، بارهای کاری اصلی مانند Copilot و ChatGPT را تأمین میکند @satyanadella
اخلاق و جامعه
- آنتروپیک هشدار میدهد که تأثیر هوش مصنوعی بر امنیت سایبری در نقطهی عطف قرار دارد؛ با توجه به اینکه Claude اکنون در برخی رقابتها بهتر از تیمهای انسانی عمل میکند، در حالی که مهاجمان نیز از هوش مصنوعی برای گسترش عملیات خود استفاده میکنند @AnthropicAI
- ایتان مالیک مشاهده میکند که وقتی ابزارهای خلاقیت به افراد داده میشود تا هر چیزی را ایجاد کنند، آنها عمدتاً ویدئوهایی از گربهها، افراد مشهور و شخصیتهای انیمه میسازند؛ این موضوع نشان میدهد که ابزارهای خلاقیت هوش مصنوعی ممکن است به رویکردهای تنظیم (Curation) متفاوتی نیاز داشته باشند @emollick
- مصطفی سلیمان استدلال میکند که حافظهی هوش مصنوعی چیزی فراتر از شخصیسازی است و به حافظهی مشترکی (co-memory) تبدیل میشود که جهان را همراه با کاربران به خاطر میآورد و به طور فعال اطلاعات را بازیابی میکند @mustafasuleyman
کاربردها
- ایتان مالیک نشان میدهد که Sora 2 محتوای بسیار خاصی از جمله ارجاعات آکادمیک ایجاد میکند، که نشان میدهد یک LLM در خط لوله بین پرامپت و خروجی ویدئو نقش دارد @emollick
- مرورگر Comet به سرعت در هر دو پلتفرم ویندوز و مک با یکپارچهسازی هوش مصنوعی که یادگیری آن احساس مزاحمت یا اجبار نمیدهد، مورد استقبال قرار میگیرد @AravSrinivas
- Physical Intelligence مدل pi0.5 Vision-Language-Action را در Hugging Face منتشر کرد؛ این مدل برای تعمیمپذیری در دنیای باز، در سطوح فیزیکی، معنایی و محیطی از طریق آموزش مشترک بر روی منابع دادهی ناهمگون طراحی شده است @ClementDelangue
پژوهشها
- پژوهشها نشان میدهد که آموزش مدلهای هوش مصنوعی با ویدئوهای کافی، امکان استدلال در مورد تصاویر را به روشهایی فراهم میکند که هرگز برای آنها آموزش ندیدهاند، از جمله حل مارپیچها و پازلها؛ همچنین، مدلهای بزرگتر در وظایف خارج از توزیع (Out-of-Distribution) عملکرد بهتری دارند @emollick
- Sora 2 در بنچمارک GPQA Diamond به امتیاز ۵۵ درصد رسید، که با عملکرد Claude 3 Opus در زمان عرضه برابری میکند؛ این موضوع این سؤال را مطرح میکند که آیا این قابلیتها صرفاً از یک مدل ویدئویی خالص نشئت میگیرند یا شامل مؤلفههای مدل زبان اضافی نیز میشوند @AndrewCurran_
- GPT-5 Pro قابلیتهای بهبود یافتهی تشخیص خطا را در کارهای آکادمیک نشان میدهد و خطاهای جزئی در ارجاعات را که داوران انسانی از دست داده بودند، پیدا میکند @emollick
- پژوهشگران استنفورد چارچوب RLAD را برای آموزش LLMها به منظور کشف انتزاعات استدلالی معرفی کردند؛ این انتزاعات، سرنخهای زبان طبیعی هستند که دانش رویهای را برای کاوش ساختاریافته در مسائل استدلالی پیچیده کدگذاری میکنند @Anikait_Singh_