اخبار هوش مصنوعی در 2025-05-11
مدلهای جدید هوش مصنوعی
- قابلیتهای o3 با عنوان «توانمندترین مدل روی زمین» با قابلیتهای جستجوی پیشرفته، اجرای پایتون و قالببندی برجسته شده است. @aidan_mclau
پژوهشها
- پژوهش در مورد «RL فقط با یک مثال آموزشی» نشان میدهد که مدلها میتوانند معیارهایی مانند MATH500 را بدون بیشبرازش (overfitting) بهبود بخشند، وقتی که به طور مکرر یک مسئله را حل میکنند. @alexgraveley
- مقاله در مورد «تشخیص توکن جایگزینشده» به عنوان یک وظیفه پیشآموزشی با نمونهگیری کارآمدتر با استفاده از معماری مولد-تمیزدهنده، که از نظر محاسباتی کارآمدتر از مدلسازی زبان پوشاندهشده است. @stanfordnlp
- عملکرد OLMo 32B بهتر از Nemotron 340B و Llama 3 70B است، که نشان میدهد مدلهای کاملاً باز از نظر عملکرد به آنچه عموماً تصور میشود، نزدیکتر هستند. @natolambert
کاربردها
- Human Behavior در حال ساخت یک هوش مصنوعی است که بازپخش جلسات را تجزیه و تحلیل میکند تا بفهمد چرا مشتریان در محصولات میمانند، تبدیل میشوند یا آنها را ترک میکنند. @ycombinator
- Claude 3.7 و GPT-4.1 اکنون ساختن عاملها را بسیار آسانتر میکنند. @alexgraveley
- معماری زیرساخت و امنیت Cursor در یادداشتهایی بر اساس مستندات پردازشگرهای فرعی آنها به تفصیل شرح داده شده است. @simonw
تحلیل صنعت
- گزارش شده است که مایکروسافت و OpenAI در حال بازنگری قرارداد خود هستند و مایکروسافت پیشنهاد داده است که در ازای دسترسی مداوم به مدلهای توسعهیافته پس از سال 2030، بخشی از سهام خود را واگذار کند. @AndrewCurran_ @TechCrunch
- Gemma گوگل به 150 میلیون بارگیری و بیش از 70000 نوع مختلف در Hugging Face رسیده است. @demishassabis
- چارچوب DSPy به عنوان حلکنندهی انتزاعات کلیدی برای هوش مصنوعی مدرن برجسته شده است، که پیادهسازی چندریختی مقیاسبندی استنتاج، یادگیری تقویتی LLM و سایر قابلیتها را امکانپذیر میکند. @stanfordnlp
- آمازون از نقشهای شغلی انسانی جدیدی که در یک محیط کار مبتنی بر هوش مصنوعی در حال ظهور هستند، رونمایی میکند. @TechCrunch
اخلاق و جامعه
- آندری کارپاتی «یادگیری اعلان سیستمی» را به عنوان یک الگوی گمشده برای یادگیری LLM پیشنهاد میکند، جایی که مدلها به جای تکیه صرف بر بهروزرسانی پارامترها، استراتژیهای صریح حل مسئله را توسعه میدهند. @karpathy
- مشخص شده است که اعلان سیستمی Claude حدود 17000 کلمه است و نه تنها شامل ترجیحات رفتاری، بلکه استراتژیهای دقیق حل مسئله نیز میشود. @karpathy
- به دانشگاهیان توصیه میشود که با وادار کردن o3 یا Gemini 2.5 به نقد مقالات پژوهشی خود، قابلیتهای هوش مصنوعی را آزمایش کنند. @emollick
- نگرانیها در مورد برنامهریزی کارخانه در پرتو پیشرفتهای بالقوه رباتیک که میتواند ترکیبهای سنتی انسان/اتوماسیون را در عرض 5 سال منسوخ کند. @emollick