اخبار هوش مصنوعی در 2025-05-11

قابلیت‌های ‏o3 با عنوان «توانمندترین مدل روی زمین» با قابلیت‌های جستجوی پیشرفته، اجرای پایتون و قالب‌بندی برجسته شده است. @aidan_mclau

پژوهش در مورد «‏RL فقط با یک مثال آموزشی» نشان می‌دهد که مدل‌ها می‌توانند معیارهایی مانند ‏MATH500 را بدون بیش‌برازش (overfitting) بهبود بخشند، وقتی که به طور مکرر یک مسئله را حل می‌کنند. @alexgraveley
مقاله در مورد «تشخیص توکن جایگزین‌شده» به عنوان یک وظیفه پیش‌آموزشی با نمونه‌گیری کارآمدتر با استفاده از معماری مولد-تمیزدهنده، که از نظر محاسباتی کارآمدتر از مدل‌سازی زبان پوشانده‌شده است. @stanfordnlp
عملکرد ‏OLMo 32B بهتر از ‏Nemotron 340B و ‏Llama 3 70B است، که نشان می‌دهد مدل‌های کاملاً باز از نظر عملکرد به آن‌چه عموماً تصور می‌شود، نزدیک‌تر هستند. @natolambert

‏Human Behavior در حال ساخت یک هوش مصنوعی است که بازپخش جلسات را تجزیه و تحلیل می‌کند تا بفهمد چرا مشتریان در محصولات می‌مانند، تبدیل می‌شوند یا آن‌ها را ترک می‌کنند. @ycombinator
‏Claude 3.7 و ‏GPT-4.1 اکنون ساختن عامل‌ها را بسیار آسان‌تر می‌کنند. @alexgraveley
معماری زیرساخت و امنیت ‏Cursor در یادداشت‌هایی بر اساس مستندات پردازشگرهای فرعی آن‌ها به تفصیل شرح داده شده است. @simonw

گزارش شده است که مایکروسافت و ‏OpenAI در حال بازنگری قرارداد خود هستند و مایکروسافت پیشنهاد داده است که در ازای دسترسی مداوم به مدل‌های توسعه‌یافته پس از سال 2030، بخشی از سهام خود را واگذار کند. @AndrewCurran_ @TechCrunch
‏Gemma گوگل به 150 میلیون بارگیری و بیش از 70000 نوع مختلف در ‏Hugging Face رسیده است. @demishassabis
چارچوب ‏DSPy به عنوان حل‌کننده‌ی انتزاعات کلیدی برای هوش مصنوعی مدرن برجسته شده است، که پیاده‌سازی چندریختی مقیاس‌بندی استنتاج، یادگیری تقویتی ‏LLM و سایر قابلیت‌ها را امکان‌پذیر می‌کند. @stanfordnlp
آمازون از نقش‌های شغلی انسانی جدیدی که در یک محیط کار مبتنی بر هوش مصنوعی در حال ظهور هستند، رونمایی می‌کند. @TechCrunch

آندری کارپاتی «یادگیری اعلان سیستمی» را به عنوان یک الگوی گمشده برای یادگیری ‏LLM پیشنهاد می‌کند، جایی که مدل‌ها به جای تکیه صرف بر به‌روزرسانی پارامترها، استراتژی‌های صریح حل مسئله را توسعه می‌دهند. @karpathy
مشخص شده است که اعلان سیستمی ‏Claude حدود 17000 کلمه است و نه تنها شامل ترجیحات رفتاری، بلکه استراتژی‌های دقیق حل مسئله نیز می‌شود. @karpathy
به دانشگاهیان توصیه می‌شود که با وادار کردن ‏o3 یا ‏Gemini 2.5 به نقد مقالات پژوهشی خود، قابلیت‌های هوش مصنوعی را آزمایش کنند. @emollick
نگرانی‌ها در مورد برنامه‌ریزی کارخانه در پرتو پیشرفت‌های بالقوه رباتیک که می‌تواند ترکیب‌های سنتی انسان/اتوماسیون را در عرض 5 سال منسوخ کند. @emollick