اخبار هوش مصنوعی در 2025-05-14

مدل‌های جدید هوش مصنوعی

‏Google DeepMind، AlphaEvolve را معرفی کرد، یک عامل کدنویسی مبتنی بر Gemini برای کشف الگوریتم که می‌تواند الگوریتم‌های ضرب ماتریسی سریع‌تری طراحی کند، راه‌حل‌های جدیدی برای مسائل باز ریاضی پیدا کند و مراکز داده را کارآمدتر کند. @GoogleDeepMind
‏OpenAI، GPT-4.1 و GPT-4.1 mini را مستقیماً در ChatGPT در دسترس قرار می‌دهد، و GPT-4.1 mini جایگزین GPT-4o mini می‌شود. @OpenAI
‏Stability AI، Stable Audio Open Small را منتشر کرد، یک مدل تبدیل متن به صدا با 341 میلیون پارامتر که برای اجرا به‌طور کامل روی پردازنده‌های Arm بهینه شده است و تولید صدا روی دستگاه را در 99٪ تلفن‌های هوشمند امکان‌پذیر می‌کند. @StabilityAI
‏Hugging Face، Wan2.1 را منتشر کرد، مدلی که در تبدیل متن به ویدیو، تبدیل تصویر به ویدیو، ویرایش ویدیو، تبدیل متن به تصویر و تبدیل ویدیو به صدا عالی است. @huggingface
‏StepFun AI، Step1X-3D را منتشر کرد، یک چارچوب تولید سه‌بعدی باز با 4.8 میلیارد پارامتر (1.3 میلیارد هندسه + 3.5 میلیارد بافت) تحت مجوز Apache 2.0. @huggingface
‏Meta FAIR مجموعه داده‌ی Open Molecules 2025 (OMol25) و Universal Model for Atoms (UMA) را برای کشف مولکولی و مدل‌سازی تعاملات اتمی منتشر کرد. @AIatMeta

پژوهش‌ها

‏AlphaEvolve روی بیش از 50 مسئله‌ی باز در تحلیل ریاضی، هندسه، ترکیبیات و نظریه اعداد اعمال شد، راه‌حل‌های پیشرفته را در 75٪ موارد دوباره کشف کرد و راه‌حل‌های قبلی را در 20٪ موارد بهبود بخشید. @GoogleDeepMind
‏AlphaEvolve یک بازنویسی ساده کد پیدا کرد که بیت‌های غیرضروری را در طراحی TPU حذف کرد، که توسط طراحان TPU از نظر صحت تأیید شد و اولین مشارکت مستقیم Gemini در مدارهای حسابی TPU را نشان می‌دهد. @AndrewCurran_
‏AlphaEvolve هسته FlashAttention را 32٪ سرعت بخشید و بهبودهایی در پیش‌پردازش و پس‌پردازش ورودی‌ها و خروجی‌های هسته پیدا کرد که منجر به 15٪ افزایش سرعت شد. @AndrewCurran_
‏Meta FAIR و بیمارستان بنیاد Rothschild در یک مطالعه‌ی بزرگ مقیاس با همکاری یکدیگر، شباهت‌های چشمگیری بین توسعه‌ی زبان در انسان‌ها و LLMها را آشکار کردند. @AIatMeta
‏Meta، Adjoint Sampling را منتشر کرد، یک الگوریتم مقیاس‌پذیر برای آموزش مدل‌های مولد بر اساس پاداش‌های اسکالر. @AIatMeta

کاربردها

‏Anthropic یک ابتکار عمل برای یافتن باگ راه‌اندازی می‌کند تا یک نسخه‌ی به‌روز شده از سیستم ضد فرار از محدودیت خود را قبل از استقرار عمومی، با همکاری HackerOne، آزمایش کند. @AnthropicAI
‏Gemini Advanced اکنون به GitHub متصل می‌شود و به کاربران اجازه می‌دهد توابع را تولید/تغییر دهند، کد پیچیده را توضیح دهند، سؤالاتی در مورد پایگاه‌های کد بپرسند و با وارد کردن کد از مخازن عمومی یا خصوصی، اشکال‌زدایی کنند. @GeminiApp
‏Perplexity از ادغام با PayPal و Venmo برای ویژگی‌های تجاری از جمله خرید، مسافرت، دستیارهای صوتی و مرورگر عامل آینده‌شان به نام Comet خبر می‌دهد. @perplexity_ai
‏Google، Gemini را به Wear OS، Android Auto، Google TV و Android XR می‌آورد، در حالی که ویژگی‌های اشتراک‌گذاری دوربین و صفحه نمایش Gemini Live را برای همه‌ی کاربران Android رایگان می‌کند. @demishassabis
‏Y Combinator، Storyboards را راه‌اندازی می‌کند، ابزاری که اسکریپت‌ها را به استوری‌بوردهای کامل با کنترل سطح شات و سازگاری شخصیت/صحنه تبدیل می‌کند. @ycombinator
‏Amjad Masad از Percival خبر می‌دهد، یک عامل هوش مصنوعی که می‌تواند سایر عوامل هوش مصنوعی را ارزیابی و اصلاح کند و 2.9 برابر بهتر از SOTA LLMها در مجموعه داده TRAIL عمل می‌کند. @amasad

تحلیل صنعت

مشاغل BigTech (‏Google، Microsoft، Apple، Tesla، Meta، Nvidia، Palantir) در 3 سال گذشته هیچ رشدی نداشته‌اند و این امر باعث شده است که یافتن شغل برای رشته‌های علوم کامپیوتر دشوار شود، زیرا شرکت‌ها به طور بالقوه از هوش مصنوعی برای رشد بدون استخدام استفاده می‌کنند. @deedydas
‏Kaggle با Hugging Face همکاری می‌کند تا استفاده مستقیم از مدل‌های Hugging Face را در Kaggle Notebooks، همراه با کشف نمونه‌های کد عمومی مرتبط، امکان‌پذیر کند. @kaggle
‏Databricks استارتاپ سرورلس Postgres به نام Neon را به قیمت 1 میلیارد دلار خریداری می‌کند که نشان‌دهنده‌ی یک خروج تک‌شاخ نادر در بازار فناوری فعلی است. @deedydas
‏Andrew Ng دوره‌ی جدیدی را در مورد Model Context Protocol (MCP) با همکاری Anthropic اعلام می‌کند و نحوه‌ی ساخت برنامه‌های هوش مصنوعی را آموزش می‌دهد که با استفاده از پروتکل استاندارد به ابزارها، داده‌ها و اعلان‌ها دسترسی پیدا می‌کنند. @AndrewYNg

اخلاق و جامعه

‏OpenAI مرکز ارزیابی‌های ایمنی را معرفی می‌کند، منبعی برای بررسی نتایج ایمنی مدل‌هایشان که به طور دوره‌ای به عنوان بخشی از تلاش‌ها برای برقراری ارتباط فعالانه در مورد ایمنی به‌روزرسانی می‌شود. @OpenAI
‏Anthropic اشاره می‌کند که برخی از مدل‌های آینده ممکن است به حفاظت‌های پیشرفته «سطح ایمنی هوش مصنوعی 3» که در سیاست مقیاس‌بندی مسئولانه آن‌ها ذکر شده است، نیاز داشته باشند. @AnthropicAI
‏Paul Graham پیشنهاد می‌کند که AGI به معنای پایان مهندسی پرامپت خواهد بود، زیرا انسان‌های با هوش متوسط می‌توانند بفهمند که شما چه می‌خواهید بدون پرامپت‌های مفصل، و ما می‌توانیم از مراقبتی که برای ساخت پرامپت‌ها لازم است به عنوان شاخصی از میزان نزدیک شدن به AGI استفاده کنیم. @paulg