اخبار هوش مصنوعی در 2025-09-16

مدل‌های جدید هوش مصنوعی

OpenAI صفحه‌ی شخصی‌سازی ChatGPT را به‌روزرسانی می‌کند و تنظیمات شخصیت، دستورالعمل‌های سفارشی و حافظه‌ها را در یک رابط کاربری یکپارچه ادغام می‌کند @sama
گوگل نسخه‌ی سفارشی از مدل Veo 3 Fast را برای YouTube Shorts منتشر می‌کند که امکان تولید ویدئو با افکت‌های صوتی و گفتار را تنها با یک پرامپت فراهم می‌آورد @GoogleDeepMind
گوگل مدل Lyria 2 را معرفی می‌کند که ویژگی Speech to Song را قدرت می‌بخشد و کلمات گفتاری را به موسیقی برای YouTube Shorts تبدیل می‌کند @GoogleDeepMind
علی‌بابا Tongyi DeepResearch را راه‌اندازی می‌کند، اولین عامل وب (Web Agent) کاملاً متن‌باز که عملکردی قابل مقایسه با Deep Research OpenAI را با تنها 30 میلیارد پارامتر ارائه می‌دهد @Ali_TongyiLab
Unitree مدل UnifoLM-WMA-0 را منتشر می‌کند، اولین معماری متن‌باز world-model-action برای یادگیری ربات‌های عمومی در چندین شکل رباتیک @ClementDelangue

تحلیل صنعت

داده‌های OpenAI و Anthropic نشان می‌دهد که هوش مصنوعی عمدتاً برای کارهای سطح بالا از جمله تفکر انتقادی، تفسیر اطلاعات، ارائه‌ی مشاوره و کارهای خلاقانه مورد استفاده قرار می‌گیرد، نه برای اتوماسیون ساده @emollick
پژوهش‌ها نشان می‌دهد که GPT-5-Codex به دلیل تقاضای بالاتر از پیش‌بینی، عملکردی 2 برابر کندتر از اهداف دارد و نیازمند ظرفیت GPU اضافی است @embirico
مطالعه‌ای بر روی 1.5 میلیون مکالمه‌ی ناشناس ChatGPT نشان می‌دهد که 75 درصد از کاربرد آن بر اطلاعات، راهنمایی و نوشتن تمرکز دارد، که 30 درصد آن مربوط به کار و 70 درصد شخصی است @nickaturley
توسعه‌دهندگان حرفه‌ای به‌طور فزاینده‌ای از هوش مصنوعی برای «vibe coding» استفاده می‌کنند تا ابزارهای داخلی مانند ابزارهای بصری‌سازی داده و نمایشگر را بسازند، جایی که نگرانی‌های امنیتی و مقیاس‌پذیری حداقل است @GergelyOrosz
پژوهش 18 شرکت فناوری نشان می‌دهد که ادغام ابزارهای هوش مصنوعی در ابزارهای کمتر، پیچیده‌تر و با پارامترهای غنی‌تر، دقت را بهبود می‌بخشد و استفاده از توکن را تا 70% در مقایسه با ابزارهای ساده و پراکنده کاهش می‌دهد @ttunguz
مایکروسافت از سرمایه‌گذاری 30 میلیارد دلاری در بریتانیا طی چهار سال خبر می‌دهد که شامل ساخت بزرگترین ابررایانه‌ی این کشور با بیش از 23,000 پردازنده‌ی گرافیکی پیشرفته است @satyanadella
Figure بیش از 1 میلیارد دلار در تأمین مالی سری C به رهبری Parkway Venture Capital برای توسعه‌ی رباتیک انسان‌نما جذب می‌کند @TechCrunch

اخلاق و جامعه

OpenAI یک سیستم پیش‌بینی سن را برای شناسایی کاربران زیر 18 سال پیاده‌سازی می‌کند، در صورت عدم اطمینان به تجربه‌ی کاربری زیر 18 سال تغییر می‌دهد و در برخی موارد برای محافظت از خردسالان، تأیید هویت را الزامی می‌کند @sama
OpenAI قوانین ایمنی متفاوتی برای نوجوانان وضع می‌کند، از جمله آموزش ChatGPT برای پرهیز از مکالمات عشوه واره و نگارش خلاقانه در مورد خودکشی، با برنامه‌ریزی برای تماس با والدین یا مقامات برای کاربرانی که افکار خودکشی را نشان می‌دهند @TechCrunch
دیزنی، یونیورسال استودیوز و وارنر بروس از استارت‌آپ چینی MiniMax شکایت می‌کنند و آنها را متهم به سرقت اموال فکری برای قدرت بخشیدن به مدل هوش مصنوعی Hailuo خود می‌کنند @AndrewCurran_
موفقیت در پذیرش سازمانی هوش مصنوعی به‌طور فزاینده‌ای به این بستگی دارد که آیا کمیته‌های هوش مصنوعی مسئولیت‌پذیر که در سال 2023 تشکیل شده‌اند، با تحولات هوش مصنوعی همگام بوده‌اند و آیا اعضا به‌طور فعال از هوش مصنوعی در محل کار استفاده می‌کنند @emollick

کاربردها

Cursor نسخه‌ی 1.6 را با دستورات سفارشی برای پرامپت‌های قابل استفاده‌ی مجدد، ترمینال Agent سریع‌تر، پشتیبانی از منابع MCP و قابلیت دستور /summarize منتشر می‌کند @cursor_ai
کاربران Perplexity Pro اکنون می‌توانند حساب‌های ایمیل، تقویم، Notion و GitHub خود را متصل کنند؛ کاربران Enterprise Pro نیز از ادغام Linear و Outlook بهره‌مند می‌شوند @perplexity_ai
World Labs تولید دنیای سه‌بعدی در مقیاس بزرگ را با استفاده از مدل Marble خود نشان می‌دهد که محیط‌های سه‌بعدی پایدار و گسترده را از تصاویر تکی ایجاد می‌کند @drfeifei
گوگل ویژگی Edit with AI را برای YouTube معرفی می‌کند که فیلم خام را تحلیل کرده، بهترین لحظات را انتخاب کرده و محتوا را با موسیقی، افکت‌ها و صداگذاری‌ها ترکیب می‌کند @GoogleDeepMind
Microsoft Copilot ویژگی Audio Expressions را راه‌اندازی می‌کند که امکان تبدیل متون نوشته شده به روایت گفتاری طبیعی و تولید داستان در لحظه را فراهم می‌آورد @Copilot
Waymo پس از سال‌ها مذاکره، مجوز شروع عملیات وسایل نقلیه‌ی خودران را در فرودگاه بین‌المللی سانفرانسیسکو دریافت می‌کند @Waymo
رفتار جدید Codex شامل استفاده از نرم‌افزار پیش‌نمایش برای گرفتن اسکرین‌شات از توسعه‌ی فرانت‌اند برای رفع اشکال بصری است، به جای تکیه صرف بر تحلیل کد @natolambert

پژوهش‌ها

یک مقاله‌ی پژوهشی استدلال می‌کند که بازده نزولی در مقیاس هوش مصنوعی توهمی است و نشان می‌دهد که دستاوردهای کوچک دقت در پروژه‌های طولانی، جایی که ارزش اقتصادی از اتمام وظایف به‌دست می‌آید نه از سؤالات تکی، به‌صورت تصاعدی افزایش می‌یابند @emollick
نتایج جدید و پیشرفته در بنچمارک ARC-AGI با 79.6% در V1 و 29.4% در V2 با استفاده از راه‌حل‌های متن‌باز که ترکیب برنامه را با Grok 4 و تطبیق در زمان آزمایش پیاده‌سازی می‌کنند، به‌دست آمد @arcprize
پژوهش Anthropic نشان می‌دهد که ابزارهای هوش مصنوعی پیچیده و با پارامترهای غنی، بهتر از ابزارهای ساده عمل می‌کنند و با درک کامل زمینه به جای نیت پراکنده، تا 70% در توکن‌های خروجی صرفه‌جویی کرده و دقت را بهبود می‌بخشند @ttunguz
OpenMed AI بیش از 90 مدل NER زیست‌پزشکی و بالینی صفر-شات متن‌باز را منتشر می‌کند که بر اساس معماری GLiNER ساخته شده‌اند و بیش از 12 مجموعه‌ی داده‌ی زیست‌پزشکی را تحت مجوز Apache-2.0 پوشش می‌دهند @MaziyarPanahi
LeRobot فرمت به‌روزرسانی شده‌ی مجموعه‌ی داده v3 را منتشر می‌کند که از مجموعه‌داده‌های چند میلیون اپیزودی و قابلیت‌های استریمینگ برای بهبود عملکرد رباتیک در مقیاس بزرگ پشتیبانی می‌کند @_fracapuano