اخبار هوش مصنوعی در 2025-09-16

مدل‌های جدید هوش مصنوعی

  • OpenAI صفحه‌ی شخصی‌سازی ChatGPT را به‌روزرسانی می‌کند و تنظیمات شخصیت، دستورالعمل‌های سفارشی و حافظه‌ها را در یک رابط کاربری یکپارچه ادغام می‌کند @sama
  • گوگل نسخه‌ی سفارشی از مدل Veo 3 Fast را برای YouTube Shorts منتشر می‌کند که امکان تولید ویدئو با افکت‌های صوتی و گفتار را تنها با یک پرامپت فراهم می‌آورد @GoogleDeepMind
  • گوگل مدل Lyria 2 را معرفی می‌کند که ویژگی Speech to Song را قدرت می‌بخشد و کلمات گفتاری را به موسیقی برای YouTube Shorts تبدیل می‌کند @GoogleDeepMind
  • علی‌بابا Tongyi DeepResearch را راه‌اندازی می‌کند، اولین عامل وب (Web Agent) کاملاً متن‌باز که عملکردی قابل مقایسه با Deep Research OpenAI را با تنها 30 میلیارد پارامتر ارائه می‌دهد @Ali_TongyiLab
  • Unitree مدل UnifoLM-WMA-0 را منتشر می‌کند، اولین معماری متن‌باز world-model-action برای یادگیری ربات‌های عمومی در چندین شکل رباتیک @ClementDelangue

تحلیل صنعت

  • داده‌های OpenAI و Anthropic نشان می‌دهد که هوش مصنوعی عمدتاً برای کارهای سطح بالا از جمله تفکر انتقادی، تفسیر اطلاعات، ارائه‌ی مشاوره و کارهای خلاقانه مورد استفاده قرار می‌گیرد، نه برای اتوماسیون ساده @emollick
  • پژوهش‌ها نشان می‌دهد که GPT-5-Codex به دلیل تقاضای بالاتر از پیش‌بینی، عملکردی 2 برابر کندتر از اهداف دارد و نیازمند ظرفیت GPU اضافی است @embirico
  • مطالعه‌ای بر روی 1.5 میلیون مکالمه‌ی ناشناس ChatGPT نشان می‌دهد که 75 درصد از کاربرد آن بر اطلاعات، راهنمایی و نوشتن تمرکز دارد، که 30 درصد آن مربوط به کار و 70 درصد شخصی است @nickaturley
  • توسعه‌دهندگان حرفه‌ای به‌طور فزاینده‌ای از هوش مصنوعی برای «vibe coding» استفاده می‌کنند تا ابزارهای داخلی مانند ابزارهای بصری‌سازی داده و نمایشگر را بسازند، جایی که نگرانی‌های امنیتی و مقیاس‌پذیری حداقل است @GergelyOrosz
  • پژوهش 18 شرکت فناوری نشان می‌دهد که ادغام ابزارهای هوش مصنوعی در ابزارهای کمتر، پیچیده‌تر و با پارامترهای غنی‌تر، دقت را بهبود می‌بخشد و استفاده از توکن را تا 70% در مقایسه با ابزارهای ساده و پراکنده کاهش می‌دهد @ttunguz
  • مایکروسافت از سرمایه‌گذاری 30 میلیارد دلاری در بریتانیا طی چهار سال خبر می‌دهد که شامل ساخت بزرگترین ابررایانه‌ی این کشور با بیش از 23,000 پردازنده‌ی گرافیکی پیشرفته است @satyanadella
  • Figure بیش از 1 میلیارد دلار در تأمین مالی سری C به رهبری Parkway Venture Capital برای توسعه‌ی رباتیک انسان‌نما جذب می‌کند @TechCrunch

اخلاق و جامعه

  • OpenAI یک سیستم پیش‌بینی سن را برای شناسایی کاربران زیر 18 سال پیاده‌سازی می‌کند، در صورت عدم اطمینان به تجربه‌ی کاربری زیر 18 سال تغییر می‌دهد و در برخی موارد برای محافظت از خردسالان، تأیید هویت را الزامی می‌کند @sama
  • OpenAI قوانین ایمنی متفاوتی برای نوجوانان وضع می‌کند، از جمله آموزش ChatGPT برای پرهیز از مکالمات عشوه واره و نگارش خلاقانه در مورد خودکشی، با برنامه‌ریزی برای تماس با والدین یا مقامات برای کاربرانی که افکار خودکشی را نشان می‌دهند @TechCrunch
  • دیزنی، یونیورسال استودیوز و وارنر بروس از استارت‌آپ چینی MiniMax شکایت می‌کنند و آنها را متهم به سرقت اموال فکری برای قدرت بخشیدن به مدل هوش مصنوعی Hailuo خود می‌کنند @AndrewCurran_
  • موفقیت در پذیرش سازمانی هوش مصنوعی به‌طور فزاینده‌ای به این بستگی دارد که آیا کمیته‌های هوش مصنوعی مسئولیت‌پذیر که در سال 2023 تشکیل شده‌اند، با تحولات هوش مصنوعی همگام بوده‌اند و آیا اعضا به‌طور فعال از هوش مصنوعی در محل کار استفاده می‌کنند @emollick

کاربردها

  • Cursor نسخه‌ی 1.6 را با دستورات سفارشی برای پرامپت‌های قابل استفاده‌ی مجدد، ترمینال Agent سریع‌تر، پشتیبانی از منابع MCP و قابلیت دستور /summarize منتشر می‌کند @cursor_ai
  • کاربران Perplexity Pro اکنون می‌توانند حساب‌های ایمیل، تقویم، Notion و GitHub خود را متصل کنند؛ کاربران Enterprise Pro نیز از ادغام Linear و Outlook بهره‌مند می‌شوند @perplexity_ai
  • World Labs تولید دنیای سه‌بعدی در مقیاس بزرگ را با استفاده از مدل Marble خود نشان می‌دهد که محیط‌های سه‌بعدی پایدار و گسترده را از تصاویر تکی ایجاد می‌کند @drfeifei
  • گوگل ویژگی Edit with AI را برای YouTube معرفی می‌کند که فیلم خام را تحلیل کرده، بهترین لحظات را انتخاب کرده و محتوا را با موسیقی، افکت‌ها و صداگذاری‌ها ترکیب می‌کند @GoogleDeepMind
  • Microsoft Copilot ویژگی Audio Expressions را راه‌اندازی می‌کند که امکان تبدیل متون نوشته شده به روایت گفتاری طبیعی و تولید داستان در لحظه را فراهم می‌آورد @Copilot
  • Waymo پس از سال‌ها مذاکره، مجوز شروع عملیات وسایل نقلیه‌ی خودران را در فرودگاه بین‌المللی سانفرانسیسکو دریافت می‌کند @Waymo
  • رفتار جدید Codex شامل استفاده از نرم‌افزار پیش‌نمایش برای گرفتن اسکرین‌شات از توسعه‌ی فرانت‌اند برای رفع اشکال بصری است، به جای تکیه صرف بر تحلیل کد @natolambert

پژوهش‌ها

  • یک مقاله‌ی پژوهشی استدلال می‌کند که بازده نزولی در مقیاس هوش مصنوعی توهمی است و نشان می‌دهد که دستاوردهای کوچک دقت در پروژه‌های طولانی، جایی که ارزش اقتصادی از اتمام وظایف به‌دست می‌آید نه از سؤالات تکی، به‌صورت تصاعدی افزایش می‌یابند @emollick
  • نتایج جدید و پیشرفته در بنچمارک ARC-AGI با 79.6% در V1 و 29.4% در V2 با استفاده از راه‌حل‌های متن‌باز که ترکیب برنامه را با Grok 4 و تطبیق در زمان آزمایش پیاده‌سازی می‌کنند، به‌دست آمد @arcprize
  • پژوهش Anthropic نشان می‌دهد که ابزارهای هوش مصنوعی پیچیده و با پارامترهای غنی، بهتر از ابزارهای ساده عمل می‌کنند و با درک کامل زمینه به جای نیت پراکنده، تا 70% در توکن‌های خروجی صرفه‌جویی کرده و دقت را بهبود می‌بخشند @ttunguz
  • OpenMed AI بیش از 90 مدل NER زیست‌پزشکی و بالینی صفر-شات متن‌باز را منتشر می‌کند که بر اساس معماری GLiNER ساخته شده‌اند و بیش از 12 مجموعه‌ی داده‌ی زیست‌پزشکی را تحت مجوز Apache-2.0 پوشش می‌دهند @MaziyarPanahi
  • LeRobot فرمت به‌روزرسانی شده‌ی مجموعه‌ی داده v3 را منتشر می‌کند که از مجموعه‌داده‌های چند میلیون اپیزودی و قابلیت‌های استریمینگ برای بهبود عملکرد رباتیک در مقیاس بزرگ پشتیبانی می‌کند @_fracapuano