اخبار هوش مصنوعی در 2025-09-16
مدلهای جدید هوش مصنوعی
- OpenAI صفحهی شخصیسازی ChatGPT را بهروزرسانی میکند و تنظیمات شخصیت، دستورالعملهای سفارشی و حافظهها را در یک رابط کاربری یکپارچه ادغام میکند @sama
- گوگل نسخهی سفارشی از مدل Veo 3 Fast را برای YouTube Shorts منتشر میکند که امکان تولید ویدئو با افکتهای صوتی و گفتار را تنها با یک پرامپت فراهم میآورد @GoogleDeepMind
- گوگل مدل Lyria 2 را معرفی میکند که ویژگی Speech to Song را قدرت میبخشد و کلمات گفتاری را به موسیقی برای YouTube Shorts تبدیل میکند @GoogleDeepMind
- علیبابا Tongyi DeepResearch را راهاندازی میکند، اولین عامل وب (Web Agent) کاملاً متنباز که عملکردی قابل مقایسه با Deep Research OpenAI را با تنها 30 میلیارد پارامتر ارائه میدهد @Ali_TongyiLab
- Unitree مدل UnifoLM-WMA-0 را منتشر میکند، اولین معماری متنباز world-model-action برای یادگیری رباتهای عمومی در چندین شکل رباتیک @ClementDelangue
تحلیل صنعت
- دادههای OpenAI و Anthropic نشان میدهد که هوش مصنوعی عمدتاً برای کارهای سطح بالا از جمله تفکر انتقادی، تفسیر اطلاعات، ارائهی مشاوره و کارهای خلاقانه مورد استفاده قرار میگیرد، نه برای اتوماسیون ساده @emollick
- پژوهشها نشان میدهد که GPT-5-Codex به دلیل تقاضای بالاتر از پیشبینی، عملکردی 2 برابر کندتر از اهداف دارد و نیازمند ظرفیت GPU اضافی است @embirico
- مطالعهای بر روی 1.5 میلیون مکالمهی ناشناس ChatGPT نشان میدهد که 75 درصد از کاربرد آن بر اطلاعات، راهنمایی و نوشتن تمرکز دارد، که 30 درصد آن مربوط به کار و 70 درصد شخصی است @nickaturley
- توسعهدهندگان حرفهای بهطور فزایندهای از هوش مصنوعی برای «vibe coding» استفاده میکنند تا ابزارهای داخلی مانند ابزارهای بصریسازی داده و نمایشگر را بسازند، جایی که نگرانیهای امنیتی و مقیاسپذیری حداقل است @GergelyOrosz
- پژوهش 18 شرکت فناوری نشان میدهد که ادغام ابزارهای هوش مصنوعی در ابزارهای کمتر، پیچیدهتر و با پارامترهای غنیتر، دقت را بهبود میبخشد و استفاده از توکن را تا 70% در مقایسه با ابزارهای ساده و پراکنده کاهش میدهد @ttunguz
- مایکروسافت از سرمایهگذاری 30 میلیارد دلاری در بریتانیا طی چهار سال خبر میدهد که شامل ساخت بزرگترین ابررایانهی این کشور با بیش از 23,000 پردازندهی گرافیکی پیشرفته است @satyanadella
- Figure بیش از 1 میلیارد دلار در تأمین مالی سری C به رهبری Parkway Venture Capital برای توسعهی رباتیک انساننما جذب میکند @TechCrunch
اخلاق و جامعه
- OpenAI یک سیستم پیشبینی سن را برای شناسایی کاربران زیر 18 سال پیادهسازی میکند، در صورت عدم اطمینان به تجربهی کاربری زیر 18 سال تغییر میدهد و در برخی موارد برای محافظت از خردسالان، تأیید هویت را الزامی میکند @sama
- OpenAI قوانین ایمنی متفاوتی برای نوجوانان وضع میکند، از جمله آموزش ChatGPT برای پرهیز از مکالمات عشوه واره و نگارش خلاقانه در مورد خودکشی، با برنامهریزی برای تماس با والدین یا مقامات برای کاربرانی که افکار خودکشی را نشان میدهند @TechCrunch
- دیزنی، یونیورسال استودیوز و وارنر بروس از استارتآپ چینی MiniMax شکایت میکنند و آنها را متهم به سرقت اموال فکری برای قدرت بخشیدن به مدل هوش مصنوعی Hailuo خود میکنند @AndrewCurran_
- موفقیت در پذیرش سازمانی هوش مصنوعی بهطور فزایندهای به این بستگی دارد که آیا کمیتههای هوش مصنوعی مسئولیتپذیر که در سال 2023 تشکیل شدهاند، با تحولات هوش مصنوعی همگام بودهاند و آیا اعضا بهطور فعال از هوش مصنوعی در محل کار استفاده میکنند @emollick
کاربردها
- Cursor نسخهی 1.6 را با دستورات سفارشی برای پرامپتهای قابل استفادهی مجدد، ترمینال Agent سریعتر، پشتیبانی از منابع MCP و قابلیت دستور /summarize منتشر میکند @cursor_ai
- کاربران Perplexity Pro اکنون میتوانند حسابهای ایمیل، تقویم، Notion و GitHub خود را متصل کنند؛ کاربران Enterprise Pro نیز از ادغام Linear و Outlook بهرهمند میشوند @perplexity_ai
- World Labs تولید دنیای سهبعدی در مقیاس بزرگ را با استفاده از مدل Marble خود نشان میدهد که محیطهای سهبعدی پایدار و گسترده را از تصاویر تکی ایجاد میکند @drfeifei
- گوگل ویژگی Edit with AI را برای YouTube معرفی میکند که فیلم خام را تحلیل کرده، بهترین لحظات را انتخاب کرده و محتوا را با موسیقی، افکتها و صداگذاریها ترکیب میکند @GoogleDeepMind
- Microsoft Copilot ویژگی Audio Expressions را راهاندازی میکند که امکان تبدیل متون نوشته شده به روایت گفتاری طبیعی و تولید داستان در لحظه را فراهم میآورد @Copilot
- Waymo پس از سالها مذاکره، مجوز شروع عملیات وسایل نقلیهی خودران را در فرودگاه بینالمللی سانفرانسیسکو دریافت میکند @Waymo
- رفتار جدید Codex شامل استفاده از نرمافزار پیشنمایش برای گرفتن اسکرینشات از توسعهی فرانتاند برای رفع اشکال بصری است، به جای تکیه صرف بر تحلیل کد @natolambert
پژوهشها
- یک مقالهی پژوهشی استدلال میکند که بازده نزولی در مقیاس هوش مصنوعی توهمی است و نشان میدهد که دستاوردهای کوچک دقت در پروژههای طولانی، جایی که ارزش اقتصادی از اتمام وظایف بهدست میآید نه از سؤالات تکی، بهصورت تصاعدی افزایش مییابند @emollick
- نتایج جدید و پیشرفته در بنچمارک ARC-AGI با 79.6% در V1 و 29.4% در V2 با استفاده از راهحلهای متنباز که ترکیب برنامه را با Grok 4 و تطبیق در زمان آزمایش پیادهسازی میکنند، بهدست آمد @arcprize
- پژوهش Anthropic نشان میدهد که ابزارهای هوش مصنوعی پیچیده و با پارامترهای غنی، بهتر از ابزارهای ساده عمل میکنند و با درک کامل زمینه به جای نیت پراکنده، تا 70% در توکنهای خروجی صرفهجویی کرده و دقت را بهبود میبخشند @ttunguz
- OpenMed AI بیش از 90 مدل NER زیستپزشکی و بالینی صفر-شات متنباز را منتشر میکند که بر اساس معماری GLiNER ساخته شدهاند و بیش از 12 مجموعهی دادهی زیستپزشکی را تحت مجوز Apache-2.0 پوشش میدهند @MaziyarPanahi
- LeRobot فرمت بهروزرسانی شدهی مجموعهی داده v3 را منتشر میکند که از مجموعهدادههای چند میلیون اپیزودی و قابلیتهای استریمینگ برای بهبود عملکرد رباتیک در مقیاس بزرگ پشتیبانی میکند @_fracapuano