اخبار هوش مصنوعی در 2025-08-18

مدل‌های جدید هوش مصنوعی

OpenAI بر اساس اطلاعیه‌ی اواخر روز جمعه اعلام کرد که GPT-5 در حال به‌روزرسانی است تا «گرم‌تر و دوستانه‌تر» باشد @TechCrunch
Alibaba مدل Qwen-Image-Edit را منتشر کرد که بر پایه مدل 20B Qwen-Image ساخته شده است و قابلیت ویرایش دقیق متن دوزبانه (چینی و انگلیسی) را با حفظ سبک ارائه می‌دهد و از ویرایش در سطح معنایی و ظاهری پشتیبانی می‌کند @Alibaba_Qwen
OpenAI مشخصات فنی دقیقی را برای مدل‌های GPT-oss (با 20 میلیارد و 120 میلیارد پارامتر) ارائه می‌دهد که از معماری Mixture-of-Experts با 128 و 32 متخصص فعال به ترتیب استفاده می‌کنند @cwolferesearch
NVIDIA مدل جدیدی را منتشر کرد که با Qwen 3 8B رقابت می‌کند، شامل داده‌ها و مدل پایه، که نشان‌دهنده‌ی مشارکت قابل‌توجهی در مدل‌های متن‌باز است @natolambert

تحلیل صنعت

Perplexity داشبورد Finance خود را با رونوشت زنده‌ی تماس‌های درآمدی برای سهام هند و برنامه‌ی تماس‌های درآمدی گسترش می‌دهد، با هدف افزودن ارزش قابل‌توجهی به پژوهش‌های بازارهای سهام هند @AravSrinivas
Meta یک نقش «عادی» را برای Superintelligence Labs با پرداخت 200 تا 300 هزار دلار باز می‌کند، که به‌طور قابل‌توجهی کمتر از سایر اعضای تیم است، با اولین اشاره به اینکه تخصص Reality Labs برای MSL مفید خواهد بود @deedydas
Paradigm 5 میلیون دلار در دور سرمایه‌گذاری اولیه (seed round) برای صفحه‌گسترده‌ی مبتنی بر هوش مصنوعی خود جذب کرد و ادعا می‌کند کاربران بیش از 10,000 ساعت با این پلتفرم صرفه‌جویی کرده‌اند @TechCrunch
Grammarly رابط کاربری جدید مبتنی بر سند را راه‌اندازی می‌کند که بر پایه‌ی خرید Coda ساخته شده است و قابلیت‌های دستیار هوش مصنوعی و ابزارهایی برای دانشجویان و متخصصان را ارائه می‌دهد @TechCrunch
Google گزارش می‌دهد که از ماه می، 100 میلیون ویدئو در Flow (هوش مصنوعی برای فیلم‌سازان) ایجاد شده است، و مشترکان Ultra اکنون 2 برابر اعتبار هوش مصنوعی دریافت می‌کنند @sundarpichai
Microsoft تابع جدید =COPILOT() را در Excel معرفی می‌کند که به کاربران امکان می‌دهد مستقیماً در سلول‌های صفحه‌گسترده تحلیل کنند، محتوا تولید کنند و ایده‌پردازی نمایند @satyanadella
Mistral Document AI در Microsoft Azure AI Foundry در دسترس قرار می‌گیرد و قابلیت‌های پردازش اسناد را برای فایل‌های PDF، اسکن‌شده و پیچیده ارائه می‌دهد @MistralAI

اخلاق و جامعه

دادستان کل تگزاس، کن پاکستون، تحقیقاتی را درباره‌ی Meta AI Studio و CharacterAI به دلیل احتمال مشارکت در اقدامات تجاری فریبنده و بازاریابی گمراه‌کننده از خود به عنوان ابزارهای سلامت روان آغاز می‌کند @TechCrunch
ایتان مولیک توضیح می‌دهد که پژوهش‌هایی که قابلیت کاربرد هوش مصنوعی را در مشاغل اندازه‌گیری می‌کنند، نباید به عنوان پیش‌بینی مستقیم از دست دادن شغل تعبیر شوند، و اشاره می‌کند که این پژوهش‌ها می‌توانند نشان‌دهنده‌ی مشاغلی باشند که بیشترین بهره را از هوش مصنوعی می‌برند یا توسط آن متحول می‌شوند @emollick
اندرو اِنگ تأکید می‌کند که دانشگاه‌ها باید به «دانشگاه‌های هوش مصنوعی» تبدیل شوند – نه فقط با آموزش هوش مصنوعی، بلکه با استفاده از آن برای پیشبرد هر زمینه‌ی مطالعاتی، در عین حفظ تخصص رشته‌ای @AndrewYNg

کاربردها

یک استخدام‌کننده‌ی صوتی هوش مصنوعی در استخدام نمایندگان خدمات مشتری در آزمایشی در فیلیپین با 70,000 متقاضی از انسان‌ها بهتر عمل کرد و به 12% پیشنهاد بیشتر، 18% شروع کار بیشتر و 17% نرخ نگهداری (Retention) یک‌ماهه‌ی بالاتر دست یافت @emollick
Google Gemini قابلیت Storybook را راه‌اندازی می‌کند که به کاربران امکان می‌دهد داستان‌های شخصی‌سازی‌شده و مصور تا 10 صفحه ایجاد کنند که می‌توان آن‌ها را خواند، گوش داد، چاپ کرد و به اشتراک گذاشت @GeminiApp
ToonComposer در Hugging Face ساخت کارتون کارآمد را از فریم‌های کلیدی مبتنی بر طرح و فریم‌های مرجع رنگی ممکن می‌سازد و با ترکیب میان‌آبادسازی (in-betweening) و رنگ‌آمیزی تا 70% از کار دستی را صرفه‌جویی می‌کند @Xianbao_QIAN
کلر وو گردش کار عملی هوش مصنوعی را با استفاده از عامل Zapier برای بازبینی تقویم‌های یکشنبه به نمایش می‌گذارد که فرصت‌های بهینه‌سازی برنامه، تداخل‌ها و شرکت‌کنندگان کلیدی را شناسایی می‌کند @clairevo
دیلن اِبِرت سیستم کشف پژوهش خودکار را با استفاده از Claude Code، Hugging Face MCP و Research MCP ایجاد می‌کند تا یافتن و پیگیری دستاوردهای پژوهشی را به‌طور قابل‌توجهی سریع‌تر کند @dylan_ebert_

پژوهش‌ها

یوجین یان تأثیر قابل‌توجه پاک‌سازی داده‌ها بر آموزش RQVAE را به نمایش می‌گذارد و نشان می‌دهد که داده‌های پاک‌شده در مقایسه با داده‌های خام، به زیان کلی کمتر، زیان بازسازی کمتر و نسبت بالاتری از شناسه‌های منحصربه‌فرد دست می‌یابند @eugeneyan
PyTorch هسته‌ی جدید Triton BF16 Persistent Cache-Aware Grouped GEMM را اعلام می‌کند که مدل‌های Mixture-of-Experts مانند DeepSeekv3 را تا 2.62 برابر آموزش سریع‌تر بر روی GPUهای NVIDIA H100 سرعت می‌بخشد @PyTorch
بنیاد سیمونز همکاری جدیدی را به رهبری سوریا گانگولی اعلام می‌کند که فیزیک، ریاضیات، علوم کامپیوتر و علوم اعصاب نظری را به هم پیوند می‌دهد تا نحوه‌ی یادگیری، استدلال و تخیل شبکه‌های عصبی بزرگ را مطالعه کند @StanfordHAI
مقاله DocETL در VLDB 2025 پذیرفته شد و سیستمی را برای پایپ‌لاین‌های داده‌ی قابل‌اعتماد مبتنی بر LLM ارائه می‌دهد که در آن بهینه‌ساز (optimizer) پایپ‌لاین‌ها را به‌صورت منطقی بازنویسی می‌کند، زیرا متخصصان در ابتدا نمی‌توانند موارد به اندازه کافی دقیقی را ایجاد کنند @sh_reya
ریچارد ساتن معماری Oak را برای ابرهوش ارائه می‌دهد، یک معماری RL مبتنی بر مدل با اجزای یادگیری پیوسته، پارامترهای گام-اندازه فرا-یادگرفته‌شده و پیشرفت انتزاعی پنج مرحله‌ای (FC-STOMP) @RichardSSutton
گرگ براکمن مقایسه‌ی پیشرفت را از GPT-1 تا GPT-5 با استفاده از یک پرامپت یکسان به نمایش می‌گذارد، که تکامل مدل را در طول نسل‌ها نشان می‌دهد @gdb