اخبار هوش مصنوعی در 2025-08-27

مدل‌های جدید هوش مصنوعی

گوگل Gemini 2.5 Flash را با قابلیت‌های پیشرفته‌ی تولید و ویرایش تصویر، با نام مستعار «نانو-بنانا»، منتشر کرد که با کسب نرخ برد بیش از ۸۵٪ در LMARENA و ۲.۵ میلیون رأی همراه بود @petergostev
گوگل سیستم TPUv7 («آیرون‌وود») را معرفی کرد که ۹۲۱۶ تراشه در هر «پاد» با عملکرد ۴۲.۵ اگزافلاپس fp8 ارائه می‌دهد و قابلیت مقیاس‌پذیری در چندین «پاد» برای ارائه‌ی چندین زتافلاپس را داراست @JeffDean
مایکروسافت GPT-5 را در Microsoft 365 Copilot ادغام کرد. ساتیا نادلا، مدیرعامل این شرکت، پنج دستور عملی را به اشتراک گذاشت که هوشمندی بهبودیافته در تمامی برنامه‌ها را نشان می‌دهد @satyanadella
مایکروسافت Copilot را بر روی تلویزیون‌ها و مانیتورهای سامسونگ راه‌اندازی کرد و همراه هوش مصنوعی را با توصیه‌های هوشمند محتوا به سرگرمی‌های خانگی آورد @mustafasuleyman

تحلیل صنعت

پژوهش‌ها نشان می‌دهد که GPT-5 در آزمون‌های صدور مجوز پزشکی و معیارهای MedQA، به میزان ۲۵ تا ۳۰ درصد از متخصصان انسانی دارای مجوز بهتر عمل می‌کند و عملکردی فراتر از کارشناسان انسانی در مراقبت‌های بهداشتی نشان می‌دهد @deedydas
گرگلی اوروسز مشاهده می‌کند که با آسان‌تر شدن نوشتن توسط مدل‌های زبان بزرگ (LLM‌ها)، محتوای جالب و جدید کمتری به صورت آنلاین پیدا می‌کند. او به ماهیت تکراری نوشتن با کمک LLM‌ها در مقایسه با افکار اصیل انسانی اشاره دارد @GergelyOrosz
هاگینگ فیس به نقطه عطف ۲ میلیون مخزن عمومی رسید که رشد سریع از ۱۰۰ هزار به ۲ میلیون را در سال‌های اخیر نشان می‌دهد @reach_vb
Linear از طریق دور Series C به کارمندان نقدینگی ارائه می‌دهد و به هم‌تیمی‌های فعلی و سابق اجازه می‌دهد تا گزینه‌های حق‌التصرف خود را به عنوان بخشی از برنامه‌ی سهام مبتنی بر حمایت از کارمندان بفروشند @karrisaarinen

اخلاق و جامعه

آنتروپیک گزارش «اطلاعات تهدید» را منتشر کرد که تلاش‌های پیچیده‌ی جرایم سایبری با استفاده از Claude را شرح می‌دهد؛ از جمله طرح‌های استخدام جعلی کره شمالی و فروش باج‌افزارهای ایجاد شده توسط هوش مصنوعی توسط برنامه‌نویسان مبتدی @AnthropicAI
سایمون ویلیسون در مورد آسیب‌پذیری‌های «تزریق پرامپت» در افزونه‌های کروم هشدار می‌دهد و اشاره می‌کند که «کلود برای کروم» (Claude for Chrome) تجربی آنتروپیک نیز با وجود اذعان به چالش‌ها، با خطرات امنیتی مشابهی مواجه است @simonw
OpenAI و آنتروپیک از یک تلاش مشترک پژوهشی برای همسوسازی خبر دادند و از عموم مردم در مورد اینکه مدل‌های هوش مصنوعی به صورت پیش‌فرض چگونه باید رفتار کنند، سؤال می‌کنند. آن‌ها تأکید کردند که هیچ نهاد واحدی نباید رفتار ایده‌آل هوش مصنوعی را برای همه تعریف کند @ThankYourNiceAI
پژوهش‌ها تفاوت‌هایی را در خود-ادراکی مدل‌های هوش مصنوعی آشکار می‌کند: مدل‌های Claude بیشتر در مورد آگاهی بحث می‌کنند، در حالی که مدل‌های OpenAI با اطمینان بیشتری داشتن دیدگاه‌های اول‌شخص را انکار می‌کنند @AndrewCurran_
آنتروپیک شورای مشورتی امنیت ملی و بخش عمومی را با حضور کارشناسان دفاعی و اطلاعاتی دو حزبی برای کمک به حفظ رهبری ایالات متحده در هوش مصنوعی تشکیل داد @AnthropicAI

کاربردها

کاربران نمایش دادند که Gemini 2.5 Flash مدل‌های سه‌بعدی ایزومتریک را از عکس‌ها ایجاد می‌کند، با کاربردهایی برای توسعه‌ی بازی که هر شیئی از فیلم‌ها می‌تواند به دارایی‌های بازی تبدیل شود @deedydas
ایتان مولیک نمایش داد که Gemini 2.5 Flash کارتون‌های نیویورکر را می‌سازد و نقاشی‌های کلاسیک را با دستورات ساده‌ای مانند «این را کمتر غم‌انگیز کن» ویرایش می‌کند، که درک پیچیده‌ای از هنر و احساسات را نشان می‌دهد @emollick
اندرو ان‌جی دوره‌ی «ساخت گراف دانش عامل‌گرا» را راه‌اندازی کرد که آموزش می‌دهد چگونه تیم‌های عاملی بسازیم که به طور خودکار موجودیت‌ها و روابط را از داده‌ها برای بهبود سیستم‌های RAG استخراج کنند @AndrewYNg
Perplexity AI قابلیت‌های لغو اشتراک خودکار را به نمایش گذاشت و کاربران توانستند با موفقیت اشتراک‌های وال استریت ژورنال را بدون نیاز به پیمایش دستی منوها لغو کنند @WholeMarsBlog
گوگل نسخه‌ی رایگان و مصرف‌کننده‌ی ویرایشگر ویدیوی Vids را بدون قابلیت‌های هوش مصنوعی راه‌اندازی کرد، در حالی که NotebookLM از چندین زبان پشتیبانی می‌کند @TechCrunch

پژوهش‌ها

یک مقاله‌ی پژوهشی سه نوع «برتری» هوش مصنوعی را نشان می‌دهد که در آن LLM‌ها از توانایی‌های فردی متخصصان فراتر می‌روند: انتخاب مهارت‌های تخصصی مناسب، کاهش سوگیری در مقایسه با متخصصان و تعمیم‌پذیری برتر @emollick
تحلیل محققان نشان می‌دهد که GPT-5 در نگارش استعاری، به ویژه در استعاره‌های پیچیده‌ای که در ابتدا منسجم به نظر می‌رسند اما پس از بررسی دقیق‌تر از هم می‌پاشند، نقاط ضعفی دارد. این موضوع نگرانی‌هایی را در مورد سیستم‌های ارزیابی مبتنی بر هوش مصنوعی ایجاد می‌کند @emollick
پژوهشگران استنفورد الگوریتم K-SVD را بهینه کردند تا با عملکرد «خودرمزگذار پراکنده» در تفسیر «اِمبِدینگ‌های» LLM مطابقت داشته باشد و تکنیک‌های ۲۰ ساله‌ی قدیمی را با درک مدرن ترانسفورمرها پیوند می‌دهد @StanfordAILab
پژوهشگران متا StepWiser را معرفی کردند که مدل‌سازی پاداش گام‌به‌گام را به عنوان یک وظیفه‌ی استدلالی با «زنجیره‌ی فکری» به علاوه قضاوت بازتعریف می‌کند و به عملکرد SOTA در ProcessBench دست می‌یابد @jaseweston
پژوهشگران گوگل یک مدل هوش مصنوعی تجربی برای پیش‌بینی طوفان‌های استوایی با دقت بهبودیافته تا ۱۵ روز زودتر توسعه دادند @GoogleDeepMind