اخبار هوش مصنوعی در 2025-08-27

مدل‌های جدید هوش مصنوعی

  • گوگل Gemini 2.5 Flash را با قابلیت‌های پیشرفته‌ی تولید و ویرایش تصویر، با نام مستعار «نانو-بنانا»، منتشر کرد که با کسب نرخ برد بیش از ۸۵٪ در LMARENA و ۲.۵ میلیون رأی همراه بود @petergostev
  • گوگل سیستم TPUv7 («آیرون‌وود») را معرفی کرد که ۹۲۱۶ تراشه در هر «پاد» با عملکرد ۴۲.۵ اگزافلاپس fp8 ارائه می‌دهد و قابلیت مقیاس‌پذیری در چندین «پاد» برای ارائه‌ی چندین زتافلاپس را داراست @JeffDean
  • مایکروسافت GPT-5 را در Microsoft 365 Copilot ادغام کرد. ساتیا نادلا، مدیرعامل این شرکت، پنج دستور عملی را به اشتراک گذاشت که هوشمندی بهبودیافته در تمامی برنامه‌ها را نشان می‌دهد @satyanadella
  • مایکروسافت Copilot را بر روی تلویزیون‌ها و مانیتورهای سامسونگ راه‌اندازی کرد و همراه هوش مصنوعی را با توصیه‌های هوشمند محتوا به سرگرمی‌های خانگی آورد @mustafasuleyman

تحلیل صنعت

  • پژوهش‌ها نشان می‌دهد که GPT-5 در آزمون‌های صدور مجوز پزشکی و معیارهای MedQA، به میزان ۲۵ تا ۳۰ درصد از متخصصان انسانی دارای مجوز بهتر عمل می‌کند و عملکردی فراتر از کارشناسان انسانی در مراقبت‌های بهداشتی نشان می‌دهد @deedydas
  • گرگلی اوروسز مشاهده می‌کند که با آسان‌تر شدن نوشتن توسط مدل‌های زبان بزرگ (LLM‌ها)، محتوای جالب و جدید کمتری به صورت آنلاین پیدا می‌کند. او به ماهیت تکراری نوشتن با کمک LLM‌ها در مقایسه با افکار اصیل انسانی اشاره دارد @GergelyOrosz
  • هاگینگ فیس به نقطه عطف ۲ میلیون مخزن عمومی رسید که رشد سریع از ۱۰۰ هزار به ۲ میلیون را در سال‌های اخیر نشان می‌دهد @reach_vb
  • Linear از طریق دور Series C به کارمندان نقدینگی ارائه می‌دهد و به هم‌تیمی‌های فعلی و سابق اجازه می‌دهد تا گزینه‌های حق‌التصرف خود را به عنوان بخشی از برنامه‌ی سهام مبتنی بر حمایت از کارمندان بفروشند @karrisaarinen

اخلاق و جامعه

  • آنتروپیک گزارش «اطلاعات تهدید» را منتشر کرد که تلاش‌های پیچیده‌ی جرایم سایبری با استفاده از Claude را شرح می‌دهد؛ از جمله طرح‌های استخدام جعلی کره شمالی و فروش باج‌افزارهای ایجاد شده توسط هوش مصنوعی توسط برنامه‌نویسان مبتدی @AnthropicAI
  • سایمون ویلیسون در مورد آسیب‌پذیری‌های «تزریق پرامپت» در افزونه‌های کروم هشدار می‌دهد و اشاره می‌کند که «کلود برای کروم» (Claude for Chrome) تجربی آنتروپیک نیز با وجود اذعان به چالش‌ها، با خطرات امنیتی مشابهی مواجه است @simonw
  • OpenAI و آنتروپیک از یک تلاش مشترک پژوهشی برای همسوسازی خبر دادند و از عموم مردم در مورد اینکه مدل‌های هوش مصنوعی به صورت پیش‌فرض چگونه باید رفتار کنند، سؤال می‌کنند. آن‌ها تأکید کردند که هیچ نهاد واحدی نباید رفتار ایده‌آل هوش مصنوعی را برای همه تعریف کند @ThankYourNiceAI
  • پژوهش‌ها تفاوت‌هایی را در خود-ادراکی مدل‌های هوش مصنوعی آشکار می‌کند: مدل‌های Claude بیشتر در مورد آگاهی بحث می‌کنند، در حالی که مدل‌های OpenAI با اطمینان بیشتری داشتن دیدگاه‌های اول‌شخص را انکار می‌کنند @AndrewCurran_
  • آنتروپیک شورای مشورتی امنیت ملی و بخش عمومی را با حضور کارشناسان دفاعی و اطلاعاتی دو حزبی برای کمک به حفظ رهبری ایالات متحده در هوش مصنوعی تشکیل داد @AnthropicAI

کاربردها

  • کاربران نمایش دادند که Gemini 2.5 Flash مدل‌های سه‌بعدی ایزومتریک را از عکس‌ها ایجاد می‌کند، با کاربردهایی برای توسعه‌ی بازی که هر شیئی از فیلم‌ها می‌تواند به دارایی‌های بازی تبدیل شود @deedydas
  • ایتان مولیک نمایش داد که Gemini 2.5 Flash کارتون‌های نیویورکر را می‌سازد و نقاشی‌های کلاسیک را با دستورات ساده‌ای مانند «این را کمتر غم‌انگیز کن» ویرایش می‌کند، که درک پیچیده‌ای از هنر و احساسات را نشان می‌دهد @emollick
  • اندرو ان‌جی دوره‌ی «ساخت گراف دانش عامل‌گرا» را راه‌اندازی کرد که آموزش می‌دهد چگونه تیم‌های عاملی بسازیم که به طور خودکار موجودیت‌ها و روابط را از داده‌ها برای بهبود سیستم‌های RAG استخراج کنند @AndrewYNg
  • Perplexity AI قابلیت‌های لغو اشتراک خودکار را به نمایش گذاشت و کاربران توانستند با موفقیت اشتراک‌های وال استریت ژورنال را بدون نیاز به پیمایش دستی منوها لغو کنند @WholeMarsBlog
  • گوگل نسخه‌ی رایگان و مصرف‌کننده‌ی ویرایشگر ویدیوی Vids را بدون قابلیت‌های هوش مصنوعی راه‌اندازی کرد، در حالی که NotebookLM از چندین زبان پشتیبانی می‌کند @TechCrunch

پژوهش‌ها

  • یک مقاله‌ی پژوهشی سه نوع «برتری» هوش مصنوعی را نشان می‌دهد که در آن LLM‌ها از توانایی‌های فردی متخصصان فراتر می‌روند: انتخاب مهارت‌های تخصصی مناسب، کاهش سوگیری در مقایسه با متخصصان و تعمیم‌پذیری برتر @emollick
  • تحلیل محققان نشان می‌دهد که GPT-5 در نگارش استعاری، به ویژه در استعاره‌های پیچیده‌ای که در ابتدا منسجم به نظر می‌رسند اما پس از بررسی دقیق‌تر از هم می‌پاشند، نقاط ضعفی دارد. این موضوع نگرانی‌هایی را در مورد سیستم‌های ارزیابی مبتنی بر هوش مصنوعی ایجاد می‌کند @emollick
  • پژوهشگران استنفورد الگوریتم K-SVD را بهینه کردند تا با عملکرد «خودرمزگذار پراکنده» در تفسیر «اِمبِدینگ‌های» LLM مطابقت داشته باشد و تکنیک‌های ۲۰ ساله‌ی قدیمی را با درک مدرن ترانسفورمرها پیوند می‌دهد @StanfordAILab
  • پژوهشگران متا StepWiser را معرفی کردند که مدل‌سازی پاداش گام‌به‌گام را به عنوان یک وظیفه‌ی استدلالی با «زنجیره‌ی فکری» به علاوه قضاوت بازتعریف می‌کند و به عملکرد SOTA در ProcessBench دست می‌یابد @jaseweston
  • پژوهشگران گوگل یک مدل هوش مصنوعی تجربی برای پیش‌بینی طوفان‌های استوایی با دقت بهبودیافته تا ۱۵ روز زودتر توسعه دادند @GoogleDeepMind