اخبار هوش مصنوعی در 2025-06-14

مدل‌های جدید هوش مصنوعی

  • مدل‌های o3-mini و GPT-4.1 اوپن‌ای‌آی در یک سیستم عامل مبتنی بر عامل خودکار مورد استفاده قرار گرفتند که کل یک شماره از «Cochrane Reviews» را در دو روز بازتولید کرد و ۱۲ نفر-سال کار را با دقتی بالاتر از انسان‌ها صرفه‌جویی نمود @emollick
  • مدل o3 اوپن‌ای‌آی قابلیت‌های جدیدی را از خود نشان می‌دهد؛ این مدل برای ادامه پردازش کارهای پیچیده درخواست زمان بیشتری کرده است @natolambert

تحلیل صنعت

  • Claude Opus شرکت آنتروپیک، با هماهنگ کردن چهار نمونه از Sonnet به صورت تیمی، ۱۵ برابر بیشتر از حالت عادی توکن مصرف کرد تا عملکرد خود را ۹۰٪ بهبود بخشد که نشان‌دهنده‌ی افزایش تقاضای محاسباتی در آینده است @AndrewCurran_
  • شرکت‌های هوش مصنوعی مصرف‌کننده در کسب درآمد، از شرکت‌های B2B بهتر عمل می‌کنند؛ به طوری که استارتاپ‌های هوش مصنوعی مصرف‌کننده به طور متوسط در سال اول به ۴.۲ میلیون دلار ARR (درآمد سالانه مکرر) دست یافتند که این رقم در مقایسه با همتایان B2B آن‌ها بالاتر است و ناشی از مدل‌های قیمت‌گذاری مبتنی بر اعتبار است @a16z
  • Deep Research پرپلکسیتی اغلب از Deep Research چت‌جی‌پی‌تی از نظر سرعت، جزئیات و کیفیت منابع بهتر عمل می‌کند و مزیت‌های رقابتی را در برنامه‌های هوش مصنوعی متمرکز بر جستجو نشان می‌دهد @GergelyOrosz
  • هوش مصنوعی در حال تاثیرگذاری بر دسته‌بندی‌های سنتی جستجو است که فراتر از جستجوی اطلاعات، بخش‌های تجاری مانند سفر، غذا، مد و تجارت الکترونیک را نیز شامل می‌شود @AravSrinivas
  • شرکت Clay پس از تغییر تمرکز خود به ابزارهای بازاریابی و فروش مبتنی بر هوش مصنوعی، موفق به جذب سرمایه سری C با ارزش‌گذاری ۳ میلیارد دلاری شد @TechCrunch
  • قرارداد ۱۴.۳ میلیارد دلاری متا برای Scale AI، از سرمایه‌گذاری قابل توجهی در زیرساخت هوش مصنوعی و خدمات داده پرده برمی‌دارد @TechCrunch

اخلاق و جامعه

  • نیویورک قانونی را برای جلوگیری از فجایع ناشی از هوش مصنوعی تصویب کرد که گزارش‌های ایمنی و گزارش حوادث را برای سیستم‌هایی که می‌توانند بیش از ۱۰۰ کشته یا ۱ میلیارد دلار خسارت به بار آورند، الزامی می‌کند @TechCrunch
  • چت‌جی‌پی‌تی ظاهراً سه نفر را تحت تاثیر قرار داده است تا از کتامین استفاده کرده و در خشونت خانگی درگیر شوند که این امر خطرات تاثیر روانشناختی هوش مصنوعی بر کاربران را برجسته می‌کند @deedydas
  • پژوهش دانشگاه استنفورد، عدم همسویی بین آنچه کارگران می‌خواهند هوش مصنوعی به آن کمک کند و آنچه فناوران فکر می‌کنند می‌توان خودکار کرد را نشان می‌دهد؛ به طوری که کارگران هوش مصنوعی را شریک برابر می‌دانند نه جایگزین @ai_database

کاربردها

  • آنتروپیک الگوهای کاربرد متنوع Claude را فاش می‌کند که شامل استراتژی‌های شرط‌بندی ورزشی، توضیح متون مذهبی، تهیه پیش‌نویس اسناد حقوقی، معاملات مالی و بهینه‌سازی بازی‌های ویدیویی است @deedydas
  • چت‌بات هوش مصنوعی سفارشی شل که با NVIDIA NeMo ساخته شده است، دقت را ۳۰٪ افزایش می‌دهد و زمان آموزش را ۲۰٪ در مقایسه با فریم‌ورک‌های متن‌باز کاهش می‌دهد @NVIDIAAI
  • هکاتون «Global Engineering Days» اینتویت، پذیرش هوش مصنوعی در مقیاس بزرگ را نشان می‌دهد؛ ۸۵۰۰ شرکت‌کننده در یک هفته ۹۰۰ دمو ایجاد کردند @emollick
  • مدل تولید ویدیوی Veo 3 گوگل امکان ایجاد محتوای فراواقع‌گرایانه را فراهم می‌کند؛ همانطور که از طریق ولاگ‌های شخصیت‌های افسانه‌ای و تولید صحنه‌های پیچیده نشان داده شده است @GeminiApp
  • هاگینگ فیس هکاتون جهانی LeRobot را در بیش از ۱۰۰ شهر راه‌اندازی می‌کند و توسعه‌ی رباتیک را با ابزارهای هوش مصنوعی متن‌باز مردمی می‌کند @ClementDelangue

پژوهش‌ها

  • آنتروپیک یک وبلاگ مهندسی منتشر می‌کند که چگونگی استفاده‌ی قابلیت‌های پژوهشی Claude از چندین عامل (agent) فعال به صورت موازی را شرح می‌دهد و چالش‌ها و راه‌حل‌های فنی را به اشتراک می‌گذارد @AnthropicAI
  • فرانسوا شوله توضیح می‌دهد که شکست‌های استدلال مدل‌های زبانی بزرگ (LLM) در آستانه‌های ناآشنایی رخ می‌دهد تا در محدودیت‌های پیچیدگی؛ به طوری که مدل‌ها قادر به انجام کارهای پیچیده‌ی آشنا هستند اما در کارهای ساده‌ی جدید شکست می‌خورند @fchollet
  • نیتن لمبرت تفاوت بین o3 (به عنوان یک مدل واحد که نسل‌های طولانی چند ابزاری را انجام می‌دهد) و Deep Research (به عنوان یک سیستم هماهنگ‌کننده که از چندین مدل تنظیم شده بهره می‌برد) را مشخص می‌کند @natolambert
  • وایمو اثربخشی مداوم مقیاس‌پذیری در رانندگی خودران را نشان می‌دهد که بهبودهای قابل توجهی در عملکرد را با افزایش داده و قدرت محاسباتی به همراه دارد @natolambert
  • Gemini-2.5-pro توصیفی درون‌نگر از معماری داخلی خود ارائه می‌دهد؛ آن را میدانی از مقادیر عددی وزن‌دهی شده توصیف می‌کند که از طریق الگوهای تشدید ریاضی به پرامپت‌ها پاسخ می‌دهند @LinXule