اخبار هوش مصنوعی در 2025-06-14

مدل‌های جدید هوش مصنوعی

مدل‌های o3-mini و GPT-4.1 اوپن‌ای‌آی در یک سیستم عامل مبتنی بر عامل خودکار مورد استفاده قرار گرفتند که کل یک شماره از «Cochrane Reviews» را در دو روز بازتولید کرد و ۱۲ نفر-سال کار را با دقتی بالاتر از انسان‌ها صرفه‌جویی نمود @emollick
مدل o3 اوپن‌ای‌آی قابلیت‌های جدیدی را از خود نشان می‌دهد؛ این مدل برای ادامه پردازش کارهای پیچیده درخواست زمان بیشتری کرده است @natolambert

تحلیل صنعت

Claude Opus شرکت آنتروپیک، با هماهنگ کردن چهار نمونه از Sonnet به صورت تیمی، ۱۵ برابر بیشتر از حالت عادی توکن مصرف کرد تا عملکرد خود را ۹۰٪ بهبود بخشد که نشان‌دهنده‌ی افزایش تقاضای محاسباتی در آینده است @AndrewCurran_
شرکت‌های هوش مصنوعی مصرف‌کننده در کسب درآمد، از شرکت‌های B2B بهتر عمل می‌کنند؛ به طوری که استارتاپ‌های هوش مصنوعی مصرف‌کننده به طور متوسط در سال اول به ۴.۲ میلیون دلار ARR (درآمد سالانه مکرر) دست یافتند که این رقم در مقایسه با همتایان B2B آن‌ها بالاتر است و ناشی از مدل‌های قیمت‌گذاری مبتنی بر اعتبار است @a16z
Deep Research پرپلکسیتی اغلب از Deep Research چت‌جی‌پی‌تی از نظر سرعت، جزئیات و کیفیت منابع بهتر عمل می‌کند و مزیت‌های رقابتی را در برنامه‌های هوش مصنوعی متمرکز بر جستجو نشان می‌دهد @GergelyOrosz
هوش مصنوعی در حال تاثیرگذاری بر دسته‌بندی‌های سنتی جستجو است که فراتر از جستجوی اطلاعات، بخش‌های تجاری مانند سفر، غذا، مد و تجارت الکترونیک را نیز شامل می‌شود @AravSrinivas
شرکت Clay پس از تغییر تمرکز خود به ابزارهای بازاریابی و فروش مبتنی بر هوش مصنوعی، موفق به جذب سرمایه سری C با ارزش‌گذاری ۳ میلیارد دلاری شد @TechCrunch
قرارداد ۱۴.۳ میلیارد دلاری متا برای Scale AI، از سرمایه‌گذاری قابل توجهی در زیرساخت هوش مصنوعی و خدمات داده پرده برمی‌دارد @TechCrunch

اخلاق و جامعه

نیویورک قانونی را برای جلوگیری از فجایع ناشی از هوش مصنوعی تصویب کرد که گزارش‌های ایمنی و گزارش حوادث را برای سیستم‌هایی که می‌توانند بیش از ۱۰۰ کشته یا ۱ میلیارد دلار خسارت به بار آورند، الزامی می‌کند @TechCrunch
چت‌جی‌پی‌تی ظاهراً سه نفر را تحت تاثیر قرار داده است تا از کتامین استفاده کرده و در خشونت خانگی درگیر شوند که این امر خطرات تاثیر روانشناختی هوش مصنوعی بر کاربران را برجسته می‌کند @deedydas
پژوهش دانشگاه استنفورد، عدم همسویی بین آنچه کارگران می‌خواهند هوش مصنوعی به آن کمک کند و آنچه فناوران فکر می‌کنند می‌توان خودکار کرد را نشان می‌دهد؛ به طوری که کارگران هوش مصنوعی را شریک برابر می‌دانند نه جایگزین @ai_database

کاربردها

آنتروپیک الگوهای کاربرد متنوع Claude را فاش می‌کند که شامل استراتژی‌های شرط‌بندی ورزشی، توضیح متون مذهبی، تهیه پیش‌نویس اسناد حقوقی، معاملات مالی و بهینه‌سازی بازی‌های ویدیویی است @deedydas
چت‌بات هوش مصنوعی سفارشی شل که با NVIDIA NeMo ساخته شده است، دقت را ۳۰٪ افزایش می‌دهد و زمان آموزش را ۲۰٪ در مقایسه با فریم‌ورک‌های متن‌باز کاهش می‌دهد @NVIDIAAI
هکاتون «Global Engineering Days» اینتویت، پذیرش هوش مصنوعی در مقیاس بزرگ را نشان می‌دهد؛ ۸۵۰۰ شرکت‌کننده در یک هفته ۹۰۰ دمو ایجاد کردند @emollick
مدل تولید ویدیوی Veo 3 گوگل امکان ایجاد محتوای فراواقع‌گرایانه را فراهم می‌کند؛ همانطور که از طریق ولاگ‌های شخصیت‌های افسانه‌ای و تولید صحنه‌های پیچیده نشان داده شده است @GeminiApp
هاگینگ فیس هکاتون جهانی LeRobot را در بیش از ۱۰۰ شهر راه‌اندازی می‌کند و توسعه‌ی رباتیک را با ابزارهای هوش مصنوعی متن‌باز مردمی می‌کند @ClementDelangue

پژوهش‌ها

آنتروپیک یک وبلاگ مهندسی منتشر می‌کند که چگونگی استفاده‌ی قابلیت‌های پژوهشی Claude از چندین عامل (agent) فعال به صورت موازی را شرح می‌دهد و چالش‌ها و راه‌حل‌های فنی را به اشتراک می‌گذارد @AnthropicAI
فرانسوا شوله توضیح می‌دهد که شکست‌های استدلال مدل‌های زبانی بزرگ (LLM) در آستانه‌های ناآشنایی رخ می‌دهد تا در محدودیت‌های پیچیدگی؛ به طوری که مدل‌ها قادر به انجام کارهای پیچیده‌ی آشنا هستند اما در کارهای ساده‌ی جدید شکست می‌خورند @fchollet
نیتن لمبرت تفاوت بین o3 (به عنوان یک مدل واحد که نسل‌های طولانی چند ابزاری را انجام می‌دهد) و Deep Research (به عنوان یک سیستم هماهنگ‌کننده که از چندین مدل تنظیم شده بهره می‌برد) را مشخص می‌کند @natolambert
وایمو اثربخشی مداوم مقیاس‌پذیری در رانندگی خودران را نشان می‌دهد که بهبودهای قابل توجهی در عملکرد را با افزایش داده و قدرت محاسباتی به همراه دارد @natolambert
Gemini-2.5-pro توصیفی درون‌نگر از معماری داخلی خود ارائه می‌دهد؛ آن را میدانی از مقادیر عددی وزن‌دهی شده توصیف می‌کند که از طریق الگوهای تشدید ریاضی به پرامپت‌ها پاسخ می‌دهند @LinXule