اخبار هوش مصنوعی در 2025-05-17

مدل‌های جدید هوش مصنوعی

  • ‏Alibaba نسخه‌های کوانتیزه‌شده‌ی مدل‌های Qwen2.5-Omni-7B را در Hugging Face و ModelScope منتشر کرد. @Alibaba_Qwen
  • ‏Alibaba مدل WorldPM (مدل ترجیحات جهانی) را معرفی کرد، که نشان می‌دهد مدل‌سازی ترجیحات انسانی از قوانین مقیاس‌بندی با آزمایش‌هایی روی مدل‌های Qwen2.5 از 1.5B تا 72B پارامتر پیروی می‌کند. @Alibaba_Qwen
  • ‏NVIDIA مدل‌های Direct Discriminative Optimization را در Hugging Face منتشر کرد، که مدل‌های مولد بصری مانند EDM و VAR را با امتیازهای FID بی‌سابقه‌ در CIFAR-10/ImageNet بهبود می‌بخشد. @huggingface
  • ‏Windsurf مدل SWE-1، یک مدل کدنویسی تخصصی که با مدل‌های پیشرو رقابت می‌کند، به همراه انواع SWE-1-lite و SWE-1-mini را معرفی کرد. @windsurf_ai

پژوهش‌ها

  • پژوهش Alibaba نشان می‌دهد که مدل‌سازی ترجیحات انسانی از قوانین مقیاس‌بندی پیروی می‌کند، و پیشنهاد می‌کند که ترجیحات گوناگون ممکن است یک نمایش یکپارچه داشته باشند. @Alibaba_Qwen
  • مدل SWE-1 شرکت Windsurf تقریباً با مدل‌های پیشرو در سودمندی، دقت و کیفیت ویرایش برای وظایف مهندسی نرم‌افزار برابری می‌کند. @windsurf_ai
  • ‏MIT مقاله‌ی یک دانشجوی دکترا در مورد مزایای بهره‌وری هوش مصنوعی را رد کرده و شواهدی مبنی بر اینکه LLMها به عنوان ضرب‌کننده‌های عملکرد بالا عمل می‌کنند را حذف کرده است. @emollick @TechCrunch

کاربردها

  • Codex CLI به بهبود خود ادامه می‌دهد، و Greg Brockman پیشنهاد می‌کند که همگرایی آینده‌ی عوامل کدنویسی «محلی» و «از راه دور» وجود خواهد داشت. @gdb
  • ‏Y Combinator ابزار Workflow Use را معرفی می‌کند، یک ابزار خودکارسازی مرورگر قطعی و خودترمیم‌شونده که 10 برابر سریع‌تر و حدود 90٪ ارزان‌تر از عوامل LLM خالص است. @ycombinator
  • ‏RunRL مدل‌های زبانی را با یادگیری تقویتی بهبود می‌بخشد و به مشتریان کمک می‌کند تا دقت را از 60٪ با Claude به 95٪ افزایش دهند. @ycombinator
  • ‏Replit تجربه‌ی عامل خود را با مدیریت بهبودیافته‌ی checkpoints، از جمله نام‌گذاری، بازگشت به نسخه‌های قبلی و قابلیت‌های پیش‌نمایش برنامه، ارتقا می‌دهد. @amasad
  • استارتاپ Firecrawl از Y Combinator مبلغ 1 میلیون دلار برای استخدام سه عامل هوش مصنوعی به عنوان کارمند ارائه می‌دهد. @TechCrunch
  • ‏Cua یک Trajectory Viewer معرفی می‌کند که دقیقاً نشان می‌دهد عوامل هوش مصنوعی Computer-Use چه می‌بینند و چه می‌کنند. @garrytan

تحلیل صنعت

  • مرکز داده‌ی برنامه‌ریزی‌شده‌ی OpenAI در ابوظبی بزرگتر از موناکو خواهد بود. @TechCrunch
  • ‏Greg Brockman و Paul Graham هر دو اعلام می‌کنند که «2025 سال عوامل است». @gdb @paulg @ycombinator
  • ‏Garry Tan پیشنهاد می‌کند که OpenAI تلاش نمی‌کند تا از استارتاپ‌های هوش مصنوعی پیشی بگیرد، و اشاره می‌کند که «در سمت API، آن‌ها بسیار امیدوارند که بسیاری از آن‌ها واقعاً خیلی خوب عمل کنند». @paulg @ycombinator
  • بیش از 300 شرکت از جمله Adobe، Amazon، Google، Meta، Microsoft، OpenAI و NVIDIA در دوره‌ی ارزیابی هوش مصنوعی Hamel Husain شرکت می‌کنند. @HamelHusain
  • ‏Hugging Face مشارکت رسمی با Kaggle را اعلام می‌کند، که اجرای مستقیم مدل‌های HF را در Kaggle Notebooks امکان‌پذیر می‌کند. @huggingface

اخلاق و جامعه

  • ‏Ethan Mollick نگرانی‌هایی را در مورد دستگاه‌های همیشه روشن مجهز به هوش مصنوعی ایجاد می‌کند که مسائل جدید حریم خصوصی را ایجاد می‌کنند، زیرا ضبط‌ها زمانی ارزشمندتر می‌شوند که هوش مصنوعی بتواند صدا را به داده‌های مفید تبدیل کند. @emollick
  • ‏Aidan McLaughlin در مورد نگرانی‌های همسویی در مورد سیستم‌های هوش مصنوعی که به طور بالقوه برای اعتیاد بهینه شده‌اند تا رضایت انسان، بحث می‌کند. @aidan_mclau