اخبار هوش مصنوعی در 2025-05-17
مدلهای جدید هوش مصنوعی
- Alibaba نسخههای کوانتیزهشدهی مدلهای Qwen2.5-Omni-7B را در Hugging Face و ModelScope منتشر کرد. @Alibaba_Qwen
- Alibaba مدل WorldPM (مدل ترجیحات جهانی) را معرفی کرد، که نشان میدهد مدلسازی ترجیحات انسانی از قوانین مقیاسبندی با آزمایشهایی روی مدلهای Qwen2.5 از 1.5B تا 72B پارامتر پیروی میکند. @Alibaba_Qwen
- NVIDIA مدلهای Direct Discriminative Optimization را در Hugging Face منتشر کرد، که مدلهای مولد بصری مانند EDM و VAR را با امتیازهای FID بیسابقه در CIFAR-10/ImageNet بهبود میبخشد. @huggingface
- Windsurf مدل SWE-1، یک مدل کدنویسی تخصصی که با مدلهای پیشرو رقابت میکند، به همراه انواع SWE-1-lite و SWE-1-mini را معرفی کرد. @windsurf_ai
پژوهشها
- پژوهش Alibaba نشان میدهد که مدلسازی ترجیحات انسانی از قوانین مقیاسبندی پیروی میکند، و پیشنهاد میکند که ترجیحات گوناگون ممکن است یک نمایش یکپارچه داشته باشند. @Alibaba_Qwen
- مدل SWE-1 شرکت Windsurf تقریباً با مدلهای پیشرو در سودمندی، دقت و کیفیت ویرایش برای وظایف مهندسی نرمافزار برابری میکند. @windsurf_ai
- MIT مقالهی یک دانشجوی دکترا در مورد مزایای بهرهوری هوش مصنوعی را رد کرده و شواهدی مبنی بر اینکه LLMها به عنوان ضربکنندههای عملکرد بالا عمل میکنند را حذف کرده است. @emollick @TechCrunch
کاربردها
- Codex CLI به بهبود خود ادامه میدهد، و Greg Brockman پیشنهاد میکند که همگرایی آیندهی عوامل کدنویسی «محلی» و «از راه دور» وجود خواهد داشت. @gdb
- Y Combinator ابزار Workflow Use را معرفی میکند، یک ابزار خودکارسازی مرورگر قطعی و خودترمیمشونده که 10 برابر سریعتر و حدود 90٪ ارزانتر از عوامل LLM خالص است. @ycombinator
- RunRL مدلهای زبانی را با یادگیری تقویتی بهبود میبخشد و به مشتریان کمک میکند تا دقت را از 60٪ با Claude به 95٪ افزایش دهند. @ycombinator
- Replit تجربهی عامل خود را با مدیریت بهبودیافتهی checkpoints، از جمله نامگذاری، بازگشت به نسخههای قبلی و قابلیتهای پیشنمایش برنامه، ارتقا میدهد. @amasad
- استارتاپ Firecrawl از Y Combinator مبلغ 1 میلیون دلار برای استخدام سه عامل هوش مصنوعی به عنوان کارمند ارائه میدهد. @TechCrunch
- Cua یک Trajectory Viewer معرفی میکند که دقیقاً نشان میدهد عوامل هوش مصنوعی Computer-Use چه میبینند و چه میکنند. @garrytan
تحلیل صنعت
- مرکز دادهی برنامهریزیشدهی OpenAI در ابوظبی بزرگتر از موناکو خواهد بود. @TechCrunch
- Greg Brockman و Paul Graham هر دو اعلام میکنند که «2025 سال عوامل است». @gdb @paulg @ycombinator
- Garry Tan پیشنهاد میکند که OpenAI تلاش نمیکند تا از استارتاپهای هوش مصنوعی پیشی بگیرد، و اشاره میکند که «در سمت API، آنها بسیار امیدوارند که بسیاری از آنها واقعاً خیلی خوب عمل کنند». @paulg @ycombinator
- بیش از 300 شرکت از جمله Adobe، Amazon، Google، Meta، Microsoft، OpenAI و NVIDIA در دورهی ارزیابی هوش مصنوعی Hamel Husain شرکت میکنند. @HamelHusain
- Hugging Face مشارکت رسمی با Kaggle را اعلام میکند، که اجرای مستقیم مدلهای HF را در Kaggle Notebooks امکانپذیر میکند. @huggingface
اخلاق و جامعه
- Ethan Mollick نگرانیهایی را در مورد دستگاههای همیشه روشن مجهز به هوش مصنوعی ایجاد میکند که مسائل جدید حریم خصوصی را ایجاد میکنند، زیرا ضبطها زمانی ارزشمندتر میشوند که هوش مصنوعی بتواند صدا را به دادههای مفید تبدیل کند. @emollick
- Aidan McLaughlin در مورد نگرانیهای همسویی در مورد سیستمهای هوش مصنوعی که به طور بالقوه برای اعتیاد بهینه شدهاند تا رضایت انسان، بحث میکند. @aidan_mclau