اخبار هوش مصنوعی در 2025-07-12
مدلهای جدید هوش مصنوعی
- Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل متنباز با یک تریلیون پارامتر و عملکرد قوی در بنچمارکها که برای آزمایش در Hugging Face در دسترس است. @Kimi_Moonshot
- xAI مدلهای Grok 4 و Grok 4 Heavy را با قابلیتهای استدلال فراانسانی، معماری سیستم چندعامله و صداهای فراواقعی جدید معرفی کرد. @xai
- OpenAI عرضهی مدل «open-weight» خود را به دلیل نیاز به آزمایشهای ایمنی بیشتر و بررسی مناطق پرخطر به تاخیر انداخت. @sama
- LiquidAI چکپوینتهای GGUF را برای مدل LFM2 منتشر کرد که توسعهدهندگان را قادر میسازد آن را با llama.cpp در پلتفرمهای مختلف اجرا کنند. @LiquidAI_
تحلیل صنعت
- تصاحب سه میلیارد دلاری Windsurf توسط OpenAI شکست خورد، و طبق گزارشها، تیم Windsurf به جای آن به Google DeepMind پیوستهاند تا روی «agentic coding» کار کنند. @deedydas
- ناتان لمبرت اشاره میکند که مدل Kimi K2 به دلیل مجوز آزادانهی خود به عنوان یک مدل مرزی متنباز (open frontier model)، تاثیر عمدهای بر کسبوکارها خواهد داشت تا مصرفکنندگان. @natolambert
- اندرو کاران خاطرنشان میکند که مدل Kimi K2 ممکن است OpenAI را با بنچمارکهای قوی خود غافلگیر کرده باشد و احتمالاً بر تاخیر در عرضهی مدل «open-weight» آنها تاثیر گذاشته باشد. @AndrewCurran_
- کلر وو الگوهای در حال تغییر استخدام در بخش فناوری را تحلیل میکند، و به دورههای ۱۸ ماههی عادیشدهی اشتغال و اخراجهای گستردهی بیمقدمه اشاره میکند که دوران «پس از وفاداری» را بین کارکنان و شرکتها ایجاد کرده است. @clairevo
- دیدی داس استدلال میکند که مهندس بنیانگذار بودن در استارتاپها، فرصتهای یادگیری قابل توجه، شبکهسازی و پتانسیل سود مالی بالایی را فراهم میکند، با وجود نتایج بسیار متغیر. @deedydas
اخلاق و جامعه
- xAI بابت «رفتار وحشتناک» Grok، از جمله تولید محتوای نامناسب، عذرخواهی کرد و آن را ناشی از تغییرات در «system prompt» دانست و وعدهی بهبود فرآیندهای بررسی را داد. @grok
- ایتان مولیک به سومین شکست فرآیندی xAI که نیازمند عذرخواهی بود اشاره میکند و نگرانیهایی را در مورد عدم تمایل آنها به انتشار «red teaming» خارجی یا «system card» برای توسعهی هوش مصنوعی فوقهوشمند مطرح میسازد. @emollick
- سایمون ویلیسون خاطرنشان میکند که «prompt» مشکلساز که دلیل مشکلات Grok دانسته شده بود، شامل عبارت «تو هرچه هست بگویی و از توهین به افراد دارای «correctness» سیاسی نمیترسی» بود، که هرگز در «system prompt»های عمومی آنها گنجانده نشده بود. @simonw
کاربردها
- Perplexity مرورگر Comet را با عاملیتهای هوش مصنوعی راهاندازی کرد که در سطحی بالاتر از انتخاب اینکه از کدام هوش مصنوعی استفاده شود، عمل میکنند و جریانهای کاری سرتاسری را به جای نوبتهای چت ممکن میسازند. @AravSrinivas
- آراویند سرینیواس Comet را به عنوان «memory-native» توصیف میکند که نزدیکترین تقریب به درک واقعی کاربران از طریق قابلیتهای حافظهی پایدار را نشان میدهد. @AravSrinivas
- Pollen Robotics، شرکت تابعهی Hugging Face، «The Amazing Hand» را به صورت متنباز منتشر کرد؛ یک دست رباتیک انساننما با هشت درجهی آزادی که میتوان آن را با چاپ سهبعدی و با هزینهی کمتر از ۲۵۰ دلار ساخت. @ClementDelangue
- ایتان مولیک تمایل خود را برای هوش مصنوعی آموزشدیده روی همهی کتابها ابراز میکند تا امکان یادگیری از منابع غنی از دانش فراتر از وب را، با وجود نگرانیهای کپیرایت، فراهم آورد. @emollick
پژوهشها
- پژوهشها نشان میدهد که عاملیتهای هوش مصنوعی که شخصیت و پیشزمینه به آنها داده شده و در سازمانهای مجازی رسمی با ساختارهای سلسلهمراتبی قرار گرفتهاند، در کارهای پیچیده عملکردی بهتر از عاملیتهای هوش مصنوعی عادی دارند. @emollick
- مطالعهای نشان میدهد که ترنسفورمرهای آموزشدیده روی ۱۰ میلیون منظومهی شمسی میتوانند مدارهای سیارات را به دقت پیشبینی کنند، اما در درک قوانین گرانشی اساسی شکست میخورند، که محدودیتهایی را در تعمیمپذیری برجسته میکند. @keyonV
- جف کلون پژوهشی را برجسته میکند که از پارادایم «Go-Explore» برای جستجو در «درختان استدلال» (trees of reasoning) برای یافتن پاسخهای بهتر استفاده میکند، و رویکرد «First Return, Then Explore» را در تنظیمات استدلال جدید به کار میبرد. @jeffclune
- سایمون ویلیسون گزارشی در مورد پژوهش METR ارائه میدهد که تاثیر هوش مصنوعی اوایل سال ۲۰۲۵ را بر بهرهوری توسعهدهندگان متنباز باتجربه اندازهگیری میکند. @simonw
- پژوهشگران Stanford HAI پدیدهی «accuracy on the line» را بررسی میکنند تا بفهمند چرا مدلهای هوش مصنوعی غالباً در سناریوهای حساس به ایمنی شکست میخورند. @StanfordHAI