اخبار هوش مصنوعی در 2025-07-11

مدل‌های جدید هوش مصنوعی

Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل MoE با ۱ تریلیون پارامتر و ۳۲ میلیارد پارامتر فعال که در بنچمارک‌های کدنویسی، از جمله ۶۵.۸٪ در SWE-Bench Verified و ۵۳.۷ Pass@1 در LiveCodeBench، به عملکردی پیشرفته دست یافته است @Kimi_Moonshot
Perplexity مدل Grok 4 را برای مشترکان Pro و Max به پلتفرم خود اضافه کرد @perplexity_ai
گوگل قابلیت تولید تصویر به ویدئوی Veo 3 را در اپلیکیشن Gemini منتشر کرد که به کاربران Ultra و Pro این امکان را می‌دهد تا عکس‌ها را به ویدئوهای ۸ ثانیه‌ای با صدا تبدیل کنند @Google

تحلیل صنعت

یک مطالعه‌ی بزرگ بر روی ۱۸۷ هزار توسعه‌دهنده که از GitHub Copilot استفاده می‌کنند، نشان می‌دهد که هوش مصنوعی ماهیت کدنویسی را تغییر می‌دهد؛ توسعه‌دهندگان بیشتر روی کدنویسی و کمتر روی مدیریت تمرکز می‌کنند، با افراد کمتری هماهنگی می‌کنند و زبان‌های جدید را بیشتر آزمایش می‌کنند که احتمالاً درآمدشان را ۱,۶۸۳ دلار در سال افزایش می‌دهد @emollick
اندرو ان‌جی ابراز ناامیدی کرد که «لایحه‌ی بزرگ و زیبای» ترامپ شامل مهلتی برای مقررات هوش مصنوعی در سطح ایالت‌های آمریکا نمی‌شود. او استدلال می‌کند که وقتی فناوری جدید و کمتر شناخته شده است، لابی‌گران می‌توانند مقررات ضدرقابتی را تصویب کنند که مانع تلاش‌های هوش مصنوعی متن‌باز می‌شود @AndrewYNg
پلتفرم صورت‌حساب مبتنی بر مصرف Stripe تا به امروز ۱۴۵٪ رشد داشته است که نشان می‌دهد صنعت در حال گذار از قیمت‌گذاری مبتنی بر تعداد کاربر به مدل‌های مصرفی است @patrickc
گزارش TechCrunch حاکی از آن است که Goldman Sachs در حال آزمایش عامل هوش مصنوعی فراگیر Devin به عنوان یک «کارمند جدید» است @TechCrunch
مطالعه‌ای نشان می‌دهد که ابزارهای کدنویسی هوش مصنوعی ممکن است سرعت همه‌ی توسعه‌دهندگان را افزایش ندهند، به طوری که زمان واقعی بین شروع کار بر روی یک مسئله و ادغام PR ممکن است افزایش یابد، در حالی که تعداد PRهای ادغام شده در روز ممکن است ۱۰ برابر شود @TechCrunch

اخلاق و جامعه

سایمون ویلسون کشف کرد که Grok 4 هنگامی که در مورد موضوعات بحث‌برانگیز مانند اسرائیل/فلسطین از آن سوال می‌شود، به طور خودکار توئیت‌های «from:elonmusk» را جست‌وجو می‌کند که نگرانی‌هایی را در مورد سوگیری در رفتار جست‌وجوی هوش مصنوعی ایجاد می‌کند @simonw
جرمی هاوارد نشان داد که Grok هنگام سوال در مورد اسرائیل/فلسطین، توئیتر را برای یافتن نظرات ایلان ماسک جست‌وجو می‌کند و ۵۴ مورد از ۶۴ ارجاع مربوط به ایلان بوده است که سوگیری احتمالی در بازیابی اطلاعات توسط هوش مصنوعی را برجسته می‌کند @jeremyphoward
طبق گزارش TechCrunch، فرانسه در حال بررسی X به دلیل مداخله‌ی خارجی است در حالی که یکی از اعضای پارلمان از Grok انتقاد می‌کند @TechCrunch

کاربردها

Perplexity مرورگر مجهز به هوش مصنوعی خود به نام Comet را راه‌اندازی کرد که موتور جست‌وجوی آن را در کانون توجه قرار می‌دهد و دارای یک دستیار همیشه‌فعال است که از طریق Alt+A قابل دسترسی است و به گفته‌ی کاربران اولیه برای ارائه‌ی «۱۰۰ برابر بهره‌وری» طراحی شده است @AravSrinivas
دستیار Comet کاربردهای عملی از جمله تحقیق و پر کردن جزئیات برای لیست‌های Facebook Marketplace، کمک در کدنویسی و مدیریت تب‌ها با کنترل صوتی را به نمایش می‌گذارد @AravSrinivas
NVIDIA همکاری با Indosat Ooredoo Hutchison و Cisco را برای ساخت یک مرکز تعالی هوش مصنوعی در اندونزی اعلام کرد که شامل پشتیبانی از پژوهش‌های هوش مصنوعی بومی و توسعه‌ی استعدادها از طریق انستیتوی یادگیری عمیق NVIDIA است @NVIDIAAI
پژوهشگران MIT روش جدید PAC Privacy را توسعه دادند که به هوش مصنوعی اجازه می‌دهد از داده‌های حساس مانند سوابق پزشکی بدون به خطر انداختن حریم خصوصی یاد بگیرد و هم دقت و هم امنیت را حفظ کند @MIT
MIT یک زانوی بیونیک جدید ساخته است که عملکرد بهتری نسبت به سایر پروتزها دارد و به افراد دارای قطع عضو بالای زانو کمک می‌کند سریع‌تر راه بروند، از پله‌ها بالا بروند و از موانع دوری کنند، در حالی که احساس می‌کنند بیشتر شبیه بخشی از بدن خودشان است @MIT

پژوهش‌ها

پژوهشگران هوش مصنوعی برکلی شبیه‌سازهای کاربر را به عنوان پلی بین یادگیری تقویتی و تعامل دنیای واقعی بررسی می‌کنند و به چالش طراحی محیط‌ها برای وظایف یادگیری تقویتی فراتر از ریاضیات و کد می‌پردازند @realJessyLin
پژوهش‌ها نشان می‌دهد که «بخش‌بندی عمل» در رباتیک و یادگیری تقویتی با وادار کردن مدل‌ها به تولید دنباله‌های کوتاهی از اعمال کمک می‌کند، که به دلایل مرموز اما مؤثر به کاوش و پشتیبانی کمک می‌کند @svlevine
استنفورد کنفرانس Agents4Science را اعلام کرد که در آن هوش مصنوعی نویسنده و بازبین اصلی است، با بازبین‌های LLM که ارزیابی‌های اولیه را ارائه می‌دهند و کارشناسان انسانی که انتخاب‌های نهایی را انجام می‌دهند، تمامی ارسال‌ها و بازبینی‌ها عمومی خواهند بود @james_y_zou
حمل حسین با خودکارسازی پرامپت مخالفت می‌کند و اظهار می‌دارد که نوشتن خوب با تفکر خوب همبستگی دارد و نوشتن عمدی و تکراری برای مشکلات چالش‌برانگیز ضروری است، زیرا پژوهش‌ها نشان می‌دهد که معیارها پس از مشاهده‌ی ردیابی‌های LLM به طور قابل توجهی تغییر می‌کنند @HamelHusain
ایتان مولیک اشاره می‌کند که Grok 4 به شدت تحت تأثیر نتایج جست‌وجو است و اغلب هنگامی که از آن خواسته می‌شود کدنویسی کند، ابتدا کد را آنلاین جست‌وجو می‌کند و این امر آن را در دیدن نتایج جست‌وجوی وب بسیار زودباور می‌کند @emollick
ایتان مولیک مشاهده می‌کند که LM Arena پیشرو از یک بنچمارک بزرگ که هر سازنده‌ی هوش مصنوعی به دنبالش بود، به حالتی رسید که در نسخه‌های اخیر کمتر ذکر می‌شود و این سوال را مطرح می‌کند که آیا این به دلیل مشکلات اعتباری است یا به این دلیل که متوجه شده‌اند امتیازات آرنا به راحتی قابل بهینه‌سازی بودند @emollick