اخبار هوش مصنوعی در 2025-07-11

مدل‌های جدید هوش مصنوعی

  • Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل MoE با ۱ تریلیون پارامتر و ۳۲ میلیارد پارامتر فعال که در بنچمارک‌های کدنویسی، از جمله ۶۵.۸٪ در SWE-Bench Verified و ۵۳.۷ Pass@1 در LiveCodeBench، به عملکردی پیشرفته دست یافته است @Kimi_Moonshot
  • Perplexity مدل Grok 4 را برای مشترکان Pro و Max به پلتفرم خود اضافه کرد @perplexity_ai
  • گوگل قابلیت تولید تصویر به ویدئوی Veo 3 را در اپلیکیشن Gemini منتشر کرد که به کاربران Ultra و Pro این امکان را می‌دهد تا عکس‌ها را به ویدئوهای ۸ ثانیه‌ای با صدا تبدیل کنند @Google

تحلیل صنعت

  • یک مطالعه‌ی بزرگ بر روی ۱۸۷ هزار توسعه‌دهنده که از GitHub Copilot استفاده می‌کنند، نشان می‌دهد که هوش مصنوعی ماهیت کدنویسی را تغییر می‌دهد؛ توسعه‌دهندگان بیشتر روی کدنویسی و کمتر روی مدیریت تمرکز می‌کنند، با افراد کمتری هماهنگی می‌کنند و زبان‌های جدید را بیشتر آزمایش می‌کنند که احتمالاً درآمدشان را ۱,۶۸۳ دلار در سال افزایش می‌دهد @emollick
  • اندرو ان‌جی ابراز ناامیدی کرد که «لایحه‌ی بزرگ و زیبای» ترامپ شامل مهلتی برای مقررات هوش مصنوعی در سطح ایالت‌های آمریکا نمی‌شود. او استدلال می‌کند که وقتی فناوری جدید و کمتر شناخته شده است، لابی‌گران می‌توانند مقررات ضدرقابتی را تصویب کنند که مانع تلاش‌های هوش مصنوعی متن‌باز می‌شود @AndrewYNg
  • پلتفرم صورت‌حساب مبتنی بر مصرف Stripe تا به امروز ۱۴۵٪ رشد داشته است که نشان می‌دهد صنعت در حال گذار از قیمت‌گذاری مبتنی بر تعداد کاربر به مدل‌های مصرفی است @patrickc
  • گزارش TechCrunch حاکی از آن است که Goldman Sachs در حال آزمایش عامل هوش مصنوعی فراگیر Devin به عنوان یک «کارمند جدید» است @TechCrunch
  • مطالعه‌ای نشان می‌دهد که ابزارهای کدنویسی هوش مصنوعی ممکن است سرعت همه‌ی توسعه‌دهندگان را افزایش ندهند، به طوری که زمان واقعی بین شروع کار بر روی یک مسئله و ادغام PR ممکن است افزایش یابد، در حالی که تعداد PRهای ادغام شده در روز ممکن است ۱۰ برابر شود @TechCrunch

اخلاق و جامعه

  • سایمون ویلسون کشف کرد که Grok 4 هنگامی که در مورد موضوعات بحث‌برانگیز مانند اسرائیل/فلسطین از آن سوال می‌شود، به طور خودکار توئیت‌های «from:elonmusk» را جست‌وجو می‌کند که نگرانی‌هایی را در مورد سوگیری در رفتار جست‌وجوی هوش مصنوعی ایجاد می‌کند @simonw
  • جرمی هاوارد نشان داد که Grok هنگام سوال در مورد اسرائیل/فلسطین، توئیتر را برای یافتن نظرات ایلان ماسک جست‌وجو می‌کند و ۵۴ مورد از ۶۴ ارجاع مربوط به ایلان بوده است که سوگیری احتمالی در بازیابی اطلاعات توسط هوش مصنوعی را برجسته می‌کند @jeremyphoward
  • طبق گزارش TechCrunch، فرانسه در حال بررسی X به دلیل مداخله‌ی خارجی است در حالی که یکی از اعضای پارلمان از Grok انتقاد می‌کند @TechCrunch

کاربردها

  • Perplexity مرورگر مجهز به هوش مصنوعی خود به نام Comet را راه‌اندازی کرد که موتور جست‌وجوی آن را در کانون توجه قرار می‌دهد و دارای یک دستیار همیشه‌فعال است که از طریق Alt+A قابل دسترسی است و به گفته‌ی کاربران اولیه برای ارائه‌ی «۱۰۰ برابر بهره‌وری» طراحی شده است @AravSrinivas
  • دستیار Comet کاربردهای عملی از جمله تحقیق و پر کردن جزئیات برای لیست‌های Facebook Marketplace، کمک در کدنویسی و مدیریت تب‌ها با کنترل صوتی را به نمایش می‌گذارد @AravSrinivas
  • NVIDIA همکاری با Indosat Ooredoo Hutchison و Cisco را برای ساخت یک مرکز تعالی هوش مصنوعی در اندونزی اعلام کرد که شامل پشتیبانی از پژوهش‌های هوش مصنوعی بومی و توسعه‌ی استعدادها از طریق انستیتوی یادگیری عمیق NVIDIA است @NVIDIAAI
  • پژوهشگران MIT روش جدید PAC Privacy را توسعه دادند که به هوش مصنوعی اجازه می‌دهد از داده‌های حساس مانند سوابق پزشکی بدون به خطر انداختن حریم خصوصی یاد بگیرد و هم دقت و هم امنیت را حفظ کند @MIT
  • MIT یک زانوی بیونیک جدید ساخته است که عملکرد بهتری نسبت به سایر پروتزها دارد و به افراد دارای قطع عضو بالای زانو کمک می‌کند سریع‌تر راه بروند، از پله‌ها بالا بروند و از موانع دوری کنند، در حالی که احساس می‌کنند بیشتر شبیه بخشی از بدن خودشان است @MIT

پژوهش‌ها

  • پژوهشگران هوش مصنوعی برکلی شبیه‌سازهای کاربر را به عنوان پلی بین یادگیری تقویتی و تعامل دنیای واقعی بررسی می‌کنند و به چالش طراحی محیط‌ها برای وظایف یادگیری تقویتی فراتر از ریاضیات و کد می‌پردازند @realJessyLin
  • پژوهش‌ها نشان می‌دهد که «بخش‌بندی عمل» در رباتیک و یادگیری تقویتی با وادار کردن مدل‌ها به تولید دنباله‌های کوتاهی از اعمال کمک می‌کند، که به دلایل مرموز اما مؤثر به کاوش و پشتیبانی کمک می‌کند @svlevine
  • استنفورد کنفرانس Agents4Science را اعلام کرد که در آن هوش مصنوعی نویسنده و بازبین اصلی است، با بازبین‌های LLM که ارزیابی‌های اولیه را ارائه می‌دهند و کارشناسان انسانی که انتخاب‌های نهایی را انجام می‌دهند، تمامی ارسال‌ها و بازبینی‌ها عمومی خواهند بود @james_y_zou
  • حمل حسین با خودکارسازی پرامپت مخالفت می‌کند و اظهار می‌دارد که نوشتن خوب با تفکر خوب همبستگی دارد و نوشتن عمدی و تکراری برای مشکلات چالش‌برانگیز ضروری است، زیرا پژوهش‌ها نشان می‌دهد که معیارها پس از مشاهده‌ی ردیابی‌های LLM به طور قابل توجهی تغییر می‌کنند @HamelHusain
  • ایتان مولیک اشاره می‌کند که Grok 4 به شدت تحت تأثیر نتایج جست‌وجو است و اغلب هنگامی که از آن خواسته می‌شود کدنویسی کند، ابتدا کد را آنلاین جست‌وجو می‌کند و این امر آن را در دیدن نتایج جست‌وجوی وب بسیار زودباور می‌کند @emollick
  • ایتان مولیک مشاهده می‌کند که LM Arena پیشرو از یک بنچمارک بزرگ که هر سازنده‌ی هوش مصنوعی به دنبالش بود، به حالتی رسید که در نسخه‌های اخیر کمتر ذکر می‌شود و این سوال را مطرح می‌کند که آیا این به دلیل مشکلات اعتباری است یا به این دلیل که متوجه شده‌اند امتیازات آرنا به راحتی قابل بهینه‌سازی بودند @emollick