اخبار هوش مصنوعی در 2025-07-11
مدلهای جدید هوش مصنوعی
- Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل MoE با ۱ تریلیون پارامتر و ۳۲ میلیارد پارامتر فعال که در بنچمارکهای کدنویسی، از جمله ۶۵.۸٪ در SWE-Bench Verified و ۵۳.۷ Pass@1 در LiveCodeBench، به عملکردی پیشرفته دست یافته است @Kimi_Moonshot
- Perplexity مدل Grok 4 را برای مشترکان Pro و Max به پلتفرم خود اضافه کرد @perplexity_ai
- گوگل قابلیت تولید تصویر به ویدئوی Veo 3 را در اپلیکیشن Gemini منتشر کرد که به کاربران Ultra و Pro این امکان را میدهد تا عکسها را به ویدئوهای ۸ ثانیهای با صدا تبدیل کنند @Google
تحلیل صنعت
- یک مطالعهی بزرگ بر روی ۱۸۷ هزار توسعهدهنده که از GitHub Copilot استفاده میکنند، نشان میدهد که هوش مصنوعی ماهیت کدنویسی را تغییر میدهد؛ توسعهدهندگان بیشتر روی کدنویسی و کمتر روی مدیریت تمرکز میکنند، با افراد کمتری هماهنگی میکنند و زبانهای جدید را بیشتر آزمایش میکنند که احتمالاً درآمدشان را ۱,۶۸۳ دلار در سال افزایش میدهد @emollick
- اندرو انجی ابراز ناامیدی کرد که «لایحهی بزرگ و زیبای» ترامپ شامل مهلتی برای مقررات هوش مصنوعی در سطح ایالتهای آمریکا نمیشود. او استدلال میکند که وقتی فناوری جدید و کمتر شناخته شده است، لابیگران میتوانند مقررات ضدرقابتی را تصویب کنند که مانع تلاشهای هوش مصنوعی متنباز میشود @AndrewYNg
- پلتفرم صورتحساب مبتنی بر مصرف Stripe تا به امروز ۱۴۵٪ رشد داشته است که نشان میدهد صنعت در حال گذار از قیمتگذاری مبتنی بر تعداد کاربر به مدلهای مصرفی است @patrickc
- گزارش TechCrunch حاکی از آن است که Goldman Sachs در حال آزمایش عامل هوش مصنوعی فراگیر Devin به عنوان یک «کارمند جدید» است @TechCrunch
- مطالعهای نشان میدهد که ابزارهای کدنویسی هوش مصنوعی ممکن است سرعت همهی توسعهدهندگان را افزایش ندهند، به طوری که زمان واقعی بین شروع کار بر روی یک مسئله و ادغام PR ممکن است افزایش یابد، در حالی که تعداد PRهای ادغام شده در روز ممکن است ۱۰ برابر شود @TechCrunch
اخلاق و جامعه
- سایمون ویلسون کشف کرد که Grok 4 هنگامی که در مورد موضوعات بحثبرانگیز مانند اسرائیل/فلسطین از آن سوال میشود، به طور خودکار توئیتهای «from:elonmusk» را جستوجو میکند که نگرانیهایی را در مورد سوگیری در رفتار جستوجوی هوش مصنوعی ایجاد میکند @simonw
- جرمی هاوارد نشان داد که Grok هنگام سوال در مورد اسرائیل/فلسطین، توئیتر را برای یافتن نظرات ایلان ماسک جستوجو میکند و ۵۴ مورد از ۶۴ ارجاع مربوط به ایلان بوده است که سوگیری احتمالی در بازیابی اطلاعات توسط هوش مصنوعی را برجسته میکند @jeremyphoward
- طبق گزارش TechCrunch، فرانسه در حال بررسی X به دلیل مداخلهی خارجی است در حالی که یکی از اعضای پارلمان از Grok انتقاد میکند @TechCrunch
کاربردها
- Perplexity مرورگر مجهز به هوش مصنوعی خود به نام Comet را راهاندازی کرد که موتور جستوجوی آن را در کانون توجه قرار میدهد و دارای یک دستیار همیشهفعال است که از طریق Alt+A قابل دسترسی است و به گفتهی کاربران اولیه برای ارائهی «۱۰۰ برابر بهرهوری» طراحی شده است @AravSrinivas
- دستیار Comet کاربردهای عملی از جمله تحقیق و پر کردن جزئیات برای لیستهای Facebook Marketplace، کمک در کدنویسی و مدیریت تبها با کنترل صوتی را به نمایش میگذارد @AravSrinivas
- NVIDIA همکاری با Indosat Ooredoo Hutchison و Cisco را برای ساخت یک مرکز تعالی هوش مصنوعی در اندونزی اعلام کرد که شامل پشتیبانی از پژوهشهای هوش مصنوعی بومی و توسعهی استعدادها از طریق انستیتوی یادگیری عمیق NVIDIA است @NVIDIAAI
- پژوهشگران MIT روش جدید PAC Privacy را توسعه دادند که به هوش مصنوعی اجازه میدهد از دادههای حساس مانند سوابق پزشکی بدون به خطر انداختن حریم خصوصی یاد بگیرد و هم دقت و هم امنیت را حفظ کند @MIT
- MIT یک زانوی بیونیک جدید ساخته است که عملکرد بهتری نسبت به سایر پروتزها دارد و به افراد دارای قطع عضو بالای زانو کمک میکند سریعتر راه بروند، از پلهها بالا بروند و از موانع دوری کنند، در حالی که احساس میکنند بیشتر شبیه بخشی از بدن خودشان است @MIT
پژوهشها
- پژوهشگران هوش مصنوعی برکلی شبیهسازهای کاربر را به عنوان پلی بین یادگیری تقویتی و تعامل دنیای واقعی بررسی میکنند و به چالش طراحی محیطها برای وظایف یادگیری تقویتی فراتر از ریاضیات و کد میپردازند @realJessyLin
- پژوهشها نشان میدهد که «بخشبندی عمل» در رباتیک و یادگیری تقویتی با وادار کردن مدلها به تولید دنبالههای کوتاهی از اعمال کمک میکند، که به دلایل مرموز اما مؤثر به کاوش و پشتیبانی کمک میکند @svlevine
- استنفورد کنفرانس Agents4Science را اعلام کرد که در آن هوش مصنوعی نویسنده و بازبین اصلی است، با بازبینهای LLM که ارزیابیهای اولیه را ارائه میدهند و کارشناسان انسانی که انتخابهای نهایی را انجام میدهند، تمامی ارسالها و بازبینیها عمومی خواهند بود @james_y_zou
- حمل حسین با خودکارسازی پرامپت مخالفت میکند و اظهار میدارد که نوشتن خوب با تفکر خوب همبستگی دارد و نوشتن عمدی و تکراری برای مشکلات چالشبرانگیز ضروری است، زیرا پژوهشها نشان میدهد که معیارها پس از مشاهدهی ردیابیهای LLM به طور قابل توجهی تغییر میکنند @HamelHusain
- ایتان مولیک اشاره میکند که Grok 4 به شدت تحت تأثیر نتایج جستوجو است و اغلب هنگامی که از آن خواسته میشود کدنویسی کند، ابتدا کد را آنلاین جستوجو میکند و این امر آن را در دیدن نتایج جستوجوی وب بسیار زودباور میکند @emollick
- ایتان مولیک مشاهده میکند که LM Arena پیشرو از یک بنچمارک بزرگ که هر سازندهی هوش مصنوعی به دنبالش بود، به حالتی رسید که در نسخههای اخیر کمتر ذکر میشود و این سوال را مطرح میکند که آیا این به دلیل مشکلات اعتباری است یا به این دلیل که متوجه شدهاند امتیازات آرنا به راحتی قابل بهینهسازی بودند @emollick