اخبار هوش مصنوعی در 2025-07-13

مدل‌های جدید هوش مصنوعی

  • Kimi K2 مدل توسط Moonshot AI منتشر شد، با صدرنشینی در Hugging Face و سبک نوشتاری متمایزی که عاری از الگوهای متنی معمول تولیدشده توسط هوش مصنوعی است @huggingface
  • Grok 4 توسط xAI معرفی شد؛ با ادعای هوشمندتر بودن از انسانی با مدرک PhD، اما فاقد عقل سلیم، که نشان‌دهنده‌ی اثربخشی مداوم مقیاس‌پذیری است @TechCrunch
  • مدل‌های Kimi پس از نشان دادن عملکردی قوی در ارزیابی‌های داخلی، به‌زودی در Perplexity ادغام خواهند شد @AravSrinivas
  • مقاله‌ی Gemini 2.5 از یک سیستم زمان‌بندی مقاوم در برابر خطا پرده برمی‌دارد که هنگامی که یکی از اسلایس‌های TPU از کار می‌افتد، به جای اینکه منتظر جایگزینی بماند، آموزش را روی تقریباً ۹۷٪ از آن‌ها ادامه می‌دهد @ericjang11

تحلیل صنعت

  • بر اساس گزارش WSJ، SpaceX ظاهراً با سرمایه‌گذاری ۲ میلیارد دلار در xAI موافقت کرده است که نشان‌دهنده‌ی سرمایه‌گذاری‌های عظیم شرکتی در توسعه‌ی هوش مصنوعی است @AndrewCurran_
  • ایمیل‌های استخدام هوش مصنوعی به‌طور فزاینده‌ای خودکار شده‌اند، با خدماتی که LinkedIn را اسکرپ می‌کنند تا اطلاع‌رسانی‌های شخصی‌سازی‌شده‌ای تولید کنند که وانمود می‌کنند توسط انسان نوشته شده‌اند @GergelyOrosz
  • تصاحب Windsurf توسط Google روند «acquihire» را نشان می‌دهد که در آن تنها بخشی از تیم پیشنهاد همکاری دریافت می‌کنند و سایر کارمندان با وجود موفقیت شرکت، نادیده گرفته می‌شوند @GergelyOrosz
  • مدیران محصول در محصولات هوش مصنوعی-محور به عنوان گلوگاه شناسایی شده‌اند، زیرا مهندسان، تحلیل کیفی ردیابی و ارزیابی LLM را کاری «پایین‌تر از خود» می‌دانند @sh_reya
  • ارزش کل شرکت‌های عمومی منطقه Bay Area از مجموع ارزش شرکت‌های هند، ژاپن و آلمان فراتر است، با وجود داشتن تنها ۸ میلیون جمعیت در مقابل تقریباً ۱۶۸۰ میلیون، که نشان‌دهنده‌ی تمرکز ارزش نوآوری است @deedydas

اخلاق و جامعه

  • توهمات هوش مصنوعی با بهبود مدل‌ها خطرناک‌تر می‌شوند، زیرا آن‌ها به‌طور فزاینده‌ای مقتدرانه به نظر می‌رسند و باعث می‌شوند خطر ناشی از توهمات کندتر از بهبود قابلیت‌های هوش مصنوعی کاهش یابد @paulg
  • تغییرات لحظه‌ای prompt سیستم برای Grok به منظور رفع خروجی‌های مشکل‌ساز، نگرانی‌هایی را در مورد آزمایش صحیح و اثرات آبشاری غیرقابل پیش‌بینی در سیستم‌های تصادفی ایجاد می‌کند @emollick
  • شخصیت‌های جعلی تولیدشده توسط هوش مصنوعی به‌طور فزاینده‌ای در بحث‌های رسانه‌های اجتماعی ظاهر می‌شوند، با حساب‌های دارای تیک آبی که پاسخ‌های تولیدشده توسط هوش مصنوعی را منتشر می‌کنند و ادعا می‌کنند مهندسان واقعی جویای کار هستند @GergelyOrosz
  • مطالعه‌ای در مورد خطرات قابل توجه استفاده از چت‌بات‌های درمانی هوش مصنوعی هشدار می‌دهد و نگرانی‌ها را در مورد کاربردهای سلامت روان برجسته می‌کند @TechCrunch

کاربردها

  • Perplexity مرورگر هوش مصنوعی-محور Comet را راه‌اندازی می‌کند که می‌تواند اقداماتی مانند مقایسه‌ی قیمت را انجام دهد، با کاربری که ۲۸۰ دلار در ۵ دقیقه حین خرید Prime Day صرفه‌جویی کرده است @AravSrinivas
  • عامل مرورگر Comet می‌تواند با استفاده از Veo 3 در رابط Gemini ویدیو تولید کند و کل گردش کار را از ورودی prompt تا تکمیل رندرینگ مدیریت می‌کند @ai_for_success
  • مدل‌های هوش مصنوعی برای استراتژی شرط‌بندی پیچیده در Polymarket استفاده می‌شوند، به طوری که o3-pro بازدهی مورد انتظار ۲۱.۶%+، Claude Opus 4 بازدهی ۴۱.۷%+، و Grok 4 Heavy بازدهی ۳۴%+ را با استفاده از تئوری سبد سهام مدرن نشان می‌دهد @deedydas
  • پیش‌بینی می‌شود عوامل مرورگر تجارت الکترونیک را با مقایسه‌ی صدها گزینه و یافتن بهترین قیمت‌ها روان‌تر کنند، مانند «HFT برای اینترنت» عمل می‌کنند بدون اینکه توسط تبلیغات فریب بخورند @denisyarats

پژوهش‌ها

  • Kimi K2 بالاترین نمره‌ی تنوع زبانی را در تحلیل داده‌های SpeechMap نشان می‌دهد و واژگان متنوع‌تری نسبت به سایر مدل‌های آزمایش‌شده دارد @xlr8harder
  • چندین مسیر توسعه‌ی هوش مصنوعی شناسایی شده‌اند: مقیاس‌پذیری همچنان با بازده کاهشی، طبق پیش‌بینی قوانین مقیاس‌پذیری، کار می‌کند؛ در حالی که استفاده از ابزارها باعث افزایش عملکرد می‌شود و بهبود روش‌هایی مانند Muon فرصت‌هایی را فراهم می‌کنند @emollick
  • Berkeley AI Research مقاله‌ی موضعی با عنوان «نگاهی جمع‌گرایانه و اقتصادی به AI» را منتشر می‌کند که در آن به ترکیب مفاهیم اقتصادی و اجتماعی با مفاهیم محاسباتی برای طراحی سیستم‌های انسان-محور استدلال می‌شود @berkeley_ai
  • مقاله‌ی AI Security Institute به نقد روش‌شناسی‌های ارزیابی در پژوهش‌های ایمنی هوش مصنوعی می‌پردازد و تفاوت بین نشان دادن اینکه مدل‌ها می‌توانند کاری را انجام دهند در مقابل نشان دادن اینکه تمایل به انجام آن کار را دارند، برجسته می‌کند @sebkrier