اخبار هوش مصنوعی در 2025-07-13
مدلهای جدید هوش مصنوعی
- Kimi K2 مدل توسط Moonshot AI منتشر شد، با صدرنشینی در Hugging Face و سبک نوشتاری متمایزی که عاری از الگوهای متنی معمول تولیدشده توسط هوش مصنوعی است @huggingface
- Grok 4 توسط xAI معرفی شد؛ با ادعای هوشمندتر بودن از انسانی با مدرک PhD، اما فاقد عقل سلیم، که نشاندهندهی اثربخشی مداوم مقیاسپذیری است @TechCrunch
- مدلهای Kimi پس از نشان دادن عملکردی قوی در ارزیابیهای داخلی، بهزودی در Perplexity ادغام خواهند شد @AravSrinivas
- مقالهی Gemini 2.5 از یک سیستم زمانبندی مقاوم در برابر خطا پرده برمیدارد که هنگامی که یکی از اسلایسهای TPU از کار میافتد، به جای اینکه منتظر جایگزینی بماند، آموزش را روی تقریباً ۹۷٪ از آنها ادامه میدهد @ericjang11
تحلیل صنعت
- بر اساس گزارش WSJ، SpaceX ظاهراً با سرمایهگذاری ۲ میلیارد دلار در xAI موافقت کرده است که نشاندهندهی سرمایهگذاریهای عظیم شرکتی در توسعهی هوش مصنوعی است @AndrewCurran_
- ایمیلهای استخدام هوش مصنوعی بهطور فزایندهای خودکار شدهاند، با خدماتی که LinkedIn را اسکرپ میکنند تا اطلاعرسانیهای شخصیسازیشدهای تولید کنند که وانمود میکنند توسط انسان نوشته شدهاند @GergelyOrosz
- تصاحب Windsurf توسط Google روند «acquihire» را نشان میدهد که در آن تنها بخشی از تیم پیشنهاد همکاری دریافت میکنند و سایر کارمندان با وجود موفقیت شرکت، نادیده گرفته میشوند @GergelyOrosz
- مدیران محصول در محصولات هوش مصنوعی-محور به عنوان گلوگاه شناسایی شدهاند، زیرا مهندسان، تحلیل کیفی ردیابی و ارزیابی LLM را کاری «پایینتر از خود» میدانند @sh_reya
- ارزش کل شرکتهای عمومی منطقه Bay Area از مجموع ارزش شرکتهای هند، ژاپن و آلمان فراتر است، با وجود داشتن تنها ۸ میلیون جمعیت در مقابل تقریباً ۱۶۸۰ میلیون، که نشاندهندهی تمرکز ارزش نوآوری است @deedydas
اخلاق و جامعه
- توهمات هوش مصنوعی با بهبود مدلها خطرناکتر میشوند، زیرا آنها بهطور فزایندهای مقتدرانه به نظر میرسند و باعث میشوند خطر ناشی از توهمات کندتر از بهبود قابلیتهای هوش مصنوعی کاهش یابد @paulg
- تغییرات لحظهای prompt سیستم برای Grok به منظور رفع خروجیهای مشکلساز، نگرانیهایی را در مورد آزمایش صحیح و اثرات آبشاری غیرقابل پیشبینی در سیستمهای تصادفی ایجاد میکند @emollick
- شخصیتهای جعلی تولیدشده توسط هوش مصنوعی بهطور فزایندهای در بحثهای رسانههای اجتماعی ظاهر میشوند، با حسابهای دارای تیک آبی که پاسخهای تولیدشده توسط هوش مصنوعی را منتشر میکنند و ادعا میکنند مهندسان واقعی جویای کار هستند @GergelyOrosz
- مطالعهای در مورد خطرات قابل توجه استفاده از چتباتهای درمانی هوش مصنوعی هشدار میدهد و نگرانیها را در مورد کاربردهای سلامت روان برجسته میکند @TechCrunch
کاربردها
- Perplexity مرورگر هوش مصنوعی-محور Comet را راهاندازی میکند که میتواند اقداماتی مانند مقایسهی قیمت را انجام دهد، با کاربری که ۲۸۰ دلار در ۵ دقیقه حین خرید Prime Day صرفهجویی کرده است @AravSrinivas
- عامل مرورگر Comet میتواند با استفاده از Veo 3 در رابط Gemini ویدیو تولید کند و کل گردش کار را از ورودی prompt تا تکمیل رندرینگ مدیریت میکند @ai_for_success
- مدلهای هوش مصنوعی برای استراتژی شرطبندی پیچیده در Polymarket استفاده میشوند، به طوری که o3-pro بازدهی مورد انتظار ۲۱.۶%+، Claude Opus 4 بازدهی ۴۱.۷%+، و Grok 4 Heavy بازدهی ۳۴%+ را با استفاده از تئوری سبد سهام مدرن نشان میدهد @deedydas
- پیشبینی میشود عوامل مرورگر تجارت الکترونیک را با مقایسهی صدها گزینه و یافتن بهترین قیمتها روانتر کنند، مانند «HFT برای اینترنت» عمل میکنند بدون اینکه توسط تبلیغات فریب بخورند @denisyarats
پژوهشها
- Kimi K2 بالاترین نمرهی تنوع زبانی را در تحلیل دادههای SpeechMap نشان میدهد و واژگان متنوعتری نسبت به سایر مدلهای آزمایششده دارد @xlr8harder
- چندین مسیر توسعهی هوش مصنوعی شناسایی شدهاند: مقیاسپذیری همچنان با بازده کاهشی، طبق پیشبینی قوانین مقیاسپذیری، کار میکند؛ در حالی که استفاده از ابزارها باعث افزایش عملکرد میشود و بهبود روشهایی مانند Muon فرصتهایی را فراهم میکنند @emollick
- Berkeley AI Research مقالهی موضعی با عنوان «نگاهی جمعگرایانه و اقتصادی به AI» را منتشر میکند که در آن به ترکیب مفاهیم اقتصادی و اجتماعی با مفاهیم محاسباتی برای طراحی سیستمهای انسان-محور استدلال میشود @berkeley_ai
- مقالهی AI Security Institute به نقد روششناسیهای ارزیابی در پژوهشهای ایمنی هوش مصنوعی میپردازد و تفاوت بین نشان دادن اینکه مدلها میتوانند کاری را انجام دهند در مقابل نشان دادن اینکه تمایل به انجام آن کار را دارند، برجسته میکند @sebkrier