اخبار هوش مصنوعی در 2025-07-28
مدلهای جدید هوش مصنوعی
- شرکت Zhipu AI مدلهای GLM-4.5 و GLM-4.5-Air را با مجوز MIT منتشر کرد. این مدلها بهترتیب ۳۵۵ میلیارد پارامتر کلی (۳۲ میلیارد فعال) و ۱۰۶ میلیارد پارامتر کلی (۱۲ میلیارد فعال) دارند و هر دو با طول کانتکست ۱۲۸ هزار و قابلیت فراخوانی توابع بومی ارائه شدهاند @reach_vb
- مدل تولید ویدیوی xAI با نام Imagine در حال آمادهسازی برای راهاندازی با ادغام در Grok است، که قابلیتهای صوتی مشابه Veo 3 را ارائه میدهد @AndrewCurran_
تحلیل صنعت
- شرکت جفریز پیشبینی هزینهی سرمایهای هوش مصنوعی چین برای سال ۲۰۲۵ را ۴۰ درصد افزایش داده و به ۱۰۸ میلیارد دلار رسانده است، با اشاره به اینکه کل موجودی تراشههای H20 شرکت NVIDIA تنها حدود نیمی از تقاضای بالقوهی چین را برآورده میکند @AndrewCurran_
- تسلا قرارداد ۱۶.۵ میلیارد دلاری تراشه با سامسونگ امضا کرد که تا سال ۲۰۳۳ اعتبار دارد، و تسلا در افزایش حداکثری بهرهوری تولید تراشههای هوش مصنوعی کمک خواهد کرد @AndrewCurran_
- استفاده از Perplexity در هند بهسرعت در حال رشد است، و مدیرعامل این شرکت این موضوع را دلیلی بر تغییر همیشگی جستجو میداند @AravSrinivas
- مدلهای زبان بزرگ (LLMها) اکنون هدایتکنندهی بخش عمدهی خریدهای اختیاری هستند اما هیچ درآمد تبلیغاتی ایجاد نمیکنند، که سوالاتی را در مورد پایداری این مدل به وجود میآورد @snowmaker
- شرکت Anthropic محدودیتهای نرخ هفتگی جدیدی را برای طرحهای Claude Pro و Max معرفی کرد که بهدلیل تقاضای بیسابقهی برای Claude Code است و کمتر از ۵٪ از مشترکین را تحت تأثیر قرار میدهد @AnthropicAI
- نقشهای مهندسی نرمافزار ممکن است با استفادهی گسترده از دستیارهای برنامهنویسی، نیاز به تحول چشمگیری داشته باشند، و بهطور بالقوه دستهبندیهای متمایزی ایجاد کنند: مهندسان زیرساخت/بکاند/امنیت، مهندسان پژوهش، و توسعهدهندگان اپلیکیشن/فرانتاند @sayashk
اخلاق و جامعه
- دانشگاههای چینی بهجای محدود کردن استفاده از هوش مصنوعی، دانشجویان را به استفادهی بیشتر از آن تشویق میکنند که رویکردی متفاوت در پذیرش هوش مصنوعی در آموزش را نشان میدهد @techreview
- یونیسف در حال بررسی این موضوع است که چگونه پیشرفت نوروتکنولوژی میتواند بر حقوق کودکان تأثیر بگذارد، با محققان MIT بهعنوان مشاور این پروژه @medialab
کاربردها
- مایکروسافت حالت Copilot را در مرورگر Edge راهاندازی کرد که دارای قابلیتهای تحلیل کانتکست چند تب، ناوبری صوتی، و انتقال هوشمند وظایف است @mustafasuleyman
- Claude اکنون میتواند صفحات Notion و تیکتهای Linear را مستقیماً از طریق MCP بخواند و بهروزرسانی کند، که امکان مدیریت پروژه و بهروزرسانی اسناد را از طریق مکالمات فراهم میآورد @AnthropicAI
- گوگل کروم خلاصههای فروشگاهی مبتنی بر هوش مصنوعی را برای کمک به خریداران آمریکایی در تصمیمگیری برای خرید اضافه کرد @TechCrunch
- سیستم FSD Supervised تسلا درک خود را از تعاملات با گیشههای عوارضی نشان میدهد، و بهطور خودکار پس از اتمام تراکنش با استفاده از دوربینهای ستونی و تکرارکنندهی جانبی پیش میرود @Tesla_AI
- Salient مبلغ ۶۰ میلیون دلار در دور سری A برای عاملهای هوش مصنوعی که به سرویسدهی وامهای مصرفکننده میپردازند، جذب کرد؛ با پردازش بیش از ۱ میلیارد دلار تراکنش و کاهش ۶۰ درصدی زمان رسیدگی @a16z
- Hugging Face ابزار خط فرمان Jobs CLI را که توسط uv کار میکند، راهاندازی کرد که امکان پردازش OCR اسناد مبتنی بر VLM را با یک دستور فراهم میکند @vanstriendaniel
پژوهشها
- مدلهای زبان میتوانند نقاشیهای ASCII پیچیدهای خلق کنند، بدون اینکه بهطور خاص برای ایجاد هنر بصری آموزش دیده باشند، که نشاندهندهی یک قابلیت نوظهور است @AITechnoPagan
- بهینهسازی مستقیم ترجیح (DPO) با آموزش یک مدل پاداش ضمنی و بازیابی سیاست بهینهی RLHF بهصورت فرم بسته کار میکند، که آن را پایدارتر و از نظر منابع کارآمدتر از RLHF مبتنی بر PPO میسازد @cwolferesearch
- انتخاب نمونهی چند شات DSPy عملکرد طبقهبندی Qwen را از ۵۰٪ به ۸۸٪ بهبود بخشید، که اهمیت انتخاب صحیح نمونهها را نشان میدهد @MaximeRivest
- مدلهای جدید GLM-4.5 عملکرد بنچمارک چشمگیری را نشان میدهند، با امتیاز AIME24 برابر با ۹۱.۰ در مقابل ۷۵.۷ برای Claude 4 Opus، و امتیاز MATH 500 برابر با ۹۸.۲ در مقابل ۹۶.۷ برای GPT-4.1 @reach_vb
- پژوهشها در مورد همراهان هوش مصنوعی بیدرنگ چالشهایی را در دستیابی به فرکانس ۱۰ هرتزی مکالمات انسانی در مقابل زمان واکنش ۱-۲ هرتزی فعلی LLMها شناسایی میکنند، که نیازمند پیشرفت در پردازش چندوجهی و درک کانتکست طولانی است @ericjang11