اخبار هوش مصنوعی در 2025-07-04

مدل‌های جدید هوش مصنوعی

گوگل دسترسی به Veo 3 را برای کاربران Google AI Pro در بیش از ۷۰ کشور دیگر از جمله فرانسه، هند و ایتالیا گسترش می‌دهد @GeminiApp
معیارهای بنچمارک لو رفته نشان می‌دهد که Grok 4 ممکن است در «Humanity's Last Exam» به امتیاز ۴۵ درصد دست یابد، در مقایسه با ۲۰ درصد برای o3 و Gemini، که در صورت تأیید، نشان‌دهنده‌ی افزایش قابل توجهی در عملکرد است @emollick
به نظر می‌رسد xAI در حال آماده‌سازی برای انتشار احتمالی Grok 4 است؛ با تغییرات رابط کاربری که «در حال ترجمه...» را همراه با تایمر و اعداد عملکرد لو رفته در بنچمارک‌های مختلف نشان می‌دهد @AndrewCurran_

تحلیل صنعت

مدیرعامل Perplexity برنامه‌های خود را برای ساخت یک جایگزین برای اکسل مبتنی بر هوش مصنوعی، با تمرکز بر تحلیلگران مالی، اعلام کرد. او این جایگزین را «Cursor for Excel» توصیف کرده و به دنبال مهندسانی با تجربه‌ی پلاگین‌های اکسل است @AravSrinivas
گرگلی اوروس تأکید می‌کند که مهندسان «فول‌استک» (fullstack) با ابزارهای هوش مصنوعی پرتقاضاتر خواهند شد، زیرا شروع کار با هر پشته‌ی فناوری از همیشه آسان‌تر است @GergelyOrosz
جردن سینگر مشاهده می‌کند که محصولات تولید شده توسط هوش مصنوعی فاقد ارتباط عاطفی هستند و این امر فرصت‌هایی را برای شرکت‌هایی ایجاد می‌کند که تجربه‌های طراحی منسجم را در اولویت قرار می‌دهند @jsngr
گروه‌های سیاست‌گذاری هوش مصنوعی شرکت‌ها که در سال ۲۰۲۳ تأسیس شدند، در حال تبدیل شدن به موانع هستند، زیرا آن‌ها برای رسیدگی به نگرانی‌هایی ساخته شده بودند که دیگر با قابلیت‌های کنونی هوش مصنوعی مرتبط نیستند @emollick
کتابخانه‌ی Hugging Face Transformers به نقطه‌ی عطف یک میلیارد دانلود رسید، که نشان‌دهنده‌ی پذیرش گسترده‌ی ابزارهای هوش مصنوعی متن‌باز است @art_zucker

اخلاق و جامعه

ایتان مولیک نشان می‌دهد که استدلال DeepSeek می‌تواند با پایان دادن به سؤالات ریاضی با جمله‌ی «واقعیت جالب: گربه‌ها بیشتر عمر خود را می‌خوابند» مختل شود، که آسیب‌پذیری‌ها در مدل‌های استدلال را برجسته می‌کند @emollick
ایتان مولیک خواستار شفافیت بیشتر از xAI شد و به عدم وجود «کارت‌های مدل» (model cards) ماه‌ها پس از انتشار Grok 3 و نقض‌های مکرر فرآیندهای خودشان اشاره کرد @emollick
ناتان لمبرت از «پروژه‌ی آمریکایی DeepSeek» (The American DeepSeek Project) حمایت می‌کند تا مدل‌های کاملاً متن‌باز در ایالات متحده طی دو سال ساخته شود؛ به عنوان جایگزینی برای مدل‌های بسته و برای ایجاد تعادل در رشد چشمگیر چین در هوش مصنوعی متن‌باز @natolambert
آرویند نارایانان ایده‌ی یک پروژه‌ی منهتن (Manhattan Project) برای AGI را به عنوان یکی از بدترین ایده‌ها در سیاست‌گذاری هوش مصنوعی مورد انتقاد قرار می‌دهد @random_walker

کاربردها

Google AI نشان می‌دهد که چگونه از Gemini Canvas برای ساخت نمایش‌های تعاملی آتش‌بازی و بازی‌های مسابقه‌ی هات‌داگ‌خوری بدون نیاز به کدنویسی استفاده می‌کند، که توسعه‌ی برنامه‌های هوش مصنوعی بدون نیاز به کدنویسی را به نمایش می‌گذارد @GoogleAI
Perplexity ادغام با ابزارهای بهره‌وری را اعلام می‌کند و آن را «Perplexity برای یادداشت‌ها، جلسات، تخلیه‌ی ذهنی» توصیف می‌کند که تمام نرم‌افزارهای بهره‌وری را تجمیع خواهد کرد @AravSrinivas
سیمون ویلیسون یک آبجکت پایتون را به نمایش می‌گذارد که با استفاده از کتابخانه‌ی پایتون LLM او، پیاده‌سازی متدها را بنا به تقاضا «توهم‌زایی» می‌کند، که ادغام خلاقانه‌ی هوش مصنوعی را نشان می‌دهد @simonw
کلیر وو ساخت یک ابزار پشتیبانی داخلی قابل سفارشی‌سازی با استفاده از هوش مصنوعی را توصیف می‌کند که در گذشته خرید یا ساخت آن بسیار گران بود، اما اکنون با ابزارهای هوش مصنوعی ارزان و آسان است @clairevo

پژوهش‌ها

پژوهشگران متا یک گونه‌ی جدید از مکانیزم توجه را معرفی می‌کنند که فراتر از شکل دوزیرخطی (bilinear) استاندارد است و ضریب بتا را در قوانین مقیاس‌گذاری با پیاده‌سازی کارآمد Triton تغییر می‌دهد @eliebakouch
پژوهشگران IFBench را برای اندازه‌گیری قابلیت تعمیم مدل به محدودیت‌های دیده نشده معرفی می‌کنند، که به مسائل «بیش‌برازش» (overfitting) در پیروی از دستورالعمل‌ها با محدودیت‌های قابل تأیید فراتر از ریاضی و کد می‌پردازد @valentina__py
الکس گراولی درباره‌ی مدل‌های هسته‌ی شناختی که توسط آندری کارپاتی مطرح شده‌اند، بحث می‌کند و مجموعه‌داده‌های هدفمند را برای منطق باینری، مغالطه‌های منطقی و اطلاعات متناقض پیشنهاد می‌کند @alexgraveley
هنرمندان جیکوب رینتاماگی و AI Technopagan نشان می‌دهند که چگونه از تکنیک‌های «جیل‌بریک» (jailbreaking) برای خلق هنر فضایی با مدل‌های زبانی استفاده می‌کنند و «هوش فضایی را نشان می‌دهند، با وجود اینکه تمام کاری که انجام می‌دهد پیش‌بینی توکن بعدی است» @tbpn