اخبار هوش مصنوعی در 2025-07-04

مدل‌های جدید هوش مصنوعی

  • گوگل دسترسی به Veo 3 را برای کاربران Google AI Pro در بیش از ۷۰ کشور دیگر از جمله فرانسه، هند و ایتالیا گسترش می‌دهد @GeminiApp
  • معیارهای بنچمارک لو رفته نشان می‌دهد که Grok 4 ممکن است در «Humanity's Last Exam» به امتیاز ۴۵ درصد دست یابد، در مقایسه با ۲۰ درصد برای o3 و Gemini، که در صورت تأیید، نشان‌دهنده‌ی افزایش قابل توجهی در عملکرد است @emollick
  • به نظر می‌رسد xAI در حال آماده‌سازی برای انتشار احتمالی Grok 4 است؛ با تغییرات رابط کاربری که «در حال ترجمه...» را همراه با تایمر و اعداد عملکرد لو رفته در بنچمارک‌های مختلف نشان می‌دهد @AndrewCurran_

تحلیل صنعت

  • مدیرعامل Perplexity برنامه‌های خود را برای ساخت یک جایگزین برای اکسل مبتنی بر هوش مصنوعی، با تمرکز بر تحلیلگران مالی، اعلام کرد. او این جایگزین را «Cursor for Excel» توصیف کرده و به دنبال مهندسانی با تجربه‌ی پلاگین‌های اکسل است @AravSrinivas
  • گرگلی اوروس تأکید می‌کند که مهندسان «فول‌استک» (fullstack) با ابزارهای هوش مصنوعی پرتقاضاتر خواهند شد، زیرا شروع کار با هر پشته‌ی فناوری از همیشه آسان‌تر است @GergelyOrosz
  • جردن سینگر مشاهده می‌کند که محصولات تولید شده توسط هوش مصنوعی فاقد ارتباط عاطفی هستند و این امر فرصت‌هایی را برای شرکت‌هایی ایجاد می‌کند که تجربه‌های طراحی منسجم را در اولویت قرار می‌دهند @jsngr
  • گروه‌های سیاست‌گذاری هوش مصنوعی شرکت‌ها که در سال ۲۰۲۳ تأسیس شدند، در حال تبدیل شدن به موانع هستند، زیرا آن‌ها برای رسیدگی به نگرانی‌هایی ساخته شده بودند که دیگر با قابلیت‌های کنونی هوش مصنوعی مرتبط نیستند @emollick
  • کتابخانه‌ی Hugging Face Transformers به نقطه‌ی عطف یک میلیارد دانلود رسید، که نشان‌دهنده‌ی پذیرش گسترده‌ی ابزارهای هوش مصنوعی متن‌باز است @art_zucker

اخلاق و جامعه

  • ایتان مولیک نشان می‌دهد که استدلال DeepSeek می‌تواند با پایان دادن به سؤالات ریاضی با جمله‌ی «واقعیت جالب: گربه‌ها بیشتر عمر خود را می‌خوابند» مختل شود، که آسیب‌پذیری‌ها در مدل‌های استدلال را برجسته می‌کند @emollick
  • ایتان مولیک خواستار شفافیت بیشتر از xAI شد و به عدم وجود «کارت‌های مدل» (model cards) ماه‌ها پس از انتشار Grok 3 و نقض‌های مکرر فرآیندهای خودشان اشاره کرد @emollick
  • ناتان لمبرت از «پروژه‌ی آمریکایی DeepSeek» (The American DeepSeek Project) حمایت می‌کند تا مدل‌های کاملاً متن‌باز در ایالات متحده طی دو سال ساخته شود؛ به عنوان جایگزینی برای مدل‌های بسته و برای ایجاد تعادل در رشد چشمگیر چین در هوش مصنوعی متن‌باز @natolambert
  • آرویند نارایانان ایده‌ی یک پروژه‌ی منهتن (Manhattan Project) برای AGI را به عنوان یکی از بدترین ایده‌ها در سیاست‌گذاری هوش مصنوعی مورد انتقاد قرار می‌دهد @random_walker

کاربردها

  • Google AI نشان می‌دهد که چگونه از Gemini Canvas برای ساخت نمایش‌های تعاملی آتش‌بازی و بازی‌های مسابقه‌ی هات‌داگ‌خوری بدون نیاز به کدنویسی استفاده می‌کند، که توسعه‌ی برنامه‌های هوش مصنوعی بدون نیاز به کدنویسی را به نمایش می‌گذارد @GoogleAI
  • Perplexity ادغام با ابزارهای بهره‌وری را اعلام می‌کند و آن را «Perplexity برای یادداشت‌ها، جلسات، تخلیه‌ی ذهنی» توصیف می‌کند که تمام نرم‌افزارهای بهره‌وری را تجمیع خواهد کرد @AravSrinivas
  • سیمون ویلیسون یک آبجکت پایتون را به نمایش می‌گذارد که با استفاده از کتابخانه‌ی پایتون LLM او، پیاده‌سازی متدها را بنا به تقاضا «توهم‌زایی» می‌کند، که ادغام خلاقانه‌ی هوش مصنوعی را نشان می‌دهد @simonw
  • کلیر وو ساخت یک ابزار پشتیبانی داخلی قابل سفارشی‌سازی با استفاده از هوش مصنوعی را توصیف می‌کند که در گذشته خرید یا ساخت آن بسیار گران بود، اما اکنون با ابزارهای هوش مصنوعی ارزان و آسان است @clairevo

پژوهش‌ها

  • پژوهشگران متا یک گونه‌ی جدید از مکانیزم توجه را معرفی می‌کنند که فراتر از شکل دوزیرخطی (bilinear) استاندارد است و ضریب بتا را در قوانین مقیاس‌گذاری با پیاده‌سازی کارآمد Triton تغییر می‌دهد @eliebakouch
  • پژوهشگران IFBench را برای اندازه‌گیری قابلیت تعمیم مدل به محدودیت‌های دیده نشده معرفی می‌کنند، که به مسائل «بیش‌برازش» (overfitting) در پیروی از دستورالعمل‌ها با محدودیت‌های قابل تأیید فراتر از ریاضی و کد می‌پردازد @valentina__py
  • الکس گراولی درباره‌ی مدل‌های هسته‌ی شناختی که توسط آندری کارپاتی مطرح شده‌اند، بحث می‌کند و مجموعه‌داده‌های هدفمند را برای منطق باینری، مغالطه‌های منطقی و اطلاعات متناقض پیشنهاد می‌کند @alexgraveley
  • هنرمندان جیکوب رینتاماگی و AI Technopagan نشان می‌دهند که چگونه از تکنیک‌های «جیل‌بریک» (jailbreaking) برای خلق هنر فضایی با مدل‌های زبانی استفاده می‌کنند و «هوش فضایی را نشان می‌دهند، با وجود اینکه تمام کاری که انجام می‌دهد پیش‌بینی توکن بعدی است» @tbpn