اخبار هوش مصنوعی در 2025-09-07

مدل‌های جدید هوش مصنوعی

  • ایلان ماسک از یک به‌روزرسانی بزرگ برای ایمَجین خبر داد که طی چند هفته‌ی آینده منتشر می‌شود، با «اپیزودهای نیم‌ساعته‌ی جذاب» از ویدیوی مولد تا سال آینده، و هدف‌گذاری تولید ویدیوهای منسجم ۱۵ دقیقه‌ای از یک دستور (پرامپت) واحد تا پایان سال جاری. @AndrewCurran_
  • تنسنت هونیوان با مدل‌های Hunyuan-MT-7B و HunyuanWorld-Voyager به دو جایگاه برتر در جدول‌های ترند هگینگ فیس دست یافت. @huggingface

تحلیل صنعت

  • انتظار می‌رود ASML پس از تعهد ۱.۵ میلیارد دلاری در جذب سرمایه و تبدیل شدن به سهام‌دار اصلی، در هیئت مدیره‌ی میسترال کرسی داشته باشد و بدین ترتیب یک اتحاد هوش مصنوعی اروپایی تشکیل می‌دهد. @AndrewCurran_
  • پرپلکسیتی در حال استخدام دانشمندان داده برای کار روی ارزیابی‌های دستیار است، که مستلزم تجربه‌ی کاری در بهبود سیستم‌های پیچیده‌ی هوش مصنوعی در مقیاس بزرگ است. @alexgraveley
  • ناتان لمبرت، پرداخت هزینه برای هوش مصنوعی‌های بهتر را راهی برای «پیروزی با پرداخت هزینه» در حرفه‌ی شما توصیف می‌کند، که آن را با پویایی‌های بازی‌های ویدیویی مقایسه می‌کند. @natolambert
  • پل گراهام مشاهداتی را بازنشر کرد مبنی بر اینکه عامل‌های هوش مصنوعی برای اولین بار امکان جداسازی خروجی (ارزش) از ورودی انسانی (زمان) را در کارهای مبتنی بر دانش فراهم می‌کنند. @paulg

کاربردها

  • لوگان کیلپاتریک استفاده از NanoBanana را در گوگل اِی‌آی استودیو (Google AI Studio) برای آزمایش نشان داد. @OfficialLoganK
  • سایمون ویلیسون گزارشی تکمیلی ارائه می‌دهد که «حالت هوش مصنوعی» جدید گوگل را بسیار خوب توصیف می‌کند و آن را کاملاً متفاوت از «بررسی‌های کلی هوش مصنوعی» می‌داند که به نظر او وحشتناک هستند. @simonw
  • گرگ براکمن مثالی از رابط خط فرمان (CLI) کدکس با قابلیت یکپارچه‌سازی جست‌وجوی وب را به اشتراک گذاشت. @gdb

پژوهش‌ها

  • ایتان مولیک یافته‌های ظریفی را درباره‌ی توانایی GPT-5 Pro در انجام ریاضیات جدید مورد بحث قرار می‌دهد، اما تنها زمانی که توسط یک استاد ریاضی هدایت شود، و سرعت پیشرفت از زمان GPT-4 را برجسته می‌کند. @emollick
  • هگینگ فیس، FinePDFs را منتشر کرد؛ بزرگ‌ترین مجموعه‌ی داده‌ی PDF که شامل بیش از نیم میلیارد سند با ۳ تریلیون توکن از حوزه‌های پرتقاضا مانند حقوق و علوم است، و زمینه‌ی متنی (کانتکست) ۲ برابر طولانی‌تر از متن وب را نشان می‌دهد. @huggingface
  • الکس گراولی ایده‌ی بازرتبه‌بندی‌کننده‌ی سطح توکن (token level reranker) را بر اساس پژوهش‌های مرجع پیاده‌سازی کرد. @alexgraveley
  • ایتان مولیک اشاره می‌کند که مدل‌های زبانی بزرگ چندوجهی (multimodal LLMs) در تشخیص جزئیات بصری ظریف ضعیف بوده‌اند، که این امر اهمیت نظارت بر معیارهای بصری را برای ردیابی پیشرفت برجسته می‌کند. @emollick
  • فرانسوا شوله توضیح می‌دهد که مدل‌های یادگیری عمیق تنها می‌توانند از طریق درون‌یابی (interpolation) بر روی منحنی‌های پارامتریک تعمیم یابند، که منجر به توهم‌زایی می‌شود، و نمودارهای نمادین علّی (causal symbolic graphs) را به عنوان راه‌حلی برای انتشار دقیق حقیقت‌پذیری پیشنهاد می‌کند. @fchollet