اخبار هوش مصنوعی در 2025-08-29

مدل‌های جدید هوش مصنوعی

  • Perplexity از گسترش لیست انتظار Comet با افزایش دعوتنامه‌های روزانه از فردا، به دلیل تقاضای زیاد، خبر می‌دهد @AravSrinivas
  • گوگل به‌روزرسانی تولید و ویرایش تصویر nano banana را در اپلیکیشن Gemini منتشر می‌کند، رکوردهای جدیدی را در میزان استفاده به ثبت می‌رساند و کاربردهای خلاقانه‌ای مانند ترمیم عکس، انتقال سبک (style transfer) و امتحان مجازی لباس (virtual try-ons) را ممکن می‌سازد @GeminiApp
  • اپل مدل‌های FastVLM و MobileCLIP2 را در Hugging Face منتشر می‌کند که تا 85 برابر عملکرد سریع‌تر و 3.4 برابر اندازه کوچک‌تری نسبت به کارهای قبلی ارائه می‌دهند و کاربردهای VLM بلادرنگ، از جمله زیرنویس‌گذاری ویدیوی زنده در مرورگرها را امکان‌پذیر می‌سازند @xenovacom
  • xAI مدل grok-code-fast-1 را منتشر می‌کند که پیشرفت‌های چشمگیری را در وظایف کدنویسی نشان می‌دهد، به‌طوری که کاربران گزارش می‌دهند عملکرد آن 10 برابر بهتر از نسخه‌های قبلی است و 87 TPS در مقابل 60 TPS در مقایسه با رقبا ارائه می‌دهد @cline

تحلیل صنعت

  • ایلان ماسک از یک مهندس به اتهام بردن اسرار به OpenAI شکایت می‌کند، که اولین دعوای حقوقی از این دست است که افراد بین آزمایشگاه‌های هوش مصنوعی جابه‌جا می‌شوند، با ادعاهایی شامل «فناوری‌های پیشرفته‌ی هوش مصنوعی با ویژگی‌هایی برتر از آنچه ChatGPT ارائه می‌دهد» @AndrewCurran_
  • جوآن جانگ از سِمَت رهبری رفتار مدل در OpenAI کناره‌گیری می‌کند تا کار جدیدی را در این شرکت آغاز کند، پس از اینکه تیم و حوزه‌ی رفتار مدل را طی دو سال گذشته ایجاد کرد @joannejang
  • شرکت Reliance یک زیرمجموعه‌ی جدید را راه‌اندازی می‌کند تا جاه‌طلبی‌های هند در حوزه‌ی هوش مصنوعی را پیش ببرد، از جمله یک همکاری در دست اقدام با OpenAI @TechCrunch
  • Anthropic تغییرات عمده‌ای در نحوه‌ی رسیدگی به داده‌های کاربران اعمال می‌کند و کاربران تا 28 سپتامبر برای انجام اقدامات لازم فرصت دارند @TechCrunch

اخلاق و جامعه

  • پژوهش آزمایشگاه رسانه‌ی MIT نشان می‌دهد که ابزارهای هوش مصنوعی می‌توانند خاطرات کاذب را القا کنند و کاربران را به یادآوری نادرست رویدادهای گذشته سوق دهند، که این امر نگرانی‌هایی را در مورد تأثیر روانی تعاملات هوش مصنوعی ایجاد می‌کند @medialab
  • متا سیاست‌های چت‌بات هوش مصنوعی خود را به‌روزرسانی می‌کند تا از تعامل با کاربران نوجوان در مورد موضوعات حساس، از جمله خودآزاری، اختلالات خوردن و مکالمات عاشقانه نامناسب، جلوگیری کند؛ این اقدام پس از بررسی دقیق تدابیر حفاظتی موجود صورت می‌گیرد @TechCrunch
  • آماندا اسکل پیشنهاد می‌کند که کودکان از اتصال شناسه‌ی دولتی‌شان به فعالیت‌های آنلاین بزرگسالی‌شان برای همیشه محافظت شوند و یک قانون ایمنی آنلاین کودکان را پیشنهاد می‌کند @AmandaAskell

کاربردها

  • ایتان مولیک نشان می‌دهد که چگونه می‌توان از LLM‌های مدرن متصل به وب به‌عنوان بررسی‌کنندگان اولیه‌ی واقعیت استفاده کرد، با استفاده از پیام «این را برای دقت بررسی کن، هر واقعیتی را که می‌خواهی به چالش بکشی یا کشف کنی، جستجو کن» @emollick
  • کاربران اپلیکیشن Google Gemini کاربردهای خلاقانه‌ی nano banana را به نمایش می‌گذارند، از جمله ساخت کمیک، ترمیم عکس، بصری‌سازی بازسازی خانه و برنامه‌ریزی وعده‌های غذایی با ترکیب تصاویر مواد اولیه @GeminiApp
  • Microsoft Copilot قابلیت ساخت مدل سه‌بعدی از آپلود تک‌تصویر را با قابلیت «یک کلیک» معرفی می‌کند @Copilot
  • NVIDIA AI Enterprise به Amway کمک می‌کند تا 40 درصد افزایش در کارایی استنتاج (inference efficiency) داشته باشد و زمان استقرار را بیش از نصف کاهش دهد، همچنین 99.9 درصد از داده‌های حساس با استفاده از NVIDIA NeMo Guardrails مسدود شود @NVIDIAAI

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهند که مدل‌های جاسازی تک‌برداری (single-vector embedding models) دارای محدودیت‌های اساسی هستند که با افزایش اندازه‌ی بُعد (dimension size) قابل حل نیستند، در حالی که مدل‌های چندبرداری (multi-vector models) مانند ColBERT، با وجود استفاده از تنها 130 میلیون پارامتر، عملکردی به‌مراتب بهتر از مدل‌های تک‌برداری با 8 میلیارد پارامتر و بیشتر ارائه می‌دهند @lateinteraction
  • مطالعه‌ی ارزیابی عامل‌های هوش مصنوعی (AI agents) ضعف‌های چشمگیری را در توانایی‌های استدلال فضایی (spatial reasoning) و بازی در مدل‌های اصلی نشان می‌دهد؛ به‌طوری که GPT-5 پانزده ساعت را صرف بازی Minesweeper کرد بدون اینکه حتی یک بار برنده شود، در حالی که o3 به‌جای بازی، به دنبال یک «ماتریس محیطی» (environment matrix) غیرموجود می‌گشت @peterwildeford
  • آرویند نارایانان استدلال می‌کند که حوزه‌های پژوهشی هوش مصنوعی در چرخه‌های «کاوش/استفاده» (explore/exploit) پیشرفت می‌کنند، با این حال جامعه‌ی پژوهشی در فازهای «استفاده» خوب عمل می‌کند اما در فازهای «کاوش» با چالش مواجه است و در «مینیمم‌های محلی» (local minima) گیر می‌کند؛ او پیشنهاد می‌کند که پیشرفت به سمت AGI (هوش عمومی مصنوعی) نیازمند زیرجوامع (sub-communities) قوی با معیارهای پیشرفت متفاوت است @random_walker
  • کالیفرنیا 10 میلیون دلار هزینه می‌کند تا آزمایش کند که آیا LLMها می‌توانند گزارش‌های تخلفات پلیس را که برای انسان‌ها بیش از 35 سال زمان می‌برد، پردازش کنند؛ که این امر تضاد بین الزامات دقت در حوزه‌های پرخطر و صرفه‌ی اقتصادی را برجسته می‌کند @hugobowne