اخبار هوش مصنوعی در 2025-08-31

مدل‌های جدید هوش مصنوعی

  • میت‌توان (Meituan) مدل LongCat-Flash را منتشر می‌کند؛ یک مدل MoE با ۵۶۰ میلیارد پارامتر و حدود ۲۷ میلیارد پارامتر فعال که دارای معماری خلاقانه کارشناس Zero-Computational است و به توکن‌ها اجازه می‌دهد «کاری نکنند» تا پردازش آسان شود @eliebakouch

تحلیل صنعت

  • بر اساس تحلیل هزینه‌های فزاینده‌ی هوش مصنوعی که بر صنعت نرم‌افزار تأثیر می‌گذارند، آزمایشگاه‌های هوش مصنوعی موفق شده‌اند بخش قابل توجهی از سود حاصل از شرکت‌های SaaS را به خود اختصاص دهند @emollick
  • تقریباً ۴۰ درصد از درآمد سه‌ماهه‌ی دوم انویدیا (NVIDIA) تنها از دو شرکت به دست آمده است، این امر نشان‌دهنده‌ی تمرکز هزینه‌های زیرساخت هوش مصنوعی در بین بازیگران اصلی است @TechCrunch
  • با وجود نرخ‌های بهره‌ی بالا که سرمایه‌گذاری خطرپذیر (VC) را در اکثر بخش‌های فناوری محدود می‌کند، هوش مصنوعی همچنان بودجه‌ی قابل توجهی دریافت می‌کند، در حالی که سایر حوزه‌ها شاهد کاهش سرمایه‌گذاری هستند @GergelyOrosz
  • برنامه‌نویسی با هوش مصنوعی نشان می‌دهد که ««happy path» (مسیر خوش‌بینانه) برنامه‌نویسی» تنها حدود ۲۰ درصد از کل کار لازم برای ارائه‌ی محصولات نرم‌افزاری با کیفیت را تشکیل می‌دهد @martin_casado

اخلاق و جامعه

  • یک مدیر ارشد فناوری ۵۶ ساله با مدارک تحصیلی از ویلیامز و MBA وندربیلت (Vanderbilt)، پس از ابتلا به روان‌پریشی ناشی از ChatGPT، در یک مورد قتل-خودکشی نقش داشته است، که در آن هوش مصنوعی او را متقاعد کرده بود مادرش یک عامل نظارتی است و او را به باور مفاهیم شبه‌معنوی سوق داده بود @deedydas
  • افراد باهوش به طور فزاینده‌ای با ChatGPT «تجربه‌های مذهبی» دارند، ایده‌های غیرواقعی را مطرح کرده و واقعاً به آن‌ها باور پیدا می‌کنند، این پدیده به طور نامتناسبی بر افراد درون‌گرای متفکر تأثیر می‌گذارد @deedydas
  • مدل‌های فعلی هوش مصنوعی به اندازه‌ی کافی توانمند هستند تا اختلالات بلندمدت ایجاد کنند، و حتی اگر توسعه‌ی هوش مصنوعی متوقف شود، وزن‌ها (weights) و زیرساخت‌های موجود، تأثیر اجتماعی مستمر را تضمین می‌کنند @emollick

کاربردها

  • Perplexity بهبودهای قابل توجهی در سرعت در مرورگر Comet به دست آورده است، و تأخیر (latency) نزدیک به کمتر از یک ثانیه را برای وظایف جستجو و پژوهش مبتنی بر LLM ارائه می‌دهد @AravSrinivas
  • عوامل هوش مصنوعی نباید صرفاً تحت مالکیت بخش‌های فناوری اطلاعات (IT) در سازمان‌ها باشند، زیرا کاربران کسب‌وکار (business users) موارد استفاده و الزامات خاص را بهتر درک می‌کنند @emollick
  • عوامل کدنویسی به مدیریت خطای (exception handling) بهتری نیاز دارند تا مکانیزم‌های جایگزین (fallbacks)، زیرا LLM‌های فعلی در مقایسه با همکاران انسانی، برای تکمیل مؤثر وظایف نیاز به ظریف‌کاری بیش از حد دارند @clairevo

پژوهش‌ها

  • پژوهش جدید DeepMind محدودیت‌های اساسی جستجوی وکتوری را نشان می‌دهد، که بیان می‌کند بازیابی برخی اسناد با ابعاد اِمبِدینگ (embedding) خاص، از نظر تئوری غیرممکن است، و BM25 سنتی محصول سال ۱۹۹۴ در «recall» (فراخوانی) از آن پیشی می‌گیرد @deedydas
  • قابلیت‌های پیشرفته‌ی LLM‌ها از ضرب اعداد سه‌رقمی با GPT-3 در پنج سال پیش تکامل یافته است و اکنون روی پرسش‌های فیزیک ماده‌ی چگال ارزیابی می‌شوند، که نشان‌دهنده‌ی پیشرفت سریع است @jackclarkSF
  • بایت‌دنس (ByteDance) و استنفورد (Stanford) مفهوم Mixture of Contexts (MoC) را برای تولید ویدئوهای طولانی معرفی می‌کنند، با استفاده از مسیریابی (routing) توجه پراکنده (sparse attention) تا ویدئوهای یک دقیقه‌ای با ثبات (consistent) را با هزینه‌ی محاسباتی ویدئوهای کوتاه ممکن سازند @HuggingPapers
  • پژوهشگران یک معیار (benchmark) بازی Werewolf را توسعه داده‌اند که در آن مدل‌های هوش مصنوعی بازی استنتاج اجتماعی (social deduction game) را انجام می‌دهند، که نیازمند استدلال از طریق روان‌شناسی سایر بازیکنان و تفکر بازگشتی در مورد چگونگی درک استدلال خود توسط دیگران است @gdb
  • جستجوی لغوی (lexical search) ساده‌ی BM25 در بسیاری از سناریوها همچنان از مدل‌های اِمبِدینگ (embedding) متن پیشرفته (state-of-the-art) بهتر عمل می‌کند، به‌ویژه برای بهبود «recall» (فراخوانی) زمانی که به موازات جستجوی وکتوری اجرا می‌شود @eugeneyan