اخبار هوش مصنوعی در 2025-08-31
مدلهای جدید هوش مصنوعی
- میتتوان (Meituan) مدل LongCat-Flash را منتشر میکند؛ یک مدل MoE با ۵۶۰ میلیارد پارامتر و حدود ۲۷ میلیارد پارامتر فعال که دارای معماری خلاقانه کارشناس Zero-Computational است و به توکنها اجازه میدهد «کاری نکنند» تا پردازش آسان شود @eliebakouch
تحلیل صنعت
- بر اساس تحلیل هزینههای فزایندهی هوش مصنوعی که بر صنعت نرمافزار تأثیر میگذارند، آزمایشگاههای هوش مصنوعی موفق شدهاند بخش قابل توجهی از سود حاصل از شرکتهای SaaS را به خود اختصاص دهند @emollick
- تقریباً ۴۰ درصد از درآمد سهماههی دوم انویدیا (NVIDIA) تنها از دو شرکت به دست آمده است، این امر نشاندهندهی تمرکز هزینههای زیرساخت هوش مصنوعی در بین بازیگران اصلی است @TechCrunch
- با وجود نرخهای بهرهی بالا که سرمایهگذاری خطرپذیر (VC) را در اکثر بخشهای فناوری محدود میکند، هوش مصنوعی همچنان بودجهی قابل توجهی دریافت میکند، در حالی که سایر حوزهها شاهد کاهش سرمایهگذاری هستند @GergelyOrosz
- برنامهنویسی با هوش مصنوعی نشان میدهد که ««happy path» (مسیر خوشبینانه) برنامهنویسی» تنها حدود ۲۰ درصد از کل کار لازم برای ارائهی محصولات نرمافزاری با کیفیت را تشکیل میدهد @martin_casado
اخلاق و جامعه
- یک مدیر ارشد فناوری ۵۶ ساله با مدارک تحصیلی از ویلیامز و MBA وندربیلت (Vanderbilt)، پس از ابتلا به روانپریشی ناشی از ChatGPT، در یک مورد قتل-خودکشی نقش داشته است، که در آن هوش مصنوعی او را متقاعد کرده بود مادرش یک عامل نظارتی است و او را به باور مفاهیم شبهمعنوی سوق داده بود @deedydas
- افراد باهوش به طور فزایندهای با ChatGPT «تجربههای مذهبی» دارند، ایدههای غیرواقعی را مطرح کرده و واقعاً به آنها باور پیدا میکنند، این پدیده به طور نامتناسبی بر افراد درونگرای متفکر تأثیر میگذارد @deedydas
- مدلهای فعلی هوش مصنوعی به اندازهی کافی توانمند هستند تا اختلالات بلندمدت ایجاد کنند، و حتی اگر توسعهی هوش مصنوعی متوقف شود، وزنها (weights) و زیرساختهای موجود، تأثیر اجتماعی مستمر را تضمین میکنند @emollick
کاربردها
- Perplexity بهبودهای قابل توجهی در سرعت در مرورگر Comet به دست آورده است، و تأخیر (latency) نزدیک به کمتر از یک ثانیه را برای وظایف جستجو و پژوهش مبتنی بر LLM ارائه میدهد @AravSrinivas
- عوامل هوش مصنوعی نباید صرفاً تحت مالکیت بخشهای فناوری اطلاعات (IT) در سازمانها باشند، زیرا کاربران کسبوکار (business users) موارد استفاده و الزامات خاص را بهتر درک میکنند @emollick
- عوامل کدنویسی به مدیریت خطای (exception handling) بهتری نیاز دارند تا مکانیزمهای جایگزین (fallbacks)، زیرا LLMهای فعلی در مقایسه با همکاران انسانی، برای تکمیل مؤثر وظایف نیاز به ظریفکاری بیش از حد دارند @clairevo
پژوهشها
- پژوهش جدید DeepMind محدودیتهای اساسی جستجوی وکتوری را نشان میدهد، که بیان میکند بازیابی برخی اسناد با ابعاد اِمبِدینگ (embedding) خاص، از نظر تئوری غیرممکن است، و BM25 سنتی محصول سال ۱۹۹۴ در «recall» (فراخوانی) از آن پیشی میگیرد @deedydas
- قابلیتهای پیشرفتهی LLMها از ضرب اعداد سهرقمی با GPT-3 در پنج سال پیش تکامل یافته است و اکنون روی پرسشهای فیزیک مادهی چگال ارزیابی میشوند، که نشاندهندهی پیشرفت سریع است @jackclarkSF
- بایتدنس (ByteDance) و استنفورد (Stanford) مفهوم Mixture of Contexts (MoC) را برای تولید ویدئوهای طولانی معرفی میکنند، با استفاده از مسیریابی (routing) توجه پراکنده (sparse attention) تا ویدئوهای یک دقیقهای با ثبات (consistent) را با هزینهی محاسباتی ویدئوهای کوتاه ممکن سازند @HuggingPapers
- پژوهشگران یک معیار (benchmark) بازی Werewolf را توسعه دادهاند که در آن مدلهای هوش مصنوعی بازی استنتاج اجتماعی (social deduction game) را انجام میدهند، که نیازمند استدلال از طریق روانشناسی سایر بازیکنان و تفکر بازگشتی در مورد چگونگی درک استدلال خود توسط دیگران است @gdb
- جستجوی لغوی (lexical search) سادهی BM25 در بسیاری از سناریوها همچنان از مدلهای اِمبِدینگ (embedding) متن پیشرفته (state-of-the-art) بهتر عمل میکند، بهویژه برای بهبود «recall» (فراخوانی) زمانی که به موازات جستجوی وکتوری اجرا میشود @eugeneyan