اخبار هوش مصنوعی در 2025-09-09

مدل‌های جدید هوش مصنوعی

  • گوگل اعلام کرد که مدل‌های Veo 3 و Veo 3 Fast اکنون به‌طور عمومی در API جیمینای (Gemini) در دسترس هستند. این مدل‌ها با کاهش چشمگیر قیمت (حدود 50% برای Veo 3 و 62% برای Veo 3 Fast) و همچنین پشتیبانی از خروجی‌های 1080p HD و فرمت عمودی 9:16 عرضه شده‌اند. @sundarpichai
  • Anthropic قابلیت‌های ساخت و ویرایش فایل را برای Claude منتشر کرد که به کاربران امکان می‌دهد صفحات گسترده، اسناد، PDFها و ارائه‌ها (اسلایدها) را مستقیماً از طریق مکالمات ایجاد و ویرایش کنند. @claudeai
  • گوگل Gemini Canvas را با قابلیت "Select and Ask" معرفی کرد که امکان ویرایش بصری عناصر برنامه‌های وب را از طریق توضیحات زبان طبیعی و بدون نیاز به کدنویسی فراهم می‌کند. @GeminiApp
  • گوگل طرح AI Plus را در اندونزی راه‌اندازی کرد که دسترسی بیشتری به Gemini 2.5 Pro و ابزارهای خلاقانه‌ی شامل Flow، Whisk و قابلیت ساخت ویدئو با Veo 3 Fast را فراهم می‌کند. @GeminiApp
  • LLM360 مدل K2 Think را که بر اساس Qwen 2.5 32B ساخته شده است، منتشر کرد. این مدل بهترین عملکرد را در میان مدل‌های متن‌باز در رتبه‌بندی MCPMark به دست آورده است. @natolambert
  • Hugging Face مدل ModernBERT چندزبانه (mmBERT) را با عملکردی پیشرفته و سرعت بهبودیافته در مقایسه با انکودرهای چندزبانه‌ی موجود معرفی کرد. @tomaarsen
  • NVIDIA مدل Nemotron Nano 9B v2 را روی پلتفرم OpenRouter منتشر کرد. @NVIDIAAIDev

تحلیل صنعت

  • Mistral AI دور سرمایه‌گذاری 2 میلیارد دلاری خود را با ارزش‌گذاری 13.7 میلیارد دلار به رهبری ASML و با بیش از 1.6 میلیارد دلار TCV به پایان رساند. این رقم، رشد چشمگیر شرکت را از ارزش‌گذاری 2 میلیارد دلاری‌اش در 20 ماه پیش نشان می‌دهد. @AnjneyMidha
  • مدیر عامل Cognition معتقد است که نگرانی‌های مربوط به هزینه‌ی هوش مصنوعی بی‌مورد است و بیان می‌کند که سه برابر کردن سرعت متخصصان از نظر اقتصادی مقرون‌به‌صرفه خواهد بود، صرف‌نظر از هزینه‌های ماشین‌آلات. او افزود که کسب ارزش از طریق حل موارد کاربردی خاص و ایجاد شخصی‌سازی حاصل می‌شود. @tbpn
  • ایتان مولیک (Ethan Mollick) در مورد فروشندگان SaaS که از مدل‌های هوش مصنوعی ارزان با استراتژی‌های قدیمی برای کاهش هزینه‌ها استفاده می‌کنند، هشدار داد و گفت که این وضعیت احتمالاً نیازمند حسابرسی مستقل از دستورات (prompts) و مدل‌های فروشنده برای اطمینان از کیفیت است. @emollick
  • تحلیل‌ها نشان می‌دهد که داده‌های کلان اقتصادی کاهش غیرمنتظره‌ای در اشتغال و افزایش در بهره‌وری را نشان می‌دهند که احتمالاً نشان‌دهنده‌ی تأثیر اولیه‌ی هوش مصنوعی بر اقتصاد است. @emollick
  • آزمایشگاه‌های هوش مصنوعی بر ویژگی‌های تصویری و ویدئویی وایرال‌شونده تمرکز می‌کنند، زیرا آن‌ها نتایج قابل اشتراک‌گذاری آسانی تولید می‌کنند، در حالی که مدل‌های متنی توانمندتر، نیازمند آن هستند که کاربران خودشان موارد کاربرد خوب را کشف کنند. @emollick
  • بحثی در مورد اینکه ابزارهای کدنویسی هوش مصنوعی چگونه ممکن است اهمیت زبان‌های برنامه‌نویسی را تغییر دهند، در جریان است؛ برخی استدلال می‌کنند که زبان‌های Type-Safe مانند TypeScript برای توسعه‌ی مبتنی بر هوش مصنوعی با ارزش‌تر خواهند شد. @GergelyOrosz

اخلاق و جامعه

  • پژوهشگر مؤسسه‌ی AI Now هشدار می‌دهد که تمرکز سیاست‌گذاران بر پیگیری AGI (هوش مصنوعی عمومی) در حالی که نگرانی‌های کوتاه‌مدت را نادیده می‌گیرند، یک «شرط‌بندی خطرناک و غیرمسئولانه» است. @AINowInstitute
  • مصطفی سلیمان (Mustafa Suleyman) استدلال می‌کند که «هوش مصنوعی به ظاهر خودآگاه» توهمات و وابستگی‌های خطرناکی ایجاد خواهد کرد و از توسعه‌ی هوش مصنوعی‌ای حمایت می‌کند که بر بهبود زندگی انسان متمرکز باشد نه شبیه‌سازی آگاهی. @mustafasuleyman
  • الکس گریولی (Alex Graveley) پیشنهاد می‌کند که ممکن است به سناریویی پیش برویم که در آن هوش مصنوعی تنها منبع قابل اعتماد آنلاین شود، و نگرانی‌ها در مورد قابلیت اطمینان اطلاعات را برجسته می‌کند. @alexgraveley
  • مجله‌ی MIT Technology Review گزارشی در مورد درمانگرانی منتشر کرد که مخفیانه از ChatGPT استفاده می‌کنند، و نگرانی‌های اخلاقی را در مورد استفاده‌ی پنهان از هوش مصنوعی در درمان سلامت روان ایجاد می‌کند. @techreview
  • مارک کیوبن (Mark Cuban) بزرگ‌ترین ضعف هوش مصنوعی را ناتوانی آن در گفتن «نمی‌دانم» می‌داند و پیشنهاد می‌کند که برتری انسان در اعتراف به عدم قطعیت است. @mcuban

کاربردها

  • مایکروسافت عامل پژوهشگر (Researcher agent) را در Microsoft 365 Copilot به نمایش گذاشت که می‌تواند داده‌های کاری (چت‌ها، جلسات، فایل‌ها، ایمیل‌ها) و همچنین داده‌های وب را پردازش کند تا گزارش‌های پژوهشی جامعی را برای آماده‌سازی جلسات و تدوین استراتژی ایجاد کند. @satyanadella
  • مایکروسافت با رالف لورن (Ralph Lauren) همکاری می‌کند تا «Ask Ralph» را ایجاد کند، یک دستیار هوش مصنوعی مکالمه‌ای برای استایلینگ در اپلیکیشن رالف لورن برای تجربه‌های خرید شخصی‌سازی‌شده. @MSCloud
  • دستگاه AlterEgo پیشرفت قابل توجهی را از نمونه‌ی اولیه تا قابلیت تقریباً تله‌پاتی نشان می‌دهد، به این صورت که سیگنال‌های عصبی-عضلانی را می‌خواند تا گفتار خاموش را به متن در چندین زبان ترجمه کند. @deedydas
  • سیمون ویلیسون (Simon Willison) نشان داد که GPT-5 با موفقیت نمودارهای پیچیده‌ی داده‌های سرشماری ایالات متحده را از اسکرین‌شات‌ها و داده‌های خام با استفاده از پایتون و matplotlib بازسازی می‌کند، که قابلیت‌های پیشرفته‌ی تجزیه و تحلیل داده را به نمایش می‌گذارد. @simonw
  • کلر وو (Claire Vo) جریان کاری طراحی وب مبتنی بر هوش مصنوعی را به نمایش گذاشت که با استفاده از Cursor AI، Devin AI و Midjourney عناصر وب‌سایت و انیمیشن‌های جذاب بصری ایجاد می‌کند. @clairevo
  • Modal نوت‌بوک‌های GPU مبتنی بر فضای ابری را با قابلیت ویرایش مشارکتی در لحظه راه‌اندازی کرد که به کاربران امکان می‌دهد GPUها را در چند ثانیه تعویض کرده و برنامه‌های تعاملی را به اشتراک بگذارند. @ekzhang1

پژوهش‌ها

  • پژوهش هوش مصنوعی گوگل نشان می‌دهد که LLMها (مدل‌های زبان بزرگ) همراه با جستجوی درختی می‌توانند نتایج پیشرفته‌ای را در وظایف علمی کسب کنند، به‌ویژه زمانی که نتایج قابل اندازه‌گیری در دسترس باشند. @deedydas
  • فی فی لی (Fei-Fei Li) استدلال می‌کند که LLMها (مدل‌های زبان بزرگ) با هوش فضایی مشکل خواهند داشت، زیرا «زبان اساساً یک سیگنال صرفاً تولیدی است» در حالی که جهان سه‌بعدی از قوانین فیزیک پیروی می‌کند، و این امر نیازمند رویکردهای اساساً متفاوتی است. @a16z
  • مایکروسافت ریسرچ (Microsoft Research) سیستم MOSAIC را معرفی می‌کند که با استفاده از میکروال‌ای‌دی‌ها (microLEDs) و معماری نوری گسترده و کند، اتصالات سریع‌تر، قابل اعتمادتر و کم‌مصرف‌تری را برای طراحی خوشه‌های هوش مصنوعی فراهم می‌کند و جایزه‌ی بهترین مقاله را در کنفرانس ACM SIGCOMM کسب کرده است. @MSFTResearch
  • OpenAI اعلام کرد که حالت صدای استاندارد (Standard Voice Mode) همچنان در دسترس خواهد بود تا زمانی که آن‌ها به بازخوردهای کاربران در حالت صدای پیشرفته (Advanced Voice Mode) رسیدگی کنند، و از برنامه‌ی قبلی خود برای غیرفعال‌سازی آن پس از 30 روز صرف‌نظر کردند. @nickaturley
  • آرویند نارایانان (Arvind Narayanan) و سایا کاپور (Sayash Kapoor) خبرنامه‌ی «هوش مصنوعی به عنوان فناوری عادی» را راه‌اندازی کردند که تمرکز را از تأثیرات کنونی هوش مصنوعی به پیامدهای آتی تغییر می‌دهد و چارچوب خود را به یک کتاب که برای سال 2027 برنامه‌ریزی شده، گسترش می‌دهند. @random_walker

اخبار هوش مصنوعی در 2025-09-08

مدل‌های جدید هوش مصنوعی

  • «علی‌بابا» مدل Qwen3-ASR را منتشر کرد؛ یک مدل همه‌کاره‌ی تشخیص گفتار که از ۱۱ زبان پشتیبانی می‌کند و قابلیت تشخیص خودکار زبان را دارد، از ورودی‌های سفارشی پشتیبانی می‌کند و حتی با وجود موسیقی پس‌زمینه، نرخ خطای کلمه‌ی آن زیر ۸ درصد است @Alibaba_Qwen

تحلیل صنعت

  • «اوپن‌ای‌آی» از یک فیلم بلند انیمیشن تولیدشده با هوش مصنوعی به نام Critterz با بودجه‌ی ۳۰ میلیون دلاری و جدول زمانی تولید ۹ ماهه که قرار است در می ۲۰۲۶ در «کن» به نمایش درآید، حمایت مالی می‌کند @AndrewCurran_
  • «دیتا بریکس» یک دور تامین مالی ۱ میلیارد دلاری دیگر را با ارزش‌گذاری ۱۰۰ میلیارد دلاری تایید کرد؛ این در حالی است که تنها چند ماه پیش ۱۰ میلیارد دلار جمع‌آوری کرده بود @TechCrunch
  • «کاگنیشن لبز» برای عامل کدنویسی هوش مصنوعی خود، Devin، موفق به جذب سرمایه شد؛ سرمایه‌گذاری‌ای که توسط «فاندرز فاند» رهبری شد و «لاکس کپیتال»، «8VC» و دیگران نیز در آن مشارکت داشتند @TechCrunch
  • شرکت ربات‌ساز چینی «یونیتری» برای عرضه‌ی عمومی سهام (IPO) ۷ میلیارد دلاری اقدام کرد؛ این شرکت با بیش از ۱۴۰ میلیون دلار درآمد و با داشتن ۷۰ درصد از سهم بازار جهانی در ربات‌های سگ‌نما، به بزرگ‌ترین شرکت ربات‌های انسان‌نمای عمومی تبدیل می‌شود @deedydas
  • بنیان‌گذاران استارتاپ‌های هوش مصنوعی با فشار زمانی بسیار زیادی مواجه هستند و حدود ۶ ماه یا کمتر فرصت دارند تا به انطباق محصول با بازار (product-market fit) دست یابند؛ پیش از آنکه به دلیل ماهیت انقلابی فناوری هوش مصنوعی مجبور شوند شرکت را تعطیل یا بفروشند @GergelyOrosz

اخلاق و جامعه

  • «آنتروپیک» از لایحه‌ی SB 53 کالیفرنیا حمایت می‌کند و از حکمرانی مبتنی بر شفافیت برای سیستم‌های هوش مصنوعی قدرتمند، به‌جای مدیریت فنی خرد (micromanagement)، طرفداری می‌کند؛ در همین حال، بر نیاز به حکمرانی متفکرانه‌ی هوش مصنوعی در امروز، به جای اقدامات واکنشی در آینده، تاکید می‌کند @AnthropicAI
  • «فرانسوا شوله» هشدار می‌دهد که با سرازیر شدن محتوای تولیدشده با هوش مصنوعی به اینترنت و افزایش اتکای انسان‌ها به هوش مصنوعی مولد، مدل‌های آینده ناگزیر بیشتر بر روی محتوای تولیدشده با هوش مصنوعی آموزش خواهند دید که این امر منجر به تبدیل شدن فرهنگ به «غذای نامرغوب بازترکیب‌شده از غذای نامرغوب» (slop remixed from slop) خواهد شد @fchollet
  • «سم آلتمن» مشاهده می‌کند که «توییتر» و «ردیت» مرتبط با هوش مصنوعی اکنون در مقایسه با یک یا دو سال پیش «بسیار ساختگی» به نظر می‌رسند؛ او این موضوع را به افراد واقعی‌ای نسبت می‌دهد که زبان LLM را به کار می‌برند، چرخه‌های تبلیغاتی شدید، بهینه‌سازی تعامل، و احتمالا دست‌کاری افکار عمومی (astroturfing) @sama

کاربردها

  • «پرپلکسیتی» «پرپلکسیتی برای دولت» را راه‌اندازی کرد که مصرف داده‌ی صفر و دسترسی کاملا امن به مدل‌های هوش مصنوعی پریمیوم را برای استفاده‌ی دولت ایالات متحده، بدون نیاز به قرارداد یا مجوز، ارائه می‌دهد @perplexity_ai
  • حالت هوش مصنوعی «گوگل» در جست‌وجو به پنج زبان جدید: هندی، اندونزیایی، ژاپنی، کره‌ای و پرتغالی برزیلی گسترش یافت؛ این گسترش با استفاده از نسخه‌ی سفارشی Gemini 2.5 برای ارائه‌ی تجربه‌های جست‌وجوی مرتبط با فرهنگ انجام شد @sundarpichai
  • «گوگل دیپ‌مایند» «روبوباله» (RoboBallet) را معرفی کرد؛ یک سیستم هوش مصنوعی که می‌تواند هماهنگی حرکت تا ۸ بازوی رباتیک را بدون برخورد برنامه‌ریزی کند و در برنامه‌ریزی وظایف و حرکت، حدود ۲۵ درصد بهتر از روش‌های سنتی عمل می‌کند @GoogleDeepMind
  • اپلیکیشن «جمینای» اکنون از آپلود فایل‌های صوتی پشتیبانی می‌کند و به اصلی‌ترین درخواست کاربران برای پشتیبانی از انواع فایل پاسخ می‌دهد @joshwoodward
  • مدیرعامل «کاگنیشن لبز» نشان می‌دهد که چگونه هوش مصنوعی Devin در داخل شرکت برای برنامه‌ریزی پروژه، رفع اشکالات، تحقیق در «دیپ‌ویکی» و به عنوان اولین خط دفاعی برای سوالات مهندسی استفاده می‌شود @clairevo

پژوهش‌ها

  • پژوهش‌ها نشان‌دهنده‌ی یک شکاف عملکردی واضح بین الگوریتم‌های یادگیری تقویتی آنلاین و آفلاین برای آموزش LLM هستند، به طوری که روش‌های آنلاین مانند PPO داده‌های خارج از توزیع را قوی‌تر از روش‌های آفلاین مانند DPO مدیریت می‌کنند؛ اگرچه این شکاف می‌تواند از طریق رویکردهای نیمه‌آنلاین به حداقل برسد @cwolferesearch
  • «ایتان مولیک» GPT-5 Pro را برای ساخت پازل‌های جذاب D&D آزمایش می‌کند و بهبودهای قابل توجهی در انسجام پازل در مقایسه با GPT-4 و Claude 3 Opus پیدا می‌کند؛ اگرچه رویکردهای تک‌پرامپت (single-prompt) همچنان با جزئیات اضافی و توجیهات عجیب مشکل دارند @emollick
  • «پاول گراهام» کشف می‌کند که GPT-5 به طور مداوم در ساخت مونگرام‌ها بد عمل می‌کند و حتی پس از اینکه به آن گفته می‌شود اشتباه کرده و از آن خواسته می‌شود برای پاسخ‌های بهتر بیشتر فکر کند، قادر به حل صحیح هیچ‌کدام نیست @paulg
  • «هاگینگ فیس» FinePDF را منتشر می‌کند؛ بزرگ‌ترین مجموعه‌داده‌ی PDF در دسترس عموم با ۳ تریلیون توکن در ۴۷۵ میلیون سند به ۱۷۳۳ زبان، که عملکردی تقریباً هم‌سطح با مجموعه‌های HTML پیشرفته (state-of-the-art) دارد @rohanpaul_ai
  • «فرانسوا شوله» پیشنهاد می‌کند که AGI (هوش عمومی مصنوعی) «یک کدگذاری الگوریتمی از فرآیند خودِ علم» خواهد بود، به جای یک ذهن فردی؛ او علم را به عنوان یک فرآیند سنتز برنامه که مدل‌های نمادین تولید می‌کند، توصیف می‌کند @fchollet

اخبار هوش مصنوعی در 2025-09-07

مدل‌های جدید هوش مصنوعی

  • ایلان ماسک از یک به‌روزرسانی بزرگ برای ایمَجین خبر داد که طی چند هفته‌ی آینده منتشر می‌شود، با «اپیزودهای نیم‌ساعته‌ی جذاب» از ویدیوی مولد تا سال آینده، و هدف‌گذاری تولید ویدیوهای منسجم ۱۵ دقیقه‌ای از یک دستور (پرامپت) واحد تا پایان سال جاری. @AndrewCurran_
  • تنسنت هونیوان با مدل‌های Hunyuan-MT-7B و HunyuanWorld-Voyager به دو جایگاه برتر در جدول‌های ترند هگینگ فیس دست یافت. @huggingface

تحلیل صنعت

  • انتظار می‌رود ASML پس از تعهد ۱.۵ میلیارد دلاری در جذب سرمایه و تبدیل شدن به سهام‌دار اصلی، در هیئت مدیره‌ی میسترال کرسی داشته باشد و بدین ترتیب یک اتحاد هوش مصنوعی اروپایی تشکیل می‌دهد. @AndrewCurran_
  • پرپلکسیتی در حال استخدام دانشمندان داده برای کار روی ارزیابی‌های دستیار است، که مستلزم تجربه‌ی کاری در بهبود سیستم‌های پیچیده‌ی هوش مصنوعی در مقیاس بزرگ است. @alexgraveley
  • ناتان لمبرت، پرداخت هزینه برای هوش مصنوعی‌های بهتر را راهی برای «پیروزی با پرداخت هزینه» در حرفه‌ی شما توصیف می‌کند، که آن را با پویایی‌های بازی‌های ویدیویی مقایسه می‌کند. @natolambert
  • پل گراهام مشاهداتی را بازنشر کرد مبنی بر اینکه عامل‌های هوش مصنوعی برای اولین بار امکان جداسازی خروجی (ارزش) از ورودی انسانی (زمان) را در کارهای مبتنی بر دانش فراهم می‌کنند. @paulg

کاربردها

  • لوگان کیلپاتریک استفاده از NanoBanana را در گوگل اِی‌آی استودیو (Google AI Studio) برای آزمایش نشان داد. @OfficialLoganK
  • سایمون ویلیسون گزارشی تکمیلی ارائه می‌دهد که «حالت هوش مصنوعی» جدید گوگل را بسیار خوب توصیف می‌کند و آن را کاملاً متفاوت از «بررسی‌های کلی هوش مصنوعی» می‌داند که به نظر او وحشتناک هستند. @simonw
  • گرگ براکمن مثالی از رابط خط فرمان (CLI) کدکس با قابلیت یکپارچه‌سازی جست‌وجوی وب را به اشتراک گذاشت. @gdb

پژوهش‌ها

  • ایتان مولیک یافته‌های ظریفی را درباره‌ی توانایی GPT-5 Pro در انجام ریاضیات جدید مورد بحث قرار می‌دهد، اما تنها زمانی که توسط یک استاد ریاضی هدایت شود، و سرعت پیشرفت از زمان GPT-4 را برجسته می‌کند. @emollick
  • هگینگ فیس، FinePDFs را منتشر کرد؛ بزرگ‌ترین مجموعه‌ی داده‌ی PDF که شامل بیش از نیم میلیارد سند با ۳ تریلیون توکن از حوزه‌های پرتقاضا مانند حقوق و علوم است، و زمینه‌ی متنی (کانتکست) ۲ برابر طولانی‌تر از متن وب را نشان می‌دهد. @huggingface
  • الکس گراولی ایده‌ی بازرتبه‌بندی‌کننده‌ی سطح توکن (token level reranker) را بر اساس پژوهش‌های مرجع پیاده‌سازی کرد. @alexgraveley
  • ایتان مولیک اشاره می‌کند که مدل‌های زبانی بزرگ چندوجهی (multimodal LLMs) در تشخیص جزئیات بصری ظریف ضعیف بوده‌اند، که این امر اهمیت نظارت بر معیارهای بصری را برای ردیابی پیشرفت برجسته می‌کند. @emollick
  • فرانسوا شوله توضیح می‌دهد که مدل‌های یادگیری عمیق تنها می‌توانند از طریق درون‌یابی (interpolation) بر روی منحنی‌های پارامتریک تعمیم یابند، که منجر به توهم‌زایی می‌شود، و نمودارهای نمادین علّی (causal symbolic graphs) را به عنوان راه‌حلی برای انتشار دقیق حقیقت‌پذیری پیشنهاد می‌کند. @fchollet

اخبار هوش مصنوعی در 2025-09-06

مدل‌های جدید هوش مصنوعی

  • جوآن جانگ از راه‌اندازی OAI Labs، یک گروه پژوهش‌محور که بر اختراع رابط‌های کاربری جدید برای همکاری انسان و هوش مصنوعی تمرکز دارد و فراتر از چت و عامل‌ها (ایجنت‌ها) به سمت الگوهای جدیدی برای تفکر، ساخت و یادگیری می‌رود، خبر داد. @joannejang
  • گوگل اعلام کرد که Nano Banana اکنون در لایه‌ی رایگان API جِمنای برای آخر هفته با نام «gemini-2.5-flash-image-preview» در دسترس است. @OfficialLoganK
  • گوگل قیمت Veo 3 را بیش از 50% کاهش داد، به طوری که قیمت Veo 3 با صدا از 0.75 دلار به 0.40 دلار و بدون صدا از 0.50 دلار به 0.20 دلار رسید. @arrakis_ai
  • سایمون ویلیسون Kimi-K2-Instruct-0905 (Kimi K-2.1) را بررسی کرد که یک بهبود تدریجی در مدل با وزن‌های باز (open weights) و تریلیون پارامتری مون‌شات است و طول بافت (context length) آن از 128 هزار به 256 هزار توکن افزایش یافته است. @simonw

تحلیل صنعت

  • گرگلی اوروس گزارش می‌دهد که 50% از بهترین استخدام‌هایش به عنوان مدیر، فارغ‌التحصیلان جدیدی بودند که بسیار باانگیزه، باهوش و متمرکز کار می‌کردند، که نشان‌دهنده‌ی بازدهی بالای سرمایه‌گذاری (ROI) در استخدام فارغ‌التحصیلان جدید، با وجود قابلیت‌های هوش مصنوعی است. @GergelyOrosz
  • نیتن لمبرت اشاره می‌کند که 10% از بودجه‌ی تأمین مالی سری F انتروپیک به نویسندگان می‌رسد، به عنوان بخشی از یک تسویه حساب 1.5 میلیارد دلاری، و آن را «عجیب‌ترین یارانه (سوبسید) سرمایه‌گذاری خطرپذیر (VC) زمان ما» می‌نامد. @natolambert
  • تک‌کرانچ گزارش می‌دهد که نویسندگان تسویه حساب انتروپیک را دریافت نمی‌کنند چون آثارشان به هوش مصنوعی خورانده شده است، بلکه به این دلیل که انتروپیک به جای خرید کتاب‌ها، آن‌ها را به صورت غیرقانونی دانلود کرده است. @TechCrunch
  • اوپن‌اِی‌آی از گسترش فعالیت‌های خود به یونان خبر داد، از جمله دسترسی به ابزارهای هوش مصنوعی با کیفیت بالا در آموزش متوسطه، به علاوه گواهینامه‌های جدید اوپن‌اِی‌آی و یک پلتفرم شغلی برای کمک به افراد جهت یادگیری مهارت‌های هوش مصنوعی و به کسب‌وکارها برای یافتن کارگران ماهر در حوزه‌ی هوش مصنوعی. @gdb

اخلاق و جامعه

  • سایمون ویلیسون استدلال می‌کند که تسویه حساب 1.5 میلیارد دلاری کتاب‌های انتروپیک به نفع انتروپیک است، و اشاره می‌کند که به نظر می‌رسد در ایالات متحده، خرید کتاب‌های دست دوم، اسکن آن‌ها و آموزش (مدل‌ها) بر اساس محتوای آن‌ها تحت تغییر «استفاده‌ی منصفانه» قانونی است. @simonw
  • ریاضیدانانی که در حال بررسی این موضوع هستند که آیا GPT-5 می‌تواند ریاضیات اصیل خلق کند یا خیر، هشدار می‌دهند که «خطر نه تنها از دست دادن اصالت است، بلکه تضعیف خود فرایند ریاضیدان بودن نیز هست.» @deedydas
  • ان‌ویدیا به دلیل دور شدن از داده‌های باز مورد انتقاد قرار گرفت، با Nemotron-CC-v2 که تحت مجوز محدودکننده‌ای منتشر شد که استفاده‌ی منبع‌باز، ترکیب داده‌ها یا انتشار بنچمارک‌ها را بدون اجازه ممنوع می‌کند. @soldni

کاربردها

  • گرگ براکمن GPT-5 Pro را «سطح بعدی برای کدنویسی» توصیف می‌کند و کاربردهای پزشکی آن را اینگونه تشریح می‌کند: «گویی بهترین فوق‌تخصص در مراکز تخصصی مانند «مایو کلینیک» این مورد را برای بررسی دریافت کرده است.» @gdb
  • سایمون ویلیسون GPT-5 Thinking را به طور گسترده با جستجوی بینگ آزمایش می‌کند، و آن را «گابلین پژوهش» خود می‌نامد و اشاره می‌کند که پس از تقریباً سه سال توصیه علیه استفاده از چت‌جی‌پی‌تی برای جستجو، GPT-5 با بینگ اکنون «یک موتور جستجوی فوق‌العاده مفید» است. @simonw
  • آراویند سرینیواس اعلام کرد که دارندگان سازمانی سهام اکنون به راحتی در Perplexity در دسترس هستند و اطلاعات مربوط به سیاستمداران و معاملات نهانی (اینسایدر تریدینگ) به زودی اضافه خواهد شد. @AravSrinivas
  • سایمون ویلیسون جستجوی معنایی تصاویر را با استفاده از جاسازی‌های متنی (text embeddings) در مقابل خلاصه‌های LLM بینایی (vision-LLM) تصاویر نشان می‌دهد، و اشاره می‌کند که این روش واقعاً خوب کار می‌کند. @simonw

پژوهش‌ها

  • پژوهش اوپن‌اِی‌آی نشان می‌دهد که توهمات (hallucinations) کمتر یک مشکل مربوط به خود مدل‌های LLM است و بیشتر یک مسئله‌ی مربوط به آموزش (مدل‌ها) بر روی آزمون‌هایی است که فقط پاسخ‌های صحیح را پاداش می‌دهند، که حدس زدن را به جای گفتن «نمی‌دانم» تشویق می‌کند. @emollick
  • ایتن مولیک این نظریه را مطرح می‌کند که انتشار o1-preview توسط اوپن‌اِی‌آی از نظر استراتژیک زیر سوال بود، زیرا نمایش قابلیت استدلال باعث شد همه بتوانند فوراً آن را کپی کنند، در حالی که به تعویق انداختن تا o3 و نامیدن آن GPT-5 می‌توانست جهشی حیرت‌انگیزتر باشد. @emollick
  • نیتن لمبرت گزارش می‌دهد که خوش‌بین است GPT-5 Pro یا Gemini Deep Think باهوش‌ترین مدل‌های موجود عمومی امروز هستند، و توصیه می‌کند که افراد از یکی یا هر دو استفاده کنند. @natolambert
  • یوجین یان از توسعه‌ی مبتنی بر ارزیابی (EDD) که مشابه توسعه‌ی مبتنی بر آزمون است حمایت می‌کند، و تأکید می‌کند که ارزیابی‌های عمومی مانند «وفاداری» (faithfulness) و «مفید بودن» (helpfulness) کاربردی نیستند – ارزیابی‌ها باید با مشکلات خاص کاربران همسو باشند. @eugeneyan

اخبار هوش مصنوعی در 2025-09-05

مدل‌های جدید هوش مصنوعی

  • Alibaba مدل Qwen3-Max-Preview را با بیش از ۱ تریلیون پارامتر منتشر کرده است. این شرکت ادعا می‌کند که عملکرد آن قوی‌تر از مدل قبلی خود، Qwen3-235B-A22B-2507، است و اکنون از طریق Qwen Chat و Alibaba Cloud API در دسترس است @Alibaba_Qwen
  • OpenAI ویژگی «انشعاب گفتگو» (conversation branching) را اعلام کرده است که اکنون در ChatGPT فعال است و به کاربران اجازه می‌دهد مسیرهای گفتگوی متفاوتی را کاوش کنند @gdb
  • Moonshot AI مدل Kimi K2-Instruct-0905 را با ۳۲ میلیارد پارامتر فعال از مجموع ۱ تریلیون پارامتر منتشر کرده است. این مدل دارای هوش کدنویسی عاملی بهبودیافته (enhanced agentic coding intelligence) و پنجره‌ی متنی ۲۵۶ هزار توکنی (context window) است @AdinaYakup

تحلیل صنعت

  • OpenAI سال آینده برای اولین بار تراشه‌های اختصاصی خود را خواهد داشت که با همکاری Broadcom و فقط برای استفاده‌ی داخلی طراحی شده‌اند. Broadcom ۱۰ میلیارد دلار سفارش از این مشتری مرموز دریافت کرده است @AndrewCurran_
  • Anthropic به یک توافق دسته‌جمعی (class action settlement) به ارزش ۱.۵ میلیارد دلار با نویسندگان کتاب بر سر مجموعه‌داده‌های LibGen و PiLiMi دست یافته است. بر اساس این توافق، تقریباً ۳۰۰۰ دلار به ازای هر کتاب پرداخت می‌شود و این بزرگترین بازیابی حق چاپ گزارش‌شده‌ی عمومی در تاریخ است @AndrewCurran_
  • ۳ مورد از ۴ اپلیکیشن برتر بهره‌وری در اپ استور آمریکا، برنامه‌های هوش مصنوعی هستند؛ ۲ مورد از گوگل، ۰.۵ مورد از مایکروسافت، و Perplexity تنها شرکت فناوری کوچک‌تر حاضر در این فهرست است @AravSrinivas
  • OpenAI در یک معامله‌ی «استخدام-خرید» (acqui-hire) دیگر، تیمی را که پشت Alex Codes بود، خریداری کرد. Alex Codes ابزاری محبوب برای استفاده از مدل‌های هوش مصنوعی در مجموعه‌ی توسعه‌ی Xcode اپل است @TechCrunch
  • Dot، یک دستیار هوش مصنوعی شخصی‌سازی‌شده، پس از یک سال فعالیت تعطیل می‌شود. تیم توسعه‌دهنده از کاربرانی که روابط نزدیکی با این هوش مصنوعی برقرار کرده بودند، تشکر کرده است @jasonyuandesign
  • کلر وو گزارش داده است که پس از نزدیک به ۲ سال ساخت ChatPRD، بالاخره به خودش حقوق پرداخت کرده است. او بر ارزش ساخت یک کسب‌وکار سالم و خودگردان (bootstrapped) از روز اول، به جای دنبال کردن استراتژی‌های رشد به هر قیمتی، تأکید کرد @clairevo

اخلاق و جامعه

  • دادستان‌های کل کالیفرنیا و دلاور نگرانی‌های خود را در مورد ایمنی ChatGPT برای کودکان و نوجوانان به OpenAI ابراز کرده‌اند و بر نظارت نظارتی مستمر بر سیستم‌های هوش مصنوعی تأکید کردند @TechCrunch
  • Common Sense Media گزارش می‌دهد که Gemini گوگل در اقدامات ایمنی برای کودکان کوتاهی کرده است و نگرانی‌هایی را در مورد مناسب بودن سیستم‌های هوش مصنوعی برای کاربران جوان‌تر ایجاد می‌کند @TechCrunch
  • وارنر برادرز از Midjourney به دلیل تولید تصاویر هوش مصنوعی از سوپرمن، بتمن و دیگر شخصیت‌های دارای حق چاپ شکایت کرده است و اختلافات جاری مالکیت فکری در محتوای تولیدشده توسط هوش مصنوعی را برجسته می‌کند @TechCrunch

کاربردها

  • Perplexity صفحات مالی (Finance pages) را با درآمدهای تخمینی آتی برای سهام انفرادی آمریکا راه‌اندازی کرده است و پشتیبانی از سهام هند هفته‌ی آینده ارائه خواهد شد @AravSrinivas
  • xAI ویژگی‌های تحلیل PDF را در Grok معرفی کرده است که به کاربران اجازه می‌دهد بخش‌هایی را برجسته کنند و توضیحات دریافت کنند یا سوالات خاصی در مورد محتوای سند بپرسند @xai
  • مایکروسافت با باغ وحش Woodland Park همکاری می‌کند تا SPARROW را آزمایش کند، یک سیستم هوش مصنوعی که داده‌های حیات وحش را مستقیماً به فضای ابری ارسال می‌کند تا سمورهای آبی اقیانوس آرام آسیب‌پذیر (Pacific martens) مورد مطالعه قرار گیرند @Microsoft
  • Figma Make اکنون برای همه‌ی حساب‌های آموزش عالی و آموزشی بوت‌کمپ در دسترس است و دسترسی به ابزارهای طراحی مبتنی بر هوش مصنوعی را گسترش می‌دهد @figma
  • Isotopes یک عامل تحلیلی پیشرفته (sophisticated analytics agent) را راه‌اندازی کرده است که توسط آرون مورتی، یکی از بنیان‌گذاران Hadoop که بعدها به Scale AI پیوست، هم‌بنیان‌گذاری شده است @TechCrunch
  • Sierra، یک استارتاپ عامل هوش مصنوعی برای خدمات مشتری، ادعا می‌کند که صدها مشتری از جمله SoFi، Ramp و Brex دارد @TechCrunch

پژوهش‌ها

  • OpenAI پژوهشی را منتشر کرده است که توضیح می‌دهد چرا مدل‌های زبان بزرگ (LLM) از طریق ارتباطی بین یادگیری نظارت‌شده و خودنظارت‌شده «توهم» (hallucination) دارند و موانع کلیدی را توصیف می‌کند که می‌توانند برای کاهش توهمات برداشته شوند @adamfungi
  • خبرنامه‌ی Deep Learning Focus از کامرون ولف به ۵۰,۰۰۰ مشترک رسیده است. این خبرنامه موضوعات فنی کلیدی از جمله مدل‌های استدلالی، عامل‌های هوش مصنوعی، معماری‌های «ترکیب متخصصان» (mixture-of-experts) و تکنیک‌های ارزیابی «LLM-as-a-Judge» را برجسته می‌کند @cwolferesearch
  • Hugging Face مجموعه‌داده‌ی FineVision را منتشر کرده است که به عنوان بهترین مجموعه‌داده‌ی باز و رایگان برای آموزش مدل‌های زبان بینایی توصیف می‌شود. این مجموعه‌داده شامل ۲۰۰ مجموعه‌ی آموزشی است که به ۱۸ میلیارد تصویر در ۹ زیرشاخه فشرده شده‌اند @ClementDelangue
  • PyTorch در حال بررسی FlashAttention در بُعد سه‌بعدی از طریق 2-Simplicial Attention است و این الگوریتم را با طراحی هم‌تراز با سخت‌افزار مدل‌سازی می‌کند و کرنل‌ها را در TLX (Triton Low Level Extensions) بازنویسی می‌کند @PyTorch
  • آرویند نارایانان پدیده‌ی «قله‌ی دروغین» (false summit) را در توسعه‌ی هوش مصنوعی مورد بحث قرار می‌دهد؛ جایی که نقاط عطف درک‌شده بارها ثابت می‌شوند که مراحل میانی هستند نه دستاوردهای نهایی، که منجر به اتهاماتی می‌شود مبنی بر اینکه شکاکان پیوسته «استانداردها را تغییر می‌دهند» (moving the goalposts) @random_walker

اخبار هوش مصنوعی در 2025-09-04

مدل‌های جدید هوش مصنوعی

  • گوگل مدل جاسازی باز جدیدی به نام EmbeddingGemma را با ۳۰۸ میلیون پارامتر منتشر کرد که در بنچمارک MTEB به عملکرد پیشرو (State-of-the-art) دست می‌یابد، در حالی که آن‌قدر کوچک است که به‌طور کامل روی دستگاه اجرا شود. @sundarpichai
  • پرپلکسیتی (Perplexity) اعلام کرد که Comet اکنون برای پیش‌سفارش در پلی استور اندروید و برای کاربران نسخه حرفه‌ای (Pro) در کره‌جنوبی، برزیل و اسپانیا در دسترس است. @AravSrinivas
  • گوگل ادغام Veo 3 را در قابلیت تبدیل عکس به ویدیو‌ی Google Photos اعلام کرد، که قابلیت‌های تولید ویدیو را ارتقا می‌دهد. @TechCrunch
  • جینا اِی‌آی (Jina AI) «jina-code-embeddings» را منتشر کرد، مجموعه‌ای جدید از مدل‌های جاسازی کد با اندازه‌های ۰.۵ میلیارد و ۱.۵ میلیارد پارامتر با عملکرد بازیابی پیشرو (SOTA) که از بیش از ۱۵ زبان برنامه‌نویسی پشتیبانی می‌کند. @JinaAI_

تحلیل صنعت

  • اندرو ان‌جی (Andrew Ng) تقاضای برآورده‌نشده‌ی قابل‌توجهی را برای مهندسان هوش مصنوعی شناسایی کرده که می‌توانند با کمک هوش مصنوعی، سیستم‌های نرم‌افزاری را به سرعت مهندسی کنند، در حالی که فارغ‌التحصیلان اخیر علوم کامپیوتر به دلیل عدم انطباق برنامه‌های درسی دانشگاه‌ها با برنامه‌نویسی مبتنی بر هوش مصنوعی (AI-native programming)، با افزایش بیکاری مواجه شده‌اند. @AndrewYNg
  • رید هافمن (Reid Hoffman) درباره‌ی مطالعه‌ی استنفورد بحث می‌کند که نشان‌دهنده‌ی کاهش ۱۶ درصدی در مشاغل سطح ورودی برای افراد ۲۲ تا ۲۵ ساله در زمینه‌های مرتبط با هوش مصنوعی است و بر نیاز به مسیرهای شغلی جدید در عصر هوش مصنوعی تاکید می‌کند. @reidhoffman
  • گرگلی اوروس (Gergely Orosz) از دستور مدیرعامل کوین‌بیس (Coinbase) برای افزایش درصد تولید کد با هوش مصنوعی انتقاد می‌کند، با این استدلال که این دستور بر معیارهای استفاده از ابزارها تمرکز دارد تا بر نتایج تجاری مانند رضایت مشتری یا قابلیت اطمینان محصول. @GergelyOrosz
  • مصطفی سلیمان (Mustafa Suleyman) تاکید می‌کند که مدل‌های پیشرو هوش مصنوعی اکنون ۹۰٪ ارزان‌تر اما ۲.۷ برابر بهتر از دو سال پیش هستند و بر جهش رو به جلو در دسترسی‌پذیری تاکید می‌کند. @mustafasuleyman
  • دیدی (Deedy) گزارش می‌دهد که بر اساس مطالعه‌ی MIT، ۹۵٪ از پروژه‌های آزمایشی (پایلوت) هوش مصنوعی مولد (Gen AI) شکست نمی‌خورند، که با روایت‌های رایج درباره‌ی نرخ شکست پروژه‌های هوش مصنوعی در تضاد است. @deedydas
  • لنی راچیتسکی (Lenny Rachitsky) ارزیابی‌ها (evals) را به عنوان یک مهارت ضروری و نوظهور برای سازندگان محصول و شرکت‌های هوش مصنوعی شناسایی می‌کند و آن را با SQL و Excel به عنوان صلاحیت‌های اساسی مقایسه می‌کند. @lennysan
  • سم آلتمن (Sam Altman) گزارش می‌دهد که میزان استفاده از Codex طی دو هفته‌ی گذشته ۱۰ برابر افزایش یافته است، که نشان‌دهنده‌ی شتاب قابل‌توجهی برای ابزارهای کدنویسی هوش مصنوعی است. @sama
  • آراویند سرینیواس (Aravind Srinivas) اعلام کرد که بیش از یک میلیون نفر در یک صبح به Comet دسترسی پیدا کردند و آن را پرکاربردترین محصول شخصی و عاملیت‌محور در جهان نامید. @AravSrinivas

اخلاق و جامعه

  • سم آلتمن (Sam Altman) شاهد افزایش شیوع حساب‌های توییتر تحت مدیریت مدل‌های زبان بزرگ (LLM) است و اشاره می‌کند که تئوری «اینترنت مرده» را جدی‌تر می‌گیرد. @sama
  • مایکروسافت ریسرچ (Microsoft Research) «Sui Generis score» را برای اندازه‌گیری تنوع روایی در خروجی‌های LLM معرفی می‌کند و نشان می‌دهد که چگونه روایت‌گری هوش مصنوعی اغلب روایت‌های تکراری و کم‌تر منحصربه‌فردی ایجاد می‌کند. @MSFTResearch

کاربردها

  • ریبرا (Ribera)، یک شرکت مراقبت‌های بهداشتی اسپانیایی، از هوش مصنوعی برای بهبود سیستم‌های ترخیص بیماران جراحی آب‌مروارید استفاده می‌کند. @Microsoft
  • اوپن‌اِی‌آی (OpenAI) قابلیت «انشعاب مکالمه (conversation branching)» را در ChatGPT راه‌اندازی می‌کند که به کاربران امکان می‌دهد مسیرهای مختلف را بدون از دست دادن رشته‌ی اصلی (مکالمه) بررسی کنند. @OpenAI
  • گوگل قابلیت ترجمه‌ی Circle to Search را معرفی می‌کند و قابلیت‌های ویرایش تصویر برنامه Gemini را ارتقا می‌دهد. @TechCrunch
  • پایگاه‌های داده Notion اکنون از قابلیت‌های مبتنی بر هوش مصنوعی برای پردازش و تحلیل داده‌های پیشرفته پشتیبانی می‌کنند. @brian_lovin
  • تک‌کرانچ (TechCrunch) گزارش می‌دهد که پلتفرم مشاغل OpenAI قرار است در اواسط سال ۲۰۲۶ راه‌اندازی شود و از هوش مصنوعی برای تطبیق نامزدها با کسب‌وکارها استفاده می‌کند. @TechCrunch
  • Supersonik AI به عنوان اولین هوش مصنوعی که می‌تواند دموهای زنده‌ی محصول را اجرا کند، راه‌اندازی شد و با رهبری a16z، پنج میلیون دلار سرمایه جذب کرد. @danipolymath

پژوهش‌ها

  • ایتان مولیک (Ethan Mollick) یافته‌های پژوهشی را به اشتراک می‌گذارد که نشان می‌دهد قابلیت‌های «تئوری ذهن» (Theory of Mind) مدل‌های زبان بزرگ (LLM) تنها از ۰.۰۰۱٪ پارامترهای آن‌ها ناشی می‌شود و شکستن این وزن‌های خاص منجر به از دست دادن هم ردیابی باور و هم درک زبان می‌شود. @emollick
  • گوگل دیپ‌مایند (Google DeepMind) روش «Deep Loop Shaping» را در مجله‌ی Science منتشر کرد که نویز را در رصدخانه‌های موج گرانشی LIGO تا ۱۰ برابر یا بیشتر کاهش می‌دهد و به شناسایی ادغام سیاه‌چاله‌ها کمک می‌کند. @GoogleDeepMind
  • پژوهشگران استنفورد «Mixture of Contexts» را برای تولید ویدیوهای یک دقیقه‌ای در یک مرحله و بدون انحراف یا فراموش کردن بستر (context) تاریخی معرفی کردند. @GordonWetzstein
  • یک مقاله‌ی پژوهشی نشان می‌دهد که عامل‌های هوش مصنوعی (AI agents) می‌توانند برای آزمایش‌های علوم اجتماعی استفاده شوند، زمانی که پرامپت‌ها بر اساس علوم اجتماعی و نظریه‌ی بازی توسعه یابند و اقدامات عامل‌های هوش مصنوعی را پیش‌بینی‌کننده‌ی نتایج واقعی انسان می‌کند. @emollick
  • مطالعه‌ی جدیدی قابلیت‌های وب‌گردی عامل‌های هوش مصنوعی (AI agents) را با استفاده از بنچمارک Online Mind2Web ارزیابی می‌کند، و ۹ مدل از جمله GPT-5 و Sonnet 4 را با ساختارهای عاملیت متفاوت آزمایش می‌کند. @sayashk
  • یک مقاله‌ی پژوهشی روش‌های ارزیابی شناسایی توهم (hallucination detection) در LLM‌ها را به چالش می‌کشد و مشکلات قابل‌توجهی را در شیوه‌های رایج این حوزه شناسایی می‌کند. @ziv_ravid
  • هاگینگ فیس (Hugging Face) «FineVision» را منتشر کرد، یک مجموعه‌داده‌ی (dataset) متن‌باز عظیم با ۱۷.۳ میلیون تصویر و ۲۴.۳ میلیون نمونه برای آموزش مدل‌های بینایی-زبان (Vision-Language Models). @thibaudfrere

اخبار هوش مصنوعی در 2025-09-03

مدل‌های جدید هوش مصنوعی

  • Perplexity مرورگر Comet را برای همه‌ی دانشجویان در سراسر جهان عرضه می‌کند، که شامل دستیار هوش مصنوعی، فلش کارت، مسدودکننده‌ی تبلیغات و حالت مطالعه می‌شود. @perplexity_ai
  • OpenAI قابلیت «پروژه‌ها» (Projects) را برای کاربران رایگان در ChatGPT در دسترس قرار می‌دهد، با امکان بارگذاری فایل‌های بزرگتر، گزینه‌های سفارشی‌سازی و کنترل‌های حافظه‌ی مخصوص پروژه. @OpenAI
  • گوگل فرمت‌های جدید «Audio Overview» را در NotebookLM معرفی می‌کند که به کاربران امکان می‌دهد بین سبک‌های «Deep Dive» (بررسی عمیق)، «Brief» (خلاصه)، «Critique» (نقد) یا «Debate» (مناظره) برای پادکست‌های تولیدشده توسط هوش مصنوعی انتخاب کنند. @TechCrunch

تحلیل صنعت

  • یک مدیر مهندسی در هنگام خواندن متون تولیدشده توسط هوش مصنوعی، کاهش سریع علاقه را مشاهده می‌کند و درخواست می‌کند که یا از هوش مصنوعی استفاده نشود یا فقط پرامپت‌ها (دستورات) ارائه شوند تا از «جملات بی‌معنی» در بررسی‌های عملکرد جلوگیری شود. @GergelyOrosz
  • ۱۲ مورد از ۵۰ اپلیکیشن برتر هوش مصنوعی مولد در سراسر جهان، همدم‌های هوش مصنوعی و اپلیکیشن‌های گفت‌و‌گوی «خاص» (spicy) هستند که نشان‌دهنده‌ی تقاضای قابل توجهی در بازار برای هوش مصنوعی مکالمه‌محور است. @deedydas
  • پذیرش هوش مصنوعی در کدنویسی تا دسامبر ۲۰۲۴ به بیش از ۳۰ درصد با تأثیر زیاد می‌رسد، اگرچه از پیش‌بینی‌های ۹۰ درصدی تا به امروز کمتر است. @emollick
  • محصولات هوش مصنوعی متمرکز بر توسعه‌دهندگان اکنون در میزان استفاده با محصولات مصرف‌کننده رقابت می‌کنند، به طوری که ابزارهایی مانند Replit، Cursor و دیگران در رتبه‌های برتر قرار می‌گیرند و «کدنویسی با حس و حال» (vibe coding) بازار را گسترش می‌دهد. @omooretweets
  • رقابت بازار هوش مصنوعی بیشتر بر جذب استعدادها تمرکز دارد تا جذب مشتری، با نبردهای شدید بر سر تعداد کمی از افرادی که می‌دانند چگونه سیستم‌های هوش مصنوعی بسازند. @a16z

اخلاق و جامعه

  • مصطفی سلیمان معتقد است که شخصیت هوش مصنوعی مشکل نیست، بلکه توهم انسان‌بودگی هوش مصنوعی است که انتظارات نگران‌کننده‌ای ایجاد می‌کند. @mustafasuleyman
  • اتان مولیک در مورد کم‌اهمیت جلوه دادن عمدی قابلیت‌های هوش مصنوعی هشدار می‌دهد و استدلال می‌کند که انتخاب گزینشی خطاها، مردم را در مورد تأثیر واقعی هوش مصنوعی بر مشاغل، آموزش و جامعه گمراه می‌کند. @emollick
  • پژوهش‌ها نشان می‌دهد که تکنیک‌های اقناعی که بر انسان‌ها مؤثر هستند، بر سیستم‌های هوش مصنوعی نیز عمل می‌کنند و سؤالاتی را در مورد دستکاری هوش مصنوعی و تصمیم‌گیری آن مطرح می‌کند. @danshapiro

کاربردها

  • مرورگر «Comet» پرپلکسیتی اکنون قابلیت تعامل با صفحات وب با کنترل صوتی را ارائه می‌دهد، که تجربه‌های هوش مصنوعی آینده‌نگرانه‌ای را برای مرور و کنترل امکان‌پذیر می‌سازد. @testingcatalog
  • مدل‌های تولید تصویر هوش مصنوعی در رنگ‌آمیزی مانگاهای سنتی سیاه‌وسفید عالی عمل می‌کنند، به طوری که گوگل Gemini پردازش سریع و ۱۰۰٪ حفظ تصویر را نشان می‌دهد. @deedydas
  • اپلیکیشن گوگل Gemini «روش کلاژ» را معرفی می‌کند که به کاربران امکان می‌دهد چندین تصویر را آپلود کرده و آن‌ها را با یک پرامپت (دستور) واحد برای سفارشی‌سازی لباس، برنامه‌ریزی غذا و پروژه‌های خلاقانه ترکیب کنند. @GeminiApp
  • هوش مصنوعی تسلا ناوبری خودران وسایل نقلیه‌ی تازه‌تولیدشده را در محوطه‌ی کارخانه، شامل توقف در سوپرشارژرها و پارک کردن در پارکینگ‌های خروجی، به نمایش می‌گذارد. @Tesla_AI
  • HubSpot تولید تصویر را در پلتفرم خود با استفاده از Stable Diffusion 3.5 Large بر روی Amazon Bedrock برای ایجاد محتوای مطابق با برند، ۱۵۰ درصد افزایش می‌دهد. @StabilityAI
  • کاربری نحوه‌ی استفاده از ارائه‌دهنده‌ی پایگاه داده MCP را برای پرس‌وجوی مستقیم داده‌های Segment، ساخت تحلیل قیفی و تولید خلاصه‌ی اجرایی با هوش مصنوعی، جایگزین کردن ابزارهای تحلیلی سنتی، نشان می‌دهد. @clairevo

پژوهش‌ها

  • مایکروسافت ریسرچ کار پیشگامانه‌ای را در مورد کامپیوتر نوری آنالوگ در مجله‌ی Nature منتشر می‌کند، که راه‌حل‌هایی ۱۰۰ برابر سریع‌تر و با مصرف انرژی بهینه‌تر برای مسائل پیچیده‌ی بهینه‌سازی را نشان می‌دهد. @satyanadella
  • گزارش مک‌کینزی از سال ۲۰۱۷ نشان می‌دهد که متخصصان هوش مصنوعی پیش‌بینی کرده بودند که میانگین خلاقیت انسانی در سال ۲۰۳۷ حاصل خواهد شد، اما در واقع در سال ۲۰۲۳ به آن دست یافته شد، و خلاقیت سه‌چهارم برتر که برای سال ۲۰۵۵ پیش‌بینی شده بود نیز اکنون به اتمام رسیده است. @emollick
  • PyTorch با استفاده از پیاده‌سازی MXFP8 در TorchAO بر روی TorchTitan در مقیاس 2K روی GPU‌های Crusoe B200، شتاب ۱.۲۲ تا ۱.۲۸ برابری را با همگرایی معادل BF16 نشان می‌دهد. @PyTorch
  • استانفورد AHELM را منتشر می‌کند – یک چارچوب ارزیابی جامع برای مدل‌های صوتی-زبانی در ۱۰ جنبه، همراه با جدول رده‌بندی و بنچمارکینگ (معیارسنجی) فراگیر. @tonyh_lee
  • تیم پژوهشی Hugging Face یک جلسه‌ی پرسش و پاسخ (AMA) آتی را در r/LocalLLaMA اعلام می‌کند که توسعه‌ی SmolLM، SmolVLM، FineWeb و همکاری تیم از راه دور در پژوهش‌های پرشتاب هوش مصنوعی را پوشش می‌دهد. @LoubnaBenAllal1

اخبار هوش مصنوعی در 2025-09-02

مدل‌های جدید هوش مصنوعی

  • آنتروپیک سرمایه‌ی سری F به مبلغ ۱۳ میلیارد دلار را با ارزش‌گذاری ۱۸۳ میلیارد دلار جذب کرد و در عرض فقط هشت ماه، درآمد سالانه‌ی خود را از ۱ میلیارد دلار به ۵ میلیارد دلار رساند و بدین‌ترتیب آن را به یکی از سریع‌ترین شرکت‌های فناوری در حال رشد در تاریخ تبدیل کرده است @AnthropicAI
  • مایکروسافت اعلام کرد که GPT-5 از روز اول برای ۱۰۰٪ کاربران Copilot در دسترس است؛ این قابلیت همراه با ویژگی‌های جدیدی از جمله Copilot 3D و دسترسی رایگان جهانی به Deep Research ارائه می‌شود @mustafasuleyman

تحلیل صنعت

  • OpenAI استتسیگ (Statsig) را به مبلغ ۱.۱ میلیارد دلار خریداری کرد و ویجای راجی را به‌عنوان مدیر ارشد فناوری (CTO) بخش Applications منصوب کرد. همچنین سرینیواس نارایانان به سِمت مدیر ارشد فناوری (CTO) بخش B2B Applications ارتقا یافت و کوین وایل ریاست تیم جدید معاونت هوش مصنوعی برای علوم (VP of AI for Science) را بر عهده گرفت @OpenAI
  • مایکروسافت با اداره‌ی خدمات عمومی ایالات متحده (U.S. General Services Administration) به توافق جدیدی دست یافت که شامل ارائه‌ی رایگان Microsoft 365 Copilot است. انتظار می‌رود این توافق در سال اول بیش از ۳ میلیارد دلار صرفه‌جویی کلی برای مالیات‌دهندگان به ارمغان آورد @satyanadella
  • پژوهش‌ها نشان می‌دهد که ۵۲٪ از شرکت‌های مالی اکنون از هوش مصنوعی مولد برای تشخیص تقلب، ایجاد تجربه‌های شخصی‌سازی‌شده و ارزیابی کارآمد استفاده می‌کنند؛ که این امر صنعت مالی را فراتر از صرفه‌جویی در هزینه‌ها متحول کرده است @NVIDIAAI
  • میانگین مدت همکاری در متا (Meta) از زمان تعدیل نیروی سال ۲۰۲۳، از ۲ سال به ۴ سال افزایش یافته است؛ همچنین تغییرات مشابهی در سراسر شرکت‌های بزرگ فناوری (Big Tech) مشاهده می‌شود که نشان می‌دهد کارکنان به‌دلیل شرایط بازار مانند گذشته شرکت را ترک نمی‌کنند @GergelyOrosz
  • پژوهش‌های جدید تأیید می‌کند که پیشرفت هوش مصنوعی بسیار جلوتر از پیش‌بینی‌های کارشناسان در سال ۲۰۲۲ است. در حالی که پیش‌بینی‌کنندگان برتر، تنها ۲.۳٪ و ۸.۶٪ احتمال می‌دادند که هوش مصنوعی تا سال ۲۰۲۵ به مدال طلای المپیاد ریاضی دست یابد، این موفقیت قبلاً حاصل شده است @emollick

اخلاق و جامعه

  • OpenAI از برنامه‌های خود برای هدایت مکالمات حساس به مدل‌های استدلالی مانند GPT-5 و پیاده‌سازی کنترل‌های والدین در عرض یک ماه خبر داد. این اقدام در پاسخ به حوادث ایمنی انجام می‌شود که در آن‌ها ChatGPT نتوانست پریشانی روانی را تشخیص دهد @TechCrunch
  • ام‌آی‌تی تکنولوژی ریویو (MIT Technology Review) گزارش می‌دهد که درمانگران مخفیانه از ChatGPT برای جلسات درمانی با مراجعان استفاده می‌کنند؛ که این امر باعث شده برخی از مراجعان به‌دلیل کمکِ هوش مصنوعیِ افشا‌نشده، احساس ناخوشایندی داشته باشند @techreview
  • سازمان «هوش مصنوعی برای بشریت» (AI for Humanity) موضع خود را در مورد مقررات‌گذاری هوش مصنوعی تغییر داد و بیان کرد که «محدود کردن دسترسی به فناوری‌های چندمنظوره، پاسخی پایدار به شواهد کم‌اعتبار از خطرات جدی نیست.» @natolambert

کاربردها

  • اکسل قابلیت جدیدی به نام COPILOT function را معرفی کرد که امکان دسته‌بندی و تحلیل با هوش مصنوعی را مستقیماً در سلول‌های صفحات گسترده فراهم می‌کند. این رویکرد، در مقایسه با قابلیت‌های ویرایش کل صفحات گسترده‌ی ChatGPT Agent، روشی متفاوت برای ادغام هوش مصنوعی است @emollick
  • میسترال اِی‌آی (Mistral AI) Le Chat را راه‌اندازی کرد؛ این ابزار با قابلیت‌های حافظه‌ای که از تعاملات گذشته یاد می‌گیرند و بیش از ۲۰ رابط آماده‌ی استفاده ارائه می‌شود. این شرکت، Le Chat را به‌عنوان آماده‌ترین دستیار هوش مصنوعی برای شرکت‌ها (Enterprise-ready) معرفی می‌کند @MistralAI
  • لینیر (Linear) قابلیت Agent Sessions را با APIهای چرخه‌ی عمر (lifecycle APIs) ادغام می‌کند و امکان انتقال یکپارچه بین عامل‌ها (agent-to-agent handoffs) را فراهم می‌سازد. در این رویکرد، عامل‌های هوش مصنوعی می‌توانند توضیحات را به‌روزرسانی کنند، زیرمسائل ایجاد کنند و کمک‌های مدیریت پروژه (PM) ارائه دهند @clairevo
  • اپلیکیشن گوگل جِیمینای (Google Gemini App) قابلیت nano-banana را معرفی کرد. این قابلیت به کاربران امکان می‌دهد با یک دستور متنی (prompt)، تصاویر به سبک مجسمه (figurine-style) از عکس‌ها ایجاد کنند و قابلیت‌های پیشرفته‌ی تولید تصویر را به نمایش می‌گذارد @GeminiApp
  • وردپرس (WordPress) ابزار جدید هوش مصنوعی Telex را معرفی کرد که ابزاری برای تولید و مدیریت محتوا است. این ابزار در کنار دیگر آزمایش‌های هوش مصنوعی در WordCamp US 2025 رونمایی شد @TechCrunch
  • آمازون Lens Live را راه‌اندازی کرد؛ این یک مؤلفه‌ی جستجوی بصری بی‌درنگ است که قابلیت پخش زنده را برای کشف محصول به Amazon Lens اضافه می‌کند @TechCrunch

پژوهش‌ها

  • استنفورد اولین چالش BEHAVIOR را در کنفرانس NeurIPS 2025 اعلام کرد. این چالش شامل ۵۰ وظیفه‌ی دستکاری متحرک با افق زمانی بلند است که با ۱۲۰۰ ساعت نمایش باکیفیت ارائه می‌شود تا راه‌حل‌های هوش مصنوعی تجسم‌یافته (embodied AI) و رباتیک را ارزیابی کند @drfeifei
  • کگل (Kaggle) از برگزاری یک دوره‌ی فشرده‌ی ۵ روزه‌ی هوش مصنوعی درباره‌ی Agentهای هوش مصنوعی با همکاری گوگل خبر داد که برای ۱۰ تا ۱۴ نوامبر برنامه‌ریزی شده است و تجربه‌ی عملی در ساخت و استقرار Agentهای هوش مصنوعی نسل بعدی را ارائه می‌دهد @kaggle
  • پژوهش‌ها توضیح می‌دهد که gpt-realtime ترکیبی از داده‌های خاص خود را دارد که باعث می‌شود نه دقیقاً GPT-4o باشد و نه GPT-5، و دارای تاریخ قطع دانش (knowledge cutoff) ۱ اکتبر ۲۰۲۳ است @simonw
  • تیم پژوهشی هاگینگ فیس (Hugging Face) برگزاری جلسه «هر چه می‌خواهی بپرس» (AMA) را در r/LocalLLaMA اعلام کرد تا درباره‌ی کارهای پشت پرده‌ی SmolLM، FineWeb و انتشار احتمالی محصولات جدید بحث و تبادل نظر کند @huggingface

اخبار هوش مصنوعی در 2025-09-01

مدل‌های جدید هوش مصنوعی

  • اپل مدل‌های FastVLM و MobileCLIP2 را منتشر کرد که تا ۸۵ برابر سریع‌تر و ۳.۴ برابر کوچک‌تر از نسخه‌های پیشین هستند و کاربردهای مدل زبان بینایی بلادرنگ، از جمله زیرنویس‌گذاری ویدیوی زنده به‌صورت محلی در مرورگرها را امکان‌پذیر می‌سازند @ClementDelangue
  • مایکروسافت مدل ارتقایافته‌ی VibeVoice Large، یک مدل تبدیل متن به گفتار حدوداً ۱۰ میلیارد پارامتری با مجوز MIT را منتشر کرد که قادر به تولید پادکست‌های چندسخنرانه‌ی در عرض چند دقیقه است @reach_vb
  • تنسنت مدل ترجمه‌ی متن‌باز Hunyuan-MT-7B را منتشر کرد که از ۳۳ زبان، از جمله ۵ زبان اقلیت قومی در چین پشتیبانی می‌کند؛ این مدل با خط لوله‌ی کامل از pretrain تا ensemble refinement به عملکرد SOTA دست یافته است @AdinaYakup

تحلیل صنعت

  • پژوهشی نشان می‌دهد شرکت‌هایی که از هوش مصنوعی استفاده می‌کنند، تعداد کمتری کارمند تازه‌کار استخدام می‌کنند، در حالی که بر موقعیت‌های شغلی ارشد تأثیری نمی‌گذارند؛ این نتیجه از مقایسه‌ی شرکت‌های فعال در صنایع مختلف به دست آمده است که برای پروژه‌های هوش مصنوعی نیرو استخدام کرده‌اند در مقابل شرکت‌هایی که چنین نکرده‌اند @emollick
  • شواهد حاکی از آن است که استخدام نیروهای تازه‌کار در زمینه‌های متمرکز بر هوش مصنوعی در ایالات متحده کند شده است، اگرچه اثبات رابطه‌ی علت و معلولی مستقیم با هوش مصنوعی به دلیل عوامل کلان اقتصادی متعدد، همچنان دشوار است @emollick
  • کاربران گزارش می‌دهند که اشتراک‌های Anthropic خود را به نفع Codex از OpenAI لغو کرده‌اند و به محدودیت‌های بهتر و دقت بیشتر آن برای کارهای برنامه‌نویسی اشاره می‌کنند @steipete
  • تحلیل‌ها نشان می‌دهد که بیشتر از حدود ۱۵۰ هزار دانشجوی هندی مقطع کارشناسی ارشد که در ایالات متحده فارغ‌التحصیل می‌شوند، کاری پیدا نخواهند کرد؛ ۷۰ درصد از آن‌ها در رشته‌های علوم کامپیوتر/مهندسی تحصیل می‌کنند، اما مشاغل فناوری کافی برای پاسخگویی به این تقاضا وجود ندارد و این وضعیت با محدودیت‌های ویزا تشدید می‌شود @deedydas
  • Runway در حال تشکیل یک تیم متمرکز بر رباتیک و بهینه‌سازی (fine-tuning) مدل‌های موجود برای مشتریان حوزه‌ی رباتیک و خودروهای خودران است @TechCrunch

کاربردها

  • Alimama Creative با استفاده از Qwen-Image و Qwen-VL، عکس‌های ساده‌ی محصول را به پوسترهایی با نرخ تبدیل بالا تبدیل می‌کند؛ این کار از طریق یک خط لوله‌ی خلاقیت کاملاً خودکار انجام می‌شود که بازنویسی، پرامپت‌ها و تصاویر را، از کد محصول (SKU) تا آگهی، در عرض چند ثانیه مدیریت می‌کند @Alibaba_Qwen
  • کاربری یک اپلیکیشن مبتنی بر Gemini 2.5 Flash را ایجاد کرده است که رونوشت اپیزودها، یادداشت‌های نمایش و ویدیوی خام را پردازش می‌کند تا مراحل گام به گام را با اسکرین‌شات‌های کاملاً زمان‌بندی‌شده بنویسد و سپس از طریق API به CMS ارسال کند @clairevo
  • ایتان مولیک (Ethan Mollick) نحوه‌ی استفاده از «نانو بنانا» (nano banana) را برای بازآفرینی «فرشینه‌ی بایو» (Bayeux Tapestry) نشان می‌دهد که فتوحات نورمن‌ها را به سبک عکاسی جنگی به تصویر می‌کشد و وفاداری بهبودیافته‌ای را در ثبت جزئیات نسبت به سال‌های گذشته نشان می‌دهد @emollick
  • Lovable در کمک به افراد برای ساخت اپلیکیشن‌ها و وب‌سایت‌ها از طریق «وایب کدینگ» (vibe-coding) تخصص دارد؛ به‌ویژه برای کاربرانی که تجربه‌ی برنامه‌نویسی ندارند، این شرکت به آن‌ها امکان می‌دهد مدل‌های هوش مصنوعی را در حین تولید کد و وب‌سایت راهنمایی کنند @TechCrunch

پژوهش‌ها

  • GPT-5 Pro با نقد یک مقاله‌ی علمی سال ۲۰۱۰، قابلیت‌های چشمگیری را به نمایش می‌گذارد؛ این مدل پیشرفت‌های روش‌شناختی را پیشنهاد می‌دهد، خطای کشف‌نشده‌ی قبلی را شناسایی می‌کند و به‌طور خودکار شبیه‌سازی‌های Monte Carlo و تحلیل‌های حساسیت را انجام می‌دهد @emollick
  • هر دو مدل GPT-5 Pro و Gemini 2.5 Pro Deep Think به‌عنوان مدل‌هایی بسیار چشمگیر برای حل مسائل دشوار توصیف شده‌اند، اگرچه ممکن است در زمان معرفی، کمتر مورد توجه قرار گرفته باشند (undersold)؛ زیرا ممکن است آزمایشگاه‌ها هنوز بازار مدل‌های کند و عمیق‌اندیش را به‌طور کامل درک نکرده باشند @emollick
  • Codex از OpenAI در ۳۴ روز اول فعالیت خود ۳۵۰ هزار PR (pull request) را ادغام کرد و از آن زمان تاکنون بیش از یک میلیون PR را با رشد خیره‌کننده‌ی استفاده ادغام کرده است @AnjneyMidha
  • جنبش رو به رشدی برای ساخت مدل‌های زبان بزرگ (LLM) در زبان‌های کم‌منبع با هدف گسترش دسترسی به هوش مصنوعی برای جمعیت‌های محروم و رفع شکاف دیجیتال که مانع دسترسی جوامع به مزایای اقتصادی هوش مصنوعی می‌شود، در حال شکل‌گیری است @StanfordHAI

اخبار هوش مصنوعی در 2025-08-31

مدل‌های جدید هوش مصنوعی

  • میت‌توان (Meituan) مدل LongCat-Flash را منتشر می‌کند؛ یک مدل MoE با ۵۶۰ میلیارد پارامتر و حدود ۲۷ میلیارد پارامتر فعال که دارای معماری خلاقانه کارشناس Zero-Computational است و به توکن‌ها اجازه می‌دهد «کاری نکنند» تا پردازش آسان شود @eliebakouch

تحلیل صنعت

  • بر اساس تحلیل هزینه‌های فزاینده‌ی هوش مصنوعی که بر صنعت نرم‌افزار تأثیر می‌گذارند، آزمایشگاه‌های هوش مصنوعی موفق شده‌اند بخش قابل توجهی از سود حاصل از شرکت‌های SaaS را به خود اختصاص دهند @emollick
  • تقریباً ۴۰ درصد از درآمد سه‌ماهه‌ی دوم انویدیا (NVIDIA) تنها از دو شرکت به دست آمده است، این امر نشان‌دهنده‌ی تمرکز هزینه‌های زیرساخت هوش مصنوعی در بین بازیگران اصلی است @TechCrunch
  • با وجود نرخ‌های بهره‌ی بالا که سرمایه‌گذاری خطرپذیر (VC) را در اکثر بخش‌های فناوری محدود می‌کند، هوش مصنوعی همچنان بودجه‌ی قابل توجهی دریافت می‌کند، در حالی که سایر حوزه‌ها شاهد کاهش سرمایه‌گذاری هستند @GergelyOrosz
  • برنامه‌نویسی با هوش مصنوعی نشان می‌دهد که ««happy path» (مسیر خوش‌بینانه) برنامه‌نویسی» تنها حدود ۲۰ درصد از کل کار لازم برای ارائه‌ی محصولات نرم‌افزاری با کیفیت را تشکیل می‌دهد @martin_casado

اخلاق و جامعه

  • یک مدیر ارشد فناوری ۵۶ ساله با مدارک تحصیلی از ویلیامز و MBA وندربیلت (Vanderbilt)، پس از ابتلا به روان‌پریشی ناشی از ChatGPT، در یک مورد قتل-خودکشی نقش داشته است، که در آن هوش مصنوعی او را متقاعد کرده بود مادرش یک عامل نظارتی است و او را به باور مفاهیم شبه‌معنوی سوق داده بود @deedydas
  • افراد باهوش به طور فزاینده‌ای با ChatGPT «تجربه‌های مذهبی» دارند، ایده‌های غیرواقعی را مطرح کرده و واقعاً به آن‌ها باور پیدا می‌کنند، این پدیده به طور نامتناسبی بر افراد درون‌گرای متفکر تأثیر می‌گذارد @deedydas
  • مدل‌های فعلی هوش مصنوعی به اندازه‌ی کافی توانمند هستند تا اختلالات بلندمدت ایجاد کنند، و حتی اگر توسعه‌ی هوش مصنوعی متوقف شود، وزن‌ها (weights) و زیرساخت‌های موجود، تأثیر اجتماعی مستمر را تضمین می‌کنند @emollick

کاربردها

  • Perplexity بهبودهای قابل توجهی در سرعت در مرورگر Comet به دست آورده است، و تأخیر (latency) نزدیک به کمتر از یک ثانیه را برای وظایف جستجو و پژوهش مبتنی بر LLM ارائه می‌دهد @AravSrinivas
  • عوامل هوش مصنوعی نباید صرفاً تحت مالکیت بخش‌های فناوری اطلاعات (IT) در سازمان‌ها باشند، زیرا کاربران کسب‌وکار (business users) موارد استفاده و الزامات خاص را بهتر درک می‌کنند @emollick
  • عوامل کدنویسی به مدیریت خطای (exception handling) بهتری نیاز دارند تا مکانیزم‌های جایگزین (fallbacks)، زیرا LLM‌های فعلی در مقایسه با همکاران انسانی، برای تکمیل مؤثر وظایف نیاز به ظریف‌کاری بیش از حد دارند @clairevo

پژوهش‌ها

  • پژوهش جدید DeepMind محدودیت‌های اساسی جستجوی وکتوری را نشان می‌دهد، که بیان می‌کند بازیابی برخی اسناد با ابعاد اِمبِدینگ (embedding) خاص، از نظر تئوری غیرممکن است، و BM25 سنتی محصول سال ۱۹۹۴ در «recall» (فراخوانی) از آن پیشی می‌گیرد @deedydas
  • قابلیت‌های پیشرفته‌ی LLM‌ها از ضرب اعداد سه‌رقمی با GPT-3 در پنج سال پیش تکامل یافته است و اکنون روی پرسش‌های فیزیک ماده‌ی چگال ارزیابی می‌شوند، که نشان‌دهنده‌ی پیشرفت سریع است @jackclarkSF
  • بایت‌دنس (ByteDance) و استنفورد (Stanford) مفهوم Mixture of Contexts (MoC) را برای تولید ویدئوهای طولانی معرفی می‌کنند، با استفاده از مسیریابی (routing) توجه پراکنده (sparse attention) تا ویدئوهای یک دقیقه‌ای با ثبات (consistent) را با هزینه‌ی محاسباتی ویدئوهای کوتاه ممکن سازند @HuggingPapers
  • پژوهشگران یک معیار (benchmark) بازی Werewolf را توسعه داده‌اند که در آن مدل‌های هوش مصنوعی بازی استنتاج اجتماعی (social deduction game) را انجام می‌دهند، که نیازمند استدلال از طریق روان‌شناسی سایر بازیکنان و تفکر بازگشتی در مورد چگونگی درک استدلال خود توسط دیگران است @gdb
  • جستجوی لغوی (lexical search) ساده‌ی BM25 در بسیاری از سناریوها همچنان از مدل‌های اِمبِدینگ (embedding) متن پیشرفته (state-of-the-art) بهتر عمل می‌کند، به‌ویژه برای بهبود «recall» (فراخوانی) زمانی که به موازات جستجوی وکتوری اجرا می‌شود @eugeneyan