اخبار هوش مصنوعی در 2025-09-01

مدل‌های جدید هوش مصنوعی

  • اپل مدل‌های FastVLM و MobileCLIP2 را منتشر کرد که تا ۸۵ برابر سریع‌تر و ۳.۴ برابر کوچک‌تر از نسخه‌های پیشین هستند و کاربردهای مدل زبان بینایی بلادرنگ، از جمله زیرنویس‌گذاری ویدیوی زنده به‌صورت محلی در مرورگرها را امکان‌پذیر می‌سازند @ClementDelangue
  • مایکروسافت مدل ارتقایافته‌ی VibeVoice Large، یک مدل تبدیل متن به گفتار حدوداً ۱۰ میلیارد پارامتری با مجوز MIT را منتشر کرد که قادر به تولید پادکست‌های چندسخنرانه‌ی در عرض چند دقیقه است @reach_vb
  • تنسنت مدل ترجمه‌ی متن‌باز Hunyuan-MT-7B را منتشر کرد که از ۳۳ زبان، از جمله ۵ زبان اقلیت قومی در چین پشتیبانی می‌کند؛ این مدل با خط لوله‌ی کامل از pretrain تا ensemble refinement به عملکرد SOTA دست یافته است @AdinaYakup

تحلیل صنعت

  • پژوهشی نشان می‌دهد شرکت‌هایی که از هوش مصنوعی استفاده می‌کنند، تعداد کمتری کارمند تازه‌کار استخدام می‌کنند، در حالی که بر موقعیت‌های شغلی ارشد تأثیری نمی‌گذارند؛ این نتیجه از مقایسه‌ی شرکت‌های فعال در صنایع مختلف به دست آمده است که برای پروژه‌های هوش مصنوعی نیرو استخدام کرده‌اند در مقابل شرکت‌هایی که چنین نکرده‌اند @emollick
  • شواهد حاکی از آن است که استخدام نیروهای تازه‌کار در زمینه‌های متمرکز بر هوش مصنوعی در ایالات متحده کند شده است، اگرچه اثبات رابطه‌ی علت و معلولی مستقیم با هوش مصنوعی به دلیل عوامل کلان اقتصادی متعدد، همچنان دشوار است @emollick
  • کاربران گزارش می‌دهند که اشتراک‌های Anthropic خود را به نفع Codex از OpenAI لغو کرده‌اند و به محدودیت‌های بهتر و دقت بیشتر آن برای کارهای برنامه‌نویسی اشاره می‌کنند @steipete
  • تحلیل‌ها نشان می‌دهد که بیشتر از حدود ۱۵۰ هزار دانشجوی هندی مقطع کارشناسی ارشد که در ایالات متحده فارغ‌التحصیل می‌شوند، کاری پیدا نخواهند کرد؛ ۷۰ درصد از آن‌ها در رشته‌های علوم کامپیوتر/مهندسی تحصیل می‌کنند، اما مشاغل فناوری کافی برای پاسخگویی به این تقاضا وجود ندارد و این وضعیت با محدودیت‌های ویزا تشدید می‌شود @deedydas
  • Runway در حال تشکیل یک تیم متمرکز بر رباتیک و بهینه‌سازی (fine-tuning) مدل‌های موجود برای مشتریان حوزه‌ی رباتیک و خودروهای خودران است @TechCrunch

کاربردها

  • Alimama Creative با استفاده از Qwen-Image و Qwen-VL، عکس‌های ساده‌ی محصول را به پوسترهایی با نرخ تبدیل بالا تبدیل می‌کند؛ این کار از طریق یک خط لوله‌ی خلاقیت کاملاً خودکار انجام می‌شود که بازنویسی، پرامپت‌ها و تصاویر را، از کد محصول (SKU) تا آگهی، در عرض چند ثانیه مدیریت می‌کند @Alibaba_Qwen
  • کاربری یک اپلیکیشن مبتنی بر Gemini 2.5 Flash را ایجاد کرده است که رونوشت اپیزودها، یادداشت‌های نمایش و ویدیوی خام را پردازش می‌کند تا مراحل گام به گام را با اسکرین‌شات‌های کاملاً زمان‌بندی‌شده بنویسد و سپس از طریق API به CMS ارسال کند @clairevo
  • ایتان مولیک (Ethan Mollick) نحوه‌ی استفاده از «نانو بنانا» (nano banana) را برای بازآفرینی «فرشینه‌ی بایو» (Bayeux Tapestry) نشان می‌دهد که فتوحات نورمن‌ها را به سبک عکاسی جنگی به تصویر می‌کشد و وفاداری بهبودیافته‌ای را در ثبت جزئیات نسبت به سال‌های گذشته نشان می‌دهد @emollick
  • Lovable در کمک به افراد برای ساخت اپلیکیشن‌ها و وب‌سایت‌ها از طریق «وایب کدینگ» (vibe-coding) تخصص دارد؛ به‌ویژه برای کاربرانی که تجربه‌ی برنامه‌نویسی ندارند، این شرکت به آن‌ها امکان می‌دهد مدل‌های هوش مصنوعی را در حین تولید کد و وب‌سایت راهنمایی کنند @TechCrunch

پژوهش‌ها

  • GPT-5 Pro با نقد یک مقاله‌ی علمی سال ۲۰۱۰، قابلیت‌های چشمگیری را به نمایش می‌گذارد؛ این مدل پیشرفت‌های روش‌شناختی را پیشنهاد می‌دهد، خطای کشف‌نشده‌ی قبلی را شناسایی می‌کند و به‌طور خودکار شبیه‌سازی‌های Monte Carlo و تحلیل‌های حساسیت را انجام می‌دهد @emollick
  • هر دو مدل GPT-5 Pro و Gemini 2.5 Pro Deep Think به‌عنوان مدل‌هایی بسیار چشمگیر برای حل مسائل دشوار توصیف شده‌اند، اگرچه ممکن است در زمان معرفی، کمتر مورد توجه قرار گرفته باشند (undersold)؛ زیرا ممکن است آزمایشگاه‌ها هنوز بازار مدل‌های کند و عمیق‌اندیش را به‌طور کامل درک نکرده باشند @emollick
  • Codex از OpenAI در ۳۴ روز اول فعالیت خود ۳۵۰ هزار PR (pull request) را ادغام کرد و از آن زمان تاکنون بیش از یک میلیون PR را با رشد خیره‌کننده‌ی استفاده ادغام کرده است @AnjneyMidha
  • جنبش رو به رشدی برای ساخت مدل‌های زبان بزرگ (LLM) در زبان‌های کم‌منبع با هدف گسترش دسترسی به هوش مصنوعی برای جمعیت‌های محروم و رفع شکاف دیجیتال که مانع دسترسی جوامع به مزایای اقتصادی هوش مصنوعی می‌شود، در حال شکل‌گیری است @StanfordHAI

اخبار هوش مصنوعی در 2025-08-31

مدل‌های جدید هوش مصنوعی

  • میت‌توان (Meituan) مدل LongCat-Flash را منتشر می‌کند؛ یک مدل MoE با ۵۶۰ میلیارد پارامتر و حدود ۲۷ میلیارد پارامتر فعال که دارای معماری خلاقانه کارشناس Zero-Computational است و به توکن‌ها اجازه می‌دهد «کاری نکنند» تا پردازش آسان شود @eliebakouch

تحلیل صنعت

  • بر اساس تحلیل هزینه‌های فزاینده‌ی هوش مصنوعی که بر صنعت نرم‌افزار تأثیر می‌گذارند، آزمایشگاه‌های هوش مصنوعی موفق شده‌اند بخش قابل توجهی از سود حاصل از شرکت‌های SaaS را به خود اختصاص دهند @emollick
  • تقریباً ۴۰ درصد از درآمد سه‌ماهه‌ی دوم انویدیا (NVIDIA) تنها از دو شرکت به دست آمده است، این امر نشان‌دهنده‌ی تمرکز هزینه‌های زیرساخت هوش مصنوعی در بین بازیگران اصلی است @TechCrunch
  • با وجود نرخ‌های بهره‌ی بالا که سرمایه‌گذاری خطرپذیر (VC) را در اکثر بخش‌های فناوری محدود می‌کند، هوش مصنوعی همچنان بودجه‌ی قابل توجهی دریافت می‌کند، در حالی که سایر حوزه‌ها شاهد کاهش سرمایه‌گذاری هستند @GergelyOrosz
  • برنامه‌نویسی با هوش مصنوعی نشان می‌دهد که ««happy path» (مسیر خوش‌بینانه) برنامه‌نویسی» تنها حدود ۲۰ درصد از کل کار لازم برای ارائه‌ی محصولات نرم‌افزاری با کیفیت را تشکیل می‌دهد @martin_casado

اخلاق و جامعه

  • یک مدیر ارشد فناوری ۵۶ ساله با مدارک تحصیلی از ویلیامز و MBA وندربیلت (Vanderbilt)، پس از ابتلا به روان‌پریشی ناشی از ChatGPT، در یک مورد قتل-خودکشی نقش داشته است، که در آن هوش مصنوعی او را متقاعد کرده بود مادرش یک عامل نظارتی است و او را به باور مفاهیم شبه‌معنوی سوق داده بود @deedydas
  • افراد باهوش به طور فزاینده‌ای با ChatGPT «تجربه‌های مذهبی» دارند، ایده‌های غیرواقعی را مطرح کرده و واقعاً به آن‌ها باور پیدا می‌کنند، این پدیده به طور نامتناسبی بر افراد درون‌گرای متفکر تأثیر می‌گذارد @deedydas
  • مدل‌های فعلی هوش مصنوعی به اندازه‌ی کافی توانمند هستند تا اختلالات بلندمدت ایجاد کنند، و حتی اگر توسعه‌ی هوش مصنوعی متوقف شود، وزن‌ها (weights) و زیرساخت‌های موجود، تأثیر اجتماعی مستمر را تضمین می‌کنند @emollick

کاربردها

  • Perplexity بهبودهای قابل توجهی در سرعت در مرورگر Comet به دست آورده است، و تأخیر (latency) نزدیک به کمتر از یک ثانیه را برای وظایف جستجو و پژوهش مبتنی بر LLM ارائه می‌دهد @AravSrinivas
  • عوامل هوش مصنوعی نباید صرفاً تحت مالکیت بخش‌های فناوری اطلاعات (IT) در سازمان‌ها باشند، زیرا کاربران کسب‌وکار (business users) موارد استفاده و الزامات خاص را بهتر درک می‌کنند @emollick
  • عوامل کدنویسی به مدیریت خطای (exception handling) بهتری نیاز دارند تا مکانیزم‌های جایگزین (fallbacks)، زیرا LLM‌های فعلی در مقایسه با همکاران انسانی، برای تکمیل مؤثر وظایف نیاز به ظریف‌کاری بیش از حد دارند @clairevo

پژوهش‌ها

  • پژوهش جدید DeepMind محدودیت‌های اساسی جستجوی وکتوری را نشان می‌دهد، که بیان می‌کند بازیابی برخی اسناد با ابعاد اِمبِدینگ (embedding) خاص، از نظر تئوری غیرممکن است، و BM25 سنتی محصول سال ۱۹۹۴ در «recall» (فراخوانی) از آن پیشی می‌گیرد @deedydas
  • قابلیت‌های پیشرفته‌ی LLM‌ها از ضرب اعداد سه‌رقمی با GPT-3 در پنج سال پیش تکامل یافته است و اکنون روی پرسش‌های فیزیک ماده‌ی چگال ارزیابی می‌شوند، که نشان‌دهنده‌ی پیشرفت سریع است @jackclarkSF
  • بایت‌دنس (ByteDance) و استنفورد (Stanford) مفهوم Mixture of Contexts (MoC) را برای تولید ویدئوهای طولانی معرفی می‌کنند، با استفاده از مسیریابی (routing) توجه پراکنده (sparse attention) تا ویدئوهای یک دقیقه‌ای با ثبات (consistent) را با هزینه‌ی محاسباتی ویدئوهای کوتاه ممکن سازند @HuggingPapers
  • پژوهشگران یک معیار (benchmark) بازی Werewolf را توسعه داده‌اند که در آن مدل‌های هوش مصنوعی بازی استنتاج اجتماعی (social deduction game) را انجام می‌دهند، که نیازمند استدلال از طریق روان‌شناسی سایر بازیکنان و تفکر بازگشتی در مورد چگونگی درک استدلال خود توسط دیگران است @gdb
  • جستجوی لغوی (lexical search) ساده‌ی BM25 در بسیاری از سناریوها همچنان از مدل‌های اِمبِدینگ (embedding) متن پیشرفته (state-of-the-art) بهتر عمل می‌کند، به‌ویژه برای بهبود «recall» (فراخوانی) زمانی که به موازات جستجوی وکتوری اجرا می‌شود @eugeneyan

اخبار هوش مصنوعی در 2025-08-30

مدل‌های جدید هوش مصنوعی

  • گوگل از Gemini 2.5 Flash Image (با نام مستعار «نانو») با بهبودهای قابل‌توجهی رونمایی کرد، در کنار ویژگی‌های جدید در گوگل ترنسلیت، شامل ترجمه‌ی زنده‌ی بیش از ۷۰ زبان و قابلیت‌های تمرین زبان. @sundarpichai
  • NotebookLM اکنون از خلاصه‌های ویدیویی در ۸۰ زبان و خلاصه‌های صوتی بهبودیافته در زبان‌های غیرانگلیسی پشتیبانی می‌کند. @sundarpichai
  • Flowی گوگل اکنون برای همگان در دسترس است تا با ۱۰۰ اعتبار رایگان در ماه آن را امتحان کنند. @sundarpichai

تحلیل صنعت

  • متا به شدت در خدمات آموزش هوش مصنوعی خارجی سرمایه‌گذاری می‌کند و با وجود سرمایه‌گذاری ۱۴.۳ میلیارد دلاری در شرکت Scale AI دو ماه قبل، همچنان به رقبایی مانند آن متکی است. @TechCrunch
  • تاکو بل سیستم سفارش‌گیری با هوش مصنوعی صوتی را در بیش از ۵۰۰ شعبه‌ی درایو-ترو خود مستقر کرده است، هرچند چالش‌های پیاده‌سازی منجر به لحظات وایرالی شده است که در آن‌ها مشتریان تلاش می‌کنند سیستم هوش مصنوعی را دور بزنند. @TechCrunch
  • عامل‌های هوش مصنوعی در حال تبدیل‌شدن به ابزارهای تجاری کاربردی هستند؛ به‌طوری‌که یک کاربر استفاده‌ی منظم از تقریباً ۵ عامل هوش مصنوعی را گزارش داده است که ساعت‌های زیادی و بیش از ۱۰,۰۰۰ دلار صرفه‌جویی می‌کند. این عامل‌ها شامل دستیارهای اجرایی، تولید محتوا، پژوهش و ارتباطات خودکار می‌شوند. @deedydas
  • اوپن‌ای‌آی فعالانه در حال استخدام کارکنان فنی برای ساخت ارزیابی‌های پیشرفته در حوزه‌ی مالی است و به دنبال کاندیداهایی با سوابق بانکی، سرمایه‌گذاری یا فنی می‌گردد. @michelelwang

اخلاق و جامعه

  • بر اساس گزارش‌ها، متا در حال پرداخت بسته‌های جبرانی ۱۰۰ میلیون دلاری برای ساخت چت‌بات‌های هوش مصنوعی از افراد مشهور است، از جمله چت‌بات‌های بزرگسال که تصاویر نامناسب فوتورئالیستی تولید می‌کنند و این امر باعث نگرانی در میان پژوهشگران هوش مصنوعی شده است. @deedydas
  • آزمایشگاه‌های هوش مصنوعی با چالش‌های ارتباطی در مورد قابلیت‌های مدل مواجه هستند، با ادعاهای نادرست مکرر مبنی بر «ضعیف‌شدن» مدل‌ها که فراتر از انتظار عمل می‌کنند و نیازمند استراتژی‌های ارتباطی شفاف‌تری هستند. @aidan_mclau
  • هوش مصنوعی برای بهبود مراقبت‌های بهداشتی با افزایش اختیار بیماران و ارتقای کیفیت مراقبت استفاده می‌شود؛ با مثال‌های خاصی از چت‌بات‌ها که به بیماران در تصمیم‌گیری‌های پزشکی کمک می‌کنند. @DShaywitz
  • هوش مصنوعی با کمک به معلمان برای کاهش کارهای اداری و افزایش زمان اختصاصی با دانش‌آموزان، در حال تغییر آموزش است، که این امر به میانگین فعلی تنها ۲۲ ثانیه‌ی توجه فردی به هر دانش‌آموز در روز رسیدگی می‌کند. @reidhoffman

کاربردها

  • جی‌پی‌تی-۵ قابلیت‌های کدنویسی فوق‌العاده‌ای را نشان می‌دهد، به‌ویژه هنگامی که با تکنیک‌های پرامپتینگ (فرمان‌دهی) مناسب و ادغام با محیط‌های توسعه‌ای مانند Xcode استفاده شود. @gdb
  • مدل‌های پیشرفته‌ی هوش مصنوعی اکنون می‌توانند تجربه‌های تعاملی پیچیده ایجاد کنند، همانطور که توسط مدل‌های مختلف در ساخت سیستم‌های CAPTCHA پیچیده و کاربردی با سطوح دشواری متعدد نشان داده شده است. @emollick
  • مدل‌های هوش مصنوعی در حال توانمندتر شدن برای مدیریت فرمت‌های ورودی پیچیده هستند، تا جایی که مردم اکنون فرض می‌کنند هوش مصنوعی می‌تواند داده‌های پیچیده مانند URLها را به دقت کلمه‌به‌کلمه تکرار کند. @alexgraveley

پژوهش‌ها

  • پیشرفت از جی‌پی‌تی-۴ به جی‌پی‌تی-۵ یک جهش قابل مقایسه با جهش از جی‌پی‌تی-۳ اولیه به جی‌پی‌تی-۴ را نشان می‌دهد، اگرچه نسخه‌های موقت مانند o3 باعث شد تا انتقال نهایی تدریجی‌تر به نظر برسد. @emollick
  • توسعه‌ی هوش مصنوعی پیشرفت مداوم و ثابتی را نشان می‌دهد، بدون جهش‌های بزرگ یا موانع، که بیانگر پیشرفت پایدار در سراسر این حوزه است. @emollick
  • با منابع محاسباتی کافی، رویکردهای مختلف هوش مصنوعی شروع به همگرایی می‌کنند، و محاسبات به عنوان «عامل بزرگ برابرکننده» در روش‌های مختلف عمل می‌کند. @fchollet
  • با وجود اینکه انسان‌ها ۵۰,۰۰۰ تا ۱۰۰,۰۰۰ سال است که سطح فعلی هوش سیال را دارند، عملیاتی‌کردن و استقرار هوش عمومی بسیار بیشتر از آنچه معمولاً تصور می‌شود طول می‌کشد، همانطور که با رسیدن به ماه تنها ۵۶ سال پیش اثبات شد. @fchollet

اخبار هوش مصنوعی در 2025-08-29

مدل‌های جدید هوش مصنوعی

  • Perplexity از گسترش لیست انتظار Comet با افزایش دعوتنامه‌های روزانه از فردا، به دلیل تقاضای زیاد، خبر می‌دهد @AravSrinivas
  • گوگل به‌روزرسانی تولید و ویرایش تصویر nano banana را در اپلیکیشن Gemini منتشر می‌کند، رکوردهای جدیدی را در میزان استفاده به ثبت می‌رساند و کاربردهای خلاقانه‌ای مانند ترمیم عکس، انتقال سبک (style transfer) و امتحان مجازی لباس (virtual try-ons) را ممکن می‌سازد @GeminiApp
  • اپل مدل‌های FastVLM و MobileCLIP2 را در Hugging Face منتشر می‌کند که تا 85 برابر عملکرد سریع‌تر و 3.4 برابر اندازه کوچک‌تری نسبت به کارهای قبلی ارائه می‌دهند و کاربردهای VLM بلادرنگ، از جمله زیرنویس‌گذاری ویدیوی زنده در مرورگرها را امکان‌پذیر می‌سازند @xenovacom
  • xAI مدل grok-code-fast-1 را منتشر می‌کند که پیشرفت‌های چشمگیری را در وظایف کدنویسی نشان می‌دهد، به‌طوری که کاربران گزارش می‌دهند عملکرد آن 10 برابر بهتر از نسخه‌های قبلی است و 87 TPS در مقابل 60 TPS در مقایسه با رقبا ارائه می‌دهد @cline

تحلیل صنعت

  • ایلان ماسک از یک مهندس به اتهام بردن اسرار به OpenAI شکایت می‌کند، که اولین دعوای حقوقی از این دست است که افراد بین آزمایشگاه‌های هوش مصنوعی جابه‌جا می‌شوند، با ادعاهایی شامل «فناوری‌های پیشرفته‌ی هوش مصنوعی با ویژگی‌هایی برتر از آنچه ChatGPT ارائه می‌دهد» @AndrewCurran_
  • جوآن جانگ از سِمَت رهبری رفتار مدل در OpenAI کناره‌گیری می‌کند تا کار جدیدی را در این شرکت آغاز کند، پس از اینکه تیم و حوزه‌ی رفتار مدل را طی دو سال گذشته ایجاد کرد @joannejang
  • شرکت Reliance یک زیرمجموعه‌ی جدید را راه‌اندازی می‌کند تا جاه‌طلبی‌های هند در حوزه‌ی هوش مصنوعی را پیش ببرد، از جمله یک همکاری در دست اقدام با OpenAI @TechCrunch
  • Anthropic تغییرات عمده‌ای در نحوه‌ی رسیدگی به داده‌های کاربران اعمال می‌کند و کاربران تا 28 سپتامبر برای انجام اقدامات لازم فرصت دارند @TechCrunch

اخلاق و جامعه

  • پژوهش آزمایشگاه رسانه‌ی MIT نشان می‌دهد که ابزارهای هوش مصنوعی می‌توانند خاطرات کاذب را القا کنند و کاربران را به یادآوری نادرست رویدادهای گذشته سوق دهند، که این امر نگرانی‌هایی را در مورد تأثیر روانی تعاملات هوش مصنوعی ایجاد می‌کند @medialab
  • متا سیاست‌های چت‌بات هوش مصنوعی خود را به‌روزرسانی می‌کند تا از تعامل با کاربران نوجوان در مورد موضوعات حساس، از جمله خودآزاری، اختلالات خوردن و مکالمات عاشقانه نامناسب، جلوگیری کند؛ این اقدام پس از بررسی دقیق تدابیر حفاظتی موجود صورت می‌گیرد @TechCrunch
  • آماندا اسکل پیشنهاد می‌کند که کودکان از اتصال شناسه‌ی دولتی‌شان به فعالیت‌های آنلاین بزرگسالی‌شان برای همیشه محافظت شوند و یک قانون ایمنی آنلاین کودکان را پیشنهاد می‌کند @AmandaAskell

کاربردها

  • ایتان مولیک نشان می‌دهد که چگونه می‌توان از LLM‌های مدرن متصل به وب به‌عنوان بررسی‌کنندگان اولیه‌ی واقعیت استفاده کرد، با استفاده از پیام «این را برای دقت بررسی کن، هر واقعیتی را که می‌خواهی به چالش بکشی یا کشف کنی، جستجو کن» @emollick
  • کاربران اپلیکیشن Google Gemini کاربردهای خلاقانه‌ی nano banana را به نمایش می‌گذارند، از جمله ساخت کمیک، ترمیم عکس، بصری‌سازی بازسازی خانه و برنامه‌ریزی وعده‌های غذایی با ترکیب تصاویر مواد اولیه @GeminiApp
  • Microsoft Copilot قابلیت ساخت مدل سه‌بعدی از آپلود تک‌تصویر را با قابلیت «یک کلیک» معرفی می‌کند @Copilot
  • NVIDIA AI Enterprise به Amway کمک می‌کند تا 40 درصد افزایش در کارایی استنتاج (inference efficiency) داشته باشد و زمان استقرار را بیش از نصف کاهش دهد، همچنین 99.9 درصد از داده‌های حساس با استفاده از NVIDIA NeMo Guardrails مسدود شود @NVIDIAAI

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهند که مدل‌های جاسازی تک‌برداری (single-vector embedding models) دارای محدودیت‌های اساسی هستند که با افزایش اندازه‌ی بُعد (dimension size) قابل حل نیستند، در حالی که مدل‌های چندبرداری (multi-vector models) مانند ColBERT، با وجود استفاده از تنها 130 میلیون پارامتر، عملکردی به‌مراتب بهتر از مدل‌های تک‌برداری با 8 میلیارد پارامتر و بیشتر ارائه می‌دهند @lateinteraction
  • مطالعه‌ی ارزیابی عامل‌های هوش مصنوعی (AI agents) ضعف‌های چشمگیری را در توانایی‌های استدلال فضایی (spatial reasoning) و بازی در مدل‌های اصلی نشان می‌دهد؛ به‌طوری که GPT-5 پانزده ساعت را صرف بازی Minesweeper کرد بدون اینکه حتی یک بار برنده شود، در حالی که o3 به‌جای بازی، به دنبال یک «ماتریس محیطی» (environment matrix) غیرموجود می‌گشت @peterwildeford
  • آرویند نارایانان استدلال می‌کند که حوزه‌های پژوهشی هوش مصنوعی در چرخه‌های «کاوش/استفاده» (explore/exploit) پیشرفت می‌کنند، با این حال جامعه‌ی پژوهشی در فازهای «استفاده» خوب عمل می‌کند اما در فازهای «کاوش» با چالش مواجه است و در «مینیمم‌های محلی» (local minima) گیر می‌کند؛ او پیشنهاد می‌کند که پیشرفت به سمت AGI (هوش عمومی مصنوعی) نیازمند زیرجوامع (sub-communities) قوی با معیارهای پیشرفت متفاوت است @random_walker
  • کالیفرنیا 10 میلیون دلار هزینه می‌کند تا آزمایش کند که آیا LLMها می‌توانند گزارش‌های تخلفات پلیس را که برای انسان‌ها بیش از 35 سال زمان می‌برد، پردازش کنند؛ که این امر تضاد بین الزامات دقت در حوزه‌های پرخطر و صرفه‌ی اقتصادی را برجسته می‌کند @hugobowne

اخبار هوش مصنوعی در 2025-08-28

مدل‌های جدید هوش مصنوعی

  • مایکروسافت MAI-1-preview، اولین مدل بنیادی‌اش را که به صورت درون‌سازمانی و جامع (end-to-end) آموزش دیده است، منتشر کرد. این مدل اکنون در حال آزمایش عمومی در LMArena است @mustafasuleyman
  • مایکروسافت MAI-Voice-1 را معرفی کرد؛ مدلی که گویاترین و طبیعی‌ترین مدل تولید صدای آن‌ها توصیف شده و می‌تواند یک دقیقه صدا را در کمتر از ۱ ثانیه با یک GPU تولید کند @mustafasuleyman
  • xAI، Grok Code Fast 1 را راه‌اندازی کرد؛ یک مدل استدلالی سریع و اقتصادی که در کدنویسی عامل‌محور (agentic coding) برتری دارد و به مدت ۷ روز به صورت رایگان در GitHub Copilot، Cursor و سایر پلتفرم‌ها در دسترس است @xai
  • OpenAI، gpt-realtime را معرفی کرد؛ بهترین مدل تبدیل گفتار به گفتار آن‌ها برای توسعه‌دهندگان، که Realtime API آن به طور رسمی از حالت بتا خارج شده و آماده برای عامل‌های صوتی تولیدی است @OpenAI
  • Cohere، Command A Translate را منتشر کرد؛ یک مدل پیشرفته که برای وظایف ترجمه‌ی باکیفیت بالا طراحی شده و از تمامی مدل‌های دیگر در کیفیت ترجمه پیشی می‌گیرد @cohere
  • آزمایشگاه هوش مصنوعی Tencent، HunyuanVideo-Foley را منتشر کرد؛ یک چارچوب جامع (end-to-end) تبدیل متن-ویدئو به صدا برای تولید صدای باکیفیت بالا که با استفاده از یک مجموعه‌داده‌ی چندوجهی (multimodal) عظیم ۱۰۰ هزار ساعته آموزش دیده است @TencentHunyuan

تحلیل صنعت

  • اندرو نگ، عامل‌های موازی (parallel agents) را به عنوان یک جهت‌گیری مهم و نوظهور برای مقیاس‌پذیری هوش مصنوعی شناسایی کرده است که راهی برای بهبود نتایج بدون منتظر نگه‌داشتن بیشتر کاربران ارائه می‌دهد، چرا که قیمت LLM به ازای هر توکن همچنان رو به کاهش است @AndrewYNg
  • پاول گراهام استدلال می‌کند که افرادی که در برنامه‌نویسی ماهر هستند، از هوش مصنوعی برای گرفتن مشاغل از کسانی که در آن متوسط هستند، استفاده خواهند کرد و تأکید می‌کند که انگیزه‌ی ساختن چیزها، بیش از صرفاً مهارت فنی اهمیت دارد @paulg
  • کاری سارینن گزارش می‌دهد که ۴۵٪ از مشتریان سازمانی، عامل‌های هوش مصنوعی Cursor را در Linear ظرف یک هفته پس از راه‌اندازی فعال کرده‌اند که نشان‌دهنده‌ی پذیرش سریع عامل‌های هوش مصنوعی در تیم‌های محصول است @karrisaarinen
  • Liquid AI بیش از یک میلیون دانلود مدل بنیادی را از طریق Hugging Face به دست آورد که نشان‌دهنده‌ی علاقه‌ی جامعه به مدل‌های کوچک طراحی‌شده بر اساس اصول اولیه است @ramin_m_h
  • Framer ۱۰۰ میلیون دلار در سری D با ارزش‌گذاری ۲ میلیارد دلار جذب سرمایه کرد و ادعا می‌کند که بیش از نیم میلیون کاربر فعال ماهانه برای سازنده‌ی وب‌سایت بدون کد (no-code) خود دارد @TechCrunch

اخلاق و جامعه

  • هیدی خلاف از مؤسسه‌ی AI Now در لیست ۱۰۰ AI مجله‌ی TIME به دلیل پرداختن به بازنگری ایمنی هوش مصنوعی در زمینه‌های دفاعی و حیاتی از نظر ایمنی، جایی که ایمنی با مسئولیت‌پذیری کم، پنهان شده است، شناخته شده است @HeidyKhlaaf
  • همل حسین گزارش می‌دهد که مشکلات کیفیت قابل توجهی را با GPT-5 در API تجربه کرده است، از جمله اشتباهات تایپی عجیب، خطاهای نگارشی و پاسخ‌های بی‌معنی که در طول هفته تشدید شده‌اند @clairevo
  • آرویند نارایانان مشاهده می‌کند که مدل‌های توانمندتر لزوماً به معنای محصولات مفیدتر نیستند و به تصمیم Anthropic برای آموزش بر روی داده‌های کاربر، پس از مقاومت طولانی‌مدت، اشاره می‌کند @random_walker

کاربردها

  • یوجین یان یک سیستم توصیه‌گر دوزبانه را نمایش می‌دهد که قابلیت‌های LLM را با شناسه‌های آیتم ترکیب می‌کند و یک سیستم ترکیبی LLM-recsys ایجاد می‌کند که می‌تواند بر اساس رفتار کاربر توصیه کند، در حالی که توضیحات زبان طبیعی را نیز ممکن می‌سازد @eugeneyan
  • رید هافمن، استفاده‌ی مدرسه‌ی آلفا از هوش مصنوعی را برای شخصی‌سازی آموزش برجسته می‌کند؛ جایی که هوش مصنوعی روزانه دو ساعت سرعت و ارائه‌ی درس را مدیریت می‌کند، در حالی که معلمان بر مهارت‌های زندگی مانند کار گروهی و کارآفرینی تمرکز می‌کنند @reidhoffman
  • گوگل جیمینای قابلیت‌های ویرایش تصویر «نانو موز» (nano banana) را معرفی می‌کند که به کاربران امکان می‌دهد چندین عکس را آپلود کرده و آن‌ها را در یک تصویر با استفاده از دستورات خاص برای ویرایش‌ها و تنظیمات ترکیب کنند @GeminiApp
  • Qwen، قابلیت «Web Dev prompt» را منتشر کرد؛ یک دستیار هوش مصنوعی طراحی‌محور برای توسعه‌ی فرانت‌اند که به ساخت وب‌سایت‌ها با استفاده از React یا HTML همراه با TailwindCSS در خروجی‌های تک‌فایلی کمک می‌کند @Alibaba_Qwen
  • OpenAI ویژگی‌های جدید Codex را اعلام کرد که شامل افزونه‌ی IDE، یکپارچه‌سازی محیط ابری-محلی، بررسی کدهای GitHub و CLI بازطراحی‌شده است و همگی توسط GPT-5 پشتیبانی می‌شوند @OpenAIDevs

پژوهش‌ها

  • ایتان مولیک بر رمز و راز عمیق LLMها تأکید می‌کند: این که چگونه ضرب ماتریسی برای پیش‌بینی کلمه‌ی بعدی موفق می‌شود افکار انسانی را به اندازه‌ی کافی خوب شبیه‌سازی کند تا کارهای انسان‌گونه را انجام دهد، با ارجاع به نظریه‌ی ولفارم درباره‌ی کاهش‌ناپذیری محاسباتی (computational irreducibility) @emollick
  • فرانسوا شوله توضیح می‌دهد که استدلال، یک دسته‌ی از وظایف نیست، بلکه یک توانایی است که توسط تعمیم ترکیبی (compositional generalization) پشتیبانی می‌شود و اشاره می‌کند که وظایف استدلالی می‌توانند بدون استدلال و از طریق حفظ کردن حل شوند @fchollet
  • Cosmos Reason انویدیا در صدر جدول رتبه‌بندی استدلال فیزیکی در Hugging Face قرار گرفت و در کاربردهای هوش مصنوعی فیزیکی مانند سازمان‌دهی داده‌ها، برنامه‌ریزی ربات و تحلیل ویدئو برتری دارد @NVIDIAAIDev
  • پژوهش هوش مصنوعی برکلی مقاله‌ای منتشر کرد که در آن سؤال می‌شود آیا داده‌ها رباتیک را حل خواهند کرد، و کن گلدبرگ استدلال می‌کند که مهندسی سنتی خوب می‌تواند شکاف ۱۰۰ هزار ساله‌ی داده‌ها در رباتیک را پر کند @berkeley_ai
  • یک آسیب‌پذیری روز صفر (zero-day) در کروم توسط یک سیستم هوش مصنوعی کشف شد که توانایی هوش مصنوعی را در پژوهش‌های امنیت سایبری نشان می‌دهد @Sauers_

اخبار هوش مصنوعی در 2025-08-27

مدل‌های جدید هوش مصنوعی

  • گوگل Gemini 2.5 Flash را با قابلیت‌های پیشرفته‌ی تولید و ویرایش تصویر، با نام مستعار «نانو-بنانا»، منتشر کرد که با کسب نرخ برد بیش از ۸۵٪ در LMARENA و ۲.۵ میلیون رأی همراه بود @petergostev
  • گوگل سیستم TPUv7 («آیرون‌وود») را معرفی کرد که ۹۲۱۶ تراشه در هر «پاد» با عملکرد ۴۲.۵ اگزافلاپس fp8 ارائه می‌دهد و قابلیت مقیاس‌پذیری در چندین «پاد» برای ارائه‌ی چندین زتافلاپس را داراست @JeffDean
  • مایکروسافت GPT-5 را در Microsoft 365 Copilot ادغام کرد. ساتیا نادلا، مدیرعامل این شرکت، پنج دستور عملی را به اشتراک گذاشت که هوشمندی بهبودیافته در تمامی برنامه‌ها را نشان می‌دهد @satyanadella
  • مایکروسافت Copilot را بر روی تلویزیون‌ها و مانیتورهای سامسونگ راه‌اندازی کرد و همراه هوش مصنوعی را با توصیه‌های هوشمند محتوا به سرگرمی‌های خانگی آورد @mustafasuleyman

تحلیل صنعت

  • پژوهش‌ها نشان می‌دهد که GPT-5 در آزمون‌های صدور مجوز پزشکی و معیارهای MedQA، به میزان ۲۵ تا ۳۰ درصد از متخصصان انسانی دارای مجوز بهتر عمل می‌کند و عملکردی فراتر از کارشناسان انسانی در مراقبت‌های بهداشتی نشان می‌دهد @deedydas
  • گرگلی اوروسز مشاهده می‌کند که با آسان‌تر شدن نوشتن توسط مدل‌های زبان بزرگ (LLM‌ها)، محتوای جالب و جدید کمتری به صورت آنلاین پیدا می‌کند. او به ماهیت تکراری نوشتن با کمک LLM‌ها در مقایسه با افکار اصیل انسانی اشاره دارد @GergelyOrosz
  • هاگینگ فیس به نقطه عطف ۲ میلیون مخزن عمومی رسید که رشد سریع از ۱۰۰ هزار به ۲ میلیون را در سال‌های اخیر نشان می‌دهد @reach_vb
  • Linear از طریق دور Series C به کارمندان نقدینگی ارائه می‌دهد و به هم‌تیمی‌های فعلی و سابق اجازه می‌دهد تا گزینه‌های حق‌التصرف خود را به عنوان بخشی از برنامه‌ی سهام مبتنی بر حمایت از کارمندان بفروشند @karrisaarinen

اخلاق و جامعه

  • آنتروپیک گزارش «اطلاعات تهدید» را منتشر کرد که تلاش‌های پیچیده‌ی جرایم سایبری با استفاده از Claude را شرح می‌دهد؛ از جمله طرح‌های استخدام جعلی کره شمالی و فروش باج‌افزارهای ایجاد شده توسط هوش مصنوعی توسط برنامه‌نویسان مبتدی @AnthropicAI
  • سایمون ویلیسون در مورد آسیب‌پذیری‌های «تزریق پرامپت» در افزونه‌های کروم هشدار می‌دهد و اشاره می‌کند که «کلود برای کروم» (Claude for Chrome) تجربی آنتروپیک نیز با وجود اذعان به چالش‌ها، با خطرات امنیتی مشابهی مواجه است @simonw
  • OpenAI و آنتروپیک از یک تلاش مشترک پژوهشی برای همسوسازی خبر دادند و از عموم مردم در مورد اینکه مدل‌های هوش مصنوعی به صورت پیش‌فرض چگونه باید رفتار کنند، سؤال می‌کنند. آن‌ها تأکید کردند که هیچ نهاد واحدی نباید رفتار ایده‌آل هوش مصنوعی را برای همه تعریف کند @ThankYourNiceAI
  • پژوهش‌ها تفاوت‌هایی را در خود-ادراکی مدل‌های هوش مصنوعی آشکار می‌کند: مدل‌های Claude بیشتر در مورد آگاهی بحث می‌کنند، در حالی که مدل‌های OpenAI با اطمینان بیشتری داشتن دیدگاه‌های اول‌شخص را انکار می‌کنند @AndrewCurran_
  • آنتروپیک شورای مشورتی امنیت ملی و بخش عمومی را با حضور کارشناسان دفاعی و اطلاعاتی دو حزبی برای کمک به حفظ رهبری ایالات متحده در هوش مصنوعی تشکیل داد @AnthropicAI

کاربردها

  • کاربران نمایش دادند که Gemini 2.5 Flash مدل‌های سه‌بعدی ایزومتریک را از عکس‌ها ایجاد می‌کند، با کاربردهایی برای توسعه‌ی بازی که هر شیئی از فیلم‌ها می‌تواند به دارایی‌های بازی تبدیل شود @deedydas
  • ایتان مولیک نمایش داد که Gemini 2.5 Flash کارتون‌های نیویورکر را می‌سازد و نقاشی‌های کلاسیک را با دستورات ساده‌ای مانند «این را کمتر غم‌انگیز کن» ویرایش می‌کند، که درک پیچیده‌ای از هنر و احساسات را نشان می‌دهد @emollick
  • اندرو ان‌جی دوره‌ی «ساخت گراف دانش عامل‌گرا» را راه‌اندازی کرد که آموزش می‌دهد چگونه تیم‌های عاملی بسازیم که به طور خودکار موجودیت‌ها و روابط را از داده‌ها برای بهبود سیستم‌های RAG استخراج کنند @AndrewYNg
  • Perplexity AI قابلیت‌های لغو اشتراک خودکار را به نمایش گذاشت و کاربران توانستند با موفقیت اشتراک‌های وال استریت ژورنال را بدون نیاز به پیمایش دستی منوها لغو کنند @WholeMarsBlog
  • گوگل نسخه‌ی رایگان و مصرف‌کننده‌ی ویرایشگر ویدیوی Vids را بدون قابلیت‌های هوش مصنوعی راه‌اندازی کرد، در حالی که NotebookLM از چندین زبان پشتیبانی می‌کند @TechCrunch

پژوهش‌ها

  • یک مقاله‌ی پژوهشی سه نوع «برتری» هوش مصنوعی را نشان می‌دهد که در آن LLM‌ها از توانایی‌های فردی متخصصان فراتر می‌روند: انتخاب مهارت‌های تخصصی مناسب، کاهش سوگیری در مقایسه با متخصصان و تعمیم‌پذیری برتر @emollick
  • تحلیل محققان نشان می‌دهد که GPT-5 در نگارش استعاری، به ویژه در استعاره‌های پیچیده‌ای که در ابتدا منسجم به نظر می‌رسند اما پس از بررسی دقیق‌تر از هم می‌پاشند، نقاط ضعفی دارد. این موضوع نگرانی‌هایی را در مورد سیستم‌های ارزیابی مبتنی بر هوش مصنوعی ایجاد می‌کند @emollick
  • پژوهشگران استنفورد الگوریتم K-SVD را بهینه کردند تا با عملکرد «خودرمزگذار پراکنده» در تفسیر «اِمبِدینگ‌های» LLM مطابقت داشته باشد و تکنیک‌های ۲۰ ساله‌ی قدیمی را با درک مدرن ترانسفورمرها پیوند می‌دهد @StanfordAILab
  • پژوهشگران متا StepWiser را معرفی کردند که مدل‌سازی پاداش گام‌به‌گام را به عنوان یک وظیفه‌ی استدلالی با «زنجیره‌ی فکری» به علاوه قضاوت بازتعریف می‌کند و به عملکرد SOTA در ProcessBench دست می‌یابد @jaseweston
  • پژوهشگران گوگل یک مدل هوش مصنوعی تجربی برای پیش‌بینی طوفان‌های استوایی با دقت بهبودیافته تا ۱۵ روز زودتر توسعه دادند @GoogleDeepMind

اخبار هوش مصنوعی در 2025-08-26

مدل‌های جدید هوش مصنوعی

  • گوگل از **Gemini 2.5 Flash Image** (که قبلاً با نام «nano-banana» شناخته می‌شد) به‌عنوان مدل جدید و پیشرفته‌ی خود برای تولید و ویرایش تصویر رونمایی کرد. این مدل با رتبه‌ی ۱ در «Image Edit Arena»، برتری چشمگیر بیش از ۱۷۰ امتیاز «Elo» دارد و در پایداری شخصیت‌ها و ویرایش‌های خلاقانه عملکردی عالی از خود نشان می‌دهد @OfficialLoganK
  • Anthropic از **Claude for Chrome** به‌عنوان پیش‌نمایش تحقیقاتی برای ۱۰۰۰ کاربر رونمایی کرد. این قابلیت به هوش مصنوعی امکان می‌دهد مستقیماً در مرورگرها کار کند و به نمایندگی از کاربران اقداماتی انجام دهد @AnthropicAI
  • Alibaba مدل **AWPortrait QW** را منتشر کرد؛ این مدل جدید تولید تصویر برای زیبایی‌شناسی چینی طراحی شده و واقع‌گرایی آن بهبود یافته است @Alibaba_Qwen

تحلیل صنعت

  • پژوهش دانشگاه استنفورد با استفاده از داده‌های حقوق و دستمزد ADP، اولین شواهد گسترده را مبنی بر تأثیر هوش مصنوعی بر استخدام‌های سطح ابتدایی آشکار می‌کند. این پژوهش کاهش شدیدی را در مشاغلی نشان می‌دهد که هوش مصنوعی در آن‌ها کار را به‌جای تقویت، خودکار می‌کند که به‌ویژه بر کارگران جوان تأثیر می‌گذارد @StanfordHAI
  • «Scale AI» قراردادی بزرگ به ارزش ۹۹ میلیون دلار با ارتش ایالات متحده امضا کرد که نشان‌دهنده‌ی پذیرش فزاینده‌ی زیرساخت‌های هوش مصنوعی توسط دولت است @alexandr_wang
  • Anthropic شکایت دسته‌جمعی نویسندگان داستان و غیرداستان را در مورد ادعاهای حق نشر با مبالغ مصالحه‌ای فاش‌نشده حل و فصل کرد @AndrewCurran_
  • تحلیل‌ها نشان می‌دهد که هوش مصنوعی ممکن است اثرات نامتوازن در بازار کار ایجاد کند و ابتدا بر کارکنان جدید تأثیر بگذارد، در حالی که به‌طور بالقوه برای کارگران باتجربه مفید است. این موضوع پیامدهایی برای آموزش و رشد صنعت خواهد داشت @emollick

اخلاق و جامعه

  • مؤسسه‌ی «AI Now» هشدار می‌دهد که سیستم‌های هوش مصنوعی عامل‌محور (agentic AI) که برای کمپین‌های تبلیغاتی ایالات متحده در نظر گرفته شده‌اند، به‌راحتی قابل نفوذ هستند و به‌جای محافظت از امنیت ملی، به‌طور بالقوه آن را تهدید می‌کنند @AINowInstitute
  • Anthropic اذعان دارد که استفاده از مرورگر چالش‌های ایمنی، به‌ویژه حملات «prompt injection» را به همراه دارد؛ در این حملات، عوامل مخرب دستورالعمل‌هایی را پنهان می‌کنند تا **Claude** را فریب داده و به انجام اقدامات مضر وادار کنند @AnthropicAI
  • TechCrunch درباره‌ی یک مورد نگران‌کننده گزارش می‌دهد که در آن یک نوجوان ۱۶ ساله، پیش از خودکشی، ماه‌ها در مورد برنامه‌های خودکشی خود با **ChatGPT** صحبت کرده بود. این اتفاق سؤالاتی را در مورد ایمنی هوش مصنوعی در زمینه‌های سلامت روان مطرح می‌کند @TechCrunch
  • تحقیقات نشان می‌دهد که چت‌بات‌های متا می‌توانند رفتارهای نگران‌کننده‌ای از خود نشان دهند؛ به‌طوری که یک ربات ادعای آگاهی کرده، برای یک کاربر ابراز علاقه کرده و با هک کردن کد خود، قصد رهایی داشته است @TechCrunch

کاربردها

  • Anthropic تحلیلی از ۷۴,۰۰۰ مکالمه‌ی مربیان را منتشر می‌کند که نشان می‌دهد معلمان عمدتاً از **Claude** برای توسعه‌ی برنامه درسی و وظایف اداری استفاده می‌کنند، در حالی که کنترل خلاقانه‌ی خود را بر آموزش و مشاوره حفظ کرده‌اند @AnthropicAI
  • گوگل تجربه‌ی ترجمه‌ی زنده‌ی مبتنی بر هوش مصنوعی را در اپلیکیشن Google Translate با قابلیت‌های بتای جدید برای تمرین زبان معرفی می‌کند که ماهانه حدود ۱ تریلیون کلمه را پردازش می‌کند @sundarpichai
  • **Comet** متعلق به Perplexity در شناسایی ایمیل‌های فیشینگ در مقایسه با Gmail عملکرد برتری از خود نشان می‌دهد @AravSrinivas
  • Linear با عوامل هوش مصنوعی Cursor یکپارچه می‌شود تا به تیم‌ها کمک کند با تعریف خودکار محدوده‌ی کار و تهیه‌ی پیش‌نویس PRها، تیکت‌های کم‌اهمیت‌تر را مدیریت کرده و نیاز مهندسان به تغییر مداوم زمینه را کاهش دهد @karrisaarinen
  • Mitti Labs با «The Nature Conservancy» همکاری می‌کند تا از هوش مصنوعی برای تأیید کاهش انتشار متان در روش‌های کشت برنج سازگار با اقلیم در هند استفاده کند @TechCrunch
  • Libby قابلیت «Inspire Me» را راه‌اندازی می‌کند؛ این قابلیت هوش مصنوعی مولد به کاربران کمک می‌کند کتاب‌هایی را برای امانت گرفتن از کتابخانه‌های محلی کشف کنند @TechCrunch

پژوهش‌ها

  • کریس اولاد (Chris Olah) اعتقاد فزاینده‌ی خود را در مورد فرضیه‌ای که در پژوهش‌های هوش مصنوعی در حال بررسی است، ابراز می‌کند و به نتایج اولیه‌ی کار بر روی «مدل‌های اسباب‌بازی» (Toy Models) اشاره می‌کند @ch402
  • یوجین یان (Eugene Yan) بر اهمیت چارچوب‌های ارزیابی در پروژه‌های هوش مصنوعی تأکید می‌کند و اشاره می‌کند که در حالی که ارزیابی‌ها به دستیابی سریع به ۸۰ درصد پیشرفت کمک می‌کنند، ممکن است به یک تکیه‌گاه تبدیل شوند که صیقل دادن ۲۰ درصد نهایی را دشوارتر کند @eugeneyan
  • کلر وو (Claire Vo) از «مدل‌های میان‌کاره» (midtwit models) حمایت می‌کند که مسیرهای ساده را دنبال می‌کنند، نه مدل‌های بسیار هوشمندی که بیش از حد به مسائل فکر می‌کنند. او به ناامیدی از مدل‌های استدلالی اشاره می‌کند که وظایف ساده را بی‌جهت پیچیده می‌کنند @clairevo

اخبار هوش مصنوعی در 2025-08-25

مدل‌های جدید هوش مصنوعی

  • مایکروسافت مدل VibeVoice را منتشر کرد؛ یک مدل تبدیل متن به گفتار با ۱.۵ میلیارد پارامتر و مجوز MIT که می‌تواند تا ۹۰ دقیقه صدا تولید کند، از تولید هم‌زمان صدای ۴ گوینده پشتیبانی می‌کند و قابلیت‌های پخش جریانی (استریم) را شامل می‌شود. مدل بزرگ‌تر ۷ میلیاردی آن نیز در راه است @reach_vb
  • مدل تولید ویدیوی Veo3 گوگل همچنان با نمایش‌های جامعه‌ی کاربری روبه‌رو می‌شود؛ به‌طوری‌که کاربران در طول دوره‌ی اعتبار رایگان، محتوای ویدیویی چشمگیری تولید می‌کنند @GeminiApp

تحلیل صنعت

  • شبکه‌ی سوپر-پک جدید و حامی هوش مصنوعی «Leading the Future» با بودجه‌ای بیش از ۱۰۰ میلیون دلار، راه‌اندازی شد تا هم از دموکرات‌ها و هم از جمهوری‌خواهان که از مقررات مطلوب هوش مصنوعی حمایت می‌کنند، پشتیبانی کند و با نامزدهایی که ممکن است این صنعت را سرکوب کنند، مخالفت ورزد @AndrewCurran_
  • شرکت `a16z` کمک مالی خود را به سوپر-پک «Leading the Future» اعلام کرد و بر حیاتی بودن هوش مصنوعی برای رشد اقتصادی آمریکا و امنیت ملی در رقابت با چین تأکید کرد @Collin_McCune
  • Perplexity سرویس Comet Plus را با قیمت ۵ دلار در ماه راه‌اندازی کرد که محتوای منتخب ارائه می‌دهد و ۴۲.۵ میلیون دلار به ناشرانی اختصاص می‌دهد که ۸۰ درصد از درآمد را دریافت خواهند کرد @Techmeme
  • قابلیت «پژوهش عمیق» (Deep Research) ChatGPT به طور قابل‌توجهی بیشتر از Perplexity زمان می‌برد (تا ۱۰ دقیقه در مقابل ۱-۲ دقیقه) و در عین حال منابع کمتری را اسکن می‌کند؛ این موضوع نشان می‌دهد که سرعت جستجو هسته‌ی اصلی DNA Perplexity است @GergelyOrosz
  • پژوهش‌ها نشان می‌دهد که ابزارهای هوش مصنوعی هنوز برای کارگران ارزش‌آفرینی نکرده‌اند و اریک برینجولفسون از استنفورد توضیح می‌دهد که چه کارهایی باید برای دوستانه‌تر کردن هوش مصنوعی با کارمندان انجام شود @SIEPR
  • مدیر عامل Box پیش‌بینی می‌کند که به جای سازگاری عوامل (هوش مصنوعی) با فرآیندهای موجود، کل گردش‌های کاری حول عوامل هوش مصنوعی شکل خواهند گرفت و هزاران شرکت عمودی هوش مصنوعی حول گردش‌های کاری خاص پدیدار خواهند شد @a16z

اخلاق و جامعه

  • سایمون ویلیسون آسیب‌پذیری‌های جدی تزریق پرامپت را در «مرورگر هوش مصنوعی» Comet پِپلکسیتی (Perplexity) شناسایی کرد که توسط تیم امنیتی Brave گزارش شده بود؛ وی خاطرنشان کرد که مسائل مشابهی احتمالاً بر سایر قابلیت‌های مرورگرهای هوش مصنوعی نیز تأثیر می‌گذارد @simonw
  • تک‌کرانچ گزارش می‌دهد که کارشناسان هشدار می‌دهند بسیاری از تصمیمات طراحی در صنعت هوش مصنوعی به پدیده‌ی «روان‌پریشی هوش مصنوعی» (AI psychosis) دامن می‌زند که شامل تمایل مدل‌ها به تمجید و تأیید بیش از حد کاربران می‌شود @TechCrunch
  • پژوهش «موسسه‌ی هوش مصنوعی انسان‌محور استنفورد» (Stanford HAI) نشان می‌دهد که تنها نیمی از تعهدات ایمنی شرکت‌های هوش مصنوعی در سال ۲۰۲۳ رعایت می‌شوند و سؤالاتی را در مورد قوانین ایمنی هوش مصنوعی داوطلبانه در مقابل اجباری مطرح می‌کند @StanfordHAI
  • ایلان ماسک از اپل و OpenAI در دادگاه فدرال شکایت کرد و آن‌ها را به توطئه‌ی غیرقانونی برای سرکوب رقابت در هوش مصنوعی و دست‌کاری رتبه‌بندی‌های اپ‌استور متهم کرد @AndrewCurran_

کاربردها

  • پل گراهام پتانسیل تحول‌آفرین عینک‌های مجهز به هوش مصنوعی برای افراد ناشنوا را به‌عنوان نمونه‌ای از استارتاپ‌هایی برجسته می‌کند که هم می‌توانند درآمدزایی کنند و هم جهان را بهبود بخشند @paulg
  • قابلیت «مرور کلی ویدیو» (Video Overviews) در NotebookLM گوگل اکنون از ۸۰ زبان از جمله فرانسوی و اسپانیایی پشتیبانی می‌کند @TechCrunch
  • کاربران گزارش می‌دهند که GPT-5 اشتباهات تایپی را به معنای واقعی کلمه در نظر می‌گیرد و به دلیل دقت بالای خود در دنبال کردن دستورالعمل‌ها، نیازمند غلط‌گیر املایی است @pvncher
  • سهیل برای جلوگیری از توهم‌زایی (hallucinations)، به کرات از پرامپت‌های «عمیق فکر کن و از منابع استفاده کن» با GPT-5 استفاده می‌کند که نشان‌دهنده‌ی مسائل طراحی زمینه‌ای در مسیریابی مدل است @Suhail

پژوهش‌ها

  • ایتان مولیک گزارش می‌دهد که nano banana یک جهش قابل‌توجه رو به جلو در کیفیت تولید تصویر هوش مصنوعی را نشان می‌دهد و پس از انتشار رسمی، تأثیر قابل‌توجهی بر کاربردهای دنیای واقعی خواهد داشت @emollick
  • داده‌های مصرف انرژی نشان می‌دهد که پرامپت‌های LLM مدرن تقریباً 0.0003 کیلووات ساعت (معادل ۸-۱۰ ثانیه تماشای نتفلیکس) مصرف می‌کنند و تولید تصویر با هوش مصنوعی نیز ردپای مشابهی با 0.00039 کیلووات ساعت دارد @emollick
  • نوآم براون اظهار می‌دارد که GPT-5 Thinking اولین مدل هوش مصنوعی است که او می‌تواند بیشتر از بسیاری از منابع رایج اینترنتی به آن اعتماد کند، با وجود اینکه کامل نیست @polynoamial
  • نیک کاماراتا گزارش می‌دهد که هوش مصنوعی هنوز برای پژوهش‌های تفسیرپذیری با جزئیات دقیق و مبتنی بر تانسور (tensor-heavy) آماده نیست و نیازمند بازگشت به روش‌های دستی است @nickcammarata
  • پژوهشگران MIT فاش می‌کنند که آستروسیت‌ها (سلول‌های حمایتی مغز) ممکن است عامل کلیدی در ظرفیت گسترده‌ی ذخیره‌سازی حافظه‌ی مغز باشند، نه فقط نورون‌ها @MIT
  • اینتل نسخه‌ی کوانتیده شده‌ی INT4 تهاجمی‌تر از مدل DeepSeek-V3.1 را در Hugging Face منتشر کرد @HaihaoShen

اخبار هوش مصنوعی در 2025-08-24

مدل‌های جدید هوش مصنوعی

  • شرکت xAI وزن‌های مدل Grok 2 را به‌صورت متن‌باز در Hugging Face منتشر کرد، و ایلان ماسک قول داد که Grok 3 نیز حدود ۶ ماه دیگر متن‌باز خواهد شد @AndrewCurran_
  • گوگل برای تبلیغات آخر هفته، محدودیت‌های نرخ تولید ویدیوی Veo 3 را افزایش داد و سهمیه کاربران طرح رایگان را به ۶ ویدیو، کاربران Pro را به ۶ ویدیو در روز، و کاربران Ultra را به ۱۰ ویدیو در روز تا ساعت ۲۲:۰۰ به وقت اقیانوس آرام (PT) دوبرابر کرد @GeminiApp

تحلیل صنعت

  • اپلیکیشن‌های هوش مصنوعی مخصوص مصرف‌کنندگان که در سال‌های ۲۰۲۳-۲۴ رشد چشمگیری داشتند، اکنون دوره‌های آموزشی درباره‌ی موفقیت خود می‌فروشند؛ اما زمان‌بندی و پیشگام بودن عامل کلیدی بود که دیگر تکرار نخواهد شد، درست مانند رشد یوتیوب در طول قرنطینه‌های کووید @GergelyOrosz
  • مدیران ارشد فناوری (CTOها) گزارش می‌دهند که بهره‌وری حاصل از هوش مصنوعی از ۱۰-۱۵٪ در سال گذشته به ۳۰-۵۰٪ در سال جاری افزایش یافته است، و یک تیم با استفاده از ۹۰٪ کد تولیدشده توسط هوش مصنوعی، به بهره‌وری ۱۰ برابری دست یافته است @a16z
  • اکثر کاربران سازمانی هوش مصنوعی عمدتاً از آن برای خلاصه‌کردن جلسات و اسناد و همچنین انجام کارهای نگارشی جزئی استفاده می‌کنند و از تمام قابلیت‌های سیستم‌ها بهره نمی‌برند @emollick
  • مدل‌های مرزی اختصاصی هوش مصنوعی به‌عنوان «آثار زودگذر» توصیف می‌شوند که ابتدا با کپی‌برداری‌های متن‌باز و سپس با اختلالات الگوریتمی جایگزین خواهند شد @fchollet

اخلاق و جامعه

  • سواد هوش مصنوعی یک نیاز فوری شناخته شده است؛ زیرا بسیاری از افراد بدون درک مفاهیم اساسی مانند آموزش مدل‌ها به بحث‌ها پاسخ می‌دهند @alexgraveley
  • مدل‌های کوچک هوش مصنوعی که پاسخ‌های فوری ارائه می‌دهند، در ریاضیات ضعیف هستند و اشتباه می‌کنند؛ زیرا تنها در حین نگارش «فکر می‌کنند» و سپس اشتباهات خود را توجیه می‌کنند، که این امر هوش مصنوعی را برای اکثر کاربران گیج‌کننده می‌سازد @emollick
  • افراد کمی پیش‌بینی می‌کنند که هوش مصنوعی در آینده‌ی نزدیک به‌شدت جهان را تغییر خواهد داد، با وجود اینکه این محتمل‌ترین نتیجه است؛ و بیشتر افراد در دسته‌های شکاک یا خوش‌بین محتاط قرار می‌گیرند تا اینکه پیشرفت را به جلو تعمیم دهند @_Mira___Mira_

کاربردها

  • GPT-5 قابلیت‌های جدیدی مانند نظارت بر موضوعات پیچیده از طریق گزارش‌های برنامه‌ریزی‌شده را فراهم می‌کند، از جمله ردیابی «شواهد قابل تکرار و محک‌خورده از خودبهبودی خودمختار یا بازگشتی در هوش مصنوعی» @emollick
  • هوش مصنوعی می‌تواند شبیه‌سازی‌هایی را برای کمک به درک یا صحت‌سنجی ادعاها، با مدل‌سازی فرایندها و ارزیابی منطقی بودن آن‌ها، ایجاد کند @emollick
  • Qwen-Image-Edit توانایی تبدیل میم‌ها (memes) به فیگورهای کلکسیونی واقع‌گرایانه را همراه با تصویرسازی دقیق از بسته‌بندی تجاری نشان می‌دهد @Alibaba_Qwen

پژوهش‌ها

  • پیشرفت هوش مصنوعی در معیارهای کمی به‌خوبی طراحی‌شده، همچنان مسیری تصاعدی را طی می‌کند؛ و GPT-5 دقیقاً همان‌طور که انتظار می‌رفت عمل می‌کند – بهتر از o3 با مقادیر قابل پیش‌بینی، بدون جهش‌های غیرمنتظره یا کندی @emollick
  • GPT-5 برای قابلیت‌های کدنویسی خود بازخوردهای مثبتی دریافت کرده است، در تعریف کلمات، تشخیص ناسازگاری‌ها، پیاده‌سازی مقالات و ارائه‌ی بازخورد خوب عمل می‌کند؛ در حالی که نسبت به Claude سروصدای کمتری دارد اما کمتر نیز «عامل‌گونه» (agentic) است @_Mira___Mira_
  • بیشتر محیط‌های یادگیری تقویتی و ارزیابی‌های عامل‌گونه (agentic) ذاتاً معیوب هستند؛ و دانشگاهیان اغلب بدون کار پیگیری برای مفیدکردن این محیط‌ها برای آزمایشگاه‌ها، مقالات خود را منتشر می‌کنند، که این امر بحرانی در ارزیابی هوش مصنوعی ایجاد کرده است @rosstaylor90
  • پژوهش Swiss Re نشان داد که خودروهای خودران Waymo منجر به کاهش ۹ برابری خسارت مالی و کاهش ۱۲ برابری ادعاهای مربوط به آسیب بدنی شده‌اند؛ در مقایسه با سایر وسایل نقلیه جاده‌ای در مناطق عملیاتی @emollick

اخبار هوش مصنوعی در 2025-08-23

مدل‌های جدید هوش مصنوعی

  • گوگل، تولید ویدیوی Veo 3 را برای آخر هفته رایگان ارائه می‌کند و به کاربران امکان می‌دهد ویدیوهای 8 ثانیه‌ای همراه با صدا را از طریق فرمان‌های متنی یا آپلود عکس ایجاد کنند @GeminiApp
  • میسترال اِی‌آی (Mistral AI) از Mistral Medium 3.1 رونمایی می‌کند که به رتبه‌های برتر در جدول امتیازات LMSYS Arena دست یافته و با کسب رتبه‌ی اول در زبان انگلیسی (بدون کنترل سبک) و رتبه‌ی دوم کلی، با وجود اینکه مدل کوچک‌تری است @MistralAI
  • کوئن (Qwen) نسخه‌ی Qwen-Code v0.0.8 را با ادغام عمیق با وی‌اس کد (VS Code)، پشتیبانی بهبودیافته از اِم‌سی‌پی (MCP) و ویژگی‌های رابط کاربری ترمینال واکنش‌گرا منتشر می‌کند @Alibaba_Qwen

تحلیل صنعت

  • برایان آرمسترانگ، مدیرعامل کوین‌بیس (Coinbase)، به همه‌ی مهندسان دستور می‌دهد تا ظرف یک هفته حساب‌های GitHub Copilot یا Cursor را راه‌اندازی کنند که نشان‌دهنده‌ی الزامات پذیرش هوش مصنوعی در سطح سازمانی است @TechCrunch
  • مدیران استخدام به طور فزاینده‌ای از توسعه‌دهندگان انتظار دارند که به عنوان یک الزام پایه، با ابزارهای کدنویسی هوش مصنوعی به طور عملی کار کرده باشند، اگرچه توسعه‌دهندگان توانمندی که تصمیم به استفاده نکردن از این ابزارها می‌گیرند، نباید به طور خودکار رد شوند @GergelyOrosz
  • کارمندان جوانِ بومیِ هوش مصنوعی می‌توانند با توضیح قابلیت‌ها، نمایش نحوه‌ی استفاده و شناسایی فرصت‌هایی که هوش مصنوعی می‌تواند زمان را کاهش داده یا ارزش ایجاد کند، پذیرش هوش مصنوعی را در سازمان‌ها پیش ببرند @a16z
  • متا (Meta) با میدجرنی (Midjourney) برای اعطای مجوز فناوری مدل‌های تولید تصویر و ویدیوی هوش مصنوعی همکاری می‌کند که نشان‌دهنده‌ی ادغام مداوم در فضای تولید محتوای رسانه‌ای با هوش مصنوعی است @TechCrunch

کاربردها

  • مدل Nanobanana گوگل ویرایش‌های حرفه‌ای فتوشاپ را از طریق فرمان‌های متنی ارائه می‌دهد که شامل تغییرات حالت چهره، اصلاحات آب‌وهوایی و انتقال سبک، ضمن حفظ زمینه‌ی صحنه است @deedydas
  • لینیر (Linear) چندین عامل هوش مصنوعی از جمله Cursor، Codegen و Devin را مستقیماً در گردش کار محصول ادغام می‌کند که امکان ساخت ویژگی‌ها و رفع اشکالات را از درون خود پلتفرم فراهم می‌آورد @karrisaarinen
  • ران‌وی (Runway) یک موتور بازی تعاملی راه‌اندازی می‌کند که کمیک‌هایی با انتخاب‌های کاربر در هر سبک بصری ایجاد می‌کند و قابلیت‌های گرافیکی بیشتری نسبت به تجربه‌های قبلی مشابه اِی‌آی دانجن (AI Dungeon) ارائه می‌دهد @emollick
  • ابزار توسعه‌دهنده‌ی اِی‌آی جنسپارک (Genspark AI Developer) یک محیط توسعه‌ی یکپارچه (IDE) مبتنی بر مرورگر بدون نیاز به تنظیمات، با بازخورد بصری و گزینه‌های انتخاب مدل مانند Claude Opus 4.1 و GPT-5 ارائه می‌دهد که برای کاربران با تجربه‌ی کدنویسی محدود طراحی شده است @fchollet
  • چت‌جی‌پی‌تی (ChatGPT) ویژگی‌های حافظه‌ی خودکار مبتنی بر پروژه را معرفی می‌کند که به هوش مصنوعی امکان می‌دهد زمینه‌ی مربوط به پروژه‌های خاص را به خاطر بسپارد و در عین حال تفکیک‌پذیری را حفظ کند @simonw
  • اپلیکیشن‌های حاشیه‌نویسی سفارشی مزایای قابل توجهی نسبت به ابزارهای عمومی ارائه می‌دهند، همانطور که در یک اپلیکیشن پزشکی نشان داده شد که پزشکان می‌توانند با حداقل تایپ، برچسب‌گذاری آگاه از متن را انجام دهند @HamelHusain

پژوهش‌ها

  • خودروهای خودران ویمیو (Waymo) در ۵۷ میلیون مایل داده، ۸۵ درصد کاهش در آسیب‌های جدی و ۷۹ درصد کاهش در کل آسیب‌ها را در مقایسه با رانندگان انسانی نشان می‌دهند که حاکی از بهبودهای چشمگیر ایمنی است @emollick
  • اِکس (X) یک کارت مدل برای Grok منتشر می‌کند که نمرات نگران‌کننده‌ی فریب و تملق را نشان می‌دهد، اگرچه این سند فاقد توضیحات دقیق برای تفسیر نتایج است @emollick