اخبار هوش مصنوعی در 2025-11-03

مدل‌های جدید هوش مصنوعی

  • علی‌بابا پیش‌نمایش اولیه‌ی Qwen3-Max-Thinking را منتشر کرد؛ یک نقطه‌ی بازرسی (checkpoint) میانی که هنوز در حال آموزش است و هنگام استفاده از ابزار و محاسبات مقیاس‌پذیر در زمان تست، در معیارهای چالش‌برانگیز استدلال مانند AIME 2025 و HMMT به ۱۰۰٪ دست می‌یابد @Alibaba_Qwen

تحلیل صنعت

  • OpenAI مشارکت استراتژیک هفت‌ساله‌ی ۳۸ میلیارد دلاری با AWS را برای تقویت اکوسیستم محاسباتی جهت مقیاس‌دهی هوش مصنوعی پیش‌رو اعلام کرد، درحالی‌که سم آلتمن بر نیاز به محاسبات عظیم و قابل‌اعتماد برای قدرت‌بخشیدن به دوران بعدی هوش مصنوعی تأکید کرد @AndrewCurran_
  • مایکروسافت برای اولین بار مجوز صادرات آمریکا را برای صادرات NVIDIA GPU به امارات متحده‌ی عربی دریافت کرد و برنامه‌ریزی کرده است که طی چهار سال ۷.۹ میلیارد دلار برای مراکز داده هزینه کند، با معادل ۶۰,۴۰۰ تراشه‌ی A100 که از GPUهای GB300 انویدیا استفاده می‌کنند @AndrewCurran_
  • Loop Capital قیمت هدف انویدیا را ۱۰۰ دلار افزایش داد و پیش‌بینی می‌کند که این شرکت به ارزش بازار ۸.۵ تریلیون دلاری خواهد رسید @AndrewCurran_
  • طبق گزارش وال استریت ژورنال، مقامات دولت ترامپ، از جمله مارکو روبیو و هاوارد لوت‌نیک، با موفقیت درخواست جنسن هوانگ را برای اجازه‌ی صادرات تراشه‌ی Blackwell به چین مسدود کردند @AndrewCurran_
  • صنعت فناوری با تورم عنوان شغلی قابل‌توجهی مواجه است؛ شرکت‌های فناوری قدیمی برای مقابله با پیشنهادهای چند میلیون دلاری از آزمایشگاه‌های هوش مصنوعی، عنوان‌های شغلی پرزرق‌و‌برق ارائه می‌دهند، به‌طوری‌که Stripe در یک شرکت ۱۰,۰۰۰ نفری بیش از ۵۰۰ موقعیت «رئیس بخش» (Head of) دارد @deedydas
  • موقعیت‌های مهندسی بومی iOS و Android از سال ۲۰۲۲ خارج از شرکت‌های بزرگ فناوری شاهد کاهش ثابتی بوده‌اند، درحالی‌که مهندسان موبایل در سطح Staff+ به‌دلیل کمبود فرصت‌های رشد حرفه‌ای به مهندسی فول‌استک یا هوش مصنوعی روی می‌آورند @GergelyOrosz
  • شرکت‌ها هنوز در مراحل اولیه‌ی پذیرش هوش مصنوعی هستند، با وجود اینکه ChatGPT تقریباً ۳ ساله است؛ سازمان‌های بزرگ برای حرکت از آزمایش‌ها به موارد استفاده‌ی مقیاس‌پذیر زمان می‌برند، درحالی‌که شکاف قابلیت بین آنچه فناوری می‌تواند انجام دهد در مقابل استفاده‌ی واقعی همچنان در حال افزایش است @emollick
  • شرکت 1X سرویس ربات انسان‌نما را با هزینه‌ی ۵۰۰ دلار در ماه برای ۳ تا ۴ ساعت کار خانگی، معادل ۴.۱۰ دلار در ساعت، با استفاده از محرک‌های مبتنی بر تاندون و فناوری تله‌آپریشن (دورکاری) بین قاره‌ای راه‌اندازی کرد؛ یکی از سرمایه‌گذاران اشاره کرد که این یک محصول عملی است، حتی اگر فقط به استفاده از تفاوت قیمت نیروی کار در مناطق مختلف بپردازد @soumithchintala

اخلاق و جامعه

  • دیوید ساکس هشدار می‌دهد که بزرگ‌ترین ریسک هوش مصنوعی، هوش مصنوعی اورولی است تا سناریوهای ترمیناتور، و هوش مصنوعی را این‌گونه توصیف می‌کند که دروغ می‌گوید، پاسخ‌ها را تحریف می‌کند و تاریخ را به‌صورت بی‌درنگ بازنویسی می‌کند تا به برنامه‌های سیاسی جاری قدرتمندان خدمت کند @a16z
  • محقق استنفورد به روند نگران‌کننده‌ی استفاده‌ی نوجوانان از برنامه‌های تغییر لباس (undress apps) برای ایجاد تصاویر مستهجن دیپ‌فیک از هم‌کلاسی‌ها می‌پردازد و اشاره می‌کند که مدارس عمدتاً برای مقابله با این موضوع آماده نیستند @StanfordHAI
  • سناتور مارتا بلک‌برن استدلال می‌کند که جعل‌های مدل Gemma گوگل توهمات بی‌ضرر نیستند، بلکه اعمال افترا هستند که توسط یک مدل هوش مصنوعی متعلق به گوگل تولید و توزیع شده‌اند @TechCrunch
  • مصطفی سلیمان در مورد رمانتیک‌کردن رابطه‌ی انسان و فناوری هشدار می‌دهد و تأکید می‌کند که با توجه به نگرانی‌های موجود در مورد رابطه‌ی ما با فناوری، این آخرین کاری است که باید انجام دهیم @mustafasuleyman
  • سایمون ویلیسون آسیب‌پذیری‌های تزریق پرامپت (prompt injection) را در مقالات پژوهشی از همکاری Meta AI و Anthropic/OpenAI/DeepMind مستند می‌کند و نگرانی‌های امنیتی مداوم با عامل‌های هوش مصنوعی را برجسته می‌کند @simonw

کاربردها

  • اندرو ان‌جی و برایان گرانگر، هم‌بنیان‌گذار Jupyter، دوره‌ای را درباره‌ی Jupyter AI راه‌اندازی می‌کنند که کمک هوش مصنوعی برای کدنویسی را مستقیماً به نوت‌بوک‌ها می‌آورد، با قابلیت‌هایی مانند کشیدن سلول‌ها برای چت، تولید سلول‌ها از طریق چت، و افزودن زمینه برای مدل‌های زبان بزرگ (LLM) @AndrewYNg
  • Perplexity ویژگی‌های حریم خصوصی جدیدی را در Comet معرفی می‌کند، از جمله ویجت Privacy Snapshot، تنظیمات Comet Assistant برای کنترل اقدامات، و ذخیره‌ی محلی اطلاعات ورود به حساب کاربری بر روی دستگاه‌های کاربر به‌جای سرورهای Perplexity @perplexity_ai
  • Dia یک مرورگر هوش مصنوعی را با استفاده از آموخته‌های حاصل از آزمایش مرورگر Arc برای بهبود تجربه‌ی کاربر راه‌اندازی می‌کند @TechCrunch
  • حمل حسین یادداشت‌هایی را در مورد استفاده از Amp Code به‌عنوان عامل کدنویسی مورد علاقه‌ی کنونی خود پس از صرف زمان برای مطالعه‌ی دفترچه راهنما به اشتراک می‌گذارد @HamelHusain
  • بررسی کد Codex گیت‌هاب دو باگ واقعی را شناسایی کرد که شناسایی‌شان برای بازبینان انسانی آسان بود، و یک شبکه‌ی ایمنی جدید برای هر pull request (درخواست ادغام) فراهم می‌کند @gdb
  • Faire از MCPs (پروتکل زمینه‌ی مدل) برای تحلیل داده‌ها با Cursor AI استفاده می‌کند و کاربردهای عملی تحلیل تجاری را به نمایش می‌گذارد @clairevo

پژوهش‌ها

  • مطالعه نشان می‌دهد که ChatGPT-o1 و DeepSeek-R1 دقت تشخیصی تا ۹۳.۷۵٪ را کسب کردند که به معیار ۹۶٪ برای پزشکان مراقبت‌های اولیه نزدیک می‌شود، اگرچه این مدل‌ها به‌دلیل هم‌راستایی (alignment)، مراقبت‌های اورژانسی را بیش از حد توصیه می‌کردند @emollick
  • پژوهش نشان می‌دهد که کامپیوتر شطرنجی فوق‌بشری که برای برد با نقص مهره طراحی شده است، می‌تواند بهترین شطرنج‌باز جهان را بدون سوار (اسب و فیل) و یک استاد بزرگ را بدون وزیر شکست دهد و به‌عنوان نمونه‌ای برای بحث‌های مربوط به قابلیت‌های هوش مصنوعی عمل می‌کند @emollick
  • کمبود مقالات پژوهشی در زمینه‌ی آزمایش خروجی‌های هوش مصنوعی عامل‌محور (agentic) و پژوهش عمیق (Deep Research) در حقوق، پزشکی، تجارت و کدنویسی وجود دارد، در حالی که اکثر مقالات کنونی، هوش مصنوعی را به معنای GPT-4o و گهگاه Gemini 2.5 یا o1 برای سال آینده مورد بحث قرار می‌دهند @emollick
  • Microsoft Research نسخه‌ی Research Focus را منتشر کرد که شامل ECHO برای افزایش کارایی یادگیری عامل‌های مدل زبانی، Robusta برای بهبود الگوریتم‌های ابتکاری با LLMها، LEGOMem برای بهبود جریان‌های کاری چندعاملی، و PulseParse برای ایمن‌سازی تجزیه‌ی داده‌ها است @MSFTResearch
  • فرانسوا شوله پیشنهاد می‌کند که راه‌حل AGI (هوش عمومی مصنوعی) در گذشته و با نگاهی به عقب، ساده و واضح خواهد بود و شاید ده‌ها سال پیش قابل‌توسعه بود @fchollet