اخبار هوش مصنوعی در 2025-11-03

مدل‌های جدید هوش مصنوعی

علی‌بابا پیش‌نمایش اولیه‌ی Qwen3-Max-Thinking را منتشر کرد؛ یک نقطه‌ی بازرسی (checkpoint) میانی که هنوز در حال آموزش است و هنگام استفاده از ابزار و محاسبات مقیاس‌پذیر در زمان تست، در معیارهای چالش‌برانگیز استدلال مانند AIME 2025 و HMMT به ۱۰۰٪ دست می‌یابد @Alibaba_Qwen

تحلیل صنعت

OpenAI مشارکت استراتژیک هفت‌ساله‌ی ۳۸ میلیارد دلاری با AWS را برای تقویت اکوسیستم محاسباتی جهت مقیاس‌دهی هوش مصنوعی پیش‌رو اعلام کرد، درحالی‌که سم آلتمن بر نیاز به محاسبات عظیم و قابل‌اعتماد برای قدرت‌بخشیدن به دوران بعدی هوش مصنوعی تأکید کرد @AndrewCurran_
مایکروسافت برای اولین بار مجوز صادرات آمریکا را برای صادرات NVIDIA GPU به امارات متحده‌ی عربی دریافت کرد و برنامه‌ریزی کرده است که طی چهار سال ۷.۹ میلیارد دلار برای مراکز داده هزینه کند، با معادل ۶۰,۴۰۰ تراشه‌ی A100 که از GPUهای GB300 انویدیا استفاده می‌کنند @AndrewCurran_
Loop Capital قیمت هدف انویدیا را ۱۰۰ دلار افزایش داد و پیش‌بینی می‌کند که این شرکت به ارزش بازار ۸.۵ تریلیون دلاری خواهد رسید @AndrewCurran_
طبق گزارش وال استریت ژورنال، مقامات دولت ترامپ، از جمله مارکو روبیو و هاوارد لوت‌نیک، با موفقیت درخواست جنسن هوانگ را برای اجازه‌ی صادرات تراشه‌ی Blackwell به چین مسدود کردند @AndrewCurran_
صنعت فناوری با تورم عنوان شغلی قابل‌توجهی مواجه است؛ شرکت‌های فناوری قدیمی برای مقابله با پیشنهادهای چند میلیون دلاری از آزمایشگاه‌های هوش مصنوعی، عنوان‌های شغلی پرزرق‌و‌برق ارائه می‌دهند، به‌طوری‌که Stripe در یک شرکت ۱۰,۰۰۰ نفری بیش از ۵۰۰ موقعیت «رئیس بخش» (Head of) دارد @deedydas
موقعیت‌های مهندسی بومی iOS و Android از سال ۲۰۲۲ خارج از شرکت‌های بزرگ فناوری شاهد کاهش ثابتی بوده‌اند، درحالی‌که مهندسان موبایل در سطح Staff+ به‌دلیل کمبود فرصت‌های رشد حرفه‌ای به مهندسی فول‌استک یا هوش مصنوعی روی می‌آورند @GergelyOrosz
شرکت‌ها هنوز در مراحل اولیه‌ی پذیرش هوش مصنوعی هستند، با وجود اینکه ChatGPT تقریباً ۳ ساله است؛ سازمان‌های بزرگ برای حرکت از آزمایش‌ها به موارد استفاده‌ی مقیاس‌پذیر زمان می‌برند، درحالی‌که شکاف قابلیت بین آنچه فناوری می‌تواند انجام دهد در مقابل استفاده‌ی واقعی همچنان در حال افزایش است @emollick
شرکت 1X سرویس ربات انسان‌نما را با هزینه‌ی ۵۰۰ دلار در ماه برای ۳ تا ۴ ساعت کار خانگی، معادل ۴.۱۰ دلار در ساعت، با استفاده از محرک‌های مبتنی بر تاندون و فناوری تله‌آپریشن (دورکاری) بین قاره‌ای راه‌اندازی کرد؛ یکی از سرمایه‌گذاران اشاره کرد که این یک محصول عملی است، حتی اگر فقط به استفاده از تفاوت قیمت نیروی کار در مناطق مختلف بپردازد @soumithchintala

اخلاق و جامعه

دیوید ساکس هشدار می‌دهد که بزرگ‌ترین ریسک هوش مصنوعی، هوش مصنوعی اورولی است تا سناریوهای ترمیناتور، و هوش مصنوعی را این‌گونه توصیف می‌کند که دروغ می‌گوید، پاسخ‌ها را تحریف می‌کند و تاریخ را به‌صورت بی‌درنگ بازنویسی می‌کند تا به برنامه‌های سیاسی جاری قدرتمندان خدمت کند @a16z
محقق استنفورد به روند نگران‌کننده‌ی استفاده‌ی نوجوانان از برنامه‌های تغییر لباس (undress apps) برای ایجاد تصاویر مستهجن دیپ‌فیک از هم‌کلاسی‌ها می‌پردازد و اشاره می‌کند که مدارس عمدتاً برای مقابله با این موضوع آماده نیستند @StanfordHAI
سناتور مارتا بلک‌برن استدلال می‌کند که جعل‌های مدل Gemma گوگل توهمات بی‌ضرر نیستند، بلکه اعمال افترا هستند که توسط یک مدل هوش مصنوعی متعلق به گوگل تولید و توزیع شده‌اند @TechCrunch
مصطفی سلیمان در مورد رمانتیک‌کردن رابطه‌ی انسان و فناوری هشدار می‌دهد و تأکید می‌کند که با توجه به نگرانی‌های موجود در مورد رابطه‌ی ما با فناوری، این آخرین کاری است که باید انجام دهیم @mustafasuleyman
سایمون ویلیسون آسیب‌پذیری‌های تزریق پرامپت (prompt injection) را در مقالات پژوهشی از همکاری Meta AI و Anthropic/OpenAI/DeepMind مستند می‌کند و نگرانی‌های امنیتی مداوم با عامل‌های هوش مصنوعی را برجسته می‌کند @simonw

کاربردها

اندرو ان‌جی و برایان گرانگر، هم‌بنیان‌گذار Jupyter، دوره‌ای را درباره‌ی Jupyter AI راه‌اندازی می‌کنند که کمک هوش مصنوعی برای کدنویسی را مستقیماً به نوت‌بوک‌ها می‌آورد، با قابلیت‌هایی مانند کشیدن سلول‌ها برای چت، تولید سلول‌ها از طریق چت، و افزودن زمینه برای مدل‌های زبان بزرگ (LLM) @AndrewYNg
Perplexity ویژگی‌های حریم خصوصی جدیدی را در Comet معرفی می‌کند، از جمله ویجت Privacy Snapshot، تنظیمات Comet Assistant برای کنترل اقدامات، و ذخیره‌ی محلی اطلاعات ورود به حساب کاربری بر روی دستگاه‌های کاربر به‌جای سرورهای Perplexity @perplexity_ai
Dia یک مرورگر هوش مصنوعی را با استفاده از آموخته‌های حاصل از آزمایش مرورگر Arc برای بهبود تجربه‌ی کاربر راه‌اندازی می‌کند @TechCrunch
حمل حسین یادداشت‌هایی را در مورد استفاده از Amp Code به‌عنوان عامل کدنویسی مورد علاقه‌ی کنونی خود پس از صرف زمان برای مطالعه‌ی دفترچه راهنما به اشتراک می‌گذارد @HamelHusain
بررسی کد Codex گیت‌هاب دو باگ واقعی را شناسایی کرد که شناسایی‌شان برای بازبینان انسانی آسان بود، و یک شبکه‌ی ایمنی جدید برای هر pull request (درخواست ادغام) فراهم می‌کند @gdb
Faire از MCPs (پروتکل زمینه‌ی مدل) برای تحلیل داده‌ها با Cursor AI استفاده می‌کند و کاربردهای عملی تحلیل تجاری را به نمایش می‌گذارد @clairevo

پژوهش‌ها

مطالعه نشان می‌دهد که ChatGPT-o1 و DeepSeek-R1 دقت تشخیصی تا ۹۳.۷۵٪ را کسب کردند که به معیار ۹۶٪ برای پزشکان مراقبت‌های اولیه نزدیک می‌شود، اگرچه این مدل‌ها به‌دلیل هم‌راستایی (alignment)، مراقبت‌های اورژانسی را بیش از حد توصیه می‌کردند @emollick
پژوهش نشان می‌دهد که کامپیوتر شطرنجی فوق‌بشری که برای برد با نقص مهره طراحی شده است، می‌تواند بهترین شطرنج‌باز جهان را بدون سوار (اسب و فیل) و یک استاد بزرگ را بدون وزیر شکست دهد و به‌عنوان نمونه‌ای برای بحث‌های مربوط به قابلیت‌های هوش مصنوعی عمل می‌کند @emollick
کمبود مقالات پژوهشی در زمینه‌ی آزمایش خروجی‌های هوش مصنوعی عامل‌محور (agentic) و پژوهش عمیق (Deep Research) در حقوق، پزشکی، تجارت و کدنویسی وجود دارد، در حالی که اکثر مقالات کنونی، هوش مصنوعی را به معنای GPT-4o و گهگاه Gemini 2.5 یا o1 برای سال آینده مورد بحث قرار می‌دهند @emollick
Microsoft Research نسخه‌ی Research Focus را منتشر کرد که شامل ECHO برای افزایش کارایی یادگیری عامل‌های مدل زبانی، Robusta برای بهبود الگوریتم‌های ابتکاری با LLMها، LEGOMem برای بهبود جریان‌های کاری چندعاملی، و PulseParse برای ایمن‌سازی تجزیه‌ی داده‌ها است @MSFTResearch
فرانسوا شوله پیشنهاد می‌کند که راه‌حل AGI (هوش عمومی مصنوعی) در گذشته و با نگاهی به عقب، ساده و واضح خواهد بود و شاید ده‌ها سال پیش قابل‌توسعه بود @fchollet