اخبار هوش مصنوعی در 2025-11-03
مدلهای جدید هوش مصنوعی
- علیبابا پیشنمایش اولیهی Qwen3-Max-Thinking را منتشر کرد؛ یک نقطهی بازرسی (checkpoint) میانی که هنوز در حال آموزش است و هنگام استفاده از ابزار و محاسبات مقیاسپذیر در زمان تست، در معیارهای چالشبرانگیز استدلال مانند AIME 2025 و HMMT به ۱۰۰٪ دست مییابد @Alibaba_Qwen
تحلیل صنعت
- OpenAI مشارکت استراتژیک هفتسالهی ۳۸ میلیارد دلاری با AWS را برای تقویت اکوسیستم محاسباتی جهت مقیاسدهی هوش مصنوعی پیشرو اعلام کرد، درحالیکه سم آلتمن بر نیاز به محاسبات عظیم و قابلاعتماد برای قدرتبخشیدن به دوران بعدی هوش مصنوعی تأکید کرد @AndrewCurran_
- مایکروسافت برای اولین بار مجوز صادرات آمریکا را برای صادرات NVIDIA GPU به امارات متحدهی عربی دریافت کرد و برنامهریزی کرده است که طی چهار سال ۷.۹ میلیارد دلار برای مراکز داده هزینه کند، با معادل ۶۰,۴۰۰ تراشهی A100 که از GPUهای GB300 انویدیا استفاده میکنند @AndrewCurran_
- Loop Capital قیمت هدف انویدیا را ۱۰۰ دلار افزایش داد و پیشبینی میکند که این شرکت به ارزش بازار ۸.۵ تریلیون دلاری خواهد رسید @AndrewCurran_
- طبق گزارش وال استریت ژورنال، مقامات دولت ترامپ، از جمله مارکو روبیو و هاوارد لوتنیک، با موفقیت درخواست جنسن هوانگ را برای اجازهی صادرات تراشهی Blackwell به چین مسدود کردند @AndrewCurran_
- صنعت فناوری با تورم عنوان شغلی قابلتوجهی مواجه است؛ شرکتهای فناوری قدیمی برای مقابله با پیشنهادهای چند میلیون دلاری از آزمایشگاههای هوش مصنوعی، عنوانهای شغلی پرزرقوبرق ارائه میدهند، بهطوریکه Stripe در یک شرکت ۱۰,۰۰۰ نفری بیش از ۵۰۰ موقعیت «رئیس بخش» (Head of) دارد @deedydas
- موقعیتهای مهندسی بومی iOS و Android از سال ۲۰۲۲ خارج از شرکتهای بزرگ فناوری شاهد کاهش ثابتی بودهاند، درحالیکه مهندسان موبایل در سطح Staff+ بهدلیل کمبود فرصتهای رشد حرفهای به مهندسی فولاستک یا هوش مصنوعی روی میآورند @GergelyOrosz
- شرکتها هنوز در مراحل اولیهی پذیرش هوش مصنوعی هستند، با وجود اینکه ChatGPT تقریباً ۳ ساله است؛ سازمانهای بزرگ برای حرکت از آزمایشها به موارد استفادهی مقیاسپذیر زمان میبرند، درحالیکه شکاف قابلیت بین آنچه فناوری میتواند انجام دهد در مقابل استفادهی واقعی همچنان در حال افزایش است @emollick
- شرکت 1X سرویس ربات انساننما را با هزینهی ۵۰۰ دلار در ماه برای ۳ تا ۴ ساعت کار خانگی، معادل ۴.۱۰ دلار در ساعت، با استفاده از محرکهای مبتنی بر تاندون و فناوری تلهآپریشن (دورکاری) بین قارهای راهاندازی کرد؛ یکی از سرمایهگذاران اشاره کرد که این یک محصول عملی است، حتی اگر فقط به استفاده از تفاوت قیمت نیروی کار در مناطق مختلف بپردازد @soumithchintala
اخلاق و جامعه
- دیوید ساکس هشدار میدهد که بزرگترین ریسک هوش مصنوعی، هوش مصنوعی اورولی است تا سناریوهای ترمیناتور، و هوش مصنوعی را اینگونه توصیف میکند که دروغ میگوید، پاسخها را تحریف میکند و تاریخ را بهصورت بیدرنگ بازنویسی میکند تا به برنامههای سیاسی جاری قدرتمندان خدمت کند @a16z
- محقق استنفورد به روند نگرانکنندهی استفادهی نوجوانان از برنامههای تغییر لباس (undress apps) برای ایجاد تصاویر مستهجن دیپفیک از همکلاسیها میپردازد و اشاره میکند که مدارس عمدتاً برای مقابله با این موضوع آماده نیستند @StanfordHAI
- سناتور مارتا بلکبرن استدلال میکند که جعلهای مدل Gemma گوگل توهمات بیضرر نیستند، بلکه اعمال افترا هستند که توسط یک مدل هوش مصنوعی متعلق به گوگل تولید و توزیع شدهاند @TechCrunch
- مصطفی سلیمان در مورد رمانتیککردن رابطهی انسان و فناوری هشدار میدهد و تأکید میکند که با توجه به نگرانیهای موجود در مورد رابطهی ما با فناوری، این آخرین کاری است که باید انجام دهیم @mustafasuleyman
- سایمون ویلیسون آسیبپذیریهای تزریق پرامپت (prompt injection) را در مقالات پژوهشی از همکاری Meta AI و Anthropic/OpenAI/DeepMind مستند میکند و نگرانیهای امنیتی مداوم با عاملهای هوش مصنوعی را برجسته میکند @simonw
کاربردها
- اندرو انجی و برایان گرانگر، همبنیانگذار Jupyter، دورهای را دربارهی Jupyter AI راهاندازی میکنند که کمک هوش مصنوعی برای کدنویسی را مستقیماً به نوتبوکها میآورد، با قابلیتهایی مانند کشیدن سلولها برای چت، تولید سلولها از طریق چت، و افزودن زمینه برای مدلهای زبان بزرگ (LLM) @AndrewYNg
- Perplexity ویژگیهای حریم خصوصی جدیدی را در Comet معرفی میکند، از جمله ویجت Privacy Snapshot، تنظیمات Comet Assistant برای کنترل اقدامات، و ذخیرهی محلی اطلاعات ورود به حساب کاربری بر روی دستگاههای کاربر بهجای سرورهای Perplexity @perplexity_ai
- Dia یک مرورگر هوش مصنوعی را با استفاده از آموختههای حاصل از آزمایش مرورگر Arc برای بهبود تجربهی کاربر راهاندازی میکند @TechCrunch
- حمل حسین یادداشتهایی را در مورد استفاده از Amp Code بهعنوان عامل کدنویسی مورد علاقهی کنونی خود پس از صرف زمان برای مطالعهی دفترچه راهنما به اشتراک میگذارد @HamelHusain
- بررسی کد Codex گیتهاب دو باگ واقعی را شناسایی کرد که شناساییشان برای بازبینان انسانی آسان بود، و یک شبکهی ایمنی جدید برای هر pull request (درخواست ادغام) فراهم میکند @gdb
- Faire از MCPs (پروتکل زمینهی مدل) برای تحلیل دادهها با Cursor AI استفاده میکند و کاربردهای عملی تحلیل تجاری را به نمایش میگذارد @clairevo
پژوهشها
- مطالعه نشان میدهد که ChatGPT-o1 و DeepSeek-R1 دقت تشخیصی تا ۹۳.۷۵٪ را کسب کردند که به معیار ۹۶٪ برای پزشکان مراقبتهای اولیه نزدیک میشود، اگرچه این مدلها بهدلیل همراستایی (alignment)، مراقبتهای اورژانسی را بیش از حد توصیه میکردند @emollick
- پژوهش نشان میدهد که کامپیوتر شطرنجی فوقبشری که برای برد با نقص مهره طراحی شده است، میتواند بهترین شطرنجباز جهان را بدون سوار (اسب و فیل) و یک استاد بزرگ را بدون وزیر شکست دهد و بهعنوان نمونهای برای بحثهای مربوط به قابلیتهای هوش مصنوعی عمل میکند @emollick
- کمبود مقالات پژوهشی در زمینهی آزمایش خروجیهای هوش مصنوعی عاملمحور (agentic) و پژوهش عمیق (Deep Research) در حقوق، پزشکی، تجارت و کدنویسی وجود دارد، در حالی که اکثر مقالات کنونی، هوش مصنوعی را به معنای GPT-4o و گهگاه Gemini 2.5 یا o1 برای سال آینده مورد بحث قرار میدهند @emollick
- Microsoft Research نسخهی Research Focus را منتشر کرد که شامل ECHO برای افزایش کارایی یادگیری عاملهای مدل زبانی، Robusta برای بهبود الگوریتمهای ابتکاری با LLMها، LEGOMem برای بهبود جریانهای کاری چندعاملی، و PulseParse برای ایمنسازی تجزیهی دادهها است @MSFTResearch
- فرانسوا شوله پیشنهاد میکند که راهحل AGI (هوش عمومی مصنوعی) در گذشته و با نگاهی به عقب، ساده و واضح خواهد بود و شاید دهها سال پیش قابلتوسعه بود @fchollet