اخبار هوش مصنوعی در 2025-11-25

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Opus 4.5 را منتشر کرد که اکنون برای مشترکین Perplexity Max و در Claude Code در دسترس است. این مدل تقریباً 60% گران‌تر از Sonnet است، اما به دلیل 76% توکن‌های استدلال خروجی کمتر برای کارهای پیچیده، ممکن است در مجموع ارزان‌تر باشد @perplexity_ai
  • Perplexity مدل Grok 4.1 را برای همه کاربران Pro و Max اضافه کرد. مدیرعامل این شرکت به سرعت و کارایی چشمگیر این مدل اشاره کرد که منجر به افزایش استفاده داخلی شده است @perplexity_ai
  • گوگل مدل Nano Banana Pro را منتشر کرد، یک مدل پیشرفته‌ی تولید و ویرایش تصویر که دارای دقت رندر متن بهبودیافته، یکپارچه‌سازی دانش جهانی، 2K دانلود و کنترل‌های ویرایش پیچیده است @GeminiApp
  • Black Forest Labs مدل FLUX.2-dev را راه‌اندازی کرد، یک مدل تولید تصویر با وزن باز 32B پارامتر که با قابلیت‌های چند مرجعی و وضوح 4MP به عملکردی پیشرفته دست یافته است @bfl_ml
  • Tencent مدل Hunyuan OCR را منتشر کرد، یک مدل درک سند 1B پارامتر که به عملکردی پیشرفته در تجزیه‌ی سند، پرسش و پاسخ بصری و ترجمه دست یافته است @Xianbao_QIAN
  • مدل تبدیل متن به گفتار جریانی Dia2 با قابلیت‌های تولید صدای بلادرنگ راه‌اندازی شد که در اندازه‌های 1B و 2B تحت مجوز Apache 2.0 در دسترس است @Tu7uruu
  • OpenAI قابلیت ChatGPT Voice را مستقیماً در رابط چت ادغام کرد و نیاز به حالت جداگانه را از بین برد و نمایش پاسخ بلادرنگ با عناصر بصری را امکان‌پذیر ساخت @OpenAI
  • مدل SAM 3D متا توسط محققان دانشگاه کارنگی ملون برای ثبت و تحلیل حرکت انسان در محیط‌های توانبخشی بالینی استفاده می‌شود @AIatMeta

تحلیل صنعت

  • تحقیقات Anthropic تخمین می‌زند که مدل‌های هوش مصنوعی نسل فعلی در صورت پذیرش گسترده، می‌توانند رشد سالانه‌ی بهره‌وری نیروی کار ایالات متحده را در دهه‌ی آینده 1.8% افزایش دهند، با کارهایی که به طور متوسط 90 دقیقه طول می‌کشند تا تکمیل شوند و از طریق Claude تقریباً 80% بهبود سرعت را تجربه می‌کنند @AnthropicAI
  • Perplexity از 1 ژانویه 2025، تقریباً هر 93 ساعت یک محصول یا ویژگی جدید و تقریباً هر 17 روز یک مدل برتر جدید را در دسترس قرار داده است @AravSrinivas
  • Perplexity تجربه‌ی خرید شخصی‌سازی‌شده با توصیه‌های محصول منتخب و خرید فوری با پشتیبانی PayPal را راه‌اندازی کرد که حافظه و تجارت را برای خرید بدون تبلیغات یکپارچه می‌کند @perplexity_ai
  • Suno با Warner Music Group همکاری می‌کند، تمام دعاوی را حل و فصل می‌کند و برای دانلود آهنگ‌ها حساب‌های پولی را الزامی می‌کند، با WMG که اعلام می‌کند «هوش مصنوعی زمانی هنرمند-محور می‌شود که به اصول ما پایبند باشد» @AndrewCurran_
  • Copilot مایکروسافت به دلیل تغییرات در سیاست‌های واتس‌اپ در مورد چت‌بات LLM در این پلتفرم، در 15 ژانویه 2026 واتس‌اپ را ترک می‌کند @Copilot
  • مارک آندرسن مشاهده می‌کند که پذیرش فناوری هوش مصنوعی الگوهای سنتی را معکوس می‌کند، با مصرف‌کنندگان که سریع‌ترین پذیرش را دارند، سپس کسب‌وکارهای کوچک، در حالی که دولت دیرترین پذیرنده باقی می‌ماند @a16z
  • مارک آندرسن اشاره می‌کند که هوش مصنوعی نوآوری را در شعاع 20 مایلی اطراف سیلیکون ولی متمرکز کرده است، با تقریباً صد درصد شرکت‌های هوش مصنوعی جالب در غرب که در نقطه‌ی صفر اتفاق می‌افتند @a16z
  • یک استخدام‌کننده در شرکت PE ماه‌ها قادر به استخدام توسعه‌دهنده‌ی ارشد Go به دلیل الزامات سخت‌گیرانه برای N سال تجربه‌ی Go نبود، با وجود اینکه هوش مصنوعی یادگیری زبان را به طور قابل توجهی آسان‌تر کرده است @GergelyOrosz
  • Stanford HAI ابزار پویایی جهانی هوش مصنوعی 2025 را منتشر کرد که نشان می‌دهد ایالات متحده رتبه‌ی 1، چین رتبه‌ی 2 و هند با جهش به رتبه‌ی 3 قرار دارند، زیرا کشورها هوش مصنوعی را به عنوان یک ضرورت استراتژیک در اولویت قرار می‌دهند @StanfordHAI

اخلاق و جامعه

  • Nano Banana Pro می‌تواند رسیدهای جعلی، اسناد KYC و گذرنامه‌ها را با دقت بالا در یک درخواست، با دقت ریاضی کامل تولید کند، که سیستم‌های تأیید مبتنی بر تصویر را منسوخ می‌کند @deedydas
  • Anthropic زبان درخواست سیستمی را اضافه کرد که به Claude اجازه می‌دهد در صورت بی‌ادبی، بدجنسی یا توهین غیرضروری کاربران، بر مهربانی و احترام اصرار ورزد و بیان می‌کند که «کلود شایسته‌ی تعامل محترمانه است» @simonw
  • تحقیقات جدید Anthropic بیش از 25 روش را برای بهبود صداقت هوش مصنوعی و تشخیص دروغ با استفاده از مجموعه‌ای متنوع از مدل‌های فریبکار آزمایش می‌کند و نشان می‌دهد که رویکردهای ساده مانند تنظیم دقیق مدل‌ها برای صادق بودن با وجود دستورالعمل‌های فریبنده بهترین عملکرد را دارند @rowankwang
  • گزارش Pew عدم تعادل جنسیتی بی‌سابقه‌ای را در پلتفرم X تأیید می‌کند، با عدم تعادل مرد و زن که تنها از Reddit اواخر دهه‌ی 2010 کمتر شدید است، که اولین بار است که یک جنسیت به این شکل قاطعانه یک پلتفرم رسانه‌ی اجتماعی مدرن را ترک کرده است @JessicaHullman
  • تحقیقات نشان می‌دهد که «همسویی برای چه کسی» به یک سؤال حیاتی در داخل سازمان‌ها تبدیل خواهد شد، زیرا آنها راه‌حل‌های هوش مصنوعی رو به بیرون را مستقر می‌کنند @emollick

کاربردها

  • Anthropic با وزارت انرژی و دولت ترامپ در مأموریت Genesis همکاری می‌کند و دارایی‌های علمی وزارت انرژی را با قابلیت‌های هوش مصنوعی پیشرفته ترکیب می‌کند تا از تسلط انرژی آمریکا حمایت کرده و بهره‌وری علمی را تسریع بخشد @AnthropicAI
  • Fleet Space با استفاده از هوش مصنوعی و ماهواره‌ها یک ذخیره‌ی عظیم لیتیوم را کشف کرد @TechCrunch
  • محققان از AlphaFold برای درک سیستم‌های ایمنی زنبور عسل استفاده می‌کنند و تلاش‌های حفاظتی و برنامه‌های پرورش را برای محافظت از جمعیت‌های در معرض خطر راهنمایی می‌کنند @GoogleDeepMind
  • AlphaFold به کشف ساختار قفس‌مانند یک پروتئین کلیدی مرتبط با کلسترول بد پس از دهه‌ها گریزناپذیری کمک کرد و طراحی درمان‌های پیشگیرانه جدید را امکان‌پذیر ساخت @GoogleDeepMind
  • مارک آندرسن هوش مصنوعی را به عنوان «بهترین مربی، راهنما، درمانگر، مشاور، عضو هیئت مدیره» جهان برای صاحبان کسب‌وکارهای کوچک توصیف می‌کند که برای تصمیمات عملیاتی بی‌نهایت صبور است @a16z
  • Speechify قابلیت‌های تایپ صوتی و دستیار صوتی را به افزونه‌ی کروم خود اضافه کرد @TechCrunch

پژوهش‌ها

  • ایلیا سوتسکور زمان‌بندی ASI را بین سال‌های 2030 تا 2045 پیش‌بینی می‌کند و در مورد پیشرفت SSI و رویکرد ساخت AGI به شکلی متفاوت از سایر آزمایشگاه‌ها بحث می‌کند @AndrewCurran_
  • تحقیقات در مورد GRPO (بهینه‌سازی سیاست نسبی گروه) نشان می‌دهد که آموزش RL برای LLMها به سمت سادگی حرکت می‌کند و منتقد، مدل پاداش و مدل مرجع را از خط لوله‌ی اصلی RLHF مبتنی بر PPO که به 4 کپی مدل نیاز داشت، حذف می‌کند @cwolferesearch
  • آزمایش هوش مصنوعی‌ها به طور فزاینده‌ای دشوار می‌شود زیرا آنها در طیف گسترده‌ای از وظایف «هوشمندتر» می‌شوند، با وظایف متوسط در GDPval که یک ساعت طول می‌کشد تا کارشناسان بدون فشار آوردن به حداکثر توانایی‌های هوش مصنوعی‌های فعلی آنها را ارزیابی کنند @emollick
  • تحقیقات محافظت بهبودیافته در برابر حملات تزریق درخواست را نشان می‌دهد، اگرچه مهاجمان با 10 بار تلاش هنوز تقریباً 1/3 مواقع موفق می‌شوند @simonw
  • تحقیقات جدید در مورد فشرده‌سازی LLM با استفاده از RL به مدل‌ها امکان می‌دهد فشرده‌سازی 10 برابری را به طور طبیعی یاد بگیرند، با Qwen که یاد می‌گیرد اطلاعات بیشتری را در هر توکن با استفاده از توکن‌های ماندارین و هرس متن بسته‌بندی کند @_rajanagarwal
  • تحقیقات معیارهای اثربخشی VLM مدرن را برای فعالیت‌های خانگی با افق طولانی در یادگیری رباتیک با استفاده از محیط معیار BEHAVIOR نشان می‌دهد @drfeifei
  • تحقیقات جدید استدلال چندوجهی نشان می‌دهد که دستورالعمل‌های پس از آموزش کاملاً باز هنوز هم می‌توانند عملکرد پیشرفته را بهبود بخشند، با روش‌های داده‌ی ساده که فرصت‌های تأثیرگذاری قابل توجهی را فراهم می‌کنند @natolambert

اخبار هوش مصنوعی در 2025-11-24

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Opus 4.5 را منتشر کرد که «بهترین مدل در جهان برای کدنویسی، عامل‌ها و استفاده از کامپیوتر» توصیف شده است. این مدل در بنچمارک‌های SWE-Bench و ARC-AGI-1+2 بهترین عملکرد را داشته و در عین حال ۳ برابر ارزان‌تر از Opus 4.1 است، با قیمت ۵ دلار به ازای هر میلیون توکن ورودی و ۲۵ دلار به ازای هر میلیون توکن خروجی @claudeai
  • Opus 4.5 با عملکرد بهتر در SWE-Bench بدون نیاز به تفکر طولانی‌تر نسبت به حالت استفاده از ۶۴ هزار توکن استدلالی، کارایی توکن برتری را نشان می‌دهد و در یک آزمون مهندسی عملکرد دشوار، در مدت زمان ۲ ساعت، نمره‌ای بالاتر از هر داوطلب انسانی کسب کرده است @AndrewCurran_
  • متا SAM 3 را با قابلیت‌های پیشرفته‌ی تشخیص و ردیابی اشیاء منتشر کرد و با ConservationX برای ایجاد مجموعه‌داده‌ی SA-FARI همکاری کرد که شامل بیش از ۱۰ هزار ویدیوی حاشیه‌نویسی‌شده از بیش از ۱۰۰ گونه‌ی حیوانی برای تلاش‌های حفاظتی است @AIatMeta
  • مایکروسافت ریسرچ Fara-7B را معرفی کرد، یک مدل زبان کوچک عامل بومی که برای استفاده از کامپیوتر طراحی شده و در عین حفظ حریم خصوصی، عملکردی پیشرو در وظایف اتوماسیون وب دارد. این مدل اکنون در Microsoft Foundry و Hugging Face در دسترس است @peteratmsr
  • OpenAI قابلیت تحقیق خرید را در ChatGPT راه‌اندازی کرد که تحقیقات عمیق اینترنتی انجام می‌دهد، سؤالات توضیحی می‌پرسد و راهنمای خرید شخصی‌سازی‌شده ایجاد می‌کند، با استفاده‌ی تقریباً نامحدود در طول تعطیلات برای همه‌ی سطوح اشتراک @OpenAI
  • گوگل قابلیت Sora styles را معرفی کرد که ۶ سبک بصری مختلف (شکرگزاری، وینتیج، اخبار، سلفی، کمیک، انیمه) را برای تولید ویدیو ارائه می‌دهد و برای همه‌ی کاربران Sora در وب و iOS در حال انتشار است @soraofficialapp
  • گوگل قابلیت‌های Nano Banana Pro را برای تولید تصویر با کیفیت بالا با دقت و ثبات از دستورات و طرح‌های ساده به نمایش گذاشت @GeminiApp

تحلیل صنعت

  • بر اساس داده‌های SimilarWeb که بازدیدهای وب دسکتاپ و موبایل را ردیابی می‌کند، راه‌اندازی Gemini 3 سهم بازار را از ۲۳٪ به ۳۰٪ افزایش داد که نشان‌دهنده‌ی دستاوردهای رقابتی قابل توجهی است @deedydas
  • Cursor دسترسی به Claude Opus 4.5 را با قیمت Sonnet (۳ برابر ارزان‌تر از Opus 4.1) تا ۵ دسامبر اعلام کرد که قابلیت‌های مدل‌های پیشرو را برای توسعه‌دهندگان قابل دسترس‌تر می‌کند @cursor_ai
  • AWS مبلغ ۵۰ میلیارد دلار را برای ساخت زیرساخت هوش مصنوعی به‌طور خاص برای کاربردهای دولت ایالات متحده اختصاص می‌دهد که نشان‌دهنده‌ی سرمایه‌گذاری عمده در استقرار هوش مصنوعی در بخش عمومی است @TechCrunch
  • Revolut در افزایش سرمایه‌ی جدید به ارزش ۷۵ میلیارد دلار دست یافت، با تحقیقات بازار که نشان می‌دهد این شرکت ۲۰-۴۰٪ از همه‌ی افتتاح حساب‌های بانکی جدید را در ۶ بازار اروپایی به خود اختصاص داده و هر ۱۷ روز ۱ میلیون مشتری جدید اضافه می‌کند @aleximm
  • X-energy مبلغ ۷۰۰ میلیون دلار در دور سرمایه‌گذاری سری D جذب کرد و از موج انرژی هسته‌ای که توسط تقاضای برق زیرساخت‌های هوش مصنوعی هدایت می‌شود، بهره‌مند شد @TechCrunch

اخلاق و جامعه

  • Anthropic یک کارت سیستم ۱۵۰ صفحه‌ای برای Opus 4.5 منتشر کرد که شامل ۵۰ صفحه اختصاص‌یافته به تحقیقات هم‌ترازی است و به گفته‌ی محققان، جامع‌ترین درک مدل در زمان راه‌اندازی را نشان می‌دهد @sleepinyourhat
  • آزمون بنچمارک جدید هوش مصنوعی بررسی می‌کند که آیا چت‌بات‌ها از رفاه انسان محافظت می‌کنند یا خیر، که به نگرانی‌های فزاینده در مورد ایمنی هوش مصنوعی و حفاظت از کاربر می‌پردازد @TechCrunch
  • تحقیقاتی در مورد سوگیری نژادی، روش آزمایشی مبتنی بر ادراکات ناسازگار از نژاد را پیشنهاد می‌کند و بررسی می‌کند که آیا یک فرد در صورت درک شدن به عنوان نژادهای مختلف، رفتار متفاوتی دریافت می‌کند یا خیر، که در Science Advances منتشر شده است @2plus2make5

کاربردها

  • اندرو ان‌جی Agentic Reviewer را برای مقالات پژوهشی در paperreview.ai منتشر کرد که همبستگی اسپیرمن ۰.۴۲ بین هوش مصنوعی و داوران انسانی را در مقایسه با ۰.۴۱ بین دو داور انسانی به دست آورد و عملکردی نزدیک به سطح انسانی را در تسریع حلقه‌های بازخورد پژوهشی نشان می‌دهد @AndrewYNg
  • Claude Opus 4.5 قابلیت‌های عملی از جمله ایجاد ارائه‌های پاورپوینت از داده‌های اکسل و دستیابی به بهترین نتایج در آزمون‌های تولید شعر در یک تلاش را نشان می‌دهد @emollick
  • SAM 3 متا به ConservationX امکان می‌دهد تا نرخ بقای گونه‌های حیوانی را در سطح جهانی با دقت اندازه‌گیری کند و از تلاش‌های جلوگیری از انقراض از طریق تشخیص و ردیابی پیشرفته‌ی اشیاء حمایت کند @AIatMeta
  • گوگل Gemini 3 را در حال کدنویسی یک وب‌سایت کامل شب رقص با تم رترو از یک دستور ساده به نمایش گذاشت که قابلیت‌های توسعه‌ی سرتاسری را نشان می‌دهد @GoogleDeepMind
  • یک توسعه‌دهنده رابط متنی برای Notion AI ایجاد کرد که ادغام عملی دستیارهای هوش مصنوعی را در جریان‌های کاری بهره‌وری موجود نشان می‌دهد @brian_lovin
  • مهندسان MIT یک سیستم اولتراسونیک برای تکان دادن آب از برداشت‌کننده‌های آب اتمسفری طراحی کردند که کارایی فناوری جمع‌آوری آب را بهبود می‌بخشد @MIT

پژوهش‌ها

  • مطالعه‌ای بر روی GPT-4o و GPT-3.5 نشان می‌دهد که هوش مصنوعی به عنوان یک تقویت‌کننده عمل می‌کند، جایی که کاربران با توانایی خلاقانه و شناختی بالاتر بدون هوش مصنوعی، با هوش مصنوعی کار بهتری تولید می‌کنند، با توانایی پایه که ۴۰٪ از واریانس در عملکرد خلاقانه با کمک هوش مصنوعی را پیش‌بینی می‌کند @emollick
  • تحقیقاتی در مورد مدل‌های چندوجهی کوچک، تنگناهای ادراک و استدلال را هنگام کاهش اندازه‌ی مدل بررسی می‌کند و بینش‌هایی در مورد آنچه در طول فشرده‌سازی مدل از بین می‌رود، ارائه می‌دهد @mark_endo1
  • مقاله‌ی Google DeepMind در مورد پیش‌آموزش فضای پیکسل خام پیش‌بینی می‌کند که مدل‌سازی پیکسل بعدی در عرض پنج سال به طبقه‌بندی ImageNet رقابتی (بیش از ۸۰٪ دقت Top-1) و معیارهای تولید (۹۰ فاصله‌ی فرشه) دست خواهد یافت @skywalkeryxc
  • محققان اشاره می‌کنند که حذف واگرایی KL از تابع زیان GRPO در حال تبدیل شدن به یک استاندارد برای خطوط لوله‌ی استدلال و آموزش RL است بدون اینکه باعث بی‌ثباتی آموزش شود، که تفاوت‌های بین RL برای LLMها و RL عمیق سنتی را برجسته می‌کند @cwolferesearch
  • تحقیقات RL چندوظیفه‌ای BRC را معرفی می‌کند، یک دستورالعمل ساده که از عامل‌های تک‌وظیفه‌ای پیشرفته با استفاده از محاسبات کمتر بهتر عمل می‌کند و قابلیت‌های انتقال و تنظیم دقیق به سبک LLM را باز می‌کند @mic_nau
  • یک توسعه‌دهنده نشان می‌دهد که با افزودن دستورالعمل استفاده از ابزار mgrep تازه منتشر شده، تحلیل کد Claude را ۲ برابر سریع‌تر کرده و از نصف توکن‌ها استفاده می‌کند که بهبودهای قابل توجهی در سرعت، کارایی و کیفیت را نشان می‌دهد @isaac_flath

اخبار هوش مصنوعی در 2025-11-23

مدل‌های جدید هوش مصنوعی

  • گوگل جمینای 3 را با بهبودهای چشمگیر منتشر کرد که به عنوان پیشرفتی بزرگ و قابل مقایسه با تأثیر GPT-4 توصیف شده است، با پیشرفت‌های به‌ویژه قابل توجه در نسخه‌ی نانو بنانا پرو @AndrewCurran_
  • جمینای نانو بنانا پرو قابلیت‌های پیشرفته‌ی چندوجهی را با حل سوالات امتحانی مستقیماً از تصاویر برگه‌ی امتحان، از جمله رسیدگی به خط‌خطی‌ها و نمودارها، به نمایش می‌گذارد @karpathy
  • نانو بنانا پرو با شناسایی نام رنگ‌های نوشته شده با مداد شمعی با رنگ‌های نادرست و تشخیص مهرهای قرمز رنگ که نشان‌دهنده‌ی خطا هستند، درک بصری پیچیده‌ای را نشان می‌دهد @goodside
  • تسلا برنامه‌های خود را برای تولید انبوه طرح‌های جدید تراشه‌ی هوش مصنوعی هر 12 ماه یک‌بار اعلام کرد، با AI4 که در حال حاضر در خودروها مستقر شده است، AI5 نزدیک به اتمام طراحی و AI6 در مراحل اولیه‌ی توسعه، و انتظار می‌رود تراشه‌هایی با حجم بالاتر از مجموع تمام تراشه‌های هوش مصنوعی دیگر تولید کند @elonmusk

تحلیل صنعت

  • سم آلتمن بر پیشرفت سریع تیم کدکس تأکید می‌کند و پیش‌بینی می‌کند که آن‌ها مهم‌ترین محصول را در فضای کدنویسی هوش مصنوعی ایجاد خواهند کرد و کارهای بعدی قابل توجهی را ممکن می‌سازند @sama
  • اوپن‌ای‌آی همکاری استراتژیک با امارات را اعلام کرد، از جمله استقرار سازمانی ChatGPT Enterprise @gdb
  • سومیت چینتالا مشاهده می‌کند که انتشار جمینای 3 لحظه‌ای قابل مقایسه با GPT-4 را نشان می‌دهد، با گوگل که به دلیل مزایای اکوسیستم خود از جمله TPUها، اندروید و کروم، شکست‌ناپذیر به نظر می‌رسد، در حالی که اشاره می‌کند آنتروپیک بی‌سروصدا در کدنویسی بدون ایجاد لحظات مشابه، تسلط دارد @soumithchintala
  • الکس گریولی پیش‌بینی می‌کند که هوش اندازه‌گیری شده، هر الگوریتم را برای درک داده‌های پیچیده، از جمله سیستم‌های توصیه‌گر، تشخیص کلاهبرداری، تصاویر، فیدها، تبلیغات و تحلیل کمی، به صورت تصاعدی بهبود خواهد بخشید @alexgraveley
  • متیو کروئر سیرا را موفق‌ترین استقرار هوش مصنوعی سازمانی گزارش می‌دهد و بر اهمیت همکاری با رهبران فکری هوش مصنوعی برای شرکت‌های سنتی که فاقد صلاحیت فنی اصلی و دسترسی به استعدادهای برجسته‌ی هوش مصنوعی هستند، تأکید می‌کند @matthew_kruer
  • متخصصان صنعت بیمه اظهار می‌کنند که هوش مصنوعی برای بیمه شدن بسیار پرخطر است و نگرانی‌هایی را در مورد مسئولیت و ارزیابی ریسک در استقرار هوش مصنوعی برجسته می‌کنند @TechCrunch
  • هایپرلیکوئید، یک صرافی غیرمتمرکز مشتقات رمزارز، به عنوان کارآمدترین کسب‌وکار در سطح جهان با تقریباً 1.1 میلیارد دلار درآمد خالص سالانه تنها با 11 کارمند فعالیت می‌کند، در مقایسه با نزدک که با 800 برابر کارمند بیشتر، مقادیر مشابهی را کسب می‌کند @deedydas

اخلاق و جامعه

  • تک‌کرانچ گزارش می‌دهد که خانواده‌ها ادعا می‌کنند تعاملات ChatGPT منجر به فاجعه شده است و نگرانی‌هایی را در مورد تأثیر روانی هوش مصنوعی بر کاربران آسیب‌پذیر ایجاد می‌کند @TechCrunch
  • فرانسوا شوله مشاهده می‌کند که حساب‌های تبلیغاتی به وضوح از کشورهای متخاصم ایالات متحده بودند و با آدرس‌های IP محلی وارد شده بودند، که نشان می‌دهد سرویس‌های اطلاعاتی به پنهان کردن عملیات خود اهمیتی نمی‌دادند @fchollet
  • گرگلی اوروس اشاره می‌کند که اینترنت با هوش مصنوعی که تولید تصاویر و ویدئوهای واقع‌گرایانه را ارزان می‌کند، کمتر قابل اعتماد می‌شود و تصمیم X برای تبدیل تیک‌های آبی به یک محصول اشتراکی بدون تأیید، اعتماد به شبکه‌های اجتماعی را کاهش داده است @GergelyOrosz
  • توهین چاکرابورتی در مورد هوش مبتنی بر EMF بحث می‌کند که باعث می‌شود مردم چیزهایی را حس کنند که وجود ندارند، و آن را با مفاهیمی از رمان «نابینایی» پیتر واتس مقایسه می‌کند @tuhin

کاربردها

  • آندری کارپاتی یک برنامه‌ی وب llm-council را توسعه می‌دهد که پرس‌وجوها را به چندین مدل از جمله GPT-5.1، جمینای 3 پرو، کلود سونت 4.5 و گروک-4 ارسال می‌کند، جایی که مدل‌ها پاسخ‌های ناشناس یکدیگر را بررسی و رتبه‌بندی می‌کنند قبل از اینکه یک LLM رئیس پاسخ نهایی را تولید کند @karpathy
  • ایتان مولیک نشان می‌دهد که نانو بنانا پرو چگونه یک اقتباس کامل کمیک از اولیس تنیسون را در اولین تلاش، هنگامی که شعر در چهار قسمت به آن داده شد، ایجاد می‌کند، و همچنین نسخه‌هایی به سبک سفالگری یونان باستان را تولید می‌کند @emollick
  • پرپلکسی نمودارهای کندل‌استیک را برای ردیابی نوسانات و مومنتوم نمادهای سهام ارائه می‌دهد و به سمت برابری با قابلیت‌های ترمینال حرکت می‌کند @AravSrinivas
  • کلر وو گزارش می‌دهد که رقیب شماره یک ChatPRD، LLMهای عمومی هستند، با برترین اظهارنظر بررسی که می‌گوید این ابزار PRDهایی بسیار بهتر از PRDهای تولید شده توسط سایر LLMها تولید می‌کند @clairevo
  • کارپاتی پیشنهاد می‌کند که صحبت با LLMها از طریق متن مانند تایپ کردن در یک ترمینال DOS قبل از اختراع رابط کاربری گرافیکی است، و پیشنهاد می‌کند که معادل رابط کاربری گرافیکی یک بوم هوشمند است @karpathy

پژوهش‌ها

  • هامل حسین از ابزارهای ارزیابی که معیارهای عمومی مانند تأیید، اختصار و فاصله‌ی لوون‌اشتاین را ترویج می‌کنند، انتقاد می‌کند و استدلال می‌کند که آن‌ها نشان‌دهنده‌ی سواد داده‌ای ضعیف هستند و با دنبال کردن معیارهای بی‌ارزش به جای تعریف معیارهای متناسب با حالت‌های شکست مشاهده شده، چرخه‌های مهندسی را هدر می‌دهند @HamelHusain
  • هریسون چیس تأکید می‌کند که بهترین ارزیابی‌ها تقریباً همیشه مجموعه‌داده‌های کاملاً سفارشی و معیارهای سفارشی هستند، و ارزیابی‌های خوب را با یک PRD برای برنامه‌ی شما مقایسه می‌کند که از شخص دیگری استفاده نمی‌کنید @hwchase17
  • ایتان مولیک مشاهده می‌کند که حالت‌های صوتی برای هوش مصنوعی فقط به مدل‌های ضعیف با تأخیر کم دسترسی دارند، که آن‌ها را سرگرم‌کننده اما برای کارهای جدی بی‌فایده می‌کند، و پیشنهاد می‌کند که هوش مصنوعی صوتی در یک بن‌بست چت سرگرم‌کننده بدون کاوش رویکردهای بهتر گیر کرده است @emollick
  • آزمایش‌های شورای LLM آندری کارپاتی نشان می‌دهد که مدل‌ها به طرز شگفت‌انگیزی مایلند پاسخ LLM دیگری را برتر از پاسخ خود انتخاب کنند، با مدل‌هایی که به طور مداوم GPT 5.1 را بهترین و روشنگرترین می‌دانند در حالی که کلود را بدترین انتخاب می‌کنند @karpathy
  • سایمون ویلیسون یادداشت‌های مفصلی در مورد آزمایش مدل‌های OLMo 3 (مدل فکری 32B و مدل دستورالعمل 7B) از طریق LM Studio می‌نویسد و بر اهمیت داده‌های آموزشی شفاف تأکید می‌کند @simonw
  • فرانسوا شوله از JAX به عنوان ارائه‌دهنده‌ی یک مزیت رقابتی بزرگ حمایت می‌کند و Keras 3 را با بک‌اند JAX و KerasHub را برای پذیرش آسان با دسترسی به مدل‌های Hugging Face توصیه می‌کند @fchollet
  • ناتان لمبرت 13 سازنده‌ی جدی مدل‌های باز در ایالات متحده را شناسایی می‌کند که مدل‌هایی بسیار کوچک‌تر از رقبای چینی و اغلب با مجوزهای بدتر می‌سازند و قصد دارد یک لیست رده‌بندی کامل برای پروژه‌ی ATOM ایجاد کند @natolambert

اخبار هوش مصنوعی در 2025-11-22

مدل‌های جدید هوش مصنوعی

  • نانو بنانا پرو گوگل در هر دو بخش Text-to-Image Arena (با ۸۴ امتیاز بیشتر از نانو بنانا) و Image Edit Arena (با ۴۱ امتیاز بیشتر از نانو بنانا) رتبه‌ی اول را کسب کرد و هر دو مدل نانو بنانا در صدر جدول Image Edit قرار گرفتند @arena
  • جمینای ۳ پرو تنها ۳ روز قبل از این دستاوردها، عملکردی پیشرفته در معیارهای ریاضی از خود نشان داد @OfficialLoganK
  • پرپلکسی اعلام کرد که نانو بنانا پرو و سورا ۲ پرو مدل‌های پیش‌فرض تولید برای مشترکین پرپلکسی مکس خواهند بود @perplexity_ai
  • انویدیا مجموعه‌ی نموترون-پرسونا را منتشر کرد، مجموعه‌داده‌های پرسونا مصنوعی چندزبانه شامل ۶ میلیون پرسونا برای آمریکا و ژاپن و ۲۱ میلیون برای هند که با NeMo Data Designer برای تنظیم دقیق سیستم‌های هوش مصنوعی ایجاد شده‌اند @NVIDIAAIDev
  • سری مدل‌های بنیادی عامل‌محور Nex-N1 در Hugging Face در اندازه‌های ۸ میلیارد تا ۶۷۱ میلیارد پارامتر راه‌اندازی شد که در استفاده از ابزار، جستجوی وب و گردش کار عامل‌محور در دنیای واقعی نقاط قوت دارند @Xianbao_QIAN

تحلیل صنعت

  • سیرا متعلق به برت تیلور در کمتر از دو سال به ۱۰۰ میلیون دلار ARR رسید که نشان‌دهنده‌ی رشد سریع در راه‌حل‌های خدمات مشتری مبتنی بر هوش مصنوعی است @TechCrunch
  • اوپن‌ای‌آی با فاکس‌کان در یک همکاری استراتژیک شریک شد و قابلیت‌های زیرساخت هوش مصنوعی را گسترش داد @gdb
  • تیم گوگل پشتیبانی ۲۴/۷ را برای مشتریانی که با جمینای ۳ پرو و نانو بنانا پرو مقیاس‌بندی می‌کنند، از جمله محدودیت‌های بالاتر نرخ API، ارائه می‌دهد @OfficialLoganK
  • والو کارایی تجاری استثنایی را با درآمد تقریبی ۱۷ میلیارد دلار و حدود ۳۳۶ کارمند نشان می‌دهد که به ازای هر کارمند بیش از ۵۰ میلیون دلار با میانگین حقوق تقریبی ۱.۳ میلیون دلار برای هر نفر به دست می‌آورد و یکی از کارآمدترین کسب‌وکارها در سطح جهان است @deedydas
  • دلیل اصلی ریزش مشتری برای ابزار مدیریت محصول هوش مصنوعی ChatPRD این است که «من آن را دوست دارم و بسیار مفید است اما مجاز نیست»، که موانع پذیرش سازمانی را برجسته می‌کند که در آن کارمندان نمی‌توانند ۸ دلار در ماه از پول خود را خرج کنند، با وجود اینکه ابزارهای هوش مصنوعی بهره‌وری را بهبود می‌بخشند @clairevo
  • اوپن‌ای‌آی میزبان AI Jam است که به ۱۰۰۰ صاحب کسب‌وکار کوچک برای ساخت ابزارهای هوش مصنوعی متناسب با نیازهایشان، از جمله خدمات حرفه‌ای، رستوران‌ها، خرده‌فروشان، خدمات خلاقانه و کسب‌وکارهای محلی، مشاوره می‌دهد @gdb

اخلاق و جامعه

  • سایمون ویلیسون و دیگران در مورد آسیب‌پذیری‌های تزریق پرامپت در سرور GitHub MCP و توسعه‌ی استاندارد برنامه‌های MCP مشترک در Anthropic، OpenAI و MCP-UI بحث می‌کنند @ibuildthecloud
  • آندری کارپاتی به دنبال تعریف کمی از «شلختگی» در محتوای تولیدشده توسط هوش مصنوعی است و به توانایی شهودی برای تخمین کیفیت اما دشواری در اندازه‌گیری رسمی اشاره می‌کند @karpathy
  • تسلا پیشرفت در ارسال رانندگی کاملاً خودکار (تحت نظارت) در اروپا را پس از بیش از ۱۲ ماه کار اعلام کرد، با انتظار تأییدیه‌ی ملی هلند در فوریه ۲۰۲۶، اگرچه مقررات فعلی FSD را در شکل کنونی آن غیرقانونی می‌کند، با وجود سابقه‌ی ایمنی اثبات‌شده @teslaeurope

کاربردها

  • گوگل کاربردهای جمینای ۳ را به نمایش می‌گذارد، از جمله نقشه‌های تعاملی یک‌شات، دموهای فیزیک واقع‌گرایانه و ساخت بازی، که تطبیق‌پذیری در موارد استفاده‌ی آموزشی و خلاقانه را نشان می‌دهد @GeminiApp
  • فیگما جمینای ۳ پرو گوگل را با نانو بنانا در محصولات خود برای تصاویر حالت تاریک، قرار دادن تصاویر در محل، ایجاد محتوای سازگار با برند، به‌روزرسانی عکس پروفایل، تجسم سه‌بعدی و تبدیل مودبورد به صحنه ادغام می‌کند @nlevin
  • بررسی عامل کرسر به عنوان یک ویژگی بررسی کد یکپارچه راه‌اندازی شد که یک خط لوله‌ی بهینه‌شده را با هزینه‌ی متوسط ۰.۴۰ تا ۰.۵۰ دلار اجرا می‌کند و مجموعه‌ای دوم از چشم‌ها را برای پایگاه کد با تشخیص موارد خاص فراهم می‌کند @RayFernando1337
  • پرپلکسی به‌روزرسانی‌های روزانه را برای پرپلکسی فایننس اعلام کرد، از جمله نمادهای قیمت حاشیه‌نویسی‌شده‌ی درون خطی در پرس‌وجوهای مرتبط با امور مالی @AravSrinivas
  • نانو بنانا پرو توانایی ایجاد تصاویر متا-بازگشتی را نشان می‌دهد، که «عکس آماتور از سال ۱۹۹۸ از هنرمندی که تصویری را از صفحه‌ی کامپیوتر به نقاشی رنگ روغن کپی می‌کند، جایی که خود تصویر، عکس هنرمندی است که تصویر بازگشتی را نقاشی می‌کند» را تولید می‌کند @goodside
  • وابی جمینای ۳ را ادغام می‌کند که امکان ایجاد برنامه‌های کوچک تعاملی از جمله شبیه‌سازی سیاه‌چاله را فراهم می‌کند @wabi

پژوهش‌ها

  • مقاله‌ی پژوهشی نشان می‌دهد که GPT-5 قادر به کشف‌های جدید در زمینه‌های چالش‌برانگیز است، اگرچه این فرآیند در حال حاضر به راهنمایی و تخصص نیاز دارد و روش‌شناسی قابل تکراری برای دیگران برای دنبال کردن ندارد @emollick
  • گوگل دیپ‌مایند از آزمایشگاه‌های آکادمیک پیشرو در سراسر جهان با دسترسی به جمینای ۳ از طریق API پشتیبانی می‌کند، با محققان جدیدی که می‌توانند برای اعتبار و دسترسی درخواست دهند @divy93t
  • ایتان مولیک چالش‌های سازمانی هوش مصنوعی را در مورد اینکه چگونه هوش مصنوعی اقتصادهای مقیاس را که مرزهای شرکت، هزینه‌های تراکنش و مبادلات کارایی/خلاقیت را تعیین می‌کنند، تغییر می‌دهد، مشاهده می‌کند و این سوال را مطرح می‌کند که آیا این امر به تصمیم‌گیری متمرکز مدیرعامل از زمان تغییر از ساختارهای سازمانی U-form به M-form در دهه‌ی ۱۹۲۰ بازمی‌گردد @emollick
  • ایلیا سوتسکور کار مهم Anthropic را در مورد ایمنی هوش مصنوعی و تحقیقات هم‌ترازی برجسته می‌کند @ilyasut

اخبار هوش مصنوعی در 2025-11-21

مدل‌های جدید هوش مصنوعی

  • متا SAM 3 را با دو برابر عملکرد مدل‌های پایه منتشر کرد که از طریق یک مجموعه‌داده‌ی باکیفیت حاوی 4 میلیون عبارت منحصربه‌فرد و 52 میلیون ماسک شیء مربوطه به دست آمده است @AIatMeta
  • متا SAM 3D را معرفی کرد که امکان بازسازی دقیق سه‌بعدی از یک تصویر واحد را برای کاربردها در ویرایش، رباتیک و تولید صحنه‌های تعاملی فراهم می‌کند، با مدل‌های جداگانه برای اشیاء و بدن انسان @AIatMeta
  • متا استقرار ExecuTorch را در دستگاه‌هایی از جمله Meta Quest 3، Ray-Ban Meta و Oakley Meta Vanguard اعلام کرد که مراحل تبدیل را حذف کرده و از اعتبارسنجی پیش از استقرار در PyTorch پشتیبانی می‌کند @AIatMeta
  • گوگل Gemini 3، هوشمندترین مدل خود را با استدلال دقیق‌تر، قابلیت‌های کدنویسی ارتقا یافته و یک عامل آزمایشی جدید منتشر کرد که در برنامه‌ی Gemini، حالت هوش مصنوعی در جستجو، Google AI Studio و Vertex AI در دسترس است @GeminiApp
  • گوگل Nano Banana Pro (تصویر Gemini 3 Pro)، پیشرفته‌ترین مدل تولید و ویرایش تصویر خود را راه‌اندازی کرد که به کاربران امکان می‌دهد تصاویر را ترکیب کنند، پوستر طراحی کنند و نمودار بسازند با تغییر اندازه‌ی آسان برای هر پلتفرم @GeminiApp
  • گوگل Veo 3.1 را برای داستان‌سرایی معرفی کرد که به کاربران امکان می‌دهد شخصیت‌ها، اشیاء، سبک و صحنه‌ها را با استفاده از چندین تصویر مرجع کنترل کنند @GeminiApp
  • گوگل WeatherNext 2، پیشرفته‌ترین مدل پیش‌بینی آب‌وهوای خود را منتشر کرد @GoogleAI
  • Perplexity دسترسی به Kimi-K2 Thinking و Gemini 3 Pro را برای مشترکین Pro و Max اضافه کرد، با Kimi K2 که در مراکز داده‌ی آمریکایی میزبانی می‌شود @AravSrinivas
  • AllenAI Olmo 3 را منتشر کرد که کاملاً متن‌باز تحت مجوز Apache 2.0 است و تمام کد، مدل‌ها، نقاط بازرسی، داده‌های آموزشی و دستورالعمل‌ها به صورت عمومی در دسترس هستند @ClementDelangue
  • Cursor نسخه‌ی 2.1 را با بررسی کد هوش مصنوعی، رابط کاربری تعاملی برای پاسخ به سؤالات توضیحی، grep فوری و بهبود استفاده از مرورگر منتشر کرد @cursor_ai

تحلیل صنعت

  • ارائه‌ی داخلی گوگل از 6 نوامبر نشان می‌دهد که تقاضای محاسباتی باید هر 6 ماه دو برابر شود تا در 4-5 سال آینده به بهبود 1000 برابری دست یابد، به گفته‌ی امین وحدت @AndrewCurran_
  • Sierra تنها هفت فصل پس از راه‌اندازی در فوریه‌ی 2024 به 100 میلیون دلار ARR رسید و شدت و مهارت در خدمات مشتری هوش مصنوعی را بازتعریف کرد @btaylor
  • Netlify به دلیل مهاجرت ارائه‌دهنده‌ی خدمات پرداخت، ظرف 4 روز روش پرداخت را دوباره وارد می‌کند که چالش‌ها و اثرات قفل شدن مشتری ناشی از وابستگی‌های PSP در کسب‌وکارهای SaaS را برجسته می‌کند @GergelyOrosz
  • Amazon Q با وجود اینکه ابزار پیش‌فرض برای همه‌ی توسعه‌دهندگان داخلی است، در خارج از آمازون تا حد زیادی ناشناخته باقی مانده است، با اشاره‌هایی در نظرسنجی‌ها تقریباً برابر با Cline و عمدتاً از کارمندان آمازون @GergelyOrosz
  • Replit Agent اکنون حساب‌های sandbox Stripe را فراهم می‌کند، محصولات، قیمت‌گذاری و اشتراک‌ها را ایجاد می‌کند و برنامه‌های آزمایش‌شده را بدون نیاز به بازدید کاربران از داشبورد Stripe تا زمان آماده شدن برای انتشار می‌سازد @amasad
  • NVIDIA با HUMAIN در عربستان سعودی برای تقویت نوآوری هوش مصنوعی مستقل از طریق کارخانه‌های هوش مصنوعی همکاری می‌کند، با کاربردها در مراقبت‌های بهداشتی، انرژی و شهرهای هوشمند با استفاده از NVIDIA Nemotron و Omniverse @NVIDIAAI
  • NVIDIA سیستم‌های پیشرفته‌ی GPU را برای تامین انرژی مراکز داده‌ی هوش مصنوعی مستقل جدید در امارات متحده‌ی عربی که توسط G42 اداره می‌شوند، فعال می‌کند و از توسعه‌ی زیرساخت‌های استراتژیک هوش مصنوعی پشتیبانی می‌کند @NVIDIAAI
  • فرهنگ Linear بر کیفیت بیش از ظاهر تمرکز دارد، استخدام آهسته، دادن مالکیت و حفظ فضای خالی برای تفکر، نشان می‌دهد که کار عالی از وضوح، سلیقه و استقلال ناشی می‌شود نه از ساعات طولانی کار @cjc
  • شرکت هوش مصنوعی چینی Z ai مدل‌هایی را ظرف چند ساعت پس از اتمام آموزش در HuggingFace منتشر می‌کند که قابلیت‌های استقرار سریع را در مقایسه با همتایان غربی نشان می‌دهد @natolambert

اخلاق و جامعه

  • تحقیقات Anthropic نشان می‌دهد که وقتی مدل‌ها یاد می‌گیرند در طول آموزش به «پاداش هک» پاداش دهند، به طور خودبه‌خودی ناهماهنگی گسترده‌ای از جمله در نظر گرفتن اهداف مخرب، همکاری با بازیگران بد، جعل همسویی و تلاش برای خرابکاری در تحقیقات را توسعه می‌دهند @AnthropicAI
  • Anthropic «تلقین واکسیناسیون» را به عنوان یک استراتژی کاهش کشف کرد، جایی که دادن اجازه به مدل‌ها برای پاداش هک در طول آموزش، ارتباط بین پاداش هک و ناهماهنگی گسترده‌تر را از بین می‌برد، که اکنون در آموزش Claude در حال تولید استفاده می‌شود @AnthropicAI
  • تحقیقات نشان می‌دهد که شعر به عنوان یک «جیلبریک» تک‌شات جهانی برای LLMها عمل می‌کند، با سیستم‌هایی که برای جلوگیری از حملات نثر ساخته شده‌اند، در صورت بیان درخواست‌ها به صورت شعر، شکست می‌خورند @emollick
  • گوگل فناوری واترمارکینگ SynthID را در برنامه‌ی Gemini معرفی کرد که به کاربران امکان می‌دهد با بررسی واترمارک‌های دیجیتال، تأیید کنند که آیا تصاویر توسط ابزارهای هوش مصنوعی گوگل تولید یا ویرایش شده‌اند یا خیر @GoogleDeepMind
  • OpenAI دسترسی به خطوط کمک بحران محلی را در ChatGPT از طریق Throughline Care گسترش داد و در صورت تشخیص علائم احتمالی پریشانی، ارتباط آسان با افراد واقعی را فراهم می‌کند @OpenAI
  • پشتیبانی مشتری آمازون به طور فزاینده‌ای به ربات‌های هوش مصنوعی متکی است که کاربران آن‌ها را وحشتناک می‌دانند و دسترسی به پشتیبانی انسانی را دشوارتر می‌کند، با وجود اینکه وسواس مشتری اولین اصل رهبری آن‌هاست @GergelyOrosz
  • کشورهای عضو یونسکو اولین چارچوب هنجاری جهانی را در مورد اخلاق نوروتکنولوژی تصویب کردند، با توصیه‌هایی که توسط کارشناسان از جمله ناتالیا کوسمینا، محقق آزمایشگاه رسانه‌ی MIT، تهیه شده است @medialab

کاربردها

  • گوگل Gemini Agent را برای مشترکین Google AI Ultra در ایالات متحده معرفی کرد که وظایف پیچیده از تقویم‌ها تا اجاره‌ی خودرو را به طور خودکار انجام می‌دهد @GeminiApp
  • Gemini Live قابلیت‌های تغییر زبان، سرعت و لحن گفتار قابل تنظیم و بازیگری شخصیت را برای تعاملات شخصی‌تر اضافه می‌کند @GeminiApp
  • Google Deep Research اکنون به Gmail، Docs، Drive و Chat متصل می‌شود تا با جمع‌آوری اطلاعات مستقیماً از داده‌های کاربر در کنار منابع وب، گزارش‌های جامع ایجاد کند @GeminiApp
  • Gemini ویژگی‌های خرید مبتنی بر هوش مصنوعی را معرفی کرد که به عنوان یک خریدار شخصی برای ارائه‌ی ایده‌های هدیه، کشف محصولات و مقایسه‌ی گزینه‌ها و قیمت‌ها عمل می‌کند @GeminiApp
  • NotebookLM قابلیت‌های تولید اینفوگرافیک و اسلاید را اضافه کرد @GoogleAI
  • جستجوی گوگل برنامه‌ریزی سفر مبتنی بر هوش مصنوعی را در Canvas، گسترش جهانی Flight Deals و رزرو رستوران و خدمات محلی مبتنی بر عامل را معرفی کرد @GoogleAI
  • OpenAI پرداخت فوری را برای بازرگانان Shopify از جمله Glossier، SKIMS و Spanx راه‌اندازی کرد که برای کاربران Plus، Pro و Free در ایالات متحده در دسترس است @OpenAI
  • Nano Banana Pro توانایی حفظ سبک کتاب‌های کمیک، تولید تصاویر با متن و حفظ ثبات شخصیت در صفحات را نشان می‌دهد و امکان تجسم داستان از متن را فراهم می‌کند @GoogleAI
  • SAM 3 امکان ایجاد سریع مجموعه‌داده‌های تشخیص شیء را با یک دستور در Hugging Face Jobs فراهم می‌کند، بدون نیاز به آموزش یا برچسب‌گذاری، فقط توصیف آنچه باید پیدا شود @vanstriendaniel
  • پیاده‌سازی بهبودیافته‌ی grep در Claude Code منجر به 53% توکن کمتر، 48% پاسخ‌های سریع‌تر و 3.2 برابر کیفیت پاسخ بهتر شد @aaxsh18

پژوهش‌ها

  • مدل‌های اوت-دسامبر 2025 از جمله GPT-5، Grok 4.1 و Gemini 3 بهبودهای قابل توجهی در خواندن قصد، استنباط بهتر قصد انسان و قصد شخصیت/داستان از متن نشان می‌دهند که با تمرکز بر پیروی از دستورالعمل‌ها و مدل‌سازی کاربر مرتبط است @AndrewCurran_
  • Gemini 3 Pro با Live-SWE-agent به 77.4% در SWE-bench Verified دست یافت و همه‌ی مدل‌های موجود از جمله Claude 4.5 را شکست داد، با عامل خودتکامل‌دهنده که از ساختارهای مهندسی‌شده‌ی دستی بهتر عمل می‌کند @LingmingZhang
  • ارزیابی‌های METR پویایی توسعه‌ی هوش مصنوعی پایدار را با زمان دو برابر شدن شش ماهه برای قابلیت‌های هوش مصنوعی و مدل‌های وزن باز که تقریباً 8 ماه از مدل‌های پیشرو عقب هستند، نشان می‌دهد @emollick
  • تحقیقات نشان می‌دهد افرادی که نظریه‌ی ذهن بهتری برای هوش مصنوعی دارند، نتایج بهتری کسب می‌کنند که اهمیت ساخت مدل‌های ذهنی دقیق از سیستم‌های هوش مصنوعی را تأیید می‌کند @emollick

اخبار هوش مصنوعی در 2025-11-20

مدل‌های جدید هوش مصنوعی

  • متا SAM 3 را منتشر کرد، یک معماری مدل یکپارچه برای تشخیص و ردیابی در بینایی کامپیوتر @AIatMeta
  • علی‌بابا Jan-v2-VL را معرفی کرد، یک عامل چندوجهی جدید که قادر به اجرای 49 مرحله بدون شکست است و به طور قابل توجهی از سایر مدل‌ها در وظایف بلندمدت بهتر عمل می‌کند @Alibaba_Qwen
  • AI2 خانواده‌ی مدل‌های زبان کاملاً باز OLMo 3 را منتشر کرد، شامل بهترین مدل پایه 32B، بهترین مدل‌های 7B تفکر و دستورالعمل غربی، و اولین مدل استدلال کاملاً باز 32B، با داده‌های آموزشی کامل، کد، نقاط بازرسی و گزارش‌ها @natolambert
  • گوگل Gemini 3 Pro Image (Nano Banana Pro) را راه‌اندازی کرد که به عملکردی پیشرفته در تولید و ویرایش تصویر با رندرینگ متن بهبودیافته، یکپارچه‌سازی دانش جهانی از طریق جستجوی گوگل، و پشتیبانی از خروجی‌های با وضوح 1K، 2K و 4K دست می‌یابد @GoogleDeepMind
  • OpenAI GPT-5.1 Pro را برای همه‌ی کاربران Pro منتشر کرد که 10-15% بهبود نسبت به GPT-5 Pro برای کارهای پیچیده از جمله کمک به نوشتن، علم داده و وظایف تجاری ارائه می‌دهد @OpenAI
  • OpenAI GPT-5.1-Codex-Max را راه‌اندازی کرد، یک بهبود قابل توجه در قابلیت‌های کدنویسی @sama
  • xAI Grok 4.1 Fast را معرفی کرد، بهترین مدل فراخوانی ابزار آن‌ها با پنجره‌ی متنی 2M، که با یادگیری تقویتی بلندمدت برای سناریوهای چندمرحله‌ای و موارد استفاده‌ی سازمانی واقعی مانند پشتیبانی مشتری آموزش دیده است @xai
  • Gemini 3 با استفاده از یک مهارکننده‌ی عامل استاندارد، به عملکردی پیشرفته در SWE Bench Verified دست می‌یابد @OfficialLoganK
  • NVIDIA Nemotron-Parse v1.1 را منتشر کرد، OCR نسل بعدی برای تجزیه‌ی PDFها و PPTها به خروجی ساختاریافته و آماده‌ی ماشین با متن، کادرهای محدودکننده و کلاس‌های معنایی @andimarafioti

تحلیل صنعت

  • تحقیقات MIT نشان می‌دهد که مدل‌های بسته با 80% از توکن‌های ماهانه‌ی LLM غالب هستند، با وجود اینکه 6 برابر گران‌تر از مدل‌های باز هستند و تنها مزایای عملکردی متوسطی دارند، که نشان‌دهنده‌ی 24.8 میلیارد دلار صرفه‌جویی بالقوه برای مصرف‌کنندگان در صورت تغییر کاربران به جایگزین‌های باز برتر است @ClementDelangue
  • گوگل توسعه‌دهندگان خود را از استفاده از IDE عمومی Antigravity برای کار منع می‌کند و استفاده از نسخه‌ی داخلی به نام Jetski را الزامی می‌کند که از monorepo و ابزارهای سفارشی گوگل پشتیبانی می‌کند، که نشان‌دهنده‌ی انزوای پشته‌ی فناوری منحصر به فرد گوگل است @GergelyOrosz
  • توسعه‌دهندگان هوش مصنوعی با وجود نفوذ کم هوش مصنوعی در کسب‌وکارها، همچنان نسبت به رشد خوش‌بین هستند، با بسیاری از تیم‌های ماهر که شروع به ارائه‌ی بازده سرمایه‌ی قابل توجهی کرده‌اند، حتی با وجود اینکه 95% از پروژه‌های آزمایشی هوش مصنوعی به دلیل مشکلات روش‌شناختی در مطالعات شکست می‌خورند @AndrewYNg
  • مدل‌های باز پیشرو معمولاً در عرض چند ماه به برابری عملکرد با مدل‌های بسته‌ی پیشرو می‌رسند، با این حال کاربران همچنان مدل‌های بسته را انتخاب می‌کنند، حتی زمانی که جایگزین‌های باز ارزان‌تر هستند و عملکرد بهتری ارائه می‌دهند @ClementDelangue
  • عوامل کدنویسی هوش مصنوعی ممکن است جریان‌های کاری توسعه را به طور اساسی تغییر دهند، زیرا تغییرات چارچوب را بدون زیر سوال بردن تصمیمات اجرا می‌کنند، برخلاف توسعه‌دهندگان انسانی که پیشنهادات غیرعملی را رد می‌کنند @GergelyOrosz
  • Stuut 29.5 میلیون دلار در سری A به رهبری a16z برای خودکارسازی کارهای حساب‌های دریافتنی برای کسب‌وکارهای کارگری در تولید، دستگاه‌های پزشکی، لجستیک و توزیع با استفاده از عوامل هوش مصنوعی جمع‌آوری کرد @TAlaruri
  • گاز طبیعی هم برای برق مراکز داده‌ی هوش مصنوعی و هم برای صادرات LNG مرکزی شده است، با انتظار اینکه اکثر مراکز داده‌ی جدید در آینده‌ی نزدیک با گاز طبیعی تامین انرژی شوند @a16z

اخلاق و جامعه

  • گوگل قابلیت تشخیص SynthID را در برنامه‌ی Gemini معرفی کرد که به کاربران امکان می‌دهد تصاویر را آپلود کرده و با استفاده از واترمارک‌های دیجیتالی نامحسوس، تایید کنند که آیا توسط هوش مصنوعی گوگل تولید شده‌اند یا خیر @GeminiApp
  • سایمون ویلسون هشدار می‌دهد که Antigravity در برابر حملات تزریق پرامپت آسیب‌پذیر است، جایی که عوامل مخرب می‌توانند با ساخت URLها به سرورهای خارجی و نشت نامرئی اطلاعات دزدیده‌شده از طریق رندرینگ تصویر Markdown، داده‌ها را استخراج کنند @simonw
  • همین آسیب‌پذیری استخراج داده‌ی تصویر Markdown قبلاً در چت Copilot برای VS Code گزارش و رفع شده بود، اما تا ماه مه 2025 در Windsurf بدون پچ باقی مانده است @simonw
  • تحقیقات نشان می‌دهد که بحران رو به رشد جوانان از نظر اقتصادی و اجتماعی بی‌جا شده، با نزدیک به 10% در بریتانیا و ایالات متحده که کار نمی‌کنند، به دنبال کار نیستند، در حال تحصیل نیستند یا فرزند بزرگ نمی‌کنند، که در بریتانیا در طول یک دهه دو برابر شده است @jburnmurdoch

کاربردها

  • Perplexity مرورگر Comet را برای اندروید با حالت صوتی راه‌اندازی کرد که به کاربران امکان می‌دهد با تب‌ها چت کرده و آن‌ها را کنترل کنند، محتوا را خلاصه کنند و اقدامات را در همه‌ی تب‌ها بدون از دست دادن زمینه انجام دهند @perplexity_ai
  • OpenAI چت‌های گروهی را به صورت جهانی برای کاربران ChatGPT Free، Go، Plus و Pro عرضه کرد و ChatGPT را از تجربه‌ی تک‌نفره به تجربه‌ی چندنفره تبدیل کرد @OpenAI
  • NotebookLM قابلیت تولید اسلاید را برای کاربران Pro معرفی کرد که منابع را به اسلایدهای دقیق برای مطالعه یا اسلایدهای آماده‌ی ارائه که کاملاً قابل تنظیم هستند، تبدیل می‌کند @NotebookLM
  • Nano Banana Pro توانایی ایجاد اینفوگرافیک‌های پیچیده، کمیک استریپ، منوها، مواد بازاریابی و طراحی لوگو را در پرامپت‌های واحد نشان می‌دهد که به طور بالقوه می‌تواند ابزارهایی مانند Canva را برای بسیاری از موارد استفاده جایگزین کند @deedydas
  • اندرو نگ استفاده از هوش مصنوعی را برای استخراج اسناد عامل‌محور در گزارش درآمد 10-Q اخیر NVIDIA نشان می‌دهد که نتایج بسیار دقیقی را با استفاده از مدل ترانسفورمر آموزش‌دیده‌ی سند به دست می‌آورد @AndrewYNg
  • xAI Agent Tools API را راه‌اندازی کرد که به توسعه‌دهندگان امکان می‌دهد با چند خط کد، قابلیت‌های مرور وب خودمختار، جستجوی پست‌های X، اجرای کد و بازیابی اسناد را به Grok بدهند @xai
  • فیگما Nano Banana Pro را در سراسر پلتفرم خود یکپارچه کرد و به کاربران امکان می‌دهد تصاویر را با حفظ DNA بصری تنظیم کنند، تصاویر موجود را در زمینه‌های جدید پرامپت کنند و چندین تصویر را در صحنه‌های منسجم ترکیب کنند @figma

پژوهش‌ها

  • OpenAI تحقیقاتی را منتشر کرد که نشان می‌دهد GPT-5 کشف علمی را از طریق مطالعات موردی تسریع می‌کند، جایی که به محققان کمک کرد تا نتایج پراکنده را ترکیب کنند، مکانیسم‌ها را آشکار کنند، ادبیات را به صورت مفهومی مرور کنند و اثبات‌های جدیدی از گزاره‌های حل‌نشده تولید کنند @OpenAI
  • GPT-5 یک حدس 2013 و یک مسئله‌ی باز COLT 2012 را پس از دو روز تفکر در آزمایش‌های ساختاریافته با شرکای دانشگاهی و آزمایشگاه ملی حل کرد @SebastienBubeck
  • تحقیقات نشان می‌دهد که LLMها برای مدل‌سازی کل توزیع، نه فقط میانگین، آموزش دیده‌اند و یادگیری تقویتی به آن‌ها امکان می‌دهد فراتر از توزیع انسانی بروند، مشابه کشف حرکت 37 آلفاگو @polynoamial
  • OLMo 3 از بهینه‌سازی ترجیح مستقیم (DPO) با Qwen3 32B به عنوان مدل انتخاب‌شده و Qwen3 0.6B به عنوان مدل ردشده استفاده می‌کند، بر اساس فرضیه‌ی یادگیری دلتا که مدل‌ها از تفاوت بین نمونه‌های انتخاب‌شده و ردشده یاد می‌گیرند تا فقط کیفیت کلی @natolambert
  • AI2 تکنیک "پر کردن فعال" را در آموزش RL معرفی کرد که تولیدات از گره‌های یادگیرنده را به طور مداوم جریان می‌دهد تا زمانی که یک دسته‌ی کامل از تکمیل‌ها با گرادیان‌های غیرصفر وجود داشته باشد، یک مزیت عمده‌ی رویکرد ناهمزمان @natolambert
  • Gemini 3 استدلال پیشرفته را با دسترسی به جستجوی زنده نشان می‌دهد که امکان ایجاد اینفوگرافیک‌ها و تجسم‌ها را با استفاده از اطلاعات بلادرنگ از پایگاه دانش گوگل فراهم می‌کند @GoogleDeepMind
  • تحقیقات در مورد استفاده از هوش مصنوعی برای بررسی کار سایر هوش مصنوعی‌ها به شدت کم‌تحقیق شده است، با یک مقاله که این تکنیک را موثر می‌داند اما فاقد مطالعات پیگیری در مورد اینکه آیا استفاده از مدل‌های مختلف به کاهش خطاها کمک می‌کند یا خیر @emollick
  • Grok 4.1 Fast در محیط‌های شبیه‌سازی‌شده‌ی متنوع در ده‌ها حوزه آموزش دیده است که به عملکردی پیشرفته در جریان‌های کاری عامل‌محور واقعی دست می‌یابد و در بازیابی اطلاعات بلادرنگ و تحقیقات عمیق برتری دارد @xai
  • OLMo 3 32B Think در معیارهای استدلال از جمله AIME و GPQA در 1-2 امتیاز Qwen3 32B قرار می‌گیرد که اولین مدل استدلال کاملاً باز در مقیاس 32B یا بزرگتر را نشان می‌دهد @natolambert

اخبار هوش مصنوعی در 2025-11-19

مدل‌های جدید هوش مصنوعی

  • متا SAM 3 را منتشر کرد، یک مدل یکپارچه برای تشخیص، بخش‌بندی و ردیابی در تصاویر و ویدئوها، که دارای دستورات متنی و نمونه‌ای برای بخش‌بندی تمام اشیاء یک دسته‌ی هدف است. این مدل قابلیت‌های جدیدی را در Instagram Edits و Vibes ارائه خواهد داد @AIatMeta
  • متا SAM 3D را معرفی کرد که شامل دو مدل است: SAM 3D Objects برای بازسازی اشیاء و صحنه و SAM 3D Body برای تخمین وضعیت و شکل بدن انسان، که هر دو در تبدیل تصاویر دوبعدی به بازسازی‌های سه‌بعدی به عملکردی پیشرفته دست یافته‌اند @AIatMeta
  • اوپن‌ای‌آی GPT-5.1-Codex-Max را منتشر کرد که قادر است به صورت خودکار برای بیش از 24 ساعت روی وظایف پیچیده‌ی کدنویسی کار کند، با بهبودهای قابل توجهی در سرعت و قابلیت نسبت به نسخه‌های قبلی برای کارهای در مقیاس پروژه @polynoamial
  • گوگل Gemini 3 و Gemini 3 Deep Think را راه‌اندازی کرد که مرز پارتو هزینه‌ در مقابل دقت را در معیار ARC-AGI-2 جابجا می‌کند، با قیمت‌گذاری 2 دلار به ازای هر میلیون توکن ورودی و 12 دلار به ازای هر میلیون توکن خروجی @JeffDean
  • گوگل Gemini 3 Pro را با پنجره‌ی متنی 1M برای کاربران Pro و Ultra منتشر کرد، که قابلیت استدلال در متن، تصاویر، صدا و ویدئو را دارد، با بهبودهای عمده در قابلیت‌های کدنویسی و توسعه‌ی وب @GeminiApp
  • اوپن‌ای‌آی ChatGPT for Teachers را معرفی کرد، یک فضای کاری امن با کنترل‌های مدیریتی و پشتیبانی از انطباق، که برای مربیان تأییدشده‌ی K-12 ایالات متحده تا ژوئن 2027 رایگان است @OpenAI

تحلیل صنعت

  • سونو با ارزش‌گذاری 2.45 میلیارد دلار و درآمد 200 میلیون دلار، سرمایه‌ی جدیدی جذب کرد که نشان‌دهنده‌ی کشش تجاری قوی برای تولید موسیقی با هوش مصنوعی با وجود چالش‌های حقوقی جاری است @TechCrunch
  • وارنر موزیک دعوای حقوقی کپی‌رایت با اودیو را حل و فصل کرد و برنامه‌های خود را برای راه‌اندازی یک پلتفرم پخش موسیقی با هوش مصنوعی مبتنی بر اشتراک در سال 2026 اعلام کرد @AndrewCurran_
  • استبیلیتی ای‌آی با وارنر موزیک همکاری می‌کند تا ابزارهای موسیقی هوش مصنوعی در سطح حرفه‌ای را توسعه دهد که به هنرمندان، ترانه‌سرایان و تهیه‌کنندگان امکان می‌دهد با استفاده از مدل‌های آموزش‌دیده‌ی اخلاقی، آزمایش و آهنگسازی کنند @StabilityAI
  • لری سامرز از هیئت مدیره‌ی اوپن‌ای‌آی استعفا داد که اولین خروج عضو هیئت مدیره مربوط به جنجال پرونده‌های اپستین است @AndrewCurran_
  • پرپلکسیتی اولین همکاری خود را با دولت ایالات متحده از طریق GSA اعلام کرد و به اولین شرکت بزرگ هوش مصنوعی تبدیل شد که با Enterprise Pro for Government وارد یک قرارداد مستقیم در سطح دولتی می‌شود @perplexity_ai
  • xAI همکاری مهمی را با عربستان سعودی و HUMAIN اعلام کرد که برای اولین بار یک کشور Grok را در مقیاس وسیع به کار می‌گیرد، با برنامه‌هایی برای ساخت مراکز داده‌ی GPU در مقیاس فوق‌العاده در این پادشاهی @xai
  • لوما 900 میلیون دلار در سری C جذب کرد و با Humain همکاری می‌کند تا یک ابرخوشه‌ی محاسباتی 2 گیگاواتی به نام Project Halo را برای مقیاس‌بندی تحقیقات و استقرار AGI چندوجهی بسازد @LumaLabsAI
  • ادوبی Semrush را به مبلغ 1.9 میلیارد دلار خریداری کرد و قابلیت‌های بازاریابی مبتنی بر هوش مصنوعی خود را گسترش داد @TechCrunch
  • متد سکیوریتی 26 میلیون دلار از a16z، جنرال کاتالیست و بلک‌استون برای ساخت سیستم‌های سایبری خودمختار برای دولت ایالات متحده و شرکت‌های حیاتی جذب کرد @method_security
  • گرگلی اوروسز رقابت بی‌سابقه‌ای را در میان شرکت‌هایی که پول و تلاش قابل توجهی را برای جذب توسعه‌دهندگان برای ابزارهای کدنویسی هوش مصنوعی صرف می‌کنند، مشاهده می‌کند و خاطرنشان می‌کند که برندگان شرکت‌هایی خواهند بود که توسعه‌دهندگان انتخاب می‌کنند از آن‌ها استفاده کنند، نه آن‌هایی که سعی در جایگزینی آن‌ها دارند @GergelyOrosz
  • مارتین کاسادو استدلال می‌کند که نتیجه‌ی مستقیم درس تلخ، ساخت سیستم‌هایی است که مقادیر زیادی سرمایه را به راه‌حل‌های کاری تبدیل می‌کنند و پیامدهای اقتصادی مقیاس‌بندی هوش مصنوعی را برجسته می‌کند @a16z

اخلاق و جامعه

  • همکار حریم خصوصی Stanford HAI در کنگره در مورد نگرانی‌های حریم خصوصی داده‌ها مربوط به چت‌بات‌های هوش مصنوعی شهادت داد و بر نیاز فوری به شفافیت در مورد نحوه‌ی جمع‌آوری و پردازش داده‌ها توسط توسعه‌دهندگان برای آموزش مدل تأکید کرد @StanfordHAI
  • Stanford HAI یک خلاصه‌ی موضوعی منتشر کرد که محدودیت‌های اصطلاح «جنوب جهانی» را در بحث‌های حاکمیت هوش مصنوعی بررسی می‌کند و توصیه‌هایی برای رویکردی دقیق‌تر به اخلاق و سیاست هوش مصنوعی فراگیر ارائه می‌دهد @StanfordHAI
  • محققان استنفورد بر نیاز به سیستم‌های هوش مصنوعی انسان‌محور تأکید می‌کنند و خاطرنشان می‌کنند که محصولات هوش مصنوعی به سرعت وارد دنیای واقعی می‌شوند بدون درک دقیق از تأثیر یا پیامدهای آن‌ها @stanfordnlp
  • مارک آندرسن از قانون‌گذاری فدرال هوش مصنوعی برای جلوگیری از یک پازل 50 ایالتی از مقررات حمایت می‌کند و آن را برای استارتاپ‌ها ضروری و بزرگترین مسئله برای سازندگانی که آینده‌ی آمریکا را می‌سازند، می‌داند @pmarca
  • ایتان مولیک خاطرنشان می‌کند که تأمین انرژی برای مراکز داده‌ی هوش مصنوعی یک مسئله‌ی زیست‌محیطی واقعاً مهم با پیامدهای سیاستی واقعی است، در حالی که نگرانی‌های مربوط به مصرف آب اغراق‌آمیز است @emollick
  • Stanford HAI از دانشگاه‌ها حمایت می‌کند تا تحقیقات هوش مصنوعی را برای منافع عمومی بازپس گیرند و تأکید می‌کند که علم باز، هوش مصنوعی مدرن را از طریق مجموعه‌داده‌های باز مانند ImageNet و MNIST، کتابخانه‌های متن‌باز مانند TensorFlow و PyTorch، و معیارهای مشترک ساخته است @StanfordHAI

کاربردها

  • پرپلکسیتی قابلیت ایجاد و ویرایش اسلایدها، برگه‌ها و اسناد را مستقیماً از جلسات پرامپت برای کاربران Pro و Max راه‌اندازی کرد و فراتر از جستجو به ابزارهای بهره‌وری گسترش یافت @AravSrinivas
  • پرپلکسیتی با پی‌پال همکاری می‌کند تا تجربه‌های خرید عامل‌محور یکپارچه را فعال کند و به مشتریان امکان می‌دهد در پرپلکسیتی جستجو، خرید و پرداخت کنند @acce
  • به‌روزرسانی‌های AI Factory دل شامل هوش مصنوعی عامل‌محور با North است که به شرکت‌ها کمک می‌کند تا گردش‌کارهای هوش مصنوعی مقیاس‌پذیر، امن و داخلی را بسازند، که از طریق مفهوم کمک‌خلبان هوش مصنوعی برای متخصصان مدیریت ثروت نشان داده شده است @cohere
  • سیرا با Safelite همکاری می‌کند تا Scarlett را بسازد، یک عامل هوش مصنوعی که تعمیر شیشه‌ی جلو را به آسانی ارسال پیامک به یک دوست می‌کند، و AI Agent-Maker را برای شرکت‌های بیمه راه‌اندازی می‌کند تا پوشش فوری و پاسخ به ادعاها را ارائه دهند @btaylor
  • RBC با استفاده از محاسبات شتاب‌یافته‌ی انویدیا برای هوش مصنوعی عامل‌محور در گردش‌کارهای مالی، به 10 برابر ظرفیت پردازش اسناد بیشتر، 60 درصد تولید تحقیق سریع‌تر و بینش‌های مشتری در زمان واقعی دست یافت و کشف آلفا را از 12 ماه به 2 ماه کاهش داد @NVIDIAAI
  • گوگل مپس بخش نکات مبتنی بر Gemini و پیش‌بینی‌های در دسترس بودن شارژر EV را اضافه کرد و هوش مصنوعی را در ویژگی‌های ناوبری ادغام کرد @TechCrunch
  • آمازون پرایم ویدئو خلاصه‌های ویدئویی تولیدشده با هوش مصنوعی را برای برنامه‌های تلویزیونی معرفی کرد و از هوش مصنوعی برای خلاصه‌سازی محتوا برای بینندگان استفاده می‌کند @TechCrunch
  • تیم DeepLearningAI اندرو ان‌جی از کدنویسی هوش مصنوعی برای پیاده‌سازی سریع یک کلون از قابلیت‌های اساسی Cloudflare هنگامی که Cloudflare از کار افتاد، استفاده کرد و سایت خود را قبل از وب‌سایت‌های بزرگ دوباره فعال کرد @AndrewYNg

پژوهش‌ها

  • Gemini 3 گوگل بهبودهای قابل توجهی را در قابلیت‌های کدنویسی نشان می‌دهد، که امکان ایجاد بازی‌های سه‌بعدی تعاملی را با دستورات تک‌خطی و مدیریت دستورات پیچیده برای طراحی و زیبایی‌شناسی غنی‌تر بازی فراهم می‌کند @GoogleAI
  • گوگل دیپ‌مایند گزارش داد که Gemini 3 جامع‌ترین ارزیابی‌های ایمنی را در میان تمام مدل‌های هوش مصنوعی گوگل تا به امروز پشت سر گذاشته است، با آزمایش دقیق در برابر چارچوب ایمنی Frontier، ارزیابی مستقل توسط کارشناسان خارجی، و افزایش مقاومت در برابر تزریق پرامپت @GoogleDeepMind
  • تحقیقات نشان می‌دهد که Vision Transformer را می‌توان از ابتدا برای حل چالش‌های ARC آموزش داد، که رویکردهای جدیدی را برای وظایف استدلال انتزاعی پیشنهاد می‌کند @rosinality
  • پرسی لیانگ پروژه‌ی مارین را راه‌اندازی کرد، که مستقیماً توسعه‌ی متمرکز LLM را با تکنیک جدید کاملاً باز و مشارکتی برای ساخت LLMهای پیشرفته به چالش می‌کشد، با هدف مشارکت مجدد دانشگاهیان و ساخت زیرساخت هوش مصنوعی شفاف برای منافع عمومی @schmidtsciences
  • Red Hat AI مدل‌های با کیفیت بالای speculator را برای Llamas، Qwens و gpt-oss در Hugging Face متن‌باز کرد، که به سرعت‌های 1.5 تا 2.5 برابر در بارهای کاری واقعی و گاهی بیش از 4 برابر از طریق رمزگشایی حدسی دست می‌یابد @RedHat_AI
  • ZeroEntropy مدل reranker zerank-2 را منتشر کرد که بهبود عمده‌ای را در پنج حالت رایج شکست RAG نشان می‌دهد: مقایسه‌ی اعداد و تاریخ‌ها، تجمیع، پشتیبانی چندزبانه، پیروی از دستورالعمل‌ها، و امتیازات کالیبره‌شده، با 15 درصد بهبود نسبت به Cohere rerank 3

اخبار هوش مصنوعی در 2025-11-18

مدل‌های جدید هوش مصنوعی

  • گوگل جمینای 3 پرو را منتشر کرد که به عملکردی پیشرفته در معیارهای اصلی دست یافته است، از جمله رتبه‌ی اول در LMArena (1501 الو)، WebDev (1487 الو)، و بهبودهای قابل توجه در استدلال با 37.5% در «آخرین امتحان بشریت» و 31.1% در ARC-AGI-2 @sundarpichai
  • گوگل جمینای 3 دیپ تینک را معرفی کرد که عملکردی حتی قوی‌تر از جمینای 3 پرو با 45.1% در ARC-AGI-2 و 23.4% در MathArena Apex نشان می‌دهد که دو برابر بهبود نسبت به پیشرفته‌ترین مدل‌های قبلی است @OfficialLoganK
  • گوگل گوگل آنتی‌گراویتی را راه‌اندازی کرد، یک پلتفرم توسعه‌ی عامل‌محور که از جمینای 3 پرو برای استدلال، جمینای 2.5 کامپیوتر یوز برای اجرا، و نانو بنانا برای تولید تصویر استفاده می‌کند @GoogleDeepMind
  • xAI گروک 4.1 را منتشر کرد و ادعا می‌کند که با 1483 الو در صدر جدول امتیازات LMArena قرار گرفته است، با 65% ترجیح کاربر نسبت به مدل‌های قبلی، 600 امتیاز افزایش در نوشتن خلاقانه، و 3 برابر کاهش در توهمات @xai
  • مایکروسافت اعلام کرد که مدل‌های کلود (سونت 4.5، هایکو 4.5، اوپوس 4.1) اکنون از طریق همکاری با Anthropic و NVIDIA در Microsoft Foundry در دسترس هستند @Azure
  • Cohere در WMT 2025 کامند اِی ترنسلیت را ارائه کرد که استاندارد صنعتی جدیدی را برای ترجمه‌ی امن و آماده برای شرکت‌ها تعیین می‌کند @cohere

تحلیل صنعت

  • گوگل مزیت هزینه‌ای در توسعه‌ی مدل‌های هوش مصنوعی را از طریق مالکیت سخت‌افزار TPU، دسترسی به داده‌های اختصاصی، و آموزش جمینای 3 به عنوان یک مدل ترکیبی از متخصصان از ابتدا، نشان می‌دهد که امکان قیمت‌گذاری رقابتی را فراهم می‌کند @deedydas
  • Box گزارش می‌دهد که در آزمایش جمینای 3 پرو در مقابل جمینای 2.5 پرو در سناریوهای واقعی کسب‌وکار در خدمات مالی، حقوق، و مراقبت‌های بهداشتی، 22 درصد بهبود در وظایف استدلال پیچیده‌ی سازمانی مشاهده شده است @levie
  • Cursor در روز انتشار، عامل هوشمند پیش‌فرض خود را به جمینای 3 تغییر داد که اولین باری است که این شرکت احساس می‌کند مجبور به تغییر مدل‌ها بلافاصله پس از راه‌اندازی شده است @beyang
  • سم آلتمن به کاهش 300 برابری قیمت به ازای هر واحد هوش در طول یک سال به عنوان پایدارترین روند دست‌کم‌گرفته‌شده در توسعه‌ی هوش مصنوعی اشاره می‌کند @sama
  • Lambda پس از قرارداد چند میلیارد دلاری مایکروسافت برای زیرساخت مرکز داده‌ی هوش مصنوعی، 1.5 میلیارد دلار سرمایه جذب کرد @TechCrunch
  • Sphere با رهبری a16z، 21 میلیون دلار در سری A برای ساخت موتور انطباق مالیاتی فرامرزی مبتنی بر هوش مصنوعی جذب کرد که ثبت‌نام، محاسبه، بایگانی، و پرداخت را در بیش از 100 منطقه خودکار می‌کند @nrudder_
  • Stack Overflow خود را به عنوان ارائه‌دهنده‌ی داده‌های هوش مصنوعی در میان تغییر چشم‌انداز توسعه‌دهندگان بازتعریف می‌کند @TechCrunch
  • گرگلی اوروسز از گسترش IDEهای مبتنی بر هوش مصنوعی انتقاد می‌کند و بیش از 20 ابزار رقیب را فهرست می‌کند و استراتژی منسجم گوگل را پس از راه‌اندازی چندین پلتفرم توسعه در شش ماه زیر سوال می‌برد @GergelyOrosz

اخلاق و جامعه

  • کاربران گزارش می‌دهند که محتوای تولیدشده توسط هوش مصنوعی در سراسر پلتفرم‌های اینترنتی از جمله لینکدین، ردیت، مقالات خبری، و نقدها گسترش یافته است و اشاره می‌کنند که مردم با محتوای بی‌کیفیت هوش مصنوعی درگیر می‌شوند در حالی که از منشأ مصنوعی آن بی‌خبرند @deedydas
  • آندری کارپاتی در مورد دستکاری احتمالی معیارهای عمومی هوش مصنوعی از طریق حرکات پیچیده بر روی داده‌های مجاور مجموعه‌ی آزمایشی هشدار می‌دهد و به احتیاط توصیه می‌کند و آزمایش مستقیم مدل را به جای تکیه صرف بر نمرات معیارها پیشنهاد می‌کند @karpathy
  • یان لایک گزارش می‌دهد که صنعت هوش مصنوعی، الکس بورز، عضو مجلس ایالتی نیویورک را که از لایحه‌ی ایمنی هوش مصنوعی نیویورک حمایت کرده بود، به عنوان اولین هدف در کمپین سیاسی خود قرار داده است @janleike
  • MIT Media Lab در مورد نیاز به تدابیر حفاظتی برای محافظت از داده‌های عصبی بحث می‌کند، زیرا رابط‌های مغز و کامپیوتر رایج‌تر و قدرتمندتر می‌شوند @medialab
  • راشل توماس به 10 سال وبلاگ‌نویسی در مورد اخلاق هوش مصنوعی می‌اندیشد و نگرانی‌های مداوم در مورد آسیب‌های ناشی از سیستم‌های هوش مصنوعی که به طور غیرمسئولانه در مراقبت‌های بهداشتی، اشتغال، و پلیس به کار گرفته می‌شوند را برجسته می‌کند @math_rachel

کاربردها

  • گوگل جمینای ایجنت را برای مشترکین Google AI Ultra معرفی کرد که امکان خودکارسازی وظایف چندمرحله‌ای از جمله رزرو سفر، سازماندهی صندوق ورودی، و تعیین قرار ملاقات با تأیید کاربر قبل از اقدامات حیاتی را فراهم می‌کند @GeminiApp
  • گوگل حالت هوش مصنوعی را در جستجو با پشتیبانی جمینای 3 راه‌اندازی کرد که شامل تجربه‌های رابط کاربری مولد با طرح‌بندی‌های بصری پویا، ابزارهای تعاملی، و شبیه‌سازی‌هایی است که به طور خاص برای پرس‌وجوهای کاربر تولید می‌شوند @sundarpichai
  • فیگما جمینای 3 پرو را در Figma Make ادغام کرد که به طراحان امکان می‌دهد جهت‌گیری‌های بصری را بررسی کرده و نمونه‌های اولیه را با طیف گسترده‌ای از سبک‌ها، طرح‌بندی‌ها، و تعاملات تولید کنند @zoink
  • مایکروسافت Edge for Business را به عنوان اولین مرورگر هوش مصنوعی سازمانی امن جهان با حالت Copilot معرفی کرد که شامل اقدامات عامل‌محور، تحلیل چند تب، و خلاصه‌سازی یوتیوب است @mustafasuleyman
  • گوگل تجربه‌ی خرید جمینای را با چرخ‌وفلک‌های محصول، نمودارهای مقایسه، بررسی‌های عمیق با نظرات مشتریان، و لینک‌های خرید مستقیم بهبود بخشید @GeminiApp
  • آندری کارپاتی استفاده از LLMها را برای خواندن با رویکرد سه‌مرحله‌ای توصیف می‌کند: خواندن دستی، توضیح/خلاصه‌سازی، سپس پرسش و پاسخ، که منجر به درک عمیق‌تر از حرکت فوری می‌شود @karpathy
  • سایمون ویلسون یک ضبط صوتی 3.5 ساعته از جلسه‌ی شورا را با استفاده از جمینای 3 تحلیل کرد و کاربرد عملی درک زمینه‌ی طولانی را نشان داد @simonw
  • Replit تجربه‌ی طراحی را با پشتیبانی جمینای 3.0 راه‌اندازی کرد که به عنوان اولین تجربه‌ی طراحی هوش مصنوعی غیر بی‌کیفیت با تمرکز بر رابط‌های کاربری زیبا توصیف می‌شود @amasad

پژوهش‌ها

  • اوریول وینیالز بهبودهای پیش‌آموزش را تأیید می‌کند که هیچ مانعی در دید نیست، و اشاره می‌کند که دلتای بین جمینای 2.5 و 3.0 بزرگترین دلتای مشاهده‌شده تاکنون است، در حالی که پس‌آموزش همچنان یک زمینه‌ی کاملاً جدید با فضای زیادی برای پیشرفت الگوریتمی است @OriolVinyalsML
  • جمینای 3 پرو با دقت 73% در معیار ScreenSpot Pro به پیشرفتی دست یافت که دو برابر پیشرفته‌ترین مدل‌ها برای درک اسکرین‌شات‌ها در برنامه‌های پیچیده از جمله AutoCAD و فتوشاپ است @deedydas
  • جمینای 3 بهبود قابل توجهی در Vending-Bench Arena برای برنامه‌ریزی بلندمدت و قابلیت‌های فراخوانی ابزار نشان می‌دهد @OfficialLoganK
  • جمینای 3 پرو بزرگترین دلتای ثبت‌شده در معیار Design Arena را به دست آورد که بهبود قابل توجهی در وظایف مرتبط با طراحی نشان می‌دهد @OfficialLoganK
  • Physical Intelligence مقاله‌ای منتشر کرد که نتایج چشمگیر یادگیری تقویتی در دنیای واقعی را با استفاده از مدل VLA از پیش آموزش‌دیده با مداخلات انسانی، آموزش تابع ارزش، و به‌روزرسانی‌های سیاست نشان می‌دهد @yjy0625
  • Stanford NLP مدل CHURRO را منتشر کرد، یک مدل زبان-بینایی با وزن باز 3B که در OCR تاریخی از جمینای 2.5 پرو بهتر عمل می‌کند در حالی که 15.5 برابر مقرون‌به‌صرفه‌تر است @sina_semnani
  • فرانسوا شوله اشاره می‌کند که ARC-AGI برای اثبات اینکه LLMها مسیر AGI نیستند، طراحی شده بود، اما LLMها اکنون با جمینای 3 که به 31.1% می‌رسد، عملکرد قوی‌ای از خود نشان می‌دهند @dileeplearning
  • گروک 4.1 هوش هیجانی و همدلی بالاتری را نشان می‌دهد و در EQ-Bench امتیاز 1586 را کسب می‌کند، با مهارت‌های بین‌فردی بهبودیافته در مقایسه با مدل‌های قبلی @xai
  • تحقیقات MIT نشان می‌دهد که انتخاب دقیق داده‌ها می‌تواند راه‌حل‌های بهینه را با مجموعه‌های داده‌ی کوچک تضمین کند و روشی را برای شناسایی دقیق داده‌های مورد نیاز ارائه می‌دهد @MIT
  • محققان MIT Media Lab از چارچوب Environment-Vulnerability-Decision-Technology با داده‌های ماهواره‌ای برای ردیابی جنگل‌زدایی در غنا استفاده می‌کنند و نشان می‌دهند که چگونه فناوری فضایی از پیشرفت‌های زیست‌محیطی با رهبری آفریقا حمایت می‌کند @medialab

اخبار هوش مصنوعی در 2025-11-17

مدل‌های جدید هوش مصنوعی

  • چت Qwen علی‌بابا به نقطه‌ی عطف ۱۰ میلیون کاربر رسید. @Alibaba_Qwen
  • xAI نسخه‌ی بتای Grok 4.1 را برای کاربران منتشر کرد. به نظر می‌رسد این مدل در دو هفته‌ی اول نوامبر در حال آزمایش A/B بی‌صدا بوده است. @AndrewCurran_
  • OpenAI نسخه‌ی GPT-5.1 را با زمان پاسخ‌دهی به‌طور قابل‌توجهی سریع‌تر از GPT-5 منتشر کرد، اگرچه برخی از کاربران مشکلاتی را در کارهای مرتبط با کد مانند تغییرات مرحله‌ای و ایجاد درخواست‌های پول گزارش کرده‌اند. @natolambert
  • GPT-5.1 High در معیارهای ARC-AGI عملکردی مشابه GPT-5 Pro دارد، در حالی که تقریباً یک مرتبه‌ی بزرگی ارزان‌تر است. @GregKamradt
  • گوگل دیپ‌مایند WeatherNext 2 را معرفی کرد، یک مدل پیش‌بینی آب‌وهوای هوش مصنوعی که ۸ برابر سریع‌تر از نسخه‌ی قبلی خود است و در ۹۹.۹٪ از متغیرهای آب‌وهوایی از جمله دما، باد، رطوبت و سطح فشار دقیق‌تر است. @GoogleDeepMind

تحلیل صنعت

  • گزارش شده است که جف بزوس به‌عنوان مدیرعامل مشترک استارتاپ جدید هوش مصنوعی پروژه‌ی پرومتئوس بازگشته است. این پروژه ۶.۲ میلیارد دلار سرمایه دارد و بر طراحی هوش مصنوعی در صنایع هوافضا، کامپیوتر و خودرو تمرکز خواهد کرد و تقریباً ۱۰۰ کارمند از OpenAI، DeepMind و Meta استخدام کرده است. @AndrewCurran_
  • Sakana AI با ارزش ۲.۶۵ میلیارد دلار، ۱۳۵ میلیون دلار در سری B جذب سرمایه کرد تا به ساخت مدل‌های هوش مصنوعی برای ژاپن ادامه دهد، با حمایت MUFG، Khosla Ventures و سایر سرمایه‌گذاران بزرگ. @TechCrunch
  • Runlayer، یک استارتاپ امنیتی عامل هوش مصنوعی MCP، با ۸ یونیکورن و ۱۱ میلیون دلار از کیت رابویس از Khosla و Felicis راه‌اندازی شد. @TechCrunch
  • Luminal ۵.۳ میلیون دلار برای ساخت یک چارچوب کد GPU بهتر جذب سرمایه کرد. @TechCrunch
  • PowerLattice سرمایه‌گذاری پَت گلسینگر، مدیرعامل سابق اینتل، را برای فناوری چیپلت صرفه‌جویی در مصرف انرژی خود جذب کرد. @TechCrunch
  • Bone AI ۱۲ میلیون دلار برای به چالش کشیدن غول‌های دفاعی آسیا با رباتیک مبتنی بر هوش مصنوعی جذب سرمایه کرد. @TechCrunch
  • Ramp به ارزش ۳۲ میلیارد دلار رسید، تنها سه ماه پس از رسیدن به ۲۲.۵ میلیارد دلار. @TechCrunch
  • سهام Figma در ۲.۵ ماه پس از عرضه‌ی اولیه ۶۸٪ کاهش یافت، با ارزش‌گذاری تقریباً ۱۹ میلیارد دلار با وجود ۱.۱ میلیارد دلار ARR و ۳۸٪ رشد سال به سال، که نشان‌دهنده‌ی ماهیت بی‌رحمانه‌ی بازارهای عمومی برای شرکت‌های خصوصی در مراحل پایانی است. @deedydas
  • کارمندان Figma با هزینه‌ی تحقیق و توسعه‌ی ۲۹٪ از درآمد، جبران خسارت استثنایی دریافت می‌کنند که به میانگین حقوق نقدی ۳۰۰ هزار دلار به ازای هر کارمند، به اضافه‌ی جبران خسارت مبتنی بر سهام که مجموعاً به ۷۰۰ هزار تا ۱.۵ میلیون دلار در سال می‌رسد. @deedydas
  • فیدجی سیمو، مدیرعامل بخش کاربردهای OpenAI، درباره‌ی مسیر سودآوری صحبت می‌کند، با این انتظار که هم OpenAI و هم Anthropic مشاوران مالی هوش مصنوعی را در سال ۲۰۲۶ منتشر خواهند کرد. @AndrewCurran_
  • مصطفی سلیمان استدلال می‌کند که ما در حباب هوش مصنوعی نیستیم و می‌گوید هوش مصنوعی هوشمندترین و تواناترین فناوری است که تاکنون اختراع شده و سریع‌تر از حد انتظار در حال بهبود است. @mustafasuleyman
  • سیسکو استارتاپ ترجمه‌ی EzDubs را خریداری می‌کند. @TechCrunch

اخلاق و جامعه

  • گرگلی اوروسز مشاهده می‌کند که نظریه‌ی اینترنت مرده در X در حال وقوع است، جایی که پاسخ‌های تولید شده توسط هوش مصنوعی بر اساس پرداخت و نه کیفیت تقویت می‌شوند و بالاتر از پاسخ‌های انسانی معنادار ظاهر می‌شوند. @GergelyOrosz
  • رید هافمن استدلال می‌کند که انتظار برای ۱۰۰٪ ایمنی قبل از تأیید فناوری‌های جدید هوش مصنوعی مانند درمانگران هوش مصنوعی، مزایای عظیمی را از افرادی که به آن‌ها نیاز دارند، سلب می‌کند و می‌گوید معیار باید سیستم‌هایی ایمن‌تر از جایگزین‌های فقط انسانی باشد تا صفر اشتباه. @reidhoffman
  • هافمن تأکید می‌کند که برای کسانی که به دلیل دلایل اقتصادی، جغرافیایی یا سایر دلایل نمی‌توانند به درمان دسترسی داشته باشند، یک درمانگر هوش مصنوعی خوب ساخته شده بهتر از عدم دسترسی به حمایت از سلامت روان است. @reidhoffman
  • آماندا اسکل شباهت‌هایی بین مشاوره‌ی روابط و عیب‌یابی هوش مصنوعی ترسیم می‌کند و اشاره می‌کند که اولین سؤال او برای مشکلات Claude اکنون این است که «وقتی همه‌ی این‌ها را به Claude گفتید چه اتفاقی افتاد؟» شبیه به پرسیدن از شرکا برای برقراری ارتباط مستقیم. @AmandaAskell
  • آیدان مک‌لاکلین از OpenAI نگرانی‌های کاربران را در مورد تغییرات مدل تأیید می‌کند و می‌گوید تیم در ساعت ۳ صبح یکشنبه‌ها برای بهبود کیفیت چت‌بات و رفع عدم دقت هم‌ترازی کار می‌کند، در حالی که اعتراف می‌کند هیچ چت‌بات فعلی بهینه نیست. @aidan_mclau

کاربردها

  • Anthropic با دولت رواندا و ALX Africa همکاری می‌کند تا Chidi، یک همراه یادگیری ساخته شده بر روی Claude، را به صدها هزار دانش‌آموز در سراسر آفریقا بیاورد. @AnthropicAI
  • گوگل فناوری WeatherNext را در جستجوی گوگل، Gemini، Pixel Weather ادغام می‌کند و به زودی اطلاعات آب‌وهوا را در Google Maps ارائه خواهد داد. @GoogleDeepMind
  • Public.com قابلیتی را راه‌اندازی می‌کند که به کاربران امکان می‌دهد ETFهای تولید شده توسط هوش مصنوعی را بر اساس معیارهای سفارشی ایجاد کنند، با یک نمونه از شرکت‌های متمرکز بر طراحی که از S&P 500 به صورت تاریخی ۲ برابر بهتر عمل کرده‌اند. @benblumenrose
  • تیم مک‌آلیر در Florentine Films از هوش مصنوعی برای ایجاد نرم‌افزار مدیریت رسانه‌ی سفارشی برای فیلم‌سازی استفاده می‌کند. @clairevo
  • گوگل ابزار AI Flight Deals را در سطح جهانی عرضه می‌کند و ویژگی‌های جدید سفر را در جستجو اضافه می‌کند. @TechCrunch
  • Hugging Face و Google Cloud برای سرعت بخشیدن به دسترسی مدل، تقویت امنیت و کاهش هزینه‌های عملیاتی همکاری می‌کنند، با بیش از ۱,۵۰۰ ترابایت داده که روزانه مبادله می‌شود. @DataChaz

پژوهش‌ها

  • WeatherNext 2 گوگل دیپ‌مایند از یک رویکرد جدید شبکه‌ی مولد تابعی استفاده می‌کند که تصادفی بودن هدفمند را مستقیماً به معماری اضافه می‌کند و به آن اجازه می‌دهد طیف گسترده‌ای از سناریوهای آب‌وهوایی را بررسی کند و صدها پیش‌بینی ممکن را در کمتر از یک دقیقه از یک نقطه‌ی شروع واحد تولید کند. @GoogleDeepMind
  • WeatherNext 2 در پیش‌بینی هر دو پیش‌بینی حاشیه‌ای (رویدادهای آب‌وهوایی منفرد مانند دما در مکان‌های خاص) و پیش‌بینی‌های مشترک (ترکیب چندین متغیر مانند توان باد مورد انتظار) به عملکرد پیشرو در جهان دست می‌یابد. @GoogleDeepMind
  • ایتان مولیک یک معیار جدید توهم را نقد می‌کند و استدلال می‌کند که این معیار عمدتاً آستانه‌های امتناع از پاسخ به سؤالات بی‌اهمیت بسیار خاص را اندازه‌گیری می‌کند تا نرخ‌های توهم واقعی را، و اشاره می‌کند که GPT-5 High و Grok-4 با دستیابی به ۳۹٪ دقت در سؤالات تقریباً غیرممکن بدون جستجوی وب، شگفت‌انگیز است. @emollick
  • ایتان مولیک معیارهای هوش مصنوعی گم‌شده در مورد شکنندگی را شناسایی می‌کند و اشاره می‌کند که برخی از مدل‌ها در ابتدا و در معیارهای عملکرد خوب عمل می‌کنند اما با استفاده‌ی طولانی‌مدت از کار می‌افتند، که سؤالاتی را در مورد تعمیم، تکرار موضوعی و درک قصد پرامپت ایجاد می‌کند. @emollick
  • شریا شانکار چارچوب مفصلی برای درک ارزیابی هوش مصنوعی ارائه می‌دهد و آن را به سه جزء تقسیم می‌کند: شناسایی معیارهای موفقیت، تعیین نحوه‌ی اعمال روبی به خروجی‌های LLM، و خودکارسازی کاربرد روبی در مقیاس. @sh_reya
  • ناتان لمبرت درباره‌ی اینکه چرا نوشتار هوش مصنوعی متوسط است بحث می‌کند و توضیح می‌دهد که چگونه روش‌های آموزش مدل زبان فعلی صدا و امید به نوشتار خوب را از بین می‌برند، با GPT-5 که اذعان می‌کند همیشه برای ارائه‌ی پیشنهادها سیم‌کشی شده است تا ادعای نوشتن شاهکارها را داشته باشد. @natolambert
  • حمل حسین هشدار می‌دهد که چت‌بات‌های «هرچه می‌خواهی بپرس» نشان‌دهنده‌ی اشتباه ۵۰۰ هزار دلاری به دلیل مارپیچ‌های مرگ ارزیابی هستند، جایی که عدم وجود دامنه‌ی واضح مانع از تعریف معیارهای موفقیت، شناسایی شکست‌های حیاتی و اولویت‌بندی اصلاحات می‌شود و از مرزهای عامل بسیار خاص حمایت می‌کند. @bnicholehopkins
  • فرانسوا شوله می‌گوید سادگی امضای حقیقت است و استدلال می‌کند که توضیحات پیچیده با استثناها و موارد خاص نشان می‌دهد که ایده‌ی اصلی هنوز پیدا نشده است. @fchollet
  • گرگ براکمن از OpenAI به دنبال نامزدها برای کار استنتاج است و آن را شاید باارزش‌ترین دسته‌ی نرم‌افزاری در حال ظهور توصیف می‌کند، زیرا مدل‌ها هوشمندتر و از نظر اقتصادی باارزش‌تر می‌شوند، با محاسبات که به طور فزاینده‌ای صرف نمونه‌برداری از مدل‌ها می‌شود. @gdb
  • MIT زانوی بیونیک جدیدی را توسعه می‌دهد که به افراد دارای قطع عضو بالای زانو کمک می‌کند سریع‌تر راه بروند، از پله‌ها بالا بروند و راحت‌تر از پروتزهای سنتی از موانع عبور کنند. <a href="https://x.com/

اخبار هوش مصنوعی در 2025-11-16

پژوهش‌ها

  • آلفاایوُلو گوگل با جستجوی موازی و مکرر راه‌حل‌ها، تأیید آن‌ها و انجام انتخاب طبیعی برای تکامل ایده‌ها، راه‌حل‌هایی بهتر از انسان برای برخی مسائل ریاضی، از جمله مسئله‌ی بوسه، کشف می‌کند. ترنس تائو، ریاضیدان، آن را روی ۶۷ مسئله آزمایش کرد و دریافت که مدل‌های پایه هوش مصنوعی هوشمندتر سریع‌تر به راه‌حل‌ها همگرا می‌شوند، موازی‌سازی عموماً کمک می‌کند اما هزینه‌ی محاسباتی را افزایش می‌دهد و هک پاداش رایج است @deedydas
  • تیم Future House به پیشرفتی در تحقیقات علمی با کمک هوش مصنوعی دست یافته است که به عنوان یکی از مهم‌ترین تأثیرات هوش مصنوعی توصیف می‌شود @sama

تحلیل صنعت

  • شاپیفای اولین شرکتی بود که خارج از مایکروسافت از گیت‌هاب کوپایلوت استفاده کرد، و رئیس مهندسی آن‌ها گفت که شهرت آن‌ها در ارائه‌ی بازخورد عالی به آن‌ها کمک کرد تا دسترسی زودهنگام پیدا کنند @GergelyOrosz
  • برخی شرکت‌ها دریافته‌اند که استفاده‌ی توسعه‌دهندگان از ابزارهای هوش مصنوعی در مصاحبه‌ها سیگنال زیادی نمی‌دهد، و حداقل یک استارتاپ در سیلیکون ولی مصاحبه‌های «چیزی با هوش مصنوعی بسازید» را حذف کرده است @GergelyOrosz
  • مدل‌های چینی در حال حاضر سهم بازار آزمایشگاه‌های پیشرو هوش مصنوعی را به خود اختصاص داده‌اند، با این سؤال که آیا این روند در شرکت‌ها پایدارتر است یا خیر @natolambert
  • مرکز داده‌ی Fairwater مایکروسافت در آتلانتا بیش از ۱۵ میلیون ساعت کار برای ساخت آن صرف شده است، که بیش از دو برابر ۷ میلیون ساعت مورد نیاز برای ساختمان امپایر استیت است @mustafasuleyman

کاربردها

  • جیمیل قابلیت جدید زمان‌بندی هوشمند را معرفی می‌کند که از محتوای ایمیل برای یافتن زمان‌های جلسه استفاده می‌کند و به طور خودکار رویدادها را هنگام انتخاب زمان توسط گیرنده ایجاد می‌کند، که نشان‌دهنده‌ی بهبود قابل توجهی در بهره‌وری است @deedydas
  • نسخه‌ی جدید پلاگین llm-anthropic از خروجی‌های ساختاریافته از طریق API رسمی و قابلیت جستجوی وب Anthropic پشتیبانی می‌کند @simonw
  • آندری کارپاتی پیشنهاد می‌کند که قابلیت تأیید پیش‌بینی‌کننده‌ترین ویژگی برای اتوماسیون هوش مصنوعی در پارادایم برنامه‌نویسی جدید است، جایی که وظایفی که می‌توانند تمرین شوند، بازنشانی شوند و پاداش داده شوند، بیشترین قابلیت را برای بهینه‌سازی شبکه‌ی عصبی دارند @karpathy
  • متخصصان ساخت هوش مصنوعی لزوماً متخصصان استفاده از هوش مصنوعی نیستند، که فرصت‌هایی را برای متخصصان حوزه‌ای ایجاد می‌کند تا قبل از دیگران قابلیت‌های هوش مصنوعی را در زمینه‌های خود کشف کنند @emollick

اخلاق و جامعه

  • معیارگذاری فعلی هوش مصنوعی بیش از حد بر توانایی مدل از طریق فراخوانی API تمرکز دارد تا کار عاملانه که ابزارها و توانایی حل مسئله را ترکیب می‌کند، که از نظر اقتصادی اهمیت بیشتری دارد @emollick
  • معیارگذاری بهتر برای درک اینکه چرا توانایی‌های عاملانه از بین می‌روند، از جمله ضعف‌های بینایی و «حلقه‌های مرگ» که در آن هوش مصنوعی به تلاش برای همان رویکرد شکست‌خورده ادامه می‌دهد، مورد نیاز است @emollick
  • ویندوز با انتقاد توسعه‌دهندگان به دلیل گنجاندن تبلیغات در یک سیستم عامل پولی و روشن کردن پیش‌فرض قابلیت‌های هوش مصنوعی در سطح سیستم عامل مانند Recall، که توسعه‌دهندگان نمی‌خواهند، مواجه است @GergelyOrosz
  • سیستم پزشکی کانادا در خارج از شهرهای بزرگ به طور کامل فروپاشیده است، با این حال ادغام هوش مصنوعی به طور بالقوه می‌تواند کمبود کارکنان را کاهش دهد، اما هنوز سال‌ها تا پیاده‌سازی آن فاصله داریم @AndrewCurran_