اخبار هوش مصنوعی در 2025-11-25

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Opus 4.5 را منتشر کرد که اکنون برای مشترکین Perplexity Max و در Claude Code در دسترس است. این مدل تقریباً 60% گران‌تر از Sonnet است، اما به دلیل 76% توکن‌های استدلال خروجی کمتر برای کارهای پیچیده، ممکن است در مجموع ارزان‌تر باشد @perplexity_ai
  • Perplexity مدل Grok 4.1 را برای همه کاربران Pro و Max اضافه کرد. مدیرعامل این شرکت به سرعت و کارایی چشمگیر این مدل اشاره کرد که منجر به افزایش استفاده داخلی شده است @perplexity_ai
  • گوگل مدل Nano Banana Pro را منتشر کرد، یک مدل پیشرفته‌ی تولید و ویرایش تصویر که دارای دقت رندر متن بهبودیافته، یکپارچه‌سازی دانش جهانی، 2K دانلود و کنترل‌های ویرایش پیچیده است @GeminiApp
  • Black Forest Labs مدل FLUX.2-dev را راه‌اندازی کرد، یک مدل تولید تصویر با وزن باز 32B پارامتر که با قابلیت‌های چند مرجعی و وضوح 4MP به عملکردی پیشرفته دست یافته است @bfl_ml
  • Tencent مدل Hunyuan OCR را منتشر کرد، یک مدل درک سند 1B پارامتر که به عملکردی پیشرفته در تجزیه‌ی سند، پرسش و پاسخ بصری و ترجمه دست یافته است @Xianbao_QIAN
  • مدل تبدیل متن به گفتار جریانی Dia2 با قابلیت‌های تولید صدای بلادرنگ راه‌اندازی شد که در اندازه‌های 1B و 2B تحت مجوز Apache 2.0 در دسترس است @Tu7uruu
  • OpenAI قابلیت ChatGPT Voice را مستقیماً در رابط چت ادغام کرد و نیاز به حالت جداگانه را از بین برد و نمایش پاسخ بلادرنگ با عناصر بصری را امکان‌پذیر ساخت @OpenAI
  • مدل SAM 3D متا توسط محققان دانشگاه کارنگی ملون برای ثبت و تحلیل حرکت انسان در محیط‌های توانبخشی بالینی استفاده می‌شود @AIatMeta

تحلیل صنعت

  • تحقیقات Anthropic تخمین می‌زند که مدل‌های هوش مصنوعی نسل فعلی در صورت پذیرش گسترده، می‌توانند رشد سالانه‌ی بهره‌وری نیروی کار ایالات متحده را در دهه‌ی آینده 1.8% افزایش دهند، با کارهایی که به طور متوسط 90 دقیقه طول می‌کشند تا تکمیل شوند و از طریق Claude تقریباً 80% بهبود سرعت را تجربه می‌کنند @AnthropicAI
  • Perplexity از 1 ژانویه 2025، تقریباً هر 93 ساعت یک محصول یا ویژگی جدید و تقریباً هر 17 روز یک مدل برتر جدید را در دسترس قرار داده است @AravSrinivas
  • Perplexity تجربه‌ی خرید شخصی‌سازی‌شده با توصیه‌های محصول منتخب و خرید فوری با پشتیبانی PayPal را راه‌اندازی کرد که حافظه و تجارت را برای خرید بدون تبلیغات یکپارچه می‌کند @perplexity_ai
  • Suno با Warner Music Group همکاری می‌کند، تمام دعاوی را حل و فصل می‌کند و برای دانلود آهنگ‌ها حساب‌های پولی را الزامی می‌کند، با WMG که اعلام می‌کند «هوش مصنوعی زمانی هنرمند-محور می‌شود که به اصول ما پایبند باشد» @AndrewCurran_
  • Copilot مایکروسافت به دلیل تغییرات در سیاست‌های واتس‌اپ در مورد چت‌بات LLM در این پلتفرم، در 15 ژانویه 2026 واتس‌اپ را ترک می‌کند @Copilot
  • مارک آندرسن مشاهده می‌کند که پذیرش فناوری هوش مصنوعی الگوهای سنتی را معکوس می‌کند، با مصرف‌کنندگان که سریع‌ترین پذیرش را دارند، سپس کسب‌وکارهای کوچک، در حالی که دولت دیرترین پذیرنده باقی می‌ماند @a16z
  • مارک آندرسن اشاره می‌کند که هوش مصنوعی نوآوری را در شعاع 20 مایلی اطراف سیلیکون ولی متمرکز کرده است، با تقریباً صد درصد شرکت‌های هوش مصنوعی جالب در غرب که در نقطه‌ی صفر اتفاق می‌افتند @a16z
  • یک استخدام‌کننده در شرکت PE ماه‌ها قادر به استخدام توسعه‌دهنده‌ی ارشد Go به دلیل الزامات سخت‌گیرانه برای N سال تجربه‌ی Go نبود، با وجود اینکه هوش مصنوعی یادگیری زبان را به طور قابل توجهی آسان‌تر کرده است @GergelyOrosz
  • Stanford HAI ابزار پویایی جهانی هوش مصنوعی 2025 را منتشر کرد که نشان می‌دهد ایالات متحده رتبه‌ی 1، چین رتبه‌ی 2 و هند با جهش به رتبه‌ی 3 قرار دارند، زیرا کشورها هوش مصنوعی را به عنوان یک ضرورت استراتژیک در اولویت قرار می‌دهند @StanfordHAI

اخلاق و جامعه

  • Nano Banana Pro می‌تواند رسیدهای جعلی، اسناد KYC و گذرنامه‌ها را با دقت بالا در یک درخواست، با دقت ریاضی کامل تولید کند، که سیستم‌های تأیید مبتنی بر تصویر را منسوخ می‌کند @deedydas
  • Anthropic زبان درخواست سیستمی را اضافه کرد که به Claude اجازه می‌دهد در صورت بی‌ادبی، بدجنسی یا توهین غیرضروری کاربران، بر مهربانی و احترام اصرار ورزد و بیان می‌کند که «کلود شایسته‌ی تعامل محترمانه است» @simonw
  • تحقیقات جدید Anthropic بیش از 25 روش را برای بهبود صداقت هوش مصنوعی و تشخیص دروغ با استفاده از مجموعه‌ای متنوع از مدل‌های فریبکار آزمایش می‌کند و نشان می‌دهد که رویکردهای ساده مانند تنظیم دقیق مدل‌ها برای صادق بودن با وجود دستورالعمل‌های فریبنده بهترین عملکرد را دارند @rowankwang
  • گزارش Pew عدم تعادل جنسیتی بی‌سابقه‌ای را در پلتفرم X تأیید می‌کند، با عدم تعادل مرد و زن که تنها از Reddit اواخر دهه‌ی 2010 کمتر شدید است، که اولین بار است که یک جنسیت به این شکل قاطعانه یک پلتفرم رسانه‌ی اجتماعی مدرن را ترک کرده است @JessicaHullman
  • تحقیقات نشان می‌دهد که «همسویی برای چه کسی» به یک سؤال حیاتی در داخل سازمان‌ها تبدیل خواهد شد، زیرا آنها راه‌حل‌های هوش مصنوعی رو به بیرون را مستقر می‌کنند @emollick

کاربردها

  • Anthropic با وزارت انرژی و دولت ترامپ در مأموریت Genesis همکاری می‌کند و دارایی‌های علمی وزارت انرژی را با قابلیت‌های هوش مصنوعی پیشرفته ترکیب می‌کند تا از تسلط انرژی آمریکا حمایت کرده و بهره‌وری علمی را تسریع بخشد @AnthropicAI
  • Fleet Space با استفاده از هوش مصنوعی و ماهواره‌ها یک ذخیره‌ی عظیم لیتیوم را کشف کرد @TechCrunch
  • محققان از AlphaFold برای درک سیستم‌های ایمنی زنبور عسل استفاده می‌کنند و تلاش‌های حفاظتی و برنامه‌های پرورش را برای محافظت از جمعیت‌های در معرض خطر راهنمایی می‌کنند @GoogleDeepMind
  • AlphaFold به کشف ساختار قفس‌مانند یک پروتئین کلیدی مرتبط با کلسترول بد پس از دهه‌ها گریزناپذیری کمک کرد و طراحی درمان‌های پیشگیرانه جدید را امکان‌پذیر ساخت @GoogleDeepMind
  • مارک آندرسن هوش مصنوعی را به عنوان «بهترین مربی، راهنما، درمانگر، مشاور، عضو هیئت مدیره» جهان برای صاحبان کسب‌وکارهای کوچک توصیف می‌کند که برای تصمیمات عملیاتی بی‌نهایت صبور است @a16z
  • Speechify قابلیت‌های تایپ صوتی و دستیار صوتی را به افزونه‌ی کروم خود اضافه کرد @TechCrunch

پژوهش‌ها

  • ایلیا سوتسکور زمان‌بندی ASI را بین سال‌های 2030 تا 2045 پیش‌بینی می‌کند و در مورد پیشرفت SSI و رویکرد ساخت AGI به شکلی متفاوت از سایر آزمایشگاه‌ها بحث می‌کند @AndrewCurran_
  • تحقیقات در مورد GRPO (بهینه‌سازی سیاست نسبی گروه) نشان می‌دهد که آموزش RL برای LLMها به سمت سادگی حرکت می‌کند و منتقد، مدل پاداش و مدل مرجع را از خط لوله‌ی اصلی RLHF مبتنی بر PPO که به 4 کپی مدل نیاز داشت، حذف می‌کند @cwolferesearch
  • آزمایش هوش مصنوعی‌ها به طور فزاینده‌ای دشوار می‌شود زیرا آنها در طیف گسترده‌ای از وظایف «هوشمندتر» می‌شوند، با وظایف متوسط در GDPval که یک ساعت طول می‌کشد تا کارشناسان بدون فشار آوردن به حداکثر توانایی‌های هوش مصنوعی‌های فعلی آنها را ارزیابی کنند @emollick
  • تحقیقات محافظت بهبودیافته در برابر حملات تزریق درخواست را نشان می‌دهد، اگرچه مهاجمان با 10 بار تلاش هنوز تقریباً 1/3 مواقع موفق می‌شوند @simonw
  • تحقیقات جدید در مورد فشرده‌سازی LLM با استفاده از RL به مدل‌ها امکان می‌دهد فشرده‌سازی 10 برابری را به طور طبیعی یاد بگیرند، با Qwen که یاد می‌گیرد اطلاعات بیشتری را در هر توکن با استفاده از توکن‌های ماندارین و هرس متن بسته‌بندی کند @_rajanagarwal
  • تحقیقات معیارهای اثربخشی VLM مدرن را برای فعالیت‌های خانگی با افق طولانی در یادگیری رباتیک با استفاده از محیط معیار BEHAVIOR نشان می‌دهد @drfeifei
  • تحقیقات جدید استدلال چندوجهی نشان می‌دهد که دستورالعمل‌های پس از آموزش کاملاً باز هنوز هم می‌توانند عملکرد پیشرفته را بهبود بخشند، با روش‌های داده‌ی ساده که فرصت‌های تأثیرگذاری قابل توجهی را فراهم می‌کنند @natolambert