اخبار هوش مصنوعی در 2025-11-25

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Opus 4.5 را منتشر کرد که اکنون برای مشترکین Perplexity Max و در Claude Code در دسترس است. این مدل تقریباً 60% گران‌تر از Sonnet است، اما به دلیل 76% توکن‌های استدلال خروجی کمتر برای کارهای پیچیده، ممکن است در مجموع ارزان‌تر باشد @perplexity_ai
Perplexity مدل Grok 4.1 را برای همه کاربران Pro و Max اضافه کرد. مدیرعامل این شرکت به سرعت و کارایی چشمگیر این مدل اشاره کرد که منجر به افزایش استفاده داخلی شده است @perplexity_ai
گوگل مدل Nano Banana Pro را منتشر کرد، یک مدل پیشرفته‌ی تولید و ویرایش تصویر که دارای دقت رندر متن بهبودیافته، یکپارچه‌سازی دانش جهانی، 2K دانلود و کنترل‌های ویرایش پیچیده است @GeminiApp
Black Forest Labs مدل FLUX.2-dev را راه‌اندازی کرد، یک مدل تولید تصویر با وزن باز 32B پارامتر که با قابلیت‌های چند مرجعی و وضوح 4MP به عملکردی پیشرفته دست یافته است @bfl_ml
Tencent مدل Hunyuan OCR را منتشر کرد، یک مدل درک سند 1B پارامتر که به عملکردی پیشرفته در تجزیه‌ی سند، پرسش و پاسخ بصری و ترجمه دست یافته است @Xianbao_QIAN
مدل تبدیل متن به گفتار جریانی Dia2 با قابلیت‌های تولید صدای بلادرنگ راه‌اندازی شد که در اندازه‌های 1B و 2B تحت مجوز Apache 2.0 در دسترس است @Tu7uruu
OpenAI قابلیت ChatGPT Voice را مستقیماً در رابط چت ادغام کرد و نیاز به حالت جداگانه را از بین برد و نمایش پاسخ بلادرنگ با عناصر بصری را امکان‌پذیر ساخت @OpenAI
مدل SAM 3D متا توسط محققان دانشگاه کارنگی ملون برای ثبت و تحلیل حرکت انسان در محیط‌های توانبخشی بالینی استفاده می‌شود @AIatMeta

تحلیل صنعت

تحقیقات Anthropic تخمین می‌زند که مدل‌های هوش مصنوعی نسل فعلی در صورت پذیرش گسترده، می‌توانند رشد سالانه‌ی بهره‌وری نیروی کار ایالات متحده را در دهه‌ی آینده 1.8% افزایش دهند، با کارهایی که به طور متوسط 90 دقیقه طول می‌کشند تا تکمیل شوند و از طریق Claude تقریباً 80% بهبود سرعت را تجربه می‌کنند @AnthropicAI
Perplexity از 1 ژانویه 2025، تقریباً هر 93 ساعت یک محصول یا ویژگی جدید و تقریباً هر 17 روز یک مدل برتر جدید را در دسترس قرار داده است @AravSrinivas
Perplexity تجربه‌ی خرید شخصی‌سازی‌شده با توصیه‌های محصول منتخب و خرید فوری با پشتیبانی PayPal را راه‌اندازی کرد که حافظه و تجارت را برای خرید بدون تبلیغات یکپارچه می‌کند @perplexity_ai
Suno با Warner Music Group همکاری می‌کند، تمام دعاوی را حل و فصل می‌کند و برای دانلود آهنگ‌ها حساب‌های پولی را الزامی می‌کند، با WMG که اعلام می‌کند «هوش مصنوعی زمانی هنرمند-محور می‌شود که به اصول ما پایبند باشد» @AndrewCurran_
Copilot مایکروسافت به دلیل تغییرات در سیاست‌های واتس‌اپ در مورد چت‌بات LLM در این پلتفرم، در 15 ژانویه 2026 واتس‌اپ را ترک می‌کند @Copilot
مارک آندرسن مشاهده می‌کند که پذیرش فناوری هوش مصنوعی الگوهای سنتی را معکوس می‌کند، با مصرف‌کنندگان که سریع‌ترین پذیرش را دارند، سپس کسب‌وکارهای کوچک، در حالی که دولت دیرترین پذیرنده باقی می‌ماند @a16z
مارک آندرسن اشاره می‌کند که هوش مصنوعی نوآوری را در شعاع 20 مایلی اطراف سیلیکون ولی متمرکز کرده است، با تقریباً صد درصد شرکت‌های هوش مصنوعی جالب در غرب که در نقطه‌ی صفر اتفاق می‌افتند @a16z
یک استخدام‌کننده در شرکت PE ماه‌ها قادر به استخدام توسعه‌دهنده‌ی ارشد Go به دلیل الزامات سخت‌گیرانه برای N سال تجربه‌ی Go نبود، با وجود اینکه هوش مصنوعی یادگیری زبان را به طور قابل توجهی آسان‌تر کرده است @GergelyOrosz
Stanford HAI ابزار پویایی جهانی هوش مصنوعی 2025 را منتشر کرد که نشان می‌دهد ایالات متحده رتبه‌ی 1، چین رتبه‌ی 2 و هند با جهش به رتبه‌ی 3 قرار دارند، زیرا کشورها هوش مصنوعی را به عنوان یک ضرورت استراتژیک در اولویت قرار می‌دهند @StanfordHAI

اخلاق و جامعه

Nano Banana Pro می‌تواند رسیدهای جعلی، اسناد KYC و گذرنامه‌ها را با دقت بالا در یک درخواست، با دقت ریاضی کامل تولید کند، که سیستم‌های تأیید مبتنی بر تصویر را منسوخ می‌کند @deedydas
Anthropic زبان درخواست سیستمی را اضافه کرد که به Claude اجازه می‌دهد در صورت بی‌ادبی، بدجنسی یا توهین غیرضروری کاربران، بر مهربانی و احترام اصرار ورزد و بیان می‌کند که «کلود شایسته‌ی تعامل محترمانه است» @simonw
تحقیقات جدید Anthropic بیش از 25 روش را برای بهبود صداقت هوش مصنوعی و تشخیص دروغ با استفاده از مجموعه‌ای متنوع از مدل‌های فریبکار آزمایش می‌کند و نشان می‌دهد که رویکردهای ساده مانند تنظیم دقیق مدل‌ها برای صادق بودن با وجود دستورالعمل‌های فریبنده بهترین عملکرد را دارند @rowankwang
گزارش Pew عدم تعادل جنسیتی بی‌سابقه‌ای را در پلتفرم X تأیید می‌کند، با عدم تعادل مرد و زن که تنها از Reddit اواخر دهه‌ی 2010 کمتر شدید است، که اولین بار است که یک جنسیت به این شکل قاطعانه یک پلتفرم رسانه‌ی اجتماعی مدرن را ترک کرده است @JessicaHullman
تحقیقات نشان می‌دهد که «همسویی برای چه کسی» به یک سؤال حیاتی در داخل سازمان‌ها تبدیل خواهد شد، زیرا آنها راه‌حل‌های هوش مصنوعی رو به بیرون را مستقر می‌کنند @emollick

کاربردها

Anthropic با وزارت انرژی و دولت ترامپ در مأموریت Genesis همکاری می‌کند و دارایی‌های علمی وزارت انرژی را با قابلیت‌های هوش مصنوعی پیشرفته ترکیب می‌کند تا از تسلط انرژی آمریکا حمایت کرده و بهره‌وری علمی را تسریع بخشد @AnthropicAI
Fleet Space با استفاده از هوش مصنوعی و ماهواره‌ها یک ذخیره‌ی عظیم لیتیوم را کشف کرد @TechCrunch
محققان از AlphaFold برای درک سیستم‌های ایمنی زنبور عسل استفاده می‌کنند و تلاش‌های حفاظتی و برنامه‌های پرورش را برای محافظت از جمعیت‌های در معرض خطر راهنمایی می‌کنند @GoogleDeepMind
AlphaFold به کشف ساختار قفس‌مانند یک پروتئین کلیدی مرتبط با کلسترول بد پس از دهه‌ها گریزناپذیری کمک کرد و طراحی درمان‌های پیشگیرانه جدید را امکان‌پذیر ساخت @GoogleDeepMind
مارک آندرسن هوش مصنوعی را به عنوان «بهترین مربی، راهنما، درمانگر، مشاور، عضو هیئت مدیره» جهان برای صاحبان کسب‌وکارهای کوچک توصیف می‌کند که برای تصمیمات عملیاتی بی‌نهایت صبور است @a16z
Speechify قابلیت‌های تایپ صوتی و دستیار صوتی را به افزونه‌ی کروم خود اضافه کرد @TechCrunch

پژوهش‌ها

ایلیا سوتسکور زمان‌بندی ASI را بین سال‌های 2030 تا 2045 پیش‌بینی می‌کند و در مورد پیشرفت SSI و رویکرد ساخت AGI به شکلی متفاوت از سایر آزمایشگاه‌ها بحث می‌کند @AndrewCurran_
تحقیقات در مورد GRPO (بهینه‌سازی سیاست نسبی گروه) نشان می‌دهد که آموزش RL برای LLMها به سمت سادگی حرکت می‌کند و منتقد، مدل پاداش و مدل مرجع را از خط لوله‌ی اصلی RLHF مبتنی بر PPO که به 4 کپی مدل نیاز داشت، حذف می‌کند @cwolferesearch
آزمایش هوش مصنوعی‌ها به طور فزاینده‌ای دشوار می‌شود زیرا آنها در طیف گسترده‌ای از وظایف «هوشمندتر» می‌شوند، با وظایف متوسط در GDPval که یک ساعت طول می‌کشد تا کارشناسان بدون فشار آوردن به حداکثر توانایی‌های هوش مصنوعی‌های فعلی آنها را ارزیابی کنند @emollick
تحقیقات محافظت بهبودیافته در برابر حملات تزریق درخواست را نشان می‌دهد، اگرچه مهاجمان با 10 بار تلاش هنوز تقریباً 1/3 مواقع موفق می‌شوند @simonw
تحقیقات جدید در مورد فشرده‌سازی LLM با استفاده از RL به مدل‌ها امکان می‌دهد فشرده‌سازی 10 برابری را به طور طبیعی یاد بگیرند، با Qwen که یاد می‌گیرد اطلاعات بیشتری را در هر توکن با استفاده از توکن‌های ماندارین و هرس متن بسته‌بندی کند @_rajanagarwal
تحقیقات معیارهای اثربخشی VLM مدرن را برای فعالیت‌های خانگی با افق طولانی در یادگیری رباتیک با استفاده از محیط معیار BEHAVIOR نشان می‌دهد @drfeifei
تحقیقات جدید استدلال چندوجهی نشان می‌دهد که دستورالعمل‌های پس از آموزش کاملاً باز هنوز هم می‌توانند عملکرد پیشرفته را بهبود بخشند، با روش‌های داده‌ی ساده که فرصت‌های تأثیرگذاری قابل توجهی را فراهم می‌کنند @natolambert