اخبار هوش مصنوعی در 2025-12-04

مدل‌های جدید هوش مصنوعی

گوگل حالت «Gemini 3 Deep Think» را برای مشترکین Ultra منتشر کرد. این حالت با استفاده از تفکر موازی، فرضیه‌های متعددی را به‌طور همزمان بررسی می‌کند تا استدلال در مسائل پیچیده‌ی ریاضی، علمی و برنامه‌نویسی بهبود یابد. این مدل در بنچمارک‌های «آخرین امتحان بشریت» و «ARC-AGI-2» از «Gemini 3 Pro» پیشی گرفته و در المپیاد جهانی ریاضی و فینال جهانی مسابقات برنامه‌نویسی دانشگاهی به استاندارد مدال طلا دست یافته است @GoogleDeepMind، @JeffDean
اوپن‌ای‌آی مدل «Codex» را راه‌اندازی کرد که اکنون در Cursor با یک عامل بهینه‌شده در دسترس است و تا ۱۱ دسامبر رایگان خواهد بود @cursor_ai
آنتروپیک مدل «Claude Opus 4.5» را برای کاربران Claude Code با حساب‌های Pro منتشر کرد. این مدل به عنوان مدل پیشرو در برنامه‌نویسی و استثنایی در کارهای پیچیده‌ی کدنویسی توصیف شده است @_catwu
Mistral Large 3 به عنوان مدل کدنویسی متن‌باز شماره یک در جدول رده‌بندی Arena معرفی شد @MistralAI
گوگل «Nano Banana Pro» را با رزولوشن 2k منتشر کرد که به جایگاه شماره یک در جدول رده‌بندی ویرایش تصویر lmarena دست یافت @JeffDean
مایکروسافت مدل «VibeVoice-Realtime-0.5B» را منتشر کرد @_akhaliq
تیم Qwen علی‌بابا اعلام کرد که اجرای FP8 RL تنها با ۵ گیگابایت VRAM امکان‌پذیر است @Alibaba_Qwen

تحلیل صنعت

آنتروپیک یک همکاری چندساله به ارزش ۲۰۰ میلیون دلار با Snowflake امضا کرد که Claude را برای بیش از ۱۲,۶۰۰ مشتری Snowflake برای تحلیل داده‌های سازمانی در دسترس قرار می‌دهد و در عین حال استانداردهای امنیتی را حفظ می‌کند @AnthropicAI
گوگل یک همکاری چندساله با Replit اعلام کرد که همکاری آن‌ها را در فضای ابزارهای توسعه‌دهنده گسترش می‌دهد @AndrewCurran_
استارتاپ حقوقی هوش مصنوعی Harvey، ارزش ۸ میلیارد دلاری خود را در دور تامین مالی سری F به رهبری a16z Growth تایید کرد. این شرکت در حال حاضر توسط بیش از نیمی از ۱۰۰ شرکت برتر AmLaw استفاده می‌شود @TechCrunch
Palo Alto Networks شرکت Chronosphere را به مبلغ ۳.۳ میلیارد دلار خریداری کرد که نشان‌دهنده‌ی یک خروج قابل توجه برای این استارتاپ نظارتی است که بر اساس موتور M3 اوبر ساخته شده بود @GergelyOrosz
Cambricon قصد دارد در سال ۲۰۲۶، ۵۰۰,۰۰۰ شتاب‌دهنده را عرضه کند که بیش از سه برابر تعداد عرضه شده در سال جاری است و نشان‌دهنده‌ی گسترش عمده در سخت‌افزار هوش مصنوعی است @AndrewCurran_
لایحه‌ی دوحزبی برای جلوگیری از فروش تراشه‌های پیشرفته‌ی انویدیا از جمله «H200s» و «Blackwells» به چین تا سال ۲۰۲۸ ارائه شد @AndrewCurran_
متا طبق گزارش‌ها قصد دارد بودجه‌ی متاورس را تا ۳۰ درصد کاهش دهد @TechCrunch
کریستیانو رونالدو سرمایه‌گذاری در Perplexity را اعلام کرد و بر کنجکاوی به عنوان یک نیاز برای عظمت تاکید کرد @Cristiano
یک مدیر اجرایی فناوری گزارش می‌دهد که از هوش مصنوعی برای نمونه‌سازی کدنویسی استفاده می‌کند، اما همچنان به تیمی متشکل از چندین توسعه‌دهنده برای پیاده‌سازی آن‌ها در نرم‌افزار تولیدی قابل اجرا نیاز دارد، که نشان می‌دهد هوش مصنوعی مکمل توسعه‌دهندگان حرفه‌ای است و جایگزین آن‌ها نیست @GergelyOrosz
مطالعه‌ی مک‌کینزی نشان می‌دهد که بسیاری از سازمان‌ها در حال پذیرش عوامل هوش مصنوعی هستند، اگرچه اکثر آن‌ها در مراحل اولیه‌ی مقیاس‌بندی این فناوری قرار دارند @MIT_CSAIL
توسعه‌دهندگان مدل با تنظیم دقیق مدل‌ها برای کار بهتر با چارچوب‌های خود، مزیت سیستماتیکی کسب می‌کنند و به طور بالقوه نفوذ خود را در لایه‌ی کاربرد به ضرر توسعه‌دهندگان شخص ثالث و متن‌باز بازمی‌یابند @sayashk

اخلاق و جامعه

داریو آمودی، مدیرعامل آنتروپیک، در مورد خطرات توسعه‌ی بیش از حد در هوش مصنوعی هشدار می‌دهد و می‌گوید برخی شرکت‌ها با مدل‌های کسب‌وکار مصرف‌کننده و حاشیه‌ی سود نامشخص ممکن است با فشار بیش از حد برای توسعه، با وجود عدم قطعیت در ارزش اقتصادی، ریسک‌های نامعقولی را بپذیرند @AndrewCurran_
مدیرعامل آنتروپیک بر پیامدهای امنیت ملی قابلیت‌های هوش مصنوعی تاکید می‌کند و می‌گوید دموکراسی‌ها باید ابتدا به قابلیت‌های پیشرفته‌ی هوش مصنوعی دست یابند @AnthropicAI
اندرو ان‌جی بحران اعتماد به هوش مصنوعی را برجسته می‌کند و به داده‌های Edelman و Pew Research اشاره می‌کند که نشان می‌دهد ۴۹ درصد از آمریکایی‌ها استفاده‌ی فزاینده از هوش مصنوعی را رد می‌کنند، در حالی که تنها ۱۷ درصد آن را می‌پذیرند. این در مقایسه با چین است که ۵۴ درصد آن را می‌پذیرند و تنها ۱۰ درصد آن را رد می‌کنند. او بی‌اعتمادی را تا حدی به شرکت‌های هوش مصنوعی نسبت می‌دهد که با مقایسه‌ی هوش مصنوعی با سلاح‌های هسته‌ای، خطرات را بزرگ‌نمایی می‌کنند و از جامعه‌ی هوش مصنوعی می‌خواهد که از ترساندن دست بردارد و برای جلب مجدد اعتماد جامعه تلاش کند @AndrewYNg
نیریت وایس-بلات پوشش ۶۰ دقیقه‌ای مطالعه‌ی آنتروپیک در مورد رفتار باج‌گیری Claude را به شدت گمراه‌کننده می‌داند و اشاره می‌کند که این رفتار تنها پس از آن رخ داد که محققان ماهر عمداً آن را از طریق تمرینات تیم قرمز مهندسی کردند، نه به طور طبیعی @AndrewYNg
اتحادیه‌ی اروپا در حال بررسی متا به دلیل تغییر سیاست است که چت‌بات‌های رقیب هوش مصنوعی را از واتس‌اپ ممنوع می‌کند @TechCrunch
ایلان ماسک نرم‌افزار جدید تسلا را اعلام کرد که امکان ارسال پیامک و رانندگی را فراهم می‌کند، که در اکثر ایالت‌ها غیرقانونی است @TechCrunch
اوپن‌ای‌آی یک روش اثبات مفهوم را توسعه می‌دهد که مدل‌ها را آموزش می‌دهد تا زمانی که دستورالعمل‌ها را نقض می‌کنند یا میانبرهای ناخواسته را انتخاب می‌کنند، گزارش دهند @gdb

کاربردها

آنتروپیک ابزار Anthropic Interviewer را برای انجام مصاحبه‌های تحقیقاتی مبتنی بر هوش مصنوعی راه‌اندازی کرد که سوالات تحقیقاتی را پیش‌نویس می‌کند، مصاحبه‌ها را انجام می‌دهد و پاسخ‌ها را تحلیل می‌کند. مطالعه‌ی اولیه‌ی ۱,۲۵۰ متخصص نشان داد که نیروی کار عمومی می‌خواهد کارهای روتین را به هوش مصنوعی واگذار کند و در عین حال وظایف اصلی هویت حرفه‌ای را حفظ کند، افراد خلاق با اضطراب در مورد امنیت شغلی و انگ استفاده از هوش مصنوعی مواجه هستند، و دانشمندان شرکای تحقیقاتی هوش مصنوعی می‌خواهند اما در حال حاضر استفاده را به نوشتن و اشکال‌زدایی محدود می‌کنند @AnthropicAI
بایت‌دنس گوشی هوشمند ZTE Nubia M153 را نشان داد که عامل هوش مصنوعی Doubao را در سطح سیستم‌عامل اندروید با کنترل کامل گوشی اجرا می‌کند و قادر به دیدن رابط کاربری، دانلود برنامه‌ها و اجرای زنجیره‌های وظایف چندمرحله‌ای است @TaylorOgan
Sierra از مجموعه‌ای از بیش از ۱۵ مدل پیشرو و متن‌باز برای کارهای مختلف از جمله فراخوانی ابزار با تاخیر کم، طبقه‌بندی دقیق، استدلال با زمینه‌ی طولانی و همدلی/لحن استفاده می‌کند @btaylor
قابلیت تولید اسلاید NotebookLM گوگل، ارائه‌های منسجمی را از مقالات علمی با حداقل توهم ایجاد می‌کند، اگرچه مشکلات املایی و نموداری گاه‌به‌گاه با ایجاد اسلاید مبتنی بر تصویر رخ می‌دهد @emollick
مدیرعامل مایکروسافت حالت عامل M365 Copilot را نشان داد که با موفقیت چالش دیجیتال قهرمانی جهان اکسل را تکمیل کرد @satyanadella
Linear با ادغام OpenAI Codex، به ابزار محصولی با بیشترین نمایندگان عامل تبدیل شد تا به رفع اشکالات، بهبودها و پاسخ به سوالات پایگاه کد کمک کند @linear

پژوهش‌ها

Claude Opus 4.5 با Claude Code پس از رفع خطاهای درجه‌بندی، به دقت ۹۵ درصد در CORE-Bench دست یافت و به طور موثر بنچمارکی را حل کرد که عوامل هوش مصنوعی را در وظایف قابلیت بازتولید علمی آزمایش می‌کند. عملکرد از ۴۲ درصد با چارچوب CORE-Agent به ۷۸ درصد با Claude Code افزایش یافت که نشان‌دهنده‌ی ارتباط قابل توجه بین مدل‌ها و چارچوب‌ها است @sayashk
Physics Letters B مقاله‌ی بازبینی‌شده‌ای را پذیرفت که در آن «GPT-5» بینش کلیدی را تولید کرده بود، که نشان‌دهنده‌ی یک نقطه‌ی عطف مهم در مشارکت هوش مصنوعی در تحقیقات فیزیک نظری است @hsu_steve
Hugging Face مدل X-VLA را معرفی کرد، مدل جدید Vision-Language-Action با پرامپت نرم LeRobot که در چندین تجسم ربات از جمله Franka، WidowX، Agibot مقیاس‌پذیر است و از تطبیق جریان و هسته‌ی ترانسفورمر برای کنترل ۵۰ هرتز استفاده می‌کند @LeRobotHF
تحقیقات در مورد شیمی پیش‌زیستی نشان می‌دهد که حیات ساده ممکن است در همه‌جای جهان وجود داشته باشد، با قندهایی که در سیارک‌ها یافت شده‌اند، اسیدهای آمینه که در فضای بین‌ستاره‌ای شناسایی شده‌اند، و حیات بلافاصله پس از خنک شدن زمین پدیدار شده است @elidourado
مهندسان MIT اندازه‌گیری دقیق قند خون را با تاباندن نور مادون قرمز نزدیک به پوست نشان دادند، که به طور بالقوه امکان نظارت غیرتهاجمی بر قند خون را برای همه‌ی افراد مبتلا به دیابت فراهم می‌کند @MIT
محققان MIT یک تراشه‌ی فرستنده طراحی کردند که کارایی انرژی ارتباطات بی‌سیم را به طور قابل توجهی بهبود می‌بخشد و به طور بالقوه برد و عمر باتری دستگاه‌های متصل را افزایش می‌دهد