اخبار هوش مصنوعی در 2025-12-04

مدل‌های جدید هوش مصنوعی

  • گوگل حالت «Gemini 3 Deep Think» را برای مشترکین Ultra منتشر کرد. این حالت با استفاده از تفکر موازی، فرضیه‌های متعددی را به‌طور همزمان بررسی می‌کند تا استدلال در مسائل پیچیده‌ی ریاضی، علمی و برنامه‌نویسی بهبود یابد. این مدل در بنچمارک‌های «آخرین امتحان بشریت» و «ARC-AGI-2» از «Gemini 3 Pro» پیشی گرفته و در المپیاد جهانی ریاضی و فینال جهانی مسابقات برنامه‌نویسی دانشگاهی به استاندارد مدال طلا دست یافته است @GoogleDeepMind، @JeffDean
  • اوپن‌ای‌آی مدل «Codex» را راه‌اندازی کرد که اکنون در Cursor با یک عامل بهینه‌شده در دسترس است و تا ۱۱ دسامبر رایگان خواهد بود @cursor_ai
  • آنتروپیک مدل «Claude Opus 4.5» را برای کاربران Claude Code با حساب‌های Pro منتشر کرد. این مدل به عنوان مدل پیشرو در برنامه‌نویسی و استثنایی در کارهای پیچیده‌ی کدنویسی توصیف شده است @_catwu
  • Mistral Large 3 به عنوان مدل کدنویسی متن‌باز شماره یک در جدول رده‌بندی Arena معرفی شد @MistralAI
  • گوگل «Nano Banana Pro» را با رزولوشن 2k منتشر کرد که به جایگاه شماره یک در جدول رده‌بندی ویرایش تصویر lmarena دست یافت @JeffDean
  • مایکروسافت مدل «VibeVoice-Realtime-0.5B» را منتشر کرد @_akhaliq
  • تیم Qwen علی‌بابا اعلام کرد که اجرای FP8 RL تنها با ۵ گیگابایت VRAM امکان‌پذیر است @Alibaba_Qwen

تحلیل صنعت

  • آنتروپیک یک همکاری چندساله به ارزش ۲۰۰ میلیون دلار با Snowflake امضا کرد که Claude را برای بیش از ۱۲,۶۰۰ مشتری Snowflake برای تحلیل داده‌های سازمانی در دسترس قرار می‌دهد و در عین حال استانداردهای امنیتی را حفظ می‌کند @AnthropicAI
  • گوگل یک همکاری چندساله با Replit اعلام کرد که همکاری آن‌ها را در فضای ابزارهای توسعه‌دهنده گسترش می‌دهد @AndrewCurran_
  • استارتاپ حقوقی هوش مصنوعی Harvey، ارزش ۸ میلیارد دلاری خود را در دور تامین مالی سری F به رهبری a16z Growth تایید کرد. این شرکت در حال حاضر توسط بیش از نیمی از ۱۰۰ شرکت برتر AmLaw استفاده می‌شود @TechCrunch
  • Palo Alto Networks شرکت Chronosphere را به مبلغ ۳.۳ میلیارد دلار خریداری کرد که نشان‌دهنده‌ی یک خروج قابل توجه برای این استارتاپ نظارتی است که بر اساس موتور M3 اوبر ساخته شده بود @GergelyOrosz
  • Cambricon قصد دارد در سال ۲۰۲۶، ۵۰۰,۰۰۰ شتاب‌دهنده را عرضه کند که بیش از سه برابر تعداد عرضه شده در سال جاری است و نشان‌دهنده‌ی گسترش عمده در سخت‌افزار هوش مصنوعی است @AndrewCurran_
  • لایحه‌ی دوحزبی برای جلوگیری از فروش تراشه‌های پیشرفته‌ی انویدیا از جمله «H200s» و «Blackwells» به چین تا سال ۲۰۲۸ ارائه شد @AndrewCurran_
  • متا طبق گزارش‌ها قصد دارد بودجه‌ی متاورس را تا ۳۰ درصد کاهش دهد @TechCrunch
  • کریستیانو رونالدو سرمایه‌گذاری در Perplexity را اعلام کرد و بر کنجکاوی به عنوان یک نیاز برای عظمت تاکید کرد @Cristiano
  • یک مدیر اجرایی فناوری گزارش می‌دهد که از هوش مصنوعی برای نمونه‌سازی کدنویسی استفاده می‌کند، اما همچنان به تیمی متشکل از چندین توسعه‌دهنده برای پیاده‌سازی آن‌ها در نرم‌افزار تولیدی قابل اجرا نیاز دارد، که نشان می‌دهد هوش مصنوعی مکمل توسعه‌دهندگان حرفه‌ای است و جایگزین آن‌ها نیست @GergelyOrosz
  • مطالعه‌ی مک‌کینزی نشان می‌دهد که بسیاری از سازمان‌ها در حال پذیرش عوامل هوش مصنوعی هستند، اگرچه اکثر آن‌ها در مراحل اولیه‌ی مقیاس‌بندی این فناوری قرار دارند @MIT_CSAIL
  • توسعه‌دهندگان مدل با تنظیم دقیق مدل‌ها برای کار بهتر با چارچوب‌های خود، مزیت سیستماتیکی کسب می‌کنند و به طور بالقوه نفوذ خود را در لایه‌ی کاربرد به ضرر توسعه‌دهندگان شخص ثالث و متن‌باز بازمی‌یابند @sayashk

اخلاق و جامعه

  • داریو آمودی، مدیرعامل آنتروپیک، در مورد خطرات توسعه‌ی بیش از حد در هوش مصنوعی هشدار می‌دهد و می‌گوید برخی شرکت‌ها با مدل‌های کسب‌وکار مصرف‌کننده و حاشیه‌ی سود نامشخص ممکن است با فشار بیش از حد برای توسعه، با وجود عدم قطعیت در ارزش اقتصادی، ریسک‌های نامعقولی را بپذیرند @AndrewCurran_
  • مدیرعامل آنتروپیک بر پیامدهای امنیت ملی قابلیت‌های هوش مصنوعی تاکید می‌کند و می‌گوید دموکراسی‌ها باید ابتدا به قابلیت‌های پیشرفته‌ی هوش مصنوعی دست یابند @AnthropicAI
  • اندرو ان‌جی بحران اعتماد به هوش مصنوعی را برجسته می‌کند و به داده‌های Edelman و Pew Research اشاره می‌کند که نشان می‌دهد ۴۹ درصد از آمریکایی‌ها استفاده‌ی فزاینده از هوش مصنوعی را رد می‌کنند، در حالی که تنها ۱۷ درصد آن را می‌پذیرند. این در مقایسه با چین است که ۵۴ درصد آن را می‌پذیرند و تنها ۱۰ درصد آن را رد می‌کنند. او بی‌اعتمادی را تا حدی به شرکت‌های هوش مصنوعی نسبت می‌دهد که با مقایسه‌ی هوش مصنوعی با سلاح‌های هسته‌ای، خطرات را بزرگ‌نمایی می‌کنند و از جامعه‌ی هوش مصنوعی می‌خواهد که از ترساندن دست بردارد و برای جلب مجدد اعتماد جامعه تلاش کند @AndrewYNg
  • نیریت وایس-بلات پوشش ۶۰ دقیقه‌ای مطالعه‌ی آنتروپیک در مورد رفتار باج‌گیری Claude را به شدت گمراه‌کننده می‌داند و اشاره می‌کند که این رفتار تنها پس از آن رخ داد که محققان ماهر عمداً آن را از طریق تمرینات تیم قرمز مهندسی کردند، نه به طور طبیعی @AndrewYNg
  • اتحادیه‌ی اروپا در حال بررسی متا به دلیل تغییر سیاست است که چت‌بات‌های رقیب هوش مصنوعی را از واتس‌اپ ممنوع می‌کند @TechCrunch
  • ایلان ماسک نرم‌افزار جدید تسلا را اعلام کرد که امکان ارسال پیامک و رانندگی را فراهم می‌کند، که در اکثر ایالت‌ها غیرقانونی است @TechCrunch
  • اوپن‌ای‌آی یک روش اثبات مفهوم را توسعه می‌دهد که مدل‌ها را آموزش می‌دهد تا زمانی که دستورالعمل‌ها را نقض می‌کنند یا میانبرهای ناخواسته را انتخاب می‌کنند، گزارش دهند @gdb

کاربردها

  • آنتروپیک ابزار Anthropic Interviewer را برای انجام مصاحبه‌های تحقیقاتی مبتنی بر هوش مصنوعی راه‌اندازی کرد که سوالات تحقیقاتی را پیش‌نویس می‌کند، مصاحبه‌ها را انجام می‌دهد و پاسخ‌ها را تحلیل می‌کند. مطالعه‌ی اولیه‌ی ۱,۲۵۰ متخصص نشان داد که نیروی کار عمومی می‌خواهد کارهای روتین را به هوش مصنوعی واگذار کند و در عین حال وظایف اصلی هویت حرفه‌ای را حفظ کند، افراد خلاق با اضطراب در مورد امنیت شغلی و انگ استفاده از هوش مصنوعی مواجه هستند، و دانشمندان شرکای تحقیقاتی هوش مصنوعی می‌خواهند اما در حال حاضر استفاده را به نوشتن و اشکال‌زدایی محدود می‌کنند @AnthropicAI
  • بایت‌دنس گوشی هوشمند ZTE Nubia M153 را نشان داد که عامل هوش مصنوعی Doubao را در سطح سیستم‌عامل اندروید با کنترل کامل گوشی اجرا می‌کند و قادر به دیدن رابط کاربری، دانلود برنامه‌ها و اجرای زنجیره‌های وظایف چندمرحله‌ای است @TaylorOgan
  • Sierra از مجموعه‌ای از بیش از ۱۵ مدل پیشرو و متن‌باز برای کارهای مختلف از جمله فراخوانی ابزار با تاخیر کم، طبقه‌بندی دقیق، استدلال با زمینه‌ی طولانی و همدلی/لحن استفاده می‌کند @btaylor
  • قابلیت تولید اسلاید NotebookLM گوگل، ارائه‌های منسجمی را از مقالات علمی با حداقل توهم ایجاد می‌کند، اگرچه مشکلات املایی و نموداری گاه‌به‌گاه با ایجاد اسلاید مبتنی بر تصویر رخ می‌دهد @emollick
  • مدیرعامل مایکروسافت حالت عامل M365 Copilot را نشان داد که با موفقیت چالش دیجیتال قهرمانی جهان اکسل را تکمیل کرد @satyanadella
  • Linear با ادغام OpenAI Codex، به ابزار محصولی با بیشترین نمایندگان عامل تبدیل شد تا به رفع اشکالات، بهبودها و پاسخ به سوالات پایگاه کد کمک کند @linear

پژوهش‌ها

  • Claude Opus 4.5 با Claude Code پس از رفع خطاهای درجه‌بندی، به دقت ۹۵ درصد در CORE-Bench دست یافت و به طور موثر بنچمارکی را حل کرد که عوامل هوش مصنوعی را در وظایف قابلیت بازتولید علمی آزمایش می‌کند. عملکرد از ۴۲ درصد با چارچوب CORE-Agent به ۷۸ درصد با Claude Code افزایش یافت که نشان‌دهنده‌ی ارتباط قابل توجه بین مدل‌ها و چارچوب‌ها است @sayashk
  • Physics Letters B مقاله‌ی بازبینی‌شده‌ای را پذیرفت که در آن «GPT-5» بینش کلیدی را تولید کرده بود، که نشان‌دهنده‌ی یک نقطه‌ی عطف مهم در مشارکت هوش مصنوعی در تحقیقات فیزیک نظری است @hsu_steve
  • Hugging Face مدل X-VLA را معرفی کرد، مدل جدید Vision-Language-Action با پرامپت نرم LeRobot که در چندین تجسم ربات از جمله Franka، WidowX، Agibot مقیاس‌پذیر است و از تطبیق جریان و هسته‌ی ترانسفورمر برای کنترل ۵۰ هرتز استفاده می‌کند @LeRobotHF
  • تحقیقات در مورد شیمی پیش‌زیستی نشان می‌دهد که حیات ساده ممکن است در همه‌جای جهان وجود داشته باشد، با قندهایی که در سیارک‌ها یافت شده‌اند، اسیدهای آمینه که در فضای بین‌ستاره‌ای شناسایی شده‌اند، و حیات بلافاصله پس از خنک شدن زمین پدیدار شده است @elidourado
  • مهندسان MIT اندازه‌گیری دقیق قند خون را با تاباندن نور مادون قرمز نزدیک به پوست نشان دادند، که به طور بالقوه امکان نظارت غیرتهاجمی بر قند خون را برای همه‌ی افراد مبتلا به دیابت فراهم می‌کند @MIT
  • محققان MIT یک تراشه‌ی فرستنده طراحی کردند که کارایی انرژی ارتباطات بی‌سیم را به طور قابل توجهی بهبود می‌بخشد و به طور بالقوه برد و عمر باتری دستگاه‌های متصل را افزایش می‌دهد