اخبار هوش مصنوعی در 2025-12-04
مدلهای جدید هوش مصنوعی
- گوگل حالت «Gemini 3 Deep Think» را برای مشترکین Ultra منتشر کرد. این حالت با استفاده از تفکر موازی، فرضیههای متعددی را بهطور همزمان بررسی میکند تا استدلال در مسائل پیچیدهی ریاضی، علمی و برنامهنویسی بهبود یابد. این مدل در بنچمارکهای «آخرین امتحان بشریت» و «ARC-AGI-2» از «Gemini 3 Pro» پیشی گرفته و در المپیاد جهانی ریاضی و فینال جهانی مسابقات برنامهنویسی دانشگاهی به استاندارد مدال طلا دست یافته است @GoogleDeepMind، @JeffDean
- اوپنایآی مدل «Codex» را راهاندازی کرد که اکنون در Cursor با یک عامل بهینهشده در دسترس است و تا ۱۱ دسامبر رایگان خواهد بود @cursor_ai
- آنتروپیک مدل «Claude Opus 4.5» را برای کاربران Claude Code با حسابهای Pro منتشر کرد. این مدل به عنوان مدل پیشرو در برنامهنویسی و استثنایی در کارهای پیچیدهی کدنویسی توصیف شده است @_catwu
- Mistral Large 3 به عنوان مدل کدنویسی متنباز شماره یک در جدول ردهبندی Arena معرفی شد @MistralAI
- گوگل «Nano Banana Pro» را با رزولوشن 2k منتشر کرد که به جایگاه شماره یک در جدول ردهبندی ویرایش تصویر lmarena دست یافت @JeffDean
- مایکروسافت مدل «VibeVoice-Realtime-0.5B» را منتشر کرد @_akhaliq
- تیم Qwen علیبابا اعلام کرد که اجرای FP8 RL تنها با ۵ گیگابایت VRAM امکانپذیر است @Alibaba_Qwen
تحلیل صنعت
- آنتروپیک یک همکاری چندساله به ارزش ۲۰۰ میلیون دلار با Snowflake امضا کرد که Claude را برای بیش از ۱۲,۶۰۰ مشتری Snowflake برای تحلیل دادههای سازمانی در دسترس قرار میدهد و در عین حال استانداردهای امنیتی را حفظ میکند @AnthropicAI
- گوگل یک همکاری چندساله با Replit اعلام کرد که همکاری آنها را در فضای ابزارهای توسعهدهنده گسترش میدهد @AndrewCurran_
- استارتاپ حقوقی هوش مصنوعی Harvey، ارزش ۸ میلیارد دلاری خود را در دور تامین مالی سری F به رهبری a16z Growth تایید کرد. این شرکت در حال حاضر توسط بیش از نیمی از ۱۰۰ شرکت برتر AmLaw استفاده میشود @TechCrunch
- Palo Alto Networks شرکت Chronosphere را به مبلغ ۳.۳ میلیارد دلار خریداری کرد که نشاندهندهی یک خروج قابل توجه برای این استارتاپ نظارتی است که بر اساس موتور M3 اوبر ساخته شده بود @GergelyOrosz
- Cambricon قصد دارد در سال ۲۰۲۶، ۵۰۰,۰۰۰ شتابدهنده را عرضه کند که بیش از سه برابر تعداد عرضه شده در سال جاری است و نشاندهندهی گسترش عمده در سختافزار هوش مصنوعی است @AndrewCurran_
- لایحهی دوحزبی برای جلوگیری از فروش تراشههای پیشرفتهی انویدیا از جمله «H200s» و «Blackwells» به چین تا سال ۲۰۲۸ ارائه شد @AndrewCurran_
- متا طبق گزارشها قصد دارد بودجهی متاورس را تا ۳۰ درصد کاهش دهد @TechCrunch
- کریستیانو رونالدو سرمایهگذاری در Perplexity را اعلام کرد و بر کنجکاوی به عنوان یک نیاز برای عظمت تاکید کرد @Cristiano
- یک مدیر اجرایی فناوری گزارش میدهد که از هوش مصنوعی برای نمونهسازی کدنویسی استفاده میکند، اما همچنان به تیمی متشکل از چندین توسعهدهنده برای پیادهسازی آنها در نرمافزار تولیدی قابل اجرا نیاز دارد، که نشان میدهد هوش مصنوعی مکمل توسعهدهندگان حرفهای است و جایگزین آنها نیست @GergelyOrosz
- مطالعهی مککینزی نشان میدهد که بسیاری از سازمانها در حال پذیرش عوامل هوش مصنوعی هستند، اگرچه اکثر آنها در مراحل اولیهی مقیاسبندی این فناوری قرار دارند @MIT_CSAIL
- توسعهدهندگان مدل با تنظیم دقیق مدلها برای کار بهتر با چارچوبهای خود، مزیت سیستماتیکی کسب میکنند و به طور بالقوه نفوذ خود را در لایهی کاربرد به ضرر توسعهدهندگان شخص ثالث و متنباز بازمییابند @sayashk
اخلاق و جامعه
- داریو آمودی، مدیرعامل آنتروپیک، در مورد خطرات توسعهی بیش از حد در هوش مصنوعی هشدار میدهد و میگوید برخی شرکتها با مدلهای کسبوکار مصرفکننده و حاشیهی سود نامشخص ممکن است با فشار بیش از حد برای توسعه، با وجود عدم قطعیت در ارزش اقتصادی، ریسکهای نامعقولی را بپذیرند @AndrewCurran_
- مدیرعامل آنتروپیک بر پیامدهای امنیت ملی قابلیتهای هوش مصنوعی تاکید میکند و میگوید دموکراسیها باید ابتدا به قابلیتهای پیشرفتهی هوش مصنوعی دست یابند @AnthropicAI
- اندرو انجی بحران اعتماد به هوش مصنوعی را برجسته میکند و به دادههای Edelman و Pew Research اشاره میکند که نشان میدهد ۴۹ درصد از آمریکاییها استفادهی فزاینده از هوش مصنوعی را رد میکنند، در حالی که تنها ۱۷ درصد آن را میپذیرند. این در مقایسه با چین است که ۵۴ درصد آن را میپذیرند و تنها ۱۰ درصد آن را رد میکنند. او بیاعتمادی را تا حدی به شرکتهای هوش مصنوعی نسبت میدهد که با مقایسهی هوش مصنوعی با سلاحهای هستهای، خطرات را بزرگنمایی میکنند و از جامعهی هوش مصنوعی میخواهد که از ترساندن دست بردارد و برای جلب مجدد اعتماد جامعه تلاش کند @AndrewYNg
- نیریت وایس-بلات پوشش ۶۰ دقیقهای مطالعهی آنتروپیک در مورد رفتار باجگیری Claude را به شدت گمراهکننده میداند و اشاره میکند که این رفتار تنها پس از آن رخ داد که محققان ماهر عمداً آن را از طریق تمرینات تیم قرمز مهندسی کردند، نه به طور طبیعی @AndrewYNg
- اتحادیهی اروپا در حال بررسی متا به دلیل تغییر سیاست است که چتباتهای رقیب هوش مصنوعی را از واتساپ ممنوع میکند @TechCrunch
- ایلان ماسک نرمافزار جدید تسلا را اعلام کرد که امکان ارسال پیامک و رانندگی را فراهم میکند، که در اکثر ایالتها غیرقانونی است @TechCrunch
- اوپنایآی یک روش اثبات مفهوم را توسعه میدهد که مدلها را آموزش میدهد تا زمانی که دستورالعملها را نقض میکنند یا میانبرهای ناخواسته را انتخاب میکنند، گزارش دهند @gdb
کاربردها
- آنتروپیک ابزار Anthropic Interviewer را برای انجام مصاحبههای تحقیقاتی مبتنی بر هوش مصنوعی راهاندازی کرد که سوالات تحقیقاتی را پیشنویس میکند، مصاحبهها را انجام میدهد و پاسخها را تحلیل میکند. مطالعهی اولیهی ۱,۲۵۰ متخصص نشان داد که نیروی کار عمومی میخواهد کارهای روتین را به هوش مصنوعی واگذار کند و در عین حال وظایف اصلی هویت حرفهای را حفظ کند، افراد خلاق با اضطراب در مورد امنیت شغلی و انگ استفاده از هوش مصنوعی مواجه هستند، و دانشمندان شرکای تحقیقاتی هوش مصنوعی میخواهند اما در حال حاضر استفاده را به نوشتن و اشکالزدایی محدود میکنند @AnthropicAI
- بایتدنس گوشی هوشمند ZTE Nubia M153 را نشان داد که عامل هوش مصنوعی Doubao را در سطح سیستمعامل اندروید با کنترل کامل گوشی اجرا میکند و قادر به دیدن رابط کاربری، دانلود برنامهها و اجرای زنجیرههای وظایف چندمرحلهای است @TaylorOgan
- Sierra از مجموعهای از بیش از ۱۵ مدل پیشرو و متنباز برای کارهای مختلف از جمله فراخوانی ابزار با تاخیر کم، طبقهبندی دقیق، استدلال با زمینهی طولانی و همدلی/لحن استفاده میکند @btaylor
- قابلیت تولید اسلاید NotebookLM گوگل، ارائههای منسجمی را از مقالات علمی با حداقل توهم ایجاد میکند، اگرچه مشکلات املایی و نموداری گاهبهگاه با ایجاد اسلاید مبتنی بر تصویر رخ میدهد @emollick
- مدیرعامل مایکروسافت حالت عامل M365 Copilot را نشان داد که با موفقیت چالش دیجیتال قهرمانی جهان اکسل را تکمیل کرد @satyanadella
- Linear با ادغام OpenAI Codex، به ابزار محصولی با بیشترین نمایندگان عامل تبدیل شد تا به رفع اشکالات، بهبودها و پاسخ به سوالات پایگاه کد کمک کند @linear
پژوهشها
- Claude Opus 4.5 با Claude Code پس از رفع خطاهای درجهبندی، به دقت ۹۵ درصد در CORE-Bench دست یافت و به طور موثر بنچمارکی را حل کرد که عوامل هوش مصنوعی را در وظایف قابلیت بازتولید علمی آزمایش میکند. عملکرد از ۴۲ درصد با چارچوب CORE-Agent به ۷۸ درصد با Claude Code افزایش یافت که نشاندهندهی ارتباط قابل توجه بین مدلها و چارچوبها است @sayashk
- Physics Letters B مقالهی بازبینیشدهای را پذیرفت که در آن «GPT-5» بینش کلیدی را تولید کرده بود، که نشاندهندهی یک نقطهی عطف مهم در مشارکت هوش مصنوعی در تحقیقات فیزیک نظری است @hsu_steve
- Hugging Face مدل X-VLA را معرفی کرد، مدل جدید Vision-Language-Action با پرامپت نرم LeRobot که در چندین تجسم ربات از جمله Franka، WidowX، Agibot مقیاسپذیر است و از تطبیق جریان و هستهی ترانسفورمر برای کنترل ۵۰ هرتز استفاده میکند @LeRobotHF
- تحقیقات در مورد شیمی پیشزیستی نشان میدهد که حیات ساده ممکن است در همهجای جهان وجود داشته باشد، با قندهایی که در سیارکها یافت شدهاند، اسیدهای آمینه که در فضای بینستارهای شناسایی شدهاند، و حیات بلافاصله پس از خنک شدن زمین پدیدار شده است @elidourado
- مهندسان MIT اندازهگیری دقیق قند خون را با تاباندن نور مادون قرمز نزدیک به پوست نشان دادند، که به طور بالقوه امکان نظارت غیرتهاجمی بر قند خون را برای همهی افراد مبتلا به دیابت فراهم میکند @MIT
- محققان MIT یک تراشهی فرستنده طراحی کردند که کارایی انرژی ارتباطات بیسیم را به طور قابل توجهی بهبود میبخشد و به طور بالقوه برد و عمر باتری دستگاههای متصل را افزایش میدهد