اخبار هوش مصنوعی در 2025-12-07

مدل‌های جدید هوش مصنوعی

گوگل جمینای 3 پرو را به‌عنوان مدل هوش مصنوعی بینایی پیشرفته معرفی کرد که به بهترین عملکرد در تمام معیارهای اصلی بینایی و چندوجهی دست یافته و در وظایف درک سند، صفحه نمایش، تصویر، ویدئو و فضایی عالی عمل می‌کند. @demishassabis
رکا ای‌آی مدل‌های پایه و دستورالعمل 8B پارامتری Rnj-1 را منتشر کرد که به عملکرد SWE-bench نزدیک به GPT-4o، استفاده از ابزار با عملکرد بهتر از مدل‌های متن‌باز مشابه، و استدلال ریاضی در AIME'25 تقریباً برابر با GPT OSS MoE 20B دست یافته است. @ashVaswani

تحلیل صنعت

ایلان ماسک مراکز داده‌ی هوش مصنوعی مبتنی بر فضا را با ماهواره‌هایی که دارای محاسبات هوش مصنوعی محلی در مدار خورشیدآهنگ هستند، پیشنهاد می‌کند و پیش‌بینی می‌کند که این روش در عرض 3 سال به کم‌هزینه‌ترین راه برای تولید هوش مصنوعی و در عرض 4 سال به سریع‌ترین راه برای مقیاس‌بندی تبدیل خواهد شد، با برنامه‌هایی برای مقیاس‌بندی به بیش از 100TW/سال با استفاده از کارخانه‌های ماهواره‌ای قمری. @elonmusk
اوپن‌ای‌آی پس از بازخورد کاربران، پیشنهادهای برنامه‌ای را که شبیه به تبلیغات بودند، غیرفعال کرد. @TechCrunch
متا گزارشاً عرضه‌ی عینک‌های واقعیت ترکیبی را تا سال 2027 به تعویق انداخت. @TechCrunch
پرپلکسیتی سومین سالگرد راه‌اندازی خود را با استفاده از OpenAI GPT-3.5 و مایکروسافت بینگ برای پاسخگویی مستقیم به سؤالات جشن می‌گیرد. @AravSrinivas

اخلاق و جامعه

آندری کارپاتی به کاربران توصیه می‌کند که LLMها را به جای موجودیت‌ها، شبیه‌ساز در نظر بگیرند و توضیح می‌دهد که وقتی از آن‌ها پرسیده می‌شود «نظر شما در مورد xyz چیست؟»، هیچ «شما» واقعی وجود ندارد - مدل یک بردار جاسازی شخصیت را از آمار داده‌های تنظیم دقیق خود اتخاذ می‌کند، نه اینکه نظرات واقعی را در طول زمان شکل داده باشد. @karpathy
تحقیقات دانیل کانمن در سال 2017 پیش از LLMها نشان می‌دهد که هر زمان که ممکن است، انسان‌ها را با الگوریتم‌ها جایگزین کنیم، و اشاره می‌کند که حتی زمانی که الگوریتم‌ها عملکرد فوق‌العاده‌ای ندارند، انسان‌ها آنقدر ضعیف و با نویز عمل می‌کنند که تنها حذف نویز نتایج بهتری نسبت به عملکرد انسان به همراه دارد. @jamescham
ایتان مولیک این سؤال را مطرح می‌کند که آیا نشریات اصلی پس از تجربه‌های روتر GPT-5، بازنگری‌هایی در مورد ادعاهای فلات توسعه‌ی هوش مصنوعی ارائه کرده‌اند یا خیر، و اشاره می‌کند که با وجود شواهدی مبنی بر غلبه بر موانعی مانند فروپاشی مدل و مقیاس‌بندی پیش‌آموزشی، سردرگمی همچنان ادامه دارد. @emollick

کاربردها

قابلیت Claude Skill به Opus 4.5 امکان می‌دهد تا اینفوگرافیک‌هایی به سبک اپل با مشخصات طراحی بسیار فنی تولید کند، با استفاده از پرامپت‌هایی که توسط Grok 4.1 تولید شده‌اند تا مانند استیو جابز طراحی گرافیک فکر کند. @deedydas
یک متخصص الکتروفیزیولوژی قلب از یک گردش کار هوش مصنوعی ترکیبی از Claude، Suno و NanoBanana برای ساخت آهنگ‌های آموزشی برای کودکان 4 و 7 ساله استفاده می‌کند، که کاربردهای خلاقانه‌ای را نشان می‌دهد که بدون هوش مصنوعی کاملاً غیرممکن بودند. @HamelHusain
محققان MIT یک استراتژی مبتنی بر هوش مصنوعی برای تقویت مواد پلیمری توسعه می‌دهند که به طور بالقوه منجر به پلاستیک‌های بادوام‌تر و کاهش زباله‌های پلاستیکی می‌شود. @MIT
ویکی‌پدیا لیستی از نشانه‌های نوشتاری هوش مصنوعی از جمله موازی‌سازی‌های منفی مانند «این یک بازی نیست. این یک انقلاب است» را نگهداری می‌کند که می‌توان آن‌ها را در پرامپت‌های سیستمی گنجاند تا از متن‌هایی که شبیه به هوش مصنوعی هستند، جلوگیری شود. @blader

پژوهش‌ها

نتایج اولین چالش BEHAVIOR در NeurIPS اعلام شد، که راه‌حل‌های هوش مصنوعی تجسم‌یافته و رباتیک را در 50 وظیفه‌ی چالش‌برانگیز خانگی ارزیابی می‌کند، با کسب مقام اول توسط Robot Learning Collective، و پس از آن تیم‌های Comet و SimpleAI. @drfeifei
AI2 تحقیقات پس از آموزش OLMo 3 را ارائه می‌دهد که بر اهمیت روش‌های ارزیابی در توسعه‌ی هوش مصنوعی در کارگاه NeurIPS Foundations of Reasoning in Language Models تأکید می‌کند. @natolambert
کارگاه NeurIPS در مورد Foundations of Reasoning in Language Models شامل سخنرانی‌هایی در مورد خودبهبودی، اکتشاف، زنجیره‌ی فکری و موضوعات مرتبط است. @canondetortugas