اخبار هوش مصنوعی در 2025-12-07
مدلهای جدید هوش مصنوعی
- گوگل جمینای 3 پرو را بهعنوان مدل هوش مصنوعی بینایی پیشرفته معرفی کرد که به بهترین عملکرد در تمام معیارهای اصلی بینایی و چندوجهی دست یافته و در وظایف درک سند، صفحه نمایش، تصویر، ویدئو و فضایی عالی عمل میکند. @demishassabis
- رکا ایآی مدلهای پایه و دستورالعمل 8B پارامتری Rnj-1 را منتشر کرد که به عملکرد SWE-bench نزدیک به GPT-4o، استفاده از ابزار با عملکرد بهتر از مدلهای متنباز مشابه، و استدلال ریاضی در AIME'25 تقریباً برابر با GPT OSS MoE 20B دست یافته است. @ashVaswani
تحلیل صنعت
- ایلان ماسک مراکز دادهی هوش مصنوعی مبتنی بر فضا را با ماهوارههایی که دارای محاسبات هوش مصنوعی محلی در مدار خورشیدآهنگ هستند، پیشنهاد میکند و پیشبینی میکند که این روش در عرض 3 سال به کمهزینهترین راه برای تولید هوش مصنوعی و در عرض 4 سال به سریعترین راه برای مقیاسبندی تبدیل خواهد شد، با برنامههایی برای مقیاسبندی به بیش از 100TW/سال با استفاده از کارخانههای ماهوارهای قمری. @elonmusk
- اوپنایآی پس از بازخورد کاربران، پیشنهادهای برنامهای را که شبیه به تبلیغات بودند، غیرفعال کرد. @TechCrunch
- متا گزارشاً عرضهی عینکهای واقعیت ترکیبی را تا سال 2027 به تعویق انداخت. @TechCrunch
- پرپلکسیتی سومین سالگرد راهاندازی خود را با استفاده از OpenAI GPT-3.5 و مایکروسافت بینگ برای پاسخگویی مستقیم به سؤالات جشن میگیرد. @AravSrinivas
اخلاق و جامعه
- آندری کارپاتی به کاربران توصیه میکند که LLMها را به جای موجودیتها، شبیهساز در نظر بگیرند و توضیح میدهد که وقتی از آنها پرسیده میشود «نظر شما در مورد xyz چیست؟»، هیچ «شما» واقعی وجود ندارد - مدل یک بردار جاسازی شخصیت را از آمار دادههای تنظیم دقیق خود اتخاذ میکند، نه اینکه نظرات واقعی را در طول زمان شکل داده باشد. @karpathy
- تحقیقات دانیل کانمن در سال 2017 پیش از LLMها نشان میدهد که هر زمان که ممکن است، انسانها را با الگوریتمها جایگزین کنیم، و اشاره میکند که حتی زمانی که الگوریتمها عملکرد فوقالعادهای ندارند، انسانها آنقدر ضعیف و با نویز عمل میکنند که تنها حذف نویز نتایج بهتری نسبت به عملکرد انسان به همراه دارد. @jamescham
- ایتان مولیک این سؤال را مطرح میکند که آیا نشریات اصلی پس از تجربههای روتر GPT-5، بازنگریهایی در مورد ادعاهای فلات توسعهی هوش مصنوعی ارائه کردهاند یا خیر، و اشاره میکند که با وجود شواهدی مبنی بر غلبه بر موانعی مانند فروپاشی مدل و مقیاسبندی پیشآموزشی، سردرگمی همچنان ادامه دارد. @emollick
کاربردها
- قابلیت Claude Skill به Opus 4.5 امکان میدهد تا اینفوگرافیکهایی به سبک اپل با مشخصات طراحی بسیار فنی تولید کند، با استفاده از پرامپتهایی که توسط Grok 4.1 تولید شدهاند تا مانند استیو جابز طراحی گرافیک فکر کند. @deedydas
- یک متخصص الکتروفیزیولوژی قلب از یک گردش کار هوش مصنوعی ترکیبی از Claude، Suno و NanoBanana برای ساخت آهنگهای آموزشی برای کودکان 4 و 7 ساله استفاده میکند، که کاربردهای خلاقانهای را نشان میدهد که بدون هوش مصنوعی کاملاً غیرممکن بودند. @HamelHusain
- محققان MIT یک استراتژی مبتنی بر هوش مصنوعی برای تقویت مواد پلیمری توسعه میدهند که به طور بالقوه منجر به پلاستیکهای بادوامتر و کاهش زبالههای پلاستیکی میشود. @MIT
- ویکیپدیا لیستی از نشانههای نوشتاری هوش مصنوعی از جمله موازیسازیهای منفی مانند «این یک بازی نیست. این یک انقلاب است» را نگهداری میکند که میتوان آنها را در پرامپتهای سیستمی گنجاند تا از متنهایی که شبیه به هوش مصنوعی هستند، جلوگیری شود. @blader
پژوهشها
- نتایج اولین چالش BEHAVIOR در NeurIPS اعلام شد، که راهحلهای هوش مصنوعی تجسمیافته و رباتیک را در 50 وظیفهی چالشبرانگیز خانگی ارزیابی میکند، با کسب مقام اول توسط Robot Learning Collective، و پس از آن تیمهای Comet و SimpleAI. @drfeifei
- AI2 تحقیقات پس از آموزش OLMo 3 را ارائه میدهد که بر اهمیت روشهای ارزیابی در توسعهی هوش مصنوعی در کارگاه NeurIPS Foundations of Reasoning in Language Models تأکید میکند. @natolambert
- کارگاه NeurIPS در مورد Foundations of Reasoning in Language Models شامل سخنرانیهایی در مورد خودبهبودی، اکتشاف، زنجیرهی فکری و موضوعات مرتبط است. @canondetortugas