اخبار هوش مصنوعی در 2025-11-23

مدل‌های جدید هوش مصنوعی

گوگل جمینای 3 را با بهبودهای چشمگیر منتشر کرد که به عنوان پیشرفتی بزرگ و قابل مقایسه با تأثیر GPT-4 توصیف شده است، با پیشرفت‌های به‌ویژه قابل توجه در نسخه‌ی نانو بنانا پرو @AndrewCurran_
جمینای نانو بنانا پرو قابلیت‌های پیشرفته‌ی چندوجهی را با حل سوالات امتحانی مستقیماً از تصاویر برگه‌ی امتحان، از جمله رسیدگی به خط‌خطی‌ها و نمودارها، به نمایش می‌گذارد @karpathy
نانو بنانا پرو با شناسایی نام رنگ‌های نوشته شده با مداد شمعی با رنگ‌های نادرست و تشخیص مهرهای قرمز رنگ که نشان‌دهنده‌ی خطا هستند، درک بصری پیچیده‌ای را نشان می‌دهد @goodside
تسلا برنامه‌های خود را برای تولید انبوه طرح‌های جدید تراشه‌ی هوش مصنوعی هر 12 ماه یک‌بار اعلام کرد، با AI4 که در حال حاضر در خودروها مستقر شده است، AI5 نزدیک به اتمام طراحی و AI6 در مراحل اولیه‌ی توسعه، و انتظار می‌رود تراشه‌هایی با حجم بالاتر از مجموع تمام تراشه‌های هوش مصنوعی دیگر تولید کند @elonmusk

تحلیل صنعت

سم آلتمن بر پیشرفت سریع تیم کدکس تأکید می‌کند و پیش‌بینی می‌کند که آن‌ها مهم‌ترین محصول را در فضای کدنویسی هوش مصنوعی ایجاد خواهند کرد و کارهای بعدی قابل توجهی را ممکن می‌سازند @sama
اوپن‌ای‌آی همکاری استراتژیک با امارات را اعلام کرد، از جمله استقرار سازمانی ChatGPT Enterprise @gdb
سومیت چینتالا مشاهده می‌کند که انتشار جمینای 3 لحظه‌ای قابل مقایسه با GPT-4 را نشان می‌دهد، با گوگل که به دلیل مزایای اکوسیستم خود از جمله TPUها، اندروید و کروم، شکست‌ناپذیر به نظر می‌رسد، در حالی که اشاره می‌کند آنتروپیک بی‌سروصدا در کدنویسی بدون ایجاد لحظات مشابه، تسلط دارد @soumithchintala
الکس گریولی پیش‌بینی می‌کند که هوش اندازه‌گیری شده، هر الگوریتم را برای درک داده‌های پیچیده، از جمله سیستم‌های توصیه‌گر، تشخیص کلاهبرداری، تصاویر، فیدها، تبلیغات و تحلیل کمی، به صورت تصاعدی بهبود خواهد بخشید @alexgraveley
متیو کروئر سیرا را موفق‌ترین استقرار هوش مصنوعی سازمانی گزارش می‌دهد و بر اهمیت همکاری با رهبران فکری هوش مصنوعی برای شرکت‌های سنتی که فاقد صلاحیت فنی اصلی و دسترسی به استعدادهای برجسته‌ی هوش مصنوعی هستند، تأکید می‌کند @matthew_kruer
متخصصان صنعت بیمه اظهار می‌کنند که هوش مصنوعی برای بیمه شدن بسیار پرخطر است و نگرانی‌هایی را در مورد مسئولیت و ارزیابی ریسک در استقرار هوش مصنوعی برجسته می‌کنند @TechCrunch
هایپرلیکوئید، یک صرافی غیرمتمرکز مشتقات رمزارز، به عنوان کارآمدترین کسب‌وکار در سطح جهان با تقریباً 1.1 میلیارد دلار درآمد خالص سالانه تنها با 11 کارمند فعالیت می‌کند، در مقایسه با نزدک که با 800 برابر کارمند بیشتر، مقادیر مشابهی را کسب می‌کند @deedydas

اخلاق و جامعه

تک‌کرانچ گزارش می‌دهد که خانواده‌ها ادعا می‌کنند تعاملات ChatGPT منجر به فاجعه شده است و نگرانی‌هایی را در مورد تأثیر روانی هوش مصنوعی بر کاربران آسیب‌پذیر ایجاد می‌کند @TechCrunch
فرانسوا شوله مشاهده می‌کند که حساب‌های تبلیغاتی به وضوح از کشورهای متخاصم ایالات متحده بودند و با آدرس‌های IP محلی وارد شده بودند، که نشان می‌دهد سرویس‌های اطلاعاتی به پنهان کردن عملیات خود اهمیتی نمی‌دادند @fchollet
گرگلی اوروس اشاره می‌کند که اینترنت با هوش مصنوعی که تولید تصاویر و ویدئوهای واقع‌گرایانه را ارزان می‌کند، کمتر قابل اعتماد می‌شود و تصمیم X برای تبدیل تیک‌های آبی به یک محصول اشتراکی بدون تأیید، اعتماد به شبکه‌های اجتماعی را کاهش داده است @GergelyOrosz
توهین چاکرابورتی در مورد هوش مبتنی بر EMF بحث می‌کند که باعث می‌شود مردم چیزهایی را حس کنند که وجود ندارند، و آن را با مفاهیمی از رمان «نابینایی» پیتر واتس مقایسه می‌کند @tuhin

کاربردها

آندری کارپاتی یک برنامه‌ی وب llm-council را توسعه می‌دهد که پرس‌وجوها را به چندین مدل از جمله GPT-5.1، جمینای 3 پرو، کلود سونت 4.5 و گروک-4 ارسال می‌کند، جایی که مدل‌ها پاسخ‌های ناشناس یکدیگر را بررسی و رتبه‌بندی می‌کنند قبل از اینکه یک LLM رئیس پاسخ نهایی را تولید کند @karpathy
ایتان مولیک نشان می‌دهد که نانو بنانا پرو چگونه یک اقتباس کامل کمیک از اولیس تنیسون را در اولین تلاش، هنگامی که شعر در چهار قسمت به آن داده شد، ایجاد می‌کند، و همچنین نسخه‌هایی به سبک سفالگری یونان باستان را تولید می‌کند @emollick
پرپلکسی نمودارهای کندل‌استیک را برای ردیابی نوسانات و مومنتوم نمادهای سهام ارائه می‌دهد و به سمت برابری با قابلیت‌های ترمینال حرکت می‌کند @AravSrinivas
کلر وو گزارش می‌دهد که رقیب شماره یک ChatPRD، LLMهای عمومی هستند، با برترین اظهارنظر بررسی که می‌گوید این ابزار PRDهایی بسیار بهتر از PRDهای تولید شده توسط سایر LLMها تولید می‌کند @clairevo
کارپاتی پیشنهاد می‌کند که صحبت با LLMها از طریق متن مانند تایپ کردن در یک ترمینال DOS قبل از اختراع رابط کاربری گرافیکی است، و پیشنهاد می‌کند که معادل رابط کاربری گرافیکی یک بوم هوشمند است @karpathy

پژوهش‌ها

هامل حسین از ابزارهای ارزیابی که معیارهای عمومی مانند تأیید، اختصار و فاصله‌ی لوون‌اشتاین را ترویج می‌کنند، انتقاد می‌کند و استدلال می‌کند که آن‌ها نشان‌دهنده‌ی سواد داده‌ای ضعیف هستند و با دنبال کردن معیارهای بی‌ارزش به جای تعریف معیارهای متناسب با حالت‌های شکست مشاهده شده، چرخه‌های مهندسی را هدر می‌دهند @HamelHusain
هریسون چیس تأکید می‌کند که بهترین ارزیابی‌ها تقریباً همیشه مجموعه‌داده‌های کاملاً سفارشی و معیارهای سفارشی هستند، و ارزیابی‌های خوب را با یک PRD برای برنامه‌ی شما مقایسه می‌کند که از شخص دیگری استفاده نمی‌کنید @hwchase17
ایتان مولیک مشاهده می‌کند که حالت‌های صوتی برای هوش مصنوعی فقط به مدل‌های ضعیف با تأخیر کم دسترسی دارند، که آن‌ها را سرگرم‌کننده اما برای کارهای جدی بی‌فایده می‌کند، و پیشنهاد می‌کند که هوش مصنوعی صوتی در یک بن‌بست چت سرگرم‌کننده بدون کاوش رویکردهای بهتر گیر کرده است @emollick
آزمایش‌های شورای LLM آندری کارپاتی نشان می‌دهد که مدل‌ها به طرز شگفت‌انگیزی مایلند پاسخ LLM دیگری را برتر از پاسخ خود انتخاب کنند، با مدل‌هایی که به طور مداوم GPT 5.1 را بهترین و روشنگرترین می‌دانند در حالی که کلود را بدترین انتخاب می‌کنند @karpathy
سایمون ویلیسون یادداشت‌های مفصلی در مورد آزمایش مدل‌های OLMo 3 (مدل فکری 32B و مدل دستورالعمل 7B) از طریق LM Studio می‌نویسد و بر اهمیت داده‌های آموزشی شفاف تأکید می‌کند @simonw
فرانسوا شوله از JAX به عنوان ارائه‌دهنده‌ی یک مزیت رقابتی بزرگ حمایت می‌کند و Keras 3 را با بک‌اند JAX و KerasHub را برای پذیرش آسان با دسترسی به مدل‌های Hugging Face توصیه می‌کند @fchollet
ناتان لمبرت 13 سازنده‌ی جدی مدل‌های باز در ایالات متحده را شناسایی می‌کند که مدل‌هایی بسیار کوچک‌تر از رقبای چینی و اغلب با مجوزهای بدتر می‌سازند و قصد دارد یک لیست رده‌بندی کامل برای پروژه‌ی ATOM ایجاد کند @natolambert