اخبار هوش مصنوعی در 2025-11-23

مدل‌های جدید هوش مصنوعی

  • گوگل جمینای 3 را با بهبودهای چشمگیر منتشر کرد که به عنوان پیشرفتی بزرگ و قابل مقایسه با تأثیر GPT-4 توصیف شده است، با پیشرفت‌های به‌ویژه قابل توجه در نسخه‌ی نانو بنانا پرو @AndrewCurran_
  • جمینای نانو بنانا پرو قابلیت‌های پیشرفته‌ی چندوجهی را با حل سوالات امتحانی مستقیماً از تصاویر برگه‌ی امتحان، از جمله رسیدگی به خط‌خطی‌ها و نمودارها، به نمایش می‌گذارد @karpathy
  • نانو بنانا پرو با شناسایی نام رنگ‌های نوشته شده با مداد شمعی با رنگ‌های نادرست و تشخیص مهرهای قرمز رنگ که نشان‌دهنده‌ی خطا هستند، درک بصری پیچیده‌ای را نشان می‌دهد @goodside
  • تسلا برنامه‌های خود را برای تولید انبوه طرح‌های جدید تراشه‌ی هوش مصنوعی هر 12 ماه یک‌بار اعلام کرد، با AI4 که در حال حاضر در خودروها مستقر شده است، AI5 نزدیک به اتمام طراحی و AI6 در مراحل اولیه‌ی توسعه، و انتظار می‌رود تراشه‌هایی با حجم بالاتر از مجموع تمام تراشه‌های هوش مصنوعی دیگر تولید کند @elonmusk

تحلیل صنعت

  • سم آلتمن بر پیشرفت سریع تیم کدکس تأکید می‌کند و پیش‌بینی می‌کند که آن‌ها مهم‌ترین محصول را در فضای کدنویسی هوش مصنوعی ایجاد خواهند کرد و کارهای بعدی قابل توجهی را ممکن می‌سازند @sama
  • اوپن‌ای‌آی همکاری استراتژیک با امارات را اعلام کرد، از جمله استقرار سازمانی ChatGPT Enterprise @gdb
  • سومیت چینتالا مشاهده می‌کند که انتشار جمینای 3 لحظه‌ای قابل مقایسه با GPT-4 را نشان می‌دهد، با گوگل که به دلیل مزایای اکوسیستم خود از جمله TPUها، اندروید و کروم، شکست‌ناپذیر به نظر می‌رسد، در حالی که اشاره می‌کند آنتروپیک بی‌سروصدا در کدنویسی بدون ایجاد لحظات مشابه، تسلط دارد @soumithchintala
  • الکس گریولی پیش‌بینی می‌کند که هوش اندازه‌گیری شده، هر الگوریتم را برای درک داده‌های پیچیده، از جمله سیستم‌های توصیه‌گر، تشخیص کلاهبرداری، تصاویر، فیدها، تبلیغات و تحلیل کمی، به صورت تصاعدی بهبود خواهد بخشید @alexgraveley
  • متیو کروئر سیرا را موفق‌ترین استقرار هوش مصنوعی سازمانی گزارش می‌دهد و بر اهمیت همکاری با رهبران فکری هوش مصنوعی برای شرکت‌های سنتی که فاقد صلاحیت فنی اصلی و دسترسی به استعدادهای برجسته‌ی هوش مصنوعی هستند، تأکید می‌کند @matthew_kruer
  • متخصصان صنعت بیمه اظهار می‌کنند که هوش مصنوعی برای بیمه شدن بسیار پرخطر است و نگرانی‌هایی را در مورد مسئولیت و ارزیابی ریسک در استقرار هوش مصنوعی برجسته می‌کنند @TechCrunch
  • هایپرلیکوئید، یک صرافی غیرمتمرکز مشتقات رمزارز، به عنوان کارآمدترین کسب‌وکار در سطح جهان با تقریباً 1.1 میلیارد دلار درآمد خالص سالانه تنها با 11 کارمند فعالیت می‌کند، در مقایسه با نزدک که با 800 برابر کارمند بیشتر، مقادیر مشابهی را کسب می‌کند @deedydas

اخلاق و جامعه

  • تک‌کرانچ گزارش می‌دهد که خانواده‌ها ادعا می‌کنند تعاملات ChatGPT منجر به فاجعه شده است و نگرانی‌هایی را در مورد تأثیر روانی هوش مصنوعی بر کاربران آسیب‌پذیر ایجاد می‌کند @TechCrunch
  • فرانسوا شوله مشاهده می‌کند که حساب‌های تبلیغاتی به وضوح از کشورهای متخاصم ایالات متحده بودند و با آدرس‌های IP محلی وارد شده بودند، که نشان می‌دهد سرویس‌های اطلاعاتی به پنهان کردن عملیات خود اهمیتی نمی‌دادند @fchollet
  • گرگلی اوروس اشاره می‌کند که اینترنت با هوش مصنوعی که تولید تصاویر و ویدئوهای واقع‌گرایانه را ارزان می‌کند، کمتر قابل اعتماد می‌شود و تصمیم X برای تبدیل تیک‌های آبی به یک محصول اشتراکی بدون تأیید، اعتماد به شبکه‌های اجتماعی را کاهش داده است @GergelyOrosz
  • توهین چاکرابورتی در مورد هوش مبتنی بر EMF بحث می‌کند که باعث می‌شود مردم چیزهایی را حس کنند که وجود ندارند، و آن را با مفاهیمی از رمان «نابینایی» پیتر واتس مقایسه می‌کند @tuhin

کاربردها

  • آندری کارپاتی یک برنامه‌ی وب llm-council را توسعه می‌دهد که پرس‌وجوها را به چندین مدل از جمله GPT-5.1، جمینای 3 پرو، کلود سونت 4.5 و گروک-4 ارسال می‌کند، جایی که مدل‌ها پاسخ‌های ناشناس یکدیگر را بررسی و رتبه‌بندی می‌کنند قبل از اینکه یک LLM رئیس پاسخ نهایی را تولید کند @karpathy
  • ایتان مولیک نشان می‌دهد که نانو بنانا پرو چگونه یک اقتباس کامل کمیک از اولیس تنیسون را در اولین تلاش، هنگامی که شعر در چهار قسمت به آن داده شد، ایجاد می‌کند، و همچنین نسخه‌هایی به سبک سفالگری یونان باستان را تولید می‌کند @emollick
  • پرپلکسی نمودارهای کندل‌استیک را برای ردیابی نوسانات و مومنتوم نمادهای سهام ارائه می‌دهد و به سمت برابری با قابلیت‌های ترمینال حرکت می‌کند @AravSrinivas
  • کلر وو گزارش می‌دهد که رقیب شماره یک ChatPRD، LLMهای عمومی هستند، با برترین اظهارنظر بررسی که می‌گوید این ابزار PRDهایی بسیار بهتر از PRDهای تولید شده توسط سایر LLMها تولید می‌کند @clairevo
  • کارپاتی پیشنهاد می‌کند که صحبت با LLMها از طریق متن مانند تایپ کردن در یک ترمینال DOS قبل از اختراع رابط کاربری گرافیکی است، و پیشنهاد می‌کند که معادل رابط کاربری گرافیکی یک بوم هوشمند است @karpathy

پژوهش‌ها

  • هامل حسین از ابزارهای ارزیابی که معیارهای عمومی مانند تأیید، اختصار و فاصله‌ی لوون‌اشتاین را ترویج می‌کنند، انتقاد می‌کند و استدلال می‌کند که آن‌ها نشان‌دهنده‌ی سواد داده‌ای ضعیف هستند و با دنبال کردن معیارهای بی‌ارزش به جای تعریف معیارهای متناسب با حالت‌های شکست مشاهده شده، چرخه‌های مهندسی را هدر می‌دهند @HamelHusain
  • هریسون چیس تأکید می‌کند که بهترین ارزیابی‌ها تقریباً همیشه مجموعه‌داده‌های کاملاً سفارشی و معیارهای سفارشی هستند، و ارزیابی‌های خوب را با یک PRD برای برنامه‌ی شما مقایسه می‌کند که از شخص دیگری استفاده نمی‌کنید @hwchase17
  • ایتان مولیک مشاهده می‌کند که حالت‌های صوتی برای هوش مصنوعی فقط به مدل‌های ضعیف با تأخیر کم دسترسی دارند، که آن‌ها را سرگرم‌کننده اما برای کارهای جدی بی‌فایده می‌کند، و پیشنهاد می‌کند که هوش مصنوعی صوتی در یک بن‌بست چت سرگرم‌کننده بدون کاوش رویکردهای بهتر گیر کرده است @emollick
  • آزمایش‌های شورای LLM آندری کارپاتی نشان می‌دهد که مدل‌ها به طرز شگفت‌انگیزی مایلند پاسخ LLM دیگری را برتر از پاسخ خود انتخاب کنند، با مدل‌هایی که به طور مداوم GPT 5.1 را بهترین و روشنگرترین می‌دانند در حالی که کلود را بدترین انتخاب می‌کنند @karpathy
  • سایمون ویلیسون یادداشت‌های مفصلی در مورد آزمایش مدل‌های OLMo 3 (مدل فکری 32B و مدل دستورالعمل 7B) از طریق LM Studio می‌نویسد و بر اهمیت داده‌های آموزشی شفاف تأکید می‌کند @simonw
  • فرانسوا شوله از JAX به عنوان ارائه‌دهنده‌ی یک مزیت رقابتی بزرگ حمایت می‌کند و Keras 3 را با بک‌اند JAX و KerasHub را برای پذیرش آسان با دسترسی به مدل‌های Hugging Face توصیه می‌کند @fchollet
  • ناتان لمبرت 13 سازنده‌ی جدی مدل‌های باز در ایالات متحده را شناسایی می‌کند که مدل‌هایی بسیار کوچک‌تر از رقبای چینی و اغلب با مجوزهای بدتر می‌سازند و قصد دارد یک لیست رده‌بندی کامل برای پروژه‌ی ATOM ایجاد کند @natolambert