اخبار هوش مصنوعی در 2025-11-23
مدلهای جدید هوش مصنوعی
- گوگل جمینای 3 را با بهبودهای چشمگیر منتشر کرد که به عنوان پیشرفتی بزرگ و قابل مقایسه با تأثیر GPT-4 توصیف شده است، با پیشرفتهای بهویژه قابل توجه در نسخهی نانو بنانا پرو @AndrewCurran_
- جمینای نانو بنانا پرو قابلیتهای پیشرفتهی چندوجهی را با حل سوالات امتحانی مستقیماً از تصاویر برگهی امتحان، از جمله رسیدگی به خطخطیها و نمودارها، به نمایش میگذارد @karpathy
- نانو بنانا پرو با شناسایی نام رنگهای نوشته شده با مداد شمعی با رنگهای نادرست و تشخیص مهرهای قرمز رنگ که نشاندهندهی خطا هستند، درک بصری پیچیدهای را نشان میدهد @goodside
- تسلا برنامههای خود را برای تولید انبوه طرحهای جدید تراشهی هوش مصنوعی هر 12 ماه یکبار اعلام کرد، با AI4 که در حال حاضر در خودروها مستقر شده است، AI5 نزدیک به اتمام طراحی و AI6 در مراحل اولیهی توسعه، و انتظار میرود تراشههایی با حجم بالاتر از مجموع تمام تراشههای هوش مصنوعی دیگر تولید کند @elonmusk
تحلیل صنعت
- سم آلتمن بر پیشرفت سریع تیم کدکس تأکید میکند و پیشبینی میکند که آنها مهمترین محصول را در فضای کدنویسی هوش مصنوعی ایجاد خواهند کرد و کارهای بعدی قابل توجهی را ممکن میسازند @sama
- اوپنایآی همکاری استراتژیک با امارات را اعلام کرد، از جمله استقرار سازمانی ChatGPT Enterprise @gdb
- سومیت چینتالا مشاهده میکند که انتشار جمینای 3 لحظهای قابل مقایسه با GPT-4 را نشان میدهد، با گوگل که به دلیل مزایای اکوسیستم خود از جمله TPUها، اندروید و کروم، شکستناپذیر به نظر میرسد، در حالی که اشاره میکند آنتروپیک بیسروصدا در کدنویسی بدون ایجاد لحظات مشابه، تسلط دارد @soumithchintala
- الکس گریولی پیشبینی میکند که هوش اندازهگیری شده، هر الگوریتم را برای درک دادههای پیچیده، از جمله سیستمهای توصیهگر، تشخیص کلاهبرداری، تصاویر، فیدها، تبلیغات و تحلیل کمی، به صورت تصاعدی بهبود خواهد بخشید @alexgraveley
- متیو کروئر سیرا را موفقترین استقرار هوش مصنوعی سازمانی گزارش میدهد و بر اهمیت همکاری با رهبران فکری هوش مصنوعی برای شرکتهای سنتی که فاقد صلاحیت فنی اصلی و دسترسی به استعدادهای برجستهی هوش مصنوعی هستند، تأکید میکند @matthew_kruer
- متخصصان صنعت بیمه اظهار میکنند که هوش مصنوعی برای بیمه شدن بسیار پرخطر است و نگرانیهایی را در مورد مسئولیت و ارزیابی ریسک در استقرار هوش مصنوعی برجسته میکنند @TechCrunch
- هایپرلیکوئید، یک صرافی غیرمتمرکز مشتقات رمزارز، به عنوان کارآمدترین کسبوکار در سطح جهان با تقریباً 1.1 میلیارد دلار درآمد خالص سالانه تنها با 11 کارمند فعالیت میکند، در مقایسه با نزدک که با 800 برابر کارمند بیشتر، مقادیر مشابهی را کسب میکند @deedydas
اخلاق و جامعه
- تککرانچ گزارش میدهد که خانوادهها ادعا میکنند تعاملات ChatGPT منجر به فاجعه شده است و نگرانیهایی را در مورد تأثیر روانی هوش مصنوعی بر کاربران آسیبپذیر ایجاد میکند @TechCrunch
- فرانسوا شوله مشاهده میکند که حسابهای تبلیغاتی به وضوح از کشورهای متخاصم ایالات متحده بودند و با آدرسهای IP محلی وارد شده بودند، که نشان میدهد سرویسهای اطلاعاتی به پنهان کردن عملیات خود اهمیتی نمیدادند @fchollet
- گرگلی اوروس اشاره میکند که اینترنت با هوش مصنوعی که تولید تصاویر و ویدئوهای واقعگرایانه را ارزان میکند، کمتر قابل اعتماد میشود و تصمیم X برای تبدیل تیکهای آبی به یک محصول اشتراکی بدون تأیید، اعتماد به شبکههای اجتماعی را کاهش داده است @GergelyOrosz
- توهین چاکرابورتی در مورد هوش مبتنی بر EMF بحث میکند که باعث میشود مردم چیزهایی را حس کنند که وجود ندارند، و آن را با مفاهیمی از رمان «نابینایی» پیتر واتس مقایسه میکند @tuhin
کاربردها
- آندری کارپاتی یک برنامهی وب llm-council را توسعه میدهد که پرسوجوها را به چندین مدل از جمله GPT-5.1، جمینای 3 پرو، کلود سونت 4.5 و گروک-4 ارسال میکند، جایی که مدلها پاسخهای ناشناس یکدیگر را بررسی و رتبهبندی میکنند قبل از اینکه یک LLM رئیس پاسخ نهایی را تولید کند @karpathy
- ایتان مولیک نشان میدهد که نانو بنانا پرو چگونه یک اقتباس کامل کمیک از اولیس تنیسون را در اولین تلاش، هنگامی که شعر در چهار قسمت به آن داده شد، ایجاد میکند، و همچنین نسخههایی به سبک سفالگری یونان باستان را تولید میکند @emollick
- پرپلکسی نمودارهای کندلاستیک را برای ردیابی نوسانات و مومنتوم نمادهای سهام ارائه میدهد و به سمت برابری با قابلیتهای ترمینال حرکت میکند @AravSrinivas
- کلر وو گزارش میدهد که رقیب شماره یک ChatPRD، LLMهای عمومی هستند، با برترین اظهارنظر بررسی که میگوید این ابزار PRDهایی بسیار بهتر از PRDهای تولید شده توسط سایر LLMها تولید میکند @clairevo
- کارپاتی پیشنهاد میکند که صحبت با LLMها از طریق متن مانند تایپ کردن در یک ترمینال DOS قبل از اختراع رابط کاربری گرافیکی است، و پیشنهاد میکند که معادل رابط کاربری گرافیکی یک بوم هوشمند است @karpathy
پژوهشها
- هامل حسین از ابزارهای ارزیابی که معیارهای عمومی مانند تأیید، اختصار و فاصلهی لووناشتاین را ترویج میکنند، انتقاد میکند و استدلال میکند که آنها نشاندهندهی سواد دادهای ضعیف هستند و با دنبال کردن معیارهای بیارزش به جای تعریف معیارهای متناسب با حالتهای شکست مشاهده شده، چرخههای مهندسی را هدر میدهند @HamelHusain
- هریسون چیس تأکید میکند که بهترین ارزیابیها تقریباً همیشه مجموعهدادههای کاملاً سفارشی و معیارهای سفارشی هستند، و ارزیابیهای خوب را با یک PRD برای برنامهی شما مقایسه میکند که از شخص دیگری استفاده نمیکنید @hwchase17
- ایتان مولیک مشاهده میکند که حالتهای صوتی برای هوش مصنوعی فقط به مدلهای ضعیف با تأخیر کم دسترسی دارند، که آنها را سرگرمکننده اما برای کارهای جدی بیفایده میکند، و پیشنهاد میکند که هوش مصنوعی صوتی در یک بنبست چت سرگرمکننده بدون کاوش رویکردهای بهتر گیر کرده است @emollick
- آزمایشهای شورای LLM آندری کارپاتی نشان میدهد که مدلها به طرز شگفتانگیزی مایلند پاسخ LLM دیگری را برتر از پاسخ خود انتخاب کنند، با مدلهایی که به طور مداوم GPT 5.1 را بهترین و روشنگرترین میدانند در حالی که کلود را بدترین انتخاب میکنند @karpathy
- سایمون ویلیسون یادداشتهای مفصلی در مورد آزمایش مدلهای OLMo 3 (مدل فکری 32B و مدل دستورالعمل 7B) از طریق LM Studio مینویسد و بر اهمیت دادههای آموزشی شفاف تأکید میکند @simonw
- فرانسوا شوله از JAX به عنوان ارائهدهندهی یک مزیت رقابتی بزرگ حمایت میکند و Keras 3 را با بکاند JAX و KerasHub را برای پذیرش آسان با دسترسی به مدلهای Hugging Face توصیه میکند @fchollet
- ناتان لمبرت 13 سازندهی جدی مدلهای باز در ایالات متحده را شناسایی میکند که مدلهایی بسیار کوچکتر از رقبای چینی و اغلب با مجوزهای بدتر میسازند و قصد دارد یک لیست ردهبندی کامل برای پروژهی ATOM ایجاد کند @natolambert