اخبار هوش مصنوعی در 2026-01-08

مدل‌های جدید هوش مصنوعی

علی‌بابا Qwen3-VL-Embedding و Qwen3-VL-Reranker را منتشر کرد که با پشتیبانی از متن، تصاویر، اسکرین‌شات‌ها، ویدئوها و بیش از ۳۰ زبان، به عملکردی پیشرو در معیارهای بازیابی چندوجهی دست یافته‌اند @Alibaba_Qwen
اوپن‌ای‌آی ChatGPT Health را راه‌اندازی کرد؛ فضایی اختصاصی و خصوصی برای مکالمات مربوط به سلامت با رمزگذاری پیشرفته، کلیدهای اختصاصی برای هر کاربر، جداسازی داده‌ها و حذف از آموزش مدل @nickaturley
جیمیل با AI Inbox، AI Overviews برای سؤالات مکالمه‌ای، پاسخ‌های پیشنهادی و قابلیت‌های ویرایش متن که توسط Gemini 3 پشتیبانی می‌شوند، وارد عصر جیمینای شد @GoogleAI

تحلیل صنعت

بر اساس اولین ردیاب سال ۲۰۲۶ سیمیلاروب، Gemini سهم ترافیک جهانی وب‌سایت‌های هوش مصنوعی را به ۲۱.۵٪ رساند و از ۲۰٪ فراتر رفت، در حالی که ChatGPT به ۶۴.۵٪ کاهش یافت و به زیر ۶۵٪ رسید @demishassabis
a16z دور سرمایه‌گذاری اولیه ۲۸ میلیون دلاری در Boltz PBC را رهبری می‌کند؛ مدل‌های هوش مصنوعی متن‌باز این شرکت برای تحقیقات زیست‌مولکولی توسط بیش از ۱۰۰,۰۰۰ دانشمند، ۲۰ شرکت برتر داروسازی و هزاران شرکت بیوتکنولوژی استفاده شده‌اند @a16z
a16z سرمایه‌گذاری ۳۰ میلیون دلاری سری A در Protege را اعلام کرد؛ این شرکت زیرساخت داده‌های دنیای واقعی را برای توسعه‌ی هوش مصنوعی می‌سازد و به اکثر شرکت‌های MAG7 و بزرگترین بازیگران خصوصی هوش مصنوعی خدمات می‌دهد @a16z
مارک آندرسن هوش مصنوعی را بزرگترین انقلاب تکنولوژیکی زندگی خود توصیف می‌کند، که به وضوح بزرگتر از اینترنت است و با ریزپردازنده، موتور بخار و برق مقایسه می‌شود @a16z
دیزنی ویدئوهای عمودی را به دیزنی+ اضافه می‌کند تا شورت‌های تولیدشده توسط Sora که اواخر امسال عرضه می‌شوند را پشتیبانی کند، با برنامه‌هایی برای محتوای تولیدشده توسط کاربر، جدول امتیازات و پرداخت‌ها @AndrewCurran_
میسترال توافق‌نامه‌ی چارچوبی را از وزارت دفاع فرانسه برای استفاده از هوش مصنوعی جهت تقویت قابلیت‌های دفاعی دریافت کرد @AndrewCurran_
اسنوفلیک قصد خود را برای خرید پلتفرم نظارت Observe اعلام کرد @TechCrunch
اوپن‌ای‌آی تیم پشت ابزار هوش مصنوعی مربیگری اجرایی Convogo را خریداری کرد @TechCrunch
گزارش‌ها حاکی از آن است که انویدیا از مشتریان چینی می‌خواهد برای تراشه‌های هوش مصنوعی H200 پیش‌پرداخت کنند @TechCrunch
پرپلکسیتی Perplexity for Public Safety را راه‌اندازی کرد که به سازمان‌های مجری قانون Enterprise Pro را به مدت ۱۲ ماه و برای حداکثر ۲۰۰ کاربر رایگان ارائه می‌دهد @perplexity_ai

اخلاق و جامعه

ترس از دست دادن (FOMO) در هوش مصنوعی، استقرار عجولانه را به دنبال دارد که خطرات امنیتی را به همراه دارد، و این وضعیت با بازنگری در ایمنی بدتر می‌شود، جایی که اصطلاحاتی مانند «تیم قرمز» بدون دقت امنیتی کافی مورد استفاده‌ی مجدد قرار می‌گیرند @AINowInstitute
گرگلی اوروس هشدار می‌دهد که ChatGPT، Claude و Perplexity همگی در تفسیر مشاوره‌ی حقوقی خود اشتباه کرده‌اند و تأکید می‌کند که نمی‌توان به هوش مصنوعی برای تصمیمات پرخطر که نیاز به پاسخگویی دارند، اعتماد کرد @GergelyOrosz
تحقیقات استنفورد نشان می‌دهد که LLMهای تولیدی می‌توانند متن کتاب‌ها را تقریباً دقیقاً فاش کنند، به طوری که Claude 3.7 Sonnet ۹۵.۸٪ از کتاب «هری پاتر و سنگ جادو» را بازتولید کرده است، که نشان می‌دهد فیلترهای ایمنی هنوز هم می‌توانند بخش‌های حفظ‌شده را از دست بدهند @percyliang
ایتان مولیک مشاهده می‌کند که هوش مصنوعی باعث یکنواخت شدن نوشتار و از بین رفتن سبک‌های نوشتاری آکادمیک خاص می‌شود، اگرچه ارتباطات کلی واضح‌تر معمولاً مثبت است @emollick
تحقیقات نشان می‌دهد که کیفیت داده‌های آنلاین، از جمله MTurk، به دلیل LLMها در حال کاهش است، که بحرانی وجودی برای علوم رفتاری ایجاد می‌کند @emollick

کاربردها

وید فاستر در زاپیر از رونویسی‌های Granola برای مهندسی معکوس فرهنگ شرکت و ساخت عوامل ارزیابی مصاحبه استفاده می‌کند که بازخورد ساختاریافته‌ای را در مورد هر نامزد ارائه می‌دهند @clairevo
برایان لاوین از Claude برای ایجاد یک توضیح‌دهنده‌ی تعاملی در مورد نحوه‌ی کار رابط‌های کاربری ترمینال استفاده می‌کند، که هوش مصنوعی را به عنوان ابزاری برای یادگیری مفاهیم فنی نشان می‌دهد @brian_lovin
توسعه‌دهندگان اکنون می‌توانند با استفاده از Nano Banana Pro، Hunyuan3D 3.1، Mixamo و Claude با three.js، شخصیت‌های سه‌بعدی را در کمتر از ۵ دقیقه تولید و متحرک‌سازی کنند @deedydas
CrowdStrike با انویدیا در تنظیم دقیق تخصصی مدل‌های باز Nemotron برای استدلال امنیتی همکاری می‌کند، که از مدل‌های پیشرفته‌ی عمومی در دقت پیشی می‌گیرد @NVIDIAAI
انویدیا Nemotron Speech ASR را برای عوامل صوتی با تأخیر کم منتشر کرد که به نهایی‌سازی رونویسی ۲۴ میلی‌ثانیه و زمان استنتاج کلی صدا به صدا کمتر از ۵۰۰ میلی‌ثانیه دست می‌یابد @NVIDIAAI
تیم Google AI Studio بهبودهای رابط کاربری را ارائه کرد، از جمله کشیدن و رها کردن یکپارچه‌ی فایل، انتخاب آسان‌تر ابزار، پشتیبانی بهتر از موبایل و ثبات طراحی @OfficialLoganK

پژوهش‌ها

تحقیقات نشان می‌دهد که RL (یادگیری تقویتی) به طور طبیعی در برابر فراموشی فاجعه‌بار در یادگیری مداوم مقاوم است و به ۶۰٪ دقت نهایی متوسط در مقایسه با ۵۴٪ برای SFT متوالی، بدون استفاده از بافرهای بازپخش، دست می‌یابد @cwolferesearch
قابلیت‌های یادگیری مداوم مبتنی بر RL از جریمه‌ی واگرایی KL ناشی نمی‌شوند، زیرا آموزش GRPO با و بدون واگرایی KL به سطوح عملکردی مشابهی دست می‌یابند @cwolferesearch
آندری کارپاتی مینی‌سریال نانوچت v1 را منتشر کرد که آموزش بهینه‌ی محاسباتی را بر اساس قوانین مقیاس‌بندی چنچیلا با نسبت پارامتر به توکن ۸ نشان می‌دهد و به نتایجی قابل مقایسه با GPT-2 با هزینه‌ی تقریبی ۵۰۰ دلار دست می‌یابد @karpathy
فرانسوا شوله ادغام Pallas در Keras را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد هسته‌های سخت‌افزاری با کارایی بالا را در پایتون بنویسند که برای TPUها به Mosaic یا برای GPUها به Triton تبدیل می‌شوند @fchollet
معماری Blackwell انویدیا با ارتقاءهای جدید TensorRT-LLM برای عملکرد MoE، توان عملیاتی توکن را در GB200 NVL72 بیش از ۲ برابر افزایش می‌دهد @NVIDIADC