اخبار هوش مصنوعی در 2026-01-08
مدلهای جدید هوش مصنوعی
- علیبابا Qwen3-VL-Embedding و Qwen3-VL-Reranker را منتشر کرد که با پشتیبانی از متن، تصاویر، اسکرینشاتها، ویدئوها و بیش از ۳۰ زبان، به عملکردی پیشرو در معیارهای بازیابی چندوجهی دست یافتهاند @Alibaba_Qwen
- اوپنایآی ChatGPT Health را راهاندازی کرد؛ فضایی اختصاصی و خصوصی برای مکالمات مربوط به سلامت با رمزگذاری پیشرفته، کلیدهای اختصاصی برای هر کاربر، جداسازی دادهها و حذف از آموزش مدل @nickaturley
- جیمیل با AI Inbox، AI Overviews برای سؤالات مکالمهای، پاسخهای پیشنهادی و قابلیتهای ویرایش متن که توسط Gemini 3 پشتیبانی میشوند، وارد عصر جیمینای شد @GoogleAI
تحلیل صنعت
- بر اساس اولین ردیاب سال ۲۰۲۶ سیمیلاروب، Gemini سهم ترافیک جهانی وبسایتهای هوش مصنوعی را به ۲۱.۵٪ رساند و از ۲۰٪ فراتر رفت، در حالی که ChatGPT به ۶۴.۵٪ کاهش یافت و به زیر ۶۵٪ رسید @demishassabis
- a16z دور سرمایهگذاری اولیه ۲۸ میلیون دلاری در Boltz PBC را رهبری میکند؛ مدلهای هوش مصنوعی متنباز این شرکت برای تحقیقات زیستمولکولی توسط بیش از ۱۰۰,۰۰۰ دانشمند، ۲۰ شرکت برتر داروسازی و هزاران شرکت بیوتکنولوژی استفاده شدهاند @a16z
- a16z سرمایهگذاری ۳۰ میلیون دلاری سری A در Protege را اعلام کرد؛ این شرکت زیرساخت دادههای دنیای واقعی را برای توسعهی هوش مصنوعی میسازد و به اکثر شرکتهای MAG7 و بزرگترین بازیگران خصوصی هوش مصنوعی خدمات میدهد @a16z
- مارک آندرسن هوش مصنوعی را بزرگترین انقلاب تکنولوژیکی زندگی خود توصیف میکند، که به وضوح بزرگتر از اینترنت است و با ریزپردازنده، موتور بخار و برق مقایسه میشود @a16z
- دیزنی ویدئوهای عمودی را به دیزنی+ اضافه میکند تا شورتهای تولیدشده توسط Sora که اواخر امسال عرضه میشوند را پشتیبانی کند، با برنامههایی برای محتوای تولیدشده توسط کاربر، جدول امتیازات و پرداختها @AndrewCurran_
- میسترال توافقنامهی چارچوبی را از وزارت دفاع فرانسه برای استفاده از هوش مصنوعی جهت تقویت قابلیتهای دفاعی دریافت کرد @AndrewCurran_
- اسنوفلیک قصد خود را برای خرید پلتفرم نظارت Observe اعلام کرد @TechCrunch
- اوپنایآی تیم پشت ابزار هوش مصنوعی مربیگری اجرایی Convogo را خریداری کرد @TechCrunch
- گزارشها حاکی از آن است که انویدیا از مشتریان چینی میخواهد برای تراشههای هوش مصنوعی H200 پیشپرداخت کنند @TechCrunch
- پرپلکسیتی Perplexity for Public Safety را راهاندازی کرد که به سازمانهای مجری قانون Enterprise Pro را به مدت ۱۲ ماه و برای حداکثر ۲۰۰ کاربر رایگان ارائه میدهد @perplexity_ai
اخلاق و جامعه
- ترس از دست دادن (FOMO) در هوش مصنوعی، استقرار عجولانه را به دنبال دارد که خطرات امنیتی را به همراه دارد، و این وضعیت با بازنگری در ایمنی بدتر میشود، جایی که اصطلاحاتی مانند «تیم قرمز» بدون دقت امنیتی کافی مورد استفادهی مجدد قرار میگیرند @AINowInstitute
- گرگلی اوروس هشدار میدهد که ChatGPT، Claude و Perplexity همگی در تفسیر مشاورهی حقوقی خود اشتباه کردهاند و تأکید میکند که نمیتوان به هوش مصنوعی برای تصمیمات پرخطر که نیاز به پاسخگویی دارند، اعتماد کرد @GergelyOrosz
- تحقیقات استنفورد نشان میدهد که LLMهای تولیدی میتوانند متن کتابها را تقریباً دقیقاً فاش کنند، به طوری که Claude 3.7 Sonnet ۹۵.۸٪ از کتاب «هری پاتر و سنگ جادو» را بازتولید کرده است، که نشان میدهد فیلترهای ایمنی هنوز هم میتوانند بخشهای حفظشده را از دست بدهند @percyliang
- ایتان مولیک مشاهده میکند که هوش مصنوعی باعث یکنواخت شدن نوشتار و از بین رفتن سبکهای نوشتاری آکادمیک خاص میشود، اگرچه ارتباطات کلی واضحتر معمولاً مثبت است @emollick
- تحقیقات نشان میدهد که کیفیت دادههای آنلاین، از جمله MTurk، به دلیل LLMها در حال کاهش است، که بحرانی وجودی برای علوم رفتاری ایجاد میکند @emollick
کاربردها
- وید فاستر در زاپیر از رونویسیهای Granola برای مهندسی معکوس فرهنگ شرکت و ساخت عوامل ارزیابی مصاحبه استفاده میکند که بازخورد ساختاریافتهای را در مورد هر نامزد ارائه میدهند @clairevo
- برایان لاوین از Claude برای ایجاد یک توضیحدهندهی تعاملی در مورد نحوهی کار رابطهای کاربری ترمینال استفاده میکند، که هوش مصنوعی را به عنوان ابزاری برای یادگیری مفاهیم فنی نشان میدهد @brian_lovin
- توسعهدهندگان اکنون میتوانند با استفاده از Nano Banana Pro، Hunyuan3D 3.1، Mixamo و Claude با three.js، شخصیتهای سهبعدی را در کمتر از ۵ دقیقه تولید و متحرکسازی کنند @deedydas
- CrowdStrike با انویدیا در تنظیم دقیق تخصصی مدلهای باز Nemotron برای استدلال امنیتی همکاری میکند، که از مدلهای پیشرفتهی عمومی در دقت پیشی میگیرد @NVIDIAAI
- انویدیا Nemotron Speech ASR را برای عوامل صوتی با تأخیر کم منتشر کرد که به نهاییسازی رونویسی ۲۴ میلیثانیه و زمان استنتاج کلی صدا به صدا کمتر از ۵۰۰ میلیثانیه دست مییابد @NVIDIAAI
- تیم Google AI Studio بهبودهای رابط کاربری را ارائه کرد، از جمله کشیدن و رها کردن یکپارچهی فایل، انتخاب آسانتر ابزار، پشتیبانی بهتر از موبایل و ثبات طراحی @OfficialLoganK
پژوهشها
- تحقیقات نشان میدهد که RL (یادگیری تقویتی) به طور طبیعی در برابر فراموشی فاجعهبار در یادگیری مداوم مقاوم است و به ۶۰٪ دقت نهایی متوسط در مقایسه با ۵۴٪ برای SFT متوالی، بدون استفاده از بافرهای بازپخش، دست مییابد @cwolferesearch
- قابلیتهای یادگیری مداوم مبتنی بر RL از جریمهی واگرایی KL ناشی نمیشوند، زیرا آموزش GRPO با و بدون واگرایی KL به سطوح عملکردی مشابهی دست مییابند @cwolferesearch
- آندری کارپاتی مینیسریال نانوچت v1 را منتشر کرد که آموزش بهینهی محاسباتی را بر اساس قوانین مقیاسبندی چنچیلا با نسبت پارامتر به توکن ۸ نشان میدهد و به نتایجی قابل مقایسه با GPT-2 با هزینهی تقریبی ۵۰۰ دلار دست مییابد @karpathy
- فرانسوا شوله ادغام Pallas در Keras را اعلام کرد که به توسعهدهندگان امکان میدهد هستههای سختافزاری با کارایی بالا را در پایتون بنویسند که برای TPUها به Mosaic یا برای GPUها به Triton تبدیل میشوند @fchollet
- معماری Blackwell انویدیا با ارتقاءهای جدید TensorRT-LLM برای عملکرد MoE، توان عملیاتی توکن را در GB200 NVL72 بیش از ۲ برابر افزایش میدهد @NVIDIADC