اخبار هوش مصنوعی در 2025-09-04

مدل‌های جدید هوش مصنوعی

  • گوگل مدل جاسازی باز جدیدی به نام EmbeddingGemma را با ۳۰۸ میلیون پارامتر منتشر کرد که در بنچمارک MTEB به عملکرد پیشرو (State-of-the-art) دست می‌یابد، در حالی که آن‌قدر کوچک است که به‌طور کامل روی دستگاه اجرا شود. @sundarpichai
  • پرپلکسیتی (Perplexity) اعلام کرد که Comet اکنون برای پیش‌سفارش در پلی استور اندروید و برای کاربران نسخه حرفه‌ای (Pro) در کره‌جنوبی، برزیل و اسپانیا در دسترس است. @AravSrinivas
  • گوگل ادغام Veo 3 را در قابلیت تبدیل عکس به ویدیو‌ی Google Photos اعلام کرد، که قابلیت‌های تولید ویدیو را ارتقا می‌دهد. @TechCrunch
  • جینا اِی‌آی (Jina AI) «jina-code-embeddings» را منتشر کرد، مجموعه‌ای جدید از مدل‌های جاسازی کد با اندازه‌های ۰.۵ میلیارد و ۱.۵ میلیارد پارامتر با عملکرد بازیابی پیشرو (SOTA) که از بیش از ۱۵ زبان برنامه‌نویسی پشتیبانی می‌کند. @JinaAI_

تحلیل صنعت

  • اندرو ان‌جی (Andrew Ng) تقاضای برآورده‌نشده‌ی قابل‌توجهی را برای مهندسان هوش مصنوعی شناسایی کرده که می‌توانند با کمک هوش مصنوعی، سیستم‌های نرم‌افزاری را به سرعت مهندسی کنند، در حالی که فارغ‌التحصیلان اخیر علوم کامپیوتر به دلیل عدم انطباق برنامه‌های درسی دانشگاه‌ها با برنامه‌نویسی مبتنی بر هوش مصنوعی (AI-native programming)، با افزایش بیکاری مواجه شده‌اند. @AndrewYNg
  • رید هافمن (Reid Hoffman) درباره‌ی مطالعه‌ی استنفورد بحث می‌کند که نشان‌دهنده‌ی کاهش ۱۶ درصدی در مشاغل سطح ورودی برای افراد ۲۲ تا ۲۵ ساله در زمینه‌های مرتبط با هوش مصنوعی است و بر نیاز به مسیرهای شغلی جدید در عصر هوش مصنوعی تاکید می‌کند. @reidhoffman
  • گرگلی اوروس (Gergely Orosz) از دستور مدیرعامل کوین‌بیس (Coinbase) برای افزایش درصد تولید کد با هوش مصنوعی انتقاد می‌کند، با این استدلال که این دستور بر معیارهای استفاده از ابزارها تمرکز دارد تا بر نتایج تجاری مانند رضایت مشتری یا قابلیت اطمینان محصول. @GergelyOrosz
  • مصطفی سلیمان (Mustafa Suleyman) تاکید می‌کند که مدل‌های پیشرو هوش مصنوعی اکنون ۹۰٪ ارزان‌تر اما ۲.۷ برابر بهتر از دو سال پیش هستند و بر جهش رو به جلو در دسترسی‌پذیری تاکید می‌کند. @mustafasuleyman
  • دیدی (Deedy) گزارش می‌دهد که بر اساس مطالعه‌ی MIT، ۹۵٪ از پروژه‌های آزمایشی (پایلوت) هوش مصنوعی مولد (Gen AI) شکست نمی‌خورند، که با روایت‌های رایج درباره‌ی نرخ شکست پروژه‌های هوش مصنوعی در تضاد است. @deedydas
  • لنی راچیتسکی (Lenny Rachitsky) ارزیابی‌ها (evals) را به عنوان یک مهارت ضروری و نوظهور برای سازندگان محصول و شرکت‌های هوش مصنوعی شناسایی می‌کند و آن را با SQL و Excel به عنوان صلاحیت‌های اساسی مقایسه می‌کند. @lennysan
  • سم آلتمن (Sam Altman) گزارش می‌دهد که میزان استفاده از Codex طی دو هفته‌ی گذشته ۱۰ برابر افزایش یافته است، که نشان‌دهنده‌ی شتاب قابل‌توجهی برای ابزارهای کدنویسی هوش مصنوعی است. @sama
  • آراویند سرینیواس (Aravind Srinivas) اعلام کرد که بیش از یک میلیون نفر در یک صبح به Comet دسترسی پیدا کردند و آن را پرکاربردترین محصول شخصی و عاملیت‌محور در جهان نامید. @AravSrinivas

اخلاق و جامعه

  • سم آلتمن (Sam Altman) شاهد افزایش شیوع حساب‌های توییتر تحت مدیریت مدل‌های زبان بزرگ (LLM) است و اشاره می‌کند که تئوری «اینترنت مرده» را جدی‌تر می‌گیرد. @sama
  • مایکروسافت ریسرچ (Microsoft Research) «Sui Generis score» را برای اندازه‌گیری تنوع روایی در خروجی‌های LLM معرفی می‌کند و نشان می‌دهد که چگونه روایت‌گری هوش مصنوعی اغلب روایت‌های تکراری و کم‌تر منحصربه‌فردی ایجاد می‌کند. @MSFTResearch

کاربردها

  • ریبرا (Ribera)، یک شرکت مراقبت‌های بهداشتی اسپانیایی، از هوش مصنوعی برای بهبود سیستم‌های ترخیص بیماران جراحی آب‌مروارید استفاده می‌کند. @Microsoft
  • اوپن‌اِی‌آی (OpenAI) قابلیت «انشعاب مکالمه (conversation branching)» را در ChatGPT راه‌اندازی می‌کند که به کاربران امکان می‌دهد مسیرهای مختلف را بدون از دست دادن رشته‌ی اصلی (مکالمه) بررسی کنند. @OpenAI
  • گوگل قابلیت ترجمه‌ی Circle to Search را معرفی می‌کند و قابلیت‌های ویرایش تصویر برنامه Gemini را ارتقا می‌دهد. @TechCrunch
  • پایگاه‌های داده Notion اکنون از قابلیت‌های مبتنی بر هوش مصنوعی برای پردازش و تحلیل داده‌های پیشرفته پشتیبانی می‌کنند. @brian_lovin
  • تک‌کرانچ (TechCrunch) گزارش می‌دهد که پلتفرم مشاغل OpenAI قرار است در اواسط سال ۲۰۲۶ راه‌اندازی شود و از هوش مصنوعی برای تطبیق نامزدها با کسب‌وکارها استفاده می‌کند. @TechCrunch
  • Supersonik AI به عنوان اولین هوش مصنوعی که می‌تواند دموهای زنده‌ی محصول را اجرا کند، راه‌اندازی شد و با رهبری a16z، پنج میلیون دلار سرمایه جذب کرد. @danipolymath

پژوهش‌ها

  • ایتان مولیک (Ethan Mollick) یافته‌های پژوهشی را به اشتراک می‌گذارد که نشان می‌دهد قابلیت‌های «تئوری ذهن» (Theory of Mind) مدل‌های زبان بزرگ (LLM) تنها از ۰.۰۰۱٪ پارامترهای آن‌ها ناشی می‌شود و شکستن این وزن‌های خاص منجر به از دست دادن هم ردیابی باور و هم درک زبان می‌شود. @emollick
  • گوگل دیپ‌مایند (Google DeepMind) روش «Deep Loop Shaping» را در مجله‌ی Science منتشر کرد که نویز را در رصدخانه‌های موج گرانشی LIGO تا ۱۰ برابر یا بیشتر کاهش می‌دهد و به شناسایی ادغام سیاه‌چاله‌ها کمک می‌کند. @GoogleDeepMind
  • پژوهشگران استنفورد «Mixture of Contexts» را برای تولید ویدیوهای یک دقیقه‌ای در یک مرحله و بدون انحراف یا فراموش کردن بستر (context) تاریخی معرفی کردند. @GordonWetzstein
  • یک مقاله‌ی پژوهشی نشان می‌دهد که عامل‌های هوش مصنوعی (AI agents) می‌توانند برای آزمایش‌های علوم اجتماعی استفاده شوند، زمانی که پرامپت‌ها بر اساس علوم اجتماعی و نظریه‌ی بازی توسعه یابند و اقدامات عامل‌های هوش مصنوعی را پیش‌بینی‌کننده‌ی نتایج واقعی انسان می‌کند. @emollick
  • مطالعه‌ی جدیدی قابلیت‌های وب‌گردی عامل‌های هوش مصنوعی (AI agents) را با استفاده از بنچمارک Online Mind2Web ارزیابی می‌کند، و ۹ مدل از جمله GPT-5 و Sonnet 4 را با ساختارهای عاملیت متفاوت آزمایش می‌کند. @sayashk
  • یک مقاله‌ی پژوهشی روش‌های ارزیابی شناسایی توهم (hallucination detection) در LLM‌ها را به چالش می‌کشد و مشکلات قابل‌توجهی را در شیوه‌های رایج این حوزه شناسایی می‌کند. @ziv_ravid
  • هاگینگ فیس (Hugging Face) «FineVision» را منتشر کرد، یک مجموعه‌داده‌ی (dataset) متن‌باز عظیم با ۱۷.۳ میلیون تصویر و ۲۴.۳ میلیون نمونه برای آموزش مدل‌های بینایی-زبان (Vision-Language Models). @thibaudfrere