اخبار هوش مصنوعی در 2025-09-04
مدلهای جدید هوش مصنوعی
- گوگل مدل جاسازی باز جدیدی به نام EmbeddingGemma را با ۳۰۸ میلیون پارامتر منتشر کرد که در بنچمارک MTEB به عملکرد پیشرو (State-of-the-art) دست مییابد، در حالی که آنقدر کوچک است که بهطور کامل روی دستگاه اجرا شود. @sundarpichai
- پرپلکسیتی (Perplexity) اعلام کرد که Comet اکنون برای پیشسفارش در پلی استور اندروید و برای کاربران نسخه حرفهای (Pro) در کرهجنوبی، برزیل و اسپانیا در دسترس است. @AravSrinivas
- گوگل ادغام Veo 3 را در قابلیت تبدیل عکس به ویدیوی Google Photos اعلام کرد، که قابلیتهای تولید ویدیو را ارتقا میدهد. @TechCrunch
- جینا اِیآی (Jina AI) «jina-code-embeddings» را منتشر کرد، مجموعهای جدید از مدلهای جاسازی کد با اندازههای ۰.۵ میلیارد و ۱.۵ میلیارد پارامتر با عملکرد بازیابی پیشرو (SOTA) که از بیش از ۱۵ زبان برنامهنویسی پشتیبانی میکند. @JinaAI_
تحلیل صنعت
- اندرو انجی (Andrew Ng) تقاضای برآوردهنشدهی قابلتوجهی را برای مهندسان هوش مصنوعی شناسایی کرده که میتوانند با کمک هوش مصنوعی، سیستمهای نرمافزاری را به سرعت مهندسی کنند، در حالی که فارغالتحصیلان اخیر علوم کامپیوتر به دلیل عدم انطباق برنامههای درسی دانشگاهها با برنامهنویسی مبتنی بر هوش مصنوعی (AI-native programming)، با افزایش بیکاری مواجه شدهاند. @AndrewYNg
- رید هافمن (Reid Hoffman) دربارهی مطالعهی استنفورد بحث میکند که نشاندهندهی کاهش ۱۶ درصدی در مشاغل سطح ورودی برای افراد ۲۲ تا ۲۵ ساله در زمینههای مرتبط با هوش مصنوعی است و بر نیاز به مسیرهای شغلی جدید در عصر هوش مصنوعی تاکید میکند. @reidhoffman
- گرگلی اوروس (Gergely Orosz) از دستور مدیرعامل کوینبیس (Coinbase) برای افزایش درصد تولید کد با هوش مصنوعی انتقاد میکند، با این استدلال که این دستور بر معیارهای استفاده از ابزارها تمرکز دارد تا بر نتایج تجاری مانند رضایت مشتری یا قابلیت اطمینان محصول. @GergelyOrosz
- مصطفی سلیمان (Mustafa Suleyman) تاکید میکند که مدلهای پیشرو هوش مصنوعی اکنون ۹۰٪ ارزانتر اما ۲.۷ برابر بهتر از دو سال پیش هستند و بر جهش رو به جلو در دسترسیپذیری تاکید میکند. @mustafasuleyman
- دیدی (Deedy) گزارش میدهد که بر اساس مطالعهی MIT، ۹۵٪ از پروژههای آزمایشی (پایلوت) هوش مصنوعی مولد (Gen AI) شکست نمیخورند، که با روایتهای رایج دربارهی نرخ شکست پروژههای هوش مصنوعی در تضاد است. @deedydas
- لنی راچیتسکی (Lenny Rachitsky) ارزیابیها (evals) را به عنوان یک مهارت ضروری و نوظهور برای سازندگان محصول و شرکتهای هوش مصنوعی شناسایی میکند و آن را با SQL و Excel به عنوان صلاحیتهای اساسی مقایسه میکند. @lennysan
- سم آلتمن (Sam Altman) گزارش میدهد که میزان استفاده از Codex طی دو هفتهی گذشته ۱۰ برابر افزایش یافته است، که نشاندهندهی شتاب قابلتوجهی برای ابزارهای کدنویسی هوش مصنوعی است. @sama
- آراویند سرینیواس (Aravind Srinivas) اعلام کرد که بیش از یک میلیون نفر در یک صبح به Comet دسترسی پیدا کردند و آن را پرکاربردترین محصول شخصی و عاملیتمحور در جهان نامید. @AravSrinivas
اخلاق و جامعه
- سم آلتمن (Sam Altman) شاهد افزایش شیوع حسابهای توییتر تحت مدیریت مدلهای زبان بزرگ (LLM) است و اشاره میکند که تئوری «اینترنت مرده» را جدیتر میگیرد. @sama
- مایکروسافت ریسرچ (Microsoft Research) «Sui Generis score» را برای اندازهگیری تنوع روایی در خروجیهای LLM معرفی میکند و نشان میدهد که چگونه روایتگری هوش مصنوعی اغلب روایتهای تکراری و کمتر منحصربهفردی ایجاد میکند. @MSFTResearch
کاربردها
- ریبرا (Ribera)، یک شرکت مراقبتهای بهداشتی اسپانیایی، از هوش مصنوعی برای بهبود سیستمهای ترخیص بیماران جراحی آبمروارید استفاده میکند. @Microsoft
- اوپناِیآی (OpenAI) قابلیت «انشعاب مکالمه (conversation branching)» را در ChatGPT راهاندازی میکند که به کاربران امکان میدهد مسیرهای مختلف را بدون از دست دادن رشتهی اصلی (مکالمه) بررسی کنند. @OpenAI
- گوگل قابلیت ترجمهی Circle to Search را معرفی میکند و قابلیتهای ویرایش تصویر برنامه Gemini را ارتقا میدهد. @TechCrunch
- پایگاههای داده Notion اکنون از قابلیتهای مبتنی بر هوش مصنوعی برای پردازش و تحلیل دادههای پیشرفته پشتیبانی میکنند. @brian_lovin
- تککرانچ (TechCrunch) گزارش میدهد که پلتفرم مشاغل OpenAI قرار است در اواسط سال ۲۰۲۶ راهاندازی شود و از هوش مصنوعی برای تطبیق نامزدها با کسبوکارها استفاده میکند. @TechCrunch
- Supersonik AI به عنوان اولین هوش مصنوعی که میتواند دموهای زندهی محصول را اجرا کند، راهاندازی شد و با رهبری a16z، پنج میلیون دلار سرمایه جذب کرد. @danipolymath
پژوهشها
- ایتان مولیک (Ethan Mollick) یافتههای پژوهشی را به اشتراک میگذارد که نشان میدهد قابلیتهای «تئوری ذهن» (Theory of Mind) مدلهای زبان بزرگ (LLM) تنها از ۰.۰۰۱٪ پارامترهای آنها ناشی میشود و شکستن این وزنهای خاص منجر به از دست دادن هم ردیابی باور و هم درک زبان میشود. @emollick
- گوگل دیپمایند (Google DeepMind) روش «Deep Loop Shaping» را در مجلهی Science منتشر کرد که نویز را در رصدخانههای موج گرانشی LIGO تا ۱۰ برابر یا بیشتر کاهش میدهد و به شناسایی ادغام سیاهچالهها کمک میکند. @GoogleDeepMind
- پژوهشگران استنفورد «Mixture of Contexts» را برای تولید ویدیوهای یک دقیقهای در یک مرحله و بدون انحراف یا فراموش کردن بستر (context) تاریخی معرفی کردند. @GordonWetzstein
- یک مقالهی پژوهشی نشان میدهد که عاملهای هوش مصنوعی (AI agents) میتوانند برای آزمایشهای علوم اجتماعی استفاده شوند، زمانی که پرامپتها بر اساس علوم اجتماعی و نظریهی بازی توسعه یابند و اقدامات عاملهای هوش مصنوعی را پیشبینیکنندهی نتایج واقعی انسان میکند. @emollick
- مطالعهی جدیدی قابلیتهای وبگردی عاملهای هوش مصنوعی (AI agents) را با استفاده از بنچمارک Online Mind2Web ارزیابی میکند، و ۹ مدل از جمله GPT-5 و Sonnet 4 را با ساختارهای عاملیت متفاوت آزمایش میکند. @sayashk
- یک مقالهی پژوهشی روشهای ارزیابی شناسایی توهم (hallucination detection) در LLMها را به چالش میکشد و مشکلات قابلتوجهی را در شیوههای رایج این حوزه شناسایی میکند. @ziv_ravid
- هاگینگ فیس (Hugging Face) «FineVision» را منتشر کرد، یک مجموعهدادهی (dataset) متنباز عظیم با ۱۷.۳ میلیون تصویر و ۲۴.۳ میلیون نمونه برای آموزش مدلهای بینایی-زبان (Vision-Language Models). @thibaudfrere