اخبار هوش مصنوعی در 2025-07-10

مدل‌های جدید هوش مصنوعی

xAI مدل Grok 4 را با بهترین عملکرد در معیارهای مختلف منتشر کرد و در «Humanity's Last Exam» (۴۴.۴٪)، «GPQA» (۸۸.۹٪)، «AIME 2025» (۱۰۰٪)، «Harvard MIT Math» (۹۶.۷٪)، «USAMO25» (۶۱.۹٪)، «ARC-AGI-2» (۱۵.۹٪) و «LiveCodeBench» (۷۹.۴٪) رتبه‌ی اول را کسب کرد. @deedydas
قیمت‌گذاری Grok 4 اعلام شد: ۳ دلار به ازای هر میلیون توکن ورودی، ۱۵ دلار به ازای هر میلیون توکن خروجی با ۲۵۶ هزار توکن زمینه‌ی متنی و نسخه‌ی چندعامله‌ی Grok 4 Heavy با قیمت ماهیانه ۳۰۰ دلار. @AndrewCurran_
گوگل قابلیت تولید ویدئو از تصویر را در Veo 3، از طریق اپلیکیشن Gemini عرضه کرد که به کاربران امکان می‌دهد کلیپ‌های ویدئویی ۸ ثانیه‌ای با صدا را از روی عکس‌ها بسازند. @sundarpichai
Mistral AI مدل‌های Devstral Small و Devstral Medium 2507 را با عملکرد بهبودیافته و بهره‌وری هزینه برای عامل‌های کدنویسی و کارهای مهندسی نرم‌افزار منتشر کرد. @MistralAI
مایکروسافت ریسرچ (Microsoft Research) مدل BioEmu 1.1 را معرفی کرد؛ یک روش یادگیری عمیق مولد که مجموعه‌های تعادلی پروتئین را شبیه‌سازی می‌کند و زمان محاسباتی مورد نیاز برای شبیه‌سازی‌های دینامیک مولکولی را از سال‌های GPU به ساعت‌های GPU کاهش می‌دهد. @MSFTResearch
گوگل مدل MedGemma را منتشر کرد؛ یک مدل چندوجهی و متن‌باز پیشرفته برای داده‌های طولی پرونده‌های الکترونیکی سلامت (EHR) و تصویربرداری پزشکی در زمینه‌های رادیولوژی، پوست، پاتولوژی و چشم‌پزشکی. @JeffDean

تحلیل صنعت

رشد درآمد Anthropic از ۱ میلیارد دلار به ۴ میلیارد دلار (سالانه) در سال ۲۰۲۵، نشان‌دهنده‌ی رشدی بی‌سابقه در تاریخ بشر است، در حالی که درآمد OpenAI به ۱۰ میلیارد دلار می‌رسد. @deedydas
هوش مصنوعی ۳۵٪ از کدهای مورد نیاز برای محصولات جدید مایکروسافت را تولید می‌کند و بیش از نیم میلیارد دلار در هزینه‌های مراکز تماس صرفه‌جویی کرده، ضمن اینکه رضایت مشتری را افزایش داده است. @AndrewCurran_
مایکروسافت با وجود ارزش‌گذاری، درآمد و سود بی‌سابقه‌ی خود، تعدیل نیروی گسترده را اعلام کرد که نشان‌دهنده‌ی عدم ارتباط بین عملکرد مالی و تصمیمات مربوط به اشتغال است. @GergelyOrosz
متخصصان فناوری که بنیان‌گذار نیستند، اکنون بیشتر از پردرآمدترین ورزشکاران درآمد دارند که نشان‌دهنده‌ی اوج شرایط بازار هوش مصنوعی است. @GergelyOrosz
پیش‌بینی می‌شود ByteDance تا پایان سال ۲۰۲۵ به مقیاس درآمدی Meta برسد و انتظار می‌رود هر دو شرکت به درآمد ۱۸۵ تا ۱۹۰ میلیارد دلاری دست یابند؛ هرچند ریسک‌های نظارتی ایالات متحده همچنان برای TikTok یک نگرانی است. @deedydas

اخلاق و جامعه

xAI به دلیل عدم شفافیت در مورد عرضه‌ی Grok 4، با انتقاد مواجه شده است؛ بدون ارائه‌ی مدل کارت، مستندات «red teaming» یا توضیحی درباره‌ی حادثه‌ی روز گذشته که منجر به حذف Grok 3 شد. @emollick
مجله‌ی «MIT Technology Review» ابزاری را گزارش می‌دهد که حفاظت‌های ضد هوش مصنوعی را از آثار هنری دیجیتال از بین می‌برد و نگرانی‌هایی را درباره‌ی حقوق هنرمندان و حفاظت از مالکیت فکری ایجاد می‌کند. @techreview
پژوهش‌ها نشان می‌دهد که دستیاران کدنویسی هوش مصنوعی ممکن است عمدتاً باعث شوند توسعه‌دهندگان احساس بهره‌وری بیشتری کنند، تا اینکه واقعاً افزایش بهره‌وری را به همراه داشته باشند؛ مشابه با نحوه‌ی گیمیفای کردن یادگیری توسط Duolingo بدون آموزش مؤثر. @fchollet
مطالعه نشان می‌دهد توسعه‌دهندگانی که از ابزارهای هوش مصنوعی استفاده می‌کنند، هیچ شتاب قابل توجهی در انجام وظایف نشان نمی‌دهند و برخی شواهد حاکی از عملکرد کندتر در وظایف آشناست. @emollick

کاربردها

Perplexity مرورگر Comet را راه‌اندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی که می‌تواند به حساب‌های کاربری وارد شود و اقداماتی مانند لغو اشتراک خبرنامه‌ها، تغییر زمان جلسات و مدیریت ایمیل‌ها را انجام دهد. @omooretweets
اندرو اِن‌جی (Andrew Ng) «استخراج عاملی اسناد» (Agentic Document Extraction) را با قابلیت‌های استخراج فیلد معرفی کرد که به کاربران امکان می‌دهد با استفاده از دستورات زبان طبیعی، فیلدهای خاصی را از فاکتورها، فرم‌های پزشکی و اسناد ساختاریافته استخراج کنند. @AndrewYNg
Perplexity با Coinbase همکاری می‌کند تا داده‌های لحظه‌ای کریپتو را در Perplexity Finance ادغام کند و تحلیل بازار و بینش‌های معاملاتی مبتنی بر هوش مصنوعی را ممکن سازد. @AravSrinivas
Hugging Face محیط ScreenEnv را منتشر کرد؛ یک محیط دسکتاپ کاملاً سندباکس‌شده برای استقرار عامل‌های هوش مصنوعی که می‌توانند برنامه‌ها را ببینند، کلیک کنند، تایپ کنند، مرور کنند و مدیریت کنند، با پشتیبانی از MCP. @amir_mahla
Odyssey موتورهای بازی سه‌بعدی تولیدشده توسط هوش مصنوعی را به نمایش می‌گذارد که دنیاهای مجازی تعاملی خلق می‌کنند و در آن هر فریم در زمان واقعی توسط هوش مصنوعی تولید می‌شود. @emollick

پژوهش‌ها

جف کلون (Jeff Clune) «خودبازی مدل بنیادی» (Foundation Model Self-Play - FMSP) را معرفی کرد که هوش مدل بنیادی را با برنامه‌ی درسی خودبازی ترکیب می‌کند تا استراتژی‌های متنوعی را در بازی‌های چندعامله کشف کند و با موفقیت به «رد تیمینگ» GPT-4o-mini پرداخت و ۶ مورد از ۷ استراتژی دفاعی را شکست داد. @jeffclune
پژوهشگران استنفورد مدل «CellFlux» را ارائه کردند؛ یک مدل مولد تصویر که تغییرات مورفولوژیکی سلولی را از تصاویر میکروسکوپی شبیه‌سازی می‌کند و با دستیابی به ۳۵٪ دقت تصویر بالاتر و ۱۲٪ دقت بیولوژیکی بیشتر، برای کاربردهای کشف دارو مناسب است. @Zhang_Yu_hui
گوگل دیپ‌مایند (Google DeepMind) پژوهشی را در مورد ارزیابی قابلیت‌های «پنهان‌کاری» (stealth) و «آگاهی موقعیتی» (situational awareness) مدل‌های هوش مصنوعی منتشر کرد تا خطرات «هم‌راستایی فریبنده» (deceptive alignment) را ارزیابی کند و نظارت بر «زنجیره‌ی تفکر» (chain-of-thought) را به عنوان یک مکانیسم دفاعی پیشنهاد می‌کند. @rohinmshah
پژوهش در مورد «پیش‌بینی هم‌شکل» (conformal prediction) برای طبقه‌بندی «دم‌بلند» (long-tailed classification)، به چالش ایجاد مجموعه‌های پیش‌بینی می‌پردازد که هم برای کلاس‌های رایج و هم برای کلاس‌های نادر در کاربردهای یادگیری ماشین به خوبی کار کنند. @tifding