اخبار هوش مصنوعی در 2025-07-10
مدلهای جدید هوش مصنوعی
- xAI مدل Grok 4 را با بهترین عملکرد در معیارهای مختلف منتشر کرد و در «Humanity's Last Exam» (۴۴.۴٪)، «GPQA» (۸۸.۹٪)، «AIME 2025» (۱۰۰٪)، «Harvard MIT Math» (۹۶.۷٪)، «USAMO25» (۶۱.۹٪)، «ARC-AGI-2» (۱۵.۹٪) و «LiveCodeBench» (۷۹.۴٪) رتبهی اول را کسب کرد. @deedydas
- قیمتگذاری Grok 4 اعلام شد: ۳ دلار به ازای هر میلیون توکن ورودی، ۱۵ دلار به ازای هر میلیون توکن خروجی با ۲۵۶ هزار توکن زمینهی متنی و نسخهی چندعاملهی Grok 4 Heavy با قیمت ماهیانه ۳۰۰ دلار. @AndrewCurran_
- گوگل قابلیت تولید ویدئو از تصویر را در Veo 3، از طریق اپلیکیشن Gemini عرضه کرد که به کاربران امکان میدهد کلیپهای ویدئویی ۸ ثانیهای با صدا را از روی عکسها بسازند. @sundarpichai
- Mistral AI مدلهای Devstral Small و Devstral Medium 2507 را با عملکرد بهبودیافته و بهرهوری هزینه برای عاملهای کدنویسی و کارهای مهندسی نرمافزار منتشر کرد. @MistralAI
- مایکروسافت ریسرچ (Microsoft Research) مدل BioEmu 1.1 را معرفی کرد؛ یک روش یادگیری عمیق مولد که مجموعههای تعادلی پروتئین را شبیهسازی میکند و زمان محاسباتی مورد نیاز برای شبیهسازیهای دینامیک مولکولی را از سالهای GPU به ساعتهای GPU کاهش میدهد. @MSFTResearch
- گوگل مدل MedGemma را منتشر کرد؛ یک مدل چندوجهی و متنباز پیشرفته برای دادههای طولی پروندههای الکترونیکی سلامت (EHR) و تصویربرداری پزشکی در زمینههای رادیولوژی، پوست، پاتولوژی و چشمپزشکی. @JeffDean
تحلیل صنعت
- رشد درآمد Anthropic از ۱ میلیارد دلار به ۴ میلیارد دلار (سالانه) در سال ۲۰۲۵، نشاندهندهی رشدی بیسابقه در تاریخ بشر است، در حالی که درآمد OpenAI به ۱۰ میلیارد دلار میرسد. @deedydas
- هوش مصنوعی ۳۵٪ از کدهای مورد نیاز برای محصولات جدید مایکروسافت را تولید میکند و بیش از نیم میلیارد دلار در هزینههای مراکز تماس صرفهجویی کرده، ضمن اینکه رضایت مشتری را افزایش داده است. @AndrewCurran_
- مایکروسافت با وجود ارزشگذاری، درآمد و سود بیسابقهی خود، تعدیل نیروی گسترده را اعلام کرد که نشاندهندهی عدم ارتباط بین عملکرد مالی و تصمیمات مربوط به اشتغال است. @GergelyOrosz
- متخصصان فناوری که بنیانگذار نیستند، اکنون بیشتر از پردرآمدترین ورزشکاران درآمد دارند که نشاندهندهی اوج شرایط بازار هوش مصنوعی است. @GergelyOrosz
- پیشبینی میشود ByteDance تا پایان سال ۲۰۲۵ به مقیاس درآمدی Meta برسد و انتظار میرود هر دو شرکت به درآمد ۱۸۵ تا ۱۹۰ میلیارد دلاری دست یابند؛ هرچند ریسکهای نظارتی ایالات متحده همچنان برای TikTok یک نگرانی است. @deedydas
اخلاق و جامعه
- xAI به دلیل عدم شفافیت در مورد عرضهی Grok 4، با انتقاد مواجه شده است؛ بدون ارائهی مدل کارت، مستندات «red teaming» یا توضیحی دربارهی حادثهی روز گذشته که منجر به حذف Grok 3 شد. @emollick
- مجلهی «MIT Technology Review» ابزاری را گزارش میدهد که حفاظتهای ضد هوش مصنوعی را از آثار هنری دیجیتال از بین میبرد و نگرانیهایی را دربارهی حقوق هنرمندان و حفاظت از مالکیت فکری ایجاد میکند. @techreview
- پژوهشها نشان میدهد که دستیاران کدنویسی هوش مصنوعی ممکن است عمدتاً باعث شوند توسعهدهندگان احساس بهرهوری بیشتری کنند، تا اینکه واقعاً افزایش بهرهوری را به همراه داشته باشند؛ مشابه با نحوهی گیمیفای کردن یادگیری توسط Duolingo بدون آموزش مؤثر. @fchollet
- مطالعه نشان میدهد توسعهدهندگانی که از ابزارهای هوش مصنوعی استفاده میکنند، هیچ شتاب قابل توجهی در انجام وظایف نشان نمیدهند و برخی شواهد حاکی از عملکرد کندتر در وظایف آشناست. @emollick
کاربردها
- Perplexity مرورگر Comet را راهاندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی که میتواند به حسابهای کاربری وارد شود و اقداماتی مانند لغو اشتراک خبرنامهها، تغییر زمان جلسات و مدیریت ایمیلها را انجام دهد. @omooretweets
- اندرو اِنجی (Andrew Ng) «استخراج عاملی اسناد» (Agentic Document Extraction) را با قابلیتهای استخراج فیلد معرفی کرد که به کاربران امکان میدهد با استفاده از دستورات زبان طبیعی، فیلدهای خاصی را از فاکتورها، فرمهای پزشکی و اسناد ساختاریافته استخراج کنند. @AndrewYNg
- Perplexity با Coinbase همکاری میکند تا دادههای لحظهای کریپتو را در Perplexity Finance ادغام کند و تحلیل بازار و بینشهای معاملاتی مبتنی بر هوش مصنوعی را ممکن سازد. @AravSrinivas
- Hugging Face محیط ScreenEnv را منتشر کرد؛ یک محیط دسکتاپ کاملاً سندباکسشده برای استقرار عاملهای هوش مصنوعی که میتوانند برنامهها را ببینند، کلیک کنند، تایپ کنند، مرور کنند و مدیریت کنند، با پشتیبانی از MCP. @amir_mahla
- Odyssey موتورهای بازی سهبعدی تولیدشده توسط هوش مصنوعی را به نمایش میگذارد که دنیاهای مجازی تعاملی خلق میکنند و در آن هر فریم در زمان واقعی توسط هوش مصنوعی تولید میشود. @emollick
پژوهشها
- جف کلون (Jeff Clune) «خودبازی مدل بنیادی» (Foundation Model Self-Play - FMSP) را معرفی کرد که هوش مدل بنیادی را با برنامهی درسی خودبازی ترکیب میکند تا استراتژیهای متنوعی را در بازیهای چندعامله کشف کند و با موفقیت به «رد تیمینگ» GPT-4o-mini پرداخت و ۶ مورد از ۷ استراتژی دفاعی را شکست داد. @jeffclune
- پژوهشگران استنفورد مدل «CellFlux» را ارائه کردند؛ یک مدل مولد تصویر که تغییرات مورفولوژیکی سلولی را از تصاویر میکروسکوپی شبیهسازی میکند و با دستیابی به ۳۵٪ دقت تصویر بالاتر و ۱۲٪ دقت بیولوژیکی بیشتر، برای کاربردهای کشف دارو مناسب است. @Zhang_Yu_hui
- گوگل دیپمایند (Google DeepMind) پژوهشی را در مورد ارزیابی قابلیتهای «پنهانکاری» (stealth) و «آگاهی موقعیتی» (situational awareness) مدلهای هوش مصنوعی منتشر کرد تا خطرات «همراستایی فریبنده» (deceptive alignment) را ارزیابی کند و نظارت بر «زنجیرهی تفکر» (chain-of-thought) را به عنوان یک مکانیسم دفاعی پیشنهاد میکند. @rohinmshah
- پژوهش در مورد «پیشبینی همشکل» (conformal prediction) برای طبقهبندی «دمبلند» (long-tailed classification)، به چالش ایجاد مجموعههای پیشبینی میپردازد که هم برای کلاسهای رایج و هم برای کلاسهای نادر در کاربردهای یادگیری ماشین به خوبی کار کنند. @tifding