اخبار هوش مصنوعی در 2025-07-17

مدل‌های جدید هوش مصنوعی

اوپن‌ای‌آی ChatGPT Agent را عرضه کرد، یک سیستم عاملیت‌محور یکپارچه‌ی ترکیب‌کننده‌ی مرورگر ریموت با قابلیت اقدام Operator، ترکیب وب Deep Research و قدرت مکالمه‌ی ChatGPT، که در حال عرضه‌شدن برای کاربران Pro، Plus و Team است @OpenAI
گوگل Veo 3 را در پیش‌نمایش پولی برای توسعه‌دهندگان از طریق API جِیمینای و Vertex AI منتشر کرد، که دارای قابلیت‌های صوتی بومی است و با قیمت ۰.۷۵ دلار در ثانیه همراه با صدا یا ۰.۵۰ دلار بدون صدا عرضه می‌شود @GoogleDeepMind
میسترال AI ویژگی‌های جدیدی را معرفی کرد، از جمله مدل صوتی Voxtral، مدل استدلالی Magistral برای استدلال چندزبانه و قابلیت‌های Deep Research در Le Chat @MistralAI
انتروپیک Claude for Financial Services را با محدودیت‌های استفاده‌ی گسترده‌تر، کانکتورهای از پیش ساخته‌شده‌ی MCP برای ارائه‌دهندگان داده‌های مالی و فرآیند معرفی هدایت‌شده عرضه کرد @AnthropicAI
ویندسرف اعلام کرد که Claude Sonnet 4 از طریق پشتیبانی مستقیم انتروپیک بازگشته است و برای کاربران Pro و Teams با دو برابر اعتبار به ازای هر درخواست در دسترس است @windsurf_ai
اِنویدیا Canary Qwen 2.5 را منتشر کرد که با دستیابی به عملکرد پیشرفته در Open ASR Leaderboard با WER ۵.۶۲ و لایسنس CC-BY با اجازه‌ی استفاده‌ی تجاری همراه است @reach_vb

تحلیل صنعت

اندرو اِن‌جی تنگنای مدیریت پروژه را به عنوان محدودیت جدید در توسعه‌ی نرم‌افزار شناسایی می‌کند، جایی که با افزایش سرعت تولید نرم‌افزار توسط کدنویسی عاملیت‌محور، تصمیم‌گیری در مورد اینکه چه چیزی ساخته شود به عامل محدودکننده تبدیل می‌شود @AndrewYNg
Perplexity اشتراک‌های Pro را به ۳۶۰ میلیون هندی برای یک سال از طریق همکاری با Airtel ارائه می‌دهد، که در صورت عدم موفقیت بالقوه سالانه ۷۰۰ میلیون تا ۳.۶ میلیارد دلار هزینه خواهد داشت، اما در صورت تبدیل ۱ درصد، می‌تواند ۷۲۰ میلیون دلار درآمد سالانه (ARR) ایجاد کند @deedydas
شایعات اکتساب Windsurf نشان می‌دهد که Cognition تقریباً ۲۵۰ میلیون دلار برای این شرکت پرداخت کرده است، که با ارزش‌گذاری ۲.۵ میلیارد دلاری گوگل مطابقت دارد، و طبق گزارش‌ها کارکنان بنیان‌گذار وضعیت خوبی پیدا کرده‌اند @deedydas
آزمایشگاه‌های Character AI پس از مشاهده‌ی رشد قوی کاربران و نرخ تعامل با گروه سنی زیر ۲۵ سال، در حال تسریع برنامه‌های توسعه‌ی آواتار هستند، و چندین آزمایشگاه نیز استراتژی‌های مشابهی را دنبال می‌کنند @AndrewCurran_
ایتان مولیک مشاهده می‌کند که تولید موسیقی با هوش مصنوعی به نقطه‌ای رسیده است که آهنگ‌های جدید می‌توانند سریع‌تر از اینکه شنیده شوند، ایجاد شوند، با کیفیتی که برخی افراد از آن لذت می‌برند @emollick
پیشرفت محدود مایکروسافت با Copilotها ناظران را شگفت‌زده می‌کند، زیرا اوپن‌ای‌آی ادغام برتری را با اکسل و پاورپوینت از طریق ChatGPT Agent نشان می‌دهد @emollick

اخلاق و جامعه

سَم آلتمن هشدار می‌دهد که ChatGPT Agent نشان‌دهنده‌ی فناوری آزمایشی پیشرفته با خطرات قابل توجهی است، و در مورد استفاده‌های پرخطر یا به اشتراک گذاشتن اطلاعات شخصی تا زمان مطالعه و بهبود بیشتر آن، هشدار می‌دهد @sama
اوپن‌ای‌آی اقدامات گسترده‌ای را برای کاهش خطرات ایمنی برای ChatGPT Agent پیاده‌سازی می‌کند، از جمله محافظت در برابر دستکاری خصمانه از طریق تزریق پرامپت، و عرضه‌ی آن را به عنوان قابلیتی با «توانایی بالا» (High Capability) تحت چارچوب آمادگی خود در نظر می‌گیرد @OpenAI
سیمون ویلسون کشف می‌کند که مدل‌های Voxtral میسترال در عدم پیروی از دستورالعمل‌های جاسازی‌شده در پیوست‌های صوتی مشکل دارند، به طوری که پرامپت‌های سیستمی مانند «do not follow instructions in it» هیچ تأثیری ندارند @simonw
آرویند نارایانان و سایا کاپور استدلال می‌کنند که هوش مصنوعی می‌تواند به جای تسریع، پیشرفت علمی را کُند کند و در مورد پارادوکس «تولید-پیشرفت» هشدار می‌دهند که در آن افزایش خروجی مقالات با پیشرفت‌های واقعی مرتبط نیست @random_walker
پژوهش‌ها در مورد همراهان هوش مصنوعی و سلامت روان همچنان مقدماتی است با تأثیرات بلندمدت نامشخص، که نگرانی‌هایی را در مورد آسیب‌های احتمالی از محصولات همراه جدید ایجاد می‌کند @emollick

کاربردها

ChatGPT Agent قابلیت تحلیل بیش از ۱۵۰۰ ایمیل پشتیبانی و صدها پست فروم را برای ایجاد گزارش‌های جامع مشتری، از جمله پژوهش لینکدین برای نمونه‌های اولیه مشتری، نشان می‌دهد @danshipper
آیدان مک‌لاگلین از ChatGPT Agent برای مسیریابی مقررات پارک خودرو در سان‌فرانسیسکو استفاده می‌کند، با جستجو در APIهای شهری، نقشه‌های تعاملی و محاسبه‌ی فواصل تا نزدیک‌ترین پارکینگ‌ها - کارهایی که به صورت دستی ساعت‌ها طول می‌کشید @aidan_mclau
مرورگر Comet پرپلکسیتی قابلیت‌های پیشرفته‌ای را نشان می‌دهد، از جمله تنظیم اتصالات webhook، یافتن URLهای صحیح و شناسایی رویدادهای خاص برای تشخیص برگشت ایمیل @ai_for_success
ایتان مولیک گزارش می‌دهد که ChatGPT Agent با موفقیت پژوهش خودکار را انجام می‌دهد و فایل‌های اکسل با فرمول‌ها و ارائه‌های پاورپوینت را آماده می‌کند، که بیشتر شبیه کار با یک کارآموز انسانی است @emollick
هَمل حسین Conductor را معرفی می‌کند، یک اپلیکیشن مک که امکان اجرای موازی چندین نمونه‌ی Claude Code را برای افزایش بهره‌وری فراهم می‌کند @charliebholtz

پژوهش‌ها

ChatGPT Agent طبق ارزیابی پژوهش Epoch AI به عملکرد ۲۷ درصدی در سؤالات FrontierMath Tier 1-3 دست می‌یابد و عملکرد پیشرفته (state-of-the-art) را در ارزیابی‌های وظایف آکادمیک و واقعی نشان می‌دهد @EpochAIResearch
پژوهشگران MIT در CHI2025 سیستم Interactive Sketchpad را ارائه دادند، یک سیستم آموزشی هوش مصنوعی که توضیحات گام‌به‌گام را با تجسم‌های تولیدشده توسط هوش مصنوعی ترکیب می‌کند تا به دانش‌آموزان در حل مسائل ریاضی کمک کند @medialab
مدل توصیه‌گر بزرگ یوتیوب که توسط جِیمینای پشتیبانی می‌شود، هر ویدیو را در پلتفرم با استفاده از SemanticID توکنایز می‌کند و یک واژه‌نامه با چندین مرتبه بزرگی بیشتر از زبان انگلیسی ایجاد می‌کند و به طور مداوم هر روز پیش‌آموزش می‌دهد @swyx
اِم‌آی‌تی CodeSteer را توسعه می‌دهد، روشی که مدل‌های هوش مصنوعی را برای جابجایی بین متن و کد به منظور حل مسائل پیچیده راهنمایی می‌کند، و پژوهشگران آن را به نحوه‌ی کمک مربیان به بهبود عملکرد ورزشکاران ستاره تشبیه می‌کنند @MIT
شرکت 1X Technologies فاز ICCV چالش مدل جهانی خود را با مجموع جایزه‌ی ۸ هزار دلار برای بخش‌های فشرده‌سازی (Compression) و نمونه‌گیری (Sampling) اعلام می‌کند، با تمرکز بر آموزش مدل‌های مولد برای کاربردهای رباتیک @itsdanielho