اخبار هوش مصنوعی در 2025-07-17
مدلهای جدید هوش مصنوعی
- اوپنایآی ChatGPT Agent را عرضه کرد، یک سیستم عاملیتمحور یکپارچهی ترکیبکنندهی مرورگر ریموت با قابلیت اقدام Operator، ترکیب وب Deep Research و قدرت مکالمهی ChatGPT، که در حال عرضهشدن برای کاربران Pro، Plus و Team است @OpenAI
- گوگل Veo 3 را در پیشنمایش پولی برای توسعهدهندگان از طریق API جِیمینای و Vertex AI منتشر کرد، که دارای قابلیتهای صوتی بومی است و با قیمت ۰.۷۵ دلار در ثانیه همراه با صدا یا ۰.۵۰ دلار بدون صدا عرضه میشود @GoogleDeepMind
- میسترال AI ویژگیهای جدیدی را معرفی کرد، از جمله مدل صوتی Voxtral، مدل استدلالی Magistral برای استدلال چندزبانه و قابلیتهای Deep Research در Le Chat @MistralAI
- انتروپیک Claude for Financial Services را با محدودیتهای استفادهی گستردهتر، کانکتورهای از پیش ساختهشدهی MCP برای ارائهدهندگان دادههای مالی و فرآیند معرفی هدایتشده عرضه کرد @AnthropicAI
- ویندسرف اعلام کرد که Claude Sonnet 4 از طریق پشتیبانی مستقیم انتروپیک بازگشته است و برای کاربران Pro و Teams با دو برابر اعتبار به ازای هر درخواست در دسترس است @windsurf_ai
- اِنویدیا Canary Qwen 2.5 را منتشر کرد که با دستیابی به عملکرد پیشرفته در Open ASR Leaderboard با WER ۵.۶۲ و لایسنس CC-BY با اجازهی استفادهی تجاری همراه است @reach_vb
تحلیل صنعت
- اندرو اِنجی تنگنای مدیریت پروژه را به عنوان محدودیت جدید در توسعهی نرمافزار شناسایی میکند، جایی که با افزایش سرعت تولید نرمافزار توسط کدنویسی عاملیتمحور، تصمیمگیری در مورد اینکه چه چیزی ساخته شود به عامل محدودکننده تبدیل میشود @AndrewYNg
- Perplexity اشتراکهای Pro را به ۳۶۰ میلیون هندی برای یک سال از طریق همکاری با Airtel ارائه میدهد، که در صورت عدم موفقیت بالقوه سالانه ۷۰۰ میلیون تا ۳.۶ میلیارد دلار هزینه خواهد داشت، اما در صورت تبدیل ۱ درصد، میتواند ۷۲۰ میلیون دلار درآمد سالانه (ARR) ایجاد کند @deedydas
- شایعات اکتساب Windsurf نشان میدهد که Cognition تقریباً ۲۵۰ میلیون دلار برای این شرکت پرداخت کرده است، که با ارزشگذاری ۲.۵ میلیارد دلاری گوگل مطابقت دارد، و طبق گزارشها کارکنان بنیانگذار وضعیت خوبی پیدا کردهاند @deedydas
- آزمایشگاههای Character AI پس از مشاهدهی رشد قوی کاربران و نرخ تعامل با گروه سنی زیر ۲۵ سال، در حال تسریع برنامههای توسعهی آواتار هستند، و چندین آزمایشگاه نیز استراتژیهای مشابهی را دنبال میکنند @AndrewCurran_
- ایتان مولیک مشاهده میکند که تولید موسیقی با هوش مصنوعی به نقطهای رسیده است که آهنگهای جدید میتوانند سریعتر از اینکه شنیده شوند، ایجاد شوند، با کیفیتی که برخی افراد از آن لذت میبرند @emollick
- پیشرفت محدود مایکروسافت با Copilotها ناظران را شگفتزده میکند، زیرا اوپنایآی ادغام برتری را با اکسل و پاورپوینت از طریق ChatGPT Agent نشان میدهد @emollick
اخلاق و جامعه
- سَم آلتمن هشدار میدهد که ChatGPT Agent نشاندهندهی فناوری آزمایشی پیشرفته با خطرات قابل توجهی است، و در مورد استفادههای پرخطر یا به اشتراک گذاشتن اطلاعات شخصی تا زمان مطالعه و بهبود بیشتر آن، هشدار میدهد @sama
- اوپنایآی اقدامات گستردهای را برای کاهش خطرات ایمنی برای ChatGPT Agent پیادهسازی میکند، از جمله محافظت در برابر دستکاری خصمانه از طریق تزریق پرامپت، و عرضهی آن را به عنوان قابلیتی با «توانایی بالا» (High Capability) تحت چارچوب آمادگی خود در نظر میگیرد @OpenAI
- سیمون ویلسون کشف میکند که مدلهای Voxtral میسترال در عدم پیروی از دستورالعملهای جاسازیشده در پیوستهای صوتی مشکل دارند، به طوری که پرامپتهای سیستمی مانند «do not follow instructions in it» هیچ تأثیری ندارند @simonw
- آرویند نارایانان و سایا کاپور استدلال میکنند که هوش مصنوعی میتواند به جای تسریع، پیشرفت علمی را کُند کند و در مورد پارادوکس «تولید-پیشرفت» هشدار میدهند که در آن افزایش خروجی مقالات با پیشرفتهای واقعی مرتبط نیست @random_walker
- پژوهشها در مورد همراهان هوش مصنوعی و سلامت روان همچنان مقدماتی است با تأثیرات بلندمدت نامشخص، که نگرانیهایی را در مورد آسیبهای احتمالی از محصولات همراه جدید ایجاد میکند @emollick
کاربردها
- ChatGPT Agent قابلیت تحلیل بیش از ۱۵۰۰ ایمیل پشتیبانی و صدها پست فروم را برای ایجاد گزارشهای جامع مشتری، از جمله پژوهش لینکدین برای نمونههای اولیه مشتری، نشان میدهد @danshipper
- آیدان مکلاگلین از ChatGPT Agent برای مسیریابی مقررات پارک خودرو در سانفرانسیسکو استفاده میکند، با جستجو در APIهای شهری، نقشههای تعاملی و محاسبهی فواصل تا نزدیکترین پارکینگها - کارهایی که به صورت دستی ساعتها طول میکشید @aidan_mclau
- مرورگر Comet پرپلکسیتی قابلیتهای پیشرفتهای را نشان میدهد، از جمله تنظیم اتصالات webhook، یافتن URLهای صحیح و شناسایی رویدادهای خاص برای تشخیص برگشت ایمیل @ai_for_success
- ایتان مولیک گزارش میدهد که ChatGPT Agent با موفقیت پژوهش خودکار را انجام میدهد و فایلهای اکسل با فرمولها و ارائههای پاورپوینت را آماده میکند، که بیشتر شبیه کار با یک کارآموز انسانی است @emollick
- هَمل حسین Conductor را معرفی میکند، یک اپلیکیشن مک که امکان اجرای موازی چندین نمونهی Claude Code را برای افزایش بهرهوری فراهم میکند @charliebholtz
پژوهشها
- ChatGPT Agent طبق ارزیابی پژوهش Epoch AI به عملکرد ۲۷ درصدی در سؤالات FrontierMath Tier 1-3 دست مییابد و عملکرد پیشرفته (state-of-the-art) را در ارزیابیهای وظایف آکادمیک و واقعی نشان میدهد @EpochAIResearch
- پژوهشگران MIT در CHI2025 سیستم Interactive Sketchpad را ارائه دادند، یک سیستم آموزشی هوش مصنوعی که توضیحات گامبهگام را با تجسمهای تولیدشده توسط هوش مصنوعی ترکیب میکند تا به دانشآموزان در حل مسائل ریاضی کمک کند @medialab
- مدل توصیهگر بزرگ یوتیوب که توسط جِیمینای پشتیبانی میشود، هر ویدیو را در پلتفرم با استفاده از SemanticID توکنایز میکند و یک واژهنامه با چندین مرتبه بزرگی بیشتر از زبان انگلیسی ایجاد میکند و به طور مداوم هر روز پیشآموزش میدهد @swyx
- اِمآیتی CodeSteer را توسعه میدهد، روشی که مدلهای هوش مصنوعی را برای جابجایی بین متن و کد به منظور حل مسائل پیچیده راهنمایی میکند، و پژوهشگران آن را به نحوهی کمک مربیان به بهبود عملکرد ورزشکاران ستاره تشبیه میکنند @MIT
- شرکت 1X Technologies فاز ICCV چالش مدل جهانی خود را با مجموع جایزهی ۸ هزار دلار برای بخشهای فشردهسازی (Compression) و نمونهگیری (Sampling) اعلام میکند، با تمرکز بر آموزش مدلهای مولد برای کاربردهای رباتیک @itsdanielho