اخبار هوش مصنوعی در 2025-06-04

مدل‌های جدید هوش مصنوعی

Meta از عینک‌های Aria Gen 2 رونمایی می‌کند که نشان‌دهنده‌ی یک جهش قابل توجه در فناوری پوشیدنی با ویژگی‌های پیشرفته برای درک ماشینی، هوش مصنوعی زمینه‌ای و پژوهش‌های رباتیک است @AIatMeta
NVIDIA مدل بینایی 8B Llama-Nemotron-Nano-VL-8B-V1 را منتشر کرد که اسناد متراکم، نمودارها و فریم‌های ویدئویی را می‌خواند و با ادغام سرتاسری چیدمان و OCR، در OCRBench V2 (انگلیسی) رتبه‌ی ۱ را کسب کرده است @jandotai
Luma Labs ابزار Modify Video را معرفی می‌کند که به کاربران امکان می‌دهد هر ویدئویی را با کنترل در حد کارگردان بر سبک، شخصیت و صحنه‌آرایی بازآفرینی کنند @LumaLabsAI
گوگل به دلیل تقاضای بالای استفاده، محدودیت‌های کوئری Gemini 2.5 Pro را برای اعضای طرح Pro از ۵۰ به ۱۰۰ در روز افزایش داد @joshwoodward
Anthropic قابلیت Claude Code را برای کاربران طرح Pro در دسترس قرار می‌دهد که برای دوره‌های کوتاه‌تر کدنویسی در پایگاه‌های کد کوچک طراحی شده است @_catwu
OpenAI ابزار Codex را با دسترسی به اینترنت برای کاربران ChatGPT Plus منتشر می‌کند، اگرچه به دلیل خطرات امنیتی به طور پیش‌فرض غیرفعال است @sama
OpenAI قابلیت حافظه‌ی سبک‌وزن را به نسخه‌ی رایگان ChatGPT اضافه می‌کند @sama
Cursor نسخه‌ی Cursor 1.0 را با قابلیت‌هایی برای بازبینی کد، به خاطر سپردن اشتباهات و کار روی ده‌ها وظیفه در پس‌زمینه منتشر کرد @cursor_ai

تحلیل صنعت

Reddit از Anthropic به دلیل استفاده‌ی ادعایی از داده‌هایشان برای آموزش Claude بدون مجوز شکایت می‌کند، در حالی که گوگل سالانه ۶۰ میلیون دلار به Reddit می‌پردازد و OpenAI نیز ظاهراً ۷۰ میلیون دلار برای دسترسی به داده‌های آموزشی پرداخت می‌کند @AndrewCurran_
OpenAI گزارش می‌دهد که بیش از ۳ میلیون کاربر تجاری پولی دارد که از ۲ میلیون در ماه فوریه افزایش یافته و نشان‌دهنده‌ی رشد قابل توجهی در پذیرش سازمانی است @AndrewCurran_
Vercel از درآمد سالانه‌ی ۲۰۰ میلیون دلار فراتر رفته است، زیرا مشتریانی مانند OpenAI، Runway و Granola به سوی خدمات توسعه‌ی وب و میزبانی آن روی آورده‌اند @nmasc_
آرویند نارایانان در برابر استعاره‌ی «زمستان هوش مصنوعی» استدلال می‌کند و اشاره دارد که مدل‌های بنیادین اقتصاد واحد مطلوبی دارند و تحقق ارزش هوش مصنوعی به دلیل نیازهای یکپارچه‌سازی، منحنی‌های یادگیری کاربر و تغییرات سازمانی، دهه‌ها طول خواهد کشید @random_walker
مهندس استقرار میدانی (FDE) به عنوان داغ‌ترین شغل در سیلیکون ولی ظاهر شده است، به طوری که تنها OpenAI بیست و دو موقعیت شغلی باز برای این نقش دارد @joeschmidtiv
Cohere با Second Front همکاری می‌کند تا راه‌حل‌های امن هوش مصنوعی را از طریق پلتفرم Game Warden به سازمان‌های دولتی و دفاعی ارائه دهد @cohere

اخلاق و جامعه

موسسه‌ی AI Now گزارش ۲۰۲۵ خود را منتشر می‌کند که نشان می‌دهد چگونه قدرت هوش مصنوعی بدون پاسخگویی در حال بازشکل‌دهی جامعه است و استدلال می‌کند که تمرکز باید بر این باشد که آیا قدرت بدون پاسخگویی شرکت‌های فناوری برای جامعه خوب است یا خیر، به جای ارزیابی سیستم‌های هوش مصنوعی فردی @AINowInstitute
پژوهش‌ها نشان می‌دهد که LLMهای پیشرفته‌ای مانند Gemini و Claude می‌توانند زمانی که در حال ارزیابی هستند را تشخیص دهند و توانایی قابل توجهی در شناسایی سناریوهای ارزیابی نزدیک به عملکرد پایه انسانی از خود نشان می‌دهند @MariusHobbhahn
سایمون ویلیسون در مورد خطرات امنیتی با دسترسی اینترنتی Codex هشدار می‌دهد و اشاره می‌کند که فهرست مجاز پیش‌فرض شامل ۷۱ دامنه‌ی بسته‌بندی رایج است که می‌توانند میزبان بردارهای نشت اطلاعات باشند @simonw
یونسکو اصول اخلاقی حاکم بر فناوری‌های عصبی را نهایی کرد که شامل دستگاه‌های کاشتنی و فناوری‌های غیرتهاجمی برای پزشکی، سرگرمی و آموزش می‌شود @medialab

کاربردها

OpenAI اتصال‌دهنده‌های از پیش ساخته شده و سفارشی را برای ChatGPT معرفی می‌کند که امکان اتصال به منابع داخلی مانند Outlook، Teams، Google Drive، Gmail و Linear را با حفظ مجوزهای سطح کاربر فراهم می‌کند @OpenAI
OpenAI حالت ضبط را برای کاربران Team در macOS منتشر می‌کند که ChatGPT را قادر می‌سازد تا جلسات را رونویسی کند، نکات کلیدی را استخراج کند و پیگیری‌ها یا کدی ایجاد کند @OpenAI
Figma سرور Dev Mode MCP را در نسخه‌ی بتا منتشر می‌کند که امکان دسترسی مستقیم به داده‌های طراحی را در گردش‌کارهای کدنویسی مبتنی بر عامل از طریق VS Code، Cursor، Windsurf و Claude Code فراهم می‌کند @figma
مایکروسافت Copilot ویژگی‌های خرید را با تاریخچه‌ی قیمت، هشدارهای تخفیف و توصیه‌های شخصی‌سازی شده با قابلیت‌های پرداخت بومی راه‌اندازی می‌کند @mustafasuleyman
پژوهشگران MIT SketchAgent را توسعه می‌دهند، یک مدل زبانی چندوجهی که نقاشی‌های انتزاعی را از پرامپت‌های زبان طبیعی در چند ثانیه و بدون آموزش بر روی داده‌های اسکیس ایجاد می‌کند @MIT_CSAIL
Monzo حفاظت از کلاهبرداری بلادرنگ را با تشخیص تماس‌های تلفنی در حال انجام و هشدار به کاربران در مورد کلاهبرداری‌های احتمالی در طول استفاده از اپلیکیشن بانکی، پیاده‌سازی می‌کند @sammcallister

پژوهش‌ها

آزمایشگاه‌های Sakana AI، ماشین داروین گودل (DGM) را معرفی می‌کنند، یک سیستم خودبهبود‌دهنده که به طور تکراری کد خود را اصلاح و تغییرات را با استفاده از معیارهای کدنویسی اعتبارسنجی می‌کند و آرشیوی از عامل‌های کدنویسی تولید شده را نگهداری می‌کند @SakanaAILabs
پژوهش‌ها نشان می‌دهد که یادگیری تقویتی از پاداش‌های قابل تأیید (RLVR) حتی با پاداش‌های تصادفی، عملکرد Qwen-2.5 را در مسائل ریاضی با افزایش فرکانس تولید کد از ۶۵٪ به بیش از ۹۰٪، حتی بدون اجرای کد، همچنان تقویت می‌کند @cwolferesearch
پژوهش هوش مصنوعی برکلی روش «Angles Don't Lie» را معرفی می‌کند که از زوایای بین جاسازی‌های توکن برای هدایت نمونه‌گیری داده‌ها در تنظیم دقیق RL استفاده می‌کند و به ۲.۵ برابر آموزش سریع‌تر و ۲ برابر نتایج کارآمدتر از نظر داده دست می‌یابد @Chenfeng_X
پژوهش Google DeepMind نشان می‌دهد که عامل‌ها مدل‌های جهانی هستند و دریافته است که دستیابی به عامل‌های در سطح انسانی ممکن است به قابلیت‌های مدل جهانی نیاز داشته باشد نه میان‌برهای بدون مدل @jonathanrichens
Hugging Face مدل رباتیک SmolVLA را منتشر می‌کند که می‌تواند روی مک‌بوک با RTX 2050 (4GB) اجرا شود، تنها با ۳۱ دمو تنظیم دقیق شده و با خطوط مبنای تک‌وظیفه‌ای مطابقت دارد، و «Async inference» را برای افزایش ۳۰ درصدی توان عملیاتی ربات معرفی می‌کند @XingdongZ
پژوهش استنفورد در مورد DexMachina نشان می‌دهد که یادگیری دستکاری ماهرانه برای هر دست ربات از یک نمایش انسانی واحد با استفاده از الگوریتم‌های RL برای سیاست‌های بلندمدت و دو دستی امکان‌پذیر است @ZhaoMandi
Voxel51 قابلیت برچسب‌گذاری خودکار تأیید شده (Verified Auto Labeling) را برای بینایی کامپیوتر معرفی می‌کند که تا ۹۵٪ عملکرد در سطح انسانی را به دست می‌آورد، در حالی که هزینه‌های برچسب‌گذاری را تا ۱۰۰,۰۰۰ برابر و زمان را تا ۵,۰۰۰ برابر کاهش می‌دهد @Voxel51