اخبار هوش مصنوعی در 2025-06-04

مدل‌های جدید هوش مصنوعی

  • Meta از عینک‌های Aria Gen 2 رونمایی می‌کند که نشان‌دهنده‌ی یک جهش قابل توجه در فناوری پوشیدنی با ویژگی‌های پیشرفته برای درک ماشینی، هوش مصنوعی زمینه‌ای و پژوهش‌های رباتیک است @AIatMeta
  • NVIDIA مدل بینایی 8B Llama-Nemotron-Nano-VL-8B-V1 را منتشر کرد که اسناد متراکم، نمودارها و فریم‌های ویدئویی را می‌خواند و با ادغام سرتاسری چیدمان و OCR، در OCRBench V2 (انگلیسی) رتبه‌ی ۱ را کسب کرده است @jandotai
  • Luma Labs ابزار Modify Video را معرفی می‌کند که به کاربران امکان می‌دهد هر ویدئویی را با کنترل در حد کارگردان بر سبک، شخصیت و صحنه‌آرایی بازآفرینی کنند @LumaLabsAI
  • گوگل به دلیل تقاضای بالای استفاده، محدودیت‌های کوئری Gemini 2.5 Pro را برای اعضای طرح Pro از ۵۰ به ۱۰۰ در روز افزایش داد @joshwoodward
  • Anthropic قابلیت Claude Code را برای کاربران طرح Pro در دسترس قرار می‌دهد که برای دوره‌های کوتاه‌تر کدنویسی در پایگاه‌های کد کوچک طراحی شده است @_catwu
  • OpenAI ابزار Codex را با دسترسی به اینترنت برای کاربران ChatGPT Plus منتشر می‌کند، اگرچه به دلیل خطرات امنیتی به طور پیش‌فرض غیرفعال است @sama
  • OpenAI قابلیت حافظه‌ی سبک‌وزن را به نسخه‌ی رایگان ChatGPT اضافه می‌کند @sama
  • Cursor نسخه‌ی Cursor 1.0 را با قابلیت‌هایی برای بازبینی کد، به خاطر سپردن اشتباهات و کار روی ده‌ها وظیفه در پس‌زمینه منتشر کرد @cursor_ai

تحلیل صنعت

  • Reddit از Anthropic به دلیل استفاده‌ی ادعایی از داده‌هایشان برای آموزش Claude بدون مجوز شکایت می‌کند، در حالی که گوگل سالانه ۶۰ میلیون دلار به Reddit می‌پردازد و OpenAI نیز ظاهراً ۷۰ میلیون دلار برای دسترسی به داده‌های آموزشی پرداخت می‌کند @AndrewCurran_
  • OpenAI گزارش می‌دهد که بیش از ۳ میلیون کاربر تجاری پولی دارد که از ۲ میلیون در ماه فوریه افزایش یافته و نشان‌دهنده‌ی رشد قابل توجهی در پذیرش سازمانی است @AndrewCurran_
  • Vercel از درآمد سالانه‌ی ۲۰۰ میلیون دلار فراتر رفته است، زیرا مشتریانی مانند OpenAI، Runway و Granola به سوی خدمات توسعه‌ی وب و میزبانی آن روی آورده‌اند @nmasc_
  • آرویند نارایانان در برابر استعاره‌ی «زمستان هوش مصنوعی» استدلال می‌کند و اشاره دارد که مدل‌های بنیادین اقتصاد واحد مطلوبی دارند و تحقق ارزش هوش مصنوعی به دلیل نیازهای یکپارچه‌سازی، منحنی‌های یادگیری کاربر و تغییرات سازمانی، دهه‌ها طول خواهد کشید @random_walker
  • مهندس استقرار میدانی (FDE) به عنوان داغ‌ترین شغل در سیلیکون ولی ظاهر شده است، به طوری که تنها OpenAI بیست و دو موقعیت شغلی باز برای این نقش دارد @joeschmidtiv
  • Cohere با Second Front همکاری می‌کند تا راه‌حل‌های امن هوش مصنوعی را از طریق پلتفرم Game Warden به سازمان‌های دولتی و دفاعی ارائه دهد @cohere

اخلاق و جامعه

  • موسسه‌ی AI Now گزارش ۲۰۲۵ خود را منتشر می‌کند که نشان می‌دهد چگونه قدرت هوش مصنوعی بدون پاسخگویی در حال بازشکل‌دهی جامعه است و استدلال می‌کند که تمرکز باید بر این باشد که آیا قدرت بدون پاسخگویی شرکت‌های فناوری برای جامعه خوب است یا خیر، به جای ارزیابی سیستم‌های هوش مصنوعی فردی @AINowInstitute
  • پژوهش‌ها نشان می‌دهد که LLMهای پیشرفته‌ای مانند Gemini و Claude می‌توانند زمانی که در حال ارزیابی هستند را تشخیص دهند و توانایی قابل توجهی در شناسایی سناریوهای ارزیابی نزدیک به عملکرد پایه انسانی از خود نشان می‌دهند @MariusHobbhahn
  • سایمون ویلیسون در مورد خطرات امنیتی با دسترسی اینترنتی Codex هشدار می‌دهد و اشاره می‌کند که فهرست مجاز پیش‌فرض شامل ۷۱ دامنه‌ی بسته‌بندی رایج است که می‌توانند میزبان بردارهای نشت اطلاعات باشند @simonw
  • یونسکو اصول اخلاقی حاکم بر فناوری‌های عصبی را نهایی کرد که شامل دستگاه‌های کاشتنی و فناوری‌های غیرتهاجمی برای پزشکی، سرگرمی و آموزش می‌شود @medialab

کاربردها

  • OpenAI اتصال‌دهنده‌های از پیش ساخته شده و سفارشی را برای ChatGPT معرفی می‌کند که امکان اتصال به منابع داخلی مانند Outlook، Teams، Google Drive، Gmail و Linear را با حفظ مجوزهای سطح کاربر فراهم می‌کند @OpenAI
  • OpenAI حالت ضبط را برای کاربران Team در macOS منتشر می‌کند که ChatGPT را قادر می‌سازد تا جلسات را رونویسی کند، نکات کلیدی را استخراج کند و پیگیری‌ها یا کدی ایجاد کند @OpenAI
  • Figma سرور Dev Mode MCP را در نسخه‌ی بتا منتشر می‌کند که امکان دسترسی مستقیم به داده‌های طراحی را در گردش‌کارهای کدنویسی مبتنی بر عامل از طریق VS Code، Cursor، Windsurf و Claude Code فراهم می‌کند @figma
  • مایکروسافت Copilot ویژگی‌های خرید را با تاریخچه‌ی قیمت، هشدارهای تخفیف و توصیه‌های شخصی‌سازی شده با قابلیت‌های پرداخت بومی راه‌اندازی می‌کند @mustafasuleyman
  • پژوهشگران MIT SketchAgent را توسعه می‌دهند، یک مدل زبانی چندوجهی که نقاشی‌های انتزاعی را از پرامپت‌های زبان طبیعی در چند ثانیه و بدون آموزش بر روی داده‌های اسکیس ایجاد می‌کند @MIT_CSAIL
  • Monzo حفاظت از کلاهبرداری بلادرنگ را با تشخیص تماس‌های تلفنی در حال انجام و هشدار به کاربران در مورد کلاهبرداری‌های احتمالی در طول استفاده از اپلیکیشن بانکی، پیاده‌سازی می‌کند @sammcallister

پژوهش‌ها

  • آزمایشگاه‌های Sakana AI، ماشین داروین گودل (DGM) را معرفی می‌کنند، یک سیستم خودبهبود‌دهنده که به طور تکراری کد خود را اصلاح و تغییرات را با استفاده از معیارهای کدنویسی اعتبارسنجی می‌کند و آرشیوی از عامل‌های کدنویسی تولید شده را نگهداری می‌کند @SakanaAILabs
  • پژوهش‌ها نشان می‌دهد که یادگیری تقویتی از پاداش‌های قابل تأیید (RLVR) حتی با پاداش‌های تصادفی، عملکرد Qwen-2.5 را در مسائل ریاضی با افزایش فرکانس تولید کد از ۶۵٪ به بیش از ۹۰٪، حتی بدون اجرای کد، همچنان تقویت می‌کند @cwolferesearch
  • پژوهش هوش مصنوعی برکلی روش «Angles Don't Lie» را معرفی می‌کند که از زوایای بین جاسازی‌های توکن برای هدایت نمونه‌گیری داده‌ها در تنظیم دقیق RL استفاده می‌کند و به ۲.۵ برابر آموزش سریع‌تر و ۲ برابر نتایج کارآمدتر از نظر داده دست می‌یابد @Chenfeng_X
  • پژوهش Google DeepMind نشان می‌دهد که عامل‌ها مدل‌های جهانی هستند و دریافته است که دستیابی به عامل‌های در سطح انسانی ممکن است به قابلیت‌های مدل جهانی نیاز داشته باشد نه میان‌برهای بدون مدل @jonathanrichens
  • Hugging Face مدل رباتیک SmolVLA را منتشر می‌کند که می‌تواند روی مک‌بوک با RTX 2050 (4GB) اجرا شود، تنها با ۳۱ دمو تنظیم دقیق شده و با خطوط مبنای تک‌وظیفه‌ای مطابقت دارد، و «Async inference» را برای افزایش ۳۰ درصدی توان عملیاتی ربات معرفی می‌کند @XingdongZ
  • پژوهش استنفورد در مورد DexMachina نشان می‌دهد که یادگیری دستکاری ماهرانه برای هر دست ربات از یک نمایش انسانی واحد با استفاده از الگوریتم‌های RL برای سیاست‌های بلندمدت و دو دستی امکان‌پذیر است @ZhaoMandi
  • Voxel51 قابلیت برچسب‌گذاری خودکار تأیید شده (Verified Auto Labeling) را برای بینایی کامپیوتر معرفی می‌کند که تا ۹۵٪ عملکرد در سطح انسانی را به دست می‌آورد، در حالی که هزینه‌های برچسب‌گذاری را تا ۱۰۰,۰۰۰ برابر و زمان را تا ۵,۰۰۰ برابر کاهش می‌دهد @Voxel51