اخبار هوش مصنوعی در 2025-06-04
مدلهای جدید هوش مصنوعی
- Meta از عینکهای Aria Gen 2 رونمایی میکند که نشاندهندهی یک جهش قابل توجه در فناوری پوشیدنی با ویژگیهای پیشرفته برای درک ماشینی، هوش مصنوعی زمینهای و پژوهشهای رباتیک است @AIatMeta
- NVIDIA مدل بینایی 8B Llama-Nemotron-Nano-VL-8B-V1 را منتشر کرد که اسناد متراکم، نمودارها و فریمهای ویدئویی را میخواند و با ادغام سرتاسری چیدمان و OCR، در OCRBench V2 (انگلیسی) رتبهی ۱ را کسب کرده است @jandotai
- Luma Labs ابزار Modify Video را معرفی میکند که به کاربران امکان میدهد هر ویدئویی را با کنترل در حد کارگردان بر سبک، شخصیت و صحنهآرایی بازآفرینی کنند @LumaLabsAI
- گوگل به دلیل تقاضای بالای استفاده، محدودیتهای کوئری Gemini 2.5 Pro را برای اعضای طرح Pro از ۵۰ به ۱۰۰ در روز افزایش داد @joshwoodward
- Anthropic قابلیت Claude Code را برای کاربران طرح Pro در دسترس قرار میدهد که برای دورههای کوتاهتر کدنویسی در پایگاههای کد کوچک طراحی شده است @_catwu
- OpenAI ابزار Codex را با دسترسی به اینترنت برای کاربران ChatGPT Plus منتشر میکند، اگرچه به دلیل خطرات امنیتی به طور پیشفرض غیرفعال است @sama
- OpenAI قابلیت حافظهی سبکوزن را به نسخهی رایگان ChatGPT اضافه میکند @sama
- Cursor نسخهی Cursor 1.0 را با قابلیتهایی برای بازبینی کد، به خاطر سپردن اشتباهات و کار روی دهها وظیفه در پسزمینه منتشر کرد @cursor_ai
تحلیل صنعت
- Reddit از Anthropic به دلیل استفادهی ادعایی از دادههایشان برای آموزش Claude بدون مجوز شکایت میکند، در حالی که گوگل سالانه ۶۰ میلیون دلار به Reddit میپردازد و OpenAI نیز ظاهراً ۷۰ میلیون دلار برای دسترسی به دادههای آموزشی پرداخت میکند @AndrewCurran_
- OpenAI گزارش میدهد که بیش از ۳ میلیون کاربر تجاری پولی دارد که از ۲ میلیون در ماه فوریه افزایش یافته و نشاندهندهی رشد قابل توجهی در پذیرش سازمانی است @AndrewCurran_
- Vercel از درآمد سالانهی ۲۰۰ میلیون دلار فراتر رفته است، زیرا مشتریانی مانند OpenAI، Runway و Granola به سوی خدمات توسعهی وب و میزبانی آن روی آوردهاند @nmasc_
- آرویند نارایانان در برابر استعارهی «زمستان هوش مصنوعی» استدلال میکند و اشاره دارد که مدلهای بنیادین اقتصاد واحد مطلوبی دارند و تحقق ارزش هوش مصنوعی به دلیل نیازهای یکپارچهسازی، منحنیهای یادگیری کاربر و تغییرات سازمانی، دههها طول خواهد کشید @random_walker
- مهندس استقرار میدانی (FDE) به عنوان داغترین شغل در سیلیکون ولی ظاهر شده است، به طوری که تنها OpenAI بیست و دو موقعیت شغلی باز برای این نقش دارد @joeschmidtiv
- Cohere با Second Front همکاری میکند تا راهحلهای امن هوش مصنوعی را از طریق پلتفرم Game Warden به سازمانهای دولتی و دفاعی ارائه دهد @cohere
اخلاق و جامعه
- موسسهی AI Now گزارش ۲۰۲۵ خود را منتشر میکند که نشان میدهد چگونه قدرت هوش مصنوعی بدون پاسخگویی در حال بازشکلدهی جامعه است و استدلال میکند که تمرکز باید بر این باشد که آیا قدرت بدون پاسخگویی شرکتهای فناوری برای جامعه خوب است یا خیر، به جای ارزیابی سیستمهای هوش مصنوعی فردی @AINowInstitute
- پژوهشها نشان میدهد که LLMهای پیشرفتهای مانند Gemini و Claude میتوانند زمانی که در حال ارزیابی هستند را تشخیص دهند و توانایی قابل توجهی در شناسایی سناریوهای ارزیابی نزدیک به عملکرد پایه انسانی از خود نشان میدهند @MariusHobbhahn
- سایمون ویلیسون در مورد خطرات امنیتی با دسترسی اینترنتی Codex هشدار میدهد و اشاره میکند که فهرست مجاز پیشفرض شامل ۷۱ دامنهی بستهبندی رایج است که میتوانند میزبان بردارهای نشت اطلاعات باشند @simonw
- یونسکو اصول اخلاقی حاکم بر فناوریهای عصبی را نهایی کرد که شامل دستگاههای کاشتنی و فناوریهای غیرتهاجمی برای پزشکی، سرگرمی و آموزش میشود @medialab
کاربردها
- OpenAI اتصالدهندههای از پیش ساخته شده و سفارشی را برای ChatGPT معرفی میکند که امکان اتصال به منابع داخلی مانند Outlook، Teams، Google Drive، Gmail و Linear را با حفظ مجوزهای سطح کاربر فراهم میکند @OpenAI
- OpenAI حالت ضبط را برای کاربران Team در macOS منتشر میکند که ChatGPT را قادر میسازد تا جلسات را رونویسی کند، نکات کلیدی را استخراج کند و پیگیریها یا کدی ایجاد کند @OpenAI
- Figma سرور Dev Mode MCP را در نسخهی بتا منتشر میکند که امکان دسترسی مستقیم به دادههای طراحی را در گردشکارهای کدنویسی مبتنی بر عامل از طریق VS Code، Cursor، Windsurf و Claude Code فراهم میکند @figma
- مایکروسافت Copilot ویژگیهای خرید را با تاریخچهی قیمت، هشدارهای تخفیف و توصیههای شخصیسازی شده با قابلیتهای پرداخت بومی راهاندازی میکند @mustafasuleyman
- پژوهشگران MIT SketchAgent را توسعه میدهند، یک مدل زبانی چندوجهی که نقاشیهای انتزاعی را از پرامپتهای زبان طبیعی در چند ثانیه و بدون آموزش بر روی دادههای اسکیس ایجاد میکند @MIT_CSAIL
- Monzo حفاظت از کلاهبرداری بلادرنگ را با تشخیص تماسهای تلفنی در حال انجام و هشدار به کاربران در مورد کلاهبرداریهای احتمالی در طول استفاده از اپلیکیشن بانکی، پیادهسازی میکند @sammcallister
پژوهشها
- آزمایشگاههای Sakana AI، ماشین داروین گودل (DGM) را معرفی میکنند، یک سیستم خودبهبوددهنده که به طور تکراری کد خود را اصلاح و تغییرات را با استفاده از معیارهای کدنویسی اعتبارسنجی میکند و آرشیوی از عاملهای کدنویسی تولید شده را نگهداری میکند @SakanaAILabs
- پژوهشها نشان میدهد که یادگیری تقویتی از پاداشهای قابل تأیید (RLVR) حتی با پاداشهای تصادفی، عملکرد Qwen-2.5 را در مسائل ریاضی با افزایش فرکانس تولید کد از ۶۵٪ به بیش از ۹۰٪، حتی بدون اجرای کد، همچنان تقویت میکند @cwolferesearch
- پژوهش هوش مصنوعی برکلی روش «Angles Don't Lie» را معرفی میکند که از زوایای بین جاسازیهای توکن برای هدایت نمونهگیری دادهها در تنظیم دقیق RL استفاده میکند و به ۲.۵ برابر آموزش سریعتر و ۲ برابر نتایج کارآمدتر از نظر داده دست مییابد @Chenfeng_X
- پژوهش Google DeepMind نشان میدهد که عاملها مدلهای جهانی هستند و دریافته است که دستیابی به عاملهای در سطح انسانی ممکن است به قابلیتهای مدل جهانی نیاز داشته باشد نه میانبرهای بدون مدل @jonathanrichens
- Hugging Face مدل رباتیک SmolVLA را منتشر میکند که میتواند روی مکبوک با RTX 2050 (4GB) اجرا شود، تنها با ۳۱ دمو تنظیم دقیق شده و با خطوط مبنای تکوظیفهای مطابقت دارد، و «Async inference» را برای افزایش ۳۰ درصدی توان عملیاتی ربات معرفی میکند @XingdongZ
- پژوهش استنفورد در مورد DexMachina نشان میدهد که یادگیری دستکاری ماهرانه برای هر دست ربات از یک نمایش انسانی واحد با استفاده از الگوریتمهای RL برای سیاستهای بلندمدت و دو دستی امکانپذیر است @ZhaoMandi
- Voxel51 قابلیت برچسبگذاری خودکار تأیید شده (Verified Auto Labeling) را برای بینایی کامپیوتر معرفی میکند که تا ۹۵٪ عملکرد در سطح انسانی را به دست میآورد، در حالی که هزینههای برچسبگذاری را تا ۱۰۰,۰۰۰ برابر و زمان را تا ۵,۰۰۰ برابر کاهش میدهد @Voxel51