اخبار هوش مصنوعی در 2025-06-12

مدل‌های جدید هوش مصنوعی

متا V-JEPA 2، مدلی جهانی جدید با عملکردی بی‌نظیر در درک و پیش‌بینی بصری، را معرفی می‌کند که امکان zero-shot planning را در ربات‌ها برای محیط‌های ناآشنا فراهم می‌سازد @AIatMeta
ان‌ویدیا مدل بنیادی رباتیک GR00T N1.5-3B را با یک مجوز تجاریِ آزاد، منبع باز می‌کند؛ این مدل اکنون در Hugging Face همراه با آموزش‌های تنظیم دقیق برای بازوی LeRobot SO-101 در دسترس است @reach_vb
StepFun مدل Step-Omni را منتشر می‌کند؛ این مدل یک مدل زبان صوتی بزرگ مبتنی بر LLM ۱۳۰ میلیاردی است که با آموزش چندمرحله‌ای و پشتیبانی چندزبانه، شامل چینی، انگلیسی و ژاپنی، ارائه شده است @Xianbao_QIAN

تحلیل صنعت

اندرو ان‌جی نوع جدیدی از مهندسان کاربردی هوش مصنوعی مولد را شناسایی می‌کند که می‌توانند با استفاده از بلوک‌های سازنده‌ی هوش مصنوعی و ابزارهای کدنویسی با کمک هوش مصنوعی، برنامه‌های کاربردی قدرتمند را سریع‌تر بسازند؛ مهارت‌های این افراد به شدت مورد تقاضای کسب‌وکارها قرار گرفته است @AndrewYNg
تیم‌های مهندسی در شرکت‌های بزرگ اکنون قبل از انتشار، طراحی‌های API خود را در برابر LLMها آزمایش می‌کنند؛ آن‌ها ارزیابی‌هایی را انجام می‌دهند تا ببینند کدام ساختار API برای کار با مدل‌ها آسان‌تر است و در صورت مشکل مدل‌ها، آن‌ها را دوباره طراحی می‌کنند @alexalbert__
اوپن‌ای‌آی و متل از همکاری برای تولید اسباب‌بازی‌های مبتنی بر هوش مصنوعی خبر می‌دهند که تا کریسمس عرضه خواهند شد؛ متل همچنین OpenAI Enterprise را در سطح شرکت خود به کار خواهد گرفت @AndrewCurran_
پژوهشی ارزش سالانه‌ی کدنویسی با کمک هوش مصنوعی در ایالات متحده را بین ۹.۶ تا ۱۴.۴ میلیارد دلار تخمین می‌زند که با تخمین‌های بهره‌وری بالاتر از آزمایش‌های کنترل‌شده‌ی تصادفی، به طور بالقوه می‌تواند به ۶۴ تا ۹۶ میلیارد دلار افزایش یابد @johannes_wachs
اتان مولیک این پرسش را مطرح می‌کند که آیا تازه‌واردان به حوزه‌ی هوش مصنوعی هنوز هم می‌توانند به بهترین عملکرد روز دست یابند، با اشاره به اینکه xAI با سرمایه‌گذاری هنگفت در محاسبات و استخدام به این هدف دست یافته است، اما با این پرسش که آیا فهرست رقبا اکنون ثابت شده است @emollick
Hugging Face پشتیبانی از TensorFlow و Flax را در کتابخانه‌ی ترنسفورمرز منسوخ می‌کند تا کاملاً بر PyTorch تمرکز کند، با هدف حذف پیچیدگی و ایجاد ابزاری ساده‌تر @LysandreJik
سرویس Hugging Face Inference Endpoints از مرز ۳۰۰۰ مشتری عبور می‌کند و برای جشن گرفتن، قیمت A100 را به ۲.۵ دلار در ساعت کاهش می‌دهد @ClementDelangue
Featherless به عنوان ارائه‌دهنده‌ی رسمی Inference در Hugging Face تبدیل می‌شود و بیش از ۶۷۰۰ LLM را برای استقرار و ارزیابی فوری در دسترس قرار می‌دهد @FeatherlessAI

اخلاق و جامعه

سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت در Microsoft 365 Copilot (که اکنون وصله شده‌اند) هشدار می‌دهد و «سه‌گانه‌ی کشنده»‌ی ترکیب دسترسی به داده‌های خصوصی با توکن‌های غیرقابل اعتماد و بردارهای استخراج داده را برجسته می‌کند @simonw
سایمون ویلیسون از مرکز داده‌ی xAI که ۳۵ توربین گاز متان را بدون مجوزهای هوا (با ادعای وضعیت «موقت») و بدون سیستم‌های کنترل آلایندگی کاهش کاتالیزوری به کار می‌گیرد، به عنوان بزرگ‌ترین رسوایی در انرژی هوش مصنوعی انتقاد می‌کند @simonw
گرگلی اوروس داستان وایرال‌شده در مورد «۷۰۰ توسعه‌دهنده که تظاهر می‌کنند هوش مصنوعی هستند» را رد می‌کند و توضیح می‌دهد که Builder.ai در واقع یک پلتفرم هوش مصنوعی به نام Natasha ساخته است که در آن توسعه‌دهندگان از ابزارهای هوش مصنوعی برای پروژه‌های مشتریان استفاده می‌کنند @GergelyOrosz
محققان استنفورد پژوهش جامعی را در مورد آنچه کارگران آمریکایی می‌خواهند عوامل هوش مصنوعی خودکار کنند یا تقویت کنند، منتشر می‌کنند؛ این پژوهش عدم تطابق‌هایی را بین خواسته‌های کارگران و قابلیت‌های فعلی هوش مصنوعی در میان ۸۴۴ وظیفه یافته است @EchoShao8899

کاربردها

گوگل دیپ‌مایند Weather Lab را راه‌اندازی می‌کند؛ این یک پلتفرم تعاملی با مدل آب و هوای هوش مصنوعی آزمایشی است که می‌تواند مسیر، شدت، اندازه و ساختار طوفان‌ها را پیش‌بینی کند و با مشارکت مرکز ملی طوفان NOAA توسعه یافته است @GoogleDeepMind
مایکروسافت اعلام می‌کند که Copilot Vision در ویندوز اکنون به صورت عمومی و رایگان در دسترس است و امکان کمک بی‌درنگ را هنگام اشتراک‌گذاری صفحه و مکالمات فراهم می‌کند @mustafasuleyman
اوپن‌ای‌آی قابلیت Projects در ChatGPT را با پشتیبانی عمیق پژوهشی، پشتیبانی از حالت صوتی، حافظه‌ی بهبودیافته برای ارجاع به چت‌های گذشته و قابلیت‌های آپلود فایل از موبایل، به‌روزرسانی می‌کند @OpenAI
پرپلکسیتی از قابلیت آتی Perplexity Tasks و یکپارچه‌سازی با مرورگر Comet خبر می‌دهد و مرورگر را به عنوان «سیستم عامل زندگی شما» معرفی می‌کند @AravSrinivas
برایان لاوین استفاده از Figma MCP با Claude Code را برای ساخت یک کامپوننت با پیچیدگی متوسط از لینک فریم فیگما، در حدود ۲ دقیقه با ۸۵٪ دقت به نمایش می‌گذارد @brian_lovin
Salesforce معیار جدیدی برای وظایف تجاری واقع‌بینانه ایجاد می‌کند تا عملکرد هوش مصنوعی را در سناریوهای عملی بهتر ارزیابی کند @emollick
همکاری Stanford HAI با دادستان شهر سان‌فرانسیسکو، پتانسیل هوش مصنوعی را در مدیریت دولتی برای پردازش اسناد حقوقی و وظایف اداری نشان می‌دهد @StanfordHAI

پژوهش‌ها

اتان مولیک o3-pro را روی بنچمارک شیدر خود آزمایش می‌کند و گزارش می‌دهد که تاکنون بهترین عملکرد را در ایجاد شیدرهای طوفان اقیانوسی از نظر بصری جذاب داشته است، اگرچه ۲۱ دقیقه برای تفکر و ۱۹ دقیقه دیگر برای رفع یک خطای کوچک زمان برد @emollick
جف دین مشارکت‌های منبع باز گوگل را برجسته می‌کند؛ با ۹۹۹ مدل منتشر شده در Hugging Face، در مقایسه با ۳۸۷ مدل برای مایکروسافت، ۳۳ مدل برای اوپن‌ای‌آی و ۰ مدل برای آنتروپیک @JeffDean
محققان MIT روشی کارآمد از نظر محاسباتی برای طراحی شبیه‌سازی‌های واقع‌بینانه از اشیاء الاستیک مانند شخصیت‌های جهنده برای فیلم‌های انیمیشن و بازی‌های ویدیویی توسعه می‌دهند @MIT_CSAIL
محققان MIT با موفقیت مدل‌سازی می‌کنند که چگونه افراد از استراتژی‌های مختلف تصمیم‌گیری برای حل وظایف پیچیده استفاده می‌کنند و بینش‌هایی برای ساخت ماشین‌هایی که بیشتر شبیه انسان‌ها فکر می‌کنند، ارائه می‌دهند @MIT
Windsurf از بهبودهایی در یکپارچه‌سازی o3 در Cascade خبر می‌دهد که باعث می‌شود به طور قابل توجهی بهتر و سریع‌تر کار کند و هزینه را برای هر دو حالت استدلال متوسط و بالا به ۱x اعتبار کاهش می‌دهد @windsurf_ai
ان‌ویدیا پلتفرم Blackwell را با فرمت NVFP4 پیشگامانه معرفی می‌کند که عملکرد و دقت بالای استنتاج را امکان‌پذیر می‌سازد و قادر به سرویس‌دهی به مدل‌های محبوبی مانند DeepSeek-R1، Llama 3.1 405B و Llama 3.3 70B است @nvidia