اخبار هوش مصنوعی در 2025-06-12
مدلهای جدید هوش مصنوعی
- متا V-JEPA 2، مدلی جهانی جدید با عملکردی بینظیر در درک و پیشبینی بصری، را معرفی میکند که امکان zero-shot planning را در رباتها برای محیطهای ناآشنا فراهم میسازد @AIatMeta
- انویدیا مدل بنیادی رباتیک GR00T N1.5-3B را با یک مجوز تجاریِ آزاد، منبع باز میکند؛ این مدل اکنون در Hugging Face همراه با آموزشهای تنظیم دقیق برای بازوی LeRobot SO-101 در دسترس است @reach_vb
- StepFun مدل Step-Omni را منتشر میکند؛ این مدل یک مدل زبان صوتی بزرگ مبتنی بر LLM ۱۳۰ میلیاردی است که با آموزش چندمرحلهای و پشتیبانی چندزبانه، شامل چینی، انگلیسی و ژاپنی، ارائه شده است @Xianbao_QIAN
تحلیل صنعت
- اندرو انجی نوع جدیدی از مهندسان کاربردی هوش مصنوعی مولد را شناسایی میکند که میتوانند با استفاده از بلوکهای سازندهی هوش مصنوعی و ابزارهای کدنویسی با کمک هوش مصنوعی، برنامههای کاربردی قدرتمند را سریعتر بسازند؛ مهارتهای این افراد به شدت مورد تقاضای کسبوکارها قرار گرفته است @AndrewYNg
- تیمهای مهندسی در شرکتهای بزرگ اکنون قبل از انتشار، طراحیهای API خود را در برابر LLMها آزمایش میکنند؛ آنها ارزیابیهایی را انجام میدهند تا ببینند کدام ساختار API برای کار با مدلها آسانتر است و در صورت مشکل مدلها، آنها را دوباره طراحی میکنند @alexalbert__
- اوپنایآی و متل از همکاری برای تولید اسباببازیهای مبتنی بر هوش مصنوعی خبر میدهند که تا کریسمس عرضه خواهند شد؛ متل همچنین OpenAI Enterprise را در سطح شرکت خود به کار خواهد گرفت @AndrewCurran_
- پژوهشی ارزش سالانهی کدنویسی با کمک هوش مصنوعی در ایالات متحده را بین ۹.۶ تا ۱۴.۴ میلیارد دلار تخمین میزند که با تخمینهای بهرهوری بالاتر از آزمایشهای کنترلشدهی تصادفی، به طور بالقوه میتواند به ۶۴ تا ۹۶ میلیارد دلار افزایش یابد @johannes_wachs
- اتان مولیک این پرسش را مطرح میکند که آیا تازهواردان به حوزهی هوش مصنوعی هنوز هم میتوانند به بهترین عملکرد روز دست یابند، با اشاره به اینکه xAI با سرمایهگذاری هنگفت در محاسبات و استخدام به این هدف دست یافته است، اما با این پرسش که آیا فهرست رقبا اکنون ثابت شده است @emollick
- Hugging Face پشتیبانی از TensorFlow و Flax را در کتابخانهی ترنسفورمرز منسوخ میکند تا کاملاً بر PyTorch تمرکز کند، با هدف حذف پیچیدگی و ایجاد ابزاری سادهتر @LysandreJik
- سرویس Hugging Face Inference Endpoints از مرز ۳۰۰۰ مشتری عبور میکند و برای جشن گرفتن، قیمت A100 را به ۲.۵ دلار در ساعت کاهش میدهد @ClementDelangue
- Featherless به عنوان ارائهدهندهی رسمی Inference در Hugging Face تبدیل میشود و بیش از ۶۷۰۰ LLM را برای استقرار و ارزیابی فوری در دسترس قرار میدهد @FeatherlessAI
اخلاق و جامعه
- سایمون ویلیسون در مورد آسیبپذیریهای تزریق پرامپت در Microsoft 365 Copilot (که اکنون وصله شدهاند) هشدار میدهد و «سهگانهی کشنده»ی ترکیب دسترسی به دادههای خصوصی با توکنهای غیرقابل اعتماد و بردارهای استخراج داده را برجسته میکند @simonw
- سایمون ویلیسون از مرکز دادهی xAI که ۳۵ توربین گاز متان را بدون مجوزهای هوا (با ادعای وضعیت «موقت») و بدون سیستمهای کنترل آلایندگی کاهش کاتالیزوری به کار میگیرد، به عنوان بزرگترین رسوایی در انرژی هوش مصنوعی انتقاد میکند @simonw
- گرگلی اوروس داستان وایرالشده در مورد «۷۰۰ توسعهدهنده که تظاهر میکنند هوش مصنوعی هستند» را رد میکند و توضیح میدهد که Builder.ai در واقع یک پلتفرم هوش مصنوعی به نام Natasha ساخته است که در آن توسعهدهندگان از ابزارهای هوش مصنوعی برای پروژههای مشتریان استفاده میکنند @GergelyOrosz
- محققان استنفورد پژوهش جامعی را در مورد آنچه کارگران آمریکایی میخواهند عوامل هوش مصنوعی خودکار کنند یا تقویت کنند، منتشر میکنند؛ این پژوهش عدم تطابقهایی را بین خواستههای کارگران و قابلیتهای فعلی هوش مصنوعی در میان ۸۴۴ وظیفه یافته است @EchoShao8899
کاربردها
- گوگل دیپمایند Weather Lab را راهاندازی میکند؛ این یک پلتفرم تعاملی با مدل آب و هوای هوش مصنوعی آزمایشی است که میتواند مسیر، شدت، اندازه و ساختار طوفانها را پیشبینی کند و با مشارکت مرکز ملی طوفان NOAA توسعه یافته است @GoogleDeepMind
- مایکروسافت اعلام میکند که Copilot Vision در ویندوز اکنون به صورت عمومی و رایگان در دسترس است و امکان کمک بیدرنگ را هنگام اشتراکگذاری صفحه و مکالمات فراهم میکند @mustafasuleyman
- اوپنایآی قابلیت Projects در ChatGPT را با پشتیبانی عمیق پژوهشی، پشتیبانی از حالت صوتی، حافظهی بهبودیافته برای ارجاع به چتهای گذشته و قابلیتهای آپلود فایل از موبایل، بهروزرسانی میکند @OpenAI
- پرپلکسیتی از قابلیت آتی Perplexity Tasks و یکپارچهسازی با مرورگر Comet خبر میدهد و مرورگر را به عنوان «سیستم عامل زندگی شما» معرفی میکند @AravSrinivas
- برایان لاوین استفاده از Figma MCP با Claude Code را برای ساخت یک کامپوننت با پیچیدگی متوسط از لینک فریم فیگما، در حدود ۲ دقیقه با ۸۵٪ دقت به نمایش میگذارد @brian_lovin
- Salesforce معیار جدیدی برای وظایف تجاری واقعبینانه ایجاد میکند تا عملکرد هوش مصنوعی را در سناریوهای عملی بهتر ارزیابی کند @emollick
- همکاری Stanford HAI با دادستان شهر سانفرانسیسکو، پتانسیل هوش مصنوعی را در مدیریت دولتی برای پردازش اسناد حقوقی و وظایف اداری نشان میدهد @StanfordHAI
پژوهشها
- اتان مولیک o3-pro را روی بنچمارک شیدر خود آزمایش میکند و گزارش میدهد که تاکنون بهترین عملکرد را در ایجاد شیدرهای طوفان اقیانوسی از نظر بصری جذاب داشته است، اگرچه ۲۱ دقیقه برای تفکر و ۱۹ دقیقه دیگر برای رفع یک خطای کوچک زمان برد @emollick
- جف دین مشارکتهای منبع باز گوگل را برجسته میکند؛ با ۹۹۹ مدل منتشر شده در Hugging Face، در مقایسه با ۳۸۷ مدل برای مایکروسافت، ۳۳ مدل برای اوپنایآی و ۰ مدل برای آنتروپیک @JeffDean
- محققان MIT روشی کارآمد از نظر محاسباتی برای طراحی شبیهسازیهای واقعبینانه از اشیاء الاستیک مانند شخصیتهای جهنده برای فیلمهای انیمیشن و بازیهای ویدیویی توسعه میدهند @MIT_CSAIL
- محققان MIT با موفقیت مدلسازی میکنند که چگونه افراد از استراتژیهای مختلف تصمیمگیری برای حل وظایف پیچیده استفاده میکنند و بینشهایی برای ساخت ماشینهایی که بیشتر شبیه انسانها فکر میکنند، ارائه میدهند @MIT
- Windsurf از بهبودهایی در یکپارچهسازی o3 در Cascade خبر میدهد که باعث میشود به طور قابل توجهی بهتر و سریعتر کار کند و هزینه را برای هر دو حالت استدلال متوسط و بالا به ۱x اعتبار کاهش میدهد @windsurf_ai
- انویدیا پلتفرم Blackwell را با فرمت NVFP4 پیشگامانه معرفی میکند که عملکرد و دقت بالای استنتاج را امکانپذیر میسازد و قادر به سرویسدهی به مدلهای محبوبی مانند DeepSeek-R1، Llama 3.1 405B و Llama 3.3 70B است @nvidia