اخبار هوش مصنوعی در 2025-05-21

مدل‌های جدید هوش مصنوعی

‏Google، مدل جدید Gemini Diffusion را منتشر کرد که از diffusion برای مدل‌سازی زبان استفاده می‌کند و 10 تا 15 برابر سریع‌تر از مدل‌های autoregressive تولید می‌کند. @demishassabis
‏Google از Veo 3، جدیدترین مدل تولید ویدیو خود با قابلیت‌های تولید صدای بومی، فیزیک بهبودیافته و درک بهتر prompt رونمایی کرد. @sundarpichai
‏Google، مدل Gemma 3n را معرفی کرد، یک مدل چندوجهی که با حداقل 2 گیگابایت رم اجرا می‌شود و از صدا، تصویر، ویدیو و متن در 140 زبان پشتیبانی می‌کند. @GoogleAI
‏Mistral AI، مدل Devstral Small 24B را منتشر کرد، یک مدل عامل کدنویسی با مجوز Apache 2.0 که در SWE-bench برای مدل‌های متن‌باز به رتبه 1 رسید. @MistralAI
‏NVIDIA، مدل Llama-3.1-Nemotron-Nano-4B-v1.1 را منتشر کرد، یک نسخه فشرده از Llama3.1-8B که عملکردی بهتر از DeepSeek-R1-Distill-Llama-8B دارد در حالی که دو برابر کوچک‌تر است. @huggingface

پژوهش‌ها

‏Microsoft در Nature پژوهشی را در مورد Aurora منتشر کرد، یک مدل پایه هوش مصنوعی که فراتر از پیش‌بینی آب‌وهوا می‌رود تا رویدادهای زیست‌محیطی مانند طوفان‌ها و امواج اقیانوس را با دقت بیشتری پیش‌بینی کند. @MSFTResearch
تحقیقات جدید نشان می‌دهد که embedding models از منابع مختلف آنقدر مشابه هستند که می‌توان آن‌ها را بر اساس ساختار به تنهایی، بدون هیچ داده جفت‌شده‌ای، بین آن‌ها نگاشت کرد. @AndrewCurran_
‏Discovery مایکروسافت از عامل‌های هوش مصنوعی تخصصی استفاده می‌کند که بر دانش علمی استدلال می‌کنند، فرضیه‌ها را تولید می‌کنند و نتایج را در یک حلقه مداوم شبیه‌سازی می‌کنند و در 200 ساعت یک خنک‌کننده جدید را کشف می‌کنند. @Microsoft
محققان استنفورد یک generative AI agent architecture توسعه داده‌اند که می‌تواند نگرش‌های بیش از 1000 نفر واقعی را برای آزمایش ایده‌ها در علوم اجتماعی شبیه‌سازی کند. @StanfordHAI

کاربردها

‏Google ابزار فیلم‌سازی هوش مصنوعی Flow را راه‌اندازی کرد که برای مدل‌های پیشرفته آن‌ها طراحی شده است و به کاربران اجازه می‌دهد ویدیوها را گسترش دهند، جلوه‌های صوتی اضافه کنند و ثبات شخصیت را حفظ کنند. @GoogleDeepMind
‏Google، شرکت Stitch (که قبلاً Galileo AI نام داشت) را خریداری کرد که به کاربران اجازه می‌دهد رابط‌های کاربری را به صورت تکراری از promptها طراحی کنند و آن‌ها را در Figma دانلود کنند. @deedydas
‏Google، اپلیکیشن Jules را معرفی کرد که تغییراتی را در مخازن GitHub با promptهای ساده انگلیسی بدون نیاز به کلون‌سازی محلی ایجاد می‌کند. @deedydas
‏Google فناوری virtual try-on را به نمایش گذاشت که از هوش مصنوعی استفاده می‌کند تا به کاربران اجازه دهد فقط با استفاده از یک عکس تمام قد، لباس‌ها را امتحان کنند. @deedydas
‏Google real-time translation را با هوش مصنوعی چندوجهی برای Google Meet به نمایش گذاشت و موانع زبانی را در تماس‌های ویدیویی از بین برد. @deedydas
‏Framer ابزارهای هوش مصنوعی جدیدی از جمله AI Wireframing برای تولید سریع طرح‌بندی‌ها و Workshop AI برای کدنویسی اجزای تعاملی را معرفی کرد. @benblumenrose
‏OpenAI و Jony Ive شرکت جدید io را معرفی کردند که بر ایجاد نسل بعدی محصولات و رابط‌های هوش مصنوعی متمرکز است. @OpenAI
‏xAI، قابلیت Live Search را به API خود اضافه کرد و به Grok اجازه داد تا در داده‌های بی‌درنگ از X، اینترنت و اخبار پرطرفدار جستجو کند. @xai
‏OpenAI پشتیبانی از MCP (Multi-Channel Platforms) را برای Responses API خود راه‌اندازی کرد و Zapier به عنوان شریک رسمی راه‌اندازی معرفی شد. @gdb
‏Google در حال گسترش AI Mode به Search است و پاسخ‌هایی شبیه GPT/Perplexity را مستقیماً در نتایج جستجو ارائه می‌دهد. @deedydas
‏Mistral AI و Google DeepMind قابلیت‌های agent collaboration را اعلام کردند و به عامل‌های مربوطه خود اجازه دادند با هم کار کنند. @AndrewCurran_

تحلیل صنعت

داده‌های نظرسنجی نشان می‌دهد که AI use at work افزایش چشمگیری داشته است، از حدود 30٪ از کارگران ایالات متحده در دسامبر به بیش از 40٪ در مارس/آوریل 2025 رسیده است و گسترش در استفاده از Gemini و ChatGPT نیز دیده می‌شود. @emollick
‏Meta برنامه Llama Startup Program را برای حمایت از استارت‌آپ‌های نوپا که برنامه‌های کاربردی هوش مصنوعی generative را با Llama می‌سازند، راه‌اندازی کرد و بازپرداخت‌های ابری و پشتیبانی فنی ارائه می‌دهد. @AIatMeta
‏LM Arena مبلغ 100 میلیون دلار در دور seed با رهبری a16z و UC Investments جمع‌آوری کرد تا از پلتفرم خود برای درک و بهبود عملکرد مدل هوش مصنوعی پشتیبانی کند. @pmarca
تجزیه و تحلیل AI power consumption نشان می‌دهد که در حالی که استفاده فردی کم است، تأثیر کلی قابل توجه است - آزمایش‌ها نشان داد که Llama 3.1 405B به طور متوسط 3353 ژول در هر prompt مصرف می‌کند که معادل 2 دقیقه و 50 ثانیه فعالیت مغز انسان است. @emollick
‏Gemini طبق گفته Google، بیش از 400 میلیون کاربر فعال ماهانه دارد و 480 تریلیون توکن در ماه پردازش می‌کند. @deedydas
سرعت AI adoption در تجارت بیشتر به نوآوری در مدل‌های کسب‌وکار، مدیریت ریسک و حکمرانی بستگی دارد تا سرعت بهبود در قابلیت‌های هوش مصنوعی. @random_walker

اخلاق و جامعه

ویژگی جدید memory-from-your-chats feature در ChatGPT نشان‌دهنده تغییر قابل توجهی در نحوه عملکرد مدل است و نگرانی‌هایی را در مورد کنترل کاربر بر ورودی مدل ایجاد می‌کند. @simonw
تحقیقات در مورد AI in education تأثیر متفاوتی را نشان می‌دهد: هنگامی که هوش مصنوعی به عنوان یک معلم خصوصی با راهنمایی مربی استفاده می‌شود، اثرات مثبت قابل توجهی دارد، اما هنگامی که به تنهایی برای کمک به تکالیف استفاده می‌شود، می‌تواند به عنوان یک میانبر عمل کند که به یادگیری آسیب می‌رساند. @emollick