اخبار هوش مصنوعی در 2025-05-21
مدلهای جدید هوش مصنوعی
- Google، مدل جدید Gemini Diffusion را منتشر کرد که از diffusion برای مدلسازی زبان استفاده میکند و 10 تا 15 برابر سریعتر از مدلهای autoregressive تولید میکند. @demishassabis
- Google از Veo 3، جدیدترین مدل تولید ویدیو خود با قابلیتهای تولید صدای بومی، فیزیک بهبودیافته و درک بهتر prompt رونمایی کرد. @sundarpichai
- Google، مدل Gemma 3n را معرفی کرد، یک مدل چندوجهی که با حداقل 2 گیگابایت رم اجرا میشود و از صدا، تصویر، ویدیو و متن در 140 زبان پشتیبانی میکند. @GoogleAI
- Mistral AI، مدل Devstral Small 24B را منتشر کرد، یک مدل عامل کدنویسی با مجوز Apache 2.0 که در SWE-bench برای مدلهای متنباز به رتبه 1 رسید. @MistralAI
- NVIDIA، مدل Llama-3.1-Nemotron-Nano-4B-v1.1 را منتشر کرد، یک نسخه فشرده از Llama3.1-8B که عملکردی بهتر از DeepSeek-R1-Distill-Llama-8B دارد در حالی که دو برابر کوچکتر است. @huggingface
پژوهشها
- Microsoft در Nature پژوهشی را در مورد Aurora منتشر کرد، یک مدل پایه هوش مصنوعی که فراتر از پیشبینی آبوهوا میرود تا رویدادهای زیستمحیطی مانند طوفانها و امواج اقیانوس را با دقت بیشتری پیشبینی کند. @MSFTResearch
- تحقیقات جدید نشان میدهد که embedding models از منابع مختلف آنقدر مشابه هستند که میتوان آنها را بر اساس ساختار به تنهایی، بدون هیچ داده جفتشدهای، بین آنها نگاشت کرد. @AndrewCurran_
- Discovery مایکروسافت از عاملهای هوش مصنوعی تخصصی استفاده میکند که بر دانش علمی استدلال میکنند، فرضیهها را تولید میکنند و نتایج را در یک حلقه مداوم شبیهسازی میکنند و در 200 ساعت یک خنککننده جدید را کشف میکنند. @Microsoft
- محققان استنفورد یک generative AI agent architecture توسعه دادهاند که میتواند نگرشهای بیش از 1000 نفر واقعی را برای آزمایش ایدهها در علوم اجتماعی شبیهسازی کند. @StanfordHAI
کاربردها
- Google ابزار فیلمسازی هوش مصنوعی Flow را راهاندازی کرد که برای مدلهای پیشرفته آنها طراحی شده است و به کاربران اجازه میدهد ویدیوها را گسترش دهند، جلوههای صوتی اضافه کنند و ثبات شخصیت را حفظ کنند. @GoogleDeepMind
- Google، شرکت Stitch (که قبلاً Galileo AI نام داشت) را خریداری کرد که به کاربران اجازه میدهد رابطهای کاربری را به صورت تکراری از promptها طراحی کنند و آنها را در Figma دانلود کنند. @deedydas
- Google، اپلیکیشن Jules را معرفی کرد که تغییراتی را در مخازن GitHub با promptهای ساده انگلیسی بدون نیاز به کلونسازی محلی ایجاد میکند. @deedydas
- Google فناوری virtual try-on را به نمایش گذاشت که از هوش مصنوعی استفاده میکند تا به کاربران اجازه دهد فقط با استفاده از یک عکس تمام قد، لباسها را امتحان کنند. @deedydas
- Google real-time translation را با هوش مصنوعی چندوجهی برای Google Meet به نمایش گذاشت و موانع زبانی را در تماسهای ویدیویی از بین برد. @deedydas
- Framer ابزارهای هوش مصنوعی جدیدی از جمله AI Wireframing برای تولید سریع طرحبندیها و Workshop AI برای کدنویسی اجزای تعاملی را معرفی کرد. @benblumenrose
- OpenAI و Jony Ive شرکت جدید io را معرفی کردند که بر ایجاد نسل بعدی محصولات و رابطهای هوش مصنوعی متمرکز است. @OpenAI
- xAI، قابلیت Live Search را به API خود اضافه کرد و به Grok اجازه داد تا در دادههای بیدرنگ از X، اینترنت و اخبار پرطرفدار جستجو کند. @xai
- OpenAI پشتیبانی از MCP (Multi-Channel Platforms) را برای Responses API خود راهاندازی کرد و Zapier به عنوان شریک رسمی راهاندازی معرفی شد. @gdb
- Google در حال گسترش AI Mode به Search است و پاسخهایی شبیه GPT/Perplexity را مستقیماً در نتایج جستجو ارائه میدهد. @deedydas
- Mistral AI و Google DeepMind قابلیتهای agent collaboration را اعلام کردند و به عاملهای مربوطه خود اجازه دادند با هم کار کنند. @AndrewCurran_
تحلیل صنعت
- دادههای نظرسنجی نشان میدهد که AI use at work افزایش چشمگیری داشته است، از حدود 30٪ از کارگران ایالات متحده در دسامبر به بیش از 40٪ در مارس/آوریل 2025 رسیده است و گسترش در استفاده از Gemini و ChatGPT نیز دیده میشود. @emollick
- Meta برنامه Llama Startup Program را برای حمایت از استارتآپهای نوپا که برنامههای کاربردی هوش مصنوعی generative را با Llama میسازند، راهاندازی کرد و بازپرداختهای ابری و پشتیبانی فنی ارائه میدهد. @AIatMeta
- LM Arena مبلغ 100 میلیون دلار در دور seed با رهبری a16z و UC Investments جمعآوری کرد تا از پلتفرم خود برای درک و بهبود عملکرد مدل هوش مصنوعی پشتیبانی کند. @pmarca
- تجزیه و تحلیل AI power consumption نشان میدهد که در حالی که استفاده فردی کم است، تأثیر کلی قابل توجه است - آزمایشها نشان داد که Llama 3.1 405B به طور متوسط 3353 ژول در هر prompt مصرف میکند که معادل 2 دقیقه و 50 ثانیه فعالیت مغز انسان است. @emollick
- Gemini طبق گفته Google، بیش از 400 میلیون کاربر فعال ماهانه دارد و 480 تریلیون توکن در ماه پردازش میکند. @deedydas
- سرعت AI adoption در تجارت بیشتر به نوآوری در مدلهای کسبوکار، مدیریت ریسک و حکمرانی بستگی دارد تا سرعت بهبود در قابلیتهای هوش مصنوعی. @random_walker
اخلاق و جامعه
- ویژگی جدید memory-from-your-chats feature در ChatGPT نشاندهنده تغییر قابل توجهی در نحوه عملکرد مدل است و نگرانیهایی را در مورد کنترل کاربر بر ورودی مدل ایجاد میکند. @simonw
- تحقیقات در مورد AI in education تأثیر متفاوتی را نشان میدهد: هنگامی که هوش مصنوعی به عنوان یک معلم خصوصی با راهنمایی مربی استفاده میشود، اثرات مثبت قابل توجهی دارد، اما هنگامی که به تنهایی برای کمک به تکالیف استفاده میشود، میتواند به عنوان یک میانبر عمل کند که به یادگیری آسیب میرساند. @emollick