اخبار هوش مصنوعی در 2025-05-20

مدل‌های جدید هوش مصنوعی

‏Google از Gemini 2.5 Pro با حالت «Deep Think» رونمایی کرد که از تکنیک‌های تفکر موازی برای در نظر گرفتن فرضیه‌های متعدد قبل از پاسخ دادن استفاده می‌کند. @demishassabis @OfficialLoganK
‏Google، Gemini 2.5 Flash را معرفی کرد، یک مدل سریع‌تر که در اوایل ماه ژوئن به طور عمومی در دسترس خواهد بود و مرز پارتو عملکرد را جابجا می‌کند. @sundarpichai @OfficialLoganK
‏Veo 3، مدل تولید ویدیوی پیشرفته‌ی Google با قابلیت‌های تولید صدای بومی، اکنون برای مشترکین Google AI Ultra در ایالات متحده در دسترس است. @GoogleDeepMind @JeffDean
‏Imagen 4، جدیدترین مدل تولید تصویر Google، اکنون با جزئیات بهبود یافته، رنگ‌های ظریف‌تر و خروجی متن بهتر، فعال است. @GeminiApp
‏Google از Gemma 3n، یک مدل جدید بهینه‌سازی‌شده برای استفاده در دستگاه‌های تلفن همراه با قابلیت‌های چندوجهی و استنتاج سریع، رونمایی کرد. @demishassabis
‏Google، Lyria 2 را برای YouTube shorts و در Vertex معرفی کرد. @AndrewCurran_

پژوهش‌ها

مقاله جدید در مورد ARC-AGI-2 منتشر شد که اصول طراحی، تجزیه و تحلیل عملکرد انسان و عملکرد مدل فعلی را پوشش می‌دهد. @fchollet
‏Google، Gemini Diffusion را معرفی کرد، یک مدل تحقیقاتی که به طور قابل توجهی سریع‌تر از مدل‌های قبلی است و در عین حال با تصحیح خطاها در طول تفکر، عملکرد کدنویسی را مطابقت می‌دهد. @GoogleAI
‏Gemini 2.5 Pro گوگل با Deep Think به امتیاز 49.4٪ در USAMO (المپیاد ریاضی ایالات متحده آمریکا) دست یافت، یک پیشرفت قابل توجه در استدلال ریاضی. @quocleix
‏Meta، Adjoint Sampling را معرفی کرد، یک الگوریتم یادگیری جدید که مدل‌های مولد را بر اساس پاداش‌های اسکالر آموزش می‌دهد، با مبانی نظری توسعه‌یافته توسط FAIR. @AIatMeta
‏NVIDIA، Cosmos-Reason1-7B را منتشر کرد، که به عنوان اولین مدل استدلال برای رباتیک، مبتنی بر Qwen 2.5-VL-7B توصیف شده است. @huggingface
مقاله تحقیقاتی جدید، مسائل بالقوه در مورد بازنمایی‌های یادگیری عمیق را پیشنهاد می‌کند و راه حل‌هایی برای بهبود ارائه می‌دهد. @jeffclune
‏Meta، OMol25 را منتشر کرد، مجموعه‌داده‌ای از بیش از 100 میلیون کانفورمر مولکولی که 83 عنصر را در بر می‌گیرد برای آموزش مدل‌های یادگیری ماشین با دقت سطح DFT. @huggingface

کاربردها

‏Google، Flow را راه‌اندازی کرد، ابزاری برای فیلم‌سازی که مدل‌های Veo، Imagen و Gemini را ترکیب می‌کند تا به ایجاد کلیپ‌ها و روایت‌های سینمایی کمک کند. @GoogleDeepMind
‏Google، Jules را معرفی کرد، یک عامل کدنویسی که به کاربران اجازه می‌دهد با استفاده از دستورات انگلیسی در یک VM با استفاده از Gemini 2.5 Pro، تغییراتی در مخازن GitHub ایجاد کنند. @deedydas @eugeneyan
‏Google، Gemini in Chrome را معرفی کرد، یک دستیار مرور هوش مصنوعی که خلاصه‌ها و پاسخ‌ها را بدون جابجایی بین تب‌ها ارائه می‌دهد. @GeminiApp
‏Google حالت Agent Mode را در برنامه Gemini معرفی کرد تا به کاربران در انجام وظایف در سراسر وب کمک کند. @sundarpichai
‏Google حالت AI Mode را در Search راه‌اندازی کرد، با استفاده از تکنیک «query fan out» برای شکستن پرس و جوها به زیرشاخه‌ها و تولید پاسخ‌های جامع. @GoogleAI
‏Google، SynthID Detector را معرفی کرد، یک پورتال برای شناسایی اینکه آیا محتوای دیجیتال توسط ابزارهای هوش مصنوعی Google تولید شده است یا خیر، که قبلاً 10 میلیارد بار استفاده شده است. @GoogleDeepMind
‏Google، Google Beam را معرفی کرد، یک پلتفرم ارتباطات ویدیویی سه‌بعدی که جریان‌های ویدیویی دوبعدی را به تجربه‌های سه‌بعدی واقع‌گرایانه تبدیل می‌کند. @GoogleAI
‏Microsoft اعلام کرد که پشتیبانی از API ‏Grok 3 به Azure می‌آید، اگرچه شفافیت محدودی در مورد امنیت و جزئیات مدل وجود دارد. @emollick
‏Stability AI، ‏Stable Video Diffusion 4D را به Stable Video 4D 2.0 ارتقا داد و کیفیت خروجی‌های 4D تولید شده از یک ویدیوی شیءمحور را بهبود بخشید. @StabilityAI
برنامه NotebookLM گوگل اکنون در App Store با ویژگی Video Overviews در دسترس است. @demishassabis @OfficialLoganK
‏SAP با Cohere همکاری می‌کند تا هوش مصنوعی عامل‌محور آماده‌ی سازمانی را در SAP Business Suite تعبیه کند. @cohere

تحلیل صنعت

‏Google گزارش می‌دهد که ماهانه 480 تریلیون توکن را در محصولات و APIها پردازش می‌کند، که نسبت به سال گذشته 50 برابر افزایش یافته است. @sundarpichai @OfficialLoganK
برنامه Gemini گوگل بیش از 400 میلیون کاربر فعال ماهانه دارد و 7 میلیون توسعه‌دهنده با API Gemini (4 برابر رشد) می‌سازند. @OfficialLoganK
کاربران فعال روزانه ChatGPT بیش از 4 برابر در سال گذشته افزایش یافته‌اند و پیام‌های ارسالی در روز حتی به طور قابل توجهی بیشتر رشد کرده‌اند. @sama
‏Google AI Overviews اکنون توسط 1.5 میلیارد نفر در ماه در بیش از 200 کشور و منطقه استفاده می‌شود. @sundarpichai
مدل‌های Llama متا، پیشنهادات مستقیم شخص اول در Azure AI Foundry خواهند بود که توسط Microsoft میزبانی و فروخته می‌شوند. @AIatMeta
شرکت‌های ابزار کدنویسی هوش مصنوعی عمدتاً بر نمایش‌های React و TypeScript تمرکز دارند، در حالی که Microsoft مطالعات موردی Java و NET. را به عنوان یک تمایز استراتژیک به نمایش می‌گذارد. @GergelyOrosz
یکی از عوارض جانبی کدنویسی هوش مصنوعی این است که «اکنون همه یک IC (مشارکت‌کننده‌ی فردی) هستند». @alexgraveley
این روایت که استفاده از هوش مصنوعی به دلیل محدودیت‌های داده، هزینه‌ها، عوامل محیطی یا مقررات از بین خواهد رفت، مفید نیست، زیرا بیش از یک میلیارد نفر از این فناوری با سودمندی بالای گزارش‌شده استفاده می‌کنند. @emollick

اخلاق و جامعه

موسسه AI Now در حال راه‌اندازی تحقیقاتی در مورد تقاضای رو به رشد انرژی هوش مصنوعی و روی آوردن صنعت به انرژی هسته‌ای است و بر زیرساخت‌ها، ایمنی و خطرات نظارتی تمرکز دارد. @AINowInstitute
مقاله Berkeley AI Research بررسی می‌کند که چگونه هوش مصنوعی پیشرفته، امنیت سایبری را تغییر می‌دهد و پیش‌بینی می‌کند که مهاجمان ممکن است در کوتاه‌مدت مزایای فوری‌تری نسبت به مدافعان به دست آورند. @berkeley_ai
مطالعه کنترل‌شده تصادفی بانک جهانی نشان می‌دهد که استفاده از GPT-4 به عنوان معلم خصوصی با راهنمایی معلم در یک برنامه شش هفته‌ای بعد از مدرسه در نیجریه «بیش از دو برابر اثر برخی از مؤثرترین مداخلات در آموزش» با هزینه‌های بسیار پایین داشته است. @emollick
گزارش وضعیت هوش مصنوعی در طراحی منتشر شد، که به بررسی صدها طراح و رهبر از شرکت‌هایی مانند Notion، Stripe، Ramp، Anthropic و Perplexity در مورد پذیرش هوش مصنوعی در طراحی می‌پردازد. @benblumenrose