اخبار هوش مصنوعی در 2025-05-20
مدلهای جدید هوش مصنوعی
- Google از Gemini 2.5 Pro با حالت «Deep Think» رونمایی کرد که از تکنیکهای تفکر موازی برای در نظر گرفتن فرضیههای متعدد قبل از پاسخ دادن استفاده میکند. @demishassabis @OfficialLoganK
- Google، Gemini 2.5 Flash را معرفی کرد، یک مدل سریعتر که در اوایل ماه ژوئن به طور عمومی در دسترس خواهد بود و مرز پارتو عملکرد را جابجا میکند. @sundarpichai @OfficialLoganK
- Veo 3، مدل تولید ویدیوی پیشرفتهی Google با قابلیتهای تولید صدای بومی، اکنون برای مشترکین Google AI Ultra در ایالات متحده در دسترس است. @GoogleDeepMind @JeffDean
- Imagen 4، جدیدترین مدل تولید تصویر Google، اکنون با جزئیات بهبود یافته، رنگهای ظریفتر و خروجی متن بهتر، فعال است. @GeminiApp
- Google از Gemma 3n، یک مدل جدید بهینهسازیشده برای استفاده در دستگاههای تلفن همراه با قابلیتهای چندوجهی و استنتاج سریع، رونمایی کرد. @demishassabis
- Google، Lyria 2 را برای YouTube shorts و در Vertex معرفی کرد. @AndrewCurran_
پژوهشها
- مقاله جدید در مورد ARC-AGI-2 منتشر شد که اصول طراحی، تجزیه و تحلیل عملکرد انسان و عملکرد مدل فعلی را پوشش میدهد. @fchollet
- Google، Gemini Diffusion را معرفی کرد، یک مدل تحقیقاتی که به طور قابل توجهی سریعتر از مدلهای قبلی است و در عین حال با تصحیح خطاها در طول تفکر، عملکرد کدنویسی را مطابقت میدهد. @GoogleAI
- Gemini 2.5 Pro گوگل با Deep Think به امتیاز 49.4٪ در USAMO (المپیاد ریاضی ایالات متحده آمریکا) دست یافت، یک پیشرفت قابل توجه در استدلال ریاضی. @quocleix
- Meta، Adjoint Sampling را معرفی کرد، یک الگوریتم یادگیری جدید که مدلهای مولد را بر اساس پاداشهای اسکالر آموزش میدهد، با مبانی نظری توسعهیافته توسط FAIR. @AIatMeta
- NVIDIA، Cosmos-Reason1-7B را منتشر کرد، که به عنوان اولین مدل استدلال برای رباتیک، مبتنی بر Qwen 2.5-VL-7B توصیف شده است. @huggingface
- مقاله تحقیقاتی جدید، مسائل بالقوه در مورد بازنماییهای یادگیری عمیق را پیشنهاد میکند و راه حلهایی برای بهبود ارائه میدهد. @jeffclune
- Meta، OMol25 را منتشر کرد، مجموعهدادهای از بیش از 100 میلیون کانفورمر مولکولی که 83 عنصر را در بر میگیرد برای آموزش مدلهای یادگیری ماشین با دقت سطح DFT. @huggingface
کاربردها
- Google، Flow را راهاندازی کرد، ابزاری برای فیلمسازی که مدلهای Veo، Imagen و Gemini را ترکیب میکند تا به ایجاد کلیپها و روایتهای سینمایی کمک کند. @GoogleDeepMind
- Google، Jules را معرفی کرد، یک عامل کدنویسی که به کاربران اجازه میدهد با استفاده از دستورات انگلیسی در یک VM با استفاده از Gemini 2.5 Pro، تغییراتی در مخازن GitHub ایجاد کنند. @deedydas @eugeneyan
- Google، Gemini in Chrome را معرفی کرد، یک دستیار مرور هوش مصنوعی که خلاصهها و پاسخها را بدون جابجایی بین تبها ارائه میدهد. @GeminiApp
- Google حالت Agent Mode را در برنامه Gemini معرفی کرد تا به کاربران در انجام وظایف در سراسر وب کمک کند. @sundarpichai
- Google حالت AI Mode را در Search راهاندازی کرد، با استفاده از تکنیک «query fan out» برای شکستن پرس و جوها به زیرشاخهها و تولید پاسخهای جامع. @GoogleAI
- Google، SynthID Detector را معرفی کرد، یک پورتال برای شناسایی اینکه آیا محتوای دیجیتال توسط ابزارهای هوش مصنوعی Google تولید شده است یا خیر، که قبلاً 10 میلیارد بار استفاده شده است. @GoogleDeepMind
- Google، Google Beam را معرفی کرد، یک پلتفرم ارتباطات ویدیویی سهبعدی که جریانهای ویدیویی دوبعدی را به تجربههای سهبعدی واقعگرایانه تبدیل میکند. @GoogleAI
- Microsoft اعلام کرد که پشتیبانی از API Grok 3 به Azure میآید، اگرچه شفافیت محدودی در مورد امنیت و جزئیات مدل وجود دارد. @emollick
- Stability AI، Stable Video Diffusion 4D را به Stable Video 4D 2.0 ارتقا داد و کیفیت خروجیهای 4D تولید شده از یک ویدیوی شیءمحور را بهبود بخشید. @StabilityAI
- برنامه NotebookLM گوگل اکنون در App Store با ویژگی Video Overviews در دسترس است. @demishassabis @OfficialLoganK
- SAP با Cohere همکاری میکند تا هوش مصنوعی عاملمحور آمادهی سازمانی را در SAP Business Suite تعبیه کند. @cohere
تحلیل صنعت
- Google گزارش میدهد که ماهانه 480 تریلیون توکن را در محصولات و APIها پردازش میکند، که نسبت به سال گذشته 50 برابر افزایش یافته است. @sundarpichai @OfficialLoganK
- برنامه Gemini گوگل بیش از 400 میلیون کاربر فعال ماهانه دارد و 7 میلیون توسعهدهنده با API Gemini (4 برابر رشد) میسازند. @OfficialLoganK
- کاربران فعال روزانه ChatGPT بیش از 4 برابر در سال گذشته افزایش یافتهاند و پیامهای ارسالی در روز حتی به طور قابل توجهی بیشتر رشد کردهاند. @sama
- Google AI Overviews اکنون توسط 1.5 میلیارد نفر در ماه در بیش از 200 کشور و منطقه استفاده میشود. @sundarpichai
- مدلهای Llama متا، پیشنهادات مستقیم شخص اول در Azure AI Foundry خواهند بود که توسط Microsoft میزبانی و فروخته میشوند. @AIatMeta
- شرکتهای ابزار کدنویسی هوش مصنوعی عمدتاً بر نمایشهای React و TypeScript تمرکز دارند، در حالی که Microsoft مطالعات موردی Java و NET. را به عنوان یک تمایز استراتژیک به نمایش میگذارد. @GergelyOrosz
- یکی از عوارض جانبی کدنویسی هوش مصنوعی این است که «اکنون همه یک IC (مشارکتکنندهی فردی) هستند». @alexgraveley
- این روایت که استفاده از هوش مصنوعی به دلیل محدودیتهای داده، هزینهها، عوامل محیطی یا مقررات از بین خواهد رفت، مفید نیست، زیرا بیش از یک میلیارد نفر از این فناوری با سودمندی بالای گزارششده استفاده میکنند. @emollick
اخلاق و جامعه
- موسسه AI Now در حال راهاندازی تحقیقاتی در مورد تقاضای رو به رشد انرژی هوش مصنوعی و روی آوردن صنعت به انرژی هستهای است و بر زیرساختها، ایمنی و خطرات نظارتی تمرکز دارد. @AINowInstitute
- مقاله Berkeley AI Research بررسی میکند که چگونه هوش مصنوعی پیشرفته، امنیت سایبری را تغییر میدهد و پیشبینی میکند که مهاجمان ممکن است در کوتاهمدت مزایای فوریتری نسبت به مدافعان به دست آورند. @berkeley_ai
- مطالعه کنترلشده تصادفی بانک جهانی نشان میدهد که استفاده از GPT-4 به عنوان معلم خصوصی با راهنمایی معلم در یک برنامه شش هفتهای بعد از مدرسه در نیجریه «بیش از دو برابر اثر برخی از مؤثرترین مداخلات در آموزش» با هزینههای بسیار پایین داشته است. @emollick
- گزارش وضعیت هوش مصنوعی در طراحی منتشر شد، که به بررسی صدها طراح و رهبر از شرکتهایی مانند Notion، Stripe، Ramp، Anthropic و Perplexity در مورد پذیرش هوش مصنوعی در طراحی میپردازد. @benblumenrose