اخبار هوش مصنوعی در 2025-05-23
مدلهای جدید هوش مصنوعی
- NVIDIA اعلام کرد که Blackwell با تولید بیش از 1000 توکن در ثانیه روی مدل Llama 4 Maverick توسط یک سرور تکی DGX B200، رکورد جدیدی در سرعت استنتاج در جهان ثبت کرده است. @AIatMeta
- Google مدل Gemma 3n را معرفی کرد، یک مدل چندوجهی که برای هوش مصنوعی موبایلی روی دستگاه با ردپای حافظه 3 برابر کوچکتر ساخته شده است و برنامههای پیچیدهتری را روی تلفنها امکانپذیر میکند. @GoogleDeepMind
- OpenAI، Operator را در ChatGPT با جدیدترین مدل استدلال o3 خود بهروزرسانی میکند و نرخ موفقیت کار و کیفیت پاسخ را بهبود میبخشد. @OpenAI
پژوهشها
- Google DeepMind حالت Gemini 2.5 Pro Deep Think را به نمایش میگذارد که با استفاده از تفکر موازی برای در نظر گرفتن فرضیههای متعدد قبل از پاسخ دادن، به حل مسائل پیچیده میپردازد. @GoogleDeepMind
- Claude 4 به امتیاز 55٪ در بنچمارک امنیت سایبری Cybench دست مییابد، که به طور قابل توجهی از سایر مدلها که حدود 22.5٪ امتیاز میگیرند، بهتر عمل میکند و قابلیتهای پیشرفته در مهندسی معکوس و بهرهبرداری از سیستم را نشان میدهد. @deedydas
- محققان کشف کردند که تمام مدلهای زبانی در یک «هندسه جهانی» یکسان از معنا همگرا میشوند و امکان ترجمه بین جاسازیهای هر مدلی را بدون دیدن متن اصلی فراهم میکنند. @emollick
- مطالعه MIT نشان میدهد که مدلهای دیداری-زبانی مورد استفاده برای تجزیه و تحلیل تصاویر پزشکی نمیتوانند به درستی از عهدهی پرسشهایی با کلمات منفی مانند «نه» و «نیست» برآیند. @MIT_CSAIL
کاربردها
- ChatGPT اکنون با کتابخانه RDKit ادغام شده است تا مولکولها و اطلاعات شیمیایی را برای کارهای علمی در زمینههای بهداشت، زیستشناسی و شیمی تجزیه و تحلیل، دستکاری و تجسم کند. @gdb
- Gemini 2.5 Flash به مدل پیشفرض جدید برای کاربران اپلیکیشن Gemini تبدیل میشود و کیفیت بهبود یافتهای را با زمان پاسخدهی سریع ارائه میدهد. @GeminiApp
- Aurora AI مایکروسافت میتواند کیفیت هوا، طوفانهای دریایی و سایر شرایط محیطی را به طور دقیق پیشبینی کند. @TechCrunch
- Sierra عاملهایی را معرفی میکند که فراتر از سیستمهای هوش مصنوعی مکالمهای سنتی مبتنی بر نوبت میروند تا مکالمات انسانمانندتری تولید کنند. @btaylor
- Cubic به عنوان «Cursor برای بازبینی کد» راهاندازی میشود - یک پلتفرم بومی هوش مصنوعی که به تیمها کمک میکند کد را 28٪ سریعتر ارسال کنند. @ycombinator
- Clarm عاملهای تحقیقات عمیق هوش مصنوعی را میسازد که در دادههای سازمانی به هم متصل میشوند تا پاسخهای دقیق و بدون توهم برای تصمیمات حیاتی ارائه دهند. @ycombinator
تحلیل صنعت
- مدلهای کدنویسی هوش مصنوعی از طریق تکنیکهای انتشار، 10 تا 15 برابر سریعتر (و ارزانتر) شدهاند، و Mercury Small از Inception Labs نتایج امیدوارکنندهای را نشان میدهد که با 4o-mini قابل مقایسه است. @deedydas
- مدلهای هوش مصنوعی پیشرفتهی کنونی هر کدام نقاط قوت و ضعف متمایز دارند، و استفاده ابزاری عاملگونهی o3 در توالی، یک عامل تمایز اصلی است، علیرغم اینکه مدلهای دیگر در زمینههای مختلف برتری دارند. @emollick
- بسیاری از برنامههای هوش مصنوعی امروزی شبیه «درشکههای بدون اسب» قرن نوزدهم هستند - بستهبندی فناوری قدرتمند در رابطهای منسوخ شده به جای طراحی مجدد برای تجربههای بومی هوش مصنوعی. @ycombinator
- Garry Tan، مدیرعامل YC، تأکید میکند که هوش مصنوعی متنباز با ایجاد رقابت منصفانه بین 8-9 بازیگر اصلی، از انحصار فناوری بعدی جلوگیری میکند و به استارتآپها انتخابهای بیشتری میدهد. @garrytan
اخلاق و جامعه
- Simon Willison در مورد آسیبپذیریهای امنیتی در سیستمهای LLM هشدار میدهد که دسترسی به دادههای خصوصی، قرار گرفتن در معرض دستورالعملهای مخرب و توانایی خروج اطلاعات را ترکیب میکنند - الگویی که در چندین پلتفرم از جمله GitLab دیده میشود. @simonw
- Dario Amodei، مدیرعامل Anthropic، پیشنهاد میکند که توهمات لزوماً محدودیتی در مسیر رسیدن به AGI نیستند، زیرا انسانها نیز اشتباه میکنند، در حالی که Demis Hassabis، مدیرعامل Google DeepMind، مخالف است و خاطرنشان میکند که ابزارهای فعلی بسیاری از سؤالات واضح را اشتباه پاسخ میدهند. @TechCrunch
- Demis Hassabis از Google DeepMind دیدگاه خود را در مورد گسترش Gemini 2.5 Pro به یک «مدل جهانی» به اشتراک میگذارد که میتواند با درک و شبیهسازی جنبههای مختلف جهان، برنامهریزی کند و تجربیات جدیدی را تصور کند. @AndrewCurran_
- مستندسازی هوش مصنوعی همچنان چالشبرانگیز است، زیرا شرکتها برای توضیح اینکه سیستمهایشان چه کاری انجام میدهند، تلاش میکنند، بخشی به این دلیل که همیشه نمیدانند و بخشی به این دلیل که هیچ رویکرد تثبیتشدهای برای مستندسازی قابلیتهای هوش مصنوعی وجود ندارد. @emollick