اخبار هوش مصنوعی در 2025-06-06
مدلهای جدید هوش مصنوعی
- Anthropic مدل Claude Gov را معرفی میکند؛ این مدلهای سفارشی برای مشتریان امنیت ملی ایالات متحده ساخته شدهاند و قبلاً توسط آژانسها در بالاترین سطح امنیت ملی ایالات متحده با دسترسی محدود به محیطهای طبقهبندیشده مستقر شدهاند @AnthropicAI
- گوگل بهروزرسانی Gemini 2.5 Pro را با عملکرد پیشرفته در مدیریت بافت طولانی (long context) منتشر میکند، که بهویژه در بازیابی تعداد بالای آیتمها توانمند است @OfficialLoganK
- مدل تولید ویدیوی Veo 3 گوگل اکنون در هر دو پلتفرم Replicate و FAL در دسترس است @AndrewCurran_
تحلیل صنعت
- Cursor با جذب ۹۰۰ میلیون دلار سرمایهگذاری سری C، به بیش از ۵۰۰ میلیون دلار ARR رسیده و توسط بیش از نیمی از شرکتهای Fortune 500، از جمله NVIDIA، Uber و Adobe استفاده میشود @cursor_ai
- مشخص شد که شرکت Uber، شرکتی است که مهندسانش Cursor را به GitHub Copilot ترجیح میدهند، و این امر منجر به صدور مجوز در سطح شرکت برای تمامی توسعهدهندگان شده است @GergelyOrosz
- استارتاپهای هوش مصنوعی در مقایسه با شرکتهای نرمافزاری پیش از دوران هوش مصنوعی، رشد درآمدی بهطور قابل توجهی سریعتری را نشان میدهند، و معیارهای جدیدی برای عملکرد شرکتهای هوش مصنوعی در حال ظهور هستند @omooretweets
- مهندسان استقرار (forward deployed engineers) در حال تبدیل شدن به داغترین شغل در استارتاپها هستند که نشاندهندهی تغییری به سمت رشد مبتنی بر خدمات در عصر هوش مصنوعی است @a16z
- موقعیت بازار Waymo در سانفرانسیسکو به ۲ تا ۳ برابر زمان انتظار و هزینهی Uber رسیده است، که نشاندهندهی تمایل بیشتر مردم برای پرداخت هزینه برای وسایل نقلیهی خودران است @natolambert
- نرمافزار در حال تبدیل شدن به سومین هزینهی بزرگ مصرفکنندگان پس از غذا و اجاره است، در حالی که هوش مصنوعی باعث افزایش هزینهکرد مصرفکنندگان در محصولات نرمافزاری میشود @a16z
اخلاق و جامعه
- OpenAI با درخواست دادگاه نیویورک تایمز برای جلوگیری از حذف چتهای کاربران مخالفت میکند، با این استدلال که این کار سابقهی بدی ایجاد کرده و حریم خصوصی کاربران را به خطر میاندازد؛ در همین حال، سم آلتمن نیاز به «امتیاز هوش مصنوعی» (AI privilege) مشابه محرمانگی وکیل-موکل را مطرح کرده است @sama
- سایمون ویلیسون در مورد آسیبپذیریهای تزریق پرامپت (prompt injection) در سرور GitHub MCP هشدار میدهد؛ جایی که مهاجمان میتوانند عوامل هوش مصنوعی را با دستورالعملهای مخرب فریب دهند تا دادههای خصوصی را سرقت کنند @julien_c
- کمتر از ۱۰٪ از بینندگان یوتیوب که بر هوش مصنوعی تمرکز دارند، زن هستند، که نشاندهندهی شکاف جنسیتی در پذیرش و آموزش هوش مصنوعی است @clairevo
کاربردها
- مدلهای زبان بزرگ (LLM) فعلی میتوانند بهبودهای قابل توجهی در دقت تصمیمگیریهای انکولوژی بالینی به دست آورند، هنگامی که به ابزارهای پزشکی دسترسی داده میشوند؛ بهطوری که GPT-4 از ۳۰٪ به ۸۷٪ دقت رسیده است @emollick
- Perplexity قابلیت ارسال اخبار روزانه را به واتساپ اضافه کرده و ویژگیهای تحلیل مالی را به صفحات مالی خود میافزاید @AravSrinivas
- مایکروسافت Copilot قابلیتهای جستجوی بصری را با تصاویر واقعی، ویدیوها و کارتها معرفی میکند تا جستجو را هوشمندتر سازد @Copilot
- Hugging Face با Google Colab برای اضافه کردن پشتیبانی «Open in Colab» برای تمامی مدلهای موجود در Hugging Face Hub همکاری میکند و این کار آزمایش مدلهای هوش مصنوعی را دسترسپذیرتر میسازد @GoogleColab
- Opportunity International از چتبات Ulangizi AI برای کمک به کشاورزان خرد در آفریقا استفاده میکند تا شیوههای کشاورزی خود را با استفاده از خدمات مالی و آموزش بهبود بخشند @Microsoft
پژوهشها
- MIT CSAIL و شرکایش Boltz-2 را منتشر میکنند، که اولین مدل هوش مصنوعی است که به عملکرد شبیهسازی FEP برای پیشبینی تمایل اتصال پروتئینها نزدیک میشود، در حالی که بیش از ۱۰۰۰ برابر سریعتر است و تحت مجوز MIT به صورت متنباز منتشر شده است @MIT_CSAIL
- فرانسوا شوله ARC-AGI-2 را به عنوان ابزاری بهتر برای اندازهگیری پیشرفت قابلیتهای AGI (هوش عمومی مصنوعی) در سطح جهشی اعلام میکند، در حالی که ARC-AGI-1 همچنان برای مقایسهی سیستمهای هوش مصنوعی و اندازهگیری کارایی بهتر است @fchollet
- EleutherAI مجموعهدادهی Common Pile v0.1 را منتشر میکند، یک مجموعهدادهی ۸ ترابایتی از متنهای دارای مجوز آزاد و مالکیت عمومی، که مدلهای ۷ میلیاردی آموزشدیده بر روی این داده، عملکردی مشابه مدلهای مشابهی مانند LLaMA 1 و ۲ را از خود نشان میدهند @AiEleuther
- Hugging Face مجموعهی ارزیابی جامع ScreenSuite را برای عوامل رابط کاربری گرافیکی (GUI Agents) منتشر میکند که شامل ارزیابی صرفاً بصری، محیطهای اوبونتو و اندروید، و پوشش موبایل، دسکتاپ و وب است @amir_mahla
- پژوهشها نشان میدهند که مدلهای تخصصی ۱۴ میلیاردی که با آموزش سبکتر توسعه یافتهاند، میتوانند بهطور منظم از o3 برای پشتیبانی از عوامل واقعی پیشی بگیرند، که دستاوردهای حاصل از تخصصگرایی را برجسته میکند @corbtt
- دیدگاه کنونی نشان میدهد که کار پژوهشهای عمیق و عامل Codex از طریق آموزش مدلها بر روی وظایف RL با افق کوتاه و پایداری عمومی انجام میشود، در حالی که آموزش end-to-end بر روی وظایف RL بسیار پراکنده، هنوز دور از دسترس است @natolambert
- MIT یک تکنیک انیمیشن متحولکننده توسعه میدهد که حرکت نرم و لهشونده را با فیزیک در سطح پیکسار و بهصورت بلادرنگ شبیهسازی میکند، و پتانسیل ایجاد انقلاب در انیمیشن، بازیسازی و رباتیک را دارد @MIT