اخبار هوش مصنوعی در 2026-02-19
مدلهای جدید هوش مصنوعی
- گوگل جمینای 3.1 پرو را منتشر کرد که به امتیاز 77.1% در ARC-AGI-2 دست یافت (بیش از دو برابر امتیاز جمینای 3 پرو) و در شاخص هوش مصنوعی تحلیلی پیشرو است، با هزینهای کمتر از نصف رقبای پیشرو @GoogleDeepMind
- جمینای 3.1 پرو در Text Arena رتبه اول مشترک (امتیاز 1500)، در Arena Expert جزو 3 مدل برتر (1538) و در Code Arena رتبه 6 را کسب کرد، همتراز با کلاد اوپوس 4.5 @arena
- Qwen3.5-397B-A17B علیبابا به یکی از 3 مدل برتر متنباز در Text Arena تبدیل شد، در مجموع رتبه 20 را کسب کرد و 8.6 تا 19.0 برابر سریعتر از Qwen3-Max رمزگشایی میکند @arena
- گوگل مدل تولید موسیقی Lyria 3 را در اپلیکیشن جمینای راهاندازی کرد که در عرض چند ثانیه از ایدهها، تصاویر یا ویدئوها موسیقی تولید میکند @JeffDean
- Arcee.ai مدل Trinity Large را منتشر کرد، اولین مدل در مقیاس پیشرو از خانواده Trinity MoE، که اکنون در Text Arena در دسترس است @arena
تحلیل صنعت
- گزارشها حاکی از آن است که OpenAI در حال نهایی کردن قرارداد تأمین مالی 100 میلیارد دلاری با ارزشی بیش از 850 میلیارد دلار است @TechCrunch
- World Labs با جذب 1 میلیارد دلار سرمایه جدید از AMD، Autodesk، Emerson Collective، Fidelity، NVIDIA و Sea برای باز کردن قفل هوش فضایی @a16z
- a16z رهبری سری D شرکت Temporal را بر عهده گرفت، زیرا اجرای پایدار برای عاملهای هوش مصنوعی طولانیمدت در OpenAI، Replit، Lovable و Abridge حیاتی میشود @a16z
- مایکروسافت Grok 4.1 Fast را به مجموعه چندمدلی Copilot Studio برای ساخت عاملهای سفارشی اضافه کرد @satyanadella
- Linear در عرض تنها یک ماه، 600 نفر از کارکنان Oscar Health را از یکی از پیچیدهترین نمونههای Jira در جهان با حذف فیلدهای سفارشی منتقل کرد @GergelyOrosz
اخلاق و جامعه
- OpenAI مبلغ 7.5 میلیون دلار به پروژه همترازی مؤسسه امنیت هوش مصنوعی اختصاص داد تا تحقیقات مستقل در مورد کاهش خطرات ایمنی و امنیتی ناشی از هوش مصنوعی نامنظم را تأمین مالی کند @OpenAINewsroom
- تحقیقات نشان میدهد که مدلهای هوش مصنوعی در برابر دستورالعملهای دستکاری دادهها مقاومت میکنند، اما میتوان از موانع امنیتی عبور کرد، که نگرانیهایی را در مورد همترازی برای سوءرفتار علمی ایجاد میکند @emollick
- مطالعه Nature Medicine نشان میدهد که هوش مصنوعی با دقت 95% در آزمونهای پزشکی قبول شد، اما زمانی که انسانها از آن برای تریاژ استفاده کردند، دقت به زیر 35% در مقایسه با گروه کنترل گوگل کاهش یافت @random_walker
کاربردها
- Perplexity مرورگر Comet iOS را با پیشسفارشهای فعال راهاندازی کرد که هوش مصنوعی را در هر صفحه وب با عملکردی در حد سافاری ادغام میکند @AravSrinivas
- Google Labs ابزار Pomelli را منتشر کرد که در عرض چند ثانیه و بدون هزینه برای کسبوکارهای کوچک، داراییهای بازاریابی حرفهای ایجاد میکند @joshwoodward
- PostHog مدیریت لاگ رایگان را با 50 گیگابایت فضای رایگان ماهانه با هزینه 0.25 دلار به ازای هر گیگابایت با استفاده از OpenTelemetry با زمینه فرانتاند و بکاند معرفی کرد @posthog
- Cursor قابلیت سندباکس عامل را در macOS، Linux و Windows اضافه کرد که به عاملها اجازه میدهد به صورت امن اجرا شوند و تنها زمانی که از سندباکس خارج میشوند، درخواست تأیید کنند @cursor_ai
پژوهشها
- جمینای 3.1 پرو به 98% در ARC-AGI-1 با هزینه 0.52 دلار به ازای هر وظیفه و 77% در ARC-AGI-2 با هزینه 0.96 دلار به ازای هر وظیفه دست یافت و مرز پارتو عملکرد و کارایی را جابجا کرد @arcprize
- فرانسوا شوله استدلال میکند که کدنویسی عاملمحور به اندازه کافی پیشرفته، اساساً یادگیری ماشین است، با اهداف بهینهسازی، محدودیتهای جستجو و خروجیهای جعبه سیاه که نگرانیهایی را در مورد بیشبرازش و رانش مفهوم ایجاد میکند @fchollet
- NVIDIA Dynamo v0.9.0 را با FlashIndexer منتشر کرد که به توان عملیاتی حدود 10 میلیارد توکن در ثانیه و تأخیر p99 کمتر از 10 میکروثانیه در یک گره دست مییابد @NVIDIAAIDev
- مایکروسافت ریسرچ گزارشی جامع در مورد یکپارچگی رسانه و روشهای احراز هویت منتشر کرد که مسیرهای عملی به سمت منشأ قابل اعتماد در تصاویر، صدا و ویدئو را بررسی میکند @MSFTResearch