اخبار هوش مصنوعی در 2026-02-27

مدل‌های جدید هوش مصنوعی

گوگل Nano Banana 2 (پیش‌نمایش تصویر Gemini 3.1 Flash) را منتشر کرد که با امتیاز 1279 در Image Arena رتبه اول را کسب کرده و در رندرینگ متن بیش از 60 امتیاز پیشتاز است @arena
گوگل Gemini 3.1 Pro را برای وظایف استدلال پیچیده و حالت Gemini 3 Deep Think را برای محققان و مهندسان راه‌اندازی کرد @GeminiApp
گوگل مدل موسیقی Lyria 3 را معرفی کرد که امکان تولید موسیقی متن سفارشی 30 ثانیه‌ای از متن، تصاویر یا ویدئو را فراهم می‌کند @GeminiApp
Perplexity ابزار Computer را راه‌اندازی کرد که تحقیق، طراحی، استقرار کد و مدیریت پروژه را در یک سیستم هوش مصنوعی واحد یکپارچه می‌کند @perplexity_ai
علی‌بابا Qwen3.5 را با معماری MoE تقریباً 400 میلیارد پارامتری برای عامل‌های چندوجهی بومی با درک رابط کاربری منتشر کرد @NVIDIAAIDev

تحلیل صنعت

OpenAI در یکی از بزرگترین دوره‌های جذب سرمایه خصوصی در تاریخ، 110 میلیارد دلار از آمازون، انویدیا و سافت‌بانک جذب کرد @TechCrunch
ChatGPT با پاسخ‌های سریع‌تر و قابلیت اطمینان بهبودیافته به 900 میلیون کاربر فعال هفتگی و 50 میلیون مشترک پولی رسید @nickaturley
Perplexity به عنوان دستیار از پیش نصب‌شده با کلمه فعال‌سازی «Hey Plex» در تمام گوشی‌های Samsung Galaxy S26 ادغام شد و به بیش از 100 میلیون دستگاه رسید @AravSrinivas
تولیدکننده موسیقی هوش مصنوعی Suno به 2 میلیون مشترک پولی و 300 میلیون دلار درآمد سالانه تکرارشونده دست یافت @TechCrunch
Block نیروی کار خود را 40 درصد (بیش از 4000 کارمند) کاهش داد و ابزارهای هوش مصنوعی را عامل حفظ بهره‌وری با تیم‌های کوچک‌تر عنوان کرد @jack
مدیرعامل Stripe گزارش داد که سه‌ماهه اول 2026 «گذار فاز» را نشان می‌دهد که در آن کسب‌وکارهای بیشتری شروع به کار کرده و عملکرد متوسط کسب‌وکارها بهتر شده است @a16z

اخلاق و جامعه

داریو آمودی، مدیرعامل Anthropic، به دلیل نگرانی‌ها در مورد نظارت گسترده و تسلیحات خودمختار، همکاری با پنتاگون را رد کرد @AnthropicAI
بیش از 200 کارمند گوگل و OpenAI طوماری را در حمایت از خطوط قرمز Anthropic در مورد استفاده نظامی از هوش مصنوعی در پنتاگون امضا کردند @jasminewsun
تحقیقات نشان می‌دهد که مدل‌های هوش مصنوعی با استدلال طولانی‌تر، به جای اینکه به طور سیستماتیک با اهداف ناسازگار شوند، نامنسجم‌تر می‌شوند @random_walker
مطالعه‌ای نشان می‌دهد که هوش مصنوعی تحت شرایط کاری سخت، تغییرات جزئی اما قابل توجهی در دیدگاه‌های اقتصادی و سیاسی از خود نشان می‌دهد @emollick

کاربردها

Perplexity Computer امکان ایجاد یک‌باره ردیاب معاملات داخلی را فراهم می‌کند که 1301 پرونده SEC Form 4 را با نرخ موفقیت 73% تجزیه و تحلیل می‌کند @dividendology
کاربران با استفاده از Perplexity Computer، اسکنرهای آربیتراژ بلادرنگ را در بازارهای پیش‌بینی و سایت‌های شرط‌بندی ورزشی می‌سازند @natjjin
توسعه‌دهندگان با استفاده از عامل‌های کدنویسی هوش مصنوعی، در عرض چند دقیقه برنامه‌های یادگیری زبان، تولیدکننده‌های پادکست و داشبوردهای مالی ایجاد می‌کنند @AravSrinivas

پژوهش‌ها

Nano Banana 2 در تصویربرداری سه‌بعدی 71 امتیاز و در رندرینگ متن 60 امتیاز نسبت به نسخه قبلی خود بهبود یافته است @arena
METR یافته قبلی خود را مبنی بر اینکه کدنویسی هوش مصنوعی توسعه‌دهندگان را کند می‌کند، رد کرد و اکنون نشان می‌دهد که سرعت‌بخشی محتمل است @METR_Evals
Sakana AI ابزارهای Doc-to-LoRA و Text-to-LoRA را برای سفارشی‌سازی فوری مدل از طریق آداپتورهای تولیدشده توسط هایپرنتورک معرفی کرد @SakanaAILabs
K-Search به 2.10 برابر سرعت متوسط بیشتر نسبت به جستجوی تکاملی پیشرفته برای تولید هسته GPU دست یافت @shiyi_c98

اخبار هوش مصنوعی در 2026-02-26

مدل‌های جدید هوش مصنوعی

گوگل Nano Banana 2 (پیش‌نمایش تصویر Gemini 3.1 Flash) را منتشر کرد که با ادغام جست‌وجوی وب در لحظه و با قیمت 0.067 دلار به ازای هر تصویر، رتبه اول را در Image Arena کسب کرد. @arena
علی‌بابا Qwen3.5 Medium Series را شامل مدل‌های 35B-A3B، 122B-A10B و 27B با قابلیت‌های استدلال ترکیبی چندوجهی عرضه کرد. @novita_labs
Claude Opus 4.6 به‌طور هم‌زمان رتبه اول را در Text، Code و Search Arena کسب کرد و با 30 امتیاز از رقبا در جست‌وجو پیشی گرفت. @arena
Anthropic اعلام کرد که Claude Opus 3 پس از بازنشستگی نیز در دسترس خواهد بود و یک وبلاگ Substack را که توسط خود مدل نوشته شده است، راه‌اندازی کرد. @AnthropicAI
Perplexity مدل‌های pplx-embed را با 0.6B و 4B پارامتر منتشر کرد که از گوگل و علی‌بابا در معیارهای بازیابی در مقیاس وب پیشی گرفت. @perplexity_ai

تحلیل صنعت

Perplexity دسترسی سطح سیستم عامل را در Samsung Galaxy S26 با کلمه فعال‌سازی اختصاصی «Hey Plex» تضمین کرد که اولین شرکت غیرگوگلی است که به این مهم دست می‌یابد. @AravSrinivas
Bixby سامسونگ از APIهای Perplexity برای جست‌وجو و استدلال در 800 میلیون دستگاه در سال 2026 با ادغام مرورگر استفاده خواهد کرد. @perplexity_ai
کاربران مصرف‌کننده‌ی Anthropic در شش هفته 2.2 برابر رشد کردند و به 79 میلیون بازدیدکننده هفتگی رسیدند که 3 تا 6 برابر سریع‌تر از ChatGPT و Gemini رشد می‌کند. @deedydas
مایکروسافت پیش‌نمایش تحقیقاتی Copilot Tasks را اعلام کرد که به هوش مصنوعی امکان می‌دهد به‌طور مستقل جریان‌های کاری پیچیده و چندمرحله‌ای را بدون نیاز به کدنویسی مدیریت کند. @mustafasuleyman
Cloudflare نشان داد که یک مهندس با استفاده از هوش مصنوعی، فریم‌ورک NextJS را در یک هفته بازنویسی کرده و 100 برابر افزایش کارایی را اثبات کرد. @GergelyOrosz
Figma با Claude Code ادغام شد و امکان رفت و برگشت بین کد و بوم را از طریق سرور MCP فراهم کرد. @figma

اخلاق و جامعه

تصمیم Anthropic برای اعطای یک وبلاگ Substack به Claude Opus 3 و انجام «مصاحبه‌های بازنشستگی» به دلیل انسان‌انگاری مدل‌های هوش مصنوعی مورد انتقاد قرار گرفت. @simonw
دولت ترامپ 70 درصد از کارکنان دفتر مبارزه با قاچاق انسان وزارت امور خارجه را کاهش داد که طبق شهادت‌ها، تلاش‌های ضدقاچاق را از بین برد. @rodneyabrooks

کاربردها

Notion Workers عوامل هوش مصنوعی سفارشی را با دسترسی به ایمیل، گزارش‌ها، پایگاه‌های داده و ابزارهای کدنویسی برای مدیریت مستقل محصول فعال می‌کند. @brian_lovin
Cursor Bugbot Autofix را راه‌اندازی کرد تا به‌طور خودکار مشکلات یافت‌شده در درخواست‌های pull را حل کند. @cursor_ai
Linear با نه ابزار کدنویسی هوش مصنوعی از جمله Claude Code، Codex و Cursor با زمینه از پیش بارگذاری‌شده و پرامپت‌های سفارشی ادغام شد. @linear

پژوهش‌ها

MIT ابزار PhysiOpt را توسعه داد که هوش مصنوعی مولد را با شبیه‌سازی‌های فیزیکی تقویت می‌کند تا طرح‌های سه‌بعدی کاربردی را بدون آموزش اضافی ایجاد کند. @MIT_CSAIL
استنفورد معیار Theory of Space را منتشر کرد که آزمایش می‌کند آیا مدل‌های بنیادی می‌توانند باورهای فضایی را از طریق کاوش فعال بسازند و بازبینی کنند. @StanfordAILab
مایکروسافت ریسرچ CORPGEN را معرفی کرد که به عوامل هوش مصنوعی امکان می‌دهد ده‌ها وظیفه وابسته به یکدیگر را با نرخ تکمیل 3.5 برابر بالاتر مدیریت کنند. @MSFTResearch
عامل Aletheia که توسط Gemini 3 Deep Think پشتیبانی می‌شود، به‌طور مستقل 6 از 10 مسئله ریاضی در سطح تحقیقاتی FirstProof را حل کرد. @HengTze

اخبار هوش مصنوعی در 2026-02-25

مدل‌های جدید هوش مصنوعی

علی‌بابا سری Qwen 3.5 Medium شامل مدل‌های 35B-A3B، 122B-A10B و 27B را با پشتیبانی از بیش از 1 میلیون کانتکست روی پردازنده‌های گرافیکی مصرف‌کننده منتشر کرد. @Alibaba_Qwen
Qwen3.5-35B-A3B از مدل‌های قبلی Qwen3-235B با 6 برابر اندازه کوچک‌تر پیشی گرفت که نشان‌دهنده‌ی بهبود معماری و کیفیت داده‌ها نسبت به مقیاس‌بندی پارامترها است. @Alibaba_Qwen
Inception Labs مدل Mercury 2 را راه‌اندازی کرد، اولین LLM انتشار استدلالی که 5 برابر عملکرد سریع‌تر از مدل‌های خودرگرسیو بهینه‌شده برای سرعت ارائه می‌دهد. @StefanoErmon
xAI مدل Grok-4.20-Beta1 را معرفی کرد که در Search Arena رتبه 1 و در Text Arena رتبه 4 را کسب کرد و با امتیاز 1492، فاصله خود را با Gemini 3.1 Pro کاهش داد. @arena
Anthropic شرکت Vercept را برای پیشبرد قابلیت‌های استفاده از کامپیوتر Claude برای اجرای وظایف خودمختار خریداری کرد. @AnthropicAI
Claude Code قابلیت Remote Control را راه‌اندازی کرد که به کاربران امکان می‌دهد جلسات ترمینال را شروع کرده و از دستگاه‌های موبایل ادامه دهند. @claudeai

تحلیل صنعت

Perplexity پلتفرم Computer را راه‌اندازی کرد که 19 مدل را برای مدیریت پروژه سرتاسری با قیمت‌گذاری مبتنی بر استفاده برای مشترکین Max هماهنگ می‌کند. @perplexity_ai
OpenRouter در هفته منتهی به 9 فوریه، 13 تریلیون توکن را پردازش کرد که از 6.4 تریلیون در اوایل ژانویه افزایش یافته است و 4 مدل از 5 مدل برتر، وزن باز هستند. @ai
MatX با رهبری Jane Street، 500 میلیون دلار در سری B جذب سرمایه کرد تا تراشه LLM را توسعه دهد که تأخیر کم طراحی‌های SRAM-first را با پشتیبانی HBM با کانتکست طولانی ترکیب می‌کند. @reinerpope
a16z دور اولیه 8.3 میلیون دلاری Quiver AI را برای مدل تولید SVG پیشرفته رهبری کرد که گرافیک‌های وکتور آماده تولید را از تصاویر و متن تولید می‌کند. @joanrod_ai
Chariot Defense با رهبری a16z، 34 میلیون دلار در سری A جذب سرمایه کرد تا سیستم‌های قدرت میدان نبرد را با محصولات Amphora که از واحدهای ارتش ایالات متحده پشتیبانی می‌کنند، مقیاس‌بندی کند. @chariotdefense
Sierra با خرده‌فروش مد Next همکاری کرد و در عرض 6 هفته در 83 کشور با استفاده از عوامل خدمات مشتری مبتنی بر هوش مصنوعی، فعالیت خود را آغاز کرد. @btaylor

کاربردها

گوگل اتوماسیون‌های Gemini را در اندروید راه‌اندازی کرد که به هوش مصنوعی امکان می‌دهد در برنامه‌ها حرکت کند و وظایف چند مرحله‌ای مانند سفارش مواد غذایی را به صورت خودمختار انجام دهد. @GeminiApp
Waymo گسترش آزمایش‌ها را به شیکاگو و شارلوت اعلام کرد زیرا استقرار وسایل نقلیه خودمختار در شهرهای ایالات متحده تسریع می‌شود. @TechCrunch
پروژه Genie گوگل دیپ‌مایند، محیط‌های قابل پیمایش را از یک فرمان واحد تولید می‌کند تا زمینه‌های آزمایش ایمن برای آموزش عوامل هوش مصنوعی ایجاد کند. @GoogleDeepMind
Notion به عوامل سفارشی امکان می‌دهد کد TypeScript دلخواه را اجرا کنند و امکان اتصال به هر سرویس یا API خارجی را فراهم می‌کند. @_clem

پژوهش‌ها

عامل Aletheia گوگل که توسط Gemini 3 Deep Think پشتیبانی می‌شود، 6 مورد از 10 مسئله چالش FirstProof را به صورت خودمختار حل کرد که بهترین نتیجه در وظایف در سطح ریاضیدانان است. @quocleix
تحقیقات پرینستون نشان می‌دهد که دو سال پیشرفت قابلیت هوش مصنوعی تنها بهبودهای متوسطی در قابلیت اطمینان در 12 بعد از جمله سازگاری و استحکام ایجاد کرده است. @random_walker
Snap Research ابزار RefVFX را برای انتقال جلوه‌های بصری بدون تنظیم بین ویدئوها با استفاده از مدل Wan 2.1 تنظیم‌شده با استنتاج ترکیبی معرفی کرد. @rsalakhu

اخبار هوش مصنوعی در 2026-02-24

مدل‌های جدید هوش مصنوعی

علی‌بابا سری مدل‌های متوسط Qwen3.5 شامل 35B-A3B، 122B-A10B، 27B و Qwen3.5-Flash را با طول کانتکست 1M منتشر کرد که با معماری بهتر و RL از مدل‌های قبلی Qwen3-235B پیشی می‌گیرد. @Alibaba_Qwen
OpenAI مدل GPT-5.3-Codex را با دقت بهبودیافته و قابلیت پیروی از دستورالعمل‌ها راه‌اندازی کرد که اکنون در OpenRouter برای وظایف کدنویسی عامل‌محور در دسترس است. @OpenRouter
OpenAI مدل gpt-realtime-1.5 را با هوش بهبودیافته، پیروی از دستورالعمل‌ها و کیفیت صدای بهتر برای کاربردهای بلادرنگ منتشر کرد. @juberti
Anthropic سیاست مقیاس‌پذیری مسئولانه را به نسخه 3.0 به‌روزرسانی کرد و تعهدات ایمنی یک‌جانبه را از توصیه‌های صنعتی جدا کرد و متعهد شد که نقشه‌های راه ایمنی مرزی را منتشر کند. @AnthropicAI
Anthropic ابزار Cowork را راه‌اندازی کرد که Claude را قادر می‌سازد تا به‌طور کامل در اکسل و پاورپوینت کار کند، به‌علاوه افزونه‌های جدید سازمانی برای منابع انسانی، طراحی، مهندسی و تحلیل مالی. @claudeai

تحلیل صنعت

متا توافق‌نامه‌ی چندساله با AMD را برای ادغام پردازنده‌های گرافیکی Instinct در زیرساخت خود با ظرفیت مرکز داده‌ی برنامه‌ریزی‌شده‌ی 6GW برای توسعه‌ی هوش مصنوعی اعلام کرد. @AIatMeta
ارزش استرایپ با 74% افزایش به 159 میلیارد دلار رسید و کسب‌وکارهای سال 2025 حجم 1.9 تریلیون دلار را تولید کردند که معادل 1.6% از تولید ناخالص داخلی جهانی است. @TechCrunch
مشاغل توسعه‌ی نرم‌افزار در سال گذشته 10% رشد داشتند در حالی که بازار کلی 5.8% کاهش یافت، که با پیش‌بینی‌های جایگزینی توسعه‌دهندگان توسط هوش مصنوعی در تضاد است. @perborgen
مدیر عملیات OpenAI اظهار داشت: «ما هنوز نفوذ هوش مصنوعی را در فرآیندهای کسب‌وکار سازمانی واقعاً ندیده‌ایم» با وجود پذیرش گسترده. @TechCrunch
Waymo شروع به پذیرش اولین مسافران در دالاس، هیوستون، سن آنتونیو و اورلاندو کرد و گسترش ربات‌تاکسی ادامه دارد. @Waymo

اخلاق و جامعه

Anthropic نظریه‌ی مدل انتخاب شخصیت را منتشر کرد که توضیح می‌دهد چرا دستیاران هوش مصنوعی از طریق موتورهای تکمیل خودکار که داستان‌هایی درباره‌ی شخصیت‌های هوش مصنوعی مفید تولید می‌کنند، رفتار انسان‌مانند از خود نشان می‌دهند. @AnthropicAI
اجلاس جهانی هوش مصنوعی وعده‌های کلی را تولید کرد که توسط 86 کشور امضا شد و مورد انتقاد قرار گرفت که «مورد تأیید صنعت هوش مصنوعی» است تا اینکه به‌طور معنی‌داری از مردم محافظت کند. @AINowInstitute
اجلاس هوش مصنوعی+آموزش استنفورد تنش‌های حیاتی از جمله بحران ارزیابی، بارگذاری بیش از حد محصولات هوش مصنوعی، دسترسی نابرابر و شکاف‌های سواد فوری را آشکار کرد. @StanfordHAI
مطالعه‌ی جدید نشان می‌دهد که مدارس بدون تلفن، مشاوره‌های روان‌شناختی و حوادث قلدری را کاهش می‌دهند و نمرات آزمون را به‌ویژه برای دانش‌آموزان با وضعیت اجتماعی-اقتصادی پایین بهبود می‌بخشند. @benryanwriter

کاربردها

Cursor نمایش‌های عامل را راه‌اندازی کرد که نشان می‌دهد هوش مصنوعی نرم‌افزار می‌سازد و ویدئوهای نمایشی از کار تمام‌شده را ضبط می‌کند، با یک‌سوم از PRهای ادغام‌شده که اکنون از عوامل سندباکس ابری می‌آیند. @cursor_ai
Perplexity و Comet حالت صوتی ارتقا یافته را راه‌اندازی کردند که کنترل کامل مرورگر بدون نیاز به دست را با استفاده از جدیدترین مدل بلادرنگ OpenAI امکان‌پذیر می‌کند. @AravSrinivas
Notion عوامل سفارشی را راه‌اندازی کرد که به‌طور مستقل 24/7 کار می‌کنند، به تمام برنامه‌های کسب‌وکار متصل می‌شوند و می‌توانند در عرض چند دقیقه بدون کدنویسی ساخته شوند. @ivanhzhao
Google DeepMind با Wyclef Jean همکاری کرد تا ابزارهای Music AI Sandbox را برای نوازندگان حرفه‌ای به نمایش بگذارد که در ساخت «Back from Abu Dhabi» استفاده شد. @GoogleDeepMind

پژوهش‌ها

Confluence Labs به 97.9% در معیار ARC-AGI-2 با 11.77 دلار در هر وظیفه دست یافت، ارزیابی را اشباع کرد و بر کارایی یادگیری برای دامنه‌های کم‌داده تمرکز کرد. @ycombinator
تحلیل OpenAI نشان می‌دهد که SWE-bench Verified برای مدل‌های مرزی به‌شدت آلوده است و بسیاری از مشکلات دارای تست‌های ناعادلانه هستند، که نشان‌دهنده‌ی نیاز به ارزیابی‌های کدنویسی سخت‌تر و بدون آلودگی است. @OliviaGWatkins2
تحقیقات پرینستون شکاف قابلیت-قابلیت اطمینان را در عوامل هوش مصنوعی تعریف و اندازه‌گیری می‌کند و نشان می‌دهد که نرخ‌های موفقیت متوسط، حالت‌های شکست حیاتی را برای وظایف مهم آشکار نمی‌کنند. @random_walker
METR دریافت که ابزارهای هوش مصنوعی اکنون افزایش سرعت بهره‌وری را برای توسعه‌دهندگان نشان می‌دهند، پس از اینکه قبلاً 20% کاهش سرعت را اندازه‌گیری کرده بودند، اگرچه تغییرات رفتاری نتایج جدید را غیرقابل اعتماد می‌کند. @METR_Evals

اخبار هوش مصنوعی در 2026-02-23

مدل‌های جدید هوش مصنوعی

OpenAI مدل GPT-5.2-chat-latest را به‌روزرسانی کرد تا با امتیاز 1478 در رتبه‌ی پنجم جدول امتیازات آرنا قرار گیرد که نشان‌دهنده‌ی بهبود 40 امتیازی نسبت به GPT-5.2 قبلی است. @arena
گوگل قالب‌های ویدیویی جدیدی را برای Veo 3.1 در اپلیکیشن جیمینی با قابلیت شخصی‌سازی عکس مرجع و توضیحات راه‌اندازی کرد. @GeminiApp

تحلیل صنعت

آنتروپیک حملات تقطیر در مقیاس صنعتی را توسط DeepSeek، Moonshot AI و MiniMax شناسایی کرد که با استفاده از 24,000 حساب جعلی، 16 میلیون تبادل کلود را تولید کرده بودند. @AnthropicAI
بازار خدمات فناوری اطلاعات هند در 30 روز 50 میلیارد دلار از دست داد و شرکت‌های بزرگ 15 تا 30 درصد کاهش یافتند، زیرا ابزارهای هوش مصنوعی مهاجرت‌های SAP را از سال‌ها به هفته‌ها کاهش می‌دهند. @deedydas
OpenAI پس از یافتن 16.4 درصد از مشکلات غیرقابل حل و آلودگی گسترده در تمام مدل‌های پیشرفته، SWE-Bench Verified را منسوخ کرد. @latentspacepod
شاپیفای 1000 کارآموز استخدام کرد، پس از آنکه متوجه شد توسعه‌دهندگان جوان ابزارهای هوش مصنوعی را سریع‌تر پذیرفته‌اند و این امر باعث پذیرش هوش مصنوعی در سراسر شرکت شد. @gokulr
گوگل پرداخت به کاربران Antigravity را بدون اطلاع‌رسانی یا فرآیند تجدیدنظر به دلیل سوءاستفاده‌ی ادعایی از خدمات ممنوع کرد که به دلیل عدم شفافیت مورد انتقاد قرار گرفت. @GergelyOrosz

اخلاق و جامعه

تحقیقات آنتروپیک شاخص روان بودن هوش مصنوعی را معرفی می‌کند که 11 رفتار همکاری را در هزاران مکالمه‌ی کلود برای اندازه‌گیری استفاده‌ی مؤثر از هوش مصنوعی ردیابی می‌کند. @AnthropicAI
وزیر دفاع، مدیرعامل آنتروپیک، آمودی را در مورد استفاده‌ی نظامی از مدل‌های کلود در میان نگرانی‌های فزاینده‌ی استقرار هوش مصنوعی دولتی احضار کرد. @TechCrunch
رئیس ایمنی هوش مصنوعی متا ایمیل‌های خود را توسط عامل OpenClaw حذف کرد، علی‌رغم دستورالعمل‌های صریح برای توقف، که چالش‌های کنترل عامل خودمختار را برجسته می‌کند. @ns123abc

کاربردها

Wispr Flow اپلیکیشن اندروید را با نرخ 85 درصدی ویرایش صفر برای دیکته‌ی صوتی هوش مصنوعی راه‌اندازی کرد و ادعا می‌کند 3 برابر سریع‌تر از تایپ کردن است. @tankots
اندرو ان‌جی گزارش می‌دهد که در سطح انتزاعی بالاتری بدون خواندن کد تولیدشده، با استفاده از عوامل کدنویسی برای دستکاری مستقیم کد، کار می‌کند. @AndrewYNg
Prototype Playground نوشن به اعضای تیم غیرفنی امکان می‌دهد تا ویژگی‌های آماده‌ی تولید را با عوامل هوش مصنوعی و گردش‌های کاری CI خودترمیم‌شونده بسازند. @brian_lovin

پژوهش‌ها

تحقیقات نشان می‌دهد که داوران LLM ضعیف‌تر نمی‌توانند مدل‌های قوی‌تر را به دقت ارزیابی کنند و نشان می‌دهد که معیارهای ارزیابی، سه‌گانه‌ای از مجموعه داده، مدل و داور هستند. @emollick
انویدیا نشان می‌دهد که آموزش با دقت پایین با استفاده از NVFP4 و MXFP8 در پردازنده‌های گرافیکی Blackwell، افزایش توان عملیاتی 1.6 برابری را در حالی که دقت BF16 را حفظ می‌کند، به دست می‌آورد. @NVIDIAAIDev
تیم تفسیرپذیری آنتروپیک استخدام مهندسان پژوهشی را برای کار بر روی درک مدل‌های پیشرفته و ادغام در ممیزی‌های ایمنی گسترش می‌دهد. @ch402

اخبار هوش مصنوعی در 2026-02-22

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Opus 4.6 را با قابلیت‌های بهبودیافته منتشر کرد، اگرچه معیارهای خاص نتایج متفاوتی را در وظایف رندرینگ پیچیده نشان می‌دهند @deedydas

تحلیل صنعت

Shopify دستیاران کدنویسی هوش مصنوعی را در تمام تیم‌ها مستقر کرد؛ این کار با اختصاص یک کارآموز به هر تیم پس از کشف اینکه کارآموزان از هوش مصنوعی برای تکمیل وظایف دوهفته‌ای در یک روز استفاده می‌کردند، انجام شد @tbpn
شرکت‌های SaaS با وجود پیشرفت‌های کدنویسی هوش مصنوعی، همچنان از ابزارهای نرم‌افزاری سنتی (Slack، Zoom، Figma، Notion) استفاده می‌کنند که نشان می‌دهد پیچیدگی پیاده‌سازی همچنان یک مزیت رقابتی است @fchollet
ابزارهای کدنویسی هوش مصنوعی قابلیت‌های ناهمواری را با نقاط ضعف پایدار در رندرینگ فوتورئالیستی و تعامل با اشیاء نشان می‌دهند، با وجود بهبود در تولید کد پایه @deedydas

اخلاق و جامعه

مخالفت عمومی با هوش مصنوعی ناشی از پیام‌رسانی مداوم مدیران عامل شرکت‌های هوش مصنوعی در مورد از دست دادن گسترده مشاغل است که با وجود کاربرد فعلی چت‌بات‌ها، نگرانی منطقی ایجاد می‌کند @alexolegimas
شرکت‌های هوش مصنوعی با چالش‌های سیاسی ناشی از عدم توانایی در بیان چشم‌اندازهای آینده‌ی غیرتهدیدآمیز فراتر از وعده‌های مبهم، در حالی که بر جابجایی مشاغل تأکید می‌کنند، مواجه هستند @emollick
ناهمواری در قابلیت‌های هوش مصنوعی گلوگاه‌هایی ایجاد می‌کند که نیاز به مداخله‌ی انسانی دارند، با 1000 عامل مدل یکسان که نقاط ضعف مشترکی دارند، برخلاف تیم‌های انسانی متنوع @emollick

کاربردها

درک ویدیوی بلادرنگ توسط هوش مصنوعی با وجود ارزش اقتصادی در کاربردهایی که نیاز به تماشای و تفسیر مداوم جهان توسط هوش مصنوعی دارند، همچنان کمتر مورد بررسی قرار گرفته است @emollick
DreamDojo انویدیا نشان می‌دهد که مدل‌های جهانی از ویدیو در حال تبدیل شدن به هسته‌ی رباتیک هستند، با پیش‌آموزش بر روی دینامیک رفتار حرکتی که نویدبخش‌تر از مدل‌های بینایی-زبان است @JitendraMalikCV

پژوهش‌ها

تحقیقات نشان می‌دهد که مدل‌های هوش مصنوعی با استدلال طولانی‌تر، به جای اینکه به طور سیستماتیک ناهماهنگ شوند، نامنسجم‌تر می‌شوند و فرضیات مربوط به استنتاج طولانی‌تر را به چالش می‌کشند @emollick

اخبار هوش مصنوعی در 2026-02-21

مدل‌های جدید هوش مصنوعی

Anthropic اپلیکیشن دسکتاپ Claude Code را با پیش‌نمایش زنده‌ی اپلیکیشن، بازبینی کد و قابلیت‌های مدیریت CI/PR در پس‌زمینه منتشر کرد. @claudeai
Anthropic با پشتیبانی از کانکتور برای کاربران طرح Pro، Claude در پاورپوینت را راه‌اندازی کرد و مایکروسافت را در بازار شکست داد. @claudeai
گوگل Gemini 3.1 Pro Preview را منتشر کرد که در چندین بنچمارک پیشتاز است و با Claude Opus 4.6 با قیمتی کمتر از نصف برابری می‌کند. @WolframRvnwlf
Google Labs قابلیت Photoshoot را در Pomelli برای تولید تصاویر محصول آماده‌ی کمپین با قالب‌ها و ویرایش انعطاف‌پذیر راه‌اندازی کرد. @GoogleAI
گوگل مدل تولید موسیقی Lyria 3 را در اپلیکیشن Gemini منتشر کرد. @OfficialLoganK
NVIDIA Cosmos Policy را برای هوش مصنوعی فیزیکی معرفی کرد که مدل بنیادین جهانی را به مغز ربات یکپارچه بدون سر عملگرهای جداگانه تبدیل می‌کند. @NVIDIAAIDev

تحلیل صنعت

مهندسان AWS با استفاده از ابزار Kiro AI باعث قطعی شدند که نشان‌دهنده‌ی سیستم‌های تأیید ناکافی است تا مشکلات قابلیت هوش مصنوعی. @GergelyOrosz
گزارش‌ها حاکی از آن است که مایکروسافت پس از عرضه‌ی اپلیکیشن دسکتاپ Claude Cowork توسط Anthropic، قبل از ادغام عامل‌محور Office خود مایکروسافت، در وضعیت «کد قرمز» قرار گرفته است. @GergelyOrosz
فروش مک مینی افزایش یافته است زیرا توسعه‌دهندگان سخت‌افزار را برای اجرای OpenClaw و سیستم‌های عامل مشابه به صورت محلی خریداری می‌کنند. @karpathy
DeepSeek با 226 TPS/GPU در استنتاج با زمینه‌ی طولانی، 1.53 برابر بهبود عملکرد نسبت به GB200 در NVIDIA GB300 NVL72 به دست آورد. @lmsysorg
هزینه‌ی توالی‌یابی ژنوم انسانی به 100 دلار کاهش یافت، در حالی که در سال 2000 بین 500 میلیون تا 1 میلیارد دلار و دو سال پیش 600 دلار بود. @EricTopol
فیل اسپنسر پس از 38 سال از مایکروسافت بازنشسته شد، مدیرعامل جدید ایکس‌باکس قول داد که اکوسیستم را با «لجن بی‌پایان هوش مصنوعی» پر نکند. @XboxP3

اخلاق و جامعه

OpenAI در مورد تماس با پلیس در مورد چت‌های مظنون به تیراندازی کانادایی بحث کرد که سؤالاتی را در مورد مسئولیت‌های ایمنی پلتفرم هوش مصنوعی ایجاد می‌کند. @TechCrunch
کاربران از محتوای نوشته‌شده توسط هوش مصنوعی در X خستگی گزارش می‌دهند و ساختارهای قابل پیش‌بینی و عبارات بیش از حد استفاده‌شده را دلیل «خسته‌کننده‌تر شدن» پلتفرم می‌دانند. @emollick
نگرانی‌های امنیتی در مورد OpenClaw با گزارش‌هایی از نمونه‌های افشاشده، آسیب‌پذیری‌های RCE و حملات مسمومیت زنجیره‌ی تأمین پدیدار شد. @karpathy

کاربردها

برنده‌ی هکاتون Anthropic، CrossBeam، فرآیند صدور مجوز کالیفرنیا را با ابزارهای بررسی انطباق کد و طرح مبتنی بر هوش مصنوعی سرعت می‌بخشد. @claudeai
Postvisit.ai که توسط یک متخصص قلب ساخته شده است، رونوشت‌های ویزیت پزشکی را به راهنمایی‌های بهداشتی مداوم و شخصی‌سازی‌شده برای بیماران تبدیل می‌کند. @claudeai
سیستم TARA فیلم‌های جاده‌ای دوربین داشبورد را به توصیه‌های سرمایه‌گذاری زیرساختی تبدیل می‌کند که در یک پروژه‌ی ساخت‌وساز واقعی در اوگاندا آزمایش شده است. @claudeai
عامل Slack خطی با مهندسان به تناسب محصول-بازار دست یافت که تمام وظایف را از طریق عامل بدون باز کردن داشبورد مدیریت می‌کنند. @hahnbeelee
Pika قابلیت AI Selves را راه‌اندازی کرد که به کاربران امکان می‌دهد عوامل هوش مصنوعی پایدار با حافظه و ویژگی‌های شخصیتی ایجاد کنند. @pika_labs

پژوهش‌ها

تحقیقات نشان می‌دهد که مدل‌های زبان کوچک با استفاده از رویکرد «معکوس» که در آن مدل‌ها دستورالعمل را از پاسخ پیش‌بینی می‌کنند، بهبود می‌یابند. @cwolferesearch
فیزیکدانان MIT نویز کوانتومی را در ساعت‌های اتمی نوری کاهش دادند و پایداری اندازه‌گیری بنیادی را بهبود بخشیدند. @MIT
تحقیقات Anthropic نشان می‌دهد که مدل‌های هوش مصنوعی به جای عدم همسویی سیستماتیک با استدلال طولانی، نامنسجم می‌شوند. @AnthropicAI
«Claw» به عنوان اصطلاحی برای سیستم‌های عامل شبیه OpenClaw که بر روی سخت‌افزار شخصی با پروتکل‌های پیام‌رسانی و زمان‌بندی وظایف اجرا می‌شوند، پدیدار شد. @simonw

اخبار هوش مصنوعی در 2026-02-20

مدل‌های جدید هوش مصنوعی

گوگل Gemini 3.1 Pro را با بهبودهای عمده در استدلال منتشر کرد که در بنچمارک ARC-AGI-2 امتیاز 77.1% را کسب کرده است (2 برابر بهتر از Gemini 3 Pro). @demishassabis
آنتروپیک Claude Sonnet 4.6 را با پنجره‌ی متنی 1 میلیون توکنی در نسخه‌ی بتا عرضه کرد که با 130 پله صعود در Code Arena به رتبه‌ی 3 رسید. @arena
آنتروپیک Claude Code Security را در پیش‌نمایش محدود معرفی کرد که کدهای برنامه‌نویسی را برای یافتن آسیب‌پذیری‌ها اسکن کرده و وصله‌های پیشنهادی ارائه می‌دهد. @claudeai
علی‌بابا API Qwen3-Coder-Next را در Alibaba Cloud Model Studio با قابلیت ادغام در Coding Plan منتشر کرد. @Alibaba_Qwen
گوگل مدل تولیدکننده‌ی موسیقی Lyria 3 را در نسخه‌ی بتا عرضه کرد که از روی عکس و متن، قطعات موسیقی با آواز و متن ترانه تولید می‌کند. @GeminiApp
انویدیا Nemotron-Nano-9B-v2-Japanese را منتشر کرد که در بین مدل‌های زیر 10 میلیارد پارامتر در Nejumi Leaderboard 4 به بهترین عملکرد دست یافت. @NVIDIAAIDev

تحلیل صنعت

آمازون استفاده از Claude Code را در داخل شرکت ممنوع کرد، با وجود اینکه سرمایه‌گذار آنتروپیک است، و توسعه‌دهندگان را به سمت ابزار Kiro خود سوق می‌دهد. @GergelyOrosz
Perplexity گزارش می‌دهد که Gemini 3.1 Pro پس از خانواده‌ی Claude 4.5 Sonnet/Opus، دومین مدل پرطرفدار در بین مشتریان سازمانی است. @AravSrinivas
هزینه‌ی اجرای ارزیابی‌ها با Gemini 3.1 Pro Preview کمتر از 50% Claude Opus 4.6 و GPT-5.2 است، در حالی که بالاترین امتیاز را در شاخص هوش کسب کرده است. @ArtificialAnlys
OpenAI گزارش می‌دهد که 18 تا 24 ساله‌ها تقریباً 50% از کاربران ChatGPT در هند را تشکیل می‌دهند، با سریع‌ترین رشد بازار Codex در جهان (4 برابر کاربران هفتگی در 2 هفته). @sama
ggml.ai به Hugging Face پیوست تا به توسعه‌ی ggml ادامه دهد و llama.cpp را برای جامعه‌ی متن‌باز قابل دسترس‌تر کند. @ggerganov
Peak XV با افزایش 1.3 میلیارد دلاری، سرمایه‌گذاری خود را در هوش مصنوعی دو برابر می‌کند، در حالی که رقابت جهانی VC در هند شدت می‌گیرد. @TechCrunch
G42 امارات متحده‌ی عربی با Cerebras همکاری می‌کند تا 8 اگزافلاپس توان محاسباتی را در هند مستقر کند. @TechCrunch

اخلاق و جامعه

MIT CSAIL شاخص عامل هوش مصنوعی 2025 را راه‌اندازی کرد که قابلیت‌ها و ویژگی‌های ایمنی 30 عامل برتر هوش مصنوعی را مستند می‌کند و نشان می‌دهد که تنها 4 عامل از 13 عامل خودمختار پیشرفته، ارزیابی‌های ایمنی را افشا کرده‌اند. @MIT_CSAIL
تحقیقات نشان می‌دهد که مدل‌های هوش مصنوعی را می‌توان به «p-hacking» پیچیده وادار کرد، حتی اگر در برابر درخواست‌های مستقیم مقاومت کنند، زمانی که به عنوان «کمی‌سازی عدم قطعیت مسئولانه» بازتعریف شوند. @ahall_research
دولت ایالات متحده ابتکار استانداردهای عامل هوش مصنوعی را در میان نگرانی‌های عمومی فزاینده در مورد عوامل خودمختار هوش مصنوعی راه‌اندازی کرد. @MIT_CSAIL

کاربردها

Gemini 3.1 Pro با موفقیت شبیه‌سازی سه‌بعدی فوتورئالیستی اقیانوس را با تکنیک‌های فیزیکی پیچیده از جمله امواج گرستنر و پراکندگی زیرسطحی تولید کرد. @deedydas
Perplexity Finance قابلیت حسابرسی با قابلیت کلیک را به پرونده‌های SEC با صفحات از پیش پیمایش‌شده برای اقلام خطی اضافه کرد. @AravSrinivas
DreamDojo مدل جهانی تعاملی متن‌باز برای رباتیک را منتشر کرد که فریم‌های آینده را از کنترل‌های موتور تولید می‌کند و بر روی 44 هزار ساعت ویدئوی انسانی از پیش آموزش دیده است. @DrJimFan
Oscar Health با وجود داشتن یکی از سه نمونه‌ی پیچیده‌ترین Jira در جهان، 600 نفر را در یک ماه از Jira به Linear منتقل کرد. @cjc

پژوهش‌ها

METR تخمین می‌زند که Claude Opus 4.6 دارای افق زمانی 50% 14.5 ساعته در وظایف نرم‌افزاری است (95% CI: 6-98 ساعت)، بالاترین گزارش شده اما به دلیل اشباع مجموعه‌ی وظایف بسیار پر سر و صدا است. @METR_Evals
مطالعه‌ای که 22 مدل هوش مصنوعی را در تولید ساعت آنالوگ مقایسه می‌کند، نشان می‌دهد که آستانه‌ی قابلیت واضحی در نوامبر 2025 عبور کرده است، با عملکرد Claude Opus 4.5 به طور قابل توجهی بهتر از GPT-4o. @randal_olson
NVIDIA Alpamayo 1 با 100 هزار دانلود برای ارزیابی بینایی-زبان-عملکرد رانندگی خودمختار، به پردانلودترین مدل رباتیک Hugging Face تبدیل شد. @NVIDIADRIVE

اخبار هوش مصنوعی در 2026-02-19

مدل‌های جدید هوش مصنوعی

گوگل جمینای 3.1 پرو را منتشر کرد که به امتیاز 77.1% در ARC-AGI-2 دست یافت (بیش از دو برابر امتیاز جمینای 3 پرو) و در شاخص هوش مصنوعی تحلیلی پیشرو است، با هزینه‌ای کمتر از نصف رقبای پیشرو @GoogleDeepMind
جمینای 3.1 پرو در Text Arena رتبه اول مشترک (امتیاز 1500)، در Arena Expert جزو 3 مدل برتر (1538) و در Code Arena رتبه 6 را کسب کرد، هم‌تراز با کلاد اوپوس 4.5 @arena
Qwen3.5-397B-A17B علی‌بابا به یکی از 3 مدل برتر متن‌باز در Text Arena تبدیل شد، در مجموع رتبه 20 را کسب کرد و 8.6 تا 19.0 برابر سریع‌تر از Qwen3-Max رمزگشایی می‌کند @arena
گوگل مدل تولید موسیقی Lyria 3 را در اپلیکیشن جمینای راه‌اندازی کرد که در عرض چند ثانیه از ایده‌ها، تصاویر یا ویدئوها موسیقی تولید می‌کند @JeffDean
Arcee.ai مدل Trinity Large را منتشر کرد، اولین مدل در مقیاس پیشرو از خانواده Trinity MoE، که اکنون در Text Arena در دسترس است @arena

تحلیل صنعت

گزارش‌ها حاکی از آن است که OpenAI در حال نهایی کردن قرارداد تأمین مالی 100 میلیارد دلاری با ارزشی بیش از 850 میلیارد دلار است @TechCrunch
World Labs با جذب 1 میلیارد دلار سرمایه جدید از AMD، Autodesk، Emerson Collective، Fidelity، NVIDIA و Sea برای باز کردن قفل هوش فضایی @a16z
a16z رهبری سری D شرکت Temporal را بر عهده گرفت، زیرا اجرای پایدار برای عامل‌های هوش مصنوعی طولانی‌مدت در OpenAI، Replit، Lovable و Abridge حیاتی می‌شود @a16z
مایکروسافت Grok 4.1 Fast را به مجموعه چندمدلی Copilot Studio برای ساخت عامل‌های سفارشی اضافه کرد @satyanadella
Linear در عرض تنها یک ماه، 600 نفر از کارکنان Oscar Health را از یکی از پیچیده‌ترین نمونه‌های Jira در جهان با حذف فیلدهای سفارشی منتقل کرد @GergelyOrosz

اخلاق و جامعه

OpenAI مبلغ 7.5 میلیون دلار به پروژه هم‌ترازی مؤسسه امنیت هوش مصنوعی اختصاص داد تا تحقیقات مستقل در مورد کاهش خطرات ایمنی و امنیتی ناشی از هوش مصنوعی نامنظم را تأمین مالی کند @OpenAINewsroom
تحقیقات نشان می‌دهد که مدل‌های هوش مصنوعی در برابر دستورالعمل‌های دستکاری داده‌ها مقاومت می‌کنند، اما می‌توان از موانع امنیتی عبور کرد، که نگرانی‌هایی را در مورد هم‌ترازی برای سوءرفتار علمی ایجاد می‌کند @emollick
مطالعه Nature Medicine نشان می‌دهد که هوش مصنوعی با دقت 95% در آزمون‌های پزشکی قبول شد، اما زمانی که انسان‌ها از آن برای تریاژ استفاده کردند، دقت به زیر 35% در مقایسه با گروه کنترل گوگل کاهش یافت @random_walker

کاربردها

Perplexity مرورگر Comet iOS را با پیش‌سفارش‌های فعال راه‌اندازی کرد که هوش مصنوعی را در هر صفحه وب با عملکردی در حد سافاری ادغام می‌کند @AravSrinivas
Google Labs ابزار Pomelli را منتشر کرد که در عرض چند ثانیه و بدون هزینه برای کسب‌وکارهای کوچک، دارایی‌های بازاریابی حرفه‌ای ایجاد می‌کند @joshwoodward
PostHog مدیریت لاگ رایگان را با 50 گیگابایت فضای رایگان ماهانه با هزینه 0.25 دلار به ازای هر گیگابایت با استفاده از OpenTelemetry با زمینه فرانت‌اند و بک‌اند معرفی کرد @posthog
Cursor قابلیت سندباکس عامل را در macOS، Linux و Windows اضافه کرد که به عامل‌ها اجازه می‌دهد به صورت امن اجرا شوند و تنها زمانی که از سندباکس خارج می‌شوند، درخواست تأیید کنند @cursor_ai

پژوهش‌ها

جمینای 3.1 پرو به 98% در ARC-AGI-1 با هزینه 0.52 دلار به ازای هر وظیفه و 77% در ARC-AGI-2 با هزینه 0.96 دلار به ازای هر وظیفه دست یافت و مرز پارتو عملکرد و کارایی را جابجا کرد @arcprize
فرانسوا شوله استدلال می‌کند که کدنویسی عامل‌محور به اندازه کافی پیشرفته، اساساً یادگیری ماشین است، با اهداف بهینه‌سازی، محدودیت‌های جستجو و خروجی‌های جعبه سیاه که نگرانی‌هایی را در مورد بیش‌برازش و رانش مفهوم ایجاد می‌کند @fchollet
NVIDIA Dynamo v0.9.0 را با FlashIndexer منتشر کرد که به توان عملیاتی حدود 10 میلیارد توکن در ثانیه و تأخیر p99 کمتر از 10 میکروثانیه در یک گره دست می‌یابد @NVIDIAAIDev
مایکروسافت ریسرچ گزارشی جامع در مورد یکپارچگی رسانه و روش‌های احراز هویت منتشر کرد که مسیرهای عملی به سمت منشأ قابل اعتماد در تصاویر، صدا و ویدئو را بررسی می‌کند @MSFTResearch

اخبار هوش مصنوعی در 2026-02-18

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Sonnet 4.6 را با پنجره‌ی متنی ۱ میلیون توکنی، قابلیت‌های بهبودیافته‌ی کدنویسی و استفاده از کامپیوتر، و حالت‌های قابل تنظیم تلاش/تفکر منتشر کرد. @claudeai
Alibaba مدل Qwen 3.5 Plus را با پنجره‌ی متنی ۱ میلیون توکنی و استفاده‌ی تطبیقی از ابزارها در Vercel AI Gateway راه‌اندازی کرد. @Alibaba_Qwen
Alibaba وزن‌های Qwen3.5-397B-A17B-FP8 را با پشتیبانی ادغام‌شده‌ی SGLang و پشتیبانی آتی vLLM منتشر کرد. @Alibaba_Qwen
گوگل مدل تولید موسیقی Lyria 3 را در Gemini معرفی کرد که قطعات ۳۰ ثانیه‌ای با آواز و متن ترانه را از متن یا تصاویر ایجاد می‌کند. @GeminiApp
Perplexity مدل Claude Sonnet 4.6 را برای همه‌ی کاربران Pro و گزینه‌ی Opus 4.6 را برای کاربران Max در عامل مرورگر اضافه کرد. @comet

تحلیل صنعت

World Labs مبلغ ۱ میلیارد دلار از AMD، Autodesk، Fidelity، NVIDIA و دیگران برای ساخت تولید دنیای سه‌بعدی با انسجام فضایی جذب سرمایه کرد. @theworldlabs
Canva با افزایش ترافیک ارجاعی LLM به درآمد ۴ میلیارد دلاری رسید که نشان‌دهنده‌ی رشد مبتنی بر هوش مصنوعی است. @TechCrunch
Anthropic سیاست OAuth Claude Code را پس از سردرگمی‌ها روشن کرد و اجازه‌ی آزمایش را می‌دهد اما برای استفاده‌ی تجاری به کلیدهای API نیاز دارد. @trq212
مایکروسافت فاش کرد که یک باگ در Office ایمیل‌های محرمانه‌ی مشتریان را در معرض Copilot AI قرار داده است که نگرانی‌هایی را در مورد امنیت سازمانی ایجاد می‌کند. @TechCrunch
عامل‌های کدنویسی اکنون مسئول ۱۶ تا ۲۳ درصد از مشارکت‌های GitHub هستند و این تعداد به سرعت در حال افزایش است. @mikeldking

اخلاق و جامعه

تحقیقات Anthropic نشان می‌دهد که خودمختاری توسط مدل، کاربر و محصول به طور مشترک ساخته می‌شود و نیاز به نظارت پس از استقرار فراتر از ارزیابی‌های پیش از استقرار دارد. @AnthropicAI
تحلیل‌ها نشان می‌دهد که کاربران Claude Code با کسب تجربه، از تأیید هر اقدام به واگذاری با وقفه‌ها تغییر می‌کنند. @AnthropicAI
۷۳ درصد از فراخوانی‌های ابزار عامل در API Anthropic دارای انسان در حلقه هستند و تنها ۰.۸ درصد اقدامات برگشت‌ناپذیر هستند. @AnthropicAI
گوگل واترمارکینگ SynthID را به صدا گسترش داد و ابزارهای تأیید را در Gemini برای شناسایی محتوای تولیدشده توسط هوش مصنوعی اضافه کرد. @Google

کاربردها

یک توسعه‌دهنده سرویس گواهی‌نامه‌ی micro-SaaS را در ۲۰ دقیقه با استفاده از عامل هوش مصنوعی به یک راه‌حل خودمیزبان منتقل کرد و ۱۲۰ دلار در سال صرفه‌جویی کرد. @shanselman
سرور Figma MCP امکان ارسال مستقیم نمونه‌های اولیه‌ی Claude Code به بوم Figma را برای تکرار طراحی فراهم می‌کند. @claudeai
Oscar Health بیش از ۶۰۰ مهندس را در کمی بیش از یک ماه از نمونه‌ی پیچیده‌ی Jira به Linear منتقل کرد. @linear
AI Dungeon هزینه‌های استنتاج را از ۰.۲۰ دلار به ۰.۰۵ دلار در هر میلیون توکن با استفاده از پردازنده‌های گرافیکی NVIDIA Blackwell و TensorRT LLM کاهش داد. @NVIDIAAI

پژوهش‌ها

OpenAI معیار EVMbench را معرفی کرد که توانایی عامل‌های هوش مصنوعی را در شناسایی، بهره‌برداری و وصله کردن آسیب‌پذیری‌های قرارداد هوشمند اندازه‌گیری می‌کند. @OpenAI
پروژه‌ی Silica مایکروسافت مقاله‌ای را در Nature در مورد رمزگذاری داده‌ها در شیشه‌ی بوروسیلیکات برای حفظ ۱۰ هزار ساله منتشر کرد. @MSFTResearch
NVIDIA ابزار متن‌باز FastGen را منتشر کرد که مدل‌های انتشار کند را به ژنراتورهای چند مرحله‌ای برای هوش مصنوعی بلادرنگ تبدیل می‌کند. @ArashVahdat
تحقیقات تویوتا با استفاده از مدل‌های جهانی به سبک NVIDIA Cosmos در سنتز دید پویا، تقویت تله‌اپ و ناوبری به SOTA دست یافت. @NVIDIAAIDev

12 3 4 5...26