اخبار هوش مصنوعی در 2025-12-13

مدل‌های جدید هوش مصنوعی

GPT-5.2 از OpenAI در اولین روز عرضه‌اش، از یک تریلیون توکن در API فراتر رفت و به سرعت در حال رشد است @sama
گوگل مدل به‌روز شده‌ی Gemini Native Audio را با دقت بالاتر در فراخوانی توابع، پیروی بهتر از دستورالعمل‌ها در زمان واقعی و قابلیت‌های مکالمه‌ی روان‌تر عرضه کرد که اکنون در API جیمنای در دسترس توسعه‌دهندگان است @OfficialLoganK
گوگل Gemini 3 Pro را با قابلیت‌های جدید برای یکپارچه‌سازی نتایج جستجوی محلی با Google Maps، نمایش عکس‌ها، رتبه‌بندی‌ها و اطلاعات دنیای واقعی در قالبی بصری و غنی راه‌اندازی کرد @GeminiApp
سورا سه سبک جدید تولید ویدئو را منتشر کرد: Handheld، Retro و Festive که برای همه‌ی کاربران در وب، iOS و اندروید در دسترس است @soraofficialapp

تحلیل صنعت

گزارش‌ها حاکی از آن است که Anthropic در حال مذاکره با گوگل برای یک قرارداد محاسباتی به ارزش ده‌ها میلیارد دلار است و سفارش‌هایی به ارزش 21 میلیارد دلار برای TPUs جهت آموزش مدل‌های بزرگ‌تر پیشنهاد شده است @AndrewCurran_
OpenAI و دیزنی همکاری خود را عمیق‌تر کردند و دیزنی حق خرید سهام بیشتر OpenAI را با ارزش‌گذاری فعلی دریافت کرد که به طور بالقوه می‌تواند روابط آینده‌ی قوی‌تری بین شرکت‌ها ایجاد کند @AndrewCurran_
وزارت صنعت و فناوری اطلاعات چین ظاهراً دستورالعمل‌هایی را صادر کرده است که واردات GPUهای H200 را برای شرکت‌هایی مانند Alibaba، Tencent، ByteDance و DeepSeek که قادر به آموزش مدل‌ها هستند، در اولویت قرار می‌دهد، در حالی که دسترسی را برای فروشندگان مجدد و شرکت‌های سنتی که استنتاج انجام می‌دهند، محدود می‌کند @jukan05
تحقیقات در مورد قیمت‌گذاری LLMها نشان داد که کشش کوتاه‌مدت حدود 1 است، که نشان‌دهنده‌ی عدم وجود پارادوکس جونس فوری است، اما قیمت‌ها در دو سال 1000 برابر کاهش یافتند در حالی که تقاضا به شدت افزایش یافت، که نشان می‌دهد این پارادوکس با گذشت زمان و با پذیرش تدریجی هوش مصنوعی توسط شرکت‌ها با قیمت‌های پایین‌تر رخ می‌دهد @emollick
مطالعه‌ای تخمین می‌زند که ChatGPT منجر به افزایش 6 درصدی در استارت‌آپ‌های جدید بین مناطق با پذیرش بالای هوش مصنوعی و مناطق با پذیرش پایین هوش مصنوعی در چین شده است، که نشان‌دهنده‌ی تأثیر اقتصادی قابل اندازه‌گیری بر کارآفرینی است @emollick
اعتبار گارتنر در تحلیل هوش مصنوعی پس از گزارش دستیاران کدنویسی هوش مصنوعی آن‌ها که آمازون، گیت‌لب و GCP را بالاتر از Cursor رتبه‌بندی کرد و Claude Code و OpenAI Codex را به طور کامل حذف کرد، زیر سوال رفته است، با ادعاهایی مبنی بر اینکه فروشندگان برای رتبه‌بندی‌های مطلوب پول پرداخت می‌کنند @GergelyOrosz
بازار دستیاران کدنویسی هوش مصنوعی رقابت پویایی را با تغییرات مکرر رهبری در فضاهای مختلف نشان می‌دهد، در حالی که بسیاری از شرکت‌ها هنوز از مدل‌های قدرتمند هوش مصنوعی خارج از کدنویسی و فناوری استفاده نکرده‌اند و اغلب گزینه‌های ارزان‌تر را انتخاب می‌کنند @emollick
Hugging Face در حال ارسال 3000 ربات Reachy Mini در سراسر جهان است که به عنوان یکی از بزرگترین محموله‌های ربات هوش مصنوعی در سال توصیف شده است و به عنوان یک پلتفرم رباتیک DIY متن‌باز برای سازندگان هوش مصنوعی طراحی شده است @ClementDelangue
قابلیت‌های سطح GPT-4 که در 2 سال 1000 برابر ارزان‌تر می‌شوند، برای تأثیرات اقتصادی کوتاه‌مدت حیاتی است، زیرا قابلیت‌های هوش مصنوعی بسیار ارزان فعلی برای بسیاری از کاربردهای مفید که اکثر مردم به طور کامل از آن‌ها استفاده نمی‌کنند، کافی است @RishiBommasani

کاربردها

OpenAI مکانیسم مهارت‌های Anthropic را در ChatGPT و ابزار Codex CLI خود به کار گرفت، به طوری که ChatGPT اکنون دارای مهارت‌هایی برای ایجاد و دستکاری صفحات گسترده، فایل‌های docx و PDF در یک پوشه‌ی جدید /home/oai/skills است @simonw
از مهارت جدید PDF در ChatGPT برای ایجاد یک گزارش دقیق در مورد فصل تولید مثل کاکاپو در سال استفاده شد، که 11 دقیقه طول کشید زیرا به طور مکرر مشکلات مانند رندر کاراکترهای خاص را رندر و رفع می‌کرد @simonw
Cursor بهبودهای ابزار طراحی سریع را شامل انتخاب عناصر بدون انیمیشن، گرد کردن اسلایدر بلور، بک‌اسپیس برای حذف عناصر، میانبرهای undo/redo و انتخاب چند عنصری متنی را عرضه کرد @cursor_ai
گوگل Android Emergency Live Video را راه‌اندازی کرد که به کاربران امکان می‌دهد اطلاعات بصری حیاتی را با یک ضربه با خدمات اضطراری به اشتراک بگذارند تا ارزیابی سریع‌تر وضعیت و راهنمایی‌های نجات‌بخش ارائه شود @sundarpichai
کاربران به طور فزاینده‌ای به LLMهایی مانند Perplexity برای جستجوی دستور پخت روی می‌آورند به جای گوگل، که قبل از دستور پخت واقعی، متن و تبلیغات بی‌پایان را برمی‌گرداند، که نشان می‌دهد چگونه جستجوی هوش مصنوعی نتایج تمیزتر و مستقیم‌تری را مشابه وب اوایل دهه 2000 ارائه می‌دهد @GergelyOrosz
توسعه‌دهنده از عامل‌های خودمختار با استفاده از یک مهار سفارشی با ابزارهای متعدد، GPT 5.2 برای نظرات دوم، 7.5 هزار پرامپت سیستمی و تزریق مجدد متناوب زمینه برای حل مشکلات عجیب و دشوار که نیاز به افق‌های طولانی دارند، استفاده کرد @Suhail
GPT-5.2 یک صفحه‌ی گسترده‌ی تعاملی اکسل برای شبیه‌سازی مبارزه‌ی هیولاهای D&D شامل توانایی‌های ویژه را پس از 60 دقیقه زمان فکر کردن ایجاد کرد، در حالی که Claude 4.5 Opus این کار را به سرعت انجام داد اما با حذف توانایی‌های ویژه آن را ساده کرد @emollick
Claude 4.5 Opus تفکر جانبی پیشرفته‌ای را نشان داد که نه تنها یک تک‌شاخ را در TikZ ترسیم کرد، بلکه آن را در LaTeX کامپایل کرد، به PDF تبدیل کرد، سپس به PNG و تصویر نهایی را با عناصر تزئینی ارائه داد @emollick
shadcn/create راه‌اندازی شد که به توسعه‌دهندگان امکان می‌دهد پیاده‌سازی‌های سفارشی shadcn/ui را با انتخاب کتابخانه‌های کامپوننت، آیکون‌ها، رنگ‌ها، تم‌ها و فونت‌ها بسازند، با بازنویسی کد کامپوننت برای مطابقت با ترجیحات فراتر از صرفاً تم‌سازی @shadcn

پژوهش‌ها

DeepMind اولین مقاله‌ی آموزش ربات‌ها را با مدل‌های جهانی تولید شده توسط Veo منتشر کرد که به همبستگی 0.88 با نرخ موفقیت در دنیای واقعی در بیش از 1600 آزمایش بر روی ربات‌های دو دستی ALOHA 2 دست یافت و به سناریوهای خارج از توزیع بدون آزمایش سخت‌افزاری در دنیای واقعی تعمیم یافت @deedydas
DeepMind یک عامل Gemini Deep Research را برای توسعه‌دهندگان از طریق Interactions API منتشر کرد که امکان جاسازی پیشرفته‌ترین قابلیت‌های تحقیقاتی خودمختار گوگل را مستقیماً در برنامه‌ها فراهم می‌کند @GoogleAI
Google Research و DeepMind DeepSearchQA را معرفی کردند، یک معیار جدید عامل تحقیقات وب متن‌باز که برای آزمایش عامل‌ها در وظایف پیچیده‌ی تحقیقات وب طراحی شده است @GoogleAI
Google Research و DeepMind مجموعه‌ی معیار FACTS را راه‌اندازی کردند، اولین آزمایش جامع صنعت که واقعیت LLM را در چهار بعد ارزیابی می‌کند: دانش مدل داخلی، جستجوی وب، مبناگذاری و ورودی‌های چندوجهی @GoogleAI
مدل‌های هوش مصنوعی مرزی واگرایی بسیار کمی در توانایی‌ها، پایبندی به پرامپت و سایر عوامل نشان می‌دهند، به طوری که مدل‌های متن‌بسته‌ی آمریکایی، مدل‌های چینی و مدل‌های متن‌باز فرانسوی همگی عملکرد بسیار مشابهی با یکدیگر دارند @emollick
رهبر تیم عامل‌های استفاده از کامپیوتر متا پس از 1.45 سال ساخت زیرساخت CUA، خطوط لوله‌ی داده، ارزیابی‌ها و مدل‌ها از ابتدا برای دستیابی به عملکرد عامل استفاده از کامپیوتر در سطح مرزی، استعفا داد @kohjingyu