اخبار هوش مصنوعی در 2025-12-13
مدلهای جدید هوش مصنوعی
- GPT-5.2 از OpenAI در اولین روز عرضهاش، از یک تریلیون توکن در API فراتر رفت و به سرعت در حال رشد است @sama
- گوگل مدل بهروز شدهی Gemini Native Audio را با دقت بالاتر در فراخوانی توابع، پیروی بهتر از دستورالعملها در زمان واقعی و قابلیتهای مکالمهی روانتر عرضه کرد که اکنون در API جیمنای در دسترس توسعهدهندگان است @OfficialLoganK
- گوگل Gemini 3 Pro را با قابلیتهای جدید برای یکپارچهسازی نتایج جستجوی محلی با Google Maps، نمایش عکسها، رتبهبندیها و اطلاعات دنیای واقعی در قالبی بصری و غنی راهاندازی کرد @GeminiApp
- سورا سه سبک جدید تولید ویدئو را منتشر کرد: Handheld، Retro و Festive که برای همهی کاربران در وب، iOS و اندروید در دسترس است @soraofficialapp
تحلیل صنعت
- گزارشها حاکی از آن است که Anthropic در حال مذاکره با گوگل برای یک قرارداد محاسباتی به ارزش دهها میلیارد دلار است و سفارشهایی به ارزش 21 میلیارد دلار برای TPUs جهت آموزش مدلهای بزرگتر پیشنهاد شده است @AndrewCurran_
- OpenAI و دیزنی همکاری خود را عمیقتر کردند و دیزنی حق خرید سهام بیشتر OpenAI را با ارزشگذاری فعلی دریافت کرد که به طور بالقوه میتواند روابط آیندهی قویتری بین شرکتها ایجاد کند @AndrewCurran_
- وزارت صنعت و فناوری اطلاعات چین ظاهراً دستورالعملهایی را صادر کرده است که واردات GPUهای H200 را برای شرکتهایی مانند Alibaba، Tencent، ByteDance و DeepSeek که قادر به آموزش مدلها هستند، در اولویت قرار میدهد، در حالی که دسترسی را برای فروشندگان مجدد و شرکتهای سنتی که استنتاج انجام میدهند، محدود میکند @jukan05
- تحقیقات در مورد قیمتگذاری LLMها نشان داد که کشش کوتاهمدت حدود 1 است، که نشاندهندهی عدم وجود پارادوکس جونس فوری است، اما قیمتها در دو سال 1000 برابر کاهش یافتند در حالی که تقاضا به شدت افزایش یافت، که نشان میدهد این پارادوکس با گذشت زمان و با پذیرش تدریجی هوش مصنوعی توسط شرکتها با قیمتهای پایینتر رخ میدهد @emollick
- مطالعهای تخمین میزند که ChatGPT منجر به افزایش 6 درصدی در استارتآپهای جدید بین مناطق با پذیرش بالای هوش مصنوعی و مناطق با پذیرش پایین هوش مصنوعی در چین شده است، که نشاندهندهی تأثیر اقتصادی قابل اندازهگیری بر کارآفرینی است @emollick
- اعتبار گارتنر در تحلیل هوش مصنوعی پس از گزارش دستیاران کدنویسی هوش مصنوعی آنها که آمازون، گیتلب و GCP را بالاتر از Cursor رتبهبندی کرد و Claude Code و OpenAI Codex را به طور کامل حذف کرد، زیر سوال رفته است، با ادعاهایی مبنی بر اینکه فروشندگان برای رتبهبندیهای مطلوب پول پرداخت میکنند @GergelyOrosz
- بازار دستیاران کدنویسی هوش مصنوعی رقابت پویایی را با تغییرات مکرر رهبری در فضاهای مختلف نشان میدهد، در حالی که بسیاری از شرکتها هنوز از مدلهای قدرتمند هوش مصنوعی خارج از کدنویسی و فناوری استفاده نکردهاند و اغلب گزینههای ارزانتر را انتخاب میکنند @emollick
- Hugging Face در حال ارسال 3000 ربات Reachy Mini در سراسر جهان است که به عنوان یکی از بزرگترین محمولههای ربات هوش مصنوعی در سال توصیف شده است و به عنوان یک پلتفرم رباتیک DIY متنباز برای سازندگان هوش مصنوعی طراحی شده است @ClementDelangue
- قابلیتهای سطح GPT-4 که در 2 سال 1000 برابر ارزانتر میشوند، برای تأثیرات اقتصادی کوتاهمدت حیاتی است، زیرا قابلیتهای هوش مصنوعی بسیار ارزان فعلی برای بسیاری از کاربردهای مفید که اکثر مردم به طور کامل از آنها استفاده نمیکنند، کافی است @RishiBommasani
کاربردها
- OpenAI مکانیسم مهارتهای Anthropic را در ChatGPT و ابزار Codex CLI خود به کار گرفت، به طوری که ChatGPT اکنون دارای مهارتهایی برای ایجاد و دستکاری صفحات گسترده، فایلهای docx و PDF در یک پوشهی جدید /home/oai/skills است @simonw
- از مهارت جدید PDF در ChatGPT برای ایجاد یک گزارش دقیق در مورد فصل تولید مثل کاکاپو در سال استفاده شد، که 11 دقیقه طول کشید زیرا به طور مکرر مشکلات مانند رندر کاراکترهای خاص را رندر و رفع میکرد @simonw
- Cursor بهبودهای ابزار طراحی سریع را شامل انتخاب عناصر بدون انیمیشن، گرد کردن اسلایدر بلور، بکاسپیس برای حذف عناصر، میانبرهای undo/redo و انتخاب چند عنصری متنی را عرضه کرد @cursor_ai
- گوگل Android Emergency Live Video را راهاندازی کرد که به کاربران امکان میدهد اطلاعات بصری حیاتی را با یک ضربه با خدمات اضطراری به اشتراک بگذارند تا ارزیابی سریعتر وضعیت و راهنماییهای نجاتبخش ارائه شود @sundarpichai
- کاربران به طور فزایندهای به LLMهایی مانند Perplexity برای جستجوی دستور پخت روی میآورند به جای گوگل، که قبل از دستور پخت واقعی، متن و تبلیغات بیپایان را برمیگرداند، که نشان میدهد چگونه جستجوی هوش مصنوعی نتایج تمیزتر و مستقیمتری را مشابه وب اوایل دهه 2000 ارائه میدهد @GergelyOrosz
- توسعهدهنده از عاملهای خودمختار با استفاده از یک مهار سفارشی با ابزارهای متعدد، GPT 5.2 برای نظرات دوم، 7.5 هزار پرامپت سیستمی و تزریق مجدد متناوب زمینه برای حل مشکلات عجیب و دشوار که نیاز به افقهای طولانی دارند، استفاده کرد @Suhail
- GPT-5.2 یک صفحهی گستردهی تعاملی اکسل برای شبیهسازی مبارزهی هیولاهای D&D شامل تواناییهای ویژه را پس از 60 دقیقه زمان فکر کردن ایجاد کرد، در حالی که Claude 4.5 Opus این کار را به سرعت انجام داد اما با حذف تواناییهای ویژه آن را ساده کرد @emollick
- Claude 4.5 Opus تفکر جانبی پیشرفتهای را نشان داد که نه تنها یک تکشاخ را در TikZ ترسیم کرد، بلکه آن را در LaTeX کامپایل کرد، به PDF تبدیل کرد، سپس به PNG و تصویر نهایی را با عناصر تزئینی ارائه داد @emollick
- shadcn/create راهاندازی شد که به توسعهدهندگان امکان میدهد پیادهسازیهای سفارشی shadcn/ui را با انتخاب کتابخانههای کامپوننت، آیکونها، رنگها، تمها و فونتها بسازند، با بازنویسی کد کامپوننت برای مطابقت با ترجیحات فراتر از صرفاً تمسازی @shadcn
پژوهشها
- DeepMind اولین مقالهی آموزش رباتها را با مدلهای جهانی تولید شده توسط Veo منتشر کرد که به همبستگی 0.88 با نرخ موفقیت در دنیای واقعی در بیش از 1600 آزمایش بر روی رباتهای دو دستی ALOHA 2 دست یافت و به سناریوهای خارج از توزیع بدون آزمایش سختافزاری در دنیای واقعی تعمیم یافت @deedydas
- DeepMind یک عامل Gemini Deep Research را برای توسعهدهندگان از طریق Interactions API منتشر کرد که امکان جاسازی پیشرفتهترین قابلیتهای تحقیقاتی خودمختار گوگل را مستقیماً در برنامهها فراهم میکند @GoogleAI
- Google Research و DeepMind DeepSearchQA را معرفی کردند، یک معیار جدید عامل تحقیقات وب متنباز که برای آزمایش عاملها در وظایف پیچیدهی تحقیقات وب طراحی شده است @GoogleAI
- Google Research و DeepMind مجموعهی معیار FACTS را راهاندازی کردند، اولین آزمایش جامع صنعت که واقعیت LLM را در چهار بعد ارزیابی میکند: دانش مدل داخلی، جستجوی وب، مبناگذاری و ورودیهای چندوجهی @GoogleAI
- مدلهای هوش مصنوعی مرزی واگرایی بسیار کمی در تواناییها، پایبندی به پرامپت و سایر عوامل نشان میدهند، به طوری که مدلهای متنبستهی آمریکایی، مدلهای چینی و مدلهای متنباز فرانسوی همگی عملکرد بسیار مشابهی با یکدیگر دارند @emollick
- رهبر تیم عاملهای استفاده از کامپیوتر متا پس از 1.45 سال ساخت زیرساخت CUA، خطوط لولهی داده، ارزیابیها و مدلها از ابتدا برای دستیابی به عملکرد عامل استفاده از کامپیوتر در سطح مرزی، استعفا داد @kohjingyu