اخبار هوش مصنوعی در 2025-12-17

مدل‌های جدید هوش مصنوعی

گوگل دیپ‌مایند جمینای 3 فلش را منتشر کرد که استدلال در سطح حرفه‌ای را با تأخیر و کارایی در سطح فلش ترکیب می‌کند. هزینه‌ی آن 0.50 دلار ورودی و 3.00 دلار خروجی به ازای هر میلیون توکن است و در اکثر معیارهای ارزیابی از جمینای 2.5 پرو بهتر عمل می‌کند، در حالی که 3 برابر سریع‌تر است @GoogleDeepMind
جمینای 3 فلش در ARC-AGI-1 به امتیاز 84.7% و در ARC-AGI-2 به امتیاز 33.6% دست یافت که با هزینه‌ی بسیار کمتری نسبت به سایر مدل‌های پیشرفته، مرز جدیدی را در نسبت امتیاز به هزینه ایجاد می‌کند @arcprize
جمینای 3 فلش در شاخص هوش تحلیل مصنوعی (Artificial Analysis Intelligence Index) امتیاز 71 را کسب کرد که 13 امتیاز بهبود نسبت به جمینای 2.5 فلش است و آن را به باهوش‌ترین مدل در محدوده‌ی قیمتی خود تبدیل می‌کند، با وجود اینکه از 160 میلیون توکن (بیش از دو برابر 2.5 فلش) استفاده می‌کند @ArtificialAnlys
جمینای 3 فلش در جدول رده‌بندی LMArena رتبه‌ی 3 را کسب کرد و در بین 5 مدل برتر در دسته‌های متن، بینایی و توسعه‌ی وب قرار گرفت و آن را به مقرون‌به‌صرفه‌ترین مدل پیشرفته تبدیل کرد @arena
جمینای 3 فلش در SWE-bench Verified به عملکردی پیشرفته دست یافت و در وظایف کدنویسی از هر دو سری 2.5 و جمینای 3 پرو بهتر عمل کرد @GoogleDeepMind
جمینای 3 فلش در آزمون مربع ساتور کره‌ای (Korean Sator Square Test) امتیاز 161.8/190 را کسب کرد و در بین تمام مدل‌های آزمایش‌شده در رتبه‌ی دوم یا سوم قرار گرفت، با 60 امتیاز بهبود در استدلال نسبت به جمینای 2.5 فلش @Hangsiin
xAI رابط برنامه‌نویسی کاربردی (API) عامل صوتی Grok را راه‌اندازی کرد که با دقت 92.3% در Big Bench Audio رتبه‌ی 1 را کسب کرد و تقریباً 5 برابر سریع‌تر از نزدیک‌ترین رقیب خود با نرخ ثابت 0.05 دلار در دقیقه است @xai
اوپن‌ای‌آی ChatGPT Images را با پشتیبانی از GPT Image 1.5 منتشر کرد که دارای قابلیت‌های قوی‌تر در پیروی از دستورالعمل‌ها، ویرایش دقیق، حفظ جزئیات و 4 برابر سرعت بیشتر در تولید است و اکنون در صدر جدول رده‌بندی Image Arena قرار دارد @OpenAI
GPT-5 پرو طبق جدول رده‌بندی SEAL شرکت Scale AI، به عنوان بهترین مدل استدلالی سال 2025 رتبه‌بندی شد و در پاسخ به سؤالات پیچیده و حل مسائل چندمرحله‌ای عالی عمل می‌کند @scale_AI
GPT-5.2-xhigh بهبودهای کیفی قابل توجهی در Codex نشان می‌دهد که نشان‌دهنده‌ی جهشی بزرگ در قابلیت‌های کدنویسی است @jam3scampbell
مایکروسافت TRELLIS 2 را منتشر کرد، یک ترانسفورمر تطبیق جریان 4 میلیارد پارامتری که تصاویر تکی را به مش‌های سه‌بعدی با بافت تا رزولوشن 1536³ تبدیل می‌کند و با مجوز MIT به صورت متن‌باز منتشر شده است @_akhaliq
Browser Use مدل متن‌باز BU-30B-A3B-Preview را با 30 میلیارد پارامتر و 3 میلیارد پارامتر فعال منتشر کرد که به کیفیت پیشرفته‌ای برای عوامل وب با سرعت بی‌درنگ دست می‌یابد و صدها وظیفه‌ی مرورگر را با 1 دلار محاسبات امکان‌پذیر می‌سازد @gregpr07
اپل مدل Sharp را منتشر کرد که تصاویر را به پاشش‌های سه‌بعدی تبدیل می‌کند و به Hugging Face Enterprise با بیش از 150 مدل، مجموعه داده و برنامه‌ی به اشتراک گذاشته شده در پلتفرم پیوست @jeffboudier

تحلیل صنعت

آمازون تغییرات عمده‌ای در رهبری هوش مصنوعی خود اعلام کرد: پیتر دیسانتیس سازمان جدید هوش مصنوعی آمازون را شامل تیم AGI، توسعه‌ی سیلیکون و محاسبات کوانتومی رهبری خواهد کرد، در حالی که رئیس فعلی هوش مصنوعی، روهیت پراساد، از سمت خود کناره‌گیری می‌کند؛ پیتر آبیل به عنوان رئیس جدید AGI منصوب شد @haydenfield
آمازون طبق گزارش‌ها در حال مذاکره برای سرمایه‌گذاری 10 میلیارد دلاری در اوپن‌ای‌آی است، زیرا معاملات چرخشی بین شرکت‌های فناوری همچنان محبوب هستند @TechCrunch
کورسیرا و یودمی توافقنامه‌ی ادغام به ارزش حدود 2.5 میلیارد دلار را امضا کردند @TechCrunch
گیت‌هاب با واکنش منفی توسعه‌دهندگان به دلیل برنامه‌ی خود برای دریافت هزینه از اجراکننده‌های GitHub Actions خودمیزبان مواجه شد و بعداً تغییر صورت‌حساب را به تعویق انداخت تا رویکرد خود را پس از بازخورد جامعه بازنگری کند @github
گیت‌هاب بدون مدیرعامل فعالیت می‌کند پس از اینکه مایکروسافت هرگز توماس دومکه را جایگزین نکرد و اکنون به گروه "CoreAI" گزارش می‌دهد، که نگرانی‌هایی را در مورد از دست دادن ارتباط با جامعه‌ی توسعه‌دهندگان ایجاد می‌کند @GergelyOrosz
ورشو به عنوان یک مرکز مهندسی بزرگ اروپایی با دفاتر اوپن‌ای‌آی، میسترال ای‌آی، ElevenLabs، گوگل، انویدیا، نتفلیکس، متا و سایر شرکت‌های برتر فناوری ظاهر می‌شود @michuk
پرپلکسیتی اپلیکیشن بومی آی‌پد را منتشر کرد که برای iPadOS بهینه‌سازی شده است و برای کارهای واقعی با ویژگی‌های دسکتاپ از جمله پشتیبانی از چندوظیفگی از طریق Stage Manager طراحی شده است @perplexity_ai
Cursor جمینای 3 فلش را به پلتفرم خود اضافه کرد و دریافت که برای بررسی سریع باگ‌ها به خوبی کار می‌کند @cursor_ai
فیگما جمینای 3 فلش را در Figma Make ادغام کرد و نتایج فوق‌العاده سریعی را ارائه می‌دهد که اکثر درخواست‌ها در 30-60 ثانیه بازگردانده می‌شوند @figma
هیئت مدیره‌ی مونزو طبق گزارش‌ها، مدیرعامل آنیل را به دلیل اختلاف نظر در مورد زمان‌بندی عرضه‌ی اولیه‌ی سهام (IPO) برکنار کرد @TechCrunch
Rad Power Bikes اعلام ورشکستگی کرد و به دنبال فروش کسب‌وکار است @TechCrunch
متا برنامه‌ی خود را برای به اشتراک گذاشتن Horizon OS کوئست با تولیدکنندگان هدست‌های شخص ثالث متوقف کرد @TechCrunch
یوتیوب از سال 2029 به طور انحصاری اسکار را پخش خواهد کرد @TechCrunch
یان لکون در پایان سال متا را ترک می‌کند تا استارتاپی را با تمرکز بر مدل‌های جهانی راه‌اندازی کند - سیستم‌های هوش مصنوعی که با مشاهده و شبیه‌سازی محیط‌های فیزیکی یاد می‌گیرند @NYUDataScience

کاربردها

67% از پزشکان روزانه از هوش مصنوعی استفاده می‌کنند، 84% می‌گویند که هوش مصنوعی آن‌ها را به پزشکان بهتری تبدیل می‌کند و 42% می‌گویند که هوش مصنوعی باعث می‌شود بیشتر بخواهند در پزشکی بمانند، با موارد استفاده‌ی اصلی که وظایف اداری و کمک به تحقیق هستند @emollick
GPT-5 در بهینه‌سازی آزمایش‌های آزمایشگاهی مرطوب ارزیابی شد و توانایی بهبود پروتکل‌های تجربی را با خلبان ربات خودمختار برای اجرای پروتکل‌های شبیه‌سازی گیبسون از زبان طبیعی نشان داد @MilesKWang
Product Intelligence شرکت Linear در ماه‌های اخیر 350 هزار پیشنهاد پذیرفته شده را تکمیل کرده و 26 هزار مسئله را اختصاص داده است که به تیم‌ها در یافتن موارد تکراری، افزودن ویژگی‌ها و هدایت مسائل به فرد مناسب کمک می‌کند @karrisaarinen
لئونا 14 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z برای ساخت سیستم عامل بومی هوش مصنوعی برای ارائه‌دهندگان مراقبت‌های بهداشتی که در واتس‌اپ تعبیه شده است، جمع‌آوری کرد و میلیون‌ها تعامل بیمار را در سراسر آمریکای لاتین پردازش می‌کند @Leona_health
فیسیا (توزیع‌کننده‌ی نایکی در برزیل) با استفاده از فناوری امتحان مجازی مبتنی بر انویدیا، 150% افزایش در تبدیل‌های درون فروشگاهی، 45% افزایش در اندازه‌ی متوسط سفارش و 128% بازگشت سرمایه (ROI) را به دست آورد @NVIDIAAI
محققان MIT سیستم گفتار به واقعیت را توسعه دادند که هوش مصنوعی مولد را با مونتاژ رباتیک ترکیب می‌کند تا اشیاء فیزیکی از جمله مبلمان و دکور را در عرض چند دقیقه ایجاد کند @medialab
Marble شرکت World Labs به محققان امکان می‌دهد محیط‌های رباتیک آماده‌ی شبیه‌سازی را تولید کنند که با NVIDIA Isaac Sim برای آموزش و ارزیابی بدون نیاز به تنظیم دستی ادغام می‌شوند @theworldlabs
Arcway موتور سه‌بعدی بی‌درنگ را راه‌اندازی کرد که در آن هر کسی می‌تواند خانه‌ها را طراحی کند و به خریداران امکان می‌دهد فضاها را کاوش کنند، مواد را تغییر دهند، مبلمان را بچینند و پروژه‌های ساختمانی را تجسم کنند @calebarclay

پژوهش‌ها

پژوهش متا چارچوب Parallel-Distill-Refine (PDR) را معرفی می‌کند که نشان می‌دهد موازی‌سازی و تقطیر استراتژیک می‌تواند از گسترش توالی با نیروی بی‌رحمانه بهتر عمل کند و به دقت 93.3% در AIME 2024 در مقابل 79.4% برای زنجیره‌ی فکری طولانی استاندارد با تأخیر یکسان دست یابد @prfsanjeevarora
Physical Intelligence خاصیت نوظهوری را در VLAها (π0/π0.5/π0.6) کشف می‌کند: با افزایش مقیاس پیش‌آموزش، مدل‌ها یاد می‌گیرند که ویدئوهای انسانی و داده‌های ربات را هم‌تراز کنند و پس از برقراری کنترل ربات، یادگیری طبیعی از ویدئوهای انسانی را امکان‌پذیر می‌سازند <a href="https://x.com/physical_int/status/200109620045669211

اخبار هوش مصنوعی در 2025-12-16

مدل‌های جدید هوش مصنوعی

متا (Meta) مدل SAM Audio را منتشر کرد؛ اولین مدل یکپارچه که هر صدایی را از ترکیب‌های صوتی پیچیده با استفاده از دستورات متنی، بصری یا بازه‌ای جدا می‌کند و از مدل‌های قبلی در معیارهای مختلف بهتر عمل می‌کند. @AIatMeta
گوگل دیپ‌مایند (Google DeepMind) مدل به‌روزرسانی‌شده‌ی Gemini 2.5 Flash Native Audio را برای عامل‌های صوتی زنده با قابلیت پیروی از دستورات بهبودیافته و مکالمات طبیعی‌تر منتشر کرد. @GoogleDeepMind
اوپن‌ای‌آی (OpenAI) ChatGPT Images 1.5 را با قابلیت پیروی از دستورات قوی‌تر، ویرایش دقیق، حفظ جزئیات و سرعت تولید ۴ برابر سریع‌تر معرفی کرد. @OpenAI
انویدیا (NVIDIA) خانواده‌ی مدل‌های استدلالی Nemotron-Cascade را منتشر کرد که با یادگیری تقویتی آبشاری و دامنه‌ای آموزش دیده‌اند. مدل ۱۴B این خانواده از DeepSeek-R1-0528 (671B) در LiveCodeBench پیشی گرفته و عملکرد مدال نقره را در IOI 2025 کسب کرده است. @_weiping
Ai2 مدل Molmo 2 را منتشر کرد که قابلیت‌های چندوجهی مبتنی بر ویدئو را به ارمغان می‌آورد و در بسیاری از معیارهای چالش‌برانگیز ویدئویی صنعتی، از مدل‌های باز پیشی می‌گیرد. @allen_ai
شیائومی (Xiaomi) مدل MiMo-V2-Flash را منتشر کرد که از طریق تقطیر چندمعلمی بر اساس سیاست (MOPD) آموزش دیده و با استفاده از ۱/۵۰ توان محاسباتی، عملکردی هم‌تراز با تمام معلم‌های متخصص در حوزه‌های خود به دست آورده است. @XiaomiMiMo

تحلیل صنعت

دور جدید سرمایه‌گذاری استارتاپ کدنویسی احساسی سوئدی Lovable، ارزش آن را به ۶.۶ میلیارد دلار رساند که بیش از سه برابر ارزش آن در پنج ماه پیش است. @AndrewCurran_
دیتابریکس (Databricks) با داغ شدن کسب‌وکار هوش مصنوعی خود، ۴ میلیارد دلار با ارزش ۱۳۴ میلیارد دلار جذب سرمایه کرد. @TechCrunch
Adaptive Security از جذب ۸۱ میلیون دلار در سری B با مشارکت انویدیا، Bain Capital VC و دیگران برای محافظت از سازمان‌ها در برابر حملات سایبری مبتنی بر هوش مصنوعی خبر داد. @AdaptiveSec
جورج آزبورن (George Osborne) به عنوان مدیر عامل و رئیس OpenAI برای کشورها، مستقر در لندن، به اوپن‌ای‌آی پیوست تا به جوامع در سراسر جهان در به اشتراک گذاشتن فرصت‌های هوش مصنوعی کمک کند. @George_Osborne
تخمین زده می‌شود که آزمایشگاه‌های پیشرو، توان محاسباتی پژوهشی بیشتری نسبت به مجموع تمام مؤسسات دانشگاهی در ایالات متحده دارند که نشان‌دهنده‌ی رویکرد نیروی بی‌رحمانه به جای استفاده‌ی کارآمد از محاسبات است. @natolambert
شرکت‌های فناوری به طور فزاینده‌ای برای نقش‌های «داستان‌گویی» استخدام می‌کنند، با دو برابر شدن موقعیت‌ها در پست‌های شغلی لینکدین از سال گذشته، که نشان‌دهنده‌ی تغییر به سمت توزیع روایت‌های اختصاصی است. @N_Sportelli
خبرنگاران در برخی رسانه‌ها با حداقل سهمیه‌ی ۳ «خبر اختصاصی» در هفته در صنعت هوش مصنوعی مواجه هستند که منجر به چارچوب‌بندی دراماتیک داستان‌های پیش‌پاافتاده می‌شود. @joannejang

اخلاق و جامعه

ایتان مولیک (Ethan Mollick) نشان می‌دهد که تمایز تصاویر تولیدشده توسط هوش مصنوعی از محتوای واقعی همچنان بسیار دشوار است، با این حال مردم همچنان بدون تأیید، تصاویری را که از دیدگاه‌هایشان حمایت می‌کنند، باور می‌کنند. @emollick
محققان استنفورد از هوش مصنوعی برای تجزیه و تحلیل تصاویر گوگل استریت ویو در ۱۶ ایالت استفاده کردند و نشان دادند که ۳۷ درصد از ساختمان‌های آسیب‌دیده در مناطق فقیرنشین برای سال‌ها به زمین‌های خالی تبدیل شدند، در حالی که ۸۲ درصد در مناطق ثروتمندتر، بزرگ‌تر و بهتر بازسازی شدند. @StanfordHAI
عادات مطالعه تغییر چشمگیری را نشان می‌دهد، به طوری که اکنون تعداد غیرخوانندگان ۳ به ۱ از خوانندگان بیشتر است، که نسبت ۲ به ۱ قبلی به نفع خوانندگان را معکوس کرده است. @paulg
یک سوم دختران کلاس هشتم، ۷ ساعت یا بیشتر در روز را در شبکه‌های اجتماعی می‌گذرانند که تقریباً تمام فعالیت روزانه‌ی آن‌ها را تشکیل می‌دهد. @JonHaidt

کاربردها

GPT-5 اوپن‌ای‌آی با Red Queen Bio همکاری کرد تا پروتکل‌های کلونینگ مولکولی را در آزمایشگاه بهینه کند و از طریق آزمایش‌های تکراری، از جمله یک رویکرد جدید مبتنی بر آنزیم، ۷۹ برابر افزایش کارایی به دست آورد. @OpenAI
سایمون ویلیسون (Simon Willison) یک کتابخانه‌ی پایتون را که یک تجزیه‌کننده‌ی کامل HTML5 را پیاده‌سازی می‌کند، با استفاده از GPT-5.2 و Codex CLI در ۴.۵ ساعت و در حین تماشای یک فیلم به جاوااسکریپت پورت کرد. @simonw
گوگل لبز (Google Labs) CC را معرفی کرد، یک عامل بهره‌وری هوش مصنوعی آزمایشی در جیمیل که خلاصه‌های «روز پیش رو» و کمک ایمیلی را برای مشترکین Google AI Ultra ارائه می‌دهد. @GoogleLabs
مایکروسافت کوپایلوت (Microsoft Copilot) حالت Eggnog را برای Mico راه‌اندازی کرد و شخصیت با تم تعطیلات را در ایالات متحده، بریتانیا و کانادا در دسترس قرار داد. @mustafasuleyman
عینک‌های هوش مصنوعی متا اکنون با قابلیت‌های صوتی پیشرفته به کاربران کمک می‌کنند تا مکالمات را بهتر بشنوند. @TechCrunch
DoorDash اپلیکیشن اجتماعی هوش مصنوعی Zesty را برای کشف رستوران‌های جدید عرضه کرد. @TechCrunch
v0 اکنون به فضای کاری Linear متصل می‌شود و به کاربران امکان می‌دهد مستقیماً از بک‌لاگ خود بسازند. @v0

پژوهش‌ها

اوپن‌ای‌آی بنچمارک FrontierScience را منتشر کرد که استدلال علمی در سطح دکترا را در فیزیک، شیمی و زیست‌شناسی با وظایف سبک المپیاد و پژوهشی که توسط متخصصان نوشته شده‌اند، اندازه‌گیری می‌کند و GPT-5.2 را به عنوان قوی‌ترین عملکردکننده نشان می‌دهد، در حالی که شکاف‌هایی را در استدلال باز آشکار می‌کند. @OpenAI
GPT-5.2 مسئله‌ی باز COLT 2022 را در مورد «پیچیدگی زمان اجرا‌ی PageRank منظم‌شده‌ی L1 شتاب‌یافته» با استفاده از الگوریتم گرادیان شتاب‌یافته‌ی استاندارد حل کرد، با تمام اثبات‌های تولیدشده‌ی خودکار و رسمی‌شده در Lean. @kfountou
گوگل ریسرچ (Google Research) از Gemini 2.5 Deep Think پیشرفته برای تأیید مقالات نظری علوم کامپیوتر استفاده کرد، به طوری که ۹۷ درصد از نویسندگان STOC2026 بازخورد را برای یافتن خطاها و بهبود وضوح مفید دانستند. @GoogleResearch
Claude Opus 4.5 با حل خلاقانه‌ی تضادهای وابستگی و دور زدن موانع محیطی، CORE-Bench را حل کرد، در حالی که Opus 4.1 و Sonnet 4 با توسل به داده‌های شبیه‌سازی‌شده شکست خوردند. @PKirgis
Ai2 مدل Olmo 3 Think را با خط لوله‌ی کاملاً باز برای یادگیری تقویتی منتشر کرد، با استفاده از تنظیم دقیق نظارت‌شده، DPO و RLVR با GRPO، که پس از ۳ هفته آموزش بدون ناپایداری به بهبود خود ادامه می‌دهد. @cwolferesearch
متا VL-JEPA را معرفی کرد، اولین مدل غیرتولیدی برای وظایف بینایی-زبان در زمان واقعی، از جمله تشخیص عمل جریانی، بازیابی، VQA و طبقه‌بندی، که با کارایی بهتر از VLMها پیشی می‌گیرد. @pascalefung
پژوهش در مورد ترانسفورمرهای با عمق رشدیافته نشان می‌دهد که انباشت تدریجی لایه‌ها در طول آموزش می‌تواند بر مشکل «نفرین عمق» که در آن لایه‌های عمیق‌تر کمتر مورد استفاده قرار می‌گیرند، غلبه کند. @KaplFer
آزمایشگاه هوش مصنوعی استنفورد سؤالات معیوب را در بنچمارک‌های هوش مصنوعی پرکاربرد شناسایی کرد و نگرانی‌هایی را در مورد قابلیت اطمینان در طراحی بنچمارک برجسته کرد. @StanfordAILab
محققان چارچوب MUPI (هوش پیش‌بینی‌کننده‌ی جهانی تعبیه‌شده) را معرفی کردند که مبنای نظری برای راه‌حل‌های مشارکتی در یادگیری تقویتی را با درک شباهت خود-دیگری فراهم می‌کند. @tyrell_turing
Latent Labs مدل Latent-X2 را برای آنتی‌بادی‌های تولیدشده توسط هوش مصنوعی با قابلیت توسعه‌پذیری شبیه به دارو و ایمنی‌زایی پایین در پنل‌های انسانی، به صورت صفر-شات، منتشر کرد. @saakohl
ترنس تائو (Terence Tao) مفهوم هوش عمومی مصنوعی (Artificial General Cleverness) را متمایز از AGI مورد بحث قرار داد. @AndrewCurran_
دمیس هاسابیس (Demis Hassabis)، مدیر عامل گوگل دیپ‌مایند، در مورد کار بر روی «مسائل گره‌ی ریشه» - چالش‌های علمی بنیادی از همجوشی و ابررساناها تا کشف مواد جدید - صحبت کرد. @GoogleDeepMind
محققان نشان دادند که شکست در اکتشاف، نه توانایی مدل‌سازی، معمولاً دلیل عدم موفقیت انسان‌ها در حل محیط‌های ARC 3 است، که اکتشاف را هم دشوار و هم مهم برجسته می‌کند. @fchollet
Stanford HAI خلاصه‌ی مسئله‌ای را منتشر کرد که اکوسیستم متنوع مدل‌های هوش مصنوعی با وزن باز چین و پیامدهای سیاستی انتشار جهانی آن‌ها را تحلیل می‌کند. <a href="https://x.com/StanfordHAI/status/200097460346072304

اخبار هوش مصنوعی در 2025-12-15

مدل‌های جدید هوش مصنوعی

NVIDIA مدل Nemotron 3 Nano را منتشر کرد، یک مدل استدلال ترکیبی 30B با معماری ترکیب متخصصان که طراحی مامبا-ترنسفورمر را ترکیب می‌کند. این مدل دارای پنجره‌ی متنی 1M و عملکرد پیشرو در معیارهای SWE-Bench، استدلال و چت است @ctnzr
NVIDIA خانواده‌ی کامل Nemotron 3 را با شفافیت بی‌سابقه معرفی کرد و داده‌های آموزشی، کتابخانه‌ی یادگیری تقویتی NeMo Gym و کد آموزشی کامل را در کنار مدل‌ها منتشر کرد. نسخه‌های Super و Ultra در ماه‌های آینده عرضه خواهند شد @nvidianewsroom
علی‌بابا Qwen Code v0.5.0 را با یکپارچه‌سازی VSCode، SDK بومی TypeScript، پشتیبانی از مدل‌های استدلال سازگار با OpenAI از جمله DeepSeek V3.2 و Kimi-K2 و پشتیبانی از زبان روسی منتشر کرد @Alibaba_Qwen
اپل Sharp را منتشر کرد، یک مدل سنتز دید تک‌چشمی که قادر به تولید نماها در کمتر از یک ثانیه است @_akhaliq
AI2 مدل Bolmo را معرفی کرد، اولین مدل زبان کاملاً باز در سطح بایت که با بایت‌سازی Olmo 3 ساخته شده است و در طیف وسیعی از وظایف با مدل‌های زیرکلمه‌ای پیشرفته برابری می‌کند یا از آن‌ها پیشی می‌گیرد @allen_ai

تحلیل صنعت

مهندسان ارشد در شرکت‌های برتر فناوری گزارش می‌دهند که وظایف آن‌ها اکنون عمدتاً شامل پرامپت‌نویسی برای Cursor یا Claude Code با Opus 4.5 و بررسی صحت خروجی است، که نشان می‌دهد هوش مصنوعی از آستانه‌ی تعمیم به اکثر وظایف نرم‌افزاری عبور کرده است @deedydas
یک توسعه‌دهنده گزارش می‌دهد که 260 دلار توکن برای تکمیل یک مهاجرت سه‌روزه که تخمین زده می‌شد هفته‌ها طول بکشد، هزینه کرده است. این موضوع این سؤال را مطرح می‌کند که آیا شرکت‌ها هزینه‌های سالانه‌ی 12 تا 35 هزار دلاری توکن به ازای هر توسعه‌دهنده را علاوه بر حقوق جذب خواهند کرد یا خیر @GergelyOrosz
شرکت‌ها برای توجیه هزینه‌های هوش مصنوعی، به دنبال افزایش 20 درصدی بهره‌وری هستند، و عدم پیش‌بینی‌پذیری هزینه‌های اندازه‌گیری‌شده، ترجیح برنامه‌های کدنویسی هوش مصنوعی با قیمت ثابت را بر مدل‌های پرداخت به ازای استفاده، افزایش می‌دهد @GergelyOrosz
توسعه‌دهندگان باتجربه ارزش بسیار بیشتری از ابزارهای هوش مصنوعی نسبت به توسعه‌دهندگان کم‌تجربه استخراج می‌کنند، زیرا آن‌ها می‌توانند وظایف را به طور دقیق مشخص کنند، نه اینکه از پرامپت‌های عمومی استفاده کنند @GergelyOrosz
رئیس‌جمهور ترامپ US Tech Force را راه‌اندازی کرد که 1000 مهندس را با همکاری OpenAI، Oracle، Palantir، Anduril، Apple، Amazon، Google، Microsoft، NVIDIA و xAI برای ابتکارات فناوری با تأثیر بالا استخدام می‌کند @AndrewCurran_
Mirelo 41 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z و Index برای مدل بنیادی متمرکز بر لایه‌ی صوتی برای تولید ویدئو جذب کرد @a16z
First Voyage 2.5 میلیون دلار برای یک همراه هوش مصنوعی که به کاربران در ساخت عادت‌ها کمک می‌کند، جذب کرد @TechCrunch
Sierra دفتر جدیدی در پاریس راه‌اندازی کرد زیرا این شرکت در حال گسترش بین‌المللی است @btaylor

پژوهش‌ها

انتشار Olmo 3 استاندارد جدیدی را برای شفافیت با انتشار کامل داده‌ها، گزارش 100 صفحه‌ای، زیرساخت آموزشی باز و ارزیابی‌های قابل تکرار تعیین می‌کند و آزمایش‌های دقیق را با مانع صفر برای ورود امکان‌پذیر می‌سازد @cwolferesearch
Nemotron 3 Nano با تنها 3.6B پارامتر فعال از 31.6B کل، به امتیاز شاخص هوش 52 دست می‌یابد که 6 امتیاز از Qwen3 30B با اندازه‌ی مشابه و 15 امتیاز بهبود نسبت به Nemotron Nano 9B V2 قبلی دارد @ArtificialAnlys
همه‌ی مدل‌های هوش مصنوعی پیشرفته اکنون همه‌ی سطوح آزمون دشوار تحلیلگر مالی خبره (CFA) را با استفاده از آزمون‌های آزمایشی پولی برای کاهش خطر نشت، پشت سر می‌گذارند، با استراتژی پرامپت‌نویسی که تأثیر حداقلی بر اکثر انواع سؤالات نشان می‌دهد @emollick
DisCIPL MIT از LLM برای هدایت مدل‌های زبان کوچک‌تر برای همکاری در وظایف باز با محدودیت‌هایی مانند پازل‌های پیشرفته و اثبات‌های ریاضی استفاده می‌کند و به دقت و کارایی قابل مقایسه با مدل‌های پیشرو دست می‌یابد @MIT_CSAIL
استادی که از نظر تاریخی نسبت به مفید بودن مدل‌ها شکاک بود، گزارش می‌دهد که GPT 5.2 Pro گام بزرگی در مفید بودن برای کاربردهای پژوهشی هندسه‌ی جبری و نظریه‌ی اعداد است @AndrewCurran_
چارچوب Parallel-Distill-Refine انویدیا به دقت 93.3% در AIME 2024 دست می‌یابد در مقایسه با 79.4% برای زنجیره‌ی فکری طولانی استاندارد با تأخیر یکسان، که نشان می‌دهد تکرار حافظه‌ی محدود می‌تواند جایگزین ردیابی‌های استدلالی طولانی شود @rsalakhu
Prime Intellect با NVIDIA همکاری می‌کند تا محیط‌های RL NeMo Gym را در Environments Hub خود ادغام کند و مقیاس‌بندی یادگیری تقویتی را برای تیم‌ها آسان‌تر کند @AndrewCurran_

کاربردها

Gemini Agent گوگل اکنون برای کاربران Google AI Ultra در ایالات متحده در دسترس است و قادر به انجام وظایفی مانند اجاره‌ی خودرو با مقایسه‌ی قیمت‌ها، جمع‌آوری اطلاعات صندوق ورودی و رزرو در محدودیت‌های بودجه است @GeminiApp
Figma Slides و Figma Buzz اکنون در ChatGPT برای ایجاد ارائه‌ها و دعوت‌نامه‌ها از طریق رابط مکالمه‌ای در دسترس هستند @figma
IBM CUGA را منتشر کرد، یک عامل سازمانی متن‌باز که وظایف را با نوشتن و اجرای کد با توجه به فایل‌های فضای کاری خودکار می‌کند، با ابزارهای داخلی برای وظایف سازمانی و پشتیبانی MCP @huggingface
شریک تجاری اجرایی Zapier، عامل آماده‌سازی جلسات مبتنی بر هوش مصنوعی، مربی جلسات برای هماهنگی تیم اجرایی و سیستم بررسی پیش‌نویس اسناد را پیاده‌سازی می‌کند که امکان بازخورد در سطح مدیرعامل را قبل از جلسات فراهم می‌کند @clairevo
یک توسعه‌دهنده گزارش می‌دهد که وظایف پیچیده را از طریق Codex با GPT 5.2 Extra High به ترتیب برای 2.5 و 1.75 ساعت اجرا کرده است و همه‌ی معیارهای پذیرش را با پوشش کامل تست و بدون کد خراب تکمیل کرده است @gdb
Zoom دستیار هوش مصنوعی را به وب می‌آورد و دسترسی را برای کاربران رایگان فراهم می‌کند @TechCrunch

اخلاق و جامعه

Merriam-Webster کلمه‌ی slop را به عنوان کلمه‌ی سال 2025 نامگذاری کرد که منعکس‌کننده‌ی نگرانی‌ها در مورد کیفیت محتوای تولیدشده توسط هوش مصنوعی است @TechCrunch
چت‌بات‌ها در مدیریت فایل به گونه‌ای مشکل دارند که نسخه‌های CLI ندارند، به طوری که Gemini اغلب فایل‌های ارجاع‌شده را اشتباه می‌گیرد و ChatGPT اغلب فایل‌های تولیدشده را اشتباه قرار می‌دهد @emollick
ویژگی فشرده‌سازی مکالمه‌ی Claude برای کارهای دانشی به خوبی کدنویسی کار نمی‌کند و برخلاف پنجره‌های متنی چرخشی، لحن و جریان را به طور ناگهانی بازنشانی می‌کند @emollick

اخبار هوش مصنوعی در 2025-12-14

مدل‌های جدید هوش مصنوعی

OpenAI مدل GPT-5.2 Pro را با قابلیت‌های تفکر گسترده‌تر منتشر کرد که پیشرفت‌های قابل‌توجهی نسبت به 5.1 Pro نشان می‌دهد، مشابه جهش از o1 Pro به o3 Pro @MParakhin
گوگل از ترجمه‌ی هم‌زمان گفتار به گفتار با پشتیبانی Gemini خبر داد که اکنون در Google Translate در دسترس است و اوایل سال آینده برای توسعه‌دهندگان عرضه خواهد شد @OfficialLoganK
Gemini 2.5 و Gemini 3 Pro عملکرد بهبودیافته‌ای را در وظایف مختلف استدلال نشان می‌دهند، به‌طوری که Gemini 3 Pro بالاترین امتیاز 9.1% را در معیار استدلال فیزیک CritPt کسب کرده است @mark_k

تحلیل صنعت

هوش مصنوعی این امکان را برای بنیان‌گذاران فراهم کرده است که ارائه‌های بی‌نقصی را در مقیاس بزرگ ایجاد کنند، که باعث شده سرمایه‌گذاران خطرپذیر نتوانند تنها به ایمیل‌های سرد ورودی تکیه کنند و این امر نحوه‌ی نفوذ استارتاپ‌ها به سرمایه‌گذاران را به‌طور اساسی تغییر داده است @TechCrunch
ابزارهای بازبینی کد فعلی برای کدهای تولیدشده توسط هوش مصنوعی ناکافی هستند و توسعه‌دهندگان نیاز دارند که پرامپت اصلی، اصلاحات انسانی انجام‌شده و علامت‌گذاری واضح بخش‌های بدون تغییر تولیدشده توسط هوش مصنوعی را بدانند @GergelyOrosz
تیمی از مهندسان نرم‌افزار قوی که به کیفیت و قابلیت نگهداری کد اهمیت می‌دهند، از تیم‌هایی که از عوامل کدنویسی هوش مصنوعی قدرتمند به‌طور بی‌فکرانه استفاده می‌کنند، بهتر عمل می‌کنند، زیرا ابزارهای هوش مصنوعی توسعه‌دهندگان را وسوسه می‌کنند تا کدهای پرحرف و با قابلیت نگهداری کمتر را ارائه دهند @GergelyOrosz
مهندسان ارشد گزارش می‌دهند که هوش مصنوعی به آن‌ها امکان می‌دهد بدون ترس از قضاوت، آزادانه‌تر سؤال بپرسند، که منجر به یادگیری سریع‌تر در مقایسه با پویایی‌های سنتی تیم می‌شود که در آن عناوین ارشد مانع از پرسیدن سؤالات اساسی می‌شوند @GergelyOrosz
سیستم‌های هوش مصنوعی آینده در 10-15 سال آینده 4-5 مرتبه از نظر انرژی کارآمدتر از هوش مصنوعی فعلی خواهند بود و سخت‌افزار به جای برق، به گلوگاه اصلی استقرار تبدیل خواهد شد @fchollet
مراکز داده در فضا از نظر اقتصادی مقرون‌به‌صرفه نیستند و با در نظر گرفتن هزینه‌های پرتاب، پیچیدگی نگهداری و ارتباطات با پهنای باند بالا، 50-100 برابر گران‌تر از مراکز داده زمینی با انرژی هسته‌ای یا تجدیدپذیر هستند @fchollet

اخلاق و جامعه

اطلاعات نادرست تولیدشده توسط هوش مصنوعی در حال حاضر برای انتشار روایت‌های دروغین استفاده می‌شود، با ایجاد داستان‌های ساختگی و نام‌ها برای افراد واقعی درگیر در رویدادهای خبری، که تهدید فوری برای یکپارچگی اطلاعات را نشان می‌دهد @Nrg8000
سرگئی برین اعتراف می‌کند که گوگل در معماری ترانسفورمر که خود اختراع کرده بود، کمتر سرمایه‌گذاری کرد زیرا شرکت بیش از حد می‌ترسید چت‌بات‌هایی را منتشر کند که حرف‌های احمقانه می‌زنند، و این امر به OpenAI اجازه داد تا محاسبات را مقیاس‌بندی کرده و با این فناوری پیش برود @slow_developer
گرفتن پاسخ‌های دقیق از هوش مصنوعی فعلی با فریب دادن یک دروغگوی حرفه‌ای برای گفتن حقیقت مقایسه می‌شود، که از کاربران می‌خواهد سیستم را به گوشه‌ی درست هدایت کنند یا پرامپت‌های صحیح را ارائه دهند @paulg

کاربردها

JustHTML، یک کتابخانه‌ی جدید پایتون بدون وابستگی، عمدتاً توسط عوامل کدنویسی در طی چند ماه ساخته شد، که شامل 3000 خط کد است که HTML را مطابق با مشخصات HTML5 تجزیه می‌کند و 9200 تست html5lib را با موفقیت پشت سر می‌گذارد @simonw
یک راهنمای 17 مرحله‌ای نحوه‌ی استفاده از حالت عامل VS Code با Claude 3.7 Sonnet، Gemini Pro 3 و Claude Opus را برای ساخت کد با کیفیت تولیدی نشان می‌دهد، که مهندسی جدی را به جای کدنویسی حسی به نمایش می‌گذارد @simonw
تیم Codex پشتیبانی آزمایشی از مهارت‌ها را اضافه می‌کند که با GPT-5.2 به‌خوبی ترکیب می‌شود و امکان تنظیم دقیق Qwen3-0.6B را برای دستیابی به بهبود +6 در معیار HumanEval فراهم می‌کند @thsottiaux
Comet Assistant در حال انتقال محاسبات به سمت مدل‌های سریع و سبک‌وزن است که می‌توانند به‌صورت محلی اجرا شوند و امکان تحلیل عمیق‌تر هر مقاله، ویدئو یا وب‌سایتی را بدون تغییر زمینه فراهم می‌کنند @AravSrinivas

پژوهش‌ها

GPT-5.2 Pro در CritPt، یک معیار استدلال فیزیک در سطح پژوهش که برای آزمایش استدلال فیزیک نظری در سطح متخصص طراحی شده است، امتیاز 0% را کسب می‌کند، در حالی که Gemini 3 Pro بالاترین امتیاز 9.1% را به دست می‌آورد @mark_k
همه‌ی مدل‌های هوش مصنوعی اخیر اکنون معمای جراح را در اولین تلاش به‌درستی حل می‌کنند، که پیشرفت در مدیریت سوگیری جنسیتی در وظایف استدلال را نشان می‌دهد @emollick
بررسی سالانه‌ی مدل‌های باز، DeepSeek R1، خانواده‌ی Qwen 3 و خانواده‌ی Kimi K2 را به‌عنوان بهترین عملکردها شناسایی می‌کند، با پیش‌بینی‌هایی مبنی بر اینکه مقیاس‌بندی ادامه خواهد یافت و شکاف مرز باز-بسته در معیارهای عمومی در سال 2026 تقریباً یکسان باقی خواهد ماند @natolambert
شاخص شفافیت مدل بنیاد استنفورد نشان می‌دهد که شفافیت صنعت از 58 به 40.69 کاهش یافته است، به‌طوری که تنها IBM و Writer شفافیت را حفظ کرده‌اند در حالی که دیگران افشاگری را کاهش داده‌اند @JesseDLandry

اخبار هوش مصنوعی در 2025-12-13

مدل‌های جدید هوش مصنوعی

GPT-5.2 از OpenAI در اولین روز عرضه‌اش، از یک تریلیون توکن در API فراتر رفت و به سرعت در حال رشد است @sama
گوگل مدل به‌روز شده‌ی Gemini Native Audio را با دقت بالاتر در فراخوانی توابع، پیروی بهتر از دستورالعمل‌ها در زمان واقعی و قابلیت‌های مکالمه‌ی روان‌تر عرضه کرد که اکنون در API جیمنای در دسترس توسعه‌دهندگان است @OfficialLoganK
گوگل Gemini 3 Pro را با قابلیت‌های جدید برای یکپارچه‌سازی نتایج جستجوی محلی با Google Maps، نمایش عکس‌ها، رتبه‌بندی‌ها و اطلاعات دنیای واقعی در قالبی بصری و غنی راه‌اندازی کرد @GeminiApp
سورا سه سبک جدید تولید ویدئو را منتشر کرد: Handheld، Retro و Festive که برای همه‌ی کاربران در وب، iOS و اندروید در دسترس است @soraofficialapp

تحلیل صنعت

گزارش‌ها حاکی از آن است که Anthropic در حال مذاکره با گوگل برای یک قرارداد محاسباتی به ارزش ده‌ها میلیارد دلار است و سفارش‌هایی به ارزش 21 میلیارد دلار برای TPUs جهت آموزش مدل‌های بزرگ‌تر پیشنهاد شده است @AndrewCurran_
OpenAI و دیزنی همکاری خود را عمیق‌تر کردند و دیزنی حق خرید سهام بیشتر OpenAI را با ارزش‌گذاری فعلی دریافت کرد که به طور بالقوه می‌تواند روابط آینده‌ی قوی‌تری بین شرکت‌ها ایجاد کند @AndrewCurran_
وزارت صنعت و فناوری اطلاعات چین ظاهراً دستورالعمل‌هایی را صادر کرده است که واردات GPUهای H200 را برای شرکت‌هایی مانند Alibaba، Tencent، ByteDance و DeepSeek که قادر به آموزش مدل‌ها هستند، در اولویت قرار می‌دهد، در حالی که دسترسی را برای فروشندگان مجدد و شرکت‌های سنتی که استنتاج انجام می‌دهند، محدود می‌کند @jukan05
تحقیقات در مورد قیمت‌گذاری LLMها نشان داد که کشش کوتاه‌مدت حدود 1 است، که نشان‌دهنده‌ی عدم وجود پارادوکس جونس فوری است، اما قیمت‌ها در دو سال 1000 برابر کاهش یافتند در حالی که تقاضا به شدت افزایش یافت، که نشان می‌دهد این پارادوکس با گذشت زمان و با پذیرش تدریجی هوش مصنوعی توسط شرکت‌ها با قیمت‌های پایین‌تر رخ می‌دهد @emollick
مطالعه‌ای تخمین می‌زند که ChatGPT منجر به افزایش 6 درصدی در استارت‌آپ‌های جدید بین مناطق با پذیرش بالای هوش مصنوعی و مناطق با پذیرش پایین هوش مصنوعی در چین شده است، که نشان‌دهنده‌ی تأثیر اقتصادی قابل اندازه‌گیری بر کارآفرینی است @emollick
اعتبار گارتنر در تحلیل هوش مصنوعی پس از گزارش دستیاران کدنویسی هوش مصنوعی آن‌ها که آمازون، گیت‌لب و GCP را بالاتر از Cursor رتبه‌بندی کرد و Claude Code و OpenAI Codex را به طور کامل حذف کرد، زیر سوال رفته است، با ادعاهایی مبنی بر اینکه فروشندگان برای رتبه‌بندی‌های مطلوب پول پرداخت می‌کنند @GergelyOrosz
بازار دستیاران کدنویسی هوش مصنوعی رقابت پویایی را با تغییرات مکرر رهبری در فضاهای مختلف نشان می‌دهد، در حالی که بسیاری از شرکت‌ها هنوز از مدل‌های قدرتمند هوش مصنوعی خارج از کدنویسی و فناوری استفاده نکرده‌اند و اغلب گزینه‌های ارزان‌تر را انتخاب می‌کنند @emollick
Hugging Face در حال ارسال 3000 ربات Reachy Mini در سراسر جهان است که به عنوان یکی از بزرگترین محموله‌های ربات هوش مصنوعی در سال توصیف شده است و به عنوان یک پلتفرم رباتیک DIY متن‌باز برای سازندگان هوش مصنوعی طراحی شده است @ClementDelangue
قابلیت‌های سطح GPT-4 که در 2 سال 1000 برابر ارزان‌تر می‌شوند، برای تأثیرات اقتصادی کوتاه‌مدت حیاتی است، زیرا قابلیت‌های هوش مصنوعی بسیار ارزان فعلی برای بسیاری از کاربردهای مفید که اکثر مردم به طور کامل از آن‌ها استفاده نمی‌کنند، کافی است @RishiBommasani

کاربردها

OpenAI مکانیسم مهارت‌های Anthropic را در ChatGPT و ابزار Codex CLI خود به کار گرفت، به طوری که ChatGPT اکنون دارای مهارت‌هایی برای ایجاد و دستکاری صفحات گسترده، فایل‌های docx و PDF در یک پوشه‌ی جدید /home/oai/skills است @simonw
از مهارت جدید PDF در ChatGPT برای ایجاد یک گزارش دقیق در مورد فصل تولید مثل کاکاپو در سال استفاده شد، که 11 دقیقه طول کشید زیرا به طور مکرر مشکلات مانند رندر کاراکترهای خاص را رندر و رفع می‌کرد @simonw
Cursor بهبودهای ابزار طراحی سریع را شامل انتخاب عناصر بدون انیمیشن، گرد کردن اسلایدر بلور، بک‌اسپیس برای حذف عناصر، میانبرهای undo/redo و انتخاب چند عنصری متنی را عرضه کرد @cursor_ai
گوگل Android Emergency Live Video را راه‌اندازی کرد که به کاربران امکان می‌دهد اطلاعات بصری حیاتی را با یک ضربه با خدمات اضطراری به اشتراک بگذارند تا ارزیابی سریع‌تر وضعیت و راهنمایی‌های نجات‌بخش ارائه شود @sundarpichai
کاربران به طور فزاینده‌ای به LLMهایی مانند Perplexity برای جستجوی دستور پخت روی می‌آورند به جای گوگل، که قبل از دستور پخت واقعی، متن و تبلیغات بی‌پایان را برمی‌گرداند، که نشان می‌دهد چگونه جستجوی هوش مصنوعی نتایج تمیزتر و مستقیم‌تری را مشابه وب اوایل دهه 2000 ارائه می‌دهد @GergelyOrosz
توسعه‌دهنده از عامل‌های خودمختار با استفاده از یک مهار سفارشی با ابزارهای متعدد، GPT 5.2 برای نظرات دوم، 7.5 هزار پرامپت سیستمی و تزریق مجدد متناوب زمینه برای حل مشکلات عجیب و دشوار که نیاز به افق‌های طولانی دارند، استفاده کرد @Suhail
GPT-5.2 یک صفحه‌ی گسترده‌ی تعاملی اکسل برای شبیه‌سازی مبارزه‌ی هیولاهای D&D شامل توانایی‌های ویژه را پس از 60 دقیقه زمان فکر کردن ایجاد کرد، در حالی که Claude 4.5 Opus این کار را به سرعت انجام داد اما با حذف توانایی‌های ویژه آن را ساده کرد @emollick
Claude 4.5 Opus تفکر جانبی پیشرفته‌ای را نشان داد که نه تنها یک تک‌شاخ را در TikZ ترسیم کرد، بلکه آن را در LaTeX کامپایل کرد، به PDF تبدیل کرد، سپس به PNG و تصویر نهایی را با عناصر تزئینی ارائه داد @emollick
shadcn/create راه‌اندازی شد که به توسعه‌دهندگان امکان می‌دهد پیاده‌سازی‌های سفارشی shadcn/ui را با انتخاب کتابخانه‌های کامپوننت، آیکون‌ها، رنگ‌ها، تم‌ها و فونت‌ها بسازند، با بازنویسی کد کامپوننت برای مطابقت با ترجیحات فراتر از صرفاً تم‌سازی @shadcn

پژوهش‌ها

DeepMind اولین مقاله‌ی آموزش ربات‌ها را با مدل‌های جهانی تولید شده توسط Veo منتشر کرد که به همبستگی 0.88 با نرخ موفقیت در دنیای واقعی در بیش از 1600 آزمایش بر روی ربات‌های دو دستی ALOHA 2 دست یافت و به سناریوهای خارج از توزیع بدون آزمایش سخت‌افزاری در دنیای واقعی تعمیم یافت @deedydas
DeepMind یک عامل Gemini Deep Research را برای توسعه‌دهندگان از طریق Interactions API منتشر کرد که امکان جاسازی پیشرفته‌ترین قابلیت‌های تحقیقاتی خودمختار گوگل را مستقیماً در برنامه‌ها فراهم می‌کند @GoogleAI
Google Research و DeepMind DeepSearchQA را معرفی کردند، یک معیار جدید عامل تحقیقات وب متن‌باز که برای آزمایش عامل‌ها در وظایف پیچیده‌ی تحقیقات وب طراحی شده است @GoogleAI
Google Research و DeepMind مجموعه‌ی معیار FACTS را راه‌اندازی کردند، اولین آزمایش جامع صنعت که واقعیت LLM را در چهار بعد ارزیابی می‌کند: دانش مدل داخلی، جستجوی وب، مبناگذاری و ورودی‌های چندوجهی @GoogleAI
مدل‌های هوش مصنوعی مرزی واگرایی بسیار کمی در توانایی‌ها، پایبندی به پرامپت و سایر عوامل نشان می‌دهند، به طوری که مدل‌های متن‌بسته‌ی آمریکایی، مدل‌های چینی و مدل‌های متن‌باز فرانسوی همگی عملکرد بسیار مشابهی با یکدیگر دارند @emollick
رهبر تیم عامل‌های استفاده از کامپیوتر متا پس از 1.45 سال ساخت زیرساخت CUA، خطوط لوله‌ی داده، ارزیابی‌ها و مدل‌ها از ابتدا برای دستیابی به عملکرد عامل استفاده از کامپیوتر در سطح مرزی، استعفا داد @kohjingyu

اخبار هوش مصنوعی در 2025-12-12

مدل‌های جدید هوش مصنوعی

OpenAI مدل GPT-5.2 را با به‌روزرسانی دانش تا اوت 2025 منتشر کرد. قیمت این مدل 1.4 برابر GPT-5.1 است و بهبودهای قابل‌توجهی در مدیریت متن‌های طولانی و وظایف «سوزن در انبار کاه» (needle-in-haystack) نشان می‌دهد @simonw
GPT-5.2 Pro (X-High) به امتیاز 90.5% در ARC-AGI-1 با هزینه 11.64 دلار به ازای هر وظیفه دست یافت که نشان‌دهنده‌ی بهبود 390 برابری در کارایی نسبت به نسخه‌ی منتشرنشده‌ی o3 (High) از یک سال پیش است که با امتیاز 88% و هزینه 4.5 هزار دلار به ازای هر وظیفه عمل می‌کرد @simonw
Ai2 مدل Olmo 3.1 را با مدل‌های 32B Think و 32B Instruct منتشر کرد که اجرای RL آن‌ها را برای سه هفته‌ی دیگر تمدید کرده و بهبودهای مستمری در عملکرد AIME و معیارهای کدنویسی با هزینه‌ی کلی تقریباً 250 هزار دلار به دست آورده است @natolambert
گوگل مدل به‌روزرسانی‌شده‌ی Gemini 2.5 Flash Native Audio را با بهبودهایی برای مدیریت گردش‌کارهای پیچیده، هدایت دستورالعمل‌های کاربر و مکالمات طبیعی منتشر کرد @GoogleAI
مدل‌های پیش‌نمایش تبدیل متن به گفتار Gemini 2.5 Flash و 2.5 Pro بهبودهایی در رعایت دستورات سبک، تنظیم دقیق سرعت با تنظیمات سرعت آگاه از متن و ثبات صدای شخصیت برای سناریوهای چند گوینده به ارمغان می‌آورند @GoogleAI
Moonshoot AI مدل Kimi K2 Thinking را منتشر کرد که اکنون در پلتفرم Tinker با قابلیت‌های جستجوی گسترده در دسترس است @AndrewCurran_
ByteDance مدل Dolphin-v2 را منتشر کرد، یک مدل 3B برای تجزیه‌ی اسناد با مجوز MIT که روی PDFها، اسکن‌ها و عکس‌ها کار می‌کند و 21 نوع محتوا را با دقت پیکسلی درک می‌کند @AdinaYakup
OpenAI مدل circuit-sparsity را در Hugging Face منتشر کرد @_akhaliq

تحلیل صنعت

Anthropic به عنوان مشتری 10 میلیارد دلاری مرموز Broadcom از سپتامبر فاش شد، با سفارش 11 میلیارد دلاری اضافی برای زیرساخت‌های هوش مصنوعی @AndrewCurran_
OpenAI همکاری با BBVA را برای گسترش استقرار ChatGPT Enterprise به 120,000 کارمند اعلام کرد که از تغییر BBVA به سمت بانکداری مبتنی بر هوش مصنوعی حمایت می‌کند @gdb
سم آلتمن، مدیرعامل OpenAI، اعلام کرد که هوش مصنوعی سازمانی در سال 2026 اولویت بزرگی برای OpenAI خواهد بود که نشان‌دهنده‌ی یک تغییر استراتژیک عمده است @gdb
مدیرعامل Pinterest گزارش داد که با استفاده از مدل‌های متن‌باز، تنظیم دقیق آن‌ها و دستیابی به عملکردی مشابه بهترین مدل‌های اختصاصی با کمتر از 10% هزینه، به نتایج مشابهی دست یافته است @jeffboudier
NVIDIA به دلیل تقاضای قوی چین، با وجود محدودیت‌های صادراتی، افزایش تولید تراشه‌ی H200 را در نظر دارد @AndrewCurran_
اتان مولیک اطمینان خود را ابراز کرد که حتی اگر توسعه‌ی هوش مصنوعی امروز متوقف شود، جامعه برای ده سال آینده با اختلالات گسترده‌ای مواجه خواهد شد، زیرا مردم در تلاش برای بهره‌برداری از قابلیت‌های مدل‌های موجود هستند @emollick
ناظران صنعت به پتانسیل خستگی مدل در LLMها مشابه خستگی نصب برنامه در برنامه‌های موبایل اشاره می‌کنند، جایی که حتی محصولات برتر نیز برای پذیرش با مشکل مواجه می‌شوند @GergelyOrosz
تحلیل‌ها نشان می‌دهد که صنعت به اوج APIهای اختصاصی رسیده و وارد دنیایی متعادل‌تر می‌شود که در آن متن‌باز، آموزش و پلتفرم‌های جایگزین سهم بیشتری از توجه، استفاده و درآمد را به دست خواهند آورد @ClementDelangue
پست طنزآمیز چالش‌های پذیرش هوش مصنوعی سازمانی را برجسته می‌کند و استقرار 1.4 میلیون دلاری Microsoft Copilot را با حداقل استفاده‌ی واقعی اما گزارش‌دهی موفقیت‌آمیز معیارها برای ارائه‌های هیئت‌مدیره توصیف می‌کند @gothburz

اخلاق و جامعه

رئیس‌جمهور ترامپ فرمان اجرایی چارچوب سیاست ملی برای هوش مصنوعی را امضا کرد و اعلام کرد که ایالات متحده باید یک استاندارد ملی با حداقل بار برای هوش مصنوعی داشته باشد، نه 50 قانون ایالتی متناقض @AndrewCurran_
این فرمان اجرایی شامل ابزارهایی مانند کارگروه دعاوی DOJ، توقف بودجه‌ی فدرال از ایالت‌هایی با قوانین هوش مصنوعی دست‌وپاگیر، تلاش‌های FTC برای مهار تلاش‌های ایالت‌ها برای مجبور کردن مدل‌های هوش مصنوعی به تغییر خروجی‌های واقعی، و تلاش‌های FCC برای مهار الزامات افشاگری است @AndrewCurran_
یوتیوب سیستم تأیید سن مبتنی بر هوش مصنوعی را با استفاده از Gemini برای تعیین خودکار سن کاربر با تجزیه و تحلیل الگوهای مشاهده اعلام کرد، با کاربران که به اشتباه زیر 18 سال تخمین زده می‌شوند، ملزم به تأیید از طریق کارت اعتباری یا شناسه‌ی دولتی هستند @AndrewCurran_
آرویند نارایانان، محقق پرینستون، مقاله‌ای منتشر کرد که در آن استدلال می‌کند که عدالت الگوریتمی یک خطای دسته‌بندی است و از مطالعه‌ی کل سیستم‌های اجتماعی-فنی به جای فقط زیرسیستم‌های فنی هنگام طراحی بوروکراسی‌های الگوریتمی حمایت می‌کند @random_walker
تحلیل‌ها نشان می‌دهد که اگر افراد زمان کوتاهی تا هوش مصنوعی تحول‌آفرین داشته باشند و معتقد باشند که برخی از ارزش‌های انسانی اساساً آشتی‌ناپذیر هستند، اطمینان از اینکه مدل برنده چارچوب اخلاقی آن‌ها را در بر می‌گیرد، به طور فزاینده‌ای مهم‌ترین چیز در جهان به نظر خواهد رسید @AndrewCurran_

کاربردها

Comet Android از Perplexity توانایی اشکال‌زدایی کد از طریق تلفن را با تجزیه و تحلیل لاگ‌های CI، ردیابی خطاها، یافتن راه‌حل‌ها و باز کردن درخواست‌های کشش آماده برای ادغام نشان می‌دهد @AravSrinivas
ChatGPT اکنون شامل یک پوشه‌ی /home/oai/skills با تعاریف مهارت برای PDFها، اسناد و صفحات گسترده است، با پشتیبانی آزمایشی نیز به Codex CLI اضافه شده است @simonw
گوگل ترنسلیت ترجمه‌ی گفتار به گفتار زنده با پشتیبانی از Gemini را در نسخه‌ی بتا منتشر کرد که ترجمه‌ی صوتی بلادرنگ را با درک ظرافت‌های گفتار انسانی به ارمغان می‌آورد @TechCrunch
ادوبی برنامه‌های رایگان یکپارچه با ChatGPT را برای فتوشاپ، آکروبات و اکسپرس در دسکتاپ، وب و iOS راه‌اندازی کرد که به کاربران امکان می‌دهد مستقیماً از داخل ChatGPT به برنامه‌های ادوبی دسترسی داشته باشند @gdb
OpenAI همکاری با دیزنی را برای آوردن Sora و قابلیت‌های تولید تصویر برای شخصیت‌های دیزنی اعلام کرد که به کاربران امکان می‌دهد محتوا را با IP دیزنی تولید کنند @sama
مایکروسافت همکاری هوش مصنوعی MahaCrimeOS را با ماهاراشترا برای حمایت از قربانیان جرایم سایبری و کلاهبرداری مالی اعلام کرد @satyanadella
Moonlake مدل Reverie را معرفی کرد، یک مدل انتشار قابل برنامه‌ریزی بلادرنگ که برای بازی‌ها آموزش دیده است و قادر به شرطی‌سازی فراتر از پیکسل‌ها است و به گیم‌پلی اجازه می‌دهد تا با حفظ مکانیک بازی به هر زیبایی‌شناسی بازسازی شود @chrmanning
کاربر گزارش می‌دهد که GPT-5.2 تحلیل طولانی و چشمگیری از اسکریپت‌های بازی ارائه می‌دهد، جزئیات ظریف را درک می‌کند و تفسیرهایی مشابه کسی که بازی را عمیقاً بازی کرده است، با تقریباً بدون توهم، ارائه می‌دهد @AndrewCurran_
Kimi K2 رفتار جستجوی گسترده‌ای را در طول استدلال نشان می‌دهد، بارها برای حمایت از ادعاها، بررسی مثال‌های نقض و تأیید اطلاعات قبل از ارائه‌ی پاسخ‌های نهایی جستجو می‌کند @AndrewCurran_

پژوهش‌ها

Olmo 3.1 32B Think از Ai2 نشان می‌دهد که مقیاس‌بندی RL می‌تواند بسیار فراتر از انتظارات اولیه ادامه یابد، با افزایش عملکرد بیش از 125 هزار ساعت H100 با هزینه‌ی تقریباً 250 هزار دلار، قابل مقایسه با مصرف منابع DeepSeek R1 @natolambert
پژوهش Fast Flow Joint Distillation (F2D2) را معرفی می‌کند که NFEs را برای نمونه‌برداری و ارزیابی احتمال به میزان دو مرتبه در مدل‌های مبتنی بر جریان کاهش می‌دهد و در عین حال کیفیت نمونه را حفظ می‌کند @rsalakhu
Google DeepMind پژوهشی را در مورد ارزیابی سیاست‌های رباتیک Gemini در شبیه‌ساز Veo World ارائه می‌دهد و یک ارزیاب عمومی برای آزمایش ایمنی ربات بدون شکستن اشیاء فیزیکی معرفی می‌کند @Majumdar_Ani
فرانسوا شوله استدلال می‌کند که هوش مصنوعی از ماشین اتوماسیون به ماشین اختراع تکامل خواهد یافت و به یک پارادایم اساساً جدید با جستجوی نمادین به عنوان هسته‌ی آن به جای برازش منحنی نیاز دارد @fchollet
شوله توضیح می‌دهد که هوش سیال اندازه‌گیری‌شده توسط ARC با قابلیت‌های اکتشاف، تعیین هدف و برنامه‌ریزی مورد نیاز برای عوامل خودمختار متفاوت است، با اکتشاف سخت‌ترین و برنامه‌ریزی آسان‌ترین در میان این مشکلات باز @fchollet
اولین LLM آموزش‌دیده در فضا با استفاده از NVIDIA H100 در Starcloud-1، همچنین اولین بار است که نسخه‌ای از Gemini گوگل در فضا اجرا می‌شود، با استفاده از مدل‌های متن‌باز بسیار کارآمد Gemma @demishassabis
روش جدید جاسازی متن با استفاده از شبکه‌ی کوچک ReLU برای تقریب ترانسفورمر بزرگ از ویژگی

اخبار هوش مصنوعی در 2025-12-11

مدل‌های جدید هوش مصنوعی

OpenAI مدل GPT-5.2 را منتشر کرد که به عنوان هوشمندترین مدل در دسترس عموم در جهان توصیف می‌شود، به ویژه در کارهای دانش‌محور دنیای واقعی از جمله صفحات گسترده، ارائه‌ها و کدنویسی بسیار قوی است. این مدل در سه نسخه عرضه می‌شود: GPT-5.2 Instant برای کارهای روزمره، GPT-5.2 Thinking برای استدلال پیچیده و وظایف با زمینه طولانی، و GPT-5.2 Pro برای سوالات دشوار و کارهای علمی @OpenAI
GPT-5.2 در SWE-Bench Pro به امتیاز 55.6%، در ARC-AGI-2 به 52.9% و در Frontier Math به 40.3% دست یافت، با نرخ برد/تساوی 70.9% در برابر کارشناسان صنعت در معیار GDPval که وظایف دانش‌محور را در 44 شغل اندازه‌گیری می‌کند @sama
GPT-5.2 Pro با هزینه 11.64 دلار به ازای هر وظیفه، به امتیاز 90.5% در ARC-AGI-1 دست یافت که نشان‌دهنده‌ی بهبود کارایی 390 برابری نسبت به پیش‌نمایش o3 سال گذشته است که با هزینه 4500 دلار به ازای هر وظیفه، 88% امتیاز کسب کرده بود @arcprize
علی‌بابا Qwen Learn Mode را معرفی کرد که توسط Qwen3-Max پشتیبانی می‌شود و دارای گفت‌وگوی سقراطی و مسیرهای یادگیری تطبیقی مبتنی بر روان‌شناسی شناختی است @Alibaba_Qwen
Cohere مدل Rerank 4 را در دو نسخه (Fast و Pro) عرضه کرد که دارای بزرگترین پنجره‌ی متنی در سری Rerank خود، قابلیت‌های خودآموزی بدون داده‌ی برچسب‌گذاری‌شده، و پشتیبانی از بیش از 100 زبان با بازیابی پیشرفته در 10 زبان اصلی تجاری است @cohere
گوگل عامل Gemini Deep Research را برای توسعه‌دهندگان معرفی کرد که بر اساس Gemini 3 Pro ساخته شده و با استفاده از یادگیری تقویتی چندمرحله‌ای آموزش دیده تا به طور خودکار در وب گشت‌وگذار کند و گزارش‌های دقیق با ارجاعات تولید کند. این عامل در معیار DeepSearchQA به عملکرد پیشرفته و در BrowseComp به بالاترین امتیاز دست یافت @GoogleDeepMind
گوگل مدل‌های Gemini TTS را با تنوع لحن غنی‌تر، پایبندی دقیق‌تر به دستورات سبک، تنظیمات سرعت هوشمندتر و آگاه از زمینه، و صداهای ثابت شخصیت در سناریوهای چندگوینده به‌روزرسانی کرد @OfficialLoganK
Mistral AI اعلام کرد که Devstral 2 در OpenRouter رتبه‌ی اول را دارد و از عرضه‌ی مدل دیگری در چند روز آینده خبر داد @MistralAI
گوگل از ادغام Gemini با Google Maps خبر داد که نتایج محلی را در قالبی بصری غنی با عکس‌ها، رتبه‌بندی‌ها و اطلاعات واقعی ارائه می‌دهد @GeminiApp

تحلیل صنعت

جمع‌آوری سرمایه‌ی خطرپذیر از اوج سال 2022 به میزان 75% کاهش یافته و در سه‌ماهه‌ی سوم 2025 به تقریباً 45 میلیارد دلار رسیده است که به سطح 8 سال پیش بازگشته است، در حالی که استقرار سرمایه در 4 سه‌ماهه‌ی گذشته در حدود 330 میلیارد دلار بالا باقی مانده است. شکاف رو به رشد بین سرمایه‌های مستقر شده و سرمایه‌های جمع‌آوری شده نشان می‌دهد که یافتن سرمایه برای استارت‌آپ‌ها به طور قابل توجهی دشوارتر خواهد شد @deedydas
برای اولین بار در تاریخ، بیش از یک‌سوم استارت‌آپ‌های سال 2025 توسط یک نفر تأسیس شده‌اند و بنیان‌گذاران انفرادی به طور فزاینده‌ای رایج شده‌اند @julianweisser
Perplexity اعلام کرد که توسط شرکت حقوقی Gunderson Dettmer برای خدمات حقوقی به کار گرفته شده است، که نیاز وکلا به هوش مصنوعی دقیق که بتواند مراجع را به طور قابل اعتماد استخراج کند، برجسته می‌کند @AravSrinivas
دیزنی با OpenAI قرارداد مجوز سه‌ساله‌ای امضا کرد که به Sora اجازه می‌دهد ویدئوهای هوش مصنوعی با حضور 200 شخصیت خود تولید کند، با انحصار برای سال اول. دیزنی برای استفاده از شخصیت‌ها محدودیت‌هایی تعیین خواهد کرد و ویدئوها را برای Disney+ انتخاب خواهد کرد @TechCrunch
Harness با ارزش 5.5 میلیارد دلار، 240 میلیون دلار سرمایه جذب کرد تا "شکاف پس از کد" هوش مصنوعی را در تحویل نرم‌افزار خودکار کند @TechCrunch
Runware در سری A خود 50 میلیون دلار سرمایه جذب کرد تا تولید تصویر و ویدئو را برای توسعه‌دهندگان آسان‌تر کند @TechCrunch
Port با ارزش 800 میلیون دلار، 100 میلیون دلار سرمایه جذب کرد تا با Backstage اسپاتیفای برای پورتال‌های توسعه‌دهنده رقابت کند @TechCrunch
Opera مرورگر Neon را با قابلیت‌های هوش مصنوعی و قیمت 20 دلار در ماه راه‌اندازی کرد @TechCrunch
Worktrace با رهبری 8VC، 9 میلیون دلار سرمایه‌ی اولیه جذب کرد تا به کسب‌وکارها در کشف فرصت‌های اتوماسیون کمک کند. این شرکت توسط آنجلا جیانگ، مدیر محصول سابق OpenAI و دیپاک واسیست، استاد علوم کامپیوتر UIUC تأسیس شده است @worktrace_ai
Vybe با رهبری First Round، 10 میلیون دلار سرمایه‌ی اولیه جذب کرد تا کدنویسی حسی را برای برنامه‌های کاربردی تجاری داخلی با ادغام داده‌های تولیدی امکان‌پذیر کند @qhoang09
Oboe با رهبری a16z، 16 میلیون دلار در سری A برای پلتفرم یادگیری شخصی‌سازی‌شده جذب کرد @NirZicherman
Unconventional AI با رهبری مشترک a16z، 475 میلیون دلار سرمایه‌ی اولیه جذب کرد تا تراشه‌های هوش مصنوعی بسیار کارآمد را با استفاده از رویکردهای محاسبات آنالوگ الهام‌گرفته از مغزهای بیولوژیکی توسعه دهد @a16z
Hugging Face اعلام کرد که text-generation-inference در حالت نگهداری قرار گرفته است و به کاربران توصیه می‌کند برای استنتاج بهینه به vLLM، SGLang، llama.cpp یا MLX مهاجرت کنند @LysandreJik
Cursor ویرایش بصری طراحی را مستقیماً در پایگاه کد معرفی کرد که به کاربران امکان می‌دهد عناصر را انتخاب کرده، آن‌ها را به صورت بصری تغییر دهند و Cursor کد را بنویسد، با هدف ایجاد پلی بین گردش کار طراحی و مهندسی @cursor_ai
Runway اولین مدل جهانی خود را منتشر کرد و صدای بومی را به آخرین مدل ویدئویی خود اضافه کرد @TechCrunch
Rivian از یک حرکت بزرگ در زمینه‌ی خودمختاری با سیلیکون سفارشی، لیدار و اشاره به ربات‌تاکسی‌ها خبر داد، با دستیار هوش مصنوعی که در اوایل سال 2026 به خودروهای برقی می‌آید @TechCrunch

اخلاق و جامعه

ایتان مولیک نشان داد که GPT-5.2 Pro کد شیدر بصری پیچیده را در یک مرحله ایجاد می‌کند، که دشواری تمایز محتوای تولید شده توسط هوش مصنوعی از کار ساخته شده توسط انسان را برجسته می‌کند @emollick
OpenAI از سرمایه‌گذاری در آمادگی امنیت سایبری با افزایش قابلیت‌های مدل‌ها خبر داد و با کارشناسان جهانی برای تقویت اقدامات حفاظتی و دادن مزیت به مدافعان همکاری می‌کند @OpenAI
دیزنی به گوگل اخطار توقف و انصراف داد و ادعای نقض گسترده‌ی حق کپی‌رایت را مطرح کرد @TechCrunch
مجله‌ی TIME "معماران هوش مصنوعی" را به عنوان شخصیت سال 2025 معرفی کرد، از جمله فی‌فی لی، که تأثیر تحول‌آفرین هوش مصنوعی بر بشریت را به رسمیت می‌شناسد @drfeifei
xAI با السالوادور همکاری می‌کند تا آموزش خصوصی Grok شخصی‌سازی‌شده را به بیش از 1 میلیون دانش‌آموز مدارس دولتی ارائه دهد و اولین برنامه‌ی ملی معلم خصوصی هوش مصنوعی در جهان را ایجاد کند @xai
Anthropic اعلام کرد که پروتکل زمینه‌ی مدل (MCP) اکنون بخشی از بنیاد Agentic AI تحت بنیاد لینوکس است، با OpenAI، Anthropic و Block به عنوان بنیان‌گذاران مشترک @AnthropicAI
ICML 2026 سیاست جدیدی را اعلام کرد که به داوران و نویسندگان اجازه می‌دهد بین استفاده‌ی محافظه‌کارانه یا آزادانه از LLM انتخاب کنند، با تطبیق بر اساس ترجیحات @icmlconf
ایتان مولیک اشاره کرد که مدل‌های هوش مصنوعی با وزن‌های باز، اقتصاد مشابه نرم‌افزار متن‌باز را ندارند، بدون مسیر مشخصی برای کسب ارزش با وجود افزایش هزینه‌های مدل، که سوالاتی را در مورد پایداری مطرح می‌کند @emollick
محققان استنفورد دریافتند که 1 از 20 معیار هوش مصنوعی دارای نقص‌های جدی است، به این معنی که صنعت به دلیل روش‌های ارزیابی معیوب، مدل‌های کم‌کارایی را تبلیغ کرده و مدل‌های بهتر را جریمه کرده است @StanfordHAI

کاربردها

Linear ادغام عامل هوش مصنوعی را با Intercom، Zendesk، Gong و Slack Workflows معرفی کرد که امکان ایجاد خودکار مشکل از تماس‌ها و تیکت‌های مشتری را با یک کلیک فراهم می‌کند @karrisaarinen
گوگل Disco را معرفی کرد، ابزاری مبتنی بر Gemini برای ساخت برنامه‌های وب از تب‌های مرورگر @TechCrunch
گوگل قابلیت امتحان لباس با هوش مصنوعی را راه‌اندازی کرد که تنها با یک سلفی کار می‌کند @TechCrunch
اندرو ان‌جی دستورالعملی برای ساخت عوامل بسیار خودمختار با استفاده از بسته‌ی متن‌باز aisuite به اشتراک گذاشت که به LLMهای پیشرفته اجازه می‌دهد از ابزارهایی مانند دسترسی به دیسک و جستجوی وب برای کارهای پیچیده استفاده کنند، اگرچه اشاره کرد که اکثر عوامل عملی به داربست‌بندی بیشتری نیاز دارند @AndrewYNg
سایمون ویلسون راهنمای جامعی در مورد الگوهای کدنویسی حسی برای ابزارهای HTML تک‌فایلی منتشر کرد که شامل APIهای فعال‌شده با CORS، localStorage،

اخبار هوش مصنوعی در 2025-12-10

مدل‌های جدید هوش مصنوعی

علی‌بابا نسخه‌ی ارتقایافته‌ی Qwen3-Omni-Flash (نسخه‌ی 2025-12-01) را با قابلیت‌های بهبودیافته‌ی درک چندمرحله‌ای ویدئو/صوت، شخصیت هوش مصنوعی قابل تنظیم از طریق دستورات سیستمی، پشتیبانی از 119 زبان متنی و 19 زبان گفتاری، و کیفیت صدای شبیه به انسان منتشر کرد. @Alibaba_Qwen
میسترال مدل‌های Devstral 2 و Devstral Small 2 را به ترتیب با 123 میلیارد و 24 میلیارد پارامتر منتشر کرد، هرچند با مجوزهای محدودکننده‌ای که استفاده از آن‌ها را برای شرکت‌هایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع می‌کند. @simonw
میسترال محدودیت کانتکست Vibe را از 100 هزار به 200 هزار توکن افزایش داد. @MistralAI
نوس ریسرچ (Nous Research) مدل Nomos 1 را به صورت متن‌باز منتشر کرد؛ این مدل 30 میلیارد پارامتری در مسابقه‌ی ریاضی پاتنام 2024 امتیاز 87 از 120 را کسب کرد و در بین 3,988 شرکت‌کننده رتبه‌ی دوم را به دست آورد. @NousResearch
استپ‌فان (StepFun) سیستم استدلال هماهنگ موازی (PaCoRe) را معرفی کرد که به یک مدل 8 میلیارد پارامتری امکان می‌دهد با زمان محاسباتی چند میلیون توکنی، به امتیاز 94.5% در HMMT25 (که از 93.2% GPT-5 بیشتر است) و 78.2% در LiveCodeBench دست یابد. @StepFun_ai

تحلیل صنعت

بلومبرگ گزارش می‌دهد که آزمایشگاه ابرهوش متا از جما (Gemma)، مدل متن‌باز OpenAI، و کیو‌ون (Qwen) برای آموزش مدل بزرگ بعدی خود با نام رمز آووکادو استفاده می‌کند که نشان‌دهنده‌ی تغییر احتمالی از استراتژی متن‌باز است. @AndrewCurran_
چت‌جی‌پی‌تی به پردانلودترین اپلیکیشن اپل در سال 2025 در ایالات متحده تبدیل شد؛ طبق گزارش پیو ریسرچ، 64% از نوجوانان آمریکایی از چت‌بات‌های هوش مصنوعی استفاده می‌کنند و 33% از آن‌ها روزانه از این چت‌بات‌ها بهره می‌برند. @AndrewCurran_
غول‌های فناوری بزرگ حدود 68 میلیارد دلار سرمایه‌گذاری در هند طی 5 سال آینده را اعلام کردند که هند را پس از ایالات متحده به دومین محرک بزرگ درآمد برای توسعه‌ی هوش مصنوعی تبدیل می‌کند. @deedydas
هاگینگ فیس (Hugging Face) اکنون میزبان بیش از 2.2 میلیون مدل است که بیش از 50,000 مدل دارای ارائه‌دهنده‌ی API هستند و این نشان‌دهنده‌ی رشد سریع در اکوسیستم هوش مصنوعی متن‌باز است. @_akhaliq
گوگل طرح هوش مصنوعی پلاس (AI Plus) با قیمت کمتر از 5 دلار را در هند برای رقابت با چت‌جی‌پی‌تی گو (ChatGPT Go) راه‌اندازی کرد. @TechCrunch
اوبو (Oboe) 16 میلیون دلار در سری A به رهبری a16z برای پلتفرم تولید دوره‌های آموزشی مبتنی بر هوش مصنوعی خود که تجربه‌های یادگیری شخصی‌سازی‌شده ایجاد می‌کند، جذب سرمایه کرد. @TechCrunch
کرسر (Cursor) نسخه‌ی 2.2 را با حالت دیباگ (Debug Mode) منتشر کرد که کد را ابزاربندی می‌کند و داده‌های زمان اجرا را به عامل‌ها ارسال می‌کند، به علاوه بهبودهایی در حالت برنامه‌ریزی (Plan Mode) و قابلیت‌های داوری چندعاملی. @cursor_ai

اخلاق و جامعه

OpenAI اعلام کرد که مدل‌های آینده‌ی آن تحت چارچوب آمادگی (Preparedness Framework) برای امنیت سایبری به قابلیت «بالا» خواهند رسید و این امر مستلزم تقویت تدابیر حفاظتی و همکاری با کارشناسان جهانی برای برتری مدافعان است. @OpenAI
ایتان مولیک هشدار داد که مجوزهای محدودکننده‌ی مدل‌های میسترال (که استفاده از آن‌ها را برای شرکت‌هایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع می‌کند) می‌تواند مشارکت‌های متن‌باز را محدود کند، زیرا از لحاظ تاریخی بخش زیادی از کار از شرکت‌های انتفاعی می‌آید. @emollick
گرگلی اوروس (Gergelyi Orosz) مشاهده کرد که لینکدین به شدت محصولات هوش مصنوعی را در همه جا تبلیغ می‌کند، با محتوای تولیدشده توسط هوش مصنوعی که پلتفرم را پر کرده و درخواست‌های شغلی ورودی را تقریباً بی‌فایده کرده است. @GergelyOrosz
برایان لاوین (Brian Lovin) گزارش داد که حساب‌های جدید X محتوای تولیدشده توسط هوش مصنوعی با کیفیت بسیار پایین، مطالب سیاسی و پست‌های بی‌ارزش را به عنوان فید پیش‌فرض مشاهده می‌کنند. @brian_lovin
ایتان مولیک اشاره کرد که روتر خودکار GPT-5 مشکلات ادراکی ایجاد می‌کند، زیرا بسیاری از نمونه‌های «چت‌جی‌پی‌تی X را اشتباه انجام داد» در واقع «چت‌جی‌پی‌تی-5 اینستنت اشتباه انجام داد» هستند که منجر به باورهای نادرست در مورد قابلیت‌های هوش مصنوعی می‌شود. @emollick
جان کارمک پیشنهاد کرد که از تاریخچه‌ی چت LLM به عنوان مرجع شغلی استفاده شود، با این استدلال که تاریخچه‌های چت چندساله سیگنال‌های بهتری نسبت به رزومه‌های سنتی ارائه می‌دهند و می‌توانند تناسب بین افراد و مشاغل را هم برای کارفرمایان و هم برای کارمندان بهینه کنند. @ID_AA_Carmack

کاربردها

گوگل با چندین ناشر از جمله در اشپیگل، گاردین، تایمز آو ایندیا و واشنگتن پست برای آزمایش ویژگی‌های تعامل هوش مصنوعی از جمله خلاصه‌های صوتی توسط جمینی در اخبار گوگل همکاری می‌کند. @AndrewCurran_
گوگل سرورهای مدیریت‌شده‌ی MCP را راه‌اندازی کرد که به عامل‌های هوش مصنوعی امکان می‌دهد به ابزارهای آن متصل شوند، به علاوه ویژگی «منابع ترجیحی» (Preferred Sources) در جستجو برای سفارشی‌سازی «اخبار برتر» (Top Stories) از منابع معتبر. @TechCrunch
فیگما ابزارهای حذف شیء و گسترش تصویر مبتنی بر هوش مصنوعی را در Design و Draw راه‌اندازی کرد که به کاربران امکان می‌دهد حواس‌پرتی‌ها را پاک کنند، پس‌زمینه‌ها را گسترش دهند و اشیاء را جدا کنند. @figma
میخائیل پاراخین (Mikhail Parakhin) سیستم SimGym را معرفی کرد که «مشتریان دیجیتال» ایجاد می‌کند که مانند مشتریان واقعی رفتار می‌کنند تا فرصت‌های بهینه‌سازی را آشکار کرده و امکان آزمایش A/B را با ترافیک زنده صفر فراهم کند. @MParakhin
ایتان مولیک نشان داد که نانو بنانا پرو (Nano Banana Pro) در NotebookLM می‌تواند ارائه‌های با کیفیت بالا را از مواد منبع با توهمات نادر تولید کند و آن را به عنوان جایگزینی بالقوه برای پاورپوینت معرفی کرد. @emollick
آندری کارپاتی (Andrej Karpathy) سیستم خودکار نمره‌دهی را با استفاده از API GPT 5.1 Thinking ایجاد کرد تا 930 بحث هکر نیوز (Hacker News) از دسامبر 2015 را با نگاهی به گذشته تحلیل کند و پربیننده‌ترین نظرات را با 60 دلار در 1 ساعت شناسایی کند. @karpathy
لینیر (Linear) گزارش داد که عامل هوش مصنوعی آن‌ها یکی از محبوب‌ترین ویژگی‌هایشان بوده است، با افزایش قابل توجهی در تعداد مسائل جدید ایجاد شده پس از راه‌اندازی. @karrisaarinen
ساتیا نادلا (Satya Nadella) بر همکاری مایکروسافت با وزارت کار هند برای استفاده از هوش مصنوعی برای اتصال بیش از 300 میلیون کارگر غیررسمی به مشاغل بهتر و تامین اجتماعی تاکید کرد. @satyanadella
CTGT منتات (Mentat) را راه‌اندازی کرد، یک API سازگار با OpenAI که از قابلیت تفسیر مکانیکی (mechanistic interpretability) برای ارائه‌ی کنترل قطعی بر رفتار LLM به شرکت‌ها استفاده می‌کند و تضمین‌های سیاست ایمنی را بدون نیاز به آموزش مجدد اضافه می‌کند. @CyrilGorlla
اسپاتیفای ویژگی «لیست‌های پخش پیشنهادی» (Prompted Playlists) مبتنی بر هوش مصنوعی و شخصی‌سازی‌شده‌تر را آزمایش می‌کند. @TechCrunch

پژوهش‌ها

گوگل دیپ‌مایند و گوگل ریسرچ مجموعه‌ی بنچمارک FACTS را توسعه دادند، اولین تست جامع صنعت که واقعیت‌سنجی LLM را در چهار بعد ارزیابی می‌کند: دانش مدل داخلی، جستجوی وب، زمینه‌سازی و ورودی‌های چندوجهی، با کسب امتیاز 68.8% توسط جمینی 3 پرو. @GoogleDeepMind
گوگل کلود AlphaEvolve را معرفی کرد، یک عامل کدنویسی مبتنی بر جمینی برای طراحی الگوریتم‌های پیشرفته که از LLMها برای پیشنهاد اصلاحات کد هوشمندانه در یک حلقه‌ی بازخورد استفاده می‌کند. @GoogleCloudTech
محققان استنفورد دریافتند که 1 از هر 20 بنچمارک هوش مصنوعی دارای نقص‌های جدی است، به این معنی که صنعت مدل‌های کم‌کارایی را تبلیغ کرده و مدل‌های بهتر را جریمه کرده است. @StanfordHAI
مایکروسافت ریسرچ Promptions را معرفی کرد که به توسعه‌دهندگان کمک می‌کند کنترل‌های پویا و آگاه به کانتکست را به رابط‌های چت اضافه کنند تا کاربران بتوانند پاسخ‌های هوش مصنوعی مولد را بدون نوشتن دستورالعمل‌های طولانی هدایت کنند. @MSFTResearch
ناتان لمبرت (Nathan Lambert) سخنرانی جامعی را منتشر کرد که تمام مراحل ساخت Olmo 3 Think را پوشش می‌دهد، از جمله تغییرات در پیش‌آموزش، ارزیابی و پس‌آموزش با تمرکز بر زیرساخت یادگیری تقویتی. @natolambert
LeRobot Community Datasets v3 تعداد 50 هزار اپیزود را در 46 نوع ربات از 235 مشارکت‌کننده در سراسر جهان منتشر کرد که یکی از بزرگترین مجموعه‌های نمایش ربات‌های متن‌باز و جمع‌سپاری‌شده است. @danaaubakir
آدی اولتین (Adi Oltean) آموزش اولین LLM در فضا را با استفاده از NVIDIA H100 در Starcloud-1 اعلام کرد و مدل nanoGPT را با موفقیت بر روی آثار کامل شکسپیر آموزش داد و استنتاج را اجرا کرد. <a href="https://x.com/AdiOltean/status/19987699974310

اخبار هوش مصنوعی در 2025-12-09

مدل‌های جدید هوش مصنوعی

علی‌بابا Qwen Code v0.2.2-v0.3.0 را با پشتیبانی از JSON جریانی، بین‌المللی‌سازی کامل و ویژگی‌های امنیتی پیشرفته شامل محدودیت‌های بافر 20 مگابایتی و سازگاری بهبودیافته بین پلتفرم‌ها منتشر کرد. @Alibaba_Qwen
علی‌بابا بهینه‌سازی سیاست تطبیقی نرم (SAPO) را معرفی کرد، یک روش یادگیری تقویتی برای آموزش مدل‌های زبان بزرگ که برش سخت را با گیت‌های کنترل‌شده با دما جایگزین می‌کند تا پایداری و عملکرد را بهبود بخشد، به‌ویژه در مدل‌های MoE. @Alibaba_Qwen
میسترال خانواده‌ی مدل کدنویسی Devstral 2 را در دو اندازه (123B تحت مجوز MIT اصلاح‌شده و 24B تحت Apache 2.0) منتشر کرد که هر دو متن‌باز و پیشرفته هستند، در کنار CLI Mistral Vibe برای اتوماسیون سرتاسری. @MistralAI
جانشین لاما متا با نام رمز Avocado، که در ابتدا برای انتشار در کریسمس برنامه‌ریزی شده بود، به اوایل سال 2026 موکول شد، با این احتمال که به‌جای متن‌باز بودن، اختصاصی باشد. @AndrewCurran_
گوگل Gemini 3 را با قابلیت‌های استدلال پیشرفته منتشر کرد که امکان ایجاد بازی‌های سه‌بعدی تعاملی، تحلیل بازخورد ارائه‌ها و تولید ابزار درخواستی در حالت هوش مصنوعی جستجو را فراهم می‌کند. @GoogleAI
اپلیکیشن Gemini گالری قالب‌های آزمایشی برای ایجاد ویدئو را معرفی کرد که به کاربران امکان می‌دهد قالب‌ها را انتخاب کرده یا با تصاویر خود سفارشی‌سازی کنند. @GeminiApp

تحلیل صنعت

گزارش «وضعیت هوش مصنوعی در شرکت‌ها» از OpenAI نشان می‌دهد که حجم پیام‌رسانی سازمانی 8 برابر نسبت به سال گذشته افزایش یافته است، به‌طوری که کارمندان به‌طور متوسط 30 درصد پیام‌های بیشتری ارسال می‌کنند و کارگران گزارش می‌دهند که روزانه 40 تا 60 دقیقه صرفه‌جویی می‌کنند. @OpenAI
گزارش Menlo Ventures نشان می‌دهد که Anthropic با 40 درصد از 37 میلیارد دلار هزینه، بازار هوش مصنوعی سازمانی را رهبری می‌کند و از OpenAI به‌عنوان ارائه‌دهنده‌ی مدل شماره 1 پیشی گرفته است، با هوش مصنوعی مولد که 6 درصد از هزینه‌های نرم‌افزار را به خود اختصاص داده و سالانه 3.2 برابر رشد می‌کند. @deedydas
پذیرش هوش مصنوعی سازمانی نشان‌دهنده‌ی تغییر از ساخت راه‌حل‌های سفارشی به خرید مدل‌های آماده است، به‌طوری که شرکت‌هایی که راه‌حل‌های هوش مصنوعی خود را می‌سازند از نیمی به یک‌چهارم کاهش یافته‌اند. @deedydas
کدنویسی با اختلاف قابل‌توجهی بر هزینه‌های هوش مصنوعی دپارتمانی غالب است، در حالی که مراقبت‌های بهداشتی در کاربردهای هوش مصنوعی عمودی پیشتاز است و پس از آن بخش‌های حقوقی، خلاقان و دولتی با فاصله قرار دارند. @deedydas
OpenAI دنیس درسِر، مدیرعامل سابق Slack، را به‌عنوان مدیر ارشد درآمد منصوب کرد تا استراتژی درآمد جهانی و پشتیبانی مشتری در مقیاس را رهبری کند. @OpenAI
مایکروسافت از سرمایه‌گذاری 17.5 میلیارد دلاری در هند تا سال 2029 خبر داد، بزرگترین سرمایه‌گذاری خود در آسیا، برای ساخت زیرساخت‌های هوش مصنوعی، مهارت‌ها و قابلیت‌های حاکمیتی. @satyanadella
Anthropic همکاری خود را با Accenture گسترش داد و گروه تجاری Accenture Anthropic را با 30,000 متخصص آموزش‌دیده در Claude ایجاد کرد تا به شرکت‌ها در انتقال از پروژه‌های آزمایشی هوش مصنوعی به تولید کمک کند. @AnthropicAI
چین در حال بررسی اجازه دسترسی محدود به تراشه‌های H200 انویدیا با الزامات توجیه، محدودیت در خریدهای بخش دولتی و یارانه‌ها فقط برای تراشه‌های داخلی است. @AndrewCurran_
تراشه‌های H200 انویدیا که برای صادرات به چین آزاد شده‌اند، ابتدا تحت بررسی امنیت ملی در ایالات متحده قرار خواهند گرفت و 25 درصد از هزینه به‌عنوان مالیات واردات به‌جای مالیات صادرات طبقه‌بندی می‌شود. @AndrewCurran_
OpenAI، Anthropic و Block بنیاد Agentic AI را تحت بنیاد لینوکس تأسیس کردند تا از استانداردهای باز و قابل همکاری برای هوش مصنوعی عامل‌محور حمایت کنند، با اهدای پروتکل Model Context توسط Anthropic. @OpenAINewsroom
شاخص شفافیت مدل بنیاد 2025 استنفورد نشان می‌دهد که شفافیت در صنعت هوش مصنوعی در حال پسرفت است و دستاوردهای سال گذشته را معکوس می‌کند، به‌طوری که IBM امتیاز 95/100 و xAI امتیاز 14/100 را کسب کرده است. @StanfordHAI
سه نفر از هر ده نوجوان آمریکایی روزانه از چت‌بات‌های هوش مصنوعی استفاده می‌کنند، اما نگرانی‌های ایمنی در میان والدین و مربیان در حال افزایش است. @TechCrunch
توسعه‌ی مبتنی بر ارتقا در شرکت‌های بزرگ فناوری، در حالی که مورد انتقاد قرار گرفته است، به سازمان‌ها کمک می‌کند تا چابک و قادر به نوآوری سریع باقی بمانند، همانطور که با ارسال سریع گوگل با Gemini و هوش مصنوعی مشهود است. @GergelyOrosz
داده‌های استفاده از OpenAI نشان می‌دهد که 5 درصد برتر کاربران 6 برابر بیشتر از میانگین پیام ارسال می‌کنند، با کدنویسی، نوشتن و تحلیل که بزرگترین شکاف‌ها را بین کاربران قدرتمند و کاربران عادی نشان می‌دهد. @soleio
Boom Supersonic 300 میلیون دلار برای ساخت توربین‌های گاز طبیعی برای مراکز داده Crusoe جمع‌آوری کرد و از فناوری مافوق صوت برای تأمین مالی توسعه‌ی هواپیما از طریق سود توربین‌ها استفاده می‌کند. @TechCrunch

اخلاق و جامعه

محققان Anthropic Selective Gradient Masking (SGTM) را توسعه دادند تا دانش پرخطر را در پارامترهای مدل جداگانه ایزوله کنند که می‌توانند بدون تأثیر گسترده بر عملکرد حذف شوند، که برای بازیابی دانش فراموش‌شده در مقایسه با روش‌های قبلی فراموشی، 7 برابر بیشتر به تنظیم دقیق نیاز دارد. @AnthropicAI
هیئت کالیفرنیا پیشنهاد می‌کند که شرکت‌های هوش مصنوعی به یک نهاد دولتی مرکزی که نماینده‌ی دارندگان حق تکثیر است، حق امتیاز پرداخت کنند و مدل فعلی انصراف را برای محافظت از آثار خلاقانه ناکارآمد می‌داند. @AndrewCurran_
اتحادیه‌ی اروپا تحقیقات ضد انحصار را در مورد ابزارهای جستجوی هوش مصنوعی گوگل آغاز کرد و اقدامات بالقوه ضد رقابتی در ویژگی‌های جستجوی مبتنی بر هوش مصنوعی را بررسی می‌کند. @TechCrunch
Ring آمازون ویژگی تشخیص چهره‌ی مبتنی بر هوش مصنوعی بحث‌برانگیز را برای زنگ‌های ویدئویی خود عرضه کرد که نگرانی‌هایی را در مورد حریم خصوصی در میان کاربران و مدافعان ایجاد کرده است. @TechCrunch
آرویند نارایانان هشدار می‌دهد که ردیاب‌های هوش مصنوعی مانند Pangram، با وجود ادعای نرخ مثبت کاذب 1 در 10,000، اگر به‌طور سیستماتیک استفاده شوند، همچنان 5 تا 10 درصد از دانش‌آموزان را در طول چهار سال به‌طور کاذب به تقلب متهم خواهند کرد. @random_walker
لوایح هوش مصنوعی کالیفرنیا ابهامات تعریفی را در مورد اصطلاحاتی مانند مدل‌های مرزی و اقدامات معقول ایجاد می‌کنند، با پتانسیل اینکه شرکت‌های ناخواسته را در بر بگیرند یا امکان دور زدن از طریق تنظیم دقیق را فراهم کنند. @random_walker
وزارت دفاع ایالات متحده پلتفرم GenAi.mil را راه‌اندازی کرد که مدل‌های هوش مصنوعی پیشرفته را مستقیماً در اختیار پرسنل نظامی قرار می‌دهد، با شروع ادغام Gemini. @AndrewCurran_

کاربردها

تحقیقات Perplexity با تحلیل صدها میلیون تعامل کاربر نشان می‌دهد که 55 درصد از پرس‌وجوهای عامل از استفاده‌ی شخصی، 30 درصد حرفه‌ای و 16 درصد آموزشی است، با کار شناختی که با 36 درصد بهره‌وری و 21 درصد وظایف یادگیری غالب است. @perplexity_ai
مایکروسافت و شرکا GigaTIME را در مجله‌ی Cell منتشر کردند، یک ابزار هوش مصنوعی که پروتئومیکس فضایی را از اسلایدهای پاتولوژی روتین برای تحقیقات سرطان در مقیاس جمعیتی در ده‌ها نوع سرطان شبیه‌سازی می‌کند. @satyanadella
Waymo پیشرفته‌ترین کاربرد در مقیاس بزرگ هوش مصنوعی تجسم‌یافته را در رانندگی خودران نشان می‌دهد، با استفاده از تقطیر از مدل‌های بزرگتر برای ایجاد مدل‌های کارآمد محاسباتی در خودرو. @JeffDean
Stripe با Instacart همکاری می‌کند تا پرداخت مستقیم در ChatGPT را با استفاده از پروتکل Agentic Commerce و توکن‌های پرداخت مشترک Stripe برای مدیریت پرداخت امن فعال کند. @gdb
OpenAI با دویچه تلکام همکاری می‌کند تا هوش مصنوعی را به میلیون‌ها مشتری و کسب‌وکار در سراسر اروپا بیاورد. @gdb
Linker Vision از NVIDIA Metropolis، NVIDIA Cosmos و Omniverse در گردش کار شبیه‌سازی-آموزش-استقرار استفاده می‌کند تا به شهرها کمک کند با بینش‌های ویدئویی بلادرنگ از عوامل هوش مصنوعی هوشمندتر شوند. @NVIDIAAI
Fireworks AI با Kimi K2 که بر روی سیستم‌های NVIDIA GB200 NVL72 اجرا می‌شود، به بالاترین عملکرد در جدول رده‌بندی Artificial Analysis دست یافت و ارائه‌ی MoE عظیم را متحول کرد. @NVIDIAAI
Pryzm 12 میلیون دلار سری A را به رهبری a16z برای ساخت سیستم عامل هوش مصنوعی برای تدارکات فدرال جمع‌آوری کرد و ماه‌ها کار را در چند دقیقه با مجوز IL5 و FedRAMP High فشرده کرد. @a16z
Aradigm Health سری A را برای ساخت آینده‌ی پوشش مراقبت‌های بهداشتی با اولویت درمان جمع‌آوری کرد و درمان‌های سلولی و ژنی میلیون دلاری را با تجمیع ریسک و هماهنگی مسیرهای بیمار قابل دسترس کرد. @a16z
تح

اخبار هوش مصنوعی در 2025-12-08

مدل‌های جدید هوش مصنوعی

Gemini 3 Flash اکنون در LM Arena در دسترس است @legit_api
Zhipu AI سری GLM-4.6V را در Hugging Face منتشر کرد که شامل یک مدل زبان-بینایی پرچم‌دار 106B با 128K کانتکست و یک نسخه 9B Flash است و اولین قابلیت بومی فراخوانی تابع (Function Calling) را در خانواده مدل‌های بینایی GLM ارائه می‌دهد @Zai_org

تحلیل صنعت

OpenAI در گزارش هوش مصنوعی سازمانی خود اعلام کرد که حجم پیام‌های ChatGPT هشت برابر و مصرف توکن استدلال API به ازای هر سازمان 320 برابر نسبت به سال گذشته افزایش یافته است @AndrewCurran_
ChatGPT اکنون روزانه 2.5 میلیارد درخواست را پردازش می‌کند که تنها چند ماه پیش 1 میلیارد بود، و 70% از مصرف‌کنندگان اکنون ابزارهای هوش مصنوعی را برای توصیه‌ی محصول به جستجوی سنتی ترجیح می‌دهند @mehdiyarix
ترافیک جستجوی هوش مصنوعی 527% نسبت به سال گذشته رشد کرده است در حالی که جستجوی سنتی ثابت مانده است، که نگرانی‌هایی را برای برندهایی که دید هوش مصنوعی خود را ردیابی نمی‌کنند، ایجاد می‌کند @mehdiyarix
Skild AI، با حمایت آمازون و تأسیس‌شده توسط محققان سابق متا، در حال جذب دور جدیدی از سرمایه‌گذاری از NVIDIA و SoftBank با ارزش 14 میلیارد دلار است که ارزش آن از ماه ژوئن سه برابر شده است @AndrewCurran_
Anthropic و OpenAI به شدت در اروپا استخدام می‌کنند و 2 تا 3 برابر حقوق پایه مهندسان و محققان هوش مصنوعی در استارتاپ‌های هوش مصنوعی اتحادیه‌ی اروپا را با دفاتر در لندن و سوئیس ارائه می‌دهند @GergelyOrosz
Linear در حال تجربه‌ی رشد عظیمی در موارد استفاده‌ای است که توسعه‌دهندگان وظایف را به عامل‌های هوش مصنوعی مانند Cursor و Codex برای پیاده‌سازی واگذار می‌کنند و ردیاب‌های مسائل را به مراکز عامل هوش مصنوعی تبدیل می‌کنند @GergelyOrosz
Clay پس از شش سال به 100 میلیون دلار ARR می‌رسد، که در تنها دو سال از 1 میلیون دلار به 100 میلیون دلار رشد کرده است، با صفر ریزش مشتری سازمانی، بیش از 200% NRR سازمانی، و 15 برابر بازگشت سرمایه به ازای هر دلار سرمایه‌گذاری‌شده @vxanand
رشد استارتاپ Linear نشان می‌دهد که وقتی کارها درست پیش می‌روند، واقعاً درست پیش می‌روند، و درآمد امسال به تنهایی از تمام سال‌های گذشته بیشتر است @karrisaarinen
AWS S3 Vectors را برای ذخیره و استفاده از وکتورها در مقیاس عظیم راه‌اندازی می‌کند، که به طور بالقوه پایگاه‌های داده‌ی فقط وکتور را به چالش می‌کشد زیرا پایگاه‌های داده‌ی رابطه‌ای نیز از وکتور پشتیبانی می‌کنند @GergelyOrosz
وزارت بازرگانی صادرات H200 GPU به چین را با حمایت وزیر بازرگانی، هاوارد لوت‌نیک، تأیید کرد @AndrewCurran_
IBM Confluent را به مبلغ 11 میلیارد دلار برای تقویت ارائه‌ی داده‌های خود خریداری می‌کند @TechCrunch
Tiger Global آینده‌ی سرمایه‌گذاری خطرپذیر محتاطانه‌ای را با یک صندوق 2.2 میلیارد دلاری جدید برنامه‌ریزی می‌کند @TechCrunch
مطالعه‌ی آزمایشگاه بودجه‌ی ییل نشان می‌دهد که هوش مصنوعی بر اساس 33 ماه داده پس از انتشار ChatGPT، هیچ اختلال قابل توجهی در بازار کار ایجاد نکرده است، و هوش مصنوعی مسئول نیمی از رشد تولید ناخالص داخلی ایالات متحده است @DavidSacks
گزارش Challenger Gray در نوامبر نشان می‌دهد که اخراج‌های مرتبط با هوش مصنوعی 53% نسبت به اکتبر کاهش یافته است، که تنها 6,280 اخراج و فقط 4.7% از کل اخراج‌ها را در سال جاری تشکیل می‌دهد @DavidSacks
شکاف بهره‌وری بین دانشگاهیان مرد و زن پس از ChatGPT افزایش یافته است، که احتمالاً به دلیل استفاده‌ی بیشتر مردان از LLMها است @MishaTeplitskiy

اخلاق و جامعه

آزمایشگاه‌های هوش مصنوعی نگران استفاده از مدل‌های ویدیویی برای فریب سیاسی بودند، اما اصلی‌ترین استفاده‌ی گمراه‌کننده‌ی آن‌ها نشان دادن حیواناتی است که به روش‌های غیرممکن یا غیرطبیعی رفتار می‌کنند، و اکثر مردم این ویدیوها را واقعی می‌دانند @AndrewCurran_
رئیس جمهور ترامپ تأیید می‌کند که یک فرمان اجرایی «یک قانون هوش مصنوعی» این هفته برای ایجاد اولویت فدرال بر قوانین هوش مصنوعی ایالتی صادر خواهد شد، با هدف جلوگیری از مجموعه‌ای از 50 رژیم نظارتی مختلف @AndrewCurran_
دیوید ساکس، مدیر ارشد هوش مصنوعی، از رویکرد «یک کتاب قانون» دفاع می‌کند و استدلال می‌کند که بیش از 1200 لایحه در مجالس ایالتی معرفی شده است و بیش از 100 اقدام قبلاً تصویب شده است، که هرج و مرج نظارتی ایجاد می‌کند که می‌تواند نوآوری را متوقف کرده و به چین اجازه دهد پیشتاز شود @AndrewCurran_
ایالت‌هایی مانند کلرادو، کالیفرنیا و ایلینوی توسعه‌دهندگان هوش مصنوعی را مسئول تبعیض الگوریتمی تعریف‌شده به عنوان تأثیر نامتناسب بر گروه‌های محافظت‌شده قرار داده‌اند، که لیست کلرادو شامل مهارت زبان انگلیسی نیز می‌شود @AndrewCurran_
گروه‌های محیط زیست خواستار توقف ساخت مراکز داده‌ی جدید شده‌اند و نگرانی‌هایی را در مورد تأثیر زیست محیطی زیرساخت‌های هوش مصنوعی مطرح کرده‌اند @TechCrunch
سخنرانی کوری دکترو در مورد شک و تردید نسبت به هوش مصنوعی مفهوم سانتور در مقابل سانتور معکوس را معرفی می‌کند: سانتور به معنای انسانی است که هوش مصنوعی را برای افزایش مهارت‌ها کنترل می‌کند، در حالی که سانتور معکوس به معنای سیستمی از هوش مصنوعی است که انسان را هدایت و کنترل می‌کند @simonw
وزارت جنگ یک کمیته‌ی راهبری آینده‌ی هوش مصنوعی را با هدف صریح توسعه‌ی پیش‌بینی‌ها، برنامه‌ها و سیاست‌های AGI تأسیس می‌کند @deanwball

کاربردها

Google DeepMind اپلیکیشن Lyria Camera را راه‌اندازی می‌کند که از Gemini برای توصیف محیط اطراف استفاده می‌کند در حالی که مدل Lyria RealTime آن درخواست‌ها را به جریان‌های موسیقی در حال تکامل مداوم تبدیل می‌کند @GoogleDeepMind
Instacart با ChatGPT ادغام می‌شود و به کاربران امکان می‌دهد بدون خروج از رابط ChatGPT مواد غذایی بخرند @TechCrunch
Hinge ویژگی جدید هوش مصنوعی را برای کمک به قرار ملاقات‌کنندگان برای فراتر رفتن از صحبت‌های کوچک خسته‌کننده راه‌اندازی می‌کند @TechCrunch
Adobe مرکز ایجاد محتوا را در Premiere mobile برای سازندگان YouTube Shorts راه‌اندازی می‌کند @TechCrunch
Anthropic اعلام می‌کند که Claude Code به Slack می‌آید، که نشان‌دهنده‌ی یک ادغام مهم برای گردش کارهای سازمانی است @TechCrunch
Thales با Cohere برای توسعه‌ی راه‌حل‌های پیشرفته‌ی هوش مصنوعی برای پشتیبانی در خدمت نیروی دریایی و دریایی در کانادا همکاری می‌کند، با استفاده از ابزارهای هوش مصنوعی عامل‌محور برای تجزیه و تحلیل و انطباق با محیط‌های پیچیده و پویا در زمان واقعی @ThalesCanada
پادکست WonderWise از هوش مصنوعی برای تبدیل سوالات علمی کودکان به آهنگ‌های آموزشی استفاده می‌کند، با ترکیب محتوای تولیدشده توسط هوش مصنوعی با روایت انسانی برای ایجاد تجربه‌های یادگیری جذاب @Aalefsrajabali
هکاتون xAI کاربردهای متنوع هوش مصنوعی را به نمایش می‌گذارد، از جمله Halftime که به طور پویا تبلیغات تولیدشده توسط هوش مصنوعی را در صحنه‌ها می‌بافد، GrokMarks برای سازماندهی خودکار نشانک‌های X، و Haggle یک عامل صوتی خودمختار برای مذاکره با ارائه‌دهندگان خدمات @xai
Clay یک مسیر شغلی و اقتصاد جدید در اطراف مهندسی GTM ایجاد می‌کند، با هزاران شغل باز و صدها آژانس که حول آن ساخته شده‌اند، بسیاری از کارآفرینان برای اولین بار کسب و کارهای 7 رقمی می‌سازند @vxanand
Nano Banana Pro جیمینی می‌تواند تصاویر را با آپلود ساده و تعیین نسبت ابعاد دلخواه تغییر اندازه دهد، که کاربرد عملی هوش مصنوعی را نشان می‌دهد @GeminiApp

پژوهش‌ها

AxiomProver به طور خودمختار 8 از 12 مسئله‌ی Putnam 2025 را در Lean تا ساعت 3:58 بعد از ظهر در روز مسابقه حل کرد، نمره‌ای که رتبه‌ی 4 را از حدود 4000 شرکت‌کننده کسب می‌کرد و وضعیت Putnam Fellow را به دست می‌آورد @CarinaLHong
تحقیقات در مورد پرامپتینگ شخصیت نشان می‌دهد که گفتن به هوش مصنوعی که «شما یک فیزیکدان بزرگ هستید» دقت آن را در پاسخ به سوالات فیزیک به طور قابل توجهی افزایش نمی‌دهد، که نشان می‌دهد شخصیت‌ها دقت را بهبود نمی‌بخشند اما ممکن است فرمت خروجی را تغییر دهند @emollick
مطالعه نشان می‌دهد که LLMهای بالینی می‌توانند امتحانات پزشکی را با 84-90% دقت با موفقیت پشت سر بگذارند، اما در وظایف بالینی واقعی با 45-69% و ارزیابی‌های ایمنی با 40-50% عملکرد ضعیفی دارند، که نشان می‌دهد معیارهای سبک امتحان، معیارهای گمراه‌کننده‌ای برای آمادگی بالینی هستند @rohanpaul_ai
Unconventional AI 475 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z برای مقابله با هدف بزرگ ساخت تراشه‌های هوش مصنوعی-محور که 1000 برابر کارآمدتر هستند، با هدف کارایی در مقیاس بیولوژیکی در 20 سال آینده، جذب می‌کند <a href="https://x.com/N

1 2 3 4 5...26