اخبار هوش مصنوعی در 2025-11-09

مدل‌های جدید هوش مصنوعی

OpenAI به‌صورت جزئی GPT-5-Codex-Mini را منتشر کرد؛ مدل جدیدی که هنوز دسترسی API ندارد و فقط از طریق اپلیکیشن کدمان لاین (CLI) کادکس آن‌ها برای وظایف تولید کد قابل دسترسی است @simonw

تحلیل صنعت

کریس لتنر، خالق سوئیفت (Swift) و موجو (Mojo)، با طراحی زبان‌های برنامه‌نویسی جدید به‌طور خاص برای مدل‌های زبان بزرگ (LLM) مخالفت می‌کند و پیشنهاد می‌دهد که زبان‌های فعلی برای توسعه‌ی مبتنی بر هوش مصنوعی کافی هستند @GergelyOrosz
تک‌کرانچ (TechCrunch) بررسی می‌کند که آیا «چرخه‌ی هیاهوی هوش مصنوعی» (AI hype cycle) در حال از بین بردن خود است یا خیر، و سرمایه‌گذاری مشترک جدید سافت‌بانک (SoftBank) و OpenAI را به‌عنوان یک مورد مطالعاتی تحلیل می‌کند @TechCrunch
MIT Technology Review گزارش می‌دهد که «انرژی» در توسعه‌ی هوش مصنوعی حرف اول را می‌زند (energy is king)، و آمریکا در این رقابت زیرساخت حیاتی عقب مانده است @techreview
گوگل ماهانه ۱۰ به توان ۱۵ توکن تولید می‌کند، که معادل تولید محتوای اینترنتی با کیفیت بالا به‌صورت هفتگی است، و با نرخ رشد فعلی تا می ۲۰۳۲ از کل گفتار بشر در طول تاریخ فراتر خواهد رفت @deedydas

اخلاق و جامعه

رید هافمن تاکید می‌کند که متخصصان فناوری موظفند فناوری‌هایی بسازند که «عاملیت انسانی» (human agency) را گسترش دهد، نه اینکه آن را از بین ببرد، و رویکردی متعادل بین شتاب‌بخشی و هدایت متفکرانه را ترویج می‌کند @reidhoffman
آهنگ‌های ضد مهاجر تولید شده توسط هوش مصنوعی، ۱۰ آهنگ برتر پربازدید اسپاتیفای هلند را تسخیر کرده‌اند، که گفته می‌شود ۸ آهنگ از این ۱۰ آهنگ توسط مزرعه‌ی ربات‌ها (bot farms) تقویت شده‌اند، و نگرانی‌هایی را در مورد دستکاری پلتفرم‌های فرهنگی توسط هوش مصنوعی ایجاد می‌کند @deedydas
گرگلی اوروس (Gergelyorosz) هشدار می‌دهد که «هذیان‌گویی مدل‌های زبان بزرگ» (LLM hallucinations) نیازمند اعتبارسنجی مداوم است، و مثالی را به اشتراک گذاشته که در آن کلاد (Claude) جملاتی ساختگی را نقل کرده که در متن ورودی وجود نداشته‌اند @GergelyOrosz
واترمارک سورا (Sora) اوپن‌ای‌آی اکنون شامل یک «شناسه‌ی حساب» (account identifier) است، که به محتوای تولید شده‌ی قبلی نیز به‌صورت گذشته‌نگر اعمال می‌شود @AndrewCurran_
سایمون ویلسون (Simon Willison) نشان می‌دهد که چگونه MCP از قابلیت ثبت پویای کلاینت (Dynamic Client Registration) اوآوت (OAuth) استفاده می‌کند، این اولین باری است که این قابلیت کم‌تر شناخته شده در نرم‌افزارهای پرکاربرد به کار گرفته شده است @simonw

کاربردها

ارزیابی‌ها نشان می‌دهد که «کیمی K2 تینکینگ» (Kimi K2 Thinking) در وظایف پشتیبانی مشتری مبتنی بر عامل (agentic) با «GPT-5» (GPT-5) هم‌سطح عمل می‌کند، و هیچ مدل زبان بزرگ دیگری به این سطح از قابلیت‌های هماهنگی و استدلال نرسیده است @omarsar0
کیمی K2 تینکینگ توکن‌های فکری به‌مراتب بیشتری نسبت به سایر مدل‌ها تولید می‌کند؛ برای پرس‌وجوهای ساده‌ای مانند «یک جمله‌ی واقعاً خوب درباره‌ی پنیر بنویس» ۱۵۹۵ توکن تولید می‌کند، در حالی که دیپ‌سیک (DeepSeek) ۱۱۰ توکن تولید می‌کند @emollick
پژوهش‌ها نشان می‌دهد که ارائه‌ی «راهنمایی LLM» (LLM guidance) به دانشجویان نسل اول دانشگاه، شکاف در درک قوانین نانوشته برای موفقیت تحصیلی را به‌طور چشمگیری کاهش می‌دهد، مانند ارزش کارآموزی‌ها و کلوپ‌های دانشجویی @emollick
کلاد کد (Claude Code) با موفقیت چندین برنامه‌ی کوچک را که در ابتدا با «GPT-4» (GPT-4) ساخته شده بودند، سازماندهی، بهبود و به‌روزرسانی کرد، که مرزهای در حال حرکت قابلیت‌های کدنویسی هوش مصنوعی را نشان می‌دهد @emollick
سایمون ویلسون ابزار کدمان لاین (CLI) کادکس اوپن‌ای‌آی را هک کرد تا یک دستور اعلان (prompt) جدید اضافه کند، که دسترسی به مدل‌های خصوصی را امکان‌پذیر می‌سازد و به این ابزار اجازه می‌دهد خود را مهندسی معکوس و گسترش دهد @simonw
پرپلکسیتی (Perplexity) دعوت‌نامه‌های دسترسی زودهنگام به کامت اندروید (Comet Android) را اعلام کرد، و کاربران را بر اساس میزان استفاده از اندروید و وضعیت اشتراک پرو/مکس اولویت‌بندی می‌کند @AravSrinivas

پژوهش‌ها

اتان مولیک نگرانی‌هایی را درباره‌ی کمبود سازوکارهای آکادمیک برای پذیرش، بررسی و انتشار افزایش ناگهانی احتمالی «اکتشافات علمی تولید شده توسط هوش مصنوعی» (AI-generated scientific discoveries) مطرح می‌کند، و این سوال را مطرح می‌کند که چه کسی هزاران مقاله‌ی جدید را خواهد خواند، ادغام خواهد کرد و بر اساس آن‌ها کار خواهد کرد @emollick
تحلیل‌ها نشان می‌دهد که در حالی که هوش مصنوعی در برخی حوزه‌ها می‌تواند علم نوآورانه انجام دهد، وظایفی که نیازمند ادغام و نظریه‌پردازی در گستره‌ی وسیعی از دانش هستند، همچنان فراتر از مرزهای کنونی باقی می‌مانند @emollick
مقایسه‌ی مدل‌های هوش مصنوعی در پرامپت‌های مربوط به مداخلات تاریخی نشان می‌دهد که حتی مدل‌های چینی نیز تنها مداخلات غربی و خاورمیانه‌ای را پیشنهاد کرده‌اند، در حالی که هیچ کدام از گزینه‌ها در آسیا، آفریقا یا آمریکا را انتخاب نکرده‌اند، با وجود اینکه در ردیابی‌های فکری خود آن‌ها را در نظر گرفته بودند @emollick
نقدی پیشنهاد می‌کند که «DPO» (بهینه‌سازی ترجیح مستقیم) (DPO - Direct Preference Optimization) یک مقاله‌ی «شتاب‌گریز» (decelerationist) مؤثر بوده است، که باعث شده منابع آکادمیک به جای ساخت زیرساخت برای گرادیان‌های سیاست در مقیاس بزرگ، بر روی انواع آن تمرکز کنند @kalomaze