اخبار هوش مصنوعی در 2025-11-09
مدلهای جدید هوش مصنوعی
- OpenAI بهصورت جزئی GPT-5-Codex-Mini را منتشر کرد؛ مدل جدیدی که هنوز دسترسی API ندارد و فقط از طریق اپلیکیشن کدمان لاین (CLI) کادکس آنها برای وظایف تولید کد قابل دسترسی است @simonw
تحلیل صنعت
- کریس لتنر، خالق سوئیفت (Swift) و موجو (Mojo)، با طراحی زبانهای برنامهنویسی جدید بهطور خاص برای مدلهای زبان بزرگ (LLM) مخالفت میکند و پیشنهاد میدهد که زبانهای فعلی برای توسعهی مبتنی بر هوش مصنوعی کافی هستند @GergelyOrosz
- تککرانچ (TechCrunch) بررسی میکند که آیا «چرخهی هیاهوی هوش مصنوعی» (AI hype cycle) در حال از بین بردن خود است یا خیر، و سرمایهگذاری مشترک جدید سافتبانک (SoftBank) و OpenAI را بهعنوان یک مورد مطالعاتی تحلیل میکند @TechCrunch
- MIT Technology Review گزارش میدهد که «انرژی» در توسعهی هوش مصنوعی حرف اول را میزند (energy is king)، و آمریکا در این رقابت زیرساخت حیاتی عقب مانده است @techreview
- گوگل ماهانه ۱۰ به توان ۱۵ توکن تولید میکند، که معادل تولید محتوای اینترنتی با کیفیت بالا بهصورت هفتگی است، و با نرخ رشد فعلی تا می ۲۰۳۲ از کل گفتار بشر در طول تاریخ فراتر خواهد رفت @deedydas
اخلاق و جامعه
- رید هافمن تاکید میکند که متخصصان فناوری موظفند فناوریهایی بسازند که «عاملیت انسانی» (human agency) را گسترش دهد، نه اینکه آن را از بین ببرد، و رویکردی متعادل بین شتاببخشی و هدایت متفکرانه را ترویج میکند @reidhoffman
- آهنگهای ضد مهاجر تولید شده توسط هوش مصنوعی، ۱۰ آهنگ برتر پربازدید اسپاتیفای هلند را تسخیر کردهاند، که گفته میشود ۸ آهنگ از این ۱۰ آهنگ توسط مزرعهی رباتها (bot farms) تقویت شدهاند، و نگرانیهایی را در مورد دستکاری پلتفرمهای فرهنگی توسط هوش مصنوعی ایجاد میکند @deedydas
- گرگلی اوروس (Gergelyorosz) هشدار میدهد که «هذیانگویی مدلهای زبان بزرگ» (LLM hallucinations) نیازمند اعتبارسنجی مداوم است، و مثالی را به اشتراک گذاشته که در آن کلاد (Claude) جملاتی ساختگی را نقل کرده که در متن ورودی وجود نداشتهاند @GergelyOrosz
- واترمارک سورا (Sora) اوپنایآی اکنون شامل یک «شناسهی حساب» (account identifier) است، که به محتوای تولید شدهی قبلی نیز بهصورت گذشتهنگر اعمال میشود @AndrewCurran_
- سایمون ویلسون (Simon Willison) نشان میدهد که چگونه MCP از قابلیت ثبت پویای کلاینت (Dynamic Client Registration) اوآوت (OAuth) استفاده میکند، این اولین باری است که این قابلیت کمتر شناخته شده در نرمافزارهای پرکاربرد به کار گرفته شده است @simonw
کاربردها
- ارزیابیها نشان میدهد که «کیمی K2 تینکینگ» (Kimi K2 Thinking) در وظایف پشتیبانی مشتری مبتنی بر عامل (agentic) با «GPT-5» (GPT-5) همسطح عمل میکند، و هیچ مدل زبان بزرگ دیگری به این سطح از قابلیتهای هماهنگی و استدلال نرسیده است @omarsar0
- کیمی K2 تینکینگ توکنهای فکری بهمراتب بیشتری نسبت به سایر مدلها تولید میکند؛ برای پرسوجوهای سادهای مانند «یک جملهی واقعاً خوب دربارهی پنیر بنویس» ۱۵۹۵ توکن تولید میکند، در حالی که دیپسیک (DeepSeek) ۱۱۰ توکن تولید میکند @emollick
- پژوهشها نشان میدهد که ارائهی «راهنمایی LLM» (LLM guidance) به دانشجویان نسل اول دانشگاه، شکاف در درک قوانین نانوشته برای موفقیت تحصیلی را بهطور چشمگیری کاهش میدهد، مانند ارزش کارآموزیها و کلوپهای دانشجویی @emollick
- کلاد کد (Claude Code) با موفقیت چندین برنامهی کوچک را که در ابتدا با «GPT-4» (GPT-4) ساخته شده بودند، سازماندهی، بهبود و بهروزرسانی کرد، که مرزهای در حال حرکت قابلیتهای کدنویسی هوش مصنوعی را نشان میدهد @emollick
- سایمون ویلسون ابزار کدمان لاین (CLI) کادکس اوپنایآی را هک کرد تا یک دستور اعلان (prompt) جدید اضافه کند، که دسترسی به مدلهای خصوصی را امکانپذیر میسازد و به این ابزار اجازه میدهد خود را مهندسی معکوس و گسترش دهد @simonw
- پرپلکسیتی (Perplexity) دعوتنامههای دسترسی زودهنگام به کامت اندروید (Comet Android) را اعلام کرد، و کاربران را بر اساس میزان استفاده از اندروید و وضعیت اشتراک پرو/مکس اولویتبندی میکند @AravSrinivas
پژوهشها
- اتان مولیک نگرانیهایی را دربارهی کمبود سازوکارهای آکادمیک برای پذیرش، بررسی و انتشار افزایش ناگهانی احتمالی «اکتشافات علمی تولید شده توسط هوش مصنوعی» (AI-generated scientific discoveries) مطرح میکند، و این سوال را مطرح میکند که چه کسی هزاران مقالهی جدید را خواهد خواند، ادغام خواهد کرد و بر اساس آنها کار خواهد کرد @emollick
- تحلیلها نشان میدهد که در حالی که هوش مصنوعی در برخی حوزهها میتواند علم نوآورانه انجام دهد، وظایفی که نیازمند ادغام و نظریهپردازی در گسترهی وسیعی از دانش هستند، همچنان فراتر از مرزهای کنونی باقی میمانند @emollick
- مقایسهی مدلهای هوش مصنوعی در پرامپتهای مربوط به مداخلات تاریخی نشان میدهد که حتی مدلهای چینی نیز تنها مداخلات غربی و خاورمیانهای را پیشنهاد کردهاند، در حالی که هیچ کدام از گزینهها در آسیا، آفریقا یا آمریکا را انتخاب نکردهاند، با وجود اینکه در ردیابیهای فکری خود آنها را در نظر گرفته بودند @emollick
- نقدی پیشنهاد میکند که «DPO» (بهینهسازی ترجیح مستقیم) (DPO - Direct Preference Optimization) یک مقالهی «شتابگریز» (decelerationist) مؤثر بوده است، که باعث شده منابع آکادمیک به جای ساخت زیرساخت برای گرادیانهای سیاست در مقیاس بزرگ، بر روی انواع آن تمرکز کنند @kalomaze