اخبار هوش مصنوعی در 2025-09-06

مدل‌های جدید هوش مصنوعی

جوآن جانگ از راه‌اندازی OAI Labs، یک گروه پژوهش‌محور که بر اختراع رابط‌های کاربری جدید برای همکاری انسان و هوش مصنوعی تمرکز دارد و فراتر از چت و عامل‌ها (ایجنت‌ها) به سمت الگوهای جدیدی برای تفکر، ساخت و یادگیری می‌رود، خبر داد. @joannejang
گوگل اعلام کرد که Nano Banana اکنون در لایه‌ی رایگان API جِمنای برای آخر هفته با نام «gemini-2.5-flash-image-preview» در دسترس است. @OfficialLoganK
گوگل قیمت Veo 3 را بیش از 50% کاهش داد، به طوری که قیمت Veo 3 با صدا از 0.75 دلار به 0.40 دلار و بدون صدا از 0.50 دلار به 0.20 دلار رسید. @arrakis_ai
سایمون ویلیسون Kimi-K2-Instruct-0905 (Kimi K-2.1) را بررسی کرد که یک بهبود تدریجی در مدل با وزن‌های باز (open weights) و تریلیون پارامتری مون‌شات است و طول بافت (context length) آن از 128 هزار به 256 هزار توکن افزایش یافته است. @simonw

تحلیل صنعت

گرگلی اوروس گزارش می‌دهد که 50% از بهترین استخدام‌هایش به عنوان مدیر، فارغ‌التحصیلان جدیدی بودند که بسیار باانگیزه، باهوش و متمرکز کار می‌کردند، که نشان‌دهنده‌ی بازدهی بالای سرمایه‌گذاری (ROI) در استخدام فارغ‌التحصیلان جدید، با وجود قابلیت‌های هوش مصنوعی است. @GergelyOrosz
نیتن لمبرت اشاره می‌کند که 10% از بودجه‌ی تأمین مالی سری F انتروپیک به نویسندگان می‌رسد، به عنوان بخشی از یک تسویه حساب 1.5 میلیارد دلاری، و آن را «عجیب‌ترین یارانه (سوبسید) سرمایه‌گذاری خطرپذیر (VC) زمان ما» می‌نامد. @natolambert
تک‌کرانچ گزارش می‌دهد که نویسندگان تسویه حساب انتروپیک را دریافت نمی‌کنند چون آثارشان به هوش مصنوعی خورانده شده است، بلکه به این دلیل که انتروپیک به جای خرید کتاب‌ها، آن‌ها را به صورت غیرقانونی دانلود کرده است. @TechCrunch
اوپن‌اِی‌آی از گسترش فعالیت‌های خود به یونان خبر داد، از جمله دسترسی به ابزارهای هوش مصنوعی با کیفیت بالا در آموزش متوسطه، به علاوه گواهینامه‌های جدید اوپن‌اِی‌آی و یک پلتفرم شغلی برای کمک به افراد جهت یادگیری مهارت‌های هوش مصنوعی و به کسب‌وکارها برای یافتن کارگران ماهر در حوزه‌ی هوش مصنوعی. @gdb

اخلاق و جامعه

سایمون ویلیسون استدلال می‌کند که تسویه حساب 1.5 میلیارد دلاری کتاب‌های انتروپیک به نفع انتروپیک است، و اشاره می‌کند که به نظر می‌رسد در ایالات متحده، خرید کتاب‌های دست دوم، اسکن آن‌ها و آموزش (مدل‌ها) بر اساس محتوای آن‌ها تحت تغییر «استفاده‌ی منصفانه» قانونی است. @simonw
ریاضیدانانی که در حال بررسی این موضوع هستند که آیا GPT-5 می‌تواند ریاضیات اصیل خلق کند یا خیر، هشدار می‌دهند که «خطر نه تنها از دست دادن اصالت است، بلکه تضعیف خود فرایند ریاضیدان بودن نیز هست.» @deedydas
ان‌ویدیا به دلیل دور شدن از داده‌های باز مورد انتقاد قرار گرفت، با Nemotron-CC-v2 که تحت مجوز محدودکننده‌ای منتشر شد که استفاده‌ی منبع‌باز، ترکیب داده‌ها یا انتشار بنچمارک‌ها را بدون اجازه ممنوع می‌کند. @soldni

کاربردها

گرگ براکمن GPT-5 Pro را «سطح بعدی برای کدنویسی» توصیف می‌کند و کاربردهای پزشکی آن را اینگونه تشریح می‌کند: «گویی بهترین فوق‌تخصص در مراکز تخصصی مانند «مایو کلینیک» این مورد را برای بررسی دریافت کرده است.» @gdb
سایمون ویلیسون GPT-5 Thinking را به طور گسترده با جستجوی بینگ آزمایش می‌کند، و آن را «گابلین پژوهش» خود می‌نامد و اشاره می‌کند که پس از تقریباً سه سال توصیه علیه استفاده از چت‌جی‌پی‌تی برای جستجو، GPT-5 با بینگ اکنون «یک موتور جستجوی فوق‌العاده مفید» است. @simonw
آراویند سرینیواس اعلام کرد که دارندگان سازمانی سهام اکنون به راحتی در Perplexity در دسترس هستند و اطلاعات مربوط به سیاستمداران و معاملات نهانی (اینسایدر تریدینگ) به زودی اضافه خواهد شد. @AravSrinivas
سایمون ویلیسون جستجوی معنایی تصاویر را با استفاده از جاسازی‌های متنی (text embeddings) در مقابل خلاصه‌های LLM بینایی (vision-LLM) تصاویر نشان می‌دهد، و اشاره می‌کند که این روش واقعاً خوب کار می‌کند. @simonw

پژوهش‌ها

پژوهش اوپن‌اِی‌آی نشان می‌دهد که توهمات (hallucinations) کمتر یک مشکل مربوط به خود مدل‌های LLM است و بیشتر یک مسئله‌ی مربوط به آموزش (مدل‌ها) بر روی آزمون‌هایی است که فقط پاسخ‌های صحیح را پاداش می‌دهند، که حدس زدن را به جای گفتن «نمی‌دانم» تشویق می‌کند. @emollick
ایتن مولیک این نظریه را مطرح می‌کند که انتشار o1-preview توسط اوپن‌اِی‌آی از نظر استراتژیک زیر سوال بود، زیرا نمایش قابلیت استدلال باعث شد همه بتوانند فوراً آن را کپی کنند، در حالی که به تعویق انداختن تا o3 و نامیدن آن GPT-5 می‌توانست جهشی حیرت‌انگیزتر باشد. @emollick
نیتن لمبرت گزارش می‌دهد که خوش‌بین است GPT-5 Pro یا Gemini Deep Think باهوش‌ترین مدل‌های موجود عمومی امروز هستند، و توصیه می‌کند که افراد از یکی یا هر دو استفاده کنند. @natolambert
یوجین یان از توسعه‌ی مبتنی بر ارزیابی (EDD) که مشابه توسعه‌ی مبتنی بر آزمون است حمایت می‌کند، و تأکید می‌کند که ارزیابی‌های عمومی مانند «وفاداری» (faithfulness) و «مفید بودن» (helpfulness) کاربردی نیستند – ارزیابی‌ها باید با مشکلات خاص کاربران همسو باشند. @eugeneyan