اخبار هوش مصنوعی در 2025-09-06

مدل‌های جدید هوش مصنوعی

  • جوآن جانگ از راه‌اندازی OAI Labs، یک گروه پژوهش‌محور که بر اختراع رابط‌های کاربری جدید برای همکاری انسان و هوش مصنوعی تمرکز دارد و فراتر از چت و عامل‌ها (ایجنت‌ها) به سمت الگوهای جدیدی برای تفکر، ساخت و یادگیری می‌رود، خبر داد. @joannejang
  • گوگل اعلام کرد که Nano Banana اکنون در لایه‌ی رایگان API جِمنای برای آخر هفته با نام «gemini-2.5-flash-image-preview» در دسترس است. @OfficialLoganK
  • گوگل قیمت Veo 3 را بیش از 50% کاهش داد، به طوری که قیمت Veo 3 با صدا از 0.75 دلار به 0.40 دلار و بدون صدا از 0.50 دلار به 0.20 دلار رسید. @arrakis_ai
  • سایمون ویلیسون Kimi-K2-Instruct-0905 (Kimi K-2.1) را بررسی کرد که یک بهبود تدریجی در مدل با وزن‌های باز (open weights) و تریلیون پارامتری مون‌شات است و طول بافت (context length) آن از 128 هزار به 256 هزار توکن افزایش یافته است. @simonw

تحلیل صنعت

  • گرگلی اوروس گزارش می‌دهد که 50% از بهترین استخدام‌هایش به عنوان مدیر، فارغ‌التحصیلان جدیدی بودند که بسیار باانگیزه، باهوش و متمرکز کار می‌کردند، که نشان‌دهنده‌ی بازدهی بالای سرمایه‌گذاری (ROI) در استخدام فارغ‌التحصیلان جدید، با وجود قابلیت‌های هوش مصنوعی است. @GergelyOrosz
  • نیتن لمبرت اشاره می‌کند که 10% از بودجه‌ی تأمین مالی سری F انتروپیک به نویسندگان می‌رسد، به عنوان بخشی از یک تسویه حساب 1.5 میلیارد دلاری، و آن را «عجیب‌ترین یارانه (سوبسید) سرمایه‌گذاری خطرپذیر (VC) زمان ما» می‌نامد. @natolambert
  • تک‌کرانچ گزارش می‌دهد که نویسندگان تسویه حساب انتروپیک را دریافت نمی‌کنند چون آثارشان به هوش مصنوعی خورانده شده است، بلکه به این دلیل که انتروپیک به جای خرید کتاب‌ها، آن‌ها را به صورت غیرقانونی دانلود کرده است. @TechCrunch
  • اوپن‌اِی‌آی از گسترش فعالیت‌های خود به یونان خبر داد، از جمله دسترسی به ابزارهای هوش مصنوعی با کیفیت بالا در آموزش متوسطه، به علاوه گواهینامه‌های جدید اوپن‌اِی‌آی و یک پلتفرم شغلی برای کمک به افراد جهت یادگیری مهارت‌های هوش مصنوعی و به کسب‌وکارها برای یافتن کارگران ماهر در حوزه‌ی هوش مصنوعی. @gdb

اخلاق و جامعه

  • سایمون ویلیسون استدلال می‌کند که تسویه حساب 1.5 میلیارد دلاری کتاب‌های انتروپیک به نفع انتروپیک است، و اشاره می‌کند که به نظر می‌رسد در ایالات متحده، خرید کتاب‌های دست دوم، اسکن آن‌ها و آموزش (مدل‌ها) بر اساس محتوای آن‌ها تحت تغییر «استفاده‌ی منصفانه» قانونی است. @simonw
  • ریاضیدانانی که در حال بررسی این موضوع هستند که آیا GPT-5 می‌تواند ریاضیات اصیل خلق کند یا خیر، هشدار می‌دهند که «خطر نه تنها از دست دادن اصالت است، بلکه تضعیف خود فرایند ریاضیدان بودن نیز هست.» @deedydas
  • ان‌ویدیا به دلیل دور شدن از داده‌های باز مورد انتقاد قرار گرفت، با Nemotron-CC-v2 که تحت مجوز محدودکننده‌ای منتشر شد که استفاده‌ی منبع‌باز، ترکیب داده‌ها یا انتشار بنچمارک‌ها را بدون اجازه ممنوع می‌کند. @soldni

کاربردها

  • گرگ براکمن GPT-5 Pro را «سطح بعدی برای کدنویسی» توصیف می‌کند و کاربردهای پزشکی آن را اینگونه تشریح می‌کند: «گویی بهترین فوق‌تخصص در مراکز تخصصی مانند «مایو کلینیک» این مورد را برای بررسی دریافت کرده است.» @gdb
  • سایمون ویلیسون GPT-5 Thinking را به طور گسترده با جستجوی بینگ آزمایش می‌کند، و آن را «گابلین پژوهش» خود می‌نامد و اشاره می‌کند که پس از تقریباً سه سال توصیه علیه استفاده از چت‌جی‌پی‌تی برای جستجو، GPT-5 با بینگ اکنون «یک موتور جستجوی فوق‌العاده مفید» است. @simonw
  • آراویند سرینیواس اعلام کرد که دارندگان سازمانی سهام اکنون به راحتی در Perplexity در دسترس هستند و اطلاعات مربوط به سیاستمداران و معاملات نهانی (اینسایدر تریدینگ) به زودی اضافه خواهد شد. @AravSrinivas
  • سایمون ویلیسون جستجوی معنایی تصاویر را با استفاده از جاسازی‌های متنی (text embeddings) در مقابل خلاصه‌های LLM بینایی (vision-LLM) تصاویر نشان می‌دهد، و اشاره می‌کند که این روش واقعاً خوب کار می‌کند. @simonw

پژوهش‌ها

  • پژوهش اوپن‌اِی‌آی نشان می‌دهد که توهمات (hallucinations) کمتر یک مشکل مربوط به خود مدل‌های LLM است و بیشتر یک مسئله‌ی مربوط به آموزش (مدل‌ها) بر روی آزمون‌هایی است که فقط پاسخ‌های صحیح را پاداش می‌دهند، که حدس زدن را به جای گفتن «نمی‌دانم» تشویق می‌کند. @emollick
  • ایتن مولیک این نظریه را مطرح می‌کند که انتشار o1-preview توسط اوپن‌اِی‌آی از نظر استراتژیک زیر سوال بود، زیرا نمایش قابلیت استدلال باعث شد همه بتوانند فوراً آن را کپی کنند، در حالی که به تعویق انداختن تا o3 و نامیدن آن GPT-5 می‌توانست جهشی حیرت‌انگیزتر باشد. @emollick
  • نیتن لمبرت گزارش می‌دهد که خوش‌بین است GPT-5 Pro یا Gemini Deep Think باهوش‌ترین مدل‌های موجود عمومی امروز هستند، و توصیه می‌کند که افراد از یکی یا هر دو استفاده کنند. @natolambert
  • یوجین یان از توسعه‌ی مبتنی بر ارزیابی (EDD) که مشابه توسعه‌ی مبتنی بر آزمون است حمایت می‌کند، و تأکید می‌کند که ارزیابی‌های عمومی مانند «وفاداری» (faithfulness) و «مفید بودن» (helpfulness) کاربردی نیستند – ارزیابی‌ها باید با مشکلات خاص کاربران همسو باشند. @eugeneyan