اخبار هوش مصنوعی در 2025-09-06
مدلهای جدید هوش مصنوعی
- جوآن جانگ از راهاندازی OAI Labs، یک گروه پژوهشمحور که بر اختراع رابطهای کاربری جدید برای همکاری انسان و هوش مصنوعی تمرکز دارد و فراتر از چت و عاملها (ایجنتها) به سمت الگوهای جدیدی برای تفکر، ساخت و یادگیری میرود، خبر داد. @joannejang
- گوگل اعلام کرد که Nano Banana اکنون در لایهی رایگان API جِمنای برای آخر هفته با نام «gemini-2.5-flash-image-preview» در دسترس است. @OfficialLoganK
- گوگل قیمت Veo 3 را بیش از 50% کاهش داد، به طوری که قیمت Veo 3 با صدا از 0.75 دلار به 0.40 دلار و بدون صدا از 0.50 دلار به 0.20 دلار رسید. @arrakis_ai
- سایمون ویلیسون Kimi-K2-Instruct-0905 (Kimi K-2.1) را بررسی کرد که یک بهبود تدریجی در مدل با وزنهای باز (open weights) و تریلیون پارامتری مونشات است و طول بافت (context length) آن از 128 هزار به 256 هزار توکن افزایش یافته است. @simonw
تحلیل صنعت
- گرگلی اوروس گزارش میدهد که 50% از بهترین استخدامهایش به عنوان مدیر، فارغالتحصیلان جدیدی بودند که بسیار باانگیزه، باهوش و متمرکز کار میکردند، که نشاندهندهی بازدهی بالای سرمایهگذاری (ROI) در استخدام فارغالتحصیلان جدید، با وجود قابلیتهای هوش مصنوعی است. @GergelyOrosz
- نیتن لمبرت اشاره میکند که 10% از بودجهی تأمین مالی سری F انتروپیک به نویسندگان میرسد، به عنوان بخشی از یک تسویه حساب 1.5 میلیارد دلاری، و آن را «عجیبترین یارانه (سوبسید) سرمایهگذاری خطرپذیر (VC) زمان ما» مینامد. @natolambert
- تککرانچ گزارش میدهد که نویسندگان تسویه حساب انتروپیک را دریافت نمیکنند چون آثارشان به هوش مصنوعی خورانده شده است، بلکه به این دلیل که انتروپیک به جای خرید کتابها، آنها را به صورت غیرقانونی دانلود کرده است. @TechCrunch
- اوپناِیآی از گسترش فعالیتهای خود به یونان خبر داد، از جمله دسترسی به ابزارهای هوش مصنوعی با کیفیت بالا در آموزش متوسطه، به علاوه گواهینامههای جدید اوپناِیآی و یک پلتفرم شغلی برای کمک به افراد جهت یادگیری مهارتهای هوش مصنوعی و به کسبوکارها برای یافتن کارگران ماهر در حوزهی هوش مصنوعی. @gdb
اخلاق و جامعه
- سایمون ویلیسون استدلال میکند که تسویه حساب 1.5 میلیارد دلاری کتابهای انتروپیک به نفع انتروپیک است، و اشاره میکند که به نظر میرسد در ایالات متحده، خرید کتابهای دست دوم، اسکن آنها و آموزش (مدلها) بر اساس محتوای آنها تحت تغییر «استفادهی منصفانه» قانونی است. @simonw
- ریاضیدانانی که در حال بررسی این موضوع هستند که آیا GPT-5 میتواند ریاضیات اصیل خلق کند یا خیر، هشدار میدهند که «خطر نه تنها از دست دادن اصالت است، بلکه تضعیف خود فرایند ریاضیدان بودن نیز هست.» @deedydas
- انویدیا به دلیل دور شدن از دادههای باز مورد انتقاد قرار گرفت، با Nemotron-CC-v2 که تحت مجوز محدودکنندهای منتشر شد که استفادهی منبعباز، ترکیب دادهها یا انتشار بنچمارکها را بدون اجازه ممنوع میکند. @soldni
کاربردها
- گرگ براکمن GPT-5 Pro را «سطح بعدی برای کدنویسی» توصیف میکند و کاربردهای پزشکی آن را اینگونه تشریح میکند: «گویی بهترین فوقتخصص در مراکز تخصصی مانند «مایو کلینیک» این مورد را برای بررسی دریافت کرده است.» @gdb
- سایمون ویلیسون GPT-5 Thinking را به طور گسترده با جستجوی بینگ آزمایش میکند، و آن را «گابلین پژوهش» خود مینامد و اشاره میکند که پس از تقریباً سه سال توصیه علیه استفاده از چتجیپیتی برای جستجو، GPT-5 با بینگ اکنون «یک موتور جستجوی فوقالعاده مفید» است. @simonw
- آراویند سرینیواس اعلام کرد که دارندگان سازمانی سهام اکنون به راحتی در Perplexity در دسترس هستند و اطلاعات مربوط به سیاستمداران و معاملات نهانی (اینسایدر تریدینگ) به زودی اضافه خواهد شد. @AravSrinivas
- سایمون ویلیسون جستجوی معنایی تصاویر را با استفاده از جاسازیهای متنی (text embeddings) در مقابل خلاصههای LLM بینایی (vision-LLM) تصاویر نشان میدهد، و اشاره میکند که این روش واقعاً خوب کار میکند. @simonw
پژوهشها
- پژوهش اوپناِیآی نشان میدهد که توهمات (hallucinations) کمتر یک مشکل مربوط به خود مدلهای LLM است و بیشتر یک مسئلهی مربوط به آموزش (مدلها) بر روی آزمونهایی است که فقط پاسخهای صحیح را پاداش میدهند، که حدس زدن را به جای گفتن «نمیدانم» تشویق میکند. @emollick
- ایتن مولیک این نظریه را مطرح میکند که انتشار o1-preview توسط اوپناِیآی از نظر استراتژیک زیر سوال بود، زیرا نمایش قابلیت استدلال باعث شد همه بتوانند فوراً آن را کپی کنند، در حالی که به تعویق انداختن تا o3 و نامیدن آن GPT-5 میتوانست جهشی حیرتانگیزتر باشد. @emollick
- نیتن لمبرت گزارش میدهد که خوشبین است GPT-5 Pro یا Gemini Deep Think باهوشترین مدلهای موجود عمومی امروز هستند، و توصیه میکند که افراد از یکی یا هر دو استفاده کنند. @natolambert
- یوجین یان از توسعهی مبتنی بر ارزیابی (EDD) که مشابه توسعهی مبتنی بر آزمون است حمایت میکند، و تأکید میکند که ارزیابیهای عمومی مانند «وفاداری» (faithfulness) و «مفید بودن» (helpfulness) کاربردی نیستند – ارزیابیها باید با مشکلات خاص کاربران همسو باشند. @eugeneyan