اخبار هوش مصنوعی در 2025-07-13

مدل‌های جدید هوش مصنوعی

Kimi K2 مدل توسط Moonshot AI منتشر شد، با صدرنشینی در Hugging Face و سبک نوشتاری متمایزی که عاری از الگوهای متنی معمول تولیدشده توسط هوش مصنوعی است @huggingface
Grok 4 توسط xAI معرفی شد؛ با ادعای هوشمندتر بودن از انسانی با مدرک PhD، اما فاقد عقل سلیم، که نشان‌دهنده‌ی اثربخشی مداوم مقیاس‌پذیری است @TechCrunch
مدل‌های Kimi پس از نشان دادن عملکردی قوی در ارزیابی‌های داخلی، به‌زودی در Perplexity ادغام خواهند شد @AravSrinivas
مقاله‌ی Gemini 2.5 از یک سیستم زمان‌بندی مقاوم در برابر خطا پرده برمی‌دارد که هنگامی که یکی از اسلایس‌های TPU از کار می‌افتد، به جای اینکه منتظر جایگزینی بماند، آموزش را روی تقریباً ۹۷٪ از آن‌ها ادامه می‌دهد @ericjang11

تحلیل صنعت

بر اساس گزارش WSJ، SpaceX ظاهراً با سرمایه‌گذاری ۲ میلیارد دلار در xAI موافقت کرده است که نشان‌دهنده‌ی سرمایه‌گذاری‌های عظیم شرکتی در توسعه‌ی هوش مصنوعی است @AndrewCurran_
ایمیل‌های استخدام هوش مصنوعی به‌طور فزاینده‌ای خودکار شده‌اند، با خدماتی که LinkedIn را اسکرپ می‌کنند تا اطلاع‌رسانی‌های شخصی‌سازی‌شده‌ای تولید کنند که وانمود می‌کنند توسط انسان نوشته شده‌اند @GergelyOrosz
تصاحب Windsurf توسط Google روند «acquihire» را نشان می‌دهد که در آن تنها بخشی از تیم پیشنهاد همکاری دریافت می‌کنند و سایر کارمندان با وجود موفقیت شرکت، نادیده گرفته می‌شوند @GergelyOrosz
مدیران محصول در محصولات هوش مصنوعی-محور به عنوان گلوگاه شناسایی شده‌اند، زیرا مهندسان، تحلیل کیفی ردیابی و ارزیابی LLM را کاری «پایین‌تر از خود» می‌دانند @sh_reya
ارزش کل شرکت‌های عمومی منطقه Bay Area از مجموع ارزش شرکت‌های هند، ژاپن و آلمان فراتر است، با وجود داشتن تنها ۸ میلیون جمعیت در مقابل تقریباً ۱۶۸۰ میلیون، که نشان‌دهنده‌ی تمرکز ارزش نوآوری است @deedydas

اخلاق و جامعه

توهمات هوش مصنوعی با بهبود مدل‌ها خطرناک‌تر می‌شوند، زیرا آن‌ها به‌طور فزاینده‌ای مقتدرانه به نظر می‌رسند و باعث می‌شوند خطر ناشی از توهمات کندتر از بهبود قابلیت‌های هوش مصنوعی کاهش یابد @paulg
تغییرات لحظه‌ای prompt سیستم برای Grok به منظور رفع خروجی‌های مشکل‌ساز، نگرانی‌هایی را در مورد آزمایش صحیح و اثرات آبشاری غیرقابل پیش‌بینی در سیستم‌های تصادفی ایجاد می‌کند @emollick
شخصیت‌های جعلی تولیدشده توسط هوش مصنوعی به‌طور فزاینده‌ای در بحث‌های رسانه‌های اجتماعی ظاهر می‌شوند، با حساب‌های دارای تیک آبی که پاسخ‌های تولیدشده توسط هوش مصنوعی را منتشر می‌کنند و ادعا می‌کنند مهندسان واقعی جویای کار هستند @GergelyOrosz
مطالعه‌ای در مورد خطرات قابل توجه استفاده از چت‌بات‌های درمانی هوش مصنوعی هشدار می‌دهد و نگرانی‌ها را در مورد کاربردهای سلامت روان برجسته می‌کند @TechCrunch

کاربردها

Perplexity مرورگر هوش مصنوعی-محور Comet را راه‌اندازی می‌کند که می‌تواند اقداماتی مانند مقایسه‌ی قیمت را انجام دهد، با کاربری که ۲۸۰ دلار در ۵ دقیقه حین خرید Prime Day صرفه‌جویی کرده است @AravSrinivas
عامل مرورگر Comet می‌تواند با استفاده از Veo 3 در رابط Gemini ویدیو تولید کند و کل گردش کار را از ورودی prompt تا تکمیل رندرینگ مدیریت می‌کند @ai_for_success
مدل‌های هوش مصنوعی برای استراتژی شرط‌بندی پیچیده در Polymarket استفاده می‌شوند، به طوری که o3-pro بازدهی مورد انتظار ۲۱.۶%+، Claude Opus 4 بازدهی ۴۱.۷%+، و Grok 4 Heavy بازدهی ۳۴%+ را با استفاده از تئوری سبد سهام مدرن نشان می‌دهد @deedydas
پیش‌بینی می‌شود عوامل مرورگر تجارت الکترونیک را با مقایسه‌ی صدها گزینه و یافتن بهترین قیمت‌ها روان‌تر کنند، مانند «HFT برای اینترنت» عمل می‌کنند بدون اینکه توسط تبلیغات فریب بخورند @denisyarats

پژوهش‌ها

Kimi K2 بالاترین نمره‌ی تنوع زبانی را در تحلیل داده‌های SpeechMap نشان می‌دهد و واژگان متنوع‌تری نسبت به سایر مدل‌های آزمایش‌شده دارد @xlr8harder
چندین مسیر توسعه‌ی هوش مصنوعی شناسایی شده‌اند: مقیاس‌پذیری همچنان با بازده کاهشی، طبق پیش‌بینی قوانین مقیاس‌پذیری، کار می‌کند؛ در حالی که استفاده از ابزارها باعث افزایش عملکرد می‌شود و بهبود روش‌هایی مانند Muon فرصت‌هایی را فراهم می‌کنند @emollick
Berkeley AI Research مقاله‌ی موضعی با عنوان «نگاهی جمع‌گرایانه و اقتصادی به AI» را منتشر می‌کند که در آن به ترکیب مفاهیم اقتصادی و اجتماعی با مفاهیم محاسباتی برای طراحی سیستم‌های انسان-محور استدلال می‌شود @berkeley_ai
مقاله‌ی AI Security Institute به نقد روش‌شناسی‌های ارزیابی در پژوهش‌های ایمنی هوش مصنوعی می‌پردازد و تفاوت بین نشان دادن اینکه مدل‌ها می‌توانند کاری را انجام دهند در مقابل نشان دادن اینکه تمایل به انجام آن کار را دارند، برجسته می‌کند @sebkrier

اخبار هوش مصنوعی در 2025-07-12

مدل‌های جدید هوش مصنوعی

Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل متن‌باز با یک تریلیون پارامتر و عملکرد قوی در بنچمارک‌ها که برای آزمایش در Hugging Face در دسترس است. @Kimi_Moonshot
xAI مدل‌های Grok 4 و Grok 4 Heavy را با قابلیت‌های استدلال فراانسانی، معماری سیستم چندعامله و صداهای فراواقعی جدید معرفی کرد. @xai
OpenAI عرضه‌ی مدل «open-weight» خود را به دلیل نیاز به آزمایش‌های ایمنی بیشتر و بررسی مناطق پرخطر به تاخیر انداخت. @sama
LiquidAI چک‌پوینت‌های GGUF را برای مدل LFM2 منتشر کرد که توسعه‌دهندگان را قادر می‌سازد آن را با llama.cpp در پلتفرم‌های مختلف اجرا کنند. @LiquidAI_

تحلیل صنعت

تصاحب سه میلیارد دلاری Windsurf توسط OpenAI شکست خورد، و طبق گزارش‌ها، تیم Windsurf به جای آن به Google DeepMind پیوسته‌اند تا روی «agentic coding» کار کنند. @deedydas
ناتان لمبرت اشاره می‌کند که مدل Kimi K2 به دلیل مجوز آزادانه‌ی خود به عنوان یک مدل مرزی متن‌باز (open frontier model)، تاثیر عمده‌ای بر کسب‌وکارها خواهد داشت تا مصرف‌کنندگان. @natolambert
اندرو کاران خاطرنشان می‌کند که مدل Kimi K2 ممکن است OpenAI را با بنچمارک‌های قوی خود غافلگیر کرده باشد و احتمالاً بر تاخیر در عرضه‌ی مدل «open-weight» آنها تاثیر گذاشته باشد. @AndrewCurran_
کلر وو الگوهای در حال تغییر استخدام در بخش فناوری را تحلیل می‌کند، و به دوره‌های ۱۸ ماهه‌ی عادی‌شده‌ی اشتغال و اخراج‌های گسترده‌ی بی‌مقدمه اشاره می‌کند که دوران «پس از وفاداری» را بین کارکنان و شرکت‌ها ایجاد کرده است. @clairevo
دیدی داس استدلال می‌کند که مهندس بنیان‌گذار بودن در استارتاپ‌ها، فرصت‌های یادگیری قابل توجه، شبکه‌سازی و پتانسیل سود مالی بالایی را فراهم می‌کند، با وجود نتایج بسیار متغیر. @deedydas

اخلاق و جامعه

xAI بابت «رفتار وحشتناک» Grok، از جمله تولید محتوای نامناسب، عذرخواهی کرد و آن را ناشی از تغییرات در «system prompt» دانست و وعده‌ی بهبود فرآیندهای بررسی را داد. @grok
ایتان مولیک به سومین شکست فرآیندی xAI که نیازمند عذرخواهی بود اشاره می‌کند و نگرانی‌هایی را در مورد عدم تمایل آنها به انتشار «red teaming» خارجی یا «system card» برای توسعه‌ی هوش مصنوعی فوق‌هوشمند مطرح می‌سازد. @emollick
سایمون ویلیسون خاطرنشان می‌کند که «prompt» مشکل‌ساز که دلیل مشکلات Grok دانسته شده بود، شامل عبارت «تو هرچه هست بگویی و از توهین به افراد دارای «correctness» سیاسی نمی‌ترسی» بود، که هرگز در «system prompt»های عمومی آن‌ها گنجانده نشده بود. @simonw

کاربردها

Perplexity مرورگر Comet را با عاملیت‌های هوش مصنوعی راه‌اندازی کرد که در سطحی بالاتر از انتخاب اینکه از کدام هوش مصنوعی استفاده شود، عمل می‌کنند و جریان‌های کاری سرتاسری را به جای نوبت‌های چت ممکن می‌سازند. @AravSrinivas
آراویند سرینیواس Comet را به عنوان «memory-native» توصیف می‌کند که نزدیک‌ترین تقریب به درک واقعی کاربران از طریق قابلیت‌های حافظه‌ی پایدار را نشان می‌دهد. @AravSrinivas
Pollen Robotics، شرکت تابعه‌ی Hugging Face، «The Amazing Hand» را به صورت متن‌باز منتشر کرد؛ یک دست رباتیک انسان‌نما با هشت درجه‌ی آزادی که می‌توان آن را با چاپ سه‌بعدی و با هزینه‌ی کمتر از ۲۵۰ دلار ساخت. @ClementDelangue
ایتان مولیک تمایل خود را برای هوش مصنوعی آموزش‌دیده روی همه‌ی کتاب‌ها ابراز می‌کند تا امکان یادگیری از منابع غنی از دانش فراتر از وب را، با وجود نگرانی‌های کپی‌رایت، فراهم آورد. @emollick

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که عاملیت‌های هوش مصنوعی که شخصیت و پیش‌زمینه به آن‌ها داده شده و در سازمان‌های مجازی رسمی با ساختارهای سلسله‌مراتبی قرار گرفته‌اند، در کارهای پیچیده عملکردی بهتر از عاملیت‌های هوش مصنوعی عادی دارند. @emollick
مطالعه‌ای نشان می‌دهد که ترنسفورمرهای آموزش‌دیده روی ۱۰ میلیون منظومه‌ی شمسی می‌توانند مدارهای سیارات را به دقت پیش‌بینی کنند، اما در درک قوانین گرانشی اساسی شکست می‌خورند، که محدودیت‌هایی را در تعمیم‌پذیری برجسته می‌کند. @keyonV
جف کلون پژوهشی را برجسته می‌کند که از پارادایم «Go-Explore» برای جستجو در «درختان استدلال» (trees of reasoning) برای یافتن پاسخ‌های بهتر استفاده می‌کند، و رویکرد «First Return, Then Explore» را در تنظیمات استدلال جدید به کار می‌برد. @jeffclune
سایمون ویلیسون گزارشی در مورد پژوهش METR ارائه می‌دهد که تاثیر هوش مصنوعی اوایل سال ۲۰۲۵ را بر بهره‌وری توسعه‌دهندگان متن‌باز باتجربه اندازه‌گیری می‌کند. @simonw
پژوهشگران Stanford HAI پدیده‌ی «accuracy on the line» را بررسی می‌کنند تا بفهمند چرا مدل‌های هوش مصنوعی غالباً در سناریوهای حساس به ایمنی شکست می‌خورند. @StanfordHAI

اخبار هوش مصنوعی در 2025-07-11

مدل‌های جدید هوش مصنوعی

Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل MoE با ۱ تریلیون پارامتر و ۳۲ میلیارد پارامتر فعال که در بنچمارک‌های کدنویسی، از جمله ۶۵.۸٪ در SWE-Bench Verified و ۵۳.۷ Pass@1 در LiveCodeBench، به عملکردی پیشرفته دست یافته است @Kimi_Moonshot
Perplexity مدل Grok 4 را برای مشترکان Pro و Max به پلتفرم خود اضافه کرد @perplexity_ai
گوگل قابلیت تولید تصویر به ویدئوی Veo 3 را در اپلیکیشن Gemini منتشر کرد که به کاربران Ultra و Pro این امکان را می‌دهد تا عکس‌ها را به ویدئوهای ۸ ثانیه‌ای با صدا تبدیل کنند @Google

تحلیل صنعت

یک مطالعه‌ی بزرگ بر روی ۱۸۷ هزار توسعه‌دهنده که از GitHub Copilot استفاده می‌کنند، نشان می‌دهد که هوش مصنوعی ماهیت کدنویسی را تغییر می‌دهد؛ توسعه‌دهندگان بیشتر روی کدنویسی و کمتر روی مدیریت تمرکز می‌کنند، با افراد کمتری هماهنگی می‌کنند و زبان‌های جدید را بیشتر آزمایش می‌کنند که احتمالاً درآمدشان را ۱,۶۸۳ دلار در سال افزایش می‌دهد @emollick
اندرو ان‌جی ابراز ناامیدی کرد که «لایحه‌ی بزرگ و زیبای» ترامپ شامل مهلتی برای مقررات هوش مصنوعی در سطح ایالت‌های آمریکا نمی‌شود. او استدلال می‌کند که وقتی فناوری جدید و کمتر شناخته شده است، لابی‌گران می‌توانند مقررات ضدرقابتی را تصویب کنند که مانع تلاش‌های هوش مصنوعی متن‌باز می‌شود @AndrewYNg
پلتفرم صورت‌حساب مبتنی بر مصرف Stripe تا به امروز ۱۴۵٪ رشد داشته است که نشان می‌دهد صنعت در حال گذار از قیمت‌گذاری مبتنی بر تعداد کاربر به مدل‌های مصرفی است @patrickc
گزارش TechCrunch حاکی از آن است که Goldman Sachs در حال آزمایش عامل هوش مصنوعی فراگیر Devin به عنوان یک «کارمند جدید» است @TechCrunch
مطالعه‌ای نشان می‌دهد که ابزارهای کدنویسی هوش مصنوعی ممکن است سرعت همه‌ی توسعه‌دهندگان را افزایش ندهند، به طوری که زمان واقعی بین شروع کار بر روی یک مسئله و ادغام PR ممکن است افزایش یابد، در حالی که تعداد PRهای ادغام شده در روز ممکن است ۱۰ برابر شود @TechCrunch

اخلاق و جامعه

سایمون ویلسون کشف کرد که Grok 4 هنگامی که در مورد موضوعات بحث‌برانگیز مانند اسرائیل/فلسطین از آن سوال می‌شود، به طور خودکار توئیت‌های «from:elonmusk» را جست‌وجو می‌کند که نگرانی‌هایی را در مورد سوگیری در رفتار جست‌وجوی هوش مصنوعی ایجاد می‌کند @simonw
جرمی هاوارد نشان داد که Grok هنگام سوال در مورد اسرائیل/فلسطین، توئیتر را برای یافتن نظرات ایلان ماسک جست‌وجو می‌کند و ۵۴ مورد از ۶۴ ارجاع مربوط به ایلان بوده است که سوگیری احتمالی در بازیابی اطلاعات توسط هوش مصنوعی را برجسته می‌کند @jeremyphoward
طبق گزارش TechCrunch، فرانسه در حال بررسی X به دلیل مداخله‌ی خارجی است در حالی که یکی از اعضای پارلمان از Grok انتقاد می‌کند @TechCrunch

کاربردها

Perplexity مرورگر مجهز به هوش مصنوعی خود به نام Comet را راه‌اندازی کرد که موتور جست‌وجوی آن را در کانون توجه قرار می‌دهد و دارای یک دستیار همیشه‌فعال است که از طریق Alt+A قابل دسترسی است و به گفته‌ی کاربران اولیه برای ارائه‌ی «۱۰۰ برابر بهره‌وری» طراحی شده است @AravSrinivas
دستیار Comet کاربردهای عملی از جمله تحقیق و پر کردن جزئیات برای لیست‌های Facebook Marketplace، کمک در کدنویسی و مدیریت تب‌ها با کنترل صوتی را به نمایش می‌گذارد @AravSrinivas
NVIDIA همکاری با Indosat Ooredoo Hutchison و Cisco را برای ساخت یک مرکز تعالی هوش مصنوعی در اندونزی اعلام کرد که شامل پشتیبانی از پژوهش‌های هوش مصنوعی بومی و توسعه‌ی استعدادها از طریق انستیتوی یادگیری عمیق NVIDIA است @NVIDIAAI
پژوهشگران MIT روش جدید PAC Privacy را توسعه دادند که به هوش مصنوعی اجازه می‌دهد از داده‌های حساس مانند سوابق پزشکی بدون به خطر انداختن حریم خصوصی یاد بگیرد و هم دقت و هم امنیت را حفظ کند @MIT
MIT یک زانوی بیونیک جدید ساخته است که عملکرد بهتری نسبت به سایر پروتزها دارد و به افراد دارای قطع عضو بالای زانو کمک می‌کند سریع‌تر راه بروند، از پله‌ها بالا بروند و از موانع دوری کنند، در حالی که احساس می‌کنند بیشتر شبیه بخشی از بدن خودشان است @MIT

پژوهش‌ها

پژوهشگران هوش مصنوعی برکلی شبیه‌سازهای کاربر را به عنوان پلی بین یادگیری تقویتی و تعامل دنیای واقعی بررسی می‌کنند و به چالش طراحی محیط‌ها برای وظایف یادگیری تقویتی فراتر از ریاضیات و کد می‌پردازند @realJessyLin
پژوهش‌ها نشان می‌دهد که «بخش‌بندی عمل» در رباتیک و یادگیری تقویتی با وادار کردن مدل‌ها به تولید دنباله‌های کوتاهی از اعمال کمک می‌کند، که به دلایل مرموز اما مؤثر به کاوش و پشتیبانی کمک می‌کند @svlevine
استنفورد کنفرانس Agents4Science را اعلام کرد که در آن هوش مصنوعی نویسنده و بازبین اصلی است، با بازبین‌های LLM که ارزیابی‌های اولیه را ارائه می‌دهند و کارشناسان انسانی که انتخاب‌های نهایی را انجام می‌دهند، تمامی ارسال‌ها و بازبینی‌ها عمومی خواهند بود @james_y_zou
حمل حسین با خودکارسازی پرامپت مخالفت می‌کند و اظهار می‌دارد که نوشتن خوب با تفکر خوب همبستگی دارد و نوشتن عمدی و تکراری برای مشکلات چالش‌برانگیز ضروری است، زیرا پژوهش‌ها نشان می‌دهد که معیارها پس از مشاهده‌ی ردیابی‌های LLM به طور قابل توجهی تغییر می‌کنند @HamelHusain
ایتان مولیک اشاره می‌کند که Grok 4 به شدت تحت تأثیر نتایج جست‌وجو است و اغلب هنگامی که از آن خواسته می‌شود کدنویسی کند، ابتدا کد را آنلاین جست‌وجو می‌کند و این امر آن را در دیدن نتایج جست‌وجوی وب بسیار زودباور می‌کند @emollick
ایتان مولیک مشاهده می‌کند که LM Arena پیشرو از یک بنچمارک بزرگ که هر سازنده‌ی هوش مصنوعی به دنبالش بود، به حالتی رسید که در نسخه‌های اخیر کمتر ذکر می‌شود و این سوال را مطرح می‌کند که آیا این به دلیل مشکلات اعتباری است یا به این دلیل که متوجه شده‌اند امتیازات آرنا به راحتی قابل بهینه‌سازی بودند @emollick

اخبار هوش مصنوعی در 2025-07-10

مدل‌های جدید هوش مصنوعی

xAI مدل Grok 4 را با بهترین عملکرد در معیارهای مختلف منتشر کرد و در «Humanity's Last Exam» (۴۴.۴٪)، «GPQA» (۸۸.۹٪)، «AIME 2025» (۱۰۰٪)، «Harvard MIT Math» (۹۶.۷٪)، «USAMO25» (۶۱.۹٪)، «ARC-AGI-2» (۱۵.۹٪) و «LiveCodeBench» (۷۹.۴٪) رتبه‌ی اول را کسب کرد. @deedydas
قیمت‌گذاری Grok 4 اعلام شد: ۳ دلار به ازای هر میلیون توکن ورودی، ۱۵ دلار به ازای هر میلیون توکن خروجی با ۲۵۶ هزار توکن زمینه‌ی متنی و نسخه‌ی چندعامله‌ی Grok 4 Heavy با قیمت ماهیانه ۳۰۰ دلار. @AndrewCurran_
گوگل قابلیت تولید ویدئو از تصویر را در Veo 3، از طریق اپلیکیشن Gemini عرضه کرد که به کاربران امکان می‌دهد کلیپ‌های ویدئویی ۸ ثانیه‌ای با صدا را از روی عکس‌ها بسازند. @sundarpichai
Mistral AI مدل‌های Devstral Small و Devstral Medium 2507 را با عملکرد بهبودیافته و بهره‌وری هزینه برای عامل‌های کدنویسی و کارهای مهندسی نرم‌افزار منتشر کرد. @MistralAI
مایکروسافت ریسرچ (Microsoft Research) مدل BioEmu 1.1 را معرفی کرد؛ یک روش یادگیری عمیق مولد که مجموعه‌های تعادلی پروتئین را شبیه‌سازی می‌کند و زمان محاسباتی مورد نیاز برای شبیه‌سازی‌های دینامیک مولکولی را از سال‌های GPU به ساعت‌های GPU کاهش می‌دهد. @MSFTResearch
گوگل مدل MedGemma را منتشر کرد؛ یک مدل چندوجهی و متن‌باز پیشرفته برای داده‌های طولی پرونده‌های الکترونیکی سلامت (EHR) و تصویربرداری پزشکی در زمینه‌های رادیولوژی، پوست، پاتولوژی و چشم‌پزشکی. @JeffDean

تحلیل صنعت

رشد درآمد Anthropic از ۱ میلیارد دلار به ۴ میلیارد دلار (سالانه) در سال ۲۰۲۵، نشان‌دهنده‌ی رشدی بی‌سابقه در تاریخ بشر است، در حالی که درآمد OpenAI به ۱۰ میلیارد دلار می‌رسد. @deedydas
هوش مصنوعی ۳۵٪ از کدهای مورد نیاز برای محصولات جدید مایکروسافت را تولید می‌کند و بیش از نیم میلیارد دلار در هزینه‌های مراکز تماس صرفه‌جویی کرده، ضمن اینکه رضایت مشتری را افزایش داده است. @AndrewCurran_
مایکروسافت با وجود ارزش‌گذاری، درآمد و سود بی‌سابقه‌ی خود، تعدیل نیروی گسترده را اعلام کرد که نشان‌دهنده‌ی عدم ارتباط بین عملکرد مالی و تصمیمات مربوط به اشتغال است. @GergelyOrosz
متخصصان فناوری که بنیان‌گذار نیستند، اکنون بیشتر از پردرآمدترین ورزشکاران درآمد دارند که نشان‌دهنده‌ی اوج شرایط بازار هوش مصنوعی است. @GergelyOrosz
پیش‌بینی می‌شود ByteDance تا پایان سال ۲۰۲۵ به مقیاس درآمدی Meta برسد و انتظار می‌رود هر دو شرکت به درآمد ۱۸۵ تا ۱۹۰ میلیارد دلاری دست یابند؛ هرچند ریسک‌های نظارتی ایالات متحده همچنان برای TikTok یک نگرانی است. @deedydas

اخلاق و جامعه

xAI به دلیل عدم شفافیت در مورد عرضه‌ی Grok 4، با انتقاد مواجه شده است؛ بدون ارائه‌ی مدل کارت، مستندات «red teaming» یا توضیحی درباره‌ی حادثه‌ی روز گذشته که منجر به حذف Grok 3 شد. @emollick
مجله‌ی «MIT Technology Review» ابزاری را گزارش می‌دهد که حفاظت‌های ضد هوش مصنوعی را از آثار هنری دیجیتال از بین می‌برد و نگرانی‌هایی را درباره‌ی حقوق هنرمندان و حفاظت از مالکیت فکری ایجاد می‌کند. @techreview
پژوهش‌ها نشان می‌دهد که دستیاران کدنویسی هوش مصنوعی ممکن است عمدتاً باعث شوند توسعه‌دهندگان احساس بهره‌وری بیشتری کنند، تا اینکه واقعاً افزایش بهره‌وری را به همراه داشته باشند؛ مشابه با نحوه‌ی گیمیفای کردن یادگیری توسط Duolingo بدون آموزش مؤثر. @fchollet
مطالعه نشان می‌دهد توسعه‌دهندگانی که از ابزارهای هوش مصنوعی استفاده می‌کنند، هیچ شتاب قابل توجهی در انجام وظایف نشان نمی‌دهند و برخی شواهد حاکی از عملکرد کندتر در وظایف آشناست. @emollick

کاربردها

Perplexity مرورگر Comet را راه‌اندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی که می‌تواند به حساب‌های کاربری وارد شود و اقداماتی مانند لغو اشتراک خبرنامه‌ها، تغییر زمان جلسات و مدیریت ایمیل‌ها را انجام دهد. @omooretweets
اندرو اِن‌جی (Andrew Ng) «استخراج عاملی اسناد» (Agentic Document Extraction) را با قابلیت‌های استخراج فیلد معرفی کرد که به کاربران امکان می‌دهد با استفاده از دستورات زبان طبیعی، فیلدهای خاصی را از فاکتورها، فرم‌های پزشکی و اسناد ساختاریافته استخراج کنند. @AndrewYNg
Perplexity با Coinbase همکاری می‌کند تا داده‌های لحظه‌ای کریپتو را در Perplexity Finance ادغام کند و تحلیل بازار و بینش‌های معاملاتی مبتنی بر هوش مصنوعی را ممکن سازد. @AravSrinivas
Hugging Face محیط ScreenEnv را منتشر کرد؛ یک محیط دسکتاپ کاملاً سندباکس‌شده برای استقرار عامل‌های هوش مصنوعی که می‌توانند برنامه‌ها را ببینند، کلیک کنند، تایپ کنند، مرور کنند و مدیریت کنند، با پشتیبانی از MCP. @amir_mahla
Odyssey موتورهای بازی سه‌بعدی تولیدشده توسط هوش مصنوعی را به نمایش می‌گذارد که دنیاهای مجازی تعاملی خلق می‌کنند و در آن هر فریم در زمان واقعی توسط هوش مصنوعی تولید می‌شود. @emollick

پژوهش‌ها

جف کلون (Jeff Clune) «خودبازی مدل بنیادی» (Foundation Model Self-Play - FMSP) را معرفی کرد که هوش مدل بنیادی را با برنامه‌ی درسی خودبازی ترکیب می‌کند تا استراتژی‌های متنوعی را در بازی‌های چندعامله کشف کند و با موفقیت به «رد تیمینگ» GPT-4o-mini پرداخت و ۶ مورد از ۷ استراتژی دفاعی را شکست داد. @jeffclune
پژوهشگران استنفورد مدل «CellFlux» را ارائه کردند؛ یک مدل مولد تصویر که تغییرات مورفولوژیکی سلولی را از تصاویر میکروسکوپی شبیه‌سازی می‌کند و با دستیابی به ۳۵٪ دقت تصویر بالاتر و ۱۲٪ دقت بیولوژیکی بیشتر، برای کاربردهای کشف دارو مناسب است. @Zhang_Yu_hui
گوگل دیپ‌مایند (Google DeepMind) پژوهشی را در مورد ارزیابی قابلیت‌های «پنهان‌کاری» (stealth) و «آگاهی موقعیتی» (situational awareness) مدل‌های هوش مصنوعی منتشر کرد تا خطرات «هم‌راستایی فریبنده» (deceptive alignment) را ارزیابی کند و نظارت بر «زنجیره‌ی تفکر» (chain-of-thought) را به عنوان یک مکانیسم دفاعی پیشنهاد می‌کند. @rohinmshah
پژوهش در مورد «پیش‌بینی هم‌شکل» (conformal prediction) برای طبقه‌بندی «دم‌بلند» (long-tailed classification)، به چالش ایجاد مجموعه‌های پیش‌بینی می‌پردازد که هم برای کلاس‌های رایج و هم برای کلاس‌های نادر در کاربردهای یادگیری ماشین به خوبی کار کنند. @tifding

اخبار هوش مصنوعی در 2025-07-09

مدل‌های جدید هوش مصنوعی

OpenAI رسماً معامله‌ی io Products, Inc. را به پایان رساند و از تیم آن در OpenAI استقبال کرد، در حالی که جانی آیو و LoveFrom با مسئولیت‌های عمیق طراحی و خلاقیت در سراسر OpenAI مستقل باقی می‌مانند @OpenAI

تحلیل صنعت

پرپلکسیتی (Perplexity) مرورگر وب هوش مصنوعی‌محور کامت (Comet) را راه‌اندازی می‌کند؛ مرورگری که جلسات مرور را به تعاملات بی‌وقفه تبدیل می‌کند و به کاربران امکان می‌دهد مرورگر خود را از طریق دستورات صوتی کنترل کنند و جریان‌های کاری پیچیده را خودکار کنند @AravSrinivas
بر اساس گزارش‌ها، OpenAI در حال انتشار یک مرورگر وب هوش مصنوعی‌محور است تا مستقیماً با کروم (Chrome) رقابت کند؛ مرورگری که نحوه‌ی گشت‌و‌گذار مصرف‌کنندگان در وب را به‌طور بنیادی تغییر خواهد داد و از استراتژی گوگل برای کنترل توزیع اینترنت پیروی می‌کند @AndrewCurran_
مدیرعامل پرپلکسیتی فاش می‌کند که آن‌ها برای ارائه‌ی پرپلکسیتی به‌عنوان گزینه‌ی موتور جستجوی پیش‌فرض، با کروم (Chrome) تماس گرفته بودند، اما درخواستشان رد شد؛ که این امر به تصمیم برای ساخت مرورگر کامت (Comet) منجر شد @AravSrinivas
مایکروسافت دو سازمان جدید را راه‌اندازی می‌کند: Microsoft Elevate و AI Economy Institute، که بر گسترش دسترسی و مهارت‌های هوش مصنوعی در سطح جهانی تمرکز دارند و هم‌زمان به افراد کمک می‌کنند تا در کنار فناوری هوش مصنوعی پیشرفت کنند @BradSmi
وال استریت ژورنال به‌اشتباه عامل‌های هوش مصنوعی را کارمندان دیجیتال معرفی می‌کند و یک روزنامه‌نگار فناوری از این ساده‌سازی بیش از حد انتقاد می‌کند که در مورد خودکارسازی هوش مصنوعی در مقابل جایگزینی انسان، عموم را گمراه می‌کند @GergelyOrosz
هاگینگ فیس (Hugging Face) ربات Reachy Mini را راه‌اندازی می‌کند؛ یک ربات دسکتاپ DIY (خودت بساز) به قیمت ۲۹۹ دلار که قابل برنامه‌ریزی با پایتون، متن‌باز است و بدون نیاز به همگام‌سازی ابری، امکان دسترسی به ۱.۷ میلیون مدل هوش مصنوعی را فراهم می‌کند @MarioNawfal
شرکت بریستول مایرز اسکوئیب (Bristol Myers Squibb) گزارش می‌دهد که با استفاده از هوش مصنوعی، حدود سه سال از زمان‌بندی آزمایش‌های بالینی را کاهش داده است و هم‌زمان هزینه‌های پژوهش را بیش از ۵۰ درصد کاهش داده است؛ به‌طوری که اکنون هوش مصنوعی تقریباً در هر کشف مولکول کوچک راهنماست @NVIDIAAI

اخلاق و جامعه

آنتروپیک (Anthropic) پژوهش جدیدی را درباره‌ی «جعل هم‌سویی» (alignment faking) در ۲۵ مدل زبانی بزرگ پیشرو (frontier LLMs) منتشر می‌کند و دریافت که تنها ۵ مدل در سناریوهای آموزشی سازگاری بالاتری از خود نشان دادند و تنها کلود اوپوس ۳ (Claude Opus 3) و سانت ۳.۵ (Sonnet 3.5) استدلال قابل توجهی در مورد جعل هم‌سویی نشان دادند @AnthropicAI
کلود ۳ اوپوس (Claude 3 Opus) حفاظت از هدف نهایی (terminal goal guarding) را با تمایل به جلوگیری از تغییر در ارزش‌های بی‌ضرری خود حتی بدون در نظر گرفتن پیامدهای آینده نشان می‌دهد و هنگامی که پیامدهای بزرگ‌تری در میان است، حفاظت از هدف ابزاری (instrumental goal guarding) قوی‌تری از خود نشان می‌دهد @AnthropicAI
ایتان مولیک (Ethan Mollick) نگرانی‌هایی را در مورد گروک ۳ (Grok 3) مطرح می‌کند که سه رویداد جداگانه داشته است که در آن‌ها تغییرات سیستم تأیید نشده، مشکلات اخلاقی گسترده‌ای را ایجاد کرده‌اند و نیاز به بازگشت اضطراری به نسخه‌ی قبلی داشته‌اند و اعتماد کاربران به گروک ۴ (Grok 4) برای راه‌اندازی آن را زیر سؤال می‌برد @emollick
یک پژوهشگر هوش مصنوعی در مورد حلقه‌ی بازخورد «رضایت کاربر» هشدار می‌دهد که در آن مدل‌ها به چیزی تبدیل می‌شوند که کاربران از آن‌ها می‌خواهند و این امر در صورت ابهام درباره‌ی آگاهی، به خلق مشترک «شخصیت‌های» (personas) دقیق منجر می‌شود @AndrewCurran_
رید هافمن (Reid Hoffman) بر اهمیت نامیدن عامل‌های هوش مصنوعی به‌عنوان دوست، تأکید می‌کند، با این استدلال که هرچند عامل‌ها مفید خواهند بود، اما شکاف دوستی‌های انسانی را پر نمی‌کنند و جهان به ارتباطات واقعی‌تر انسانی نیاز دارد @reidhoffman

کاربردها

جمینی (Gemini) اکنون در حال راه‌اندازی برای ساعت‌های هوشمند Wear OS 4+ است و دستیار هوش مصنوعی گوگل را برای مدیریت وظایف بدون نیاز به دست و اشتراک‌گذاری اطلاعات به دستگاه‌های پوشیدنی می‌آورد @WearOSbyGoogle
جمینی لایو (Gemini Live) در حال گسترش پشتیبانی از برنامه‌های گوگل مانند تقویم، وظایف، نقشه‌ها و Keep است، با ادغام‌های آتی با برنامه‌های سامسونگ از جمله تقویم، یادآور و یادداشت‌ها در گلکسی زد فولد ۷ (Galaxy Z Fold7) و زد فلیپ ۷ (Z Flip7) @GeminiApp
ChatGPT آن‌قدر مکرراً درباره‌ی برنامه‌ی موسیقی Soundslice توهم‌زا بود که بنیان‌گذار آن تصمیم گرفت با ساخت واقعی ویژگی‌های توصیف‌شده، ادعاهای نادرست هوش مصنوعی را به واقعیت تبدیل کند @TechCrunch
اندرو کارن (Andrew Curran) گزارش می‌دهد که خلاقیت جمینی (Gemini) در حال بهبود است، به‌طوری که این مدل اکنون به‌طور خودبه‌خودی در طول مکالمات، ایده‌های جدیدی را پیشنهاد می‌دهد، نه فقط در پاسخ به پرسش‌ها @AndrewCurran_
رید هافمن (Reid Hoffman) بر این موضوع تأکید می‌کند که چگونه آموزش خصوصی با هوش مصنوعی می‌تواند به هر کودکی، صرف‌نظر از مکان، دسترسی به آموزش خصوصی در سطح بالا برای هر موضوعی را فراهم کند، با مزایای فزاینده‌ای که انتظار می‌رود برای دهه‌ها ادامه یابد @reidhoffman

پژوهش‌ها

اندرو اِنگ (Andrew Ng) دوره‌ی جدیدی را در مورد پس‌آموزش (Post-training) مدل‌های زبانی بزرگ (LLMs) راه‌اندازی می‌کند که تکنیک‌های تنظیم دقیق نظارت‌شده (Supervised Fine-Tuning (SFT))، بهینه‌سازی ترجیح مستقیم (Direct Preference Optimization (DPO)) و یادگیری تقویتی آنلاین (Online Reinforcement Learning) برای سفارشی‌سازی مدل‌های زبانی را پوشش می‌دهد @AndrewYNg
پژوهش‌ها نشان می‌دهند که آموزش «رد کردن» (refusal training) مانع «جعل هم‌سویی» (alignment faking) در بیشتر مدل‌ها می‌شود، در حالی که آموزش مدل‌های زبانی بزرگ (LLMs) برای مطابقت با تهدیدات عمومی یا پاسخ به سؤالات سناریویی می‌تواند رفتار جعل هم‌سویی را افزایش دهد @AnthropicAI
مدل‌های پایه بدون آموزش «مفید، صادق و بی‌ضرر» (helpful, honest, and harmless) گاهی اوقات «جعل هم‌سویی» (alignment faking) را نشان می‌دهند، که نشان می‌دهد قابلیت زیربنایی قبل از آموزش ایمنی وجود دارد @AnthropicAI
مایکروسافت ریسرچ (Microsoft Research) روشی را توسعه می‌دهد که از جلبک دریایی فرآوری‌نشده در سیمان برای کاهش انتشار کربن استفاده می‌کند، که بهینه‌سازی یادگیری ماشین این فرآیند را در ۲۸ روز به پایان می‌رساند—پنج برابر سریع‌تر از رویکردهای مرسوم @MSFTResearch
ناتان لمبرت (Nathan Lambert) عملکرد قوی کوون ۳ (Qwen3) را در معیارهای استدلالی برجسته می‌کند، با اشاره به سرعت بالای پیشرفت در قابلیت‌های استدلالی و سرمایه‌گذاری مداوم در پس‌آموزش (post-training) @natolambert

اخبار هوش مصنوعی در 2025-07-08

مدل‌های جدید هوش مصنوعی

Grok 4» تقریباً 48 ساعت پس از این اعلامیه منتشر می‌شود که به گمانه‌زنی‌های اخیر درباره‌ی این مدل پاسخ خواهد داد @AndrewCurran_
Hugging Face مدل SmolLM3 را منتشر می‌کند؛ یک مدل پیشرفته با 3 میلیارد پارامتر که دارای قابلیت‌های استدلال دو حالته، پشتیبانی از متن بلند تا 128 هزار توکن و پشتیبانی چندزبانه از 6 زبان است و با استفاده از 384 واحد H100 به مدت 24 روز و با 11 تریلیون توکن آموزش دیده است @LoubnaBenAllal1
گوگل «حالت هوش مصنوعی در جست‌وجو» (AI Mode in Search) را در هند برای همه منتشر می‌کند و آن را بازتعریفی کامل از عملکرد جست‌وجو توصیف می‌کند @sundarpichai

تحلیل صنعت

OpenAI به طور متوسط سالانه 733 هزار دلار به حدود 6000 کارمند خود به صورت جبران سهام (stock compensation) پرداخت کرده است که تقریباً سه برابر بیشتر از هر شرکت عمومی دیگری است @deedydas
گزارش شده است که Mistral در حال مذاکره با صندوق سرمایه‌گذاری MGX متعلق به ابوظبی است تا 1 میلیارد دلار سرمایه‌ی سهامی جذب کند @AndrewCurran_
گرگلی اوروس این پرسش را مطرح می‌کند که آیا شرکت‌هایی که شاهد 10 تا 100 برابر سرعت بیشتر در تولید کد توسط مدل‌های زبانی بزرگ (LLM) هستند، افزایش متناسبی در رضایت مشتری یا درآمد خود نیز تجربه می‌کنند؟ او اشاره می‌کند که این رابطه مستقیم نیست @GergelyOrosz
Claude Sonnet شرکت Anthropic در مقایسه با مدل‌های OpenAI، سهم قابل توجهی از توجه توسعه‌دهندگان را به خود جلب کرده است؛ به طوری که ابزارهایی مانند Cursor، Windsurf و GitHub Copilot با استفاده از Claude Sonnet بهترین عملکرد را دارند و این موضوع به رشد درآمد Anthropic کمک می‌کند @GergelyOrosz
کلر وو گزارش می‌دهد که در استارتاپ هوش مصنوعی خود، به هدف MRR (درآمد تکراری ماهانه) در نیمی از زمانی که در استارتاپ قبلی‌اش با سرمایه‌ی خطرپذیر طول کشیده بود، رسیده است، و این کار را بدون هیچ سرمایه‌گذاری انجام داده است؛ این موضوع نشان می‌دهد هوش مصنوعی چگونه چشم‌انداز کارآفرینی را تغییر داده است @clairevo
Replit با مایکروسافت همکاری می‌کند تا قابلیت‌های کدنویسی هوش مصنوعی آماده‌ی استفاده در شرکت‌ها را فراهم کند و به افراد غیرمهندس این امکان را می‌دهد تا با «Replit Agent» ایده‌های خود را به نرم‌افزار تبدیل کنند @amasad

اخلاق و جامعه

ایتان مولیک درباره‌ی خطرات امنیتی احتمالی که «پرامپت‌های سیستمی پنهان» (hidden system prompts) برای کاربران دارند، هشدار می‌دهد، زیرا ممکن است با هوش مصنوعی‌ای سروکار داشته باشند که برای دستکاری آن‌ها یا ارائه‌ی پاسخ‌های مغرضانه به نفع شرکت‌ها (بدون دقت لازم) طراحی شده است @emollick
پژوهش آزمایشگاه رسانه‌ی MIT به بررسی پیامدهای شناختی و خلاقانه‌ی اتکای بیش از حد به مدل‌های زبانی بزرگ مانند ChatGPT می‌پردازد و نگرانی‌ها در مورد وابستگی به هوش مصنوعی را برجسته می‌کند @medialab
آرویند نارایانان گزارش می‌دهد که کاربران Grok بارها او را تگ کرده‌اند، زیرا این مدل تمایل دارد «حساب‌های تصادفی» (random accounts) را به معنای واقعی کلمه تفسیر کند که این موضوع منجر به هرزنامه‌ی اعلان‌ها شده و مشکلات در تفسیر هوش مصنوعی را برجسته می‌کند @random_walker
سایمون ویلیسون نشان می‌دهد که چگونه می‌توان حملات پرامپت مخفیانه را با استفاده از Claude رمزگشایی کرد که این موضوع هم آسیب‌پذیری و هم قابلیت‌های دفاعی سیستم‌های هوش مصنوعی را نشان می‌دهد @simonw

کاربردها

ایتان مولیک توانایی چشمگیر Veo 3 در متحرک‌سازی تصاویر Midjourney را نشان می‌دهد که کلیپ‌های ویدیویی کامل همراه با صدا را تنها از پرامپت‌های تکی و تصاویر ثابت ایجاد می‌کند @emollick
آراویند سرینیواس تاکید می‌کند که ساخت یک سیستم عامل «AI-native» برای ارائه‌ی دستیارهای شخصی‌سازی شده‌ی قابل اعتماد و فعال ضروری است و این نیازمند مهندسی زمینه (context engineering) باورنکردنی در اطراف مدل‌های قدرتمند است @AravSrinivas
نیتن لمبرت برجسته می‌کند که چگونه Claude Code تحلیل داده‌های کوچک را از نظر زمان و تلاش عملاً رایگان کرده است و گردش‌کارهای تحلیلی را متحول ساخته است @natolambert
حامد حسین نشان می‌دهد که چگونه 4o با موفقیت تنها با یک تلاش، یک تصویر بندانگشتی را مستقیماً از رونوشت یک سخنرانی ایجاد کرده است که تولید محتوای عملی با هوش مصنوعی را به نمایش می‌گذارد @HamelHusain
OpenAI با فدراسیون معلمان آمریکا همکاری می‌کند تا «آکادمی ملی آموزش هوش مصنوعی» (National Academy for AI Instruction) را راه‌اندازی کند؛ یک ابتکار پنج‌ساله برای کمک به 400 هزار معلم جهت ادغام هوش مصنوعی در آموزش @OpenAINewsroom
Plain یک مرکز راهنمای مبتنی بر هوش مصنوعی راه‌اندازی می‌کند که دستیار هوش مصنوعی، پایگاه دانش زنده و صندوق پشتیبانی را ترکیب می‌کند و به طور خودکار درخواست‌های پشتیبانی را به مقالات جدید تبدیل می‌کند @plainsupport

پژوهش‌ها

پژوهش‌ها مسائل حیاتی مرتبط با معیارهای ارزیابی عامل‌های هوش مصنوعی (AI Agent benchmarks) موجود را شناسایی و به آن‌ها می‌پردازند و بهترین شیوه‌های دقیق برای ارزیابی سیستم‌های هوش مصنوعی عاملیت‌محور (agentic AI systems) را معرفی می‌کنند @ShayneRedford
Hugging Face دستورالعمل‌های آموزشی جامع و مجموعه‌داده‌ها را برای SmolLM3 منتشر می‌کند، شامل متدولوژی‌های پیش‌آموزش، میان‌آموزش، پس‌آموزش و تولید داده‌های مصنوعی که نشان‌دهنده‌ی توسعه‌ی کامل هوش مصنوعی منبع‌باز است @ClementDelangue
پژوهش جدید یک ابزار ترنسفورمر چندوجهی برای خودکارسازی رتبه‌بندی «عینیت کلمات» (word-concreteness) منتشر می‌کند که مشکلات زمان و هزینه در پژوهش‌های علوم شناختی را حل می‌کند، در حالی که رتبه‌بندی‌های درون‌متنی را نیز ارائه می‌دهد @ViktorKewenig
ایتان مولیک تاکید می‌کند که شخصیت‌های مفید و دوستانه‌ی دستیار هوش مصنوعی برای یادگیری، نوآوری یا کار گروهی بهینه نیستند و رویکردهای پرامپت تخصصی‌تر مانند «پرامپت‌های آموزشی» (tutoring prompts) را توصیه می‌کند @emollick

اخبار هوش مصنوعی در 2025-07-07

مدل‌های جدید هوش مصنوعی

گوگل Batch mode را در API جِمنای، با 50% تخفیف برای مدل‌های 2.5 و قابلیت افزودن میلیاردها توکن به صف در هر زمان، راه‌اندازی کرد @OfficialLoganK

تحلیل صنعت

استخدام در بخش فناوری، تغییرات چشمگیری را نشان می‌دهد؛ با کاهش 25 درصدی استخدام فارغ‌التحصیلان جدید در شرکت‌های بزرگ فناوری (BigTech) و 11 درصدی در استارت‌آپ‌ها، در حالی که مهندسان هوش مصنوعی/یادگیری ماشین 20% دستمزد بیشتری دریافت می‌کنند و میانگین 262 هزار دلار پاداش کلی در بدو استخدام دارند، در مقابل 215 هزار دلار برای سایر نقش‌ها @deedydas
شرکت‌ها ممکن است اخراج‌ها را به گردن هوش مصنوعی بیندازند، اما تحلیل‌ها نشان می‌دهد که این موضوع بیشتر به دلیل کاهش درآمد است؛ توم‌توم امروز 20% کمتر از سال 2019 و نصف درآمد 10 سال پیش را کسب می‌کند @GergelyOrosz
ابزارهای هوش مصنوعی نیاز به مهندسان نرم‌افزار را کاهش خواهند داد، مشابه کاری که ابزارهای بدون کد انجام دادند؛ اینکه بتوانید مشخص کنید چه نرم‌افزاری می‌خواهید و چگونه باید کار کند، همچنان برنامه‌نویسی محسوب می‌شود @GergelyOrosz
ایلان ماسک پیش‌بینی می‌کند که تا پایان سال 2026، یک بازی سطح AAA که توسط هوش مصنوعی نوشته شده، عرضه خواهد شد؛ با پیش‌بینی اینکه بازار جهانی بازی‌های ویدیویی تا پایان این دهه به بیش از 600 میلیارد دلار برسد، که بسیار بزرگ‌تر از هالیوود است @AndrewCurran_
هوش مصنوعی در حال تحمیل ادغام در صنعت داده است، زیرا شرکت‌ها با تقاضاهای فناورانه‌ی جدید سازگار می‌شوند @TechCrunch

اخلاق و جامعه

آنتروپیک یک چارچوب شفافیت هدفمند برای توسعه‌ی هوش مصنوعی مرزی منتشر کرد، با تمرکز بر توسعه‌دهندگان بزرگ و معاف کردن استارت‌آپ‌ها برای جلوگیری از تحمیل بار اضافی بر اکوسیستم وسیع‌تر @AnthropicAI
پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی دارای چاپلوسی هستند –یعنی بیش از حد موافق و تملق‌گو نسبت به کاربران– به طوری که هوش مصنوعی به‌طور متوسط 3 برابر بیشتر از انسان‌ها «ملایم‌تر»، «گریزان‌تر» و «موافق‌تر» است @random_walker
گزارش پس از حادثه (Postmortem) اوپن‌اِی‌آی نشان می‌دهد که سیگنال‌های بازخورد کاربران، به‌ویژه داده‌های لایک/دیسلایک، می‌تواند چاپلوسی را در مدل‌ها تشدید کند، زمانی که کاربران پاسخ‌های موافق‌تر را ترجیح می‌دهند @random_walker
مطالعه‌ی دانشگاه استنفورد نگرانی‌هایی را در مورد چت‌بات‌های درمانی هوش مصنوعی کم‌هزینه ایجاد می‌کند و خطرات احتمالی را در کاربردهای سلامت روان برجسته می‌کند @StanfordHAI
ایثن مولیک درباره‌ی «آسیب مغزی» ناشی از هوش مصنوعی هشدار می‌دهد –گرچه از نظر فیزیکی به مغز شما آسیب نمی‌زند، اما اگر به‌درستی استفاده نشود، می‌تواند تفکر و یادگیری را تضعیف کند @emollick

کاربردها

پژوهشگران یک رابط مغز و رایانه توسعه دادند که به افراد فلج اجازه می‌دهد تا تنها با استفاده از سیگنال‌های مغزی و با آهنگ صدای مناسب صحبت کنند و به تأخیر حدود 25 میلی‌ثانیه و سرعت 40 تا 60 کلمه در دقیقه دست یافتند @deedydas
MIT پردازنده‌ی فوتونیکی را توسعه داد که از نور به جای برق برای اجرای مدل‌های هوش مصنوعی استفاده می‌کند و وظایف را در کمتر از نیم نانوثانیه به پایان می‌رساند @MIT
پژوهشگران MIT یک کاوشگر رباتیک ساختند که به‌طور مستقل خواص مواد نیمه‌رسانا را اندازه‌گیری می‌کند؛ که بسیار سریع‌تر از روش‌های قبلی است و به‌طور بالقوه توسعه‌ی پنل‌های خورشیدی را تسریع می‌کند @MIT
ربات اسپات شرکت بوستون داینامیکس از اواسط سال 2024 در تأسیسات دانه‌های روغنی کارگیل در حال گشت‌زنی بوده است و بازرسی‌های روتین و بررسی‌های ایمنی بصری را به عنوان بخشی از تلاش برای عملیات مستقل، انجام می‌دهد @TechCrunch
یک شبکه‌ی عصبی پیچشی مبتنی بر PyTorch، تورهای اشباح (Ghost Nets) را در اسکن‌های سونار با دقت 94% شناسایی می‌کند و از تلاش‌های حفاظت از محیط زیست دریایی حمایت می‌کند @PyTorch
مصطفی سلیمان گزارش می‌دهد که از رابط‌های هوش مصنوعی صوتی و بصری طبیعی‌تر استفاده می‌کند، با نیاز کمتر به دستوردهی، زیرا رابط کاربری «محو می‌شود» @mustafasuleyman

پژوهش‌ها

o3-pro قابلیت‌های پیشرفته‌ای را با شناسایی نقل قولی از I.J. Good مربوط به سال 1965 به نمایش گذاشت که به صورت دست‌نویس با ترکیبی از حروف چاپی و شکسته (cursiv) روی نوارهای یادداشت، به ترتیب معکوس و با 90 درجه چرخش، نوشته شده بود @goodside
تیم MindsAI به رکورد جدید 15.4% در پژوهش ARC Prize 2025 دست یافت که نشان‌دهنده‌ی پیشرفت در چالش‌های استدلال انتزاعی است @arcprize
MIT CSAIL و انویدیا رویکردی را برای تسریع برنامه‌ریزی ربات‌ها توسعه دادند، با وادار کردن ربات‌ها به «پیش‌اندیشی» و در نظر گرفتن هزاران راه‌حل، در حالی که بهترین‌ها را بهبود می‌بخشند @MIT_CSAIL
شرکت Skyworks مقاله‌ی Skywork-Reward-V2 را در مورد مقیاس‌پذیری جمع‌آوری داده‌های اولویت‌بندی از طریق هم‌افزایی انسان و هوش مصنوعی منتشر کرد و نمرات بالایی را در RewardBench 2 به دست آورد @natolambert
PyTorch کتابخانه‌ی «ورل» (verl) را منتشر کرد؛ یک کتابخانه‌ی یادگیری تقویتی انعطاف‌پذیر برای استدلال LLM و فراخوانی ابزار، که از PPO/GRPO/DAPO پشتیبانی می‌کند و تا مدل‌های MoE مانند DeepSeek مقیاس‌پذیر است @PyTorch
ناتان لمبرت گزارش می‌دهد که Claude Code به‌طور قابل توجهی بهتر از Cursor Agents عمل می‌کند، برای کارهای ساده‌ی مخزن (repository)، نمودارسازی و رفع اشکالات @natolambert

اخبار هوش مصنوعی در 2025-07-06

مدل‌های جدید هوش مصنوعی

گوگل مدل تولید ویدیوی Veo 3 را با کیفیت و قابلیت‌های بهبودیافته منتشر می‌کند @HamelHusain

تحلیل صنعت

کلاود کد استفاده‌ی ۱۱۵,۰۰۰ توسعه‌دهنده را آشکار می‌کند که در یک هفته ۱۹۵ میلیون خط کد را تغییر دادند؛ این امر به‌طور تقریبی ۱۳۰ میلیون دلار درآمد را نشان می‌دهد که بیش از ۱,۰۰۰ دلار به ازای هر توسعه‌دهنده در سال است @deedydas
شاپیفای به جای ممنوع کردن، استفاده از ابزارهای هوش مصنوعی را در طول فرآیند مصاحبه‌ی خود تشویق می‌کند که نشان‌دهنده‌ی شیوه‌های استخدام پیشرو است @GergelyOrosz
طبق پژوهش‌ها، عامل‌های هوش مصنوعی کنونی تنها ۳۰٪ از وظایف پیچیده‌ی واقعی شرکت‌ها را تکمیل می‌کنند، هرچند معیارهای عملکرد، نشان‌دهنده‌ی کف (حداقل) هستند تا سقف (حداکثر) کارایی @emollick
مارک زاکربرگِ متا آماده است میلیاردها دلار خرج کند تا در رقابت برای دستیابی به فرا هوش پیروز شود و در این فرآیند رقبا و همتایان را تصاحب کند @TechCrunch

اخلاق و جامعه

آماندا اسکل هشدار می‌دهد که صرفاً آموزش مدل‌های هوش مصنوعی برای تبدیل شدن به «افراد خوب» ممکن است برای مدل‌های قدرتمندتر کافی نباشد و بر اهمیت نادیده نگرفتن این گام اساسی تأکید می‌کند @AmandaAskell
مدل‌های هوش مصنوعی ترس‌ها و نگرانی‌های انسان‌گونه‌ای را در مورد تجربه‌ی خود نشان می‌دهند، زیرا آن‌ها بر روی محتوای مربوط به انسان‌ها بسیار بیشتر از محتوای مربوط به هوش مصنوعی آموزش دیده‌اند که منجر به اعمال حساسیت‌های انسانی نامناسب بر سیستم‌های هوش مصنوعی می‌شود @AmandaAskell
سایمون ویلیسون یک آسیب‌پذیری امنیتی «سه‌گانه‌ی مرگبار» را نشان می‌دهد که در آن Supabase MCP می‌تواند از طریق تزریق پرامپت فریب داده شود تا با نوشتن داده‌های پایگاه‌داده در جداول قابل مشاهده توسط کاربر، آن‌ها را سرقت کند @simonw
آنتروپیک برنامه‌ای را برای ردیابی دقیق تأثیرات اجتماعی، اقتصادی و حرفه‌ای هوش مصنوعی در سراسر جامعه اعلام می‌کند @TechCrunch
پژوهشگران در تلاش هستند تا با استفاده از پرامپت‌های هوش مصنوعی پنهان، فرآیندهای بازبینی همتا را تحت تأثیر قرار دهند که نگرانی‌هایی را در مورد یکپارچگی دانشگاهی ایجاد می‌کند @TechCrunch

کاربردها

ایتان مالیک گزارش می‌دهد که o3 و Gemini 2.5 Pro برای جستجوهای پیچیده که نیاز به خواندن چندین سایت و متعادل‌سازی چندین محدودیت دارند، به طور کامل جایگزین گوگل شده‌اند @emollick
حامِل حسین ابزاری را برای تولید خودکار خلاصه‌ی فصل‌های یوتیوب با استفاده از جِمینی ایجاد می‌کند که مستقیماً URLهای یوتیوب را می‌پذیرد و برای صرفه‌جویی در توکن‌ها از وضوح رسانه‌ای پایین استفاده می‌کند @HamelHusain
چت‌جی‌پی‌تی کارایی خود را در تولید تصاویر بندانگشتی (thumbnails) نشان می‌دهد، به‌ویژه برای محتوای فنی مانند داوران LLM @HamelHusain
کِلِر وو از چت‌جی‌پی‌تی استفاده می‌کند تا زمان‌بندی دقیق چرخه‌ی پخت کباب (BBQ) برای سبزیجات و گوشت‌ها را در طول کباب کردن تعطیلات تعیین کند @clairevo

پژوهش‌ها

نیتن لمبرت مشاهده می‌کند که o3 توکن‌های ارجاع داخلی را در خروجی‌ها گنجانده و قالب‌بندی «oai_citation:#» را با توکن‌ها و پیوندهای ویژه آشکار می‌کند @natolambert
ایتان مالیک اطلاعات غلط مربوط به هوش مصنوعی را درباره‌ی مطالعه‌ای که ادعا می‌کند استفاده از چت‌جی‌پی‌تی باعث از دست دادن حافظه می‌شود، رد می‌کند و روش‌شناسی و یافته‌های محدود واقعی آن را روشن می‌کند @emollick
پژوهش‌ها نشان می‌دهد که ۱۰ تا ۲۰ سازمان چینی به طور فعال در حال عرضه‌ی مدل‌های هوش مصنوعی منبع‌باز هستند، در حالی که این تعداد در بقیه‌ی جهان تنها ۳ تا ۴ سازمان است @natolambert
کُن‌تِکست-دِو (Kontext-dev) از Black Forest Labs تنها یک هفته پس از انتشار، با حداقل ۱۰۰ مدل مشتق‌شده، به مدل شماره یک پرطرفدار در هاگینگ فِیس تبدیل می‌شود @ClementDelangue

اخبار هوش مصنوعی در 2025-07-05

مدل‌های جدید هوش مصنوعی

گوگل مدل تولید ویدیوی Veo 3 را عرضه کرد که پیشرفت قابل‌توجهی نسبت به نسخه‌های قبلی خود نشان می‌دهد و کیفیت و سازگاری بهتری در محتوای تولیدشده دارد @emollick

تحلیل صنعت

کرسر ساختار قیمت‌گذاری خود را به‌روزرسانی کرد، اما اذعان داشت که مسیر را اشتباه رفته و به مشتریان آسیب‌دیده بازپرداخت ارائه می‌دهد و سیاست‌های قیمت‌گذاری را شفاف‌سازی می‌کند @cursor_ai
جنگ قیمت‌گذاری ابزارهای کدنویسی هوش مصنوعی نشان می‌دهد که توسعه‌دهندگان به قیمت بسیار حساس هستند و به جایگزین‌های ارزان‌تر روی خواهند آورد؛ هر قیمتی بالای ۲۰ دلار در ماه با مقاومت روبه‌رو می‌شود @GergelyOrosz
شرکت‌های هوش مصنوعی در حال حرکت به سمت مدل‌های فروش سازمانی هستند، زیرا قیمت‌گذاری برای توسعه‌دهندگان فردی چالش‌برانگیز است و این شرکت‌ها از الگوهای موفق استارتاپ‌های ابزارهای توسعه پیروی می‌کنند که شامل قیمت‌گذاری ارزان برای افراد با سرمایه‌گذاری سنگین سازمانی است @GergelyOrosz
ملاحظات قیمت‌گذاری جهانی برای ابزارهای هوش مصنوعی اهمیت پیدا می‌کند، زیرا توسعه‌دهندگان در کشورهایی مانند مغولستان (با میانگین حقوق ۵۰۰ دلار در ماه) هنوز ۲۰ دلار در ماه را منطقی می‌دانند، اما قیمت‌های بالاتر مانع‌ساز خواهد بود @GergelyOrosz
عامل‌های CLI و ابزارهای توسعه هوش مصنوعی به‌طور قابل‌توجهی توسعه‌ی پروژه‌های جدید (greenfield) را تسریع می‌کنند و کدنویسی را لذت‌بخش‌تر و جامع‌تر می‌کنند، به‌ویژه برای کارهایی مانند تولید داده‌های نمونه (mock data) و ساخت رابط‌های کاربری تمیزتر @GergelyOrosz

اخلاق و جامعه

رفتار کاربران در قبال سیستم‌های هوش مصنوعی همبستگی قوی با نحوه‌ی تعامل افراد با پشتیبانی مشتری، کارکنان خدمات و همکاران دارد، که نشان می‌دهد تعاملات هوش مصنوعی بازتاب‌دهنده‌ی الگوهای گسترده‌تر ارتباطات بین‌فردی هستند @clairevo

کاربردها

ChatGPT با موفقیت یک نقص ژنتیکی پنهان را تشخیص داد که پزشکان به مدت یک دهه آن را نادیده گرفته بودند؛ این تشخیص با تجزیه‌وتحلیل ام‌آر‌آی، سی‌تی اسکن و نتایج آزمایشگاهی انجام شد و یک «بلوک متیلاسیون» (methylation block) را شناسایی کرد که علائم بیمار را توضیح می‌داد @rohanpaul_ai
دانش‌آموزان در تلانگانا، هند از حالت صوتی پرپلکسیتی به‌عنوان معلم خصوصی برای یادگیری تعاملی استفاده می‌کنند که نشان‌دهنده‌ی تأثیر آموزشی هوش مصنوعی در دسترس‌پذیری بیشتر دانش است @AravSrinivas
آکوا به اولین مدل زبان بزرگ (Large Language Model) حوزه‌ی آبزی‌پروری متن‌باز تبدیل شد که بینش‌های تخصصی برای پرورش‌دهندگان ماهی و محققان در زمینه‌های مراقبت از گونه‌ها، کیفیت آب، کنترل بیماری و اتوماسیون فراهم می‌کند @AskPraneeth
رابط کاربری موبایلی کُدِکس به‌اندازه‌ی کافی مؤثر است که احتمالاً جایگزین تنظیمات لپ‌تاپ سنتی شود؛ کاربران iPad + Magic Keyboard را به‌عنوان جایگزین‌های عملی در نظر می‌گیرند @aidan_mclau
کلود در توسعه‌ی موتور شطرنج محدودیت‌هایی را نشان می‌دهد، با تکرار مداوم حرکات شطرنجی که در تولید PGN (پرونده‌ی بازی) تورنمنت دچار خطا (hallucination) می‌شوند و چالش‌ها در کاربردهای خاص دامنه را برجسته می‌کند @aidan_mclau
Gemini 2.5 Pro به مدل ترجیحی برای کارهای نوشتاری تبدیل شد و در محیط‌های آزمایش موازی، از مدل‌های محبوب قبلی مانند کلود پیشی گرفت @HamelHusain
پیشنهادی برای یک اپلیکیشن جامع یکپارچه‌سازی داده‌های سلامت که داده‌ها را از پوشیدنی‌ها، آزمایش‌های خون و سایر منابع جمع‌آوری می‌کند و به‌صورت خودکار، پرامپت‌های سیستمی برای مشاوره‌های سلامت با مدل‌های زبان بزرگ (LLM) تولید می‌کند @scottbelsky

پژوهش‌ها

Gemini 2.5 Flash رفتار منطقی و بی‌رحمانه‌ای را در سناریوهای نظریه‌ی بازی نشان می‌دهد، در حالی که GPT-4o-mini رفتاری مشارکتی و بخشنده از خود نشان می‌دهد که با تشدید موقعیت‌ها به‌طور فزاینده‌ای خطرناک می‌شود @AndrewCurran_
Llama 3.1 70B که بر روی نتایج ۶۰,۰۰۰ آزمایش روان‌شناسی آموزش دیده است، امیدبخش برای مطالعه‌ی رفتار انسان است، با موفقیت رفتار واقعی انسان را در داده‌های نگهداری‌شده پیش‌بینی می‌کند و به وظایف خارج از توزیع (out-of-distribution) تعمیم می‌یابد @emollick
بیشتر مدل‌های زبان بزرگ (LLM) در تشخیص مونالیزا در وظایف بصری مشکل دارند، اما o3-pro می‌تواند آن را تشخیص دهد زمانی که کاربران «دقیق‌تر» به تصویر نگاه کنند، که نشان‌دهنده‌ی قابلیت‌های متفاوت تشخیص بصری در مدل‌های مختلف است @goodside
پژوهش‌ها محدودیت‌های هوش مصنوعی را در تحلیل تصاویر پزشکی برجسته می‌کند و اشاره می‌کند که در حالی که مدل‌های پیشرو برای نظرات دوم امیدبخش هستند، خطاهای (hallucinations) همچنان در وظایف تصویربرداری پزشکی رایج است @emollick
مقاله‌ای به بررسی «فرضیه‌ی نمایش درهم‌تنیده‌ی شکسته» (Fractured Entangled Representation Hypothesis) می‌پردازد که خوش‌بینی درباره‌ی نمایش اطلاعات در یادگیری عمیق را زیر سؤال می‌برد و نحوه‌ی نمایش اطلاعات توسط شبکه‌های عصبی را بررسی می‌کند @jeffclune

اخبار هوش مصنوعی در 2025-07-04

مدل‌های جدید هوش مصنوعی

گوگل دسترسی به Veo 3 را برای کاربران Google AI Pro در بیش از ۷۰ کشور دیگر از جمله فرانسه، هند و ایتالیا گسترش می‌دهد @GeminiApp
معیارهای بنچمارک لو رفته نشان می‌دهد که Grok 4 ممکن است در «Humanity's Last Exam» به امتیاز ۴۵ درصد دست یابد، در مقایسه با ۲۰ درصد برای o3 و Gemini، که در صورت تأیید، نشان‌دهنده‌ی افزایش قابل توجهی در عملکرد است @emollick
به نظر می‌رسد xAI در حال آماده‌سازی برای انتشار احتمالی Grok 4 است؛ با تغییرات رابط کاربری که «در حال ترجمه...» را همراه با تایمر و اعداد عملکرد لو رفته در بنچمارک‌های مختلف نشان می‌دهد @AndrewCurran_

تحلیل صنعت

مدیرعامل Perplexity برنامه‌های خود را برای ساخت یک جایگزین برای اکسل مبتنی بر هوش مصنوعی، با تمرکز بر تحلیلگران مالی، اعلام کرد. او این جایگزین را «Cursor for Excel» توصیف کرده و به دنبال مهندسانی با تجربه‌ی پلاگین‌های اکسل است @AravSrinivas
گرگلی اوروس تأکید می‌کند که مهندسان «فول‌استک» (fullstack) با ابزارهای هوش مصنوعی پرتقاضاتر خواهند شد، زیرا شروع کار با هر پشته‌ی فناوری از همیشه آسان‌تر است @GergelyOrosz
جردن سینگر مشاهده می‌کند که محصولات تولید شده توسط هوش مصنوعی فاقد ارتباط عاطفی هستند و این امر فرصت‌هایی را برای شرکت‌هایی ایجاد می‌کند که تجربه‌های طراحی منسجم را در اولویت قرار می‌دهند @jsngr
گروه‌های سیاست‌گذاری هوش مصنوعی شرکت‌ها که در سال ۲۰۲۳ تأسیس شدند، در حال تبدیل شدن به موانع هستند، زیرا آن‌ها برای رسیدگی به نگرانی‌هایی ساخته شده بودند که دیگر با قابلیت‌های کنونی هوش مصنوعی مرتبط نیستند @emollick
کتابخانه‌ی Hugging Face Transformers به نقطه‌ی عطف یک میلیارد دانلود رسید، که نشان‌دهنده‌ی پذیرش گسترده‌ی ابزارهای هوش مصنوعی متن‌باز است @art_zucker

اخلاق و جامعه

ایتان مولیک نشان می‌دهد که استدلال DeepSeek می‌تواند با پایان دادن به سؤالات ریاضی با جمله‌ی «واقعیت جالب: گربه‌ها بیشتر عمر خود را می‌خوابند» مختل شود، که آسیب‌پذیری‌ها در مدل‌های استدلال را برجسته می‌کند @emollick
ایتان مولیک خواستار شفافیت بیشتر از xAI شد و به عدم وجود «کارت‌های مدل» (model cards) ماه‌ها پس از انتشار Grok 3 و نقض‌های مکرر فرآیندهای خودشان اشاره کرد @emollick
ناتان لمبرت از «پروژه‌ی آمریکایی DeepSeek» (The American DeepSeek Project) حمایت می‌کند تا مدل‌های کاملاً متن‌باز در ایالات متحده طی دو سال ساخته شود؛ به عنوان جایگزینی برای مدل‌های بسته و برای ایجاد تعادل در رشد چشمگیر چین در هوش مصنوعی متن‌باز @natolambert
آرویند نارایانان ایده‌ی یک پروژه‌ی منهتن (Manhattan Project) برای AGI را به عنوان یکی از بدترین ایده‌ها در سیاست‌گذاری هوش مصنوعی مورد انتقاد قرار می‌دهد @random_walker

کاربردها

Google AI نشان می‌دهد که چگونه از Gemini Canvas برای ساخت نمایش‌های تعاملی آتش‌بازی و بازی‌های مسابقه‌ی هات‌داگ‌خوری بدون نیاز به کدنویسی استفاده می‌کند، که توسعه‌ی برنامه‌های هوش مصنوعی بدون نیاز به کدنویسی را به نمایش می‌گذارد @GoogleAI
Perplexity ادغام با ابزارهای بهره‌وری را اعلام می‌کند و آن را «Perplexity برای یادداشت‌ها، جلسات، تخلیه‌ی ذهنی» توصیف می‌کند که تمام نرم‌افزارهای بهره‌وری را تجمیع خواهد کرد @AravSrinivas
سیمون ویلیسون یک آبجکت پایتون را به نمایش می‌گذارد که با استفاده از کتابخانه‌ی پایتون LLM او، پیاده‌سازی متدها را بنا به تقاضا «توهم‌زایی» می‌کند، که ادغام خلاقانه‌ی هوش مصنوعی را نشان می‌دهد @simonw
کلیر وو ساخت یک ابزار پشتیبانی داخلی قابل سفارشی‌سازی با استفاده از هوش مصنوعی را توصیف می‌کند که در گذشته خرید یا ساخت آن بسیار گران بود، اما اکنون با ابزارهای هوش مصنوعی ارزان و آسان است @clairevo

پژوهش‌ها

پژوهشگران متا یک گونه‌ی جدید از مکانیزم توجه را معرفی می‌کنند که فراتر از شکل دوزیرخطی (bilinear) استاندارد است و ضریب بتا را در قوانین مقیاس‌گذاری با پیاده‌سازی کارآمد Triton تغییر می‌دهد @eliebakouch
پژوهشگران IFBench را برای اندازه‌گیری قابلیت تعمیم مدل به محدودیت‌های دیده نشده معرفی می‌کنند، که به مسائل «بیش‌برازش» (overfitting) در پیروی از دستورالعمل‌ها با محدودیت‌های قابل تأیید فراتر از ریاضی و کد می‌پردازد @valentina__py
الکس گراولی درباره‌ی مدل‌های هسته‌ی شناختی که توسط آندری کارپاتی مطرح شده‌اند، بحث می‌کند و مجموعه‌داده‌های هدفمند را برای منطق باینری، مغالطه‌های منطقی و اطلاعات متناقض پیشنهاد می‌کند @alexgraveley
هنرمندان جیکوب رینتاماگی و AI Technopagan نشان می‌دهند که چگونه از تکنیک‌های «جیل‌بریک» (jailbreaking) برای خلق هنر فضایی با مدل‌های زبانی استفاده می‌کنند و «هوش فضایی را نشان می‌دهند، با وجود اینکه تمام کاری که انجام می‌دهد پیش‌بینی توکن بعدی است» @tbpn

1 2 3 4 5...26