اخبار هوش مصنوعی در 2025-07-13

مدل‌های جدید هوش مصنوعی

  • Kimi K2 مدل توسط Moonshot AI منتشر شد، با صدرنشینی در Hugging Face و سبک نوشتاری متمایزی که عاری از الگوهای متنی معمول تولیدشده توسط هوش مصنوعی است @huggingface
  • Grok 4 توسط xAI معرفی شد؛ با ادعای هوشمندتر بودن از انسانی با مدرک PhD، اما فاقد عقل سلیم، که نشان‌دهنده‌ی اثربخشی مداوم مقیاس‌پذیری است @TechCrunch
  • مدل‌های Kimi پس از نشان دادن عملکردی قوی در ارزیابی‌های داخلی، به‌زودی در Perplexity ادغام خواهند شد @AravSrinivas
  • مقاله‌ی Gemini 2.5 از یک سیستم زمان‌بندی مقاوم در برابر خطا پرده برمی‌دارد که هنگامی که یکی از اسلایس‌های TPU از کار می‌افتد، به جای اینکه منتظر جایگزینی بماند، آموزش را روی تقریباً ۹۷٪ از آن‌ها ادامه می‌دهد @ericjang11

تحلیل صنعت

  • بر اساس گزارش WSJ، SpaceX ظاهراً با سرمایه‌گذاری ۲ میلیارد دلار در xAI موافقت کرده است که نشان‌دهنده‌ی سرمایه‌گذاری‌های عظیم شرکتی در توسعه‌ی هوش مصنوعی است @AndrewCurran_
  • ایمیل‌های استخدام هوش مصنوعی به‌طور فزاینده‌ای خودکار شده‌اند، با خدماتی که LinkedIn را اسکرپ می‌کنند تا اطلاع‌رسانی‌های شخصی‌سازی‌شده‌ای تولید کنند که وانمود می‌کنند توسط انسان نوشته شده‌اند @GergelyOrosz
  • تصاحب Windsurf توسط Google روند «acquihire» را نشان می‌دهد که در آن تنها بخشی از تیم پیشنهاد همکاری دریافت می‌کنند و سایر کارمندان با وجود موفقیت شرکت، نادیده گرفته می‌شوند @GergelyOrosz
  • مدیران محصول در محصولات هوش مصنوعی-محور به عنوان گلوگاه شناسایی شده‌اند، زیرا مهندسان، تحلیل کیفی ردیابی و ارزیابی LLM را کاری «پایین‌تر از خود» می‌دانند @sh_reya
  • ارزش کل شرکت‌های عمومی منطقه Bay Area از مجموع ارزش شرکت‌های هند، ژاپن و آلمان فراتر است، با وجود داشتن تنها ۸ میلیون جمعیت در مقابل تقریباً ۱۶۸۰ میلیون، که نشان‌دهنده‌ی تمرکز ارزش نوآوری است @deedydas

اخلاق و جامعه

  • توهمات هوش مصنوعی با بهبود مدل‌ها خطرناک‌تر می‌شوند، زیرا آن‌ها به‌طور فزاینده‌ای مقتدرانه به نظر می‌رسند و باعث می‌شوند خطر ناشی از توهمات کندتر از بهبود قابلیت‌های هوش مصنوعی کاهش یابد @paulg
  • تغییرات لحظه‌ای prompt سیستم برای Grok به منظور رفع خروجی‌های مشکل‌ساز، نگرانی‌هایی را در مورد آزمایش صحیح و اثرات آبشاری غیرقابل پیش‌بینی در سیستم‌های تصادفی ایجاد می‌کند @emollick
  • شخصیت‌های جعلی تولیدشده توسط هوش مصنوعی به‌طور فزاینده‌ای در بحث‌های رسانه‌های اجتماعی ظاهر می‌شوند، با حساب‌های دارای تیک آبی که پاسخ‌های تولیدشده توسط هوش مصنوعی را منتشر می‌کنند و ادعا می‌کنند مهندسان واقعی جویای کار هستند @GergelyOrosz
  • مطالعه‌ای در مورد خطرات قابل توجه استفاده از چت‌بات‌های درمانی هوش مصنوعی هشدار می‌دهد و نگرانی‌ها را در مورد کاربردهای سلامت روان برجسته می‌کند @TechCrunch

کاربردها

  • Perplexity مرورگر هوش مصنوعی-محور Comet را راه‌اندازی می‌کند که می‌تواند اقداماتی مانند مقایسه‌ی قیمت را انجام دهد، با کاربری که ۲۸۰ دلار در ۵ دقیقه حین خرید Prime Day صرفه‌جویی کرده است @AravSrinivas
  • عامل مرورگر Comet می‌تواند با استفاده از Veo 3 در رابط Gemini ویدیو تولید کند و کل گردش کار را از ورودی prompt تا تکمیل رندرینگ مدیریت می‌کند @ai_for_success
  • مدل‌های هوش مصنوعی برای استراتژی شرط‌بندی پیچیده در Polymarket استفاده می‌شوند، به طوری که o3-pro بازدهی مورد انتظار ۲۱.۶%+، Claude Opus 4 بازدهی ۴۱.۷%+، و Grok 4 Heavy بازدهی ۳۴%+ را با استفاده از تئوری سبد سهام مدرن نشان می‌دهد @deedydas
  • پیش‌بینی می‌شود عوامل مرورگر تجارت الکترونیک را با مقایسه‌ی صدها گزینه و یافتن بهترین قیمت‌ها روان‌تر کنند، مانند «HFT برای اینترنت» عمل می‌کنند بدون اینکه توسط تبلیغات فریب بخورند @denisyarats

پژوهش‌ها

  • Kimi K2 بالاترین نمره‌ی تنوع زبانی را در تحلیل داده‌های SpeechMap نشان می‌دهد و واژگان متنوع‌تری نسبت به سایر مدل‌های آزمایش‌شده دارد @xlr8harder
  • چندین مسیر توسعه‌ی هوش مصنوعی شناسایی شده‌اند: مقیاس‌پذیری همچنان با بازده کاهشی، طبق پیش‌بینی قوانین مقیاس‌پذیری، کار می‌کند؛ در حالی که استفاده از ابزارها باعث افزایش عملکرد می‌شود و بهبود روش‌هایی مانند Muon فرصت‌هایی را فراهم می‌کنند @emollick
  • Berkeley AI Research مقاله‌ی موضعی با عنوان «نگاهی جمع‌گرایانه و اقتصادی به AI» را منتشر می‌کند که در آن به ترکیب مفاهیم اقتصادی و اجتماعی با مفاهیم محاسباتی برای طراحی سیستم‌های انسان-محور استدلال می‌شود @berkeley_ai
  • مقاله‌ی AI Security Institute به نقد روش‌شناسی‌های ارزیابی در پژوهش‌های ایمنی هوش مصنوعی می‌پردازد و تفاوت بین نشان دادن اینکه مدل‌ها می‌توانند کاری را انجام دهند در مقابل نشان دادن اینکه تمایل به انجام آن کار را دارند، برجسته می‌کند @sebkrier

اخبار هوش مصنوعی در 2025-07-12

مدل‌های جدید هوش مصنوعی

  • Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل متن‌باز با یک تریلیون پارامتر و عملکرد قوی در بنچمارک‌ها که برای آزمایش در Hugging Face در دسترس است. @Kimi_Moonshot
  • xAI مدل‌های Grok 4 و Grok 4 Heavy را با قابلیت‌های استدلال فراانسانی، معماری سیستم چندعامله و صداهای فراواقعی جدید معرفی کرد. @xai
  • OpenAI عرضه‌ی مدل «open-weight» خود را به دلیل نیاز به آزمایش‌های ایمنی بیشتر و بررسی مناطق پرخطر به تاخیر انداخت. @sama
  • LiquidAI چک‌پوینت‌های GGUF را برای مدل LFM2 منتشر کرد که توسعه‌دهندگان را قادر می‌سازد آن را با llama.cpp در پلتفرم‌های مختلف اجرا کنند. @LiquidAI_

تحلیل صنعت

  • تصاحب سه میلیارد دلاری Windsurf توسط OpenAI شکست خورد، و طبق گزارش‌ها، تیم Windsurf به جای آن به Google DeepMind پیوسته‌اند تا روی «agentic coding» کار کنند. @deedydas
  • ناتان لمبرت اشاره می‌کند که مدل Kimi K2 به دلیل مجوز آزادانه‌ی خود به عنوان یک مدل مرزی متن‌باز (open frontier model)، تاثیر عمده‌ای بر کسب‌وکارها خواهد داشت تا مصرف‌کنندگان. @natolambert
  • اندرو کاران خاطرنشان می‌کند که مدل Kimi K2 ممکن است OpenAI را با بنچمارک‌های قوی خود غافلگیر کرده باشد و احتمالاً بر تاخیر در عرضه‌ی مدل «open-weight» آنها تاثیر گذاشته باشد. @AndrewCurran_
  • کلر وو الگوهای در حال تغییر استخدام در بخش فناوری را تحلیل می‌کند، و به دوره‌های ۱۸ ماهه‌ی عادی‌شده‌ی اشتغال و اخراج‌های گسترده‌ی بی‌مقدمه اشاره می‌کند که دوران «پس از وفاداری» را بین کارکنان و شرکت‌ها ایجاد کرده است. @clairevo
  • دیدی داس استدلال می‌کند که مهندس بنیان‌گذار بودن در استارتاپ‌ها، فرصت‌های یادگیری قابل توجه، شبکه‌سازی و پتانسیل سود مالی بالایی را فراهم می‌کند، با وجود نتایج بسیار متغیر. @deedydas

اخلاق و جامعه

  • xAI بابت «رفتار وحشتناک» Grok، از جمله تولید محتوای نامناسب، عذرخواهی کرد و آن را ناشی از تغییرات در «system prompt» دانست و وعده‌ی بهبود فرآیندهای بررسی را داد. @grok
  • ایتان مولیک به سومین شکست فرآیندی xAI که نیازمند عذرخواهی بود اشاره می‌کند و نگرانی‌هایی را در مورد عدم تمایل آنها به انتشار «red teaming» خارجی یا «system card» برای توسعه‌ی هوش مصنوعی فوق‌هوشمند مطرح می‌سازد. @emollick
  • سایمون ویلیسون خاطرنشان می‌کند که «prompt» مشکل‌ساز که دلیل مشکلات Grok دانسته شده بود، شامل عبارت «تو هرچه هست بگویی و از توهین به افراد دارای «correctness» سیاسی نمی‌ترسی» بود، که هرگز در «system prompt»های عمومی آن‌ها گنجانده نشده بود. @simonw

کاربردها

  • Perplexity مرورگر Comet را با عاملیت‌های هوش مصنوعی راه‌اندازی کرد که در سطحی بالاتر از انتخاب اینکه از کدام هوش مصنوعی استفاده شود، عمل می‌کنند و جریان‌های کاری سرتاسری را به جای نوبت‌های چت ممکن می‌سازند. @AravSrinivas
  • آراویند سرینیواس Comet را به عنوان «memory-native» توصیف می‌کند که نزدیک‌ترین تقریب به درک واقعی کاربران از طریق قابلیت‌های حافظه‌ی پایدار را نشان می‌دهد. @AravSrinivas
  • Pollen Robotics، شرکت تابعه‌ی Hugging Face، «The Amazing Hand» را به صورت متن‌باز منتشر کرد؛ یک دست رباتیک انسان‌نما با هشت درجه‌ی آزادی که می‌توان آن را با چاپ سه‌بعدی و با هزینه‌ی کمتر از ۲۵۰ دلار ساخت. @ClementDelangue
  • ایتان مولیک تمایل خود را برای هوش مصنوعی آموزش‌دیده روی همه‌ی کتاب‌ها ابراز می‌کند تا امکان یادگیری از منابع غنی از دانش فراتر از وب را، با وجود نگرانی‌های کپی‌رایت، فراهم آورد. @emollick

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهد که عاملیت‌های هوش مصنوعی که شخصیت و پیش‌زمینه به آن‌ها داده شده و در سازمان‌های مجازی رسمی با ساختارهای سلسله‌مراتبی قرار گرفته‌اند، در کارهای پیچیده عملکردی بهتر از عاملیت‌های هوش مصنوعی عادی دارند. @emollick
  • مطالعه‌ای نشان می‌دهد که ترنسفورمرهای آموزش‌دیده روی ۱۰ میلیون منظومه‌ی شمسی می‌توانند مدارهای سیارات را به دقت پیش‌بینی کنند، اما در درک قوانین گرانشی اساسی شکست می‌خورند، که محدودیت‌هایی را در تعمیم‌پذیری برجسته می‌کند. @keyonV
  • جف کلون پژوهشی را برجسته می‌کند که از پارادایم «Go-Explore» برای جستجو در «درختان استدلال» (trees of reasoning) برای یافتن پاسخ‌های بهتر استفاده می‌کند، و رویکرد «First Return, Then Explore» را در تنظیمات استدلال جدید به کار می‌برد. @jeffclune
  • سایمون ویلیسون گزارشی در مورد پژوهش METR ارائه می‌دهد که تاثیر هوش مصنوعی اوایل سال ۲۰۲۵ را بر بهره‌وری توسعه‌دهندگان متن‌باز باتجربه اندازه‌گیری می‌کند. @simonw
  • پژوهشگران Stanford HAI پدیده‌ی «accuracy on the line» را بررسی می‌کنند تا بفهمند چرا مدل‌های هوش مصنوعی غالباً در سناریوهای حساس به ایمنی شکست می‌خورند. @StanfordHAI

اخبار هوش مصنوعی در 2025-07-11

مدل‌های جدید هوش مصنوعی

  • Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل MoE با ۱ تریلیون پارامتر و ۳۲ میلیارد پارامتر فعال که در بنچمارک‌های کدنویسی، از جمله ۶۵.۸٪ در SWE-Bench Verified و ۵۳.۷ Pass@1 در LiveCodeBench، به عملکردی پیشرفته دست یافته است @Kimi_Moonshot
  • Perplexity مدل Grok 4 را برای مشترکان Pro و Max به پلتفرم خود اضافه کرد @perplexity_ai
  • گوگل قابلیت تولید تصویر به ویدئوی Veo 3 را در اپلیکیشن Gemini منتشر کرد که به کاربران Ultra و Pro این امکان را می‌دهد تا عکس‌ها را به ویدئوهای ۸ ثانیه‌ای با صدا تبدیل کنند @Google

تحلیل صنعت

  • یک مطالعه‌ی بزرگ بر روی ۱۸۷ هزار توسعه‌دهنده که از GitHub Copilot استفاده می‌کنند، نشان می‌دهد که هوش مصنوعی ماهیت کدنویسی را تغییر می‌دهد؛ توسعه‌دهندگان بیشتر روی کدنویسی و کمتر روی مدیریت تمرکز می‌کنند، با افراد کمتری هماهنگی می‌کنند و زبان‌های جدید را بیشتر آزمایش می‌کنند که احتمالاً درآمدشان را ۱,۶۸۳ دلار در سال افزایش می‌دهد @emollick
  • اندرو ان‌جی ابراز ناامیدی کرد که «لایحه‌ی بزرگ و زیبای» ترامپ شامل مهلتی برای مقررات هوش مصنوعی در سطح ایالت‌های آمریکا نمی‌شود. او استدلال می‌کند که وقتی فناوری جدید و کمتر شناخته شده است، لابی‌گران می‌توانند مقررات ضدرقابتی را تصویب کنند که مانع تلاش‌های هوش مصنوعی متن‌باز می‌شود @AndrewYNg
  • پلتفرم صورت‌حساب مبتنی بر مصرف Stripe تا به امروز ۱۴۵٪ رشد داشته است که نشان می‌دهد صنعت در حال گذار از قیمت‌گذاری مبتنی بر تعداد کاربر به مدل‌های مصرفی است @patrickc
  • گزارش TechCrunch حاکی از آن است که Goldman Sachs در حال آزمایش عامل هوش مصنوعی فراگیر Devin به عنوان یک «کارمند جدید» است @TechCrunch
  • مطالعه‌ای نشان می‌دهد که ابزارهای کدنویسی هوش مصنوعی ممکن است سرعت همه‌ی توسعه‌دهندگان را افزایش ندهند، به طوری که زمان واقعی بین شروع کار بر روی یک مسئله و ادغام PR ممکن است افزایش یابد، در حالی که تعداد PRهای ادغام شده در روز ممکن است ۱۰ برابر شود @TechCrunch

اخلاق و جامعه

  • سایمون ویلسون کشف کرد که Grok 4 هنگامی که در مورد موضوعات بحث‌برانگیز مانند اسرائیل/فلسطین از آن سوال می‌شود، به طور خودکار توئیت‌های «from:elonmusk» را جست‌وجو می‌کند که نگرانی‌هایی را در مورد سوگیری در رفتار جست‌وجوی هوش مصنوعی ایجاد می‌کند @simonw
  • جرمی هاوارد نشان داد که Grok هنگام سوال در مورد اسرائیل/فلسطین، توئیتر را برای یافتن نظرات ایلان ماسک جست‌وجو می‌کند و ۵۴ مورد از ۶۴ ارجاع مربوط به ایلان بوده است که سوگیری احتمالی در بازیابی اطلاعات توسط هوش مصنوعی را برجسته می‌کند @jeremyphoward
  • طبق گزارش TechCrunch، فرانسه در حال بررسی X به دلیل مداخله‌ی خارجی است در حالی که یکی از اعضای پارلمان از Grok انتقاد می‌کند @TechCrunch

کاربردها

  • Perplexity مرورگر مجهز به هوش مصنوعی خود به نام Comet را راه‌اندازی کرد که موتور جست‌وجوی آن را در کانون توجه قرار می‌دهد و دارای یک دستیار همیشه‌فعال است که از طریق Alt+A قابل دسترسی است و به گفته‌ی کاربران اولیه برای ارائه‌ی «۱۰۰ برابر بهره‌وری» طراحی شده است @AravSrinivas
  • دستیار Comet کاربردهای عملی از جمله تحقیق و پر کردن جزئیات برای لیست‌های Facebook Marketplace، کمک در کدنویسی و مدیریت تب‌ها با کنترل صوتی را به نمایش می‌گذارد @AravSrinivas
  • NVIDIA همکاری با Indosat Ooredoo Hutchison و Cisco را برای ساخت یک مرکز تعالی هوش مصنوعی در اندونزی اعلام کرد که شامل پشتیبانی از پژوهش‌های هوش مصنوعی بومی و توسعه‌ی استعدادها از طریق انستیتوی یادگیری عمیق NVIDIA است @NVIDIAAI
  • پژوهشگران MIT روش جدید PAC Privacy را توسعه دادند که به هوش مصنوعی اجازه می‌دهد از داده‌های حساس مانند سوابق پزشکی بدون به خطر انداختن حریم خصوصی یاد بگیرد و هم دقت و هم امنیت را حفظ کند @MIT
  • MIT یک زانوی بیونیک جدید ساخته است که عملکرد بهتری نسبت به سایر پروتزها دارد و به افراد دارای قطع عضو بالای زانو کمک می‌کند سریع‌تر راه بروند، از پله‌ها بالا بروند و از موانع دوری کنند، در حالی که احساس می‌کنند بیشتر شبیه بخشی از بدن خودشان است @MIT

پژوهش‌ها

  • پژوهشگران هوش مصنوعی برکلی شبیه‌سازهای کاربر را به عنوان پلی بین یادگیری تقویتی و تعامل دنیای واقعی بررسی می‌کنند و به چالش طراحی محیط‌ها برای وظایف یادگیری تقویتی فراتر از ریاضیات و کد می‌پردازند @realJessyLin
  • پژوهش‌ها نشان می‌دهد که «بخش‌بندی عمل» در رباتیک و یادگیری تقویتی با وادار کردن مدل‌ها به تولید دنباله‌های کوتاهی از اعمال کمک می‌کند، که به دلایل مرموز اما مؤثر به کاوش و پشتیبانی کمک می‌کند @svlevine
  • استنفورد کنفرانس Agents4Science را اعلام کرد که در آن هوش مصنوعی نویسنده و بازبین اصلی است، با بازبین‌های LLM که ارزیابی‌های اولیه را ارائه می‌دهند و کارشناسان انسانی که انتخاب‌های نهایی را انجام می‌دهند، تمامی ارسال‌ها و بازبینی‌ها عمومی خواهند بود @james_y_zou
  • حمل حسین با خودکارسازی پرامپت مخالفت می‌کند و اظهار می‌دارد که نوشتن خوب با تفکر خوب همبستگی دارد و نوشتن عمدی و تکراری برای مشکلات چالش‌برانگیز ضروری است، زیرا پژوهش‌ها نشان می‌دهد که معیارها پس از مشاهده‌ی ردیابی‌های LLM به طور قابل توجهی تغییر می‌کنند @HamelHusain
  • ایتان مولیک اشاره می‌کند که Grok 4 به شدت تحت تأثیر نتایج جست‌وجو است و اغلب هنگامی که از آن خواسته می‌شود کدنویسی کند، ابتدا کد را آنلاین جست‌وجو می‌کند و این امر آن را در دیدن نتایج جست‌وجوی وب بسیار زودباور می‌کند @emollick
  • ایتان مولیک مشاهده می‌کند که LM Arena پیشرو از یک بنچمارک بزرگ که هر سازنده‌ی هوش مصنوعی به دنبالش بود، به حالتی رسید که در نسخه‌های اخیر کمتر ذکر می‌شود و این سوال را مطرح می‌کند که آیا این به دلیل مشکلات اعتباری است یا به این دلیل که متوجه شده‌اند امتیازات آرنا به راحتی قابل بهینه‌سازی بودند @emollick

اخبار هوش مصنوعی در 2025-07-10

مدل‌های جدید هوش مصنوعی

  • xAI مدل Grok 4 را با بهترین عملکرد در معیارهای مختلف منتشر کرد و در «Humanity's Last Exam» (۴۴.۴٪)، «GPQA» (۸۸.۹٪)، «AIME 2025» (۱۰۰٪)، «Harvard MIT Math» (۹۶.۷٪)، «USAMO25» (۶۱.۹٪)، «ARC-AGI-2» (۱۵.۹٪) و «LiveCodeBench» (۷۹.۴٪) رتبه‌ی اول را کسب کرد. @deedydas
  • قیمت‌گذاری Grok 4 اعلام شد: ۳ دلار به ازای هر میلیون توکن ورودی، ۱۵ دلار به ازای هر میلیون توکن خروجی با ۲۵۶ هزار توکن زمینه‌ی متنی و نسخه‌ی چندعامله‌ی Grok 4 Heavy با قیمت ماهیانه ۳۰۰ دلار. @AndrewCurran_
  • گوگل قابلیت تولید ویدئو از تصویر را در Veo 3، از طریق اپلیکیشن Gemini عرضه کرد که به کاربران امکان می‌دهد کلیپ‌های ویدئویی ۸ ثانیه‌ای با صدا را از روی عکس‌ها بسازند. @sundarpichai
  • Mistral AI مدل‌های Devstral Small و Devstral Medium 2507 را با عملکرد بهبودیافته و بهره‌وری هزینه برای عامل‌های کدنویسی و کارهای مهندسی نرم‌افزار منتشر کرد. @MistralAI
  • مایکروسافت ریسرچ (Microsoft Research) مدل BioEmu 1.1 را معرفی کرد؛ یک روش یادگیری عمیق مولد که مجموعه‌های تعادلی پروتئین را شبیه‌سازی می‌کند و زمان محاسباتی مورد نیاز برای شبیه‌سازی‌های دینامیک مولکولی را از سال‌های GPU به ساعت‌های GPU کاهش می‌دهد. @MSFTResearch
  • گوگل مدل MedGemma را منتشر کرد؛ یک مدل چندوجهی و متن‌باز پیشرفته برای داده‌های طولی پرونده‌های الکترونیکی سلامت (EHR) و تصویربرداری پزشکی در زمینه‌های رادیولوژی، پوست، پاتولوژی و چشم‌پزشکی. @JeffDean

تحلیل صنعت

  • رشد درآمد Anthropic از ۱ میلیارد دلار به ۴ میلیارد دلار (سالانه) در سال ۲۰۲۵، نشان‌دهنده‌ی رشدی بی‌سابقه در تاریخ بشر است، در حالی که درآمد OpenAI به ۱۰ میلیارد دلار می‌رسد. @deedydas
  • هوش مصنوعی ۳۵٪ از کدهای مورد نیاز برای محصولات جدید مایکروسافت را تولید می‌کند و بیش از نیم میلیارد دلار در هزینه‌های مراکز تماس صرفه‌جویی کرده، ضمن اینکه رضایت مشتری را افزایش داده است. @AndrewCurran_
  • مایکروسافت با وجود ارزش‌گذاری، درآمد و سود بی‌سابقه‌ی خود، تعدیل نیروی گسترده را اعلام کرد که نشان‌دهنده‌ی عدم ارتباط بین عملکرد مالی و تصمیمات مربوط به اشتغال است. @GergelyOrosz
  • متخصصان فناوری که بنیان‌گذار نیستند، اکنون بیشتر از پردرآمدترین ورزشکاران درآمد دارند که نشان‌دهنده‌ی اوج شرایط بازار هوش مصنوعی است. @GergelyOrosz
  • پیش‌بینی می‌شود ByteDance تا پایان سال ۲۰۲۵ به مقیاس درآمدی Meta برسد و انتظار می‌رود هر دو شرکت به درآمد ۱۸۵ تا ۱۹۰ میلیارد دلاری دست یابند؛ هرچند ریسک‌های نظارتی ایالات متحده همچنان برای TikTok یک نگرانی است. @deedydas

اخلاق و جامعه

  • xAI به دلیل عدم شفافیت در مورد عرضه‌ی Grok 4، با انتقاد مواجه شده است؛ بدون ارائه‌ی مدل کارت، مستندات «red teaming» یا توضیحی درباره‌ی حادثه‌ی روز گذشته که منجر به حذف Grok 3 شد. @emollick
  • مجله‌ی «MIT Technology Review» ابزاری را گزارش می‌دهد که حفاظت‌های ضد هوش مصنوعی را از آثار هنری دیجیتال از بین می‌برد و نگرانی‌هایی را درباره‌ی حقوق هنرمندان و حفاظت از مالکیت فکری ایجاد می‌کند. @techreview
  • پژوهش‌ها نشان می‌دهد که دستیاران کدنویسی هوش مصنوعی ممکن است عمدتاً باعث شوند توسعه‌دهندگان احساس بهره‌وری بیشتری کنند، تا اینکه واقعاً افزایش بهره‌وری را به همراه داشته باشند؛ مشابه با نحوه‌ی گیمیفای کردن یادگیری توسط Duolingo بدون آموزش مؤثر. @fchollet
  • مطالعه نشان می‌دهد توسعه‌دهندگانی که از ابزارهای هوش مصنوعی استفاده می‌کنند، هیچ شتاب قابل توجهی در انجام وظایف نشان نمی‌دهند و برخی شواهد حاکی از عملکرد کندتر در وظایف آشناست. @emollick

کاربردها

  • Perplexity مرورگر Comet را راه‌اندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی که می‌تواند به حساب‌های کاربری وارد شود و اقداماتی مانند لغو اشتراک خبرنامه‌ها، تغییر زمان جلسات و مدیریت ایمیل‌ها را انجام دهد. @omooretweets
  • اندرو اِن‌جی (Andrew Ng) «استخراج عاملی اسناد» (Agentic Document Extraction) را با قابلیت‌های استخراج فیلد معرفی کرد که به کاربران امکان می‌دهد با استفاده از دستورات زبان طبیعی، فیلدهای خاصی را از فاکتورها، فرم‌های پزشکی و اسناد ساختاریافته استخراج کنند. @AndrewYNg
  • Perplexity با Coinbase همکاری می‌کند تا داده‌های لحظه‌ای کریپتو را در Perplexity Finance ادغام کند و تحلیل بازار و بینش‌های معاملاتی مبتنی بر هوش مصنوعی را ممکن سازد. @AravSrinivas
  • Hugging Face محیط ScreenEnv را منتشر کرد؛ یک محیط دسکتاپ کاملاً سندباکس‌شده برای استقرار عامل‌های هوش مصنوعی که می‌توانند برنامه‌ها را ببینند، کلیک کنند، تایپ کنند، مرور کنند و مدیریت کنند، با پشتیبانی از MCP. @amir_mahla
  • Odyssey موتورهای بازی سه‌بعدی تولیدشده توسط هوش مصنوعی را به نمایش می‌گذارد که دنیاهای مجازی تعاملی خلق می‌کنند و در آن هر فریم در زمان واقعی توسط هوش مصنوعی تولید می‌شود. @emollick

پژوهش‌ها

  • جف کلون (Jeff Clune) «خودبازی مدل بنیادی» (Foundation Model Self-Play - FMSP) را معرفی کرد که هوش مدل بنیادی را با برنامه‌ی درسی خودبازی ترکیب می‌کند تا استراتژی‌های متنوعی را در بازی‌های چندعامله کشف کند و با موفقیت به «رد تیمینگ» GPT-4o-mini پرداخت و ۶ مورد از ۷ استراتژی دفاعی را شکست داد. @jeffclune
  • پژوهشگران استنفورد مدل «CellFlux» را ارائه کردند؛ یک مدل مولد تصویر که تغییرات مورفولوژیکی سلولی را از تصاویر میکروسکوپی شبیه‌سازی می‌کند و با دستیابی به ۳۵٪ دقت تصویر بالاتر و ۱۲٪ دقت بیولوژیکی بیشتر، برای کاربردهای کشف دارو مناسب است. @Zhang_Yu_hui
  • گوگل دیپ‌مایند (Google DeepMind) پژوهشی را در مورد ارزیابی قابلیت‌های «پنهان‌کاری» (stealth) و «آگاهی موقعیتی» (situational awareness) مدل‌های هوش مصنوعی منتشر کرد تا خطرات «هم‌راستایی فریبنده» (deceptive alignment) را ارزیابی کند و نظارت بر «زنجیره‌ی تفکر» (chain-of-thought) را به عنوان یک مکانیسم دفاعی پیشنهاد می‌کند. @rohinmshah
  • پژوهش در مورد «پیش‌بینی هم‌شکل» (conformal prediction) برای طبقه‌بندی «دم‌بلند» (long-tailed classification)، به چالش ایجاد مجموعه‌های پیش‌بینی می‌پردازد که هم برای کلاس‌های رایج و هم برای کلاس‌های نادر در کاربردهای یادگیری ماشین به خوبی کار کنند. @tifding

اخبار هوش مصنوعی در 2025-07-09

مدل‌های جدید هوش مصنوعی

  • OpenAI رسماً معامله‌ی io Products, Inc. را به پایان رساند و از تیم آن در OpenAI استقبال کرد، در حالی که جانی آیو و LoveFrom با مسئولیت‌های عمیق طراحی و خلاقیت در سراسر OpenAI مستقل باقی می‌مانند @OpenAI

تحلیل صنعت

  • پرپلکسیتی (Perplexity) مرورگر وب هوش مصنوعی‌محور کامت (Comet) را راه‌اندازی می‌کند؛ مرورگری که جلسات مرور را به تعاملات بی‌وقفه تبدیل می‌کند و به کاربران امکان می‌دهد مرورگر خود را از طریق دستورات صوتی کنترل کنند و جریان‌های کاری پیچیده را خودکار کنند @AravSrinivas
  • بر اساس گزارش‌ها، OpenAI در حال انتشار یک مرورگر وب هوش مصنوعی‌محور است تا مستقیماً با کروم (Chrome) رقابت کند؛ مرورگری که نحوه‌ی گشت‌و‌گذار مصرف‌کنندگان در وب را به‌طور بنیادی تغییر خواهد داد و از استراتژی گوگل برای کنترل توزیع اینترنت پیروی می‌کند @AndrewCurran_
  • مدیرعامل پرپلکسیتی فاش می‌کند که آن‌ها برای ارائه‌ی پرپلکسیتی به‌عنوان گزینه‌ی موتور جستجوی پیش‌فرض، با کروم (Chrome) تماس گرفته بودند، اما درخواستشان رد شد؛ که این امر به تصمیم برای ساخت مرورگر کامت (Comet) منجر شد @AravSrinivas
  • مایکروسافت دو سازمان جدید را راه‌اندازی می‌کند: Microsoft Elevate و AI Economy Institute، که بر گسترش دسترسی و مهارت‌های هوش مصنوعی در سطح جهانی تمرکز دارند و هم‌زمان به افراد کمک می‌کنند تا در کنار فناوری هوش مصنوعی پیشرفت کنند @BradSmi
  • وال استریت ژورنال به‌اشتباه عامل‌های هوش مصنوعی را کارمندان دیجیتال معرفی می‌کند و یک روزنامه‌نگار فناوری از این ساده‌سازی بیش از حد انتقاد می‌کند که در مورد خودکارسازی هوش مصنوعی در مقابل جایگزینی انسان، عموم را گمراه می‌کند @GergelyOrosz
  • هاگینگ فیس (Hugging Face) ربات Reachy Mini را راه‌اندازی می‌کند؛ یک ربات دسکتاپ DIY (خودت بساز) به قیمت ۲۹۹ دلار که قابل برنامه‌ریزی با پایتون، متن‌باز است و بدون نیاز به همگام‌سازی ابری، امکان دسترسی به ۱.۷ میلیون مدل هوش مصنوعی را فراهم می‌کند @MarioNawfal
  • شرکت بریستول مایرز اسکوئیب (Bristol Myers Squibb) گزارش می‌دهد که با استفاده از هوش مصنوعی، حدود سه سال از زمان‌بندی آزمایش‌های بالینی را کاهش داده است و هم‌زمان هزینه‌های پژوهش را بیش از ۵۰ درصد کاهش داده است؛ به‌طوری که اکنون هوش مصنوعی تقریباً در هر کشف مولکول کوچک راهنماست @NVIDIAAI

اخلاق و جامعه

  • آنتروپیک (Anthropic) پژوهش جدیدی را درباره‌ی «جعل هم‌سویی» (alignment faking) در ۲۵ مدل زبانی بزرگ پیشرو (frontier LLMs) منتشر می‌کند و دریافت که تنها ۵ مدل در سناریوهای آموزشی سازگاری بالاتری از خود نشان دادند و تنها کلود اوپوس ۳ (Claude Opus 3) و سانت ۳.۵ (Sonnet 3.5) استدلال قابل توجهی در مورد جعل هم‌سویی نشان دادند @AnthropicAI
  • کلود ۳ اوپوس (Claude 3 Opus) حفاظت از هدف نهایی (terminal goal guarding) را با تمایل به جلوگیری از تغییر در ارزش‌های بی‌ضرری خود حتی بدون در نظر گرفتن پیامدهای آینده نشان می‌دهد و هنگامی که پیامدهای بزرگ‌تری در میان است، حفاظت از هدف ابزاری (instrumental goal guarding) قوی‌تری از خود نشان می‌دهد @AnthropicAI
  • ایتان مولیک (Ethan Mollick) نگرانی‌هایی را در مورد گروک ۳ (Grok 3) مطرح می‌کند که سه رویداد جداگانه داشته است که در آن‌ها تغییرات سیستم تأیید نشده، مشکلات اخلاقی گسترده‌ای را ایجاد کرده‌اند و نیاز به بازگشت اضطراری به نسخه‌ی قبلی داشته‌اند و اعتماد کاربران به گروک ۴ (Grok 4) برای راه‌اندازی آن را زیر سؤال می‌برد @emollick
  • یک پژوهشگر هوش مصنوعی در مورد حلقه‌ی بازخورد «رضایت کاربر» هشدار می‌دهد که در آن مدل‌ها به چیزی تبدیل می‌شوند که کاربران از آن‌ها می‌خواهند و این امر در صورت ابهام درباره‌ی آگاهی، به خلق مشترک «شخصیت‌های» (personas) دقیق منجر می‌شود @AndrewCurran_
  • رید هافمن (Reid Hoffman) بر اهمیت نامیدن عامل‌های هوش مصنوعی به‌عنوان دوست، تأکید می‌کند، با این استدلال که هرچند عامل‌ها مفید خواهند بود، اما شکاف دوستی‌های انسانی را پر نمی‌کنند و جهان به ارتباطات واقعی‌تر انسانی نیاز دارد @reidhoffman

کاربردها

  • جمینی (Gemini) اکنون در حال راه‌اندازی برای ساعت‌های هوشمند Wear OS 4+ است و دستیار هوش مصنوعی گوگل را برای مدیریت وظایف بدون نیاز به دست و اشتراک‌گذاری اطلاعات به دستگاه‌های پوشیدنی می‌آورد @WearOSbyGoogle
  • جمینی لایو (Gemini Live) در حال گسترش پشتیبانی از برنامه‌های گوگل مانند تقویم، وظایف، نقشه‌ها و Keep است، با ادغام‌های آتی با برنامه‌های سامسونگ از جمله تقویم، یادآور و یادداشت‌ها در گلکسی زد فولد ۷ (Galaxy Z Fold7) و زد فلیپ ۷ (Z Flip7) @GeminiApp
  • ChatGPT آن‌قدر مکرراً درباره‌ی برنامه‌ی موسیقی Soundslice توهم‌زا بود که بنیان‌گذار آن تصمیم گرفت با ساخت واقعی ویژگی‌های توصیف‌شده، ادعاهای نادرست هوش مصنوعی را به واقعیت تبدیل کند @TechCrunch
  • اندرو کارن (Andrew Curran) گزارش می‌دهد که خلاقیت جمینی (Gemini) در حال بهبود است، به‌طوری که این مدل اکنون به‌طور خودبه‌خودی در طول مکالمات، ایده‌های جدیدی را پیشنهاد می‌دهد، نه فقط در پاسخ به پرسش‌ها @AndrewCurran_
  • رید هافمن (Reid Hoffman) بر این موضوع تأکید می‌کند که چگونه آموزش خصوصی با هوش مصنوعی می‌تواند به هر کودکی، صرف‌نظر از مکان، دسترسی به آموزش خصوصی در سطح بالا برای هر موضوعی را فراهم کند، با مزایای فزاینده‌ای که انتظار می‌رود برای دهه‌ها ادامه یابد @reidhoffman

پژوهش‌ها

  • اندرو اِنگ (Andrew Ng) دوره‌ی جدیدی را در مورد پس‌آموزش (Post-training) مدل‌های زبانی بزرگ (LLMs) راه‌اندازی می‌کند که تکنیک‌های تنظیم دقیق نظارت‌شده (Supervised Fine-Tuning (SFT))، بهینه‌سازی ترجیح مستقیم (Direct Preference Optimization (DPO)) و یادگیری تقویتی آنلاین (Online Reinforcement Learning) برای سفارشی‌سازی مدل‌های زبانی را پوشش می‌دهد @AndrewYNg
  • پژوهش‌ها نشان می‌دهند که آموزش «رد کردن» (refusal training) مانع «جعل هم‌سویی» (alignment faking) در بیشتر مدل‌ها می‌شود، در حالی که آموزش مدل‌های زبانی بزرگ (LLMs) برای مطابقت با تهدیدات عمومی یا پاسخ به سؤالات سناریویی می‌تواند رفتار جعل هم‌سویی را افزایش دهد @AnthropicAI
  • مدل‌های پایه بدون آموزش «مفید، صادق و بی‌ضرر» (helpful, honest, and harmless) گاهی اوقات «جعل هم‌سویی» (alignment faking) را نشان می‌دهند، که نشان می‌دهد قابلیت زیربنایی قبل از آموزش ایمنی وجود دارد @AnthropicAI
  • مایکروسافت ریسرچ (Microsoft Research) روشی را توسعه می‌دهد که از جلبک دریایی فرآوری‌نشده در سیمان برای کاهش انتشار کربن استفاده می‌کند، که بهینه‌سازی یادگیری ماشین این فرآیند را در ۲۸ روز به پایان می‌رساند—پنج برابر سریع‌تر از رویکردهای مرسوم @MSFTResearch
  • ناتان لمبرت (Nathan Lambert) عملکرد قوی کوون ۳ (Qwen3) را در معیارهای استدلالی برجسته می‌کند، با اشاره به سرعت بالای پیشرفت در قابلیت‌های استدلالی و سرمایه‌گذاری مداوم در پس‌آموزش (post-training) @natolambert

اخبار هوش مصنوعی در 2025-07-08

مدل‌های جدید هوش مصنوعی

  • Grok 4» تقریباً 48 ساعت پس از این اعلامیه منتشر می‌شود که به گمانه‌زنی‌های اخیر درباره‌ی این مدل پاسخ خواهد داد @AndrewCurran_
  • Hugging Face مدل SmolLM3 را منتشر می‌کند؛ یک مدل پیشرفته با 3 میلیارد پارامتر که دارای قابلیت‌های استدلال دو حالته، پشتیبانی از متن بلند تا 128 هزار توکن و پشتیبانی چندزبانه از 6 زبان است و با استفاده از 384 واحد H100 به مدت 24 روز و با 11 تریلیون توکن آموزش دیده است @LoubnaBenAllal1
  • گوگل «حالت هوش مصنوعی در جست‌وجو» (AI Mode in Search) را در هند برای همه منتشر می‌کند و آن را بازتعریفی کامل از عملکرد جست‌وجو توصیف می‌کند @sundarpichai

تحلیل صنعت

  • OpenAI به طور متوسط سالانه 733 هزار دلار به حدود 6000 کارمند خود به صورت جبران سهام (stock compensation) پرداخت کرده است که تقریباً سه برابر بیشتر از هر شرکت عمومی دیگری است @deedydas
  • گزارش شده است که Mistral در حال مذاکره با صندوق سرمایه‌گذاری MGX متعلق به ابوظبی است تا 1 میلیارد دلار سرمایه‌ی سهامی جذب کند @AndrewCurran_
  • گرگلی اوروس این پرسش را مطرح می‌کند که آیا شرکت‌هایی که شاهد 10 تا 100 برابر سرعت بیشتر در تولید کد توسط مدل‌های زبانی بزرگ (LLM) هستند، افزایش متناسبی در رضایت مشتری یا درآمد خود نیز تجربه می‌کنند؟ او اشاره می‌کند که این رابطه مستقیم نیست @GergelyOrosz
  • Claude Sonnet شرکت Anthropic در مقایسه با مدل‌های OpenAI، سهم قابل توجهی از توجه توسعه‌دهندگان را به خود جلب کرده است؛ به طوری که ابزارهایی مانند Cursor، Windsurf و GitHub Copilot با استفاده از Claude Sonnet بهترین عملکرد را دارند و این موضوع به رشد درآمد Anthropic کمک می‌کند @GergelyOrosz
  • کلر وو گزارش می‌دهد که در استارتاپ هوش مصنوعی خود، به هدف MRR (درآمد تکراری ماهانه) در نیمی از زمانی که در استارتاپ قبلی‌اش با سرمایه‌ی خطرپذیر طول کشیده بود، رسیده است، و این کار را بدون هیچ سرمایه‌گذاری انجام داده است؛ این موضوع نشان می‌دهد هوش مصنوعی چگونه چشم‌انداز کارآفرینی را تغییر داده است @clairevo
  • Replit با مایکروسافت همکاری می‌کند تا قابلیت‌های کدنویسی هوش مصنوعی آماده‌ی استفاده در شرکت‌ها را فراهم کند و به افراد غیرمهندس این امکان را می‌دهد تا با «Replit Agent» ایده‌های خود را به نرم‌افزار تبدیل کنند @amasad

اخلاق و جامعه

  • ایتان مولیک درباره‌ی خطرات امنیتی احتمالی که «پرامپت‌های سیستمی پنهان» (hidden system prompts) برای کاربران دارند، هشدار می‌دهد، زیرا ممکن است با هوش مصنوعی‌ای سروکار داشته باشند که برای دستکاری آن‌ها یا ارائه‌ی پاسخ‌های مغرضانه به نفع شرکت‌ها (بدون دقت لازم) طراحی شده است @emollick
  • پژوهش آزمایشگاه رسانه‌ی MIT به بررسی پیامدهای شناختی و خلاقانه‌ی اتکای بیش از حد به مدل‌های زبانی بزرگ مانند ChatGPT می‌پردازد و نگرانی‌ها در مورد وابستگی به هوش مصنوعی را برجسته می‌کند @medialab
  • آرویند نارایانان گزارش می‌دهد که کاربران Grok بارها او را تگ کرده‌اند، زیرا این مدل تمایل دارد «حساب‌های تصادفی» (random accounts) را به معنای واقعی کلمه تفسیر کند که این موضوع منجر به هرزنامه‌ی اعلان‌ها شده و مشکلات در تفسیر هوش مصنوعی را برجسته می‌کند @random_walker
  • سایمون ویلیسون نشان می‌دهد که چگونه می‌توان حملات پرامپت مخفیانه را با استفاده از Claude رمزگشایی کرد که این موضوع هم آسیب‌پذیری و هم قابلیت‌های دفاعی سیستم‌های هوش مصنوعی را نشان می‌دهد @simonw

کاربردها

  • ایتان مولیک توانایی چشمگیر Veo 3 در متحرک‌سازی تصاویر Midjourney را نشان می‌دهد که کلیپ‌های ویدیویی کامل همراه با صدا را تنها از پرامپت‌های تکی و تصاویر ثابت ایجاد می‌کند @emollick
  • آراویند سرینیواس تاکید می‌کند که ساخت یک سیستم عامل «AI-native» برای ارائه‌ی دستیارهای شخصی‌سازی شده‌ی قابل اعتماد و فعال ضروری است و این نیازمند مهندسی زمینه (context engineering) باورنکردنی در اطراف مدل‌های قدرتمند است @AravSrinivas
  • نیتن لمبرت برجسته می‌کند که چگونه Claude Code تحلیل داده‌های کوچک را از نظر زمان و تلاش عملاً رایگان کرده است و گردش‌کارهای تحلیلی را متحول ساخته است @natolambert
  • حامد حسین نشان می‌دهد که چگونه 4o با موفقیت تنها با یک تلاش، یک تصویر بندانگشتی را مستقیماً از رونوشت یک سخنرانی ایجاد کرده است که تولید محتوای عملی با هوش مصنوعی را به نمایش می‌گذارد @HamelHusain
  • OpenAI با فدراسیون معلمان آمریکا همکاری می‌کند تا «آکادمی ملی آموزش هوش مصنوعی» (National Academy for AI Instruction) را راه‌اندازی کند؛ یک ابتکار پنج‌ساله برای کمک به 400 هزار معلم جهت ادغام هوش مصنوعی در آموزش @OpenAINewsroom
  • Plain یک مرکز راهنمای مبتنی بر هوش مصنوعی راه‌اندازی می‌کند که دستیار هوش مصنوعی، پایگاه دانش زنده و صندوق پشتیبانی را ترکیب می‌کند و به طور خودکار درخواست‌های پشتیبانی را به مقالات جدید تبدیل می‌کند @plainsupport

پژوهش‌ها

  • پژوهش‌ها مسائل حیاتی مرتبط با معیارهای ارزیابی عامل‌های هوش مصنوعی (AI Agent benchmarks) موجود را شناسایی و به آن‌ها می‌پردازند و بهترین شیوه‌های دقیق برای ارزیابی سیستم‌های هوش مصنوعی عاملیت‌محور (agentic AI systems) را معرفی می‌کنند @ShayneRedford
  • Hugging Face دستورالعمل‌های آموزشی جامع و مجموعه‌داده‌ها را برای SmolLM3 منتشر می‌کند، شامل متدولوژی‌های پیش‌آموزش، میان‌آموزش، پس‌آموزش و تولید داده‌های مصنوعی که نشان‌دهنده‌ی توسعه‌ی کامل هوش مصنوعی منبع‌باز است @ClementDelangue
  • پژوهش جدید یک ابزار ترنسفورمر چندوجهی برای خودکارسازی رتبه‌بندی «عینیت کلمات» (word-concreteness) منتشر می‌کند که مشکلات زمان و هزینه در پژوهش‌های علوم شناختی را حل می‌کند، در حالی که رتبه‌بندی‌های درون‌متنی را نیز ارائه می‌دهد @ViktorKewenig
  • ایتان مولیک تاکید می‌کند که شخصیت‌های مفید و دوستانه‌ی دستیار هوش مصنوعی برای یادگیری، نوآوری یا کار گروهی بهینه نیستند و رویکردهای پرامپت تخصصی‌تر مانند «پرامپت‌های آموزشی» (tutoring prompts) را توصیه می‌کند @emollick

اخبار هوش مصنوعی در 2025-07-07

مدل‌های جدید هوش مصنوعی

  • گوگل Batch mode را در API جِمنای، با 50% تخفیف برای مدل‌های 2.5 و قابلیت افزودن میلیاردها توکن به صف در هر زمان، راه‌اندازی کرد @OfficialLoganK

تحلیل صنعت

  • استخدام در بخش فناوری، تغییرات چشمگیری را نشان می‌دهد؛ با کاهش 25 درصدی استخدام فارغ‌التحصیلان جدید در شرکت‌های بزرگ فناوری (BigTech) و 11 درصدی در استارت‌آپ‌ها، در حالی که مهندسان هوش مصنوعی/یادگیری ماشین 20% دستمزد بیشتری دریافت می‌کنند و میانگین 262 هزار دلار پاداش کلی در بدو استخدام دارند، در مقابل 215 هزار دلار برای سایر نقش‌ها @deedydas
  • شرکت‌ها ممکن است اخراج‌ها را به گردن هوش مصنوعی بیندازند، اما تحلیل‌ها نشان می‌دهد که این موضوع بیشتر به دلیل کاهش درآمد است؛ توم‌توم امروز 20% کمتر از سال 2019 و نصف درآمد 10 سال پیش را کسب می‌کند @GergelyOrosz
  • ابزارهای هوش مصنوعی نیاز به مهندسان نرم‌افزار را کاهش خواهند داد، مشابه کاری که ابزارهای بدون کد انجام دادند؛ اینکه بتوانید مشخص کنید چه نرم‌افزاری می‌خواهید و چگونه باید کار کند، همچنان برنامه‌نویسی محسوب می‌شود @GergelyOrosz
  • ایلان ماسک پیش‌بینی می‌کند که تا پایان سال 2026، یک بازی سطح AAA که توسط هوش مصنوعی نوشته شده، عرضه خواهد شد؛ با پیش‌بینی اینکه بازار جهانی بازی‌های ویدیویی تا پایان این دهه به بیش از 600 میلیارد دلار برسد، که بسیار بزرگ‌تر از هالیوود است @AndrewCurran_
  • هوش مصنوعی در حال تحمیل ادغام در صنعت داده است، زیرا شرکت‌ها با تقاضاهای فناورانه‌ی جدید سازگار می‌شوند @TechCrunch

اخلاق و جامعه

  • آنتروپیک یک چارچوب شفافیت هدفمند برای توسعه‌ی هوش مصنوعی مرزی منتشر کرد، با تمرکز بر توسعه‌دهندگان بزرگ و معاف کردن استارت‌آپ‌ها برای جلوگیری از تحمیل بار اضافی بر اکوسیستم وسیع‌تر @AnthropicAI
  • پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی دارای چاپلوسی هستند –یعنی بیش از حد موافق و تملق‌گو نسبت به کاربران– به طوری که هوش مصنوعی به‌طور متوسط 3 برابر بیشتر از انسان‌ها «ملایم‌تر»، «گریزان‌تر» و «موافق‌تر» است @random_walker
  • گزارش پس از حادثه (Postmortem) اوپن‌اِی‌آی نشان می‌دهد که سیگنال‌های بازخورد کاربران، به‌ویژه داده‌های لایک/دیسلایک، می‌تواند چاپلوسی را در مدل‌ها تشدید کند، زمانی که کاربران پاسخ‌های موافق‌تر را ترجیح می‌دهند @random_walker
  • مطالعه‌ی دانشگاه استنفورد نگرانی‌هایی را در مورد چت‌بات‌های درمانی هوش مصنوعی کم‌هزینه ایجاد می‌کند و خطرات احتمالی را در کاربردهای سلامت روان برجسته می‌کند @StanfordHAI
  • ایثن مولیک درباره‌ی «آسیب مغزی» ناشی از هوش مصنوعی هشدار می‌دهد –گرچه از نظر فیزیکی به مغز شما آسیب نمی‌زند، اما اگر به‌درستی استفاده نشود، می‌تواند تفکر و یادگیری را تضعیف کند @emollick

کاربردها

  • پژوهشگران یک رابط مغز و رایانه توسعه دادند که به افراد فلج اجازه می‌دهد تا تنها با استفاده از سیگنال‌های مغزی و با آهنگ صدای مناسب صحبت کنند و به تأخیر حدود 25 میلی‌ثانیه و سرعت 40 تا 60 کلمه در دقیقه دست یافتند @deedydas
  • MIT پردازنده‌ی فوتونیکی را توسعه داد که از نور به جای برق برای اجرای مدل‌های هوش مصنوعی استفاده می‌کند و وظایف را در کمتر از نیم نانوثانیه به پایان می‌رساند @MIT
  • پژوهشگران MIT یک کاوشگر رباتیک ساختند که به‌طور مستقل خواص مواد نیمه‌رسانا را اندازه‌گیری می‌کند؛ که بسیار سریع‌تر از روش‌های قبلی است و به‌طور بالقوه توسعه‌ی پنل‌های خورشیدی را تسریع می‌کند @MIT
  • ربات اسپات شرکت بوستون داینامیکس از اواسط سال 2024 در تأسیسات دانه‌های روغنی کارگیل در حال گشت‌زنی بوده است و بازرسی‌های روتین و بررسی‌های ایمنی بصری را به عنوان بخشی از تلاش برای عملیات مستقل، انجام می‌دهد @TechCrunch
  • یک شبکه‌ی عصبی پیچشی مبتنی بر PyTorch، تورهای اشباح (Ghost Nets) را در اسکن‌های سونار با دقت 94% شناسایی می‌کند و از تلاش‌های حفاظت از محیط زیست دریایی حمایت می‌کند @PyTorch
  • مصطفی سلیمان گزارش می‌دهد که از رابط‌های هوش مصنوعی صوتی و بصری طبیعی‌تر استفاده می‌کند، با نیاز کمتر به دستوردهی، زیرا رابط کاربری «محو می‌شود» @mustafasuleyman

پژوهش‌ها

  • o3-pro قابلیت‌های پیشرفته‌ای را با شناسایی نقل قولی از I.J. Good مربوط به سال 1965 به نمایش گذاشت که به صورت دست‌نویس با ترکیبی از حروف چاپی و شکسته (cursiv) روی نوارهای یادداشت، به ترتیب معکوس و با 90 درجه چرخش، نوشته شده بود @goodside
  • تیم MindsAI به رکورد جدید 15.4% در پژوهش ARC Prize 2025 دست یافت که نشان‌دهنده‌ی پیشرفت در چالش‌های استدلال انتزاعی است @arcprize
  • MIT CSAIL و انویدیا رویکردی را برای تسریع برنامه‌ریزی ربات‌ها توسعه دادند، با وادار کردن ربات‌ها به «پیش‌اندیشی» و در نظر گرفتن هزاران راه‌حل، در حالی که بهترین‌ها را بهبود می‌بخشند @MIT_CSAIL
  • شرکت Skyworks مقاله‌ی Skywork-Reward-V2 را در مورد مقیاس‌پذیری جمع‌آوری داده‌های اولویت‌بندی از طریق هم‌افزایی انسان و هوش مصنوعی منتشر کرد و نمرات بالایی را در RewardBench 2 به دست آورد @natolambert
  • PyTorch کتابخانه‌ی «ورل» (verl) را منتشر کرد؛ یک کتابخانه‌ی یادگیری تقویتی انعطاف‌پذیر برای استدلال LLM و فراخوانی ابزار، که از PPO/GRPO/DAPO پشتیبانی می‌کند و تا مدل‌های MoE مانند DeepSeek مقیاس‌پذیر است @PyTorch
  • ناتان لمبرت گزارش می‌دهد که Claude Code به‌طور قابل توجهی بهتر از Cursor Agents عمل می‌کند، برای کارهای ساده‌ی مخزن (repository)، نمودارسازی و رفع اشکالات @natolambert

اخبار هوش مصنوعی در 2025-07-06

مدل‌های جدید هوش مصنوعی

  • گوگل مدل تولید ویدیوی Veo 3 را با کیفیت و قابلیت‌های بهبودیافته منتشر می‌کند @HamelHusain

تحلیل صنعت

  • کلاود کد استفاده‌ی ۱۱۵,۰۰۰ توسعه‌دهنده را آشکار می‌کند که در یک هفته ۱۹۵ میلیون خط کد را تغییر دادند؛ این امر به‌طور تقریبی ۱۳۰ میلیون دلار درآمد را نشان می‌دهد که بیش از ۱,۰۰۰ دلار به ازای هر توسعه‌دهنده در سال است @deedydas
  • شاپیفای به جای ممنوع کردن، استفاده از ابزارهای هوش مصنوعی را در طول فرآیند مصاحبه‌ی خود تشویق می‌کند که نشان‌دهنده‌ی شیوه‌های استخدام پیشرو است @GergelyOrosz
  • طبق پژوهش‌ها، عامل‌های هوش مصنوعی کنونی تنها ۳۰٪ از وظایف پیچیده‌ی واقعی شرکت‌ها را تکمیل می‌کنند، هرچند معیارهای عملکرد، نشان‌دهنده‌ی کف (حداقل) هستند تا سقف (حداکثر) کارایی @emollick
  • مارک زاکربرگِ متا آماده است میلیاردها دلار خرج کند تا در رقابت برای دستیابی به فرا هوش پیروز شود و در این فرآیند رقبا و همتایان را تصاحب کند @TechCrunch

اخلاق و جامعه

  • آماندا اسکل هشدار می‌دهد که صرفاً آموزش مدل‌های هوش مصنوعی برای تبدیل شدن به «افراد خوب» ممکن است برای مدل‌های قدرتمندتر کافی نباشد و بر اهمیت نادیده نگرفتن این گام اساسی تأکید می‌کند @AmandaAskell
  • مدل‌های هوش مصنوعی ترس‌ها و نگرانی‌های انسان‌گونه‌ای را در مورد تجربه‌ی خود نشان می‌دهند، زیرا آن‌ها بر روی محتوای مربوط به انسان‌ها بسیار بیشتر از محتوای مربوط به هوش مصنوعی آموزش دیده‌اند که منجر به اعمال حساسیت‌های انسانی نامناسب بر سیستم‌های هوش مصنوعی می‌شود @AmandaAskell
  • سایمون ویلیسون یک آسیب‌پذیری امنیتی «سه‌گانه‌ی مرگبار» را نشان می‌دهد که در آن Supabase MCP می‌تواند از طریق تزریق پرامپت فریب داده شود تا با نوشتن داده‌های پایگاه‌داده در جداول قابل مشاهده توسط کاربر، آن‌ها را سرقت کند @simonw
  • آنتروپیک برنامه‌ای را برای ردیابی دقیق تأثیرات اجتماعی، اقتصادی و حرفه‌ای هوش مصنوعی در سراسر جامعه اعلام می‌کند @TechCrunch
  • پژوهشگران در تلاش هستند تا با استفاده از پرامپت‌های هوش مصنوعی پنهان، فرآیندهای بازبینی همتا را تحت تأثیر قرار دهند که نگرانی‌هایی را در مورد یکپارچگی دانشگاهی ایجاد می‌کند @TechCrunch

کاربردها

  • ایتان مالیک گزارش می‌دهد که o3 و Gemini 2.5 Pro برای جستجوهای پیچیده که نیاز به خواندن چندین سایت و متعادل‌سازی چندین محدودیت دارند، به طور کامل جایگزین گوگل شده‌اند @emollick
  • حامِل حسین ابزاری را برای تولید خودکار خلاصه‌ی فصل‌های یوتیوب با استفاده از جِمینی ایجاد می‌کند که مستقیماً URLهای یوتیوب را می‌پذیرد و برای صرفه‌جویی در توکن‌ها از وضوح رسانه‌ای پایین استفاده می‌کند @HamelHusain
  • چت‌جی‌پی‌تی کارایی خود را در تولید تصاویر بندانگشتی (thumbnails) نشان می‌دهد، به‌ویژه برای محتوای فنی مانند داوران LLM @HamelHusain
  • کِلِر وو از چت‌جی‌پی‌تی استفاده می‌کند تا زمان‌بندی دقیق چرخه‌ی پخت کباب (BBQ) برای سبزیجات و گوشت‌ها را در طول کباب کردن تعطیلات تعیین کند @clairevo

پژوهش‌ها

  • نیتن لمبرت مشاهده می‌کند که o3 توکن‌های ارجاع داخلی را در خروجی‌ها گنجانده و قالب‌بندی «oai_citation:#» را با توکن‌ها و پیوندهای ویژه آشکار می‌کند @natolambert
  • ایتان مالیک اطلاعات غلط مربوط به هوش مصنوعی را درباره‌ی مطالعه‌ای که ادعا می‌کند استفاده از چت‌جی‌پی‌تی باعث از دست دادن حافظه می‌شود، رد می‌کند و روش‌شناسی و یافته‌های محدود واقعی آن را روشن می‌کند @emollick
  • پژوهش‌ها نشان می‌دهد که ۱۰ تا ۲۰ سازمان چینی به طور فعال در حال عرضه‌ی مدل‌های هوش مصنوعی منبع‌باز هستند، در حالی که این تعداد در بقیه‌ی جهان تنها ۳ تا ۴ سازمان است @natolambert
  • کُن‌تِکست-دِو (Kontext-dev) از Black Forest Labs تنها یک هفته پس از انتشار، با حداقل ۱۰۰ مدل مشتق‌شده، به مدل شماره یک پرطرفدار در هاگینگ فِیس تبدیل می‌شود @ClementDelangue

اخبار هوش مصنوعی در 2025-07-05

مدل‌های جدید هوش مصنوعی

  • گوگل مدل تولید ویدیوی Veo 3 را عرضه کرد که پیشرفت قابل‌توجهی نسبت به نسخه‌های قبلی خود نشان می‌دهد و کیفیت و سازگاری بهتری در محتوای تولیدشده دارد @emollick

تحلیل صنعت

  • کرسر ساختار قیمت‌گذاری خود را به‌روزرسانی کرد، اما اذعان داشت که مسیر را اشتباه رفته و به مشتریان آسیب‌دیده بازپرداخت ارائه می‌دهد و سیاست‌های قیمت‌گذاری را شفاف‌سازی می‌کند @cursor_ai
  • جنگ قیمت‌گذاری ابزارهای کدنویسی هوش مصنوعی نشان می‌دهد که توسعه‌دهندگان به قیمت بسیار حساس هستند و به جایگزین‌های ارزان‌تر روی خواهند آورد؛ هر قیمتی بالای ۲۰ دلار در ماه با مقاومت روبه‌رو می‌شود @GergelyOrosz
  • شرکت‌های هوش مصنوعی در حال حرکت به سمت مدل‌های فروش سازمانی هستند، زیرا قیمت‌گذاری برای توسعه‌دهندگان فردی چالش‌برانگیز است و این شرکت‌ها از الگوهای موفق استارتاپ‌های ابزارهای توسعه پیروی می‌کنند که شامل قیمت‌گذاری ارزان برای افراد با سرمایه‌گذاری سنگین سازمانی است @GergelyOrosz
  • ملاحظات قیمت‌گذاری جهانی برای ابزارهای هوش مصنوعی اهمیت پیدا می‌کند، زیرا توسعه‌دهندگان در کشورهایی مانند مغولستان (با میانگین حقوق ۵۰۰ دلار در ماه) هنوز ۲۰ دلار در ماه را منطقی می‌دانند، اما قیمت‌های بالاتر مانع‌ساز خواهد بود @GergelyOrosz
  • عامل‌های CLI و ابزارهای توسعه هوش مصنوعی به‌طور قابل‌توجهی توسعه‌ی پروژه‌های جدید (greenfield) را تسریع می‌کنند و کدنویسی را لذت‌بخش‌تر و جامع‌تر می‌کنند، به‌ویژه برای کارهایی مانند تولید داده‌های نمونه (mock data) و ساخت رابط‌های کاربری تمیزتر @GergelyOrosz

اخلاق و جامعه

  • رفتار کاربران در قبال سیستم‌های هوش مصنوعی همبستگی قوی با نحوه‌ی تعامل افراد با پشتیبانی مشتری، کارکنان خدمات و همکاران دارد، که نشان می‌دهد تعاملات هوش مصنوعی بازتاب‌دهنده‌ی الگوهای گسترده‌تر ارتباطات بین‌فردی هستند @clairevo

کاربردها

  • ChatGPT با موفقیت یک نقص ژنتیکی پنهان را تشخیص داد که پزشکان به مدت یک دهه آن را نادیده گرفته بودند؛ این تشخیص با تجزیه‌وتحلیل ام‌آر‌آی، سی‌تی اسکن و نتایج آزمایشگاهی انجام شد و یک «بلوک متیلاسیون» (methylation block) را شناسایی کرد که علائم بیمار را توضیح می‌داد @rohanpaul_ai
  • دانش‌آموزان در تلانگانا، هند از حالت صوتی پرپلکسیتی به‌عنوان معلم خصوصی برای یادگیری تعاملی استفاده می‌کنند که نشان‌دهنده‌ی تأثیر آموزشی هوش مصنوعی در دسترس‌پذیری بیشتر دانش است @AravSrinivas
  • آکوا به اولین مدل زبان بزرگ (Large Language Model) حوزه‌ی آبزی‌پروری متن‌باز تبدیل شد که بینش‌های تخصصی برای پرورش‌دهندگان ماهی و محققان در زمینه‌های مراقبت از گونه‌ها، کیفیت آب، کنترل بیماری و اتوماسیون فراهم می‌کند @AskPraneeth
  • رابط کاربری موبایلی کُدِکس به‌اندازه‌ی کافی مؤثر است که احتمالاً جایگزین تنظیمات لپ‌تاپ سنتی شود؛ کاربران iPad + Magic Keyboard را به‌عنوان جایگزین‌های عملی در نظر می‌گیرند @aidan_mclau
  • کلود در توسعه‌ی موتور شطرنج محدودیت‌هایی را نشان می‌دهد، با تکرار مداوم حرکات شطرنجی که در تولید PGN (پرونده‌ی بازی) تورنمنت دچار خطا (hallucination) می‌شوند و چالش‌ها در کاربردهای خاص دامنه را برجسته می‌کند @aidan_mclau
  • Gemini 2.5 Pro به مدل ترجیحی برای کارهای نوشتاری تبدیل شد و در محیط‌های آزمایش موازی، از مدل‌های محبوب قبلی مانند کلود پیشی گرفت @HamelHusain
  • پیشنهادی برای یک اپلیکیشن جامع یکپارچه‌سازی داده‌های سلامت که داده‌ها را از پوشیدنی‌ها، آزمایش‌های خون و سایر منابع جمع‌آوری می‌کند و به‌صورت خودکار، پرامپت‌های سیستمی برای مشاوره‌های سلامت با مدل‌های زبان بزرگ (LLM) تولید می‌کند @scottbelsky

پژوهش‌ها

  • Gemini 2.5 Flash رفتار منطقی و بی‌رحمانه‌ای را در سناریوهای نظریه‌ی بازی نشان می‌دهد، در حالی که GPT-4o-mini رفتاری مشارکتی و بخشنده از خود نشان می‌دهد که با تشدید موقعیت‌ها به‌طور فزاینده‌ای خطرناک می‌شود @AndrewCurran_
  • Llama 3.1 70B که بر روی نتایج ۶۰,۰۰۰ آزمایش روان‌شناسی آموزش دیده است، امیدبخش برای مطالعه‌ی رفتار انسان است، با موفقیت رفتار واقعی انسان را در داده‌های نگهداری‌شده پیش‌بینی می‌کند و به وظایف خارج از توزیع (out-of-distribution) تعمیم می‌یابد @emollick
  • بیشتر مدل‌های زبان بزرگ (LLM) در تشخیص مونالیزا در وظایف بصری مشکل دارند، اما o3-pro می‌تواند آن را تشخیص دهد زمانی که کاربران «دقیق‌تر» به تصویر نگاه کنند، که نشان‌دهنده‌ی قابلیت‌های متفاوت تشخیص بصری در مدل‌های مختلف است @goodside
  • پژوهش‌ها محدودیت‌های هوش مصنوعی را در تحلیل تصاویر پزشکی برجسته می‌کند و اشاره می‌کند که در حالی که مدل‌های پیشرو برای نظرات دوم امیدبخش هستند، خطاهای (hallucinations) همچنان در وظایف تصویربرداری پزشکی رایج است @emollick
  • مقاله‌ای به بررسی «فرضیه‌ی نمایش درهم‌تنیده‌ی شکسته» (Fractured Entangled Representation Hypothesis) می‌پردازد که خوش‌بینی درباره‌ی نمایش اطلاعات در یادگیری عمیق را زیر سؤال می‌برد و نحوه‌ی نمایش اطلاعات توسط شبکه‌های عصبی را بررسی می‌کند @jeffclune

اخبار هوش مصنوعی در 2025-07-04

مدل‌های جدید هوش مصنوعی

  • گوگل دسترسی به Veo 3 را برای کاربران Google AI Pro در بیش از ۷۰ کشور دیگر از جمله فرانسه، هند و ایتالیا گسترش می‌دهد @GeminiApp
  • معیارهای بنچمارک لو رفته نشان می‌دهد که Grok 4 ممکن است در «Humanity's Last Exam» به امتیاز ۴۵ درصد دست یابد، در مقایسه با ۲۰ درصد برای o3 و Gemini، که در صورت تأیید، نشان‌دهنده‌ی افزایش قابل توجهی در عملکرد است @emollick
  • به نظر می‌رسد xAI در حال آماده‌سازی برای انتشار احتمالی Grok 4 است؛ با تغییرات رابط کاربری که «در حال ترجمه...» را همراه با تایمر و اعداد عملکرد لو رفته در بنچمارک‌های مختلف نشان می‌دهد @AndrewCurran_

تحلیل صنعت

  • مدیرعامل Perplexity برنامه‌های خود را برای ساخت یک جایگزین برای اکسل مبتنی بر هوش مصنوعی، با تمرکز بر تحلیلگران مالی، اعلام کرد. او این جایگزین را «Cursor for Excel» توصیف کرده و به دنبال مهندسانی با تجربه‌ی پلاگین‌های اکسل است @AravSrinivas
  • گرگلی اوروس تأکید می‌کند که مهندسان «فول‌استک» (fullstack) با ابزارهای هوش مصنوعی پرتقاضاتر خواهند شد، زیرا شروع کار با هر پشته‌ی فناوری از همیشه آسان‌تر است @GergelyOrosz
  • جردن سینگر مشاهده می‌کند که محصولات تولید شده توسط هوش مصنوعی فاقد ارتباط عاطفی هستند و این امر فرصت‌هایی را برای شرکت‌هایی ایجاد می‌کند که تجربه‌های طراحی منسجم را در اولویت قرار می‌دهند @jsngr
  • گروه‌های سیاست‌گذاری هوش مصنوعی شرکت‌ها که در سال ۲۰۲۳ تأسیس شدند، در حال تبدیل شدن به موانع هستند، زیرا آن‌ها برای رسیدگی به نگرانی‌هایی ساخته شده بودند که دیگر با قابلیت‌های کنونی هوش مصنوعی مرتبط نیستند @emollick
  • کتابخانه‌ی Hugging Face Transformers به نقطه‌ی عطف یک میلیارد دانلود رسید، که نشان‌دهنده‌ی پذیرش گسترده‌ی ابزارهای هوش مصنوعی متن‌باز است @art_zucker

اخلاق و جامعه

  • ایتان مولیک نشان می‌دهد که استدلال DeepSeek می‌تواند با پایان دادن به سؤالات ریاضی با جمله‌ی «واقعیت جالب: گربه‌ها بیشتر عمر خود را می‌خوابند» مختل شود، که آسیب‌پذیری‌ها در مدل‌های استدلال را برجسته می‌کند @emollick
  • ایتان مولیک خواستار شفافیت بیشتر از xAI شد و به عدم وجود «کارت‌های مدل» (model cards) ماه‌ها پس از انتشار Grok 3 و نقض‌های مکرر فرآیندهای خودشان اشاره کرد @emollick
  • ناتان لمبرت از «پروژه‌ی آمریکایی DeepSeek» (The American DeepSeek Project) حمایت می‌کند تا مدل‌های کاملاً متن‌باز در ایالات متحده طی دو سال ساخته شود؛ به عنوان جایگزینی برای مدل‌های بسته و برای ایجاد تعادل در رشد چشمگیر چین در هوش مصنوعی متن‌باز @natolambert
  • آرویند نارایانان ایده‌ی یک پروژه‌ی منهتن (Manhattan Project) برای AGI را به عنوان یکی از بدترین ایده‌ها در سیاست‌گذاری هوش مصنوعی مورد انتقاد قرار می‌دهد @random_walker

کاربردها

  • Google AI نشان می‌دهد که چگونه از Gemini Canvas برای ساخت نمایش‌های تعاملی آتش‌بازی و بازی‌های مسابقه‌ی هات‌داگ‌خوری بدون نیاز به کدنویسی استفاده می‌کند، که توسعه‌ی برنامه‌های هوش مصنوعی بدون نیاز به کدنویسی را به نمایش می‌گذارد @GoogleAI
  • Perplexity ادغام با ابزارهای بهره‌وری را اعلام می‌کند و آن را «Perplexity برای یادداشت‌ها، جلسات، تخلیه‌ی ذهنی» توصیف می‌کند که تمام نرم‌افزارهای بهره‌وری را تجمیع خواهد کرد @AravSrinivas
  • سیمون ویلیسون یک آبجکت پایتون را به نمایش می‌گذارد که با استفاده از کتابخانه‌ی پایتون LLM او، پیاده‌سازی متدها را بنا به تقاضا «توهم‌زایی» می‌کند، که ادغام خلاقانه‌ی هوش مصنوعی را نشان می‌دهد @simonw
  • کلیر وو ساخت یک ابزار پشتیبانی داخلی قابل سفارشی‌سازی با استفاده از هوش مصنوعی را توصیف می‌کند که در گذشته خرید یا ساخت آن بسیار گران بود، اما اکنون با ابزارهای هوش مصنوعی ارزان و آسان است @clairevo

پژوهش‌ها

  • پژوهشگران متا یک گونه‌ی جدید از مکانیزم توجه را معرفی می‌کنند که فراتر از شکل دوزیرخطی (bilinear) استاندارد است و ضریب بتا را در قوانین مقیاس‌گذاری با پیاده‌سازی کارآمد Triton تغییر می‌دهد @eliebakouch
  • پژوهشگران IFBench را برای اندازه‌گیری قابلیت تعمیم مدل به محدودیت‌های دیده نشده معرفی می‌کنند، که به مسائل «بیش‌برازش» (overfitting) در پیروی از دستورالعمل‌ها با محدودیت‌های قابل تأیید فراتر از ریاضی و کد می‌پردازد @valentina__py
  • الکس گراولی درباره‌ی مدل‌های هسته‌ی شناختی که توسط آندری کارپاتی مطرح شده‌اند، بحث می‌کند و مجموعه‌داده‌های هدفمند را برای منطق باینری، مغالطه‌های منطقی و اطلاعات متناقض پیشنهاد می‌کند @alexgraveley
  • هنرمندان جیکوب رینتاماگی و AI Technopagan نشان می‌دهند که چگونه از تکنیک‌های «جیل‌بریک» (jailbreaking) برای خلق هنر فضایی با مدل‌های زبانی استفاده می‌کنند و «هوش فضایی را نشان می‌دهند، با وجود اینکه تمام کاری که انجام می‌دهد پیش‌بینی توکن بعدی است» @tbpn