اخبار هوش مصنوعی در 2025-08-03

مدل‌های جدید هوش مصنوعی

  • چین یک هوش مصنوعی پیشگامانه برای ریاضیات منتشر می‌کند که در IMO 2025 مدال طلا را کسب کرده، بیش از ۵۰ درصد از تمام مسائل Putnam و ۷۸ درصد از مسائل گذشته‌ی IMO را حل می‌کند و با شکست دادن AlphaGeometry2 گوگل، به ۱۰۰ درصد در بنچمارک miniF2F اوپن‌ای‌آی دست می‌یابد. @deedydas
  • هاگینگ فیس گزارش می‌دهد که ۵۰ مدل زبان بزرگ (LLM) تنها در ۲-۳ هفته منتشر شده‌اند که نشان‌دهنده‌ی بالاترین تعداد انتشار تاکنون است، اما به طور بالقوه کمترین تعدادی است که در آینده خواهیم دید. @julien_c
  • Runway مدل تولید ویدیوی Aleph را منتشر می‌کند که ثبات بهبودیافته‌ای را در صحنه‌ها نشان می‌دهد؛ این امر با انتقال‌های پیچیده‌ی صحنه و پیوستگی روایی به نمایش گذاشته شده است. @emollick

تحلیل صنعت

  • اندرو کارن استدلال می‌کند که تنها GPT-4، با پیاده‌سازی و کاهش هزینه‌های استنتاج، برای دگرگون کردن کامل اشتغال انسانی کافی بود، حتی اگر پیشرفت هوش مصنوعی در سال ۲۰۲۳ متوقف می‌شد، و تأثیر آن تازه در حال آشکار شدن است. @AndrewCurran_
  • سونی، وارنر و یونیورسال به طور جداگانه با شرکت‌های موسیقی هوش مصنوعی Suno و Udio در حال مذاکره هستند و به دنبال اثرانگشت‌گذاری محتوا برای ردیابی استفاده از مواد دارای مجوز می‌باشند؛ این توافقات احتمالاً شامل سهیم شدن لیبل‌های ضبط موسیقی در شرکت‌های موسیقی مولد خواهد بود. @AndrewCurran_
  • سم آلتمن ظهور «عصر فست فشن SaaS» را پیش‌بینی می‌کند که نشان‌دهنده‌ی چرخه‌های سریع تکرار و استقرار در توسعه‌ی نرم‌افزار است. @sama
  • گرگلی اوروسز گسترش استارتاپ‌های ابزار کدنویسی هوش مصنوعی را مشاهده می‌کند و اشاره می‌کند که این ابزارها را می‌توان با صدها خط کد بر بستر LLMهای پیشرفته ساخت، که این حوزه را عمدتاً به یک رقابت بازاریابی تبدیل می‌کند. @GergelyOrosz
  • ناتان لمبرت پیش‌بینی می‌کند که اوپن‌ای‌آی هم یک مدل متن‌باز (اولین مدل از زمان GPT-2) و هم GPT-5 را ظرف چند هفته از یکدیگر منتشر خواهد کرد؛ این امر نشان‌دهنده‌ی تفاوت بین حوزه‌های دارای پتانسیل تأثیرگذاری بزرگ در مقابل بهبودهای تدریجی است. @natolambert
  • الکس گروولی استدلال می‌کند که رویکرد اکوسیستم توزیع‌شده‌ی آزمایشگاه‌های هوش مصنوعی چین، که در آن آن‌ها بر اساس کار یکدیگر پیشرفت می‌کنند، در نهایت از به‌روزرسانی‌های سیستمی یکپارچه‌ی آزمایشگاه‌های آمریکایی برای پارادایم‌های جدید پیشی خواهد گرفت. @alexgraveley
  • اسکات بلوسکی نقش‌های شغلی نوظهور در هوش مصنوعی را شناسایی می‌کند، از جمله «طراحان/مهندسان ارکستراسیون» که پرامپت‌ها و منطق جریان کار را طراحی می‌کنند، و «ناظران» که قوانین را اعلام و اجرا می‌کنند. @scottbelsky

اخلاق و جامعه

  • ایتان مولیک نشان می‌دهد که تولید ویدیوی هوش مصنوعی به سطوحی از کیفیت رسیده است که تمایز آن از محتوای واقعی فوق‌العاده دشوار می‌شود و نگرانی‌هایی را در مورد اعتماد و اطلاعات نادرست ایجاد می‌کند. @emollick
  • یک مطالعه نشان می‌دهد که کاربران نابینا برای توصیف مواد حساس مانند تست‌های بارداری و بررسی‌های ظاهری، به هوش مصنوعی روی می‌آورند و برای حفظ حریم خصوصی، عدم دقت احتمالی را می‌پذیرند، در حالی که قبلاً چنین امکانی وجود نداشت. @emollick
  • پژوهش جدیدی نشان می‌دهد که نویسندگان آکادمیک می‌توانند «تزریق پرامپت» را به مقالات خود وارد کنند تا با مجبور کردن داوران به انجام بازبینی انسانی به جای اتکای شدید به بازبینی‌های هوش مصنوعی، علم را بهبود بخشند. @emollick
  • سایمون ویلسون از رویکرد «پرامپت‌نویسی حداقل» حمایت می‌کند و یافتن کوتاه‌ترین و ساده‌ترین پرامپت برای دستیابی به اهداف را ترجیح می‌دهد، به جای اتکا به روش‌های (هک‌های) پرامپت‌نویسی قدیمی مانند پیشنهادهای انعام. @simonw

کاربردها

  • ChatPRD یکپارچه‌سازی MCP را با پشتیبانی از Cursor، Windsurf و Claude راه‌اندازی می‌کند و کاربران را قادر می‌سازد تا PRDها را بازیابی کرده، اسناد بنویسند و کد را با زمینه‌ی محصول در محیط‌های توسعه ترکیب کنند. @clairevo
  • Comet پِرپِلِکسیتی (Perplexity) در هند به طور فزاینده‌ای مورد استفاده قرار می‌گیرد؛ این پلتفرم با تأکید بر دقت از طریق معماری قدرتمند «تولید تقویت‌شده با بازیابی» (Retrieval-Augmented Generation) که به طور فعال اسناد اخیر را برای به حداقل رساندن هالوسینیشن‌ها بازیابی می‌کند، عمل می‌کند. @AravSrinivas
  • گرگ براکمن حالت مطالعه‌ی ChatGPT را نشان می‌دهد که به طور مؤثری برای آموزش جبر به بزرگسالان استفاده می‌شود و کاربردهای آموزشی آن را به نمایش می‌گذارد. @gdb

پژوهش‌ها

  • ناتان لمبرت تحلیل می‌کند که Gemini DeepThink، Grok Heavy و o3 pro احتمالاً در میزان استفاده از محاسبات موازی خود بیشتر با یکدیگر تفاوت دارند تا در مدل‌های زیربنایی‌شان، با وجود تفاوت‌هایی در موازی‌سازی خام، عوامل مستقل با ارکستراتورها، و تخصیص محاسبات به ازای هر پرامپت. @natolambert
  • اولین مجموعه‌ی داده‌ی استدلال به زبان عربی در هاگینگ فیس منتشر شد که برای آموزش و تنظیم دقیق مدل‌های هوش مصنوعی برای وظایف استدلالی در زبان عربی طراحی شده است. @Akashi203
  • هاگینگ فیس کتاب راهنمای Ultra-Scale (Ultra-Scale Playbook) را با ۲۰۰ صفحه منتشر می‌کند که مباحثی چون موازی‌سازی 5D، ZeRO، Flash Attention و بهینه‌سازی محاسبات/ارتباطات را پوشش می‌دهد و شامل بیش از ۴۰۰۰ آزمایش مقیاس‌گذاری است. @ClementDelangue
  • الکس گروولی قابلیت‌های استدلال بینایی فراتر از کلون‌سازی رفتار را زیر سؤال می‌برد و نسبت به آموزش LLMها با داده‌های اینترنتی در مقایسه با محیط‌های دست‌ساز ابراز تردید می‌کند. @alexgraveley