اخبار هوش مصنوعی در 2025-08-03
مدلهای جدید هوش مصنوعی
- چین یک هوش مصنوعی پیشگامانه برای ریاضیات منتشر میکند که در IMO 2025 مدال طلا را کسب کرده، بیش از ۵۰ درصد از تمام مسائل Putnam و ۷۸ درصد از مسائل گذشتهی IMO را حل میکند و با شکست دادن AlphaGeometry2 گوگل، به ۱۰۰ درصد در بنچمارک miniF2F اوپنایآی دست مییابد. @deedydas
- هاگینگ فیس گزارش میدهد که ۵۰ مدل زبان بزرگ (LLM) تنها در ۲-۳ هفته منتشر شدهاند که نشاندهندهی بالاترین تعداد انتشار تاکنون است، اما به طور بالقوه کمترین تعدادی است که در آینده خواهیم دید. @julien_c
- Runway مدل تولید ویدیوی Aleph را منتشر میکند که ثبات بهبودیافتهای را در صحنهها نشان میدهد؛ این امر با انتقالهای پیچیدهی صحنه و پیوستگی روایی به نمایش گذاشته شده است. @emollick
تحلیل صنعت
- اندرو کارن استدلال میکند که تنها GPT-4، با پیادهسازی و کاهش هزینههای استنتاج، برای دگرگون کردن کامل اشتغال انسانی کافی بود، حتی اگر پیشرفت هوش مصنوعی در سال ۲۰۲۳ متوقف میشد، و تأثیر آن تازه در حال آشکار شدن است. @AndrewCurran_
- سونی، وارنر و یونیورسال به طور جداگانه با شرکتهای موسیقی هوش مصنوعی Suno و Udio در حال مذاکره هستند و به دنبال اثرانگشتگذاری محتوا برای ردیابی استفاده از مواد دارای مجوز میباشند؛ این توافقات احتمالاً شامل سهیم شدن لیبلهای ضبط موسیقی در شرکتهای موسیقی مولد خواهد بود. @AndrewCurran_
- سم آلتمن ظهور «عصر فست فشن SaaS» را پیشبینی میکند که نشاندهندهی چرخههای سریع تکرار و استقرار در توسعهی نرمافزار است. @sama
- گرگلی اوروسز گسترش استارتاپهای ابزار کدنویسی هوش مصنوعی را مشاهده میکند و اشاره میکند که این ابزارها را میتوان با صدها خط کد بر بستر LLMهای پیشرفته ساخت، که این حوزه را عمدتاً به یک رقابت بازاریابی تبدیل میکند. @GergelyOrosz
- ناتان لمبرت پیشبینی میکند که اوپنایآی هم یک مدل متنباز (اولین مدل از زمان GPT-2) و هم GPT-5 را ظرف چند هفته از یکدیگر منتشر خواهد کرد؛ این امر نشاندهندهی تفاوت بین حوزههای دارای پتانسیل تأثیرگذاری بزرگ در مقابل بهبودهای تدریجی است. @natolambert
- الکس گروولی استدلال میکند که رویکرد اکوسیستم توزیعشدهی آزمایشگاههای هوش مصنوعی چین، که در آن آنها بر اساس کار یکدیگر پیشرفت میکنند، در نهایت از بهروزرسانیهای سیستمی یکپارچهی آزمایشگاههای آمریکایی برای پارادایمهای جدید پیشی خواهد گرفت. @alexgraveley
- اسکات بلوسکی نقشهای شغلی نوظهور در هوش مصنوعی را شناسایی میکند، از جمله «طراحان/مهندسان ارکستراسیون» که پرامپتها و منطق جریان کار را طراحی میکنند، و «ناظران» که قوانین را اعلام و اجرا میکنند. @scottbelsky
اخلاق و جامعه
- ایتان مولیک نشان میدهد که تولید ویدیوی هوش مصنوعی به سطوحی از کیفیت رسیده است که تمایز آن از محتوای واقعی فوقالعاده دشوار میشود و نگرانیهایی را در مورد اعتماد و اطلاعات نادرست ایجاد میکند. @emollick
- یک مطالعه نشان میدهد که کاربران نابینا برای توصیف مواد حساس مانند تستهای بارداری و بررسیهای ظاهری، به هوش مصنوعی روی میآورند و برای حفظ حریم خصوصی، عدم دقت احتمالی را میپذیرند، در حالی که قبلاً چنین امکانی وجود نداشت. @emollick
- پژوهش جدیدی نشان میدهد که نویسندگان آکادمیک میتوانند «تزریق پرامپت» را به مقالات خود وارد کنند تا با مجبور کردن داوران به انجام بازبینی انسانی به جای اتکای شدید به بازبینیهای هوش مصنوعی، علم را بهبود بخشند. @emollick
- سایمون ویلسون از رویکرد «پرامپتنویسی حداقل» حمایت میکند و یافتن کوتاهترین و سادهترین پرامپت برای دستیابی به اهداف را ترجیح میدهد، به جای اتکا به روشهای (هکهای) پرامپتنویسی قدیمی مانند پیشنهادهای انعام. @simonw
کاربردها
- ChatPRD یکپارچهسازی MCP را با پشتیبانی از Cursor، Windsurf و Claude راهاندازی میکند و کاربران را قادر میسازد تا PRDها را بازیابی کرده، اسناد بنویسند و کد را با زمینهی محصول در محیطهای توسعه ترکیب کنند. @clairevo
- Comet پِرپِلِکسیتی (Perplexity) در هند به طور فزایندهای مورد استفاده قرار میگیرد؛ این پلتفرم با تأکید بر دقت از طریق معماری قدرتمند «تولید تقویتشده با بازیابی» (Retrieval-Augmented Generation) که به طور فعال اسناد اخیر را برای به حداقل رساندن هالوسینیشنها بازیابی میکند، عمل میکند. @AravSrinivas
- گرگ براکمن حالت مطالعهی ChatGPT را نشان میدهد که به طور مؤثری برای آموزش جبر به بزرگسالان استفاده میشود و کاربردهای آموزشی آن را به نمایش میگذارد. @gdb
پژوهشها
- ناتان لمبرت تحلیل میکند که Gemini DeepThink، Grok Heavy و o3 pro احتمالاً در میزان استفاده از محاسبات موازی خود بیشتر با یکدیگر تفاوت دارند تا در مدلهای زیربناییشان، با وجود تفاوتهایی در موازیسازی خام، عوامل مستقل با ارکستراتورها، و تخصیص محاسبات به ازای هر پرامپت. @natolambert
- اولین مجموعهی دادهی استدلال به زبان عربی در هاگینگ فیس منتشر شد که برای آموزش و تنظیم دقیق مدلهای هوش مصنوعی برای وظایف استدلالی در زبان عربی طراحی شده است. @Akashi203
- هاگینگ فیس کتاب راهنمای Ultra-Scale (Ultra-Scale Playbook) را با ۲۰۰ صفحه منتشر میکند که مباحثی چون موازیسازی 5D، ZeRO، Flash Attention و بهینهسازی محاسبات/ارتباطات را پوشش میدهد و شامل بیش از ۴۰۰۰ آزمایش مقیاسگذاری است. @ClementDelangue
- الکس گروولی قابلیتهای استدلال بینایی فراتر از کلونسازی رفتار را زیر سؤال میبرد و نسبت به آموزش LLMها با دادههای اینترنتی در مقایسه با محیطهای دستساز ابراز تردید میکند. @alexgraveley