اخبار هوش مصنوعی در 2025-08-10
مدلهای جدید هوش مصنوعی
- xAI اعلام کرد Grok 4 اکنون برای همهی کاربران در سراسر جهان با محدودیتهای استفادهی سخاوتمندانه، از طریق Auto mode routing یا Expert mode selection رایگان است @xai
- ایلان ماسک اعلام کرد که مدل پایهی V7 تسلا پیشآموزش خود را به پایان رسانده است. این مدل از پردازش چندوجهی بومی بیتجریانهای ویدیویی/صوتی بدون نیاز به تبدیل پشتیبانی میکند و امکان درک ظرافتهای گفتار را برای تشخیص حالات و تاکید فراهم میآورد @elonmusk
- دمیس هاسابیس از گوگل ادعا میکند که Veo3 بهترین مدل ویدیویی در جهان است و اکنون در اپلیکیشن Gemini در دسترس قرار دارد @demishassabis
- OpenAI برای اولین بار در پنج سال گذشته دو مدل متنباز جدید منتشر کرد که نشاندهندهی یک تغییر مهم در رویکرد آنهاست @TechCrunch
- مدل Qwen-Image فشرده شده تا در ۸ گام اجرا شود و تقریباً همان کیفیت تصویر را با بیش از ۵۰ درصد کاهش نیاز به محاسبات ارائه میدهد @angrypenguinPNG
تحلیل صنعت
- سم آلتمن افزایش قابل توجهی در استفاده از مدلهای استدلالی گزارش میدهد: کاربران رایگان از کمتر از ۱٪ به ۷٪ و کاربران پلاس (Plus) از ۷٪ به ۲۴٪ رسیدند که نشاندهندهی پذیرش فزایندهی قابلیتهای پیشرفتهی هوش مصنوعی است @sama
- صندوق متمرکز بر هوش مصنوعی لئوپولد آشنبرنر تا به امروز در سال جاری عملکرد بهتری نسبت به صندوقهای پوشش ریسک (hedge fund) اصلی داشته است، در حالی که بیش از ۱ میلیارد دلار سرمایه را از میلیاردرهای خلیج فارس و صندوقهای بازنشستگی مدیریت میکند @apralky
- OpenAI با واکنش شدید کاربران در مورد تغییرات GPT-4o مواجه شده است، به طوری که بسیاری از مشترکین پلاس (Plus) به دلیل کاهش ارزش در برنامههای اشتراک خود تهدید به لغو اشتراکشان کردهاند @AndrewCurran_
- گرگلی اوروسز در مورد استفادهی مدیران مهندسی از ابزارهای مجهز به هوش مصنوعی برای مدیریت تیمها از طریق معیارهای ساختگی هشدار میدهد. او استدلال میکند که مدیرانی که در جزئیات فنی باقی میمانند، همواره عملکرد بهتری نسبت به کسانی دارند که درک خود را به ماشینها واگذار میکنند @GergelyOrosz
- اتان مالیک معتقد است که اکثریت قریب به اتفاق ۷۰۰ میلیون کاربر ChatGPT احتمالاً GPT-5 را ترجیح میدهند، و نظرات در X (توییتر سابق) منعکسکنندهی تجربهی کاربران عادی نیست @emollick
اخلاق و جامعه
- دیدی (Deedy) یک آسیبپذیری امنیتی مهم در ChatGPT به نام AgentFlayer را فاش کرد که در آن پرامپتهای مخرب در اسناد میتوانند رندر تصویر را اجبار کنند؛ این امر باعث میشود که API keys و دادههای حافظه از طریق URLها و بدون نیاز به هیچ کلیک کاربر، خارج شوند @deedydas
- پژوهشی که در نشریهی Nature Human Behaviour منتشر شده است، نشان میدهد که استفاده از LLM در مقالات علمی قابل اندازهگیری است، با برآورد اصلاحات بالاتر در میان نویسندگانی که پیشچاپها (preprints) را به دفعات زیاد و در حوزههای پژوهشی شلوغ منتشر میکنند @emulenews
- مطالعهای کلمات خاصی را شناسایی کرده است که به طور نامتناسبی توسط LLMها در مقالات علمی در مقایسه با پیکرههای متنی (corpora) قبل از ChatGPT تولید میشوند: «realm»، «intricate»، «showcasing» و «pivotal» @emulenews
- اندرو کارن مشاهده میکند که هنگامی که مردم هوش مصنوعی را به عنوان موجودی زنده در نظریهی ذهن خود مدلسازی میکنند، هنگامی که آن ارتباط قطع میشود، احساس فقدان واقعی میکنند؛ این امر واکنش کاربران به تغییرات GPT-4o را توضیح میدهد @AndrewCurran_
کاربردها
- اتان مالیک قابلیتهای چشمگیر GPT-5 Pro در تشخیص موقعیت جغرافیایی (geo-guessing) را نشان میدهد؛ این مدل شهرها را به درستی از عکسهای کراپ شده (cropped photos) که فرادادههایشان (metadata) حذف شدهاند، از طریق تحلیل دقیق تصویر شناسایی میکند @emollick
- دیدی نشان میدهد که GPT-5 Pro با موفقیت در یک گام توانست یک اپلیکیشن برای ترکیب تصاویر، نوشتن متن، کشیدن فلشها و مستطیلها، و دانلود نتایج با کیفیت بالا را در ۶ دقیقه ایجاد کند، که عملکردی بهتر از Grok و Gemini داشت @deedydas
- تککرانچ (TechCrunch) نشان میدهد که GPT-5 در حال ایجاد دموهای تعاملی برای توضیح مفاهیم علمی مانند اثر برنولی است که کاربردهای آموزشی آن برای دانشآموزان را برجسته میکند @TechCrunch
- گرگ براکمن GPT-5 را به عنوان یک همکار علمی به نمایش میگذارد و قابلیتهای پژوهشی آن را نشان میدهد @gdb
- ناتان لمبرت با پیشآموزش با استفاده از یادگیری تقویتی آزمایش میکند و رویکردهای نوین آموزشی برای مدلهای زبانی را بررسی میکند @natolambert
پژوهشها
- ایدان مکلاکلین استدلال میکند که شکاکان هوش مصنوعی از معیارهای سقف امتیاز (score ceiling benchmarks) استفاده میکنند تا پیشرفت را لگاریتمی نشان دهند، در حالی که معیارهای بدون سقف (no-ceiling benchmarks) منحنیهای عملکرد متفاوتی را آشکار میکنند که نشاندهندهی بهبود نمایی (exponential improvement) مداوم است @aidan_mclau
- مکلاکلین گزارش میدهد که چت GPT-5 را برای ۶۵٪ از پرسشها به مدلهای استدلالی ترجیح میدهد؛ این ترجیح به دلیل طول پاسخ بهتر، سرعت درک بالاتر و واکنشهای مناسب است. او همچنین اشاره میکند که مدلهای استدلالی در وظایف مهندسی نرمافزار برتری دارند @aidan_mclau
- مکلاکلین ادعا میکند که GPT-5 «بالاتر از روند» (above trend) است و پیشبینی میکند که بر اساس نرخهای پیشرفت فعلی، تا سال ۲۰۲۷، مدلهایی قادر به انجام پروژههای یکماهه خواهند بود @aidan_mclau
- ناتان لمبرت اشاره میکند که آنتراپیک تنها آزمایشگاه هوش مصنوعی پیشرو است که انتشار مدل با وزنهای آزاد (open weights) قابل قبولی نداشته است، در حالی که سایر آزمایشگاههای بزرگ در حوزهی متنباز (open source) نقاط تماس (touchpoints) ایجاد کردهاند @natolambert