اخبار هوش مصنوعی در 2025-08-02
مدلهای جدید هوش مصنوعی
- گوگل اعلام کرد که Gemini 2.5 Deep Think در بسیاری از معیارهای دشوار، بهترین عملکرد موجود را به دست آورده است @demishassabis
- اوپنایآی از عرضههای آتی طی چند ماه آینده، از جمله مدلها، محصولات و قابلیتهای جدید خبر داد و نسبت به کمبود احتمالی ظرفیت در حین عرضه هشدار داد @sama
- گزارشهایی مبنی بر مشاهدهی نسخهی اولیهی GPT-5-reasoning (medium) که توسط کاربران منتخب در حال آزمایش است، منتشر شده است @AndrewCurran_
تحلیل صنعت
- انتروپیک به دلیل نقض شرایط سرویس، دسترسی اوپنایآی به API مدلهای خود را لغو کرد که نشاندهندهی تنشهای رقابتی بین شرکتهای هوش مصنوعی است @AndrewCurran_
- طبق گزارشها، متا به یک پژوهشگر مبلغ 1.5 میلیارد دلار طی 6 سال پیشنهاد داد که وی در نهایت آن را رد کرد؛ این موضوع نشاندهندهی رقابت شدید بر سر جذب استعدادها در هوش مصنوعی است @deedydas
- یوجین یان هشدار میدهد که ابزارهای کدنویسی هوش مصنوعی به ساخت سریعتر کمک میکنند اما در صورتی که کد بدون در نظر گرفتن خوانایی و قابلیت توسعهپذیری تولید شود، میتوانند مشکلات قابلیت نگهداری ایجاد کرده و به طور بالقوه هزینههای مالکیت بلندمدت را افزایش دهند @eugeneyan
- پل گراهام مشاهده میکند که همکاری استارتاپها با شرکتهای بزرگ به ندرت به عنوان میانبری برای رشد عمل میکند و بیشتر این تلاشها منجر به سوءاستفاده از استارتاپ میشود @paulg
پژوهشها
- چهارمین مسئله در FrontierMath Tier 4 توسط هوش مصنوعی حل شده است؛ به طور خاص یک مسئلهی نظریهی اعداد که جایزهی بهترین ارائه را برده بود @gdb
- پژوهشی پیشگامانه نشان میدهد یک مدل بسیار کوچک الهامگرفته از مغز با 27 میلیون پارامتر که تنها با 1000 نمونه آموزش دیده است، در وظایف استدلالی از o3-mini-high پیشی میگیرد و به 40% در ARC-AGI دست یافته و سودوکوها و مازهای پیچیده را حل میکند @deedydas
- اریک یانگ پیشبینی میکند که مدلهای هوش مصنوعی طی 12 ماه کشفیات ریاضی جدیدی برای حدسهای سادهی اثباتنشده انجام خواهند داد و خودبهبودبخشی ابتدایی را طی 24 ماه به دست خواهند آورد @ericjang11
- پژوهشها نشان میدهد که تکنیکهای پرامپتینگ سنتی مانند تهدید، ادب، توهین و وعدهی پاداش، دیگر تأثیر چشمگیری بر عملکرد مدلهای اخیر هوش مصنوعی در وظایف چالشبرانگیز ندارند @emollick
- پرامپتینگ زنجیرهی فکری (Chain-of-thought) دیگر بهبود عملکرد قابل توجهی ایجاد نمیکند، حتی برای مدلهای غیر استدلالی، که نشاندهندهی همگرایی در قابلیتهای مدل است @emollick
کاربردها
- ایتان مولیک نشان میدهد که Gemini 2.5 Deep Think با استفاده از پرامپتهای ساده، یک بازی کامل فرمان موشکی با فیزیک نسبیت واقعی ایجاد میکند و هر تکرار آن بدون خطا اجرا میشود @emollick
- پرپلکسی قابلیتهای ایجنت Comet را در مقایسه با ChatGPT Agent برای کاربردهای دنیای واقعی به نمایش میگذارد @AravSrinivas
- ایجنتهای هوش مصنوعی مبتنی بر مرورگر کاربردهای عملی از جمله یافتن کدهای تخفیف کارآمد، مدیریت محتوای یوتیوب، ایجاد لیست محصولات از تبها و خودکارسازی وظایف تکراری وب را نشان میدهند @garrytan
- ابزارهای هوش مصنوعی در صورت استفادهی دقیق توسط انسانها، پژوهشهای علمی را از طریق کاربردهای زمانبهصرفه در پاکسازی دادهها، تحلیل اکتشافی، نگارش و کمک به پژوهش، سرعت میبخشند @emollick
اخلاق و جامعه
- ایتان مولیک پیامدهای فرضی شکست نسبی Llama 4 را مورد بحث قرار میدهد و پیشنهاد میکند که این امر میتواند توسعهی هوش مصنوعی متنباز را به چین منتقل کرده و شرکتها را به سمت مدلهای بسته سوق دهد @emollick
- نگرانیهایی در مورد خلاصهمقالات علمی تولیدشده توسط هوش مصنوعی مطرح شد، با بحث در مورد تعادل بین مزایای صرفهجویی در زمان و نیاز به نظارت انسانی در نگارش دانشگاهی @emollick
- آیدان مکلافلین از موانعی که مانع دسترسی پژوهشگران هوش مصنوعی به مدلهای رقیب میشوند، انتقاد میکند و استدلال میکند که این امر مانع پژوهشهای کیفی مهم در مورد رفتار مدل میشود @aidan_mclau