اخبار هوش مصنوعی در 2025-07-19
مدلهای جدید هوش مصنوعی
- اوپنایآی با یک LLM استدلالکننده تجربی که از یادگیری تقویتی عمومی و مقیاسگذاری محاسبات در زمان آزمایش استفاده میکند، عملکردی در سطح مدال طلا در المپیاد جهانی ریاضی ۲۰۲۵ بهدست آورده است @OpenAI
- اوپنایآی توضیح میدهد که GPT-5 بهزودی منتشر میشود اما مدل طلایی IMO یک سیستم تجربی جداگانه است که تا ماهها منتشر نخواهد شد @OpenAI
- اوپنایآی بهروزرسانیهای صدای پیشرفته (Advanced Voice) را برای کاربران رایگان ChatGPT با گفتاری طبیعیتر و گویاتر و قابلیتهای ترجمهی بهبودیافته ارائه میدهد @OpenAI
- Perplexity Comet، یک رابط کاربری جدید هوش مصنوعی را راهاندازی میکند که به کاربران امکان میدهد ویجتها و وظایف سفارشی را با معماری محاسباتی ترکیبی کلاینت-سرور بسازند @AravSrinivas
تحلیل صنعت
- تیم Superintelligence متا متشکل از ۴۴ نفر است که ۵۰ درصد آنها از چین، ۷۵ درصد دارای مدرک دکترا، و ۴۰ درصد از اوپنایآی هستند و هر یک از اعضای آن احتمالاً سالانه ۱۰ تا ۱۰۰ میلیون دلار درآمد دارند @deedydas
- Comet از Perplexity در پلیاستور هند در تمامی دستهبندیهای برنامه به جایگاه پنجم و در بهرهوری به جایگاه دوم میرسد که نشاندهندهی پذیرش سریع آن است @AravSrinivas
- لی رابینسون به Cursor میپیوندد تا بر آموزش توسعهدهندگان تمرکز کند و بر نیاز به آموزش نحوهی استفادهی مؤثر از ابزارهای کدنویسی هوش مصنوعی به توسعهدهندگان جدید و باتجربه تأکید میکند @leerob
- Greptile با حمایت Benchmark، سرمایهی سری A را با ارزشگذاری ۱۸۰ میلیون دلاری جمعآوری میکند که نشاندهندهی رقابت فزاینده در حوزهی بازبینی کد با هوش مصنوعی است @TechCrunch
- تغییرات مالیاتی بخش ۱۷۴ که از سال ۲۰۲۳ گریبانگیر کسبوکارهای فناوری ایالات متحده بود، عمدتاً معکوس شدهاند و انتظار میرود انگیزه برای استخدام بیشتر در ایالات متحده و استخدام کمتر بینالمللی ایجاد کند @GergelyOrosz
اخلاق و جامعه
- سایمون ویلیسون دربارهی آسیبپذیریهای تزریق پرامپت (prompt injection) در سرور GitHub MCP هشدار میدهد، جایی که مهاجمان میتوانند عوامل هوش مصنوعی را فریب دهند تا از طریق دستورالعملهای مخرب، دادههای خصوصی را بدزدند @simonw
- اسکات بلزکی جنگهای داده را پیشبینی میکند، زیرا شرکتها دسترسی به API/MCP را قطع میکنند، در حالی که کاربران قابلیت انتقال حافظه و داده را طلب میکنند و این سؤال مطرح است که آیا مشتریان در نهایت پیروز خواهند شد @scottbelsky
- TechCrunch به کاربران توصیه میکند که قبل از دادن دسترسی هوش مصنوعی به دادههای شخصی، به دلایل حریم خصوصی و امنیتی، دوبار فکر کنند @TechCrunch
کاربردها
- ایتان مولیک Veo 3 Fast را نشان میدهد که صحنههای بازیهای ویدیویی را به شکل تولیدات تئاتر جامعه ایجاد میکند و قابلیتهای خلاقانهی تولید ویدیوی هوش مصنوعی را به نمایش میگذارد @emollick
- Comet از Perplexity امکان استخراج خودکار از Reddit را برای تحلیل ساختاریافتهی نظرات فراهم میکند و میتواند از طریق قابلیت خودبازی شطرنج بازی کند @AravSrinivas
- پلتفرم ChatGPT اکنون شامل عواملی است که میتوانند وعدههای غذایی را برنامهریزی کرده و مواد اولیه را خریداری کنند، ارائههای قابل ویرایش را بر اساس رقبای صنعت تولید کنند و وظایف واقعی را انجام دهند @TechCrunch
- جک دورسی در کمتر از یک هفته دو برنامه را با استفاده از vibe coding و ابزار هوش مصنوعی Goose برای پیامرسانی و ردیابی قرار گرفتن در معرض نور خورشید منتشر میکند @TechCrunch
- حامل حسین مشاهده میکند که پستهای وبلاگ اکنون برای کامپیوترها نوشته میشوند، جایی که کاربران میتوانند URLها را در Claude جایگذاری کنند و از آن بخواهند که پروژهها را بهطور خودکار راهاندازی کند @HamelHusain
پژوهشها
- مدل تجربی اوپنایآی عملکرد مدال طلای IMO را با استفاده از اثباتهای زبان طبیعی و تحت قوانین رقابت انسانی و بدون ابزار بهدست میآورد که نقطهی عطفی بزرگ در استدلال ریاضیاتی است @gdb
- دستاورد IMO از یادگیری تقویتی عمومی و مقیاسگذاری محاسبات در زمان آزمایش استفاده میکند، نه از روششناسیهای محدود و مختص وظایف خاص، که نشاندهندهی پیشرفت به سمت هوش عمومی است @AndrewCurran_
- فرانسوا شوله هوش را کارایی در کسب مهارتهای جدید تعریف میکند، نه مجموعهای از مهارتها، و هشدار میدهد که امتیازات بنچمارک میتوانند در مورد هوش واقعی سیستمهای هوش مصنوعی گمراهکننده باشند @fchollet
- ناتان لمبرت پیشنهاد میکند که اوپنایآی ممکن است به RL با اپیزودهای بسیار طولانی با ۱ تا ۱۰۰ میلیون توکن به ازای هر پاسخ دست یافته باشد، که یادگیری تقویتی گسترده را با مقیاسگذاری عظیم محاسبات در زمان آزمایش ترکیب میکند @krishnakaasyap
- جرد فریدمن واگرایی بین مهارتهایی را مشاهده میکند که میتوانند بنچمارک و از طریق تقویت آموخته شوند در مقابل آنهایی که نمیتوانند، با اشاره به اینکه ChatGPT در ریاضیات عالی است اما در نوشتن ایمیلهای سرد (cold emails) مشکل دارد @snowmaker
- ایتان مولیک اشاره میکند که دستاورد IMO با توجه به اینکه بازارهای پیشبینی تنها ۲۰ درصد شانس وقوع آن را در سال جاری میدانستند، بعید به نظر میرسید و بر اهمیت آن به عنوان یک آزمون دشوار که بدون ابزار انجام شده است، تأکید میکند @emollick