اخبار هوش مصنوعی در 2025-07-19

مدل‌های جدید هوش مصنوعی

اوپن‌ای‌آی با یک LLM استدلال‌کننده تجربی که از یادگیری تقویتی عمومی و مقیاس‌گذاری محاسبات در زمان آزمایش استفاده می‌کند، عملکردی در سطح مدال طلا در المپیاد جهانی ریاضی ۲۰۲۵ به‌دست آورده است @OpenAI
اوپن‌ای‌آی توضیح می‌دهد که GPT-5 به‌زودی منتشر می‌شود اما مدل طلایی IMO یک سیستم تجربی جداگانه است که تا ماه‌ها منتشر نخواهد شد @OpenAI
اوپن‌ای‌آی به‌روزرسانی‌های صدای پیشرفته (Advanced Voice) را برای کاربران رایگان ChatGPT با گفتاری طبیعی‌تر و گویاتر و قابلیت‌های ترجمه‌ی بهبودیافته ارائه می‌دهد @OpenAI
Perplexity Comet، یک رابط کاربری جدید هوش مصنوعی را راه‌اندازی می‌کند که به کاربران امکان می‌دهد ویجت‌ها و وظایف سفارشی را با معماری محاسباتی ترکیبی کلاینت-سرور بسازند @AravSrinivas

تحلیل صنعت

تیم Superintelligence متا متشکل از ۴۴ نفر است که ۵۰ درصد آن‌ها از چین، ۷۵ درصد دارای مدرک دکترا، و ۴۰ درصد از اوپن‌ای‌آی هستند و هر یک از اعضای آن احتمالاً سالانه ۱۰ تا ۱۰۰ میلیون دلار درآمد دارند @deedydas
Comet از Perplexity در پلی‌استور هند در تمامی دسته‌بندی‌های برنامه به جایگاه پنجم و در بهره‌وری به جایگاه دوم می‌رسد که نشان‌دهنده‌ی پذیرش سریع آن است @AravSrinivas
لی رابینسون به Cursor می‌پیوندد تا بر آموزش توسعه‌دهندگان تمرکز کند و بر نیاز به آموزش نحوه‌ی استفاده‌ی مؤثر از ابزارهای کدنویسی هوش مصنوعی به توسعه‌دهندگان جدید و باتجربه تأکید می‌کند @leerob
Greptile با حمایت Benchmark، سرمایه‌ی سری A را با ارزش‌گذاری ۱۸۰ میلیون دلاری جمع‌آوری می‌کند که نشان‌دهنده‌ی رقابت فزاینده در حوزه‌ی بازبینی کد با هوش مصنوعی است @TechCrunch
تغییرات مالیاتی بخش ۱۷۴ که از سال ۲۰۲۳ گریبان‌گیر کسب‌وکارهای فناوری ایالات متحده بود، عمدتاً معکوس شده‌اند و انتظار می‌رود انگیزه برای استخدام بیشتر در ایالات متحده و استخدام کمتر بین‌المللی ایجاد کند @GergelyOrosz

اخلاق و جامعه

سایمون ویلیسون درباره‌ی آسیب‌پذیری‌های تزریق پرامپت (prompt injection) در سرور GitHub MCP هشدار می‌دهد، جایی که مهاجمان می‌توانند عوامل هوش مصنوعی را فریب دهند تا از طریق دستورالعمل‌های مخرب، داده‌های خصوصی را بدزدند @simonw
اسکات بلزکی جنگ‌های داده را پیش‌بینی می‌کند، زیرا شرکت‌ها دسترسی به API/MCP را قطع می‌کنند، در حالی که کاربران قابلیت انتقال حافظه و داده را طلب می‌کنند و این سؤال مطرح است که آیا مشتریان در نهایت پیروز خواهند شد @scottbelsky
TechCrunch به کاربران توصیه می‌کند که قبل از دادن دسترسی هوش مصنوعی به داده‌های شخصی، به دلایل حریم خصوصی و امنیتی، دوبار فکر کنند @TechCrunch

کاربردها

ایتان مولیک Veo 3 Fast را نشان می‌دهد که صحنه‌های بازی‌های ویدیویی را به شکل تولیدات تئاتر جامعه ایجاد می‌کند و قابلیت‌های خلاقانه‌ی تولید ویدیوی هوش مصنوعی را به نمایش می‌گذارد @emollick
Comet از Perplexity امکان استخراج خودکار از Reddit را برای تحلیل ساختاریافته‌ی نظرات فراهم می‌کند و می‌تواند از طریق قابلیت خودبازی شطرنج بازی کند @AravSrinivas
پلتفرم ChatGPT اکنون شامل عواملی است که می‌توانند وعده‌های غذایی را برنامه‌ریزی کرده و مواد اولیه را خریداری کنند، ارائه‌های قابل ویرایش را بر اساس رقبای صنعت تولید کنند و وظایف واقعی را انجام دهند @TechCrunch
جک دورسی در کمتر از یک هفته دو برنامه را با استفاده از vibe coding و ابزار هوش مصنوعی Goose برای پیام‌رسانی و ردیابی قرار گرفتن در معرض نور خورشید منتشر می‌کند @TechCrunch
حامل حسین مشاهده می‌کند که پست‌های وبلاگ اکنون برای کامپیوترها نوشته می‌شوند، جایی که کاربران می‌توانند URLها را در Claude جای‌گذاری کنند و از آن بخواهند که پروژه‌ها را به‌طور خودکار راه‌اندازی کند @HamelHusain

پژوهش‌ها

مدل تجربی اوپن‌ای‌آی عملکرد مدال طلای IMO را با استفاده از اثبات‌های زبان طبیعی و تحت قوانین رقابت انسانی و بدون ابزار به‌دست می‌آورد که نقطه‌ی عطفی بزرگ در استدلال ریاضیاتی است @gdb
دستاورد IMO از یادگیری تقویتی عمومی و مقیاس‌گذاری محاسبات در زمان آزمایش استفاده می‌کند، نه از روش‌شناسی‌های محدود و مختص وظایف خاص، که نشان‌دهنده‌ی پیشرفت به سمت هوش عمومی است @AndrewCurran_
فرانسوا شوله هوش را کارایی در کسب مهارت‌های جدید تعریف می‌کند، نه مجموعه‌ای از مهارت‌ها، و هشدار می‌دهد که امتیازات بنچمارک می‌توانند در مورد هوش واقعی سیستم‌های هوش مصنوعی گمراه‌کننده باشند @fchollet
ناتان لمبرت پیشنهاد می‌کند که اوپن‌ای‌آی ممکن است به RL با اپیزودهای بسیار طولانی با ۱ تا ۱۰۰ میلیون توکن به ازای هر پاسخ دست یافته باشد، که یادگیری تقویتی گسترده را با مقیاس‌گذاری عظیم محاسبات در زمان آزمایش ترکیب می‌کند @krishnakaasyap
جرد فریدمن واگرایی بین مهارت‌هایی را مشاهده می‌کند که می‌توانند بنچمارک و از طریق تقویت آموخته شوند در مقابل آن‌هایی که نمی‌توانند، با اشاره به اینکه ChatGPT در ریاضیات عالی است اما در نوشتن ایمیل‌های سرد (cold emails) مشکل دارد @snowmaker
ایتان مولیک اشاره می‌کند که دستاورد IMO با توجه به اینکه بازارهای پیش‌بینی تنها ۲۰ درصد شانس وقوع آن را در سال جاری می‌دانستند، بعید به نظر می‌رسید و بر اهمیت آن به عنوان یک آزمون دشوار که بدون ابزار انجام شده است، تأکید می‌کند @emollick