اخبار هوش مصنوعی در 2025-07-19

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی با یک LLM استدلال‌کننده تجربی که از یادگیری تقویتی عمومی و مقیاس‌گذاری محاسبات در زمان آزمایش استفاده می‌کند، عملکردی در سطح مدال طلا در المپیاد جهانی ریاضی ۲۰۲۵ به‌دست آورده است @OpenAI
  • اوپن‌ای‌آی توضیح می‌دهد که GPT-5 به‌زودی منتشر می‌شود اما مدل طلایی IMO یک سیستم تجربی جداگانه است که تا ماه‌ها منتشر نخواهد شد @OpenAI
  • اوپن‌ای‌آی به‌روزرسانی‌های صدای پیشرفته (Advanced Voice) را برای کاربران رایگان ChatGPT با گفتاری طبیعی‌تر و گویاتر و قابلیت‌های ترجمه‌ی بهبودیافته ارائه می‌دهد @OpenAI
  • Perplexity Comet، یک رابط کاربری جدید هوش مصنوعی را راه‌اندازی می‌کند که به کاربران امکان می‌دهد ویجت‌ها و وظایف سفارشی را با معماری محاسباتی ترکیبی کلاینت-سرور بسازند @AravSrinivas

تحلیل صنعت

  • تیم Superintelligence متا متشکل از ۴۴ نفر است که ۵۰ درصد آن‌ها از چین، ۷۵ درصد دارای مدرک دکترا، و ۴۰ درصد از اوپن‌ای‌آی هستند و هر یک از اعضای آن احتمالاً سالانه ۱۰ تا ۱۰۰ میلیون دلار درآمد دارند @deedydas
  • Comet از Perplexity در پلی‌استور هند در تمامی دسته‌بندی‌های برنامه به جایگاه پنجم و در بهره‌وری به جایگاه دوم می‌رسد که نشان‌دهنده‌ی پذیرش سریع آن است @AravSrinivas
  • لی رابینسون به Cursor می‌پیوندد تا بر آموزش توسعه‌دهندگان تمرکز کند و بر نیاز به آموزش نحوه‌ی استفاده‌ی مؤثر از ابزارهای کدنویسی هوش مصنوعی به توسعه‌دهندگان جدید و باتجربه تأکید می‌کند @leerob
  • Greptile با حمایت Benchmark، سرمایه‌ی سری A را با ارزش‌گذاری ۱۸۰ میلیون دلاری جمع‌آوری می‌کند که نشان‌دهنده‌ی رقابت فزاینده در حوزه‌ی بازبینی کد با هوش مصنوعی است @TechCrunch
  • تغییرات مالیاتی بخش ۱۷۴ که از سال ۲۰۲۳ گریبان‌گیر کسب‌وکارهای فناوری ایالات متحده بود، عمدتاً معکوس شده‌اند و انتظار می‌رود انگیزه برای استخدام بیشتر در ایالات متحده و استخدام کمتر بین‌المللی ایجاد کند @GergelyOrosz

اخلاق و جامعه

  • سایمون ویلیسون درباره‌ی آسیب‌پذیری‌های تزریق پرامپت (prompt injection) در سرور GitHub MCP هشدار می‌دهد، جایی که مهاجمان می‌توانند عوامل هوش مصنوعی را فریب دهند تا از طریق دستورالعمل‌های مخرب، داده‌های خصوصی را بدزدند @simonw
  • اسکات بلزکی جنگ‌های داده را پیش‌بینی می‌کند، زیرا شرکت‌ها دسترسی به API/MCP را قطع می‌کنند، در حالی که کاربران قابلیت انتقال حافظه و داده را طلب می‌کنند و این سؤال مطرح است که آیا مشتریان در نهایت پیروز خواهند شد @scottbelsky
  • TechCrunch به کاربران توصیه می‌کند که قبل از دادن دسترسی هوش مصنوعی به داده‌های شخصی، به دلایل حریم خصوصی و امنیتی، دوبار فکر کنند @TechCrunch

کاربردها

  • ایتان مولیک Veo 3 Fast را نشان می‌دهد که صحنه‌های بازی‌های ویدیویی را به شکل تولیدات تئاتر جامعه ایجاد می‌کند و قابلیت‌های خلاقانه‌ی تولید ویدیوی هوش مصنوعی را به نمایش می‌گذارد @emollick
  • Comet از Perplexity امکان استخراج خودکار از Reddit را برای تحلیل ساختاریافته‌ی نظرات فراهم می‌کند و می‌تواند از طریق قابلیت خودبازی شطرنج بازی کند @AravSrinivas
  • پلتفرم ChatGPT اکنون شامل عواملی است که می‌توانند وعده‌های غذایی را برنامه‌ریزی کرده و مواد اولیه را خریداری کنند، ارائه‌های قابل ویرایش را بر اساس رقبای صنعت تولید کنند و وظایف واقعی را انجام دهند @TechCrunch
  • جک دورسی در کمتر از یک هفته دو برنامه را با استفاده از vibe coding و ابزار هوش مصنوعی Goose برای پیام‌رسانی و ردیابی قرار گرفتن در معرض نور خورشید منتشر می‌کند @TechCrunch
  • حامل حسین مشاهده می‌کند که پست‌های وبلاگ اکنون برای کامپیوترها نوشته می‌شوند، جایی که کاربران می‌توانند URLها را در Claude جای‌گذاری کنند و از آن بخواهند که پروژه‌ها را به‌طور خودکار راه‌اندازی کند @HamelHusain

پژوهش‌ها

  • مدل تجربی اوپن‌ای‌آی عملکرد مدال طلای IMO را با استفاده از اثبات‌های زبان طبیعی و تحت قوانین رقابت انسانی و بدون ابزار به‌دست می‌آورد که نقطه‌ی عطفی بزرگ در استدلال ریاضیاتی است @gdb
  • دستاورد IMO از یادگیری تقویتی عمومی و مقیاس‌گذاری محاسبات در زمان آزمایش استفاده می‌کند، نه از روش‌شناسی‌های محدود و مختص وظایف خاص، که نشان‌دهنده‌ی پیشرفت به سمت هوش عمومی است @AndrewCurran_
  • فرانسوا شوله هوش را کارایی در کسب مهارت‌های جدید تعریف می‌کند، نه مجموعه‌ای از مهارت‌ها، و هشدار می‌دهد که امتیازات بنچمارک می‌توانند در مورد هوش واقعی سیستم‌های هوش مصنوعی گمراه‌کننده باشند @fchollet
  • ناتان لمبرت پیشنهاد می‌کند که اوپن‌ای‌آی ممکن است به RL با اپیزودهای بسیار طولانی با ۱ تا ۱۰۰ میلیون توکن به ازای هر پاسخ دست یافته باشد، که یادگیری تقویتی گسترده را با مقیاس‌گذاری عظیم محاسبات در زمان آزمایش ترکیب می‌کند @krishnakaasyap
  • جرد فریدمن واگرایی بین مهارت‌هایی را مشاهده می‌کند که می‌توانند بنچمارک و از طریق تقویت آموخته شوند در مقابل آن‌هایی که نمی‌توانند، با اشاره به اینکه ChatGPT در ریاضیات عالی است اما در نوشتن ایمیل‌های سرد (cold emails) مشکل دارد @snowmaker
  • ایتان مولیک اشاره می‌کند که دستاورد IMO با توجه به اینکه بازارهای پیش‌بینی تنها ۲۰ درصد شانس وقوع آن را در سال جاری می‌دانستند، بعید به نظر می‌رسید و بر اهمیت آن به عنوان یک آزمون دشوار که بدون ابزار انجام شده است، تأکید می‌کند @emollick