اخبار هوش مصنوعی در 2025-07-21

مدل‌های جدید هوش مصنوعی

  • گوگل دیپ‌مایند اعلام کرد که جیمینای دیپ‌ثینک در المپیاد جهانی ریاضی به عملکردی در سطح مدال طلا دست یافت و ۵ مسئله از ۶ مسئله را با اثبات‌های ریاضی دقیق و به زبان طبیعی در محدوده‌ی زمانی ۴.۵ ساعته حل کرد @demishassabis
  • علی‌بابا کون۳-۲۳۵بی-ای۲۲بی-اینستراکت-۲۵۰۷ و نسخه‌ی FP8 آن را منتشر کرد و حالت تفکر ترکیبی (hybrid thinking mode) را به نفع مدل‌های مجزای اینستراکت (Instruct) و تینکینگ (Thinking) برای کیفیت بهتر کنار گذاشت @Alibaba_Qwen
  • گوگل قابلیت‌های بومی تبدیل متن به گفتار را برای مدل‌های جیمینای ۲.۵ فلش و ۲.۵ پرو راه‌اندازی کرد که برای استفاده در مقیاس تولید، از جمله محتوای پادکست به سبک نوت‌بوک‌ال‌ام (NotebookLM)، در دسترس هستند @OfficialLoganK

تحلیل صنعت

  • اوپن‌اِی‌آی تا پایان سال جاری میلادی بیش از ۱ میلیون واحد پردازش گرافیکی (GPU) را آنلاین خواهد کرد، با برنامه‌هایی برای مقیاس‌پذیری ۱۰۰ برابری از آن پس @sama
  • چیپ هویان مشاهده می‌کند که محدودیت‌های شناختی انسان هنگام کار با عامل‌های کدنویسی هوش مصنوعی به گلوگاه تبدیل شده‌اند، زیرا هوش مصنوعی می‌تواند چندین وظیفه‌ی موازی را انجام دهد، در حالی که انسان‌ها تنها می‌توانند چند بستر (Context) را به‌طور همزمان پیگیری کنند @chipro
  • اندرو اِنگ گلوگاه مدیریت محصول را به‌عنوان محدودیت جدید در توسعه‌ی نرم‌افزار شناسایی می‌کند، جایی که تصمیم‌گیری در مورد اینکه چه چیزی ساخته شود به عامل محدودکننده تبدیل می‌شود، زیرا کدنویسی عاملی (Agentic Coding) سرعت پیاده‌سازی را تسریع می‌کند @AndrewYNg
  • گرگلی اوروس گزارش می‌دهد که توسعه‌دهندگان SDK شاهد این هستند که مدل‌های زبان بزرگ (LLM) بیش از کاربران انسانی مستندات آن‌ها را می‌خوانند، که این امر منجر به بهینه‌سازی برای هر دو گروه مخاطب می‌شود @GergelyOrosz
  • جزئیات خرید ویندسرف (Windsurf) نشان می‌دهد که گوگل تقریباً ۴۰ مهندس هسته‌ای (Core Engineer) را به دست آورد، در حالی که ۱۸۵ نفر از کارکنان فروش را رها کرد و مهندسان بنیان‌گذار هر کدام هفت رقم (چند میلیون دلار) کسب کردند @garrytan
  • شرکت‌های هوش مصنوعی در حال استخدام نیروی فروش سریع‌تر از هر نقش دیگری هستند که نشان می‌دهد هوش مصنوعی با وجود اتوماسیون در سایر حوزه‌ها، جایگزین عملکردهای فروش نمی‌شود @GergelyOrosz
  • اتان مالیک اشاره می‌کند که وابستگی به مسیر (Path Dependency) در شرکت‌ها، بر اساس روابط با ارائه‌دهندگان خدمات ابری (آمازون، مایکروسافت، گوگل)، در حال ظهور است و محدودیت‌هایی در دسترسی و زمان‌بندی مدل‌های هوش مصنوعی ایجاد می‌کند @emollick
  • مدل‌های هوش مصنوعی عاملی نسل بعدی مانند گروک هوی (Grok Heavy)، جیمینای دیپ‌ثینک (Gemini Deep Think) و سیستم‌های آتی اوپن‌اِی‌آی، تقریباً پانزده برابر توکن بیشتری نسبت به سیستم‌های فعلی استفاده خواهند کرد که توضیح می‌دهد چرا طرح‌های پرو بیش از ۲۰۰ دلار هزینه دارند @AndrewCurran_

اخلاق و جامعه

  • ام‌آی‌تی تکنولوژی ریویو (MIT Technology Review) گزارش می‌دهد که شرکت‌های هوش مصنوعی تا حد زیادی ارائه‌ی سلب مسئولیت درباره‌ی توصیه‌های پزشکی را متوقف کرده‌اند و محققان هشدار می‌دهند که این امر خطرات را افزایش می‌دهد، زیرا مردم بیش از حد به راهنمایی‌های پزشکی هوش مصنوعی که معتبر به نظر می‌رسند اما احتمالاً نادرست هستند، اعتماد می‌کنند @techreview
  • مطالعه‌ای نشان می‌دهد که ۷۲ درصد از نوجوانان ایالات متحده از همدم‌های هوش مصنوعی استفاده کرده‌اند که نگرانی‌هایی را درباره‌ی وابستگی عاطفی و تأثیرات بر رشد ایجاد می‌کند @TechCrunch
  • کلر وو (Claire Vo) ابراز نگرانی می‌کند که چالش‌های تربیت دیجیتال ممکن است از زورگویی سایبری (cyberbullying) به دستکاری عاطفی کودکان توسط چت‌بات‌های هوش مصنوعی تغییر کند @clairevo

کاربردها

  • مرورگر کامت (Comet) پرپلکسیتی (Perplexity) تنها ۱۰ روز پس از انتشار، بالاتر از صفحه‌ی «ستاره دنباله‌دار» ویکی‌پدیا در نتایج جستجوی گوگل رتبه‌بندی می‌شود که نشان‌دهنده‌ی موفقیت سریع در بهینه‌سازی موتورهای جستجو (SEO) است @AravSrinivas
  • اندرو کران (Andrew Curran) نشان می‌دهد که ویو ۳ (Veo 3) به اعلان‌های (Prompt) با فرمت JSON و ایجاز بسیار خوب پاسخ می‌دهد و نتایج چشمگیری را از اعلان‌های تک‌جمله‌ای به دست می‌آورد @AndrewCurran_
  • اتان مالیک توانایی سونو اِی‌آی (Suno AI) در ایجاد قطعات موسیقی ۸ دقیقه‌ای منسجم با احساسات آشکار تنها از ورودی متن، با استفاده از «مرثیه‌ی اول» ریلکه (Rilke) به‌عنوان مثال را به نمایش می‌گذارد @emollick
  • بخش CSAIL ام‌آی‌تی (MIT CSAIL) یک رابط کاربری دستی توسعه می‌دهد که هر کسی را قادر می‌سازد تا ربات‌ها را برای وظایف تولیدی با استفاده از رویکردهای آموزش طبیعی، آموزش کینستتیک (Kinesthetic Training) و تله‌اپریشن (Teleoperation) آموزش دهد @MIT_CSAIL
  • آراویند سرینیواس (Aravind Srinivas) تکامل پرپلکسیتی (Perplexity) را از یک شرکت «هرچیزی بپرس» به یک شرکت «هرکاری بکن» با انتشار کامت (Comet) توصیف می‌کند @AravSrinivas
  • لانچ‌دارکلی (LaunchDarkly) استفاده‌ی سیستماتیک از عامل‌های هوش مصنوعی از جمله کرسر (Cursor)، ویندسرف (Windsurf) و دوین (Devin) را توسط ۱۰۰ مهندس در مخازن تولیدی (Production Repositories) نشان می‌دهد @clairevo

پژوهش‌ها

  • هر دو مدل o3 اوپن‌اِی‌آی و جیمینای دیپ‌ثینک گوگل به عملکردی یکسان در سطح مدال طلا در المپیاد جهانی ریاضی، با ۳۵ امتیاز از ۴۲ امتیاز، دست یافتند؛ آن‌ها مسائل ۱ تا ۵ را حل کردند اما در مسئله‌ی ۶ موفق نبودند که نشان‌دهنده‌ی قابلیت‌های همگرا در استدلال ریاضی است @simonw
  • جیمینای دیپ‌ثینک گوگل از تفکر موازی و چندین نمونه (Instance) که با ارزیابی خودکار (Self-Evaluation) با هم کار می‌کنند، استفاده می‌کند که نشان‌دهنده‌ی گذار از سیستم‌های استدلال رسمی تخصصی به مدل‌های زبان طبیعی عمومی است @AndrewCurran_
  • فرانسوا شوله (François Chollet) اشاره می‌کند که دستاورد مدال طلای المپیاد جهانی ریاضی صرفاً از طریق جستجو در فضای توکن در مدت ۴.۵ ساعت به دست آمد، با راه‌حل‌هایی که طبیعی به نظر می‌رسیدند @fchollet
  • محققان پیشنهاد می‌کنند که سیستم‌های هوش عمومی باید دارای مدل‌های جهان انطباقی (Adaptive World Models) باشند که قادر به ساخت و اصلاح سریع از طریق تعامل هستند، و «بازی‌های نوظهور» (Novel Games) را به‌عنوان چارچوب ارزیابی معرفی می‌کنند @LanceYing42
  • یوگین یان (Eugene Yan) پژوهشی را درباره‌ی خودرمزگذار‌های واریشنی کوانتیزه‌شده‌ی باقیمانده (Residual-Quantized Variational Autoencoders - RQ-VAE) به اشتراک می‌گذارد و اشاره می‌کند که ترفندهای چرخش (Rotation Tricks) عملکرد آموزش را با بیش از ۹۰ درصد استفاده از کدبوک (Codebook) به‌طور قابل‌توجهی بهبود می‌بخشند @eugeneyan
  • اتان مالیک تأکید می‌کند که هر دو اوپن‌اِی‌آی و گوگل از مدل‌های عمومی برای حل مسائل المپیاد جهانی ریاضی به زبان ساده استفاده کردند که شواهد فزاینده‌ای از توانایی مدل‌های زبان بزرگ (LLM) در تعمیم به وظایف جدید حل مسئله ارائه می‌دهد @emollick
  • کاربران چت‌جی‌پی‌تی اکنون روزانه ۲.۵ میلیارد اعلان (Prompt) ارسال می‌کنند که نشان‌دهنده‌ی مقیاس عظیم تعامل با هوش مصنوعی است @TechCrunch