اخبار هوش مصنوعی در 2025-07-21

مدل‌های جدید هوش مصنوعی

گوگل دیپ‌مایند اعلام کرد که جیمینای دیپ‌ثینک در المپیاد جهانی ریاضی به عملکردی در سطح مدال طلا دست یافت و ۵ مسئله از ۶ مسئله را با اثبات‌های ریاضی دقیق و به زبان طبیعی در محدوده‌ی زمانی ۴.۵ ساعته حل کرد @demishassabis
علی‌بابا کون۳-۲۳۵بی-ای۲۲بی-اینستراکت-۲۵۰۷ و نسخه‌ی FP8 آن را منتشر کرد و حالت تفکر ترکیبی (hybrid thinking mode) را به نفع مدل‌های مجزای اینستراکت (Instruct) و تینکینگ (Thinking) برای کیفیت بهتر کنار گذاشت @Alibaba_Qwen
گوگل قابلیت‌های بومی تبدیل متن به گفتار را برای مدل‌های جیمینای ۲.۵ فلش و ۲.۵ پرو راه‌اندازی کرد که برای استفاده در مقیاس تولید، از جمله محتوای پادکست به سبک نوت‌بوک‌ال‌ام (NotebookLM)، در دسترس هستند @OfficialLoganK

تحلیل صنعت

اوپن‌اِی‌آی تا پایان سال جاری میلادی بیش از ۱ میلیون واحد پردازش گرافیکی (GPU) را آنلاین خواهد کرد، با برنامه‌هایی برای مقیاس‌پذیری ۱۰۰ برابری از آن پس @sama
چیپ هویان مشاهده می‌کند که محدودیت‌های شناختی انسان هنگام کار با عامل‌های کدنویسی هوش مصنوعی به گلوگاه تبدیل شده‌اند، زیرا هوش مصنوعی می‌تواند چندین وظیفه‌ی موازی را انجام دهد، در حالی که انسان‌ها تنها می‌توانند چند بستر (Context) را به‌طور همزمان پیگیری کنند @chipro
اندرو اِنگ گلوگاه مدیریت محصول را به‌عنوان محدودیت جدید در توسعه‌ی نرم‌افزار شناسایی می‌کند، جایی که تصمیم‌گیری در مورد اینکه چه چیزی ساخته شود به عامل محدودکننده تبدیل می‌شود، زیرا کدنویسی عاملی (Agentic Coding) سرعت پیاده‌سازی را تسریع می‌کند @AndrewYNg
گرگلی اوروس گزارش می‌دهد که توسعه‌دهندگان SDK شاهد این هستند که مدل‌های زبان بزرگ (LLM) بیش از کاربران انسانی مستندات آن‌ها را می‌خوانند، که این امر منجر به بهینه‌سازی برای هر دو گروه مخاطب می‌شود @GergelyOrosz
جزئیات خرید ویندسرف (Windsurf) نشان می‌دهد که گوگل تقریباً ۴۰ مهندس هسته‌ای (Core Engineer) را به دست آورد، در حالی که ۱۸۵ نفر از کارکنان فروش را رها کرد و مهندسان بنیان‌گذار هر کدام هفت رقم (چند میلیون دلار) کسب کردند @garrytan
شرکت‌های هوش مصنوعی در حال استخدام نیروی فروش سریع‌تر از هر نقش دیگری هستند که نشان می‌دهد هوش مصنوعی با وجود اتوماسیون در سایر حوزه‌ها، جایگزین عملکردهای فروش نمی‌شود @GergelyOrosz
اتان مالیک اشاره می‌کند که وابستگی به مسیر (Path Dependency) در شرکت‌ها، بر اساس روابط با ارائه‌دهندگان خدمات ابری (آمازون، مایکروسافت، گوگل)، در حال ظهور است و محدودیت‌هایی در دسترسی و زمان‌بندی مدل‌های هوش مصنوعی ایجاد می‌کند @emollick
مدل‌های هوش مصنوعی عاملی نسل بعدی مانند گروک هوی (Grok Heavy)، جیمینای دیپ‌ثینک (Gemini Deep Think) و سیستم‌های آتی اوپن‌اِی‌آی، تقریباً پانزده برابر توکن بیشتری نسبت به سیستم‌های فعلی استفاده خواهند کرد که توضیح می‌دهد چرا طرح‌های پرو بیش از ۲۰۰ دلار هزینه دارند @AndrewCurran_

اخلاق و جامعه

ام‌آی‌تی تکنولوژی ریویو (MIT Technology Review) گزارش می‌دهد که شرکت‌های هوش مصنوعی تا حد زیادی ارائه‌ی سلب مسئولیت درباره‌ی توصیه‌های پزشکی را متوقف کرده‌اند و محققان هشدار می‌دهند که این امر خطرات را افزایش می‌دهد، زیرا مردم بیش از حد به راهنمایی‌های پزشکی هوش مصنوعی که معتبر به نظر می‌رسند اما احتمالاً نادرست هستند، اعتماد می‌کنند @techreview
مطالعه‌ای نشان می‌دهد که ۷۲ درصد از نوجوانان ایالات متحده از همدم‌های هوش مصنوعی استفاده کرده‌اند که نگرانی‌هایی را درباره‌ی وابستگی عاطفی و تأثیرات بر رشد ایجاد می‌کند @TechCrunch
کلر وو (Claire Vo) ابراز نگرانی می‌کند که چالش‌های تربیت دیجیتال ممکن است از زورگویی سایبری (cyberbullying) به دستکاری عاطفی کودکان توسط چت‌بات‌های هوش مصنوعی تغییر کند @clairevo

کاربردها

مرورگر کامت (Comet) پرپلکسیتی (Perplexity) تنها ۱۰ روز پس از انتشار، بالاتر از صفحه‌ی «ستاره دنباله‌دار» ویکی‌پدیا در نتایج جستجوی گوگل رتبه‌بندی می‌شود که نشان‌دهنده‌ی موفقیت سریع در بهینه‌سازی موتورهای جستجو (SEO) است @AravSrinivas
اندرو کران (Andrew Curran) نشان می‌دهد که ویو ۳ (Veo 3) به اعلان‌های (Prompt) با فرمت JSON و ایجاز بسیار خوب پاسخ می‌دهد و نتایج چشمگیری را از اعلان‌های تک‌جمله‌ای به دست می‌آورد @AndrewCurran_
اتان مالیک توانایی سونو اِی‌آی (Suno AI) در ایجاد قطعات موسیقی ۸ دقیقه‌ای منسجم با احساسات آشکار تنها از ورودی متن، با استفاده از «مرثیه‌ی اول» ریلکه (Rilke) به‌عنوان مثال را به نمایش می‌گذارد @emollick
بخش CSAIL ام‌آی‌تی (MIT CSAIL) یک رابط کاربری دستی توسعه می‌دهد که هر کسی را قادر می‌سازد تا ربات‌ها را برای وظایف تولیدی با استفاده از رویکردهای آموزش طبیعی، آموزش کینستتیک (Kinesthetic Training) و تله‌اپریشن (Teleoperation) آموزش دهد @MIT_CSAIL
آراویند سرینیواس (Aravind Srinivas) تکامل پرپلکسیتی (Perplexity) را از یک شرکت «هرچیزی بپرس» به یک شرکت «هرکاری بکن» با انتشار کامت (Comet) توصیف می‌کند @AravSrinivas
لانچ‌دارکلی (LaunchDarkly) استفاده‌ی سیستماتیک از عامل‌های هوش مصنوعی از جمله کرسر (Cursor)، ویندسرف (Windsurf) و دوین (Devin) را توسط ۱۰۰ مهندس در مخازن تولیدی (Production Repositories) نشان می‌دهد @clairevo

پژوهش‌ها

هر دو مدل o3 اوپن‌اِی‌آی و جیمینای دیپ‌ثینک گوگل به عملکردی یکسان در سطح مدال طلا در المپیاد جهانی ریاضی، با ۳۵ امتیاز از ۴۲ امتیاز، دست یافتند؛ آن‌ها مسائل ۱ تا ۵ را حل کردند اما در مسئله‌ی ۶ موفق نبودند که نشان‌دهنده‌ی قابلیت‌های همگرا در استدلال ریاضی است @simonw
جیمینای دیپ‌ثینک گوگل از تفکر موازی و چندین نمونه (Instance) که با ارزیابی خودکار (Self-Evaluation) با هم کار می‌کنند، استفاده می‌کند که نشان‌دهنده‌ی گذار از سیستم‌های استدلال رسمی تخصصی به مدل‌های زبان طبیعی عمومی است @AndrewCurran_
فرانسوا شوله (François Chollet) اشاره می‌کند که دستاورد مدال طلای المپیاد جهانی ریاضی صرفاً از طریق جستجو در فضای توکن در مدت ۴.۵ ساعت به دست آمد، با راه‌حل‌هایی که طبیعی به نظر می‌رسیدند @fchollet
محققان پیشنهاد می‌کنند که سیستم‌های هوش عمومی باید دارای مدل‌های جهان انطباقی (Adaptive World Models) باشند که قادر به ساخت و اصلاح سریع از طریق تعامل هستند، و «بازی‌های نوظهور» (Novel Games) را به‌عنوان چارچوب ارزیابی معرفی می‌کنند @LanceYing42
یوگین یان (Eugene Yan) پژوهشی را درباره‌ی خودرمزگذار‌های واریشنی کوانتیزه‌شده‌ی باقیمانده (Residual-Quantized Variational Autoencoders - RQ-VAE) به اشتراک می‌گذارد و اشاره می‌کند که ترفندهای چرخش (Rotation Tricks) عملکرد آموزش را با بیش از ۹۰ درصد استفاده از کدبوک (Codebook) به‌طور قابل‌توجهی بهبود می‌بخشند @eugeneyan
اتان مالیک تأکید می‌کند که هر دو اوپن‌اِی‌آی و گوگل از مدل‌های عمومی برای حل مسائل المپیاد جهانی ریاضی به زبان ساده استفاده کردند که شواهد فزاینده‌ای از توانایی مدل‌های زبان بزرگ (LLM) در تعمیم به وظایف جدید حل مسئله ارائه می‌دهد @emollick
کاربران چت‌جی‌پی‌تی اکنون روزانه ۲.۵ میلیارد اعلان (Prompt) ارسال می‌کنند که نشان‌دهنده‌ی مقیاس عظیم تعامل با هوش مصنوعی است @TechCrunch