اخبار هوش مصنوعی در 2025-07-21
مدلهای جدید هوش مصنوعی
- گوگل دیپمایند اعلام کرد که جیمینای دیپثینک در المپیاد جهانی ریاضی به عملکردی در سطح مدال طلا دست یافت و ۵ مسئله از ۶ مسئله را با اثباتهای ریاضی دقیق و به زبان طبیعی در محدودهی زمانی ۴.۵ ساعته حل کرد @demishassabis
- علیبابا کون۳-۲۳۵بی-ای۲۲بی-اینستراکت-۲۵۰۷ و نسخهی FP8 آن را منتشر کرد و حالت تفکر ترکیبی (hybrid thinking mode) را به نفع مدلهای مجزای اینستراکت (Instruct) و تینکینگ (Thinking) برای کیفیت بهتر کنار گذاشت @Alibaba_Qwen
- گوگل قابلیتهای بومی تبدیل متن به گفتار را برای مدلهای جیمینای ۲.۵ فلش و ۲.۵ پرو راهاندازی کرد که برای استفاده در مقیاس تولید، از جمله محتوای پادکست به سبک نوتبوکالام (NotebookLM)، در دسترس هستند @OfficialLoganK
تحلیل صنعت
- اوپناِیآی تا پایان سال جاری میلادی بیش از ۱ میلیون واحد پردازش گرافیکی (GPU) را آنلاین خواهد کرد، با برنامههایی برای مقیاسپذیری ۱۰۰ برابری از آن پس @sama
- چیپ هویان مشاهده میکند که محدودیتهای شناختی انسان هنگام کار با عاملهای کدنویسی هوش مصنوعی به گلوگاه تبدیل شدهاند، زیرا هوش مصنوعی میتواند چندین وظیفهی موازی را انجام دهد، در حالی که انسانها تنها میتوانند چند بستر (Context) را بهطور همزمان پیگیری کنند @chipro
- اندرو اِنگ گلوگاه مدیریت محصول را بهعنوان محدودیت جدید در توسعهی نرمافزار شناسایی میکند، جایی که تصمیمگیری در مورد اینکه چه چیزی ساخته شود به عامل محدودکننده تبدیل میشود، زیرا کدنویسی عاملی (Agentic Coding) سرعت پیادهسازی را تسریع میکند @AndrewYNg
- گرگلی اوروس گزارش میدهد که توسعهدهندگان SDK شاهد این هستند که مدلهای زبان بزرگ (LLM) بیش از کاربران انسانی مستندات آنها را میخوانند، که این امر منجر به بهینهسازی برای هر دو گروه مخاطب میشود @GergelyOrosz
- جزئیات خرید ویندسرف (Windsurf) نشان میدهد که گوگل تقریباً ۴۰ مهندس هستهای (Core Engineer) را به دست آورد، در حالی که ۱۸۵ نفر از کارکنان فروش را رها کرد و مهندسان بنیانگذار هر کدام هفت رقم (چند میلیون دلار) کسب کردند @garrytan
- شرکتهای هوش مصنوعی در حال استخدام نیروی فروش سریعتر از هر نقش دیگری هستند که نشان میدهد هوش مصنوعی با وجود اتوماسیون در سایر حوزهها، جایگزین عملکردهای فروش نمیشود @GergelyOrosz
- اتان مالیک اشاره میکند که وابستگی به مسیر (Path Dependency) در شرکتها، بر اساس روابط با ارائهدهندگان خدمات ابری (آمازون، مایکروسافت، گوگل)، در حال ظهور است و محدودیتهایی در دسترسی و زمانبندی مدلهای هوش مصنوعی ایجاد میکند @emollick
- مدلهای هوش مصنوعی عاملی نسل بعدی مانند گروک هوی (Grok Heavy)، جیمینای دیپثینک (Gemini Deep Think) و سیستمهای آتی اوپناِیآی، تقریباً پانزده برابر توکن بیشتری نسبت به سیستمهای فعلی استفاده خواهند کرد که توضیح میدهد چرا طرحهای پرو بیش از ۲۰۰ دلار هزینه دارند @AndrewCurran_
اخلاق و جامعه
- امآیتی تکنولوژی ریویو (MIT Technology Review) گزارش میدهد که شرکتهای هوش مصنوعی تا حد زیادی ارائهی سلب مسئولیت دربارهی توصیههای پزشکی را متوقف کردهاند و محققان هشدار میدهند که این امر خطرات را افزایش میدهد، زیرا مردم بیش از حد به راهنماییهای پزشکی هوش مصنوعی که معتبر به نظر میرسند اما احتمالاً نادرست هستند، اعتماد میکنند @techreview
- مطالعهای نشان میدهد که ۷۲ درصد از نوجوانان ایالات متحده از همدمهای هوش مصنوعی استفاده کردهاند که نگرانیهایی را دربارهی وابستگی عاطفی و تأثیرات بر رشد ایجاد میکند @TechCrunch
- کلر وو (Claire Vo) ابراز نگرانی میکند که چالشهای تربیت دیجیتال ممکن است از زورگویی سایبری (cyberbullying) به دستکاری عاطفی کودکان توسط چتباتهای هوش مصنوعی تغییر کند @clairevo
کاربردها
- مرورگر کامت (Comet) پرپلکسیتی (Perplexity) تنها ۱۰ روز پس از انتشار، بالاتر از صفحهی «ستاره دنبالهدار» ویکیپدیا در نتایج جستجوی گوگل رتبهبندی میشود که نشاندهندهی موفقیت سریع در بهینهسازی موتورهای جستجو (SEO) است @AravSrinivas
- اندرو کران (Andrew Curran) نشان میدهد که ویو ۳ (Veo 3) به اعلانهای (Prompt) با فرمت JSON و ایجاز بسیار خوب پاسخ میدهد و نتایج چشمگیری را از اعلانهای تکجملهای به دست میآورد @AndrewCurran_
- اتان مالیک توانایی سونو اِیآی (Suno AI) در ایجاد قطعات موسیقی ۸ دقیقهای منسجم با احساسات آشکار تنها از ورودی متن، با استفاده از «مرثیهی اول» ریلکه (Rilke) بهعنوان مثال را به نمایش میگذارد @emollick
- بخش CSAIL امآیتی (MIT CSAIL) یک رابط کاربری دستی توسعه میدهد که هر کسی را قادر میسازد تا رباتها را برای وظایف تولیدی با استفاده از رویکردهای آموزش طبیعی، آموزش کینستتیک (Kinesthetic Training) و تلهاپریشن (Teleoperation) آموزش دهد @MIT_CSAIL
- آراویند سرینیواس (Aravind Srinivas) تکامل پرپلکسیتی (Perplexity) را از یک شرکت «هرچیزی بپرس» به یک شرکت «هرکاری بکن» با انتشار کامت (Comet) توصیف میکند @AravSrinivas
- لانچدارکلی (LaunchDarkly) استفادهی سیستماتیک از عاملهای هوش مصنوعی از جمله کرسر (Cursor)، ویندسرف (Windsurf) و دوین (Devin) را توسط ۱۰۰ مهندس در مخازن تولیدی (Production Repositories) نشان میدهد @clairevo
پژوهشها
- هر دو مدل o3 اوپناِیآی و جیمینای دیپثینک گوگل به عملکردی یکسان در سطح مدال طلا در المپیاد جهانی ریاضی، با ۳۵ امتیاز از ۴۲ امتیاز، دست یافتند؛ آنها مسائل ۱ تا ۵ را حل کردند اما در مسئلهی ۶ موفق نبودند که نشاندهندهی قابلیتهای همگرا در استدلال ریاضی است @simonw
- جیمینای دیپثینک گوگل از تفکر موازی و چندین نمونه (Instance) که با ارزیابی خودکار (Self-Evaluation) با هم کار میکنند، استفاده میکند که نشاندهندهی گذار از سیستمهای استدلال رسمی تخصصی به مدلهای زبان طبیعی عمومی است @AndrewCurran_
- فرانسوا شوله (François Chollet) اشاره میکند که دستاورد مدال طلای المپیاد جهانی ریاضی صرفاً از طریق جستجو در فضای توکن در مدت ۴.۵ ساعت به دست آمد، با راهحلهایی که طبیعی به نظر میرسیدند @fchollet
- محققان پیشنهاد میکنند که سیستمهای هوش عمومی باید دارای مدلهای جهان انطباقی (Adaptive World Models) باشند که قادر به ساخت و اصلاح سریع از طریق تعامل هستند، و «بازیهای نوظهور» (Novel Games) را بهعنوان چارچوب ارزیابی معرفی میکنند @LanceYing42
- یوگین یان (Eugene Yan) پژوهشی را دربارهی خودرمزگذارهای واریشنی کوانتیزهشدهی باقیمانده (Residual-Quantized Variational Autoencoders - RQ-VAE) به اشتراک میگذارد و اشاره میکند که ترفندهای چرخش (Rotation Tricks) عملکرد آموزش را با بیش از ۹۰ درصد استفاده از کدبوک (Codebook) بهطور قابلتوجهی بهبود میبخشند @eugeneyan
- اتان مالیک تأکید میکند که هر دو اوپناِیآی و گوگل از مدلهای عمومی برای حل مسائل المپیاد جهانی ریاضی به زبان ساده استفاده کردند که شواهد فزایندهای از توانایی مدلهای زبان بزرگ (LLM) در تعمیم به وظایف جدید حل مسئله ارائه میدهد @emollick
- کاربران چتجیپیتی اکنون روزانه ۲.۵ میلیارد اعلان (Prompt) ارسال میکنند که نشاندهندهی مقیاس عظیم تعامل با هوش مصنوعی است @TechCrunch