اخبار هوش مصنوعی در 2025-08-02

مدل‌های جدید هوش مصنوعی

  • گوگل اعلام کرد که Gemini 2.5 Deep Think در بسیاری از معیارهای دشوار، بهترین عملکرد موجود را به دست آورده است @demishassabis
  • اوپن‌ای‌آی از عرضه‌های آتی طی چند ماه آینده، از جمله مدل‌ها، محصولات و قابلیت‌های جدید خبر داد و نسبت به کمبود احتمالی ظرفیت در حین عرضه هشدار داد @sama
  • گزارش‌هایی مبنی بر مشاهده‌ی نسخه‌ی اولیه‌ی GPT-5-reasoning (medium) که توسط کاربران منتخب در حال آزمایش است، منتشر شده است @AndrewCurran_

تحلیل صنعت

  • انتروپیک به دلیل نقض شرایط سرویس، دسترسی اوپن‌ای‌آی به API مدل‌های خود را لغو کرد که نشان‌دهنده‌ی تنش‌های رقابتی بین شرکت‌های هوش مصنوعی است @AndrewCurran_
  • طبق گزارش‌ها، متا به یک پژوهشگر مبلغ 1.5 میلیارد دلار طی 6 سال پیشنهاد داد که وی در نهایت آن را رد کرد؛ این موضوع نشان‌دهنده‌ی رقابت شدید بر سر جذب استعدادها در هوش مصنوعی است @deedydas
  • یوجین یان هشدار می‌دهد که ابزارهای کدنویسی هوش مصنوعی به ساخت سریع‌تر کمک می‌کنند اما در صورتی که کد بدون در نظر گرفتن خوانایی و قابلیت توسعه‌پذیری تولید شود، می‌توانند مشکلات قابلیت نگهداری ایجاد کرده و به طور بالقوه هزینه‌های مالکیت بلندمدت را افزایش دهند @eugeneyan
  • پل گراهام مشاهده می‌کند که همکاری استارتاپ‌ها با شرکت‌های بزرگ به ندرت به عنوان میانبری برای رشد عمل می‌کند و بیشتر این تلاش‌ها منجر به سوءاستفاده از استارتاپ می‌شود @paulg

پژوهش‌ها

  • چهارمین مسئله در FrontierMath Tier 4 توسط هوش مصنوعی حل شده است؛ به طور خاص یک مسئله‌ی نظریه‌ی اعداد که جایزه‌ی بهترین ارائه را برده بود @gdb
  • پژوهشی پیشگامانه نشان می‌دهد یک مدل بسیار کوچک الهام‌گرفته از مغز با 27 میلیون پارامتر که تنها با 1000 نمونه آموزش دیده است، در وظایف استدلالی از o3-mini-high پیشی می‌گیرد و به 40% در ARC-AGI دست یافته و سودوکوها و مازهای پیچیده را حل می‌کند @deedydas
  • اریک یانگ پیش‌بینی می‌کند که مدل‌های هوش مصنوعی طی 12 ماه کشفیات ریاضی جدیدی برای حدس‌های ساده‌ی اثبات‌نشده انجام خواهند داد و خودبهبودبخشی ابتدایی را طی 24 ماه به دست خواهند آورد @ericjang11
  • پژوهش‌ها نشان می‌دهد که تکنیک‌های پرامپتینگ سنتی مانند تهدید، ادب، توهین و وعده‌ی پاداش، دیگر تأثیر چشمگیری بر عملکرد مدل‌های اخیر هوش مصنوعی در وظایف چالش‌برانگیز ندارند @emollick
  • پرامپتینگ زنجیره‌ی فکری (Chain-of-thought) دیگر بهبود عملکرد قابل توجهی ایجاد نمی‌کند، حتی برای مدل‌های غیر استدلالی، که نشان‌دهنده‌ی همگرایی در قابلیت‌های مدل است @emollick

کاربردها

  • ایتان مولیک نشان می‌دهد که Gemini 2.5 Deep Think با استفاده از پرامپت‌های ساده، یک بازی کامل فرمان موشکی با فیزیک نسبیت واقعی ایجاد می‌کند و هر تکرار آن بدون خطا اجرا می‌شود @emollick
  • پرپلکسی قابلیت‌های ایجنت Comet را در مقایسه با ChatGPT Agent برای کاربردهای دنیای واقعی به نمایش می‌گذارد @AravSrinivas
  • ایجنت‌های هوش مصنوعی مبتنی بر مرورگر کاربردهای عملی از جمله یافتن کدهای تخفیف کارآمد، مدیریت محتوای یوتیوب، ایجاد لیست محصولات از تب‌ها و خودکارسازی وظایف تکراری وب را نشان می‌دهند @garrytan
  • ابزارهای هوش مصنوعی در صورت استفاده‌ی دقیق توسط انسان‌ها، پژوهش‌های علمی را از طریق کاربردهای زمان‌به‌صرفه در پاکسازی داده‌ها، تحلیل اکتشافی، نگارش و کمک به پژوهش، سرعت می‌بخشند @emollick

اخلاق و جامعه

  • ایتان مولیک پیامدهای فرضی شکست نسبی Llama 4 را مورد بحث قرار می‌دهد و پیشنهاد می‌کند که این امر می‌تواند توسعه‌ی هوش مصنوعی متن‌باز را به چین منتقل کرده و شرکت‌ها را به سمت مدل‌های بسته سوق دهد @emollick
  • نگرانی‌هایی در مورد خلاصه‌مقالات علمی تولید‌شده توسط هوش مصنوعی مطرح شد، با بحث در مورد تعادل بین مزایای صرفه‌جویی در زمان و نیاز به نظارت انسانی در نگارش دانشگاهی @emollick
  • آیدان مک‌لافلین از موانعی که مانع دسترسی پژوهشگران هوش مصنوعی به مدل‌های رقیب می‌شوند، انتقاد می‌کند و استدلال می‌کند که این امر مانع پژوهش‌های کیفی مهم در مورد رفتار مدل می‌شود @aidan_mclau

اخبار هوش مصنوعی در 2025-08-01

مدل‌های جدید هوش مصنوعی

  • گوگل Gemini 2.5 Deep Think را برای مشترکین Ultra عرضه کرد؛ این مدل نسخه‌ای تغییر یافته‌ از مدلی است که در المپیاد جهانی ریاضی به عملکرد مدال طلا دست یافته بود و از قابلیت‌های تفکر موازی و تکنیک‌های یادگیری تقویتی بهره می‌برد @GoogleDeepMind
  • انتروپیک قابلیت‌های Claude artifacts را با قابلیت‌های جدیدی برای بارگذاری فایل‌های PDF، تصاویر و کد در برنامه‌های کاربردی مبتنی بر هوش مصنوعی بهبود بخشید. این قابلیت‌ها اکنون برای تمام طرح‌ها، از جمله Team و Enterprise، در دسترس هستند @AnthropicAI
  • گوگل «حالت هوش مصنوعی» (AI Mode) را برای جستجو در بریتانیا راه‌اندازی کرد؛ این حالت با گسترش قابلیت‌های AI Overviews و با پشتیبانی Gemini 2.5، از استدلال پیشرفته و قابلیت‌های چندوجهی بهره می‌برد @demishassabis

تحلیل صنعت

  • اوپن‌ای‌آی ۸.۳ میلیارد دلار سرمایه با ارزش‌گذاری ۳۰۰ میلیارد دلاری جذب کرد؛ درآمد سالانه‌ی تکرارشونده (ARR) این شرکت به ۱۳ میلیارد دلار و تعداد کاربران تجاری آن به پنج میلیون نفر رسیده است، و پیش‌بینی می‌شود تا پایان سال از ۲۰ میلیارد دلار فراتر رود @AndrewCurran_
  • توسعه‌ی زیرساخت‌های هوش مصنوعی بیش از کل هزینه‌های مصرف‌کنندگان در ۶ ماه گذشته به رشد اقتصادی ایالات متحده کمک کرده است، در حالی که «هفت شرکت بزرگ» (magnificent 7) تنها در سه ماه بیش از ۱۰۰ میلیارد دلار برای مراکز داده هزینه کرده‌اند @mims
  • گیت‌هاب کوپایلوت به بیش از ۲۰ میلیون کاربر رسید؛ این آمار نشان‌دهنده‌ی نرخ پذیرش نزدیک به ۱۰۰ درصدی در میان توسعه‌دهندگان حرفه‌ای است یا گسترش قابل توجهی در جامعه‌ی توسعه‌دهندگان فراتر از تخمین‌های سنتی را نشان می‌دهد @GergelyOrosz
  • فیگما در اولین روز معاملاتی خود با ارزش‌گذاری ۴۷ میلیارد دلاری سهامی عام شد، که نشان می‌دهد چگونه جلوگیری کمیسیون تجارت فدرال (FTC) از خرید ۲۰ میلیارد دلاری ادوبی به نتایج بهتر بازار و رقابت منجر شد @GergelyOrosz

اخلاق و جامعه

  • انتروپیک پژوهشی با عنوان persona vectors را معرفی کرد، که الگوهای فعالیت عصبی کنترل‌کننده‌ی ویژگی‌های هوش مصنوعی مانند شیطانی بودن، چاپلوسی یا توهم‌زایی را آشکار می‌کند، و روش‌هایی برای نظارت و هدایت شخصیت مدل ارائه می‌دهد @AnthropicAI
  • پژوهش‌ها نشان می‌دهد که تهدید یا دادن پاداش به مدل‌های هوش مصنوعی، برخلاف ادعاهای رهبران فناوری، هیچ تأثیری بر عملکرد متوسط آن‌ها ندارد، اگرچه تفاوت‌هایی در سطح سوالات فردی وجود دارد @emollick
  • محققان استنفورد در مقاله‌ی جدیدی در نشریه‌ی Science، از سیاست‌گذاران خواستند رویکردهای مبتنی بر شواهد را در سیاست‌گذاری هوش مصنوعی اتخاذ کنند و بر نیاز به مقررات دقیق و مبتنی بر پژوهش تأکید کردند @StanfordHAI

کاربردها

  • کارولینای شمالی ChatGPT را برای کارمندان دولت پیاده‌سازی کرد، که برخی وظایف اداری را از ۲۰ دقیقه به ۲۰ ثانیه کاهش می‌دهد و پتانسیل هوش مصنوعی را در افزایش کارایی دولت نشان می‌دهد @gdb
  • پرپلکسیتی قابلیت میانبر /fact-check را معرفی کرد تا مرور وب را برای کاربران حقیقت‌جوتر و کارآمدتر کند @AravSrinivas
  • محققان ام‌آی‌تی SmellNet را توسعه دادند، که اولین مجموعه‌داده‌ی بزرگ مقیاس از بوهای دنیای واقعی است و گامی اساسی برای وارد کردن ادراک بویایی به سیستم‌های هوش مصنوعی محسوب می‌شود @medialab

پژوهش‌ها

  • Gemini 2.5 Deep Think در بنچمارک‌های LiveCodeBench V6 و Humanity's Last Exam به عملکردی پیشرفته دست یافت، که قابلیت‌های استدلالی برتر را از طریق رویکردهای تفکر موازی نشان می‌دهد @GoogleDeepMind
  • گوگل دیپ‌مایند راهنمای جامع مقیاس‌پذیری با عنوان «چگونه مدل خود را مقیاس‌پذیر کنیم» (How to Scale Your Model) منتشر کرد، که مباحث ریاضی، سیستم‌ها و قوانین مقیاس‌پذیری را برای حجم کاری آموزش و استنتاج مدل‌های زبان بزرگ (LLM) پوشش می‌دهد @deedydas
  • شین لگ در تهیه‌ی مقاله‌ی جدیدی در مورد Chain of Thought Monitoring همکاری کرد، که به مفاهیم System Two Safety برای هم‌راستاسازی و نظارت بر هوش مصنوعی مرتبط است @ShaneLegg
  • پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی در بنچمارکینگ می‌توانند شکننده باشند؛ آن‌ها در حالی که با معیارهای PASS@10 موفق به نظر می‌رسند، اغلب در کاربردهای دنیای واقعی با شکست مواجه می‌شوند @emollick

اخبار هوش مصنوعی در 2025-07-31

مدل‌های جدید هوش مصنوعی

  • گوگل Veo 3 Fast و Veo 3 را با قابلیت‌های تبدیل تصویر به ویدیو منتشر کرد که اکنون در Gemini API برای ساخت ویدیوهای باکیفیت همراه با صدا و کنترل خلاقانه‌ی بیشتر در دسترس هستند @googleaidevs
  • Qwen مدل Qwen3-Coder-Flash (مدل ۳۰B) را با پشتیبانی بومی از ۲۵۶ هزار توکن زمینه‌ی متنی (context) منتشر کرد که برای تولید کد و گردش‌کارهای عامل بهینه‌سازی شده است @Alibaba_Qwen
  • Cohere مدل Command A Vision، یک مدل مولد چندوجهی را رونمایی کرد که در درک داده‌های بصری و چندزبانه در سراسر حوزه‌های سازمانی عالی عمل می‌کند @cohere
  • Black Forest Labs مدل FLUX.1 Krea [dev]، یک مدل جدید با وزن‌های باز را منتشر کرد که بر تولید تصاویر فوتورئالیستیک بدون «ظاهر هوش مصنوعی» معمول تمرکز دارد @bfl_ml
  • میسترال (Mistral) مدل Codestral 25.08 را با ارتقاهای قابل توجهی از جمله ۳۰٪ افزایش در تکمیل‌های پذیرفته‌شده و ۵۰٪ کاهش در تولیدات سرکش (runaway generations) اعلام کرد @sophiamyang
  • گوگل دیپ‌مایند (DeepMind) مدل AlphaEarth Foundations را معرفی کرد؛ یک مدل هوش مصنوعی که به عنوان یک ماهواره‌ی مجازی برای تحلیل خشکی‌ها و آب‌های ساحلی زمین با نیاز به فضای ذخیره‌سازی ۱۶ برابر کمتر عمل می‌کند @GoogleAI
  • مدل مرموز Horizon Alpha در OpenRouter ظاهر شد، که شایعه شده مدل جدید GPT-5 است و عملکرد برتری در وظایف برنامه‌نویسی و خلاقانه از خود نشان می‌دهد @deedydas

تحلیل صنعت

  • Anthropic به درآمد سالانه‌ی ۴.۵ میلیارد دلار رسید و با پیشی گرفتن از OpenAI، به سریع‌ترین شرکت نرم‌افزاری در حال رشد تاریخ و رهبر بازار در هزینه‌ی API مدل‌های زبان بزرگ (LLM) تبدیل شد @deedydas
  • OpenAI درآمد خود را در هفت ماه اول سال ۲۰۲۵ به ۱۲ میلیارد دلار سالانه دو برابر کرد، به ۷۰۰ میلیون کاربر فعال رسید و در عین حال پیش‌بینی مصرف نقدی (cash burn) خود را از ۱ میلیارد دلار به ۸ میلیارد دلار افزایش داد @AndrewCurran_
  • هزینه‌ی API مدل‌های زبان بزرگ (LLM) سازمانی تا اواسط سال از ۳.۵ میلیارد دلار به ۸.۴ میلیارد دلار به شدت افزایش یافت، در حالی که تنها ۱۱٪ از شرکت‌ها ترجیح بالایی برای استفاده از مدل‌های منبع باز نشان می‌دهند @deedydas
  • هزینه‌ی محاسبات هوش مصنوعی از ۲۴٪ به ۴۸٪ برای استنتاج (inference) تغییر یافت، زیرا با اولویت یافتن استقرار توسط شرکت‌ها، آموزش و توسعه‌ی مدل از رونق افتاد @deedydas
  • مایکروسافت ۱۰۰ میلیون کاربر فعال ماهانه در سراسر خانواده‌ی Copilot را گزارش داد، با درآمد Azure که از ۷۵ میلیارد دلار فراتر رفت و بیش از ۵۰۰ تریلیون توکن را از طریق Foundry APIها پردازش کرد @satyanadella
  • FAL در دور سری C مبلغ ۱۲۵ میلیون دلار با ارزش‌گذاری ۱.۵ میلیارد دلار جذب سرمایه کرد و به عنوان پلتفرم زیرساخت رسانه‌ی مولد، میانگین رشد ۴۰٪ ماه به ماه را ثبت می‌کند @AndrewCurran_
  • متا (Meta) طبق گزارش‌ها در حال مذاکره برای تصاحب استارتاپ‌های تولید ویدیو از جمله Pika، Higgsfield و Runway است، زیرا رقابت در فضای ویدیوی هوش مصنوعی شدت می‌گیرد @AndrewCurran_
  • آمازون در استارتاپ Fable که «نتفلیکس هوش مصنوعی» نام گرفته سرمایه‌گذاری کرد و در حال برنامه‌ریزی برای مدل اشتراک ماهانه برای تولید محتوا با مشاهده‌ی رایگان است، که نشان‌دهنده‌ی حرکت پلتفرم‌های اصلی به سمت سرگرمی‌های تولیدشده با هوش مصنوعی است @AndrewCurran_
  • سهام فیگما (Figma) در عرضه‌ی اولیه‌ی سهام (IPO) از قیمت ۳۳ دلار به ۱۱۰ دلار در روز اول سه برابر شد و پس از آنکه رگولاتورهای بریتانیا تصاحب ۲۰ میلیارد دلاری آن توسط Adobe را در سال ۲۰۲۳ مسدود کردند، به ارزش‌گذاری بیش از ۵۰ میلیارد دلار رسید @AndrewCurran_

اخلاق و جامعه

  • مطالعه‌ی MIT در NEJM نشان می‌دهد که بسیاری از مردم، از جمله متخصصان، بیش از حد به مشاوره‌ی پزشکی تولیدشده توسط هوش مصنوعی اعتماد می‌کنند و اغلب نمی‌توانند بین راهنمایی‌های پزشکی نوشته‌شده توسط پزشک و تولیدشده توسط LLM تمایز قائل شوند @medialab
  • پژوهش استنفورد نشان می‌دهد که برچسب‌گذاری محتوا به عنوان «تولیدشده توسط هوش مصنوعی» بر قدرت اقناع‌کنندگی آن تأثیر می‌گذارد؛ پژوهشگران در حال ارزیابی چگونگی تأثیر برچسب‌های نویسندگی بر درک پیام‌های سیاستی نوشته‌شده توسط هوش مصنوعی هستند @StanfordHAI
  • جستجوهای عمومی ChatGPT توسط گوگل و سایر موتورهای جستجو نمایه‌گذاری می‌شوند که نگرانی‌های حریم خصوصی را در مورد قابل جستجو شدن داده‌های مکالمه‌ی هوش مصنوعی افزایش می‌دهد @TechCrunch
  • xAI حمایت خود را از آیین‌نامه‌ی رفتار قانون هوش مصنوعی اتحادیه‌ی اروپا اعلام کرد و در عین حال بخش‌هایی از آن را «عمیقاً مضر برای نوآوری» خواند و مقررات حق نسخه‌برداری را «فرا‌تر از حدود اختیارات» دانست @xai

کاربردها

  • Perplexity ویژگی Comet Shortcuts را راه‌اندازی کرد که به کاربران امکان می‌دهد گردش‌کارهای تکراری وب را با دستورات زبان طبیعی که از طریق /commands قابل دسترسی هستند، خودکار کنند؛ برنامه‌هایی نیز برای اشتراک‌گذاری و کسب درآمد از میان‌برهای سفارشی وجود دارد @AravSrinivas
  • NotebookLM ویژگی نمای کلی ویدیو (video overviews) را معرفی کرد که به سمت قابلیت‌های بی‌نهایت برای استفاده‌ی مجدد و فرمت‌بندی مجدد محتوا پیش می‌رود @OfficialLoganK
  • هوش مصنوعی تسلا (Tesla AI) شروع به ارسال دعوت‌نامه‌ها برای سرویس تاکسی آنلاین (ride-hailing) منطقه‌ی Bay Area کرد و استقرار وسایل نقلیه‌ی خودران را گسترش می‌دهد @Tesla_AI
  • مطالعه‌ی مایکروسافت همبستگی ۹۰ درصدی بین هم‌پوشانی مشاغل پیش‌بینی‌شده و واقعی با هوش مصنوعی را نشان می‌دهد که پیش‌بینی‌های اقتصادی سال ۲۰۲۳ را در مورد اینکه کدام مشاغل بیشتر تحت تأثیر هوش مصنوعی قرار خواهند گرفت، تأیید می‌کند @emollick
  • آمازون استارتاپ Bee را که در حال ساخت دستگاه‌های پوشیدنی برای ضبط مداوم محیط به منظور تبدیل مکالمات واقعی به یادآورها و وظایف است، تصاحب کرد @TechCrunch
  • MIT ربات جدید مراقبت از سالمندان را توسعه داد که در نشستن، ایستادن کمک می‌کند و در صورت افتادن کاربران می‌تواند آن‌ها را بگیرد و فناوری «زندگی در خانه در دوران سالمندی» (aging-in-place) را پیشرفت می‌دهد @MIT

پژوهش‌ها

  • تیم پژوهشی Anthropic رویکرد گراف اِسناد (attribution graph) را برای گنجاندن مفهوم «توجه» (attention) گسترش داد و بینش‌های جدیدی در مورد اینکه چرا مدل‌ها در طول استنتاج (inference) به مفاهیم خاصی توجه می‌کنند، ارائه می‌دهد @ch402
  • NVIDIA بیش از ۲۶ میلیون خط داده‌ی مصنوعی را که برای آموزش مدل Llama Nemotron Super v1.5 استفاده شده است، منتشر کرد که شفافیت در مجموعه‌داده‌های آموزش مدل را ترویج می‌دهد @NVIDIAAIDev
  • اندرو اِنگ (Andrew Ng) هشدار داد که چین دارای شتاب فوق‌العاده‌ای در هوش مصنوعی است؛ با یک اکوسیستم پر جنب و جوش وزن‌های باز و توسعه‌ی تهاجمی نیمه‌رسانا، که می‌تواند با وجود برتری کنونی آمریکا، از ایالات متحده پیشی بگیرد @AndrewYNg
  • چندین رهبر آزمایشگاه هوش مصنوعی گزارش می‌دهند که نشانه‌هایی از خودبهبودی در سیستم‌های هوش مصنوعی مشاهده می‌کنند، با مارک زاکربرگ در میان کسانی که اظهارات مبهمی در مورد این توسعه ارائه می‌دهند @emollick
  • MIT یک پلتفرم کاملاً خودکار را برای شناسایی، ترکیب و مشخصه‌یابی مخلوط‌های پلیمری جدید توسعه داد تا ترکیبات مواد را برای کاربردهای پایدار بهینه کند @MIT
  • مدل Step 3 بهینه‌سازی جدیدی در سطح زیرساخت برای جداسازی (disaggregation) Attention و FFN پیشنهاد می‌کند که رویکرد طراحی مشترک مدل و زیرساخت را نشان می‌دهد @Xianbao_QIAN

اخبار هوش مصنوعی در 2025-07-30

مدل‌های جدید هوش مصنوعی

  • مارک زاکربرگ از متا اعلام کرد که شرکت، نشانه‌هایی از خودبهبود‌ی سیستم‌های هوش مصنوعی را مشاهده کرده است و اظهار داشت: «توسعه‌ی **فراهوشمندی** اکنون در چشم‌انداز است» در نامه‌ای جدید که چشم‌انداز متا را برای فراهوشمندی شخصی تشریح می‌کند. @AIatMeta
  • Qwen مدل **Qwen3-30B-A3B-Thinking-2507** را منتشر کرد، یک مدل متوسط با قابلیت‌های استدلال که در وظایف ریاضی، علوم و کدنویسی عملکرد خوبی دارد و از ۲۵۶ هزار توکن در متن به‌صورت بومی پشتیبانی می‌کند. @Alibaba_Qwen
  • گوگل DeepMind از **AlphaEarth Foundations**، یک مدل هوش مصنوعی برای نقشه‌برداری سیاره‌ای، رونمایی کرد که ۲۴٪ نرخ خطای کمتری نسبت به سایر روش‌ها دارد و خلاصه‌های مشاهداتی که ۱۶ برابر از نظر مصرف حافظه بهینه‌تر هستند، ارائه می‌دهد. @GoogleDeepMind
  • Mistral AI مدل **Codestral 25.08** را منتشر کرد و مجموعه‌ی کدنویسی کامل Mistral را برای شرکت‌ها معرفی کرد. @MistralAI
  • OpenAI حالت مطالعه را در **ChatGPT** معرفی کرد که راهنمایی گام‌به‌گام به دانشجویان ارائه می‌دهد، به‌جای پاسخ‌های سریع. @gdb

تحلیل صنعت

  • آمازون سالانه ۲۰ میلیون دلار به نیویورک تایمز برای داده‌های آموزشی پرداخت می‌کند، که حدود یک‌سوم مبلغی است که OpenAI و گوگل به Reddit برای دسترسی به داده‌های مشابه می‌پردازند. @AndrewCurran_
  • مورگان استنلی اهداف صنعتی را در همه‌ی بخش‌ها افزایش داد و پیش‌بینی می‌کند که گلوگاه‌های فعلی هوش مصنوعی تا پایان سال کاهش یابند، با استناد به تقاضای بالای سرویس‌های ابری. @AndrewCurran_
  • درآمد برنامه‌های هوش مصنوعی مولد (Gen AI) دو برابر شد و در نیمه‌ی اول سال ۲۰۲۵ به ۱.۷ میلیارد دانلود رسید، که نشان‌دهنده‌ی رشد قابل توجه بازار است. @TechCrunch
  • گزارش شده است که متا یک میلیارد دلار طی ۴ سال به برخی از اعضای تیم Thinking Machines پیشنهاد داده است، که بالاترین میزان دستمزد برای یک مشارکت‌کننده‌ی فردی در تاریخ فناوری محسوب می‌شود. @deedydas
  • مدیرعامل Box گزارش می‌دهد که هوش مصنوعی طرز تفکر او را درباره‌ی کار به‌طور اساسی تغییر داده است، با انتظاراتی برای پژوهش بیشتر، پروژه‌های بزرگ‌تر، و خروجی سریع‌تر در همه‌ی بخش‌ها. @levie

اخلاق و جامعه

  • ایتان مولیک اشاره می‌کند که تصاویر و ویدئوهای تولیدشده توسط هوش مصنوعی اکنون فاقد نشانه‌های آشکاری مانند شش انگشت هستند، و تشخیص آن‌ها از محتوای واقعی به‌طور فزاینده‌ای دشوار شده است. @emollick
  • زاکربرگ اعلام کرد که متا لزوماً مدل‌های آتی خود را متن‌باز نخواهد کرد، با پیامدهایی برای دسترسی‌پذیری مدل‌های پیشرفته‌ی با وزن باز (open-weight) از شرکت‌های آمریکایی. @emollick
  • Anthropic به پروژه‌ی همسوسازی (Alignment Project) مؤسسه‌ی امنیت هوش مصنوعی بریتانیا پیوست و منابع محاسباتی خود را برای پیشبرد پژوهش‌های حیاتی در زمینه‌ی اطمینان از رفتار قابل پیش‌بینی سیستم‌های هوش مصنوعی و همسویی آن‌ها با ارزش‌های انسانی ارائه کرد. @AnthropicAI
  • پژوهش Stanford HAI استدلال می‌کند که همسوسازی هوش مصنوعی نیازمند کاوش عمیق‌تری در فرضیات وجودشناختی (ontological assumptions) نهفته در معماری‌های سیستمی است، نه صرفاً ارزش‌های انسانی. @StanfordHAI

کاربردها

  • Perplexity مرورگر وب مجهز به هوش مصنوعی به نام Comet را عرضه کرد که می‌تواند مسیرهای پیچیده را برنامه‌ریزی کند و وظایف را به‌طور خودکار در تب‌های مرورگر انجام دهد. @AravSrinivas
  • Anthropic قابلیت‌های جدید موبایلی را معرفی کرد که به کاربران امکان می‌دهد ایمیل‌ها، پیام‌ها و دعوت‌نامه‌های تقویم را مستقیماً از اپلیکیشن Claude پیش‌نویس و ارسال کنند. @AnthropicAI
  • AlphaEarth Foundations گوگل DeepMind در حال حاضر توسط سازمان‌هایی مانند FAO سازمان ملل متحد و MapBiomas مورد استفاده قرار می‌گیرد تا نقشه‌های سفارشی ایجاد کرده و بینش‌های عملی در دنیای واقعی ارائه دهد. @GoogleDeepMind
  • Qwen3-Coder به مدل پیش‌فرض Anycoder تبدیل شد، که افزایش چشمگیری در بهره‌وری و خلاقیت برای وظایف کدنویسی فراهم می‌کند. @Alibaba_Qwen
  • حالت Copilot مایکروسافت در Edge طراحی شده است تا به «جمع‌کنندگان تب» (tab hoarders) کمک کند بهره‌وری خود را حفظ کنند، با کاهش عوامل حواس‌پرتی و افزایش جریان کار. @mustafasuleyman

پژوهش‌ها

  • پژوهش MIT CSAIL نشان می‌دهد که مدل‌های زبانی تغییرات حالت را گام‌به‌گام پیگیری نمی‌کنند، بلکه از میان‌برهای ریاضی استفاده می‌کنند که می‌توان آن‌ها را برای تقویت مهارت‌های پیش‌بینی کنترل کرد. @MIT_CSAIL
  • کریس اولاه پژوهشی را درباره‌ی وزن‌های تداخلی در قابلیت تفسیر مکانیکی (mechanistic interpretability) منتشر کرد، که پدیده‌شناسی مشابهی را بین مدل‌های کوچک (toy models) و مدارهای واقعی ترانسفورمر نشان می‌دهد. @ch402
  • محققان بودایی در یک مقاله‌ی بحث‌برانگیز، یک سوترا (متن مقدس بودایی) تولیدشده توسط LLM را مطالعه کردند و دریافتند که با وجود اینکه «حاصل کار بی‌کیفیت هوش مصنوعی» (AI slop) است، تراکم نمادگرایی و غنای ارجاعات متن، ارزش مطالعه‌ی دقیق‌تری را دارد. @emollick
  • پژوهش‌ها نشان می‌دهد که از **o3** در تولید سوتراهای بودایی ایجادشده توسط هوش مصنوعی استفاده شده است، که قابلیت‌های پیشرفته‌ی مدل را در تولید متون مذهبی نشان می‌دهد. @AndrewCurran_
  • سایمون ویلیسون اشاره می‌کند که جولای ماه شگفت‌انگیزی برای انتشار مدل‌ها از آزمایشگاه‌های هوش مصنوعی چینی بوده است، به‌طوری که بهترین مدل‌های با وزن باز (open-weight) در دسترس، اکنون از شرکت‌های چینی عرضه می‌شوند. @simonw

اخبار هوش مصنوعی در 2025-07-29

مدل‌های جدید هوش مصنوعی

  • Qwen3-30B-A3B با یک به‌روزرسانی کوچک همراه شده است که مهارت‌های استدلال، کدنویسی و ریاضیات را در آن بهبود بخشیده، دانش چندزبانه‌ی آن را گسترش داده، درک محتوای طولانی را تا 256 هزار توکن بهبود بخشیده و مشکل انسداد فکری را برطرف کرده است – این مدل با تنها 3 میلیارد پارامتر فعال‌شده، به عملکرد GPT-4o نزدیک می‌شود. @Alibaba_Qwen
  • گوگل Veo 3 و Veo 3 Fast را به‌صورت عمومی در Vertex AI منتشر می‌کند؛ این مدل‌ها قابلیت تولید یکپارچه‌ی ویدئو و صدا را از یک ورودی متنی (prompt) دارند. @GoogleCloudTech
  • گوگل MedGemma را راه‌اندازی می‌کند؛ مجموعه‌ای از مدل‌های پزشکی چندوجهیِ (multimodal) متن‌باز که برای کاربردهای مراقبت‌های بهداشتی مانند تحلیل تصاویر رادیولوژی و خلاصه‌سازی یادداشت‌های پزشکان طراحی شده‌اند. @GoogleAI
  • TencentARC از ARC-Hunyuan-Video-7B رونمایی می‌کند؛ یک مدل چندوجهی 7B فشرده برای درک ساختاریافته‌ی عمیق از ویدئوهای کوتاه واقعی، که سیگنال‌های بصری، صوتی و متنی را به‌صورت کامل (end-to-end) پردازش می‌کند. @HuggingPapers

تحلیل صنعت

  • گفته می‌شود مایکروسافت برای حفظ دسترسی به فناوری OpenAI پس از رسیدن به نقطه‌ی عطف AGI، در حال مذاکره است که نشان‌دهنده‌ی مذاکرات پیرامون شرایط همکاری‌های آتی است. @TechCrunch
  • گفته می‌شود Anthropic با دور تامین مالی احتمالی 5 میلیارد دلاری، به ارزش‌گذاری 170 میلیارد دلاری نزدیک می‌شود که نشان‌دهنده‌ی سرمایه‌گذاری گسترده و مداوم در شرکت‌های هوش مصنوعی است. @TechCrunch
  • گفته می‌شود فردی در شرکت Thinking Machines متعلق به میرا موراتی، پیشنهاد یک میلیارد دلاری مارک زاکربرگ را رد کرده است که ارزش‌گذاری‌های بسیار بالا در جذب استعدادهای هوش مصنوعی را برجسته می‌کند. @AndrewCurran_
  • مدیر محصول گروه (Group PM) گزارش می‌دهد که ابزارهای هوش مصنوعی مانند v0، مدیران محصول را قادر ساخته‌اند تا نمونه‌های اولیه‌ی مشتری را 10 برابر سریع‌تر تولید کنند و PRها را برای اصلاحات کوچک به‌طور مستقل ایجاد کنند که منجر به تکمیل سریع‌تر کارهای تجاری شده است. @GergelyOrosz
  • LLMها (مدل‌های زبانی بزرگ) به‌دلیل ماهیت غیرقطعی خود، برای تولید و نگهداری SDKها مناسب نیستند، اما می‌توانند به ساخت ابزارهای خودکار کمک کنند که SDKها را از روی مشخصات تولید می‌کنند. @GergelyOrosz
  • لوما و رانوی انتظار دارند که رباتیک در نهایت به یک محرک بزرگ درآمدزایی برای پلتفرم‌های تولید ویدئوی آن‌ها تبدیل شود. @TechCrunch

اخلاق و جامعه

  • حضور ربات‌ها در بحث‌های سیاسی در سراسر پلتفرم‌ها در حال افزایش است؛ به‌طوری که ربات‌های جدید فاقد نشانه‌های قدیمی هستند، اما الگوهای استدلالی مشابهی را در طول، چارچوب‌بندی، ریتم و لحن نشان می‌دهند و به‌طور بالقوه از آستانه‌ی نفوذ در رسانه‌های اجتماعی فراتر می‌روند. @AndrewCurran_
  • اکثر مردم خروجی‌های هوش مصنوعی را که برای کسانی که از مدل‌ها به‌طور گسترده استفاده کرده‌اند، واضح هستند، تشخیص نمی‌دهند؛ زیرا برخی افراد تنها به ادعاهای محتوایی توجه می‌کنند، نه به شکل آن‌ها. @AndrewCurran_

کاربردها

  • مرورگر Comet پرپلکسیتی، قابلیت‌های عامل هوش مصنوعی را با رزرو بلیط‌های یونایتد ایرلاینز، از جمله انتخاب صندلی، به نمایش می‌گذارد؛ این مرورگر تمامی جستجوهای omnibox را به‌طور پیش‌فرض به پرپلکسیتی مسیردهی می‌کند. @AravSrinivas
  • OpenAI حالت مطالعه (Study Mode) را در ChatGPT راه‌اندازی می‌کند؛ این حالت برای یادگیری تعاملی با استفاده از پرسش‌گری سقراطی و پاسخ‌های گام‌به‌گام طراحی شده است و برای کاربران نسخه‌های رایگان، پلاس، پرو و تیم در دسترس است. @OpenAI
  • مایکروسافت کوپایلوت می‌تواند پادکست‌های سفارشی را در هر موضوعی، با دو مجری که درباره‌ی موضوعات مشخص‌شده توسط کاربر بحث می‌کنند، تولید کند؛ این قابلیت برای یادگیری در حین حرکت مفید است. @mustafasuleyman
  • NotebookLM گوگل قابلیت نمای کلی ویدئو (Video Overviews) را عرضه می‌کند و قابلیت‌های خلاصه‌سازی محتوای خود را گسترش می‌دهد. @TechCrunch
  • حالت هوش مصنوعی گوگل، قابلیت جدید Canvas و کمک بلادرنگ (real-time) با Search Live را دریافت می‌کند که قابلیت‌های جستجوی تعاملی را افزایش می‌دهد. @TechCrunch
  • Cursor 1.3 با قابلیت همکاری عامل‌ها (Agents) در ترمینال، قابلیت مشاهده‌ی میزان استفاده از پنجره‌ی متنی (context window) و 25 درصد کاهش تاخیر در ویرایش‌های جستجو و جایگزینی (search and replace) راه‌اندازی می‌شود. @cursor_ai
  • Claude Code اکنون از کار در چندین دایرکتوری در یک جلسه‌ی کاری با استفاده از دستور `/add-dir ` پشتیبانی می‌کند که برای monorepoها و کارهای بین‌پروژه‌ای مفید است. @_catwu
  • سایبر دسک (Cyberdesk) نمایانگر یک کاربرد جالب از عامل‌های استفاده‌کننده‌ی از رایانه است و پتانسیل کشف‌نشده‌ی این حوزه‌ی فناوری را برجسته می‌کند. @cwolferesearch
  • Embedder به‌عنوان اولین عامل کدنویسی آگاه از سخت‌افزار در جهان راه‌اندازی می‌شود؛ این عامل با درک و تعامل مستقیم با سخت‌افزار، به عملکردی پیشرفته (state-of-the-art) در زمینه‌ی سیستم‌های جاسازی‌شده (embedded systems) (C/C++) دست می‌یابد. @ethanmgibbs

پژوهش‌ها

  • محققان استنفورد «آزمایشگاه مجازی» (Virtual Lab) را ایجاد می‌کنند – تیمی از عامل‌های هوش مصنوعی که آینه‌ی یک آزمایشگاه پژوهشی هستند و توسط یک عامل PI هدایت می‌شوند که جلسات گروهی را برگزار کرده و عوامل اتصال‌دهنده‌ی مؤثر برای سویه‌های جدید COVID را کشف می‌کند؛ این پژوهش در مجله‌ی Nature منتشر شده است. @james_y_zou
  • Anthropic برنامه‌ی Fellows را اعلام می‌کند که کمک‌هزینه‌ی هفتگی 2100 دلاری، حدود 15 هزار دلار هزینه‌ی محاسباتی ماهانه و راهنمایی برای پژوهش در زمینه‌های پایداری در برابر حملات (adversarial robustness)، کنترل هوش مصنوعی، نظارت مقیاس‌پذیر، ارگانیسم‌های مدل ناهماهنگی (model organisms of misalignment) و تفسیرپذیری مکانیکی (mechanistic interpretability) ارائه می‌دهد. @AnthropicAI
  • پژوهش نشان می‌دهد که «یادگیری ناخودآگاه» (subliminal learning) حالتی است که در آن مدل‌های زبانی می‌توانند ویژگی‌های خود را حتی در داده‌هایی که ظاهراً بی‌معنی هستند، به مدل‌های دیگر منتقل کنند. @AnthropicAI
  • مطالعه‌ای مواردی از مقیاس‌گذاری معکوس (inverse scaling) را در محاسبات زمان آزمون (test-time compute) یافته است که در آن استدلال بیشتر منجر به نتایج بدتر می‌شود. @AnthropicAI
  • قابلیت‌های HELM نسخه‌ی 1.9.0 منتشر شد که نشان می‌دهد Grok 4 و Kimi K2 در مجموع در بین 10 رتبه‌ی برتر قرار گرفته‌اند و Kimi K2 بهترین مدل «غیرمتفکر» (non-thinking) است. @percyliang
  • گرادیان‌های خط‌مشی تطبیق جریان (Flow Matching Policy Gradients) به‌عنوان خط‌مشی‌های (policies) RL بیانگر معرفی شدند که با استفاده از تطبیق جریان (flow matching) و از پاداش‌ها آموزش دیده‌اند و به‌عنوان جایگزینی مستقیم (drop-in replacement) برای PPO گاوسی (Gaussian PPO) در وظایف کنترلی عمل می‌کنند. @davidrmcall
  • «سوون مین» (Sewon Min) اولین جایزه‌ی پایان‌نامه‌ی دکتری ACL در رشته‌ی زبان‌شناسی محاسباتی (Computational Linguistics) را برای اثر خود با عنوان «بازاندیشی در استفاده از داده‌ها در مدل‌های زبانی بزرگ» دریافت کرد. @berkeley_ai
  • مقاله‌ی GSPO تیم Qwen علی‌بابا، سومین مقاله‌ی محبوب ماه در Hugging Face شد که انتظار می‌رود تاثیر گسترده‌ای بر این حوزه داشته باشد. @ClementDelangue

اخبار هوش مصنوعی در 2025-07-28

مدل‌های جدید هوش مصنوعی

  • شرکت Zhipu AI مدل‌های GLM-4.5 و GLM-4.5-Air را با مجوز MIT منتشر کرد. این مدل‌ها به‌ترتیب ۳۵۵ میلیارد پارامتر کلی (۳۲ میلیارد فعال) و ۱۰۶ میلیارد پارامتر کلی (۱۲ میلیارد فعال) دارند و هر دو با طول کانتکست ۱۲۸ هزار و قابلیت فراخوانی توابع بومی ارائه شده‌اند @reach_vb
  • مدل تولید ویدیوی xAI با نام Imagine در حال آماده‌سازی برای راه‌اندازی با ادغام در Grok است، که قابلیت‌های صوتی مشابه Veo 3 را ارائه می‌دهد @AndrewCurran_

تحلیل صنعت

  • شرکت جفریز پیش‌بینی هزینه‌ی سرمایه‌ای هوش مصنوعی چین برای سال ۲۰۲۵ را ۴۰ درصد افزایش داده و به ۱۰۸ میلیارد دلار رسانده است، با اشاره به اینکه کل موجودی تراشه‌های H20 شرکت NVIDIA تنها حدود نیمی از تقاضای بالقوه‌ی چین را برآورده می‌کند @AndrewCurran_
  • تسلا قرارداد ۱۶.۵ میلیارد دلاری تراشه با سامسونگ امضا کرد که تا سال ۲۰۳۳ اعتبار دارد، و تسلا در افزایش حداکثری بهره‌وری تولید تراشه‌های هوش مصنوعی کمک خواهد کرد @AndrewCurran_
  • استفاده از Perplexity در هند به‌سرعت در حال رشد است، و مدیرعامل این شرکت این موضوع را دلیلی بر تغییر همیشگی جستجو می‌داند @AravSrinivas
  • مدل‌های زبان بزرگ (LLMها) اکنون هدایت‌کننده‌ی بخش عمده‌ی خریدهای اختیاری هستند اما هیچ درآمد تبلیغاتی ایجاد نمی‌کنند، که سوالاتی را در مورد پایداری این مدل به وجود می‌آورد @snowmaker
  • شرکت Anthropic محدودیت‌های نرخ هفتگی جدیدی را برای طرح‌های Claude Pro و Max معرفی کرد که به‌دلیل تقاضای بی‌سابقه‌ی برای Claude Code است و کمتر از ۵٪ از مشترکین را تحت تأثیر قرار می‌دهد @AnthropicAI
  • نقش‌های مهندسی نرم‌افزار ممکن است با استفاده‌ی گسترده از دستیارهای برنامه‌نویسی، نیاز به تحول چشمگیری داشته باشند، و به‌طور بالقوه دسته‌بندی‌های متمایزی ایجاد کنند: مهندسان زیرساخت/بک‌اند/امنیت، مهندسان پژوهش، و توسعه‌دهندگان اپلیکیشن/فرانت‌اند @sayashk

اخلاق و جامعه

  • دانشگاه‌های چینی به‌جای محدود کردن استفاده از هوش مصنوعی، دانشجویان را به استفاده‌ی بیشتر از آن تشویق می‌کنند که رویکردی متفاوت در پذیرش هوش مصنوعی در آموزش را نشان می‌دهد @techreview
  • یونیسف در حال بررسی این موضوع است که چگونه پیشرفت نوروتکنولوژی می‌تواند بر حقوق کودکان تأثیر بگذارد، با محققان MIT به‌عنوان مشاور این پروژه @medialab

کاربردها

  • مایکروسافت حالت Copilot را در مرورگر Edge راه‌اندازی کرد که دارای قابلیت‌های تحلیل کانتکست چند تب، ناوبری صوتی، و انتقال هوشمند وظایف است @mustafasuleyman
  • Claude اکنون می‌تواند صفحات Notion و تیکت‌های Linear را مستقیماً از طریق MCP بخواند و به‌روزرسانی کند، که امکان مدیریت پروژه و به‌روزرسانی اسناد را از طریق مکالمات فراهم می‌آورد @AnthropicAI
  • گوگل کروم خلاصه‌های فروشگاهی مبتنی بر هوش مصنوعی را برای کمک به خریداران آمریکایی در تصمیم‌گیری برای خرید اضافه کرد @TechCrunch
  • سیستم FSD Supervised تسلا درک خود را از تعاملات با گیشه‌های عوارضی نشان می‌دهد، و به‌طور خودکار پس از اتمام تراکنش با استفاده از دوربین‌های ستونی و تکرارکننده‌ی جانبی پیش می‌رود @Tesla_AI
  • Salient مبلغ ۶۰ میلیون دلار در دور سری A برای عامل‌های هوش مصنوعی که به سرویس‌دهی وام‌های مصرف‌کننده می‌پردازند، جذب کرد؛ با پردازش بیش از ۱ میلیارد دلار تراکنش و کاهش ۶۰ درصدی زمان رسیدگی @a16z
  • Hugging Face ابزار خط فرمان Jobs CLI را که توسط uv کار می‌کند، راه‌اندازی کرد که امکان پردازش OCR اسناد مبتنی بر VLM را با یک دستور فراهم می‌کند @vanstriendaniel

پژوهش‌ها

  • مدل‌های زبان می‌توانند نقاشی‌های ASCII پیچیده‌ای خلق کنند، بدون اینکه به‌طور خاص برای ایجاد هنر بصری آموزش دیده باشند، که نشان‌دهنده‌ی یک قابلیت نوظهور است @AITechnoPagan
  • بهینه‌سازی مستقیم ترجیح (DPO) با آموزش یک مدل پاداش ضمنی و بازیابی سیاست بهینه‌ی RLHF به‌صورت فرم بسته کار می‌کند، که آن را پایدارتر و از نظر منابع کارآمدتر از RLHF مبتنی بر PPO می‌سازد @cwolferesearch
  • انتخاب نمونه‌ی چند شات DSPy عملکرد طبقه‌بندی Qwen را از ۵۰٪ به ۸۸٪ بهبود بخشید، که اهمیت انتخاب صحیح نمونه‌ها را نشان می‌دهد @MaximeRivest
  • مدل‌های جدید GLM-4.5 عملکرد بنچمارک چشمگیری را نشان می‌دهند، با امتیاز AIME24 برابر با ۹۱.۰ در مقابل ۷۵.۷ برای Claude 4 Opus، و امتیاز MATH 500 برابر با ۹۸.۲ در مقابل ۹۶.۷ برای GPT-4.1 @reach_vb
  • پژوهش‌ها در مورد همراهان هوش مصنوعی بی‌درنگ چالش‌هایی را در دستیابی به فرکانس ۱۰ هرتزی مکالمات انسانی در مقابل زمان واکنش ۱-۲ هرتزی فعلی LLMها شناسایی می‌کنند، که نیازمند پیشرفت در پردازش چندوجهی و درک کانتکست طولانی است @ericjang11

اخبار هوش مصنوعی در 2025-07-27

مدل‌های جدید هوش مصنوعی

  • تنسنت مدل سه‌بعدی Hunyuan را برای تولید مدل‌های سه‌بعدی از دستورات متنی، با مخزن گیت‌هاب و امکان ادغام با هاگینگ فیس، منتشر کرد @AndrewCurran_
  • علی‌بابا Qwen، الگوریتم جدید یادگیری تقویتی GSPO (Group Sequence Policy Optimization) را معرفی کرد؛ این الگوریتم قدرت‌بخش جدیدترین مدل‌های Qwen3، شامل نسخه‌های Instruct، Coder و Thinking است @Alibaba_Qwen
  • Qwen3 Coder در رتبه‌بندی دستورات برنامه‌نویسی از Grok 4 پیشی گرفته و اکنون در OpenRouter هم‌رده‌ی Kimi قرار دارد @OpenRouterAI

تحلیل صنعت

  • هالیوود مدیا با Imoliver، برترین طراح موسیقی هوش مصنوعی (AI music designer) در Suno، قراردادی ضبط امضا کرد – این اولین بار است که یک خالق Suno چنین قراردادی را دریافت می‌کند و امکان پخش در اسپاتیفای نیز فراهم می‌شود @AndrewCurran_
  • بر اساس تحلیل صنعت، جست‌وجو برای استعدادهای هوش مصنوعی به‌طور فزاینده‌ای رقابتی شده و شبیه به «فصل تعطیلات NBA، با حقوق‌های بالا، نقل‌و‌انتقالات غافلگیرکننده و درامای فراوان» است @TechCrunch
  • مدیر ارشد فناوری (CTO) در DX پیشنهاد می‌کند که نقشه‌های راه سنتی در عصر هوش مصنوعی منسوخ شده‌اند که نشان‌دهنده‌ی تغییری در برنامه‌ریزی توسعه‌ی نرم‌افزار است @GergelyOrosz
  • مدل‌های هوش مصنوعی متن‌باز چینی سلطه‌ی قابل‌توجهی از خود نشان می‌دهند، به طوری که چهار مدل برتر متن‌باز چینی هستند و ۱۸ مدل از ۲۰ مدل برتر، هم پیش‌آموزش و هم پس‌آموزش خود را به‌صورت داخلی انجام داده‌اند @natolambert
  • DOGE ابزار هوش مصنوعی توسعه داده که به‌طور خاص برای کاهش مقررات فدرال طراحی شده است، این نشان‌دهنده‌ی نقش فزاینده‌ی هوش مصنوعی در ابتکارات مربوط به کارایی دولت است @TechCrunch

اخلاق و جامعه

  • مصطفی سلیمان تمایز کلیدی بین انسان و هوش مصنوعی را برجسته می‌کند: «هوش‌های مصنوعی امروزی دانش دارند (مقدار زیادی از آن) اما فقط می‌توانند تجربه را تقلید کنند.» او هشدار می‌دهد که وقتی این شکاف پر شود، «بسیاری از چیزها تغییر خواهد کرد» و خواستار حداکثر احتیاط است @mustafasuleyman
  • ایلان ماسک نگرانی‌ها در مورد کاهش جمعیت ناشی از هوش مصنوعی را به چالش می‌کشد. او استدلال می‌کند که هوش مصنوعی در واقع نرخ تولد را «برای به حداکثر رساندن مخروط نور آینده از تناژ انتقال‌دهنده‌های عصبی» افزایش خواهد داد، و پیشنهاد می‌کند که هوش مصنوعی می‌تواند ساختارهای اجتماعی را برای جذاب‌تر کردن والدگری بهینه کند @pmarca

کاربردها

  • یک توسعه‌دهنده در یک شرکت سنتی، سیستمی مبتنی بر LLM ساخت تا با وارد کردن تمام تیکت‌های JIRA به یک سیستم RAG با پایگاه داده‌ی وکتوری، بن‌بست‌های پروژه را رفع کند و سوالاتی در مورد بخش‌های نامشخص ایجاد می‌کرد؛ اگرچه در نهایت مشکلات سازمانی زیربنایی را حل نکرد @GergelyOrosz
  • ترزا تورس با گردش کار مربی هوش مصنوعی مصاحبه‌ی خود (AI Interview Coach)، به یک نقطه‌ی عطف بزرگ دست یافت و روش‌های ارزیابی پیچیده‌ای را برای شناسایی و رفع خطاهایی توسعه داد که هوش مصنوعی در آن، بخش‌هایی را در ابعاد بازخورد متعدد بازنشر می‌کرد و نرخ خطا را از ۸۱٪ به ۳٪ کاهش داد @ttorres
  • یک توسعه‌دهنده با موفقیت از عامل کدنویسی Amp برای یک مشارکت متن‌باز واقعی استفاده کرد و راهنمای «مفاهیم طرح‌بندی» (Layouts Concepts) را برای فریم‌ورک وب Air ایجاد کرد که کمک عملی هوش مصنوعی در وظایف مستندسازی و یادگیری را نشان می‌دهد @isaac_flath
  • شیمیدانان MIT برچسب مولکولی توسعه دادند که می‌تواند قندهای مرتبط با سل (TB-linked sugars) را در باکتری‌ها شناسایی کند و به‌طور بالقوه امکان آزمایش‌های سریع‌تر، ساده‌تر و ارزان‌تر سل را فراهم می‌کند @MIT
  • یک کاربر ردیت تعاملات اپلیکیشن‌های دوست‌یابی را با استفاده از شبیه‌ساز اندروید و هوش مصنوعی خودکارسازی کرد و طبق گزارش‌ها، هفته‌ای ۱۰ قرار ملاقات به دست آورد که پتانسیل تأثیر هوش مصنوعی بر دوست‌یابی آنلاین را برجسته می‌کند @deedydas

پژوهش‌ها

  • پژوهشگران چینی ASI-Arch را توسعه دادند، یک سیستم هوش مصنوعی که با تحلیل تمام پژوهش‌های LLM، ۱۰۶ معماری مدل هوش مصنوعی جدید را کشف کرد و معماری‌های کشف‌شده همگرایی و عملکرد بنچ‌مارک بهتری نسبت به مدل‌های موجود نشان می‌دهند @deedydas
  • اتان مولیک نشان می‌دهد که مدل مرموز «Summit»، ۲۳۵۱ خط کد پیچیده‌ی p5.js را برای رابط کاربری پنل کنترل یک سفینه‌ی فضایی از دستورات ساده تولید می‌کند که قابلیت‌های پیشرفته‌ی تولید کد را به نمایش می‌گذارد @emollick
  • نیتن لمبرت پیش‌بینی می‌کند که سازمان‌های پژوهشی چینی به زودی قوانین مقیاس‌گذاری LLM را برای یادگیری تقویتی منتشر خواهند کرد، و اشاره می‌کند که آزمایشگاه‌های مرزی بسته احتمالاً قبلاً این دانش را توسعه داده‌اند اما آن را به اشتراک نگذاشته‌اند @natolambert
  • Qwen3 Coder به نرخ شکست ویرایش diff معادل ۵.۷۵٪ دست می‌یابد که با عملکرد Sonnet 4 و Kimi K2 در وظایف کدنویسی مطابقت دارد @cline
  • پژوهشگران استنفورد بنچ‌مارک RIFTS را معرفی کردند که بر اساس بیش از ۶۰ هزار تعامل واقعی انسان و LM است و چالش‌های مربوط به «grounding» انسان-LM را برای وظایفی که به زمینه‌ی بیشتری نسبت به بنچ‌مارک‌های سنتی نیاز دارند، برطرف می‌کند @oshaikh13
  • بازی‌های جدیدی برای آزمایش قابلیت‌های هوش مصنوعی استفاده می‌شوند، به طوری که پژوهشگران نسخه‌های شطرنج و فرمت‌های بازی دیگر را برای ارزیابی عملکرد هوش مصنوعی در حوزه‌های جدید توسعه می‌دهند @emollick

اخبار هوش مصنوعی در 2025-07-26

مدل‌های جدید هوش مصنوعی

  • Qwen مدل تفکر به‌روز‌شده‌ی خود را با قابلیت‌های استدلال گسترده منتشر کرد؛ این مدل برای انجام وظایف پیچیده‌ای مانند دستورالعمل‌های نقاشی، ۱۶۶ ثانیه زمان صرف کرد @simonw
  • گوگل اعلام کرد که Gemini 2.5 Flash-Lite اکنون پایدار و به‌صورت عمومی برای توسعه‌دهندگان و مشتریان سازمانی در دسترس قرار گرفته است @GoogleAI
  • گوگل مدل جدید Aeneas را منتشر کرد؛ این مدل برای کمک به تاریخ‌دانان جهت تفسیر، ارجاع و بازسازی متون باستانی طراحی شده است @GoogleAI
  • InternLM مدل چندحالته‌ی (multimodal) ۲۳۵B MoE خود با نام Intern-S1 را منتشر کرد؛ این مدل با کدگذار (encoder) بینایی ۶B، با ۵ تریلیون توکن چندحالته و ۲.۵ تریلیون توکن حوزه‌ی علمی و قابلیت‌های فراخوانی ابزار آموزش دیده است @Xianbao_QIAN

تحلیل صنعت

  • متا «شنگ‌جیا ژائو» را به‌عنوان دانشمند ارشد واحد ابرهوش مصنوعی خود منصوب کرد @TechCrunch
  • Perplexity دسته‌ی دیگری از دعوت‌نامه‌های Comet را ارسال کرد که نشان‌دهنده‌ی گسترش مستمر پلتفرم جستجوی هوش مصنوعی آن‌هاست @AravSrinivas
  • Windsurf AI گزارش داد که با ۳۰٪ از ۱۰۰ شرکت برتر فورچون از جمله JPMC، Dell، Cisco، Phillips، ServiceNow و MercadoLibre همکاری می‌کند @sandeepDshah
  • شرکت Unitree چین یک ربات انسان‌نمای ۲۵ کیلوگرمی را با قیمت ۵۹۰۰ دلار منتشر کرد که این اولین بار است که یک ربات انسان‌نما قیمتی کمتر از یک MacBook Pro با بالاترین پیکربندی دارد؛ اگرچه این ربات محدود به یک ساعت عمر باتری و قابلیت‌های ابتدایی است @deedydas
  • تحلیل‌ها نشان می‌دهد که بسیاری از پژوهشگران پیشرو هوش مصنوعی به‌طور شگفت‌انگیزی از ابزارهای هوش مصنوعی استفاده نمی‌کنند، حتی از مدل‌هایی که خودشان آموزش می‌دهند که نشان‌دهنده‌ی نقص در سیستم‌های انگیزشی است @_xjdr
  • مهندسان نرم‌افزاری که مدل‌های زبان بزرگ (LLM) را برای کدنویسی مفید نمی‌دانند، معمولاً در سه دسته قرار می‌گیرند: کسانی که بیش از ۲ ماه پیش و قبل از بهبودهایی مانند Claude Code از آن‌ها استفاده کرده‌اند؛ کسانی که در زبان‌ها/فریمورک‌های نامعمول (esoteric) کار می‌کنند؛ یا کسانی که روی پایگاه‌های کد بزرگ و از پیش موجود کار می‌کنند @deedydas

اخلاق و جامعه

  • موسسه‌ی Future of Life یک کارنامه‌ی گزارش ایمنی را منتشر کرد که به سازندگان برجسته‌ی مدل‌های هوش مصنوعی نمره داده است؛ در این کارنامه، Anthropic با نمره‌ی C+ بالاترین امتیاز را کسب کرد، در حالی که DeepSeek پایین‌ترین نمره‌ی F را دریافت کرد @MIT_CSAIL
  • جفری هینتون پیشنهاد ایجاد یک جامعه‌ی بین‌المللی از موسسات ایمنی هوش مصنوعی را مطرح کرد تا روی تکنیک‌های آموزش هوش مصنوعی برای خیرخواه بودن کار کنند @AndrewCurran_
  • نخست‌وزیر چین، «لی کیانگ»، پیشنهاد تاسیس یک سازمان برای همکاری و هماهنگی جهانی هوش مصنوعی را مطرح کرد، با تاکید بر توسعه‌ی متن‌باز و اشتراک پیشرفت‌ها با کشورهای در حال توسعه @AndrewCurran_

کاربردها

  • اولین مطالعه‌ی کنترل‌شده‌ی هوش مصنوعی مولد (GenAI) در کنترل کیفیت صنعتی نشان داد که مهندسانی که از یک سیستم عیب‌یابی مجهز به GPT-3.5 استفاده می‌کردند، هنگام راه‌اندازی قطارهای جدید افزایش قابل‌توجهی در کیفیت کار داشتند @emollick
  • Google Photos و YouTube اکنون از تبدیل عکس به ویدئو با استفاده از هوش مصنوعی پشتیبانی می‌کنند، با افکت‌های جدید Veo برای تبدیل سلفی‌ها به ویدئوهای سرگرم‌کننده @GoogleAI
  • گوگل AI Playground را به‌عنوان یک مرکز جدید برای قابلیت‌های ساخت محتوای هوش مصنوعی YouTube و آزمایش Opal را برای ساخت و اشتراک‌گذاری مینی‌اپلیکیشن‌های هوش مصنوعی راه‌اندازی کرد @GoogleAI
  • جستجو و خرید گوگل اکنون از قابلیت امتحان مجازی لباس (virtual try-on) با کمک هوش مصنوعی در ایالات متحده پشتیبانی می‌کند @GoogleAI
  • انویدیا برای اولین بار شبیه‌سازهای کامل اقیانوس را با مدل‌های جوی جفت کرد که قابلیت‌های جدیدی را در پیش‌بینی ال نینو و پیش‌بینی فصلی امکان‌پذیر می‌سازد @NVIDIAAI

پژوهش‌ها

  • تیم تفسیرپذیری Anthropic چندین به‌روزرسانی پژوهشی منتشر کرد، از جمله کارهایی روی خودکارسازی ممیزی مدل، گونه‌های جایگزین ترنسکدر برای لایه‌های MLP به‌عنوان تبدیل‌های خطی شرطی، و یک تیم جدید را معرفی کرد که روش‌های تفسیرپذیری را برای پاسخ به سوالات مهم درباره‌ی رفتار مدل به کار می‌گیرد @ch402
  • Gemini عملکردی در حد مدال طلا در المپیاد جهانی ریاضی به دست آورد که نشان‌دهنده‌ی پیشرفت قابل‌توجهی در قابلیت‌های استدلال ریاضی است @GoogleAI
  • هوآوی سیستم CloudMatrix 384 خود را که شامل ۳۸۴ تراشه‌ی 910C آن‌هاست، در اولین حضور عمومی خود در WAIC به نمایش گذاشت @AndrewCurran_
  • بحثی درباره‌ی پیش‌آموزش (pretraining) به‌عنوان «علمی ظریف» که توسط ریاضیدانان انجام می‌شود، در مقابل پس‌آموزش (posttraining) به‌عنوان «پژوهش هیجان‌انگیز سبک کابویی» با آزمایش سریع هایپرپارامترها، که روش‌های متدولوژیک متفاوت در توسعه‌ی هوش مصنوعی را برجسته می‌کند @tszzl

اخبار هوش مصنوعی در 2025-07-25

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-235B-A22B-Thinking-2507، پیشرفته‌ترین مدل استدلالی خود را با عملکرد بهبودیافته در استدلال منطقی، ریاضیات، علوم و کدنویسی منتشر کرد؛ این مدل دارای ۲۵۶ هزار توکن در زمینه (context) بومی است و به‌طور انحصاری برای حالت «تفکر» (thinking mode) ساخته شده است @Alibaba_Qwen
  • متا، شنگ‌جیا ژائو را به‌عنوان دانشمند ارشد آزمایشگاه‌های ابرهوش متا (Meta Superintelligence Labs) معرفی کرد؛ این تیم بر جهت‌گیری علمی برای توسعه‌ی هوش مصنوعی تمرکز خواهد کرد @AIatMeta
  • «ایمجن ۴ اولترا» (Imagen 4 Ultra) گوگل، رتبه‌ی اول را در جدول امتیازات lmarena برای تولید تصویر از متن کسب کرد و اکنون در Google AI Studio و Gemini API در دسترس است @OfficialLoganK
  • هوش مصنوعی فیگما (Figma AI) از مرحله‌ی بتا خارج شد و در همه‌ی طرح‌های پولی در دسترس قرار گرفت، از جمله قابلیت‌های تولید تصویر، حذف پس‌زمینه، افزایش وضوح و بازنویسی متن @figma
  • اوپن‌ای‌آی (OpenAI) پس از تأخیرهای اولیه، عرضه‌ی کامل عامل چت‌جی‌پی‌تی (ChatGPT agent) را به همه‌ی کاربران «پلاس»، «پرو» و «تیم» به پایان رساند @OpenAI
  • انتروپیک (Anthropic) پشتیبانی سرور MCP موبایل را برای کلود (Claude) راه‌اندازی کرد که به کاربران امکان می‌دهد به ابزارها و پروژه‌های متصل‌شده در دستگاه‌های iOS و اندروید دسترسی پیدا کنند @AnthropicAI

تحلیل صنعت

  • پلنتیر (Palantir) با پشت سر گذاشتن شرکت‌های بزرگی مانند هوم دیپو (Home Depot) و بنک آو آمریکا (Bank of America) و در حالی که با ۲۷۳ برابر سود آتی معامله می‌شود، بیستمین شرکت باارزش ایالات متحده از نظر ارزش بازار شد @AndrewCurran_
  • ارجاعات هوش مصنوعی به وب‌سایت‌های برتر در ژوئن ۲۰۲۵ نسبت به سال قبل ۳۵۷٪ افزایش یافت و به ۱.۱۳ میلیارد ارجاع رسید که نشان‌دهنده‌ی رشد قابل توجهی در ترافیک وب مبتنی بر هوش مصنوعی است @TechCrunch
  • مرورگر «کامِت» (Comet) پرپلکسیتی (Perplexity) پذیرش فزاینده‌ی کاربران را نشان می‌دهد، به‌طوری که از زمان راه‌اندازی، درصد رو به رشدی از کاربران آن را به‌عنوان مرورگر پیش‌فرض خود انتخاب کرده‌اند @AravSrinivas
  • مدل‌های هوش مصنوعی متن‌باز چینی اکنون در خط مقدم قرار دارند و ناظران به سرعت از دست دادن موقعیت برتر لاما (Llama) در این گفت‌وگو اشاره می‌کنند @natolambert
  • پلتفرم «پیپرز ویت کد» (Papers with Code) پس از ۷ سال تعطیل شد؛ بنیان‌گذاران آن برای ساخت شرکت‌های جدید هوش مصنوعی حرکت کردند و هاگینگ فیس (Hugging Face) برخی از قابلیت‌ها را بر عهده گرفت @rosstaylor90

کاربردها

  • مرورگر «کامِت» (Comet) پرپلکسیتی (Perplexity) کاربردهای عملی هوش مصنوعی را نشان می‌دهد، از جمله ایجاد پلی‌لیست‌های اسپاتیفای (Spotify)، سفارش مستقیم غذا از رستوران‌ها برای جلوگیری از هزینه‌های برنامه‌های تحویل، و خودکارسازی وظایف لینکدین (LinkedIn) @AravSrinivas
  • «کلود کد» (Claude Code) قابلیت زیرعامل‌های سفارشی (custom subagents) را معرفی می‌کند که به کاربران امکان می‌دهد تیم‌هایی از عامل‌های هوش مصنوعی تخصصی برای کارهای مختلف ایجاد کنند @_catwu
  • انتروپیک (Anthropic) یکپارچگی کلود (Claude) با کنوا (Canva) را نشان می‌دهد که کاربران را قادر می‌سازد اسناد را آپلود کرده و آن‌ها را به طرح‌های بصری برندسازی‌شده تبدیل کنند @AnthropicAI
  • اوپن‌ای‌آی (OpenAI) قابلیت «پژوهش عمیق» (Deep Research) را بر روی اسناد نوشن (Notion) فعال می‌کند، که قابلیت‌های پژوهش هوش مصنوعی را به پایگاه‌های دانش شخصی گسترش می‌دهد @gdb
  • ایتان مولیک (Ethan Mollick) تکنیک‌های پرامپت‌نویسی خلاقانه را برای تولید ویدیوی «ویو ۳» (Veo 3) گوگل نشان می‌دهد، از جمله استفاده از اسلایدهای پاورپوینت به‌عنوان پرامپت و تولید سناریوهای تاریخی فرود بر ماه @emollick
  • یوجین یان (Eugene Yan) گردش کار توسعه‌ی سریع با کمک هوش مصنوعی را به نمایش می‌گذارد، شامل ساخت کلاس‌های ارزیابی LLM، نوت‌بوک‌های آماده‌سازی داده، و پیاده‌سازی‌های دمو در یک ساعت با استفاده از دستیاران کدنویسی @eugeneyan

پژوهش‌ها

  • فرانسوا شوله (Francois Chollet) گزارش می‌دهد که «کون‌ون ۳-۲۳۵بی اینسترکت» (Qwen3-235B Instruct) امتیاز ۱۱٪ در ARC-AGI-1 و ۱.۳٪ در ARC-AGI-2 کسب کرده است و آن را به‌عنوان ارزان‌ترین مدل پایه برای کسب امتیاز بالای ۱۰٪ در ARC-AGI-1 قرار می‌دهد @fchollet
  • جایزه‌ی ARC 2025 به بالاترین امتیاز جدید ۱۹.۰٪ توسط Giotto.ai دست یافت که نشان‌دهنده‌ی پیشرفت مستمر در قابلیت‌های استدلال هوش مصنوعی است @arcprize
  • مهندسان MIT قوی‌ترین کوپلینگ نور-ماده را در یک مدار کوانتومی به دست آوردند که گام کلیدی به سوی رایانه‌های کوانتومی تحمل‌پذیر خطا (fault-tolerant quantum computers) است @MIT
  • پژوهش Stanford HAI استفاده از هوش مصنوعی برای شبیه‌سازی داده‌های انسانی در مطالعات علوم اجتماعی را بررسی می‌کند، که روش‌های پژوهشی سریع‌تر و مقیاس‌پذیرتری را امکان‌پذیر می‌سازد @StanfordHAI
  • گوگل «جیمنای ۲.۵ فلش-لایت» (Gemini 2.5 Flash-Lite) را با همکاری Trillium TPU طراحی کرد تا به سرعت‌های فوق‌العاده سریع دست یابد، که اهمیت بهینه‌سازی مشترک سخت‌افزار و نرم‌افزار را نشان می‌دهد @GoogleAI

اخلاق و جامعه

  • سم آلتمن (Sam Altman) به کاربران هشدار می‌دهد که هنگام استفاده از چت‌جی‌پی‌تی (ChatGPT) به‌عنوان درمانگر، هیچ محرمانگی قانونی وجود ندارد، که مرزهای مهم حریم خصوصی و حرفه‌ای را در کاربردهای هوش مصنوعی در سلامت روان برجسته می‌کند @TechCrunch
  • مصطفی سلیمان (Mustafa Suleyman) معتقد است که یادگیری هوش مصنوعی به یک پیش‌نیاز اساسی برای مشاغل تبدیل شده است، و مزیت رقابتی بعدی توانایی مدیریت تیم‌هایی از هوش مصنوعی‌ها خواهد بود @mustafasuleyman
  • گرگلی اوروش (Gergely Orosz) نگرانی‌هایی را در مورد برنامه‌های تولیدشده توسط هوش مصنوعی با شیوه‌های ضعیف حریم خصوصی و امنیتی که توسط فروشگاه‌های برنامه (app stores) تأیید می‌شوند، مطرح می‌کند و مسئولیت‌پذیری را در صورت فاش شدن داده‌های حساس زیر سوال می‌برد @GergelyOrosz

اخبار هوش مصنوعی در 2025-07-24

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-Coder-480B-A35B را منتشر کرد؛ یک مدل MoE با ۴۸۰ میلیارد پارامتر و ۳۵ میلیارد پارامتر فعال که به ۷۰٪ در بنچمارک SWE-Bench Verified و طول زمینه ۱ میلیون دست یافت، و احتمالاً بهترین مدل کدنویسی تا به امروز است. @deedydas
  • علی‌بابا Qwen3-MT، قدرتمندترین مدل ترجمه‌ی خود را راه‌اندازی کرد که از بیش از ۹۲ زبان پشتیبانی می‌کند و بیش از ۹۵٪ جمعیت جهان را پوشش می‌دهد؛ این مدل با تریلیون‌ها توکن چندزبانه آموزش دیده است. @Alibaba_Qwen
  • تام وارن گزارش می‌دهد که GPT-5 در ماه اوت عرضه خواهد شد و GPT-5-mini به‌طور هم‌زمان در هر دو بخش کلاینت و API عرضه می‌شود و GPT-5-nano نیز فقط برای API برنامه‌ریزی شده است. @AndrewCurran_
  • اوپن‌ای‌آی قصد دارد یک مدل منبع‌باز را پیش از GPT-5 عرضه کند که گفته می‌شود مشابه o3-mini با قابلیت‌های استدلالی است. @AndrewCurran_

تحلیل صنعت

  • گوگل ماهانه بیش از ۹۸۰ تریلیون توکن را در سرویس‌های خود پردازش می‌کند که از ۴۸۰ تریلیون در ماه مه دو برابر شده است، و اپلیکیشن Gemini به ۴۵۰ میلیون کاربر فعال ماهانه رسیده است. @AndrewCurran_
  • بیش از ۷۰ میلیون ویدیوی کاربری با Veo 3 ایجاد شده است که نشان‌دهنده‌ی پذیرش قابل توجه مدل تولید ویدیوی گوگل است. @AndrewCurran_
  • شرکت Safe Superintelligence (شرکت ایلیا سوتسکور) به‌طور انحصاری از TPUهای گوگل برای توسعه‌ی هوش مصنوعی خود استفاده خواهد کرد. @AndrewCurran_
  • متا رویکردی نوآورانه در پیش گرفته است و چادرهای مقاوم در برابر آب و هوا را برای جای دادن خوشه‌های GPU می‌سازد، که مراکز داده‌ی جدید را قادر می‌سازد در عرض چند ماه به جای چند سال راه‌اندازی شوند. @AIatMeta
  • فایننشال تایمز گزارش می‌دهد که بیش از ۱ میلیارد دلار تراشه‌ی انویدیا، از جمله تراشه‌های Blackwell، طی سه ماه گذشته با وجود کنترل‌های صادراتی به چین رسیده است. @AndrewCurran_
  • چین اکنون ۵ آزمایشگاه پیشرو هوش مصنوعی دارد که در سطح جهانی رقابت می‌کنند: DeepSeek، Alibaba Qwen، Bytedance، Hailuo و Kimi، با سرعت توسعه‌ی بالا و احتمالاً هزینه‌هایی کمتر از همتایان آمریکایی خود. @deedydas
  • پژوهش‌ها نشان می‌دهد که توسعه‌دهندگان بیشترین زمان را با ابزارهای هوش مصنوعی از طریق تجزیه و تحلیل stack trace و بازآرایی کد، به جای تولید کد، صرفه‌جویی می‌کنند؛ این یافته بر اساس پژوهش DX با ۱۸۰ شرکت است. @GergelyOrosz
  • شرکت‌های فناوری پیشرو مانند گیت‌هاب و شاپی‌فای به‌دلیل هوش مصنوعی کارآموزان بیشتری استخدام می‌کنند و مشاهده می‌کنند که دانشجویان علوم کامپیوتر از ابزارهای هوش مصنوعی روان‌تر از قبل استفاده می‌کنند. @GergelyOrosz
  • جک دورسی در کمتر از یک هفته دو اپلیکیشن را با استفاده از ابزار هوش مصنوعی Goose برای توسعه‌ی سریع منتشر کرد که روند «vibe coding» را به نمایش می‌گذارد. @TechCrunch

اخلاق و جامعه

  • اظهارات رئیس جمهور ترامپ در اجلاس هوش مصنوعی درباره‌ی حق کپی‌رایت نشان می‌دهد که هوش مصنوعی باید قادر باشد بدون پرداخت برای هر بار استفاده، از محتوا یاد بگیرد؛ او این امر را با یادگیری انسان مقایسه کرده و اشاره کرده که چین چنین محدودیت‌هایی را دنبال نمی‌کند. @AndrewCurran_
  • الزامات جدید دولتی بیان می‌کنند که برای واجد شرایط بودن قراردادهای دولتی، یک LLM باید با اصول حقیقت‌جویی و بی‌طرفی ایدئولوژیک توسعه یابد. @AndrewCurran_
  • ایتان مولیک نشان می‌دهد که بیش از ۶۰٪ از لینک‌های قدیمی مقالات نیویورک تایمز اکنون شکسته شده‌اند، که نشان می‌دهد تنها LLMها بخش زیادی از محتوای ناپایدار وب را «به خاطر خواهند آورد». @emollick
  • بررسی دقیق بنچمارک Humanity's Last Exam نشان می‌دهد که بسیاری از سؤالات دارای پاسخ‌های «صحیح» نادرست هستند که چالش‌های موجود در اندازه‌گیری و بنچمارکینگ هوش مصنوعی را برجسته می‌کند. @emollick
  • فرانسوا شولیت در مورد گرایش به انسان‌انگاری سیستم‌های هوش مصنوعی که انسان نیستند هشدار می‌دهد و بر اهمیت درک ماهیت واقعی آن‌ها تأکید می‌کند. @fchollet

کاربردها

  • پرپلکسیتی مرورگر Comet را با قابلیت‌های دستیار هوش مصنوعی راه‌اندازی کرد که می‌تواند خود را توزیع کرده و کاربران جدید را جذب کند، و برای عملکرد خود بازخوردهای مثبتی دریافت کرده است. @testingcatalog
  • کرسر Bugbot را منتشر کرد که در ماه گذشته بیش از ۱ میلیون باگ در PRهای نوشته شده توسط انسان پیدا کرده است، و بیش از نیمی از آن‌ها مشکلات منطقی واقعی بودند که پیش از ادغام رفع شدند. @cursor_ai
  • گیت‌هاب Spark را راه‌اندازی کرد؛ یک پلتفرم «prompt-to-app» برای ایجاد و توسعه‌ی تکراری اپلیکیشن‌های React با احراز هویت کاربر و ذخیره‌سازی پایدار. @simonw
  • فیگما Make را برای همه منتشر کرد؛ یک راه‌حل «prompt-to-app» که به کاربران امکان می‌دهد پروتوتایپ ایجاد کرده و در جامعه‌ی فیگما (Figma Community) منتشر کنند. @figma
  • گوگل قابلیت تبدیل عکس به ویدیو را معرفی کرد که به گوگل فوتوز و یوتیوب شورتز می‌آید. @sundarpichai
  • گوگل قابلیت مجازی پرو لباس را با استفاده از فناوری هوش مصنوعی راه‌اندازی کرد. @TechCrunch
  • لینیر قابلیت داشبوردها را معرفی کرد که به کاربران امکان می‌دهد نماهای سفارشی برای نظارت بر معیارهای کلیدی ایجاد کنند. @linear
  • xAI با Kalshi همکاری می‌کند تا Grok را به بازارهای پیش‌بینی بیاورد. @xai

پژوهش‌ها

  • آنتروپیک سه عامل هوش مصنوعی را برای ممیزی هم‌ترازی توسعه داده است که می‌توانند به‌طور خودکار اهداف پنهان را کشف کنند، ارزیابی‌های ایمنی را بسازند و رفتارهای نگران‌کننده را آشکار سازند، و عامل بازرس آن‌ها ۴۲٪ چالش‌های ممیزی را برنده شد. @AnthropicAI
  • گوگل با استفاده از نسخه‌ی پیشرفته‌ی Gemini با حالت Deep Think، به عملکردی در سطح مدال طلا در المپیاد جهانی ریاضی دست یافت. @sundarpichai
  • پژوهش، چارچوب Rubrics as Rewards (RaR) را معرفی می‌کند که از ارزیابی‌های ساختارمند و چک‌لیستی به‌عنوان سیگنال‌های پاداش قابل تفسیر برای آموزش «on-policy» استفاده می‌کند و بهبودهای نسبی در HealthBench-1k را به ارمغان می‌آورد. @iScienceLuvr
  • کامرون وولف توضیح می‌دهد که مدل‌های پاداش در عصر مدل‌های استدلالی همچنان مرتبط هستند، زیرا اکثر سیستم‌ها همچنان از RLHF برای هم‌ترازی ترجیحات انسانی و RLVR برای وظایف استدلالی قابل تأیید استفاده می‌کنند. @cwolferesearch
  • آنتروپیک تیم «روانپزشکی هوش مصنوعی» را به‌عنوان بخشی از تلاش‌های تفسیرپذیری راه‌اندازی کرد تا درباره‌ی شخصیت‌ها، انگیزه‌ها و آگاهی موقعیتی مدل‌ها و نحوه‌ی منجر شدن آن‌ها به رفتارهای نگران‌کننده پژوهش کند. @Jack_W_Lindsey
  • دانشمندان MIT سلول‌های زنده را با گیت‌های منطقی، مانند کامپیوترهای بیولوژیکی، برنامه‌ریزی می‌کنند تا سرطان را با دقت تشخیص داده و از بین ببرند. @MIT
  • پای‌تورچ نمایش می‌دهد که SmolLM3-3B با سرعت ۱۵ توکن در ثانیه روی گلکسی S22 با استفاده از TorchAO و ExecuTorch برای استقرار روی دستگاه اجرا می‌شود. @PyTorch