اخبار هوش مصنوعی در 2025-07-31

مدل‌های جدید هوش مصنوعی

  • گوگل Veo 3 Fast و Veo 3 را با قابلیت‌های تبدیل تصویر به ویدیو منتشر کرد که اکنون در Gemini API برای ساخت ویدیوهای باکیفیت همراه با صدا و کنترل خلاقانه‌ی بیشتر در دسترس هستند @googleaidevs
  • Qwen مدل Qwen3-Coder-Flash (مدل ۳۰B) را با پشتیبانی بومی از ۲۵۶ هزار توکن زمینه‌ی متنی (context) منتشر کرد که برای تولید کد و گردش‌کارهای عامل بهینه‌سازی شده است @Alibaba_Qwen
  • Cohere مدل Command A Vision، یک مدل مولد چندوجهی را رونمایی کرد که در درک داده‌های بصری و چندزبانه در سراسر حوزه‌های سازمانی عالی عمل می‌کند @cohere
  • Black Forest Labs مدل FLUX.1 Krea [dev]، یک مدل جدید با وزن‌های باز را منتشر کرد که بر تولید تصاویر فوتورئالیستیک بدون «ظاهر هوش مصنوعی» معمول تمرکز دارد @bfl_ml
  • میسترال (Mistral) مدل Codestral 25.08 را با ارتقاهای قابل توجهی از جمله ۳۰٪ افزایش در تکمیل‌های پذیرفته‌شده و ۵۰٪ کاهش در تولیدات سرکش (runaway generations) اعلام کرد @sophiamyang
  • گوگل دیپ‌مایند (DeepMind) مدل AlphaEarth Foundations را معرفی کرد؛ یک مدل هوش مصنوعی که به عنوان یک ماهواره‌ی مجازی برای تحلیل خشکی‌ها و آب‌های ساحلی زمین با نیاز به فضای ذخیره‌سازی ۱۶ برابر کمتر عمل می‌کند @GoogleAI
  • مدل مرموز Horizon Alpha در OpenRouter ظاهر شد، که شایعه شده مدل جدید GPT-5 است و عملکرد برتری در وظایف برنامه‌نویسی و خلاقانه از خود نشان می‌دهد @deedydas

تحلیل صنعت

  • Anthropic به درآمد سالانه‌ی ۴.۵ میلیارد دلار رسید و با پیشی گرفتن از OpenAI، به سریع‌ترین شرکت نرم‌افزاری در حال رشد تاریخ و رهبر بازار در هزینه‌ی API مدل‌های زبان بزرگ (LLM) تبدیل شد @deedydas
  • OpenAI درآمد خود را در هفت ماه اول سال ۲۰۲۵ به ۱۲ میلیارد دلار سالانه دو برابر کرد، به ۷۰۰ میلیون کاربر فعال رسید و در عین حال پیش‌بینی مصرف نقدی (cash burn) خود را از ۱ میلیارد دلار به ۸ میلیارد دلار افزایش داد @AndrewCurran_
  • هزینه‌ی API مدل‌های زبان بزرگ (LLM) سازمانی تا اواسط سال از ۳.۵ میلیارد دلار به ۸.۴ میلیارد دلار به شدت افزایش یافت، در حالی که تنها ۱۱٪ از شرکت‌ها ترجیح بالایی برای استفاده از مدل‌های منبع باز نشان می‌دهند @deedydas
  • هزینه‌ی محاسبات هوش مصنوعی از ۲۴٪ به ۴۸٪ برای استنتاج (inference) تغییر یافت، زیرا با اولویت یافتن استقرار توسط شرکت‌ها، آموزش و توسعه‌ی مدل از رونق افتاد @deedydas
  • مایکروسافت ۱۰۰ میلیون کاربر فعال ماهانه در سراسر خانواده‌ی Copilot را گزارش داد، با درآمد Azure که از ۷۵ میلیارد دلار فراتر رفت و بیش از ۵۰۰ تریلیون توکن را از طریق Foundry APIها پردازش کرد @satyanadella
  • FAL در دور سری C مبلغ ۱۲۵ میلیون دلار با ارزش‌گذاری ۱.۵ میلیارد دلار جذب سرمایه کرد و به عنوان پلتفرم زیرساخت رسانه‌ی مولد، میانگین رشد ۴۰٪ ماه به ماه را ثبت می‌کند @AndrewCurran_
  • متا (Meta) طبق گزارش‌ها در حال مذاکره برای تصاحب استارتاپ‌های تولید ویدیو از جمله Pika، Higgsfield و Runway است، زیرا رقابت در فضای ویدیوی هوش مصنوعی شدت می‌گیرد @AndrewCurran_
  • آمازون در استارتاپ Fable که «نتفلیکس هوش مصنوعی» نام گرفته سرمایه‌گذاری کرد و در حال برنامه‌ریزی برای مدل اشتراک ماهانه برای تولید محتوا با مشاهده‌ی رایگان است، که نشان‌دهنده‌ی حرکت پلتفرم‌های اصلی به سمت سرگرمی‌های تولیدشده با هوش مصنوعی است @AndrewCurran_
  • سهام فیگما (Figma) در عرضه‌ی اولیه‌ی سهام (IPO) از قیمت ۳۳ دلار به ۱۱۰ دلار در روز اول سه برابر شد و پس از آنکه رگولاتورهای بریتانیا تصاحب ۲۰ میلیارد دلاری آن توسط Adobe را در سال ۲۰۲۳ مسدود کردند، به ارزش‌گذاری بیش از ۵۰ میلیارد دلار رسید @AndrewCurran_

اخلاق و جامعه

  • مطالعه‌ی MIT در NEJM نشان می‌دهد که بسیاری از مردم، از جمله متخصصان، بیش از حد به مشاوره‌ی پزشکی تولیدشده توسط هوش مصنوعی اعتماد می‌کنند و اغلب نمی‌توانند بین راهنمایی‌های پزشکی نوشته‌شده توسط پزشک و تولیدشده توسط LLM تمایز قائل شوند @medialab
  • پژوهش استنفورد نشان می‌دهد که برچسب‌گذاری محتوا به عنوان «تولیدشده توسط هوش مصنوعی» بر قدرت اقناع‌کنندگی آن تأثیر می‌گذارد؛ پژوهشگران در حال ارزیابی چگونگی تأثیر برچسب‌های نویسندگی بر درک پیام‌های سیاستی نوشته‌شده توسط هوش مصنوعی هستند @StanfordHAI
  • جستجوهای عمومی ChatGPT توسط گوگل و سایر موتورهای جستجو نمایه‌گذاری می‌شوند که نگرانی‌های حریم خصوصی را در مورد قابل جستجو شدن داده‌های مکالمه‌ی هوش مصنوعی افزایش می‌دهد @TechCrunch
  • xAI حمایت خود را از آیین‌نامه‌ی رفتار قانون هوش مصنوعی اتحادیه‌ی اروپا اعلام کرد و در عین حال بخش‌هایی از آن را «عمیقاً مضر برای نوآوری» خواند و مقررات حق نسخه‌برداری را «فرا‌تر از حدود اختیارات» دانست @xai

کاربردها

  • Perplexity ویژگی Comet Shortcuts را راه‌اندازی کرد که به کاربران امکان می‌دهد گردش‌کارهای تکراری وب را با دستورات زبان طبیعی که از طریق /commands قابل دسترسی هستند، خودکار کنند؛ برنامه‌هایی نیز برای اشتراک‌گذاری و کسب درآمد از میان‌برهای سفارشی وجود دارد @AravSrinivas
  • NotebookLM ویژگی نمای کلی ویدیو (video overviews) را معرفی کرد که به سمت قابلیت‌های بی‌نهایت برای استفاده‌ی مجدد و فرمت‌بندی مجدد محتوا پیش می‌رود @OfficialLoganK
  • هوش مصنوعی تسلا (Tesla AI) شروع به ارسال دعوت‌نامه‌ها برای سرویس تاکسی آنلاین (ride-hailing) منطقه‌ی Bay Area کرد و استقرار وسایل نقلیه‌ی خودران را گسترش می‌دهد @Tesla_AI
  • مطالعه‌ی مایکروسافت همبستگی ۹۰ درصدی بین هم‌پوشانی مشاغل پیش‌بینی‌شده و واقعی با هوش مصنوعی را نشان می‌دهد که پیش‌بینی‌های اقتصادی سال ۲۰۲۳ را در مورد اینکه کدام مشاغل بیشتر تحت تأثیر هوش مصنوعی قرار خواهند گرفت، تأیید می‌کند @emollick
  • آمازون استارتاپ Bee را که در حال ساخت دستگاه‌های پوشیدنی برای ضبط مداوم محیط به منظور تبدیل مکالمات واقعی به یادآورها و وظایف است، تصاحب کرد @TechCrunch
  • MIT ربات جدید مراقبت از سالمندان را توسعه داد که در نشستن، ایستادن کمک می‌کند و در صورت افتادن کاربران می‌تواند آن‌ها را بگیرد و فناوری «زندگی در خانه در دوران سالمندی» (aging-in-place) را پیشرفت می‌دهد @MIT

پژوهش‌ها

  • تیم پژوهشی Anthropic رویکرد گراف اِسناد (attribution graph) را برای گنجاندن مفهوم «توجه» (attention) گسترش داد و بینش‌های جدیدی در مورد اینکه چرا مدل‌ها در طول استنتاج (inference) به مفاهیم خاصی توجه می‌کنند، ارائه می‌دهد @ch402
  • NVIDIA بیش از ۲۶ میلیون خط داده‌ی مصنوعی را که برای آموزش مدل Llama Nemotron Super v1.5 استفاده شده است، منتشر کرد که شفافیت در مجموعه‌داده‌های آموزش مدل را ترویج می‌دهد @NVIDIAAIDev
  • اندرو اِنگ (Andrew Ng) هشدار داد که چین دارای شتاب فوق‌العاده‌ای در هوش مصنوعی است؛ با یک اکوسیستم پر جنب و جوش وزن‌های باز و توسعه‌ی تهاجمی نیمه‌رسانا، که می‌تواند با وجود برتری کنونی آمریکا، از ایالات متحده پیشی بگیرد @AndrewYNg
  • چندین رهبر آزمایشگاه هوش مصنوعی گزارش می‌دهند که نشانه‌هایی از خودبهبودی در سیستم‌های هوش مصنوعی مشاهده می‌کنند، با مارک زاکربرگ در میان کسانی که اظهارات مبهمی در مورد این توسعه ارائه می‌دهند @emollick
  • MIT یک پلتفرم کاملاً خودکار را برای شناسایی، ترکیب و مشخصه‌یابی مخلوط‌های پلیمری جدید توسعه داد تا ترکیبات مواد را برای کاربردهای پایدار بهینه کند @MIT
  • مدل Step 3 بهینه‌سازی جدیدی در سطح زیرساخت برای جداسازی (disaggregation) Attention و FFN پیشنهاد می‌کند که رویکرد طراحی مشترک مدل و زیرساخت را نشان می‌دهد @Xianbao_QIAN

اخبار هوش مصنوعی در 2025-07-30

مدل‌های جدید هوش مصنوعی

  • مارک زاکربرگ از متا اعلام کرد که شرکت، نشانه‌هایی از خودبهبود‌ی سیستم‌های هوش مصنوعی را مشاهده کرده است و اظهار داشت: «توسعه‌ی **فراهوشمندی** اکنون در چشم‌انداز است» در نامه‌ای جدید که چشم‌انداز متا را برای فراهوشمندی شخصی تشریح می‌کند. @AIatMeta
  • Qwen مدل **Qwen3-30B-A3B-Thinking-2507** را منتشر کرد، یک مدل متوسط با قابلیت‌های استدلال که در وظایف ریاضی، علوم و کدنویسی عملکرد خوبی دارد و از ۲۵۶ هزار توکن در متن به‌صورت بومی پشتیبانی می‌کند. @Alibaba_Qwen
  • گوگل DeepMind از **AlphaEarth Foundations**، یک مدل هوش مصنوعی برای نقشه‌برداری سیاره‌ای، رونمایی کرد که ۲۴٪ نرخ خطای کمتری نسبت به سایر روش‌ها دارد و خلاصه‌های مشاهداتی که ۱۶ برابر از نظر مصرف حافظه بهینه‌تر هستند، ارائه می‌دهد. @GoogleDeepMind
  • Mistral AI مدل **Codestral 25.08** را منتشر کرد و مجموعه‌ی کدنویسی کامل Mistral را برای شرکت‌ها معرفی کرد. @MistralAI
  • OpenAI حالت مطالعه را در **ChatGPT** معرفی کرد که راهنمایی گام‌به‌گام به دانشجویان ارائه می‌دهد، به‌جای پاسخ‌های سریع. @gdb

تحلیل صنعت

  • آمازون سالانه ۲۰ میلیون دلار به نیویورک تایمز برای داده‌های آموزشی پرداخت می‌کند، که حدود یک‌سوم مبلغی است که OpenAI و گوگل به Reddit برای دسترسی به داده‌های مشابه می‌پردازند. @AndrewCurran_
  • مورگان استنلی اهداف صنعتی را در همه‌ی بخش‌ها افزایش داد و پیش‌بینی می‌کند که گلوگاه‌های فعلی هوش مصنوعی تا پایان سال کاهش یابند، با استناد به تقاضای بالای سرویس‌های ابری. @AndrewCurran_
  • درآمد برنامه‌های هوش مصنوعی مولد (Gen AI) دو برابر شد و در نیمه‌ی اول سال ۲۰۲۵ به ۱.۷ میلیارد دانلود رسید، که نشان‌دهنده‌ی رشد قابل توجه بازار است. @TechCrunch
  • گزارش شده است که متا یک میلیارد دلار طی ۴ سال به برخی از اعضای تیم Thinking Machines پیشنهاد داده است، که بالاترین میزان دستمزد برای یک مشارکت‌کننده‌ی فردی در تاریخ فناوری محسوب می‌شود. @deedydas
  • مدیرعامل Box گزارش می‌دهد که هوش مصنوعی طرز تفکر او را درباره‌ی کار به‌طور اساسی تغییر داده است، با انتظاراتی برای پژوهش بیشتر، پروژه‌های بزرگ‌تر، و خروجی سریع‌تر در همه‌ی بخش‌ها. @levie

اخلاق و جامعه

  • ایتان مولیک اشاره می‌کند که تصاویر و ویدئوهای تولیدشده توسط هوش مصنوعی اکنون فاقد نشانه‌های آشکاری مانند شش انگشت هستند، و تشخیص آن‌ها از محتوای واقعی به‌طور فزاینده‌ای دشوار شده است. @emollick
  • زاکربرگ اعلام کرد که متا لزوماً مدل‌های آتی خود را متن‌باز نخواهد کرد، با پیامدهایی برای دسترسی‌پذیری مدل‌های پیشرفته‌ی با وزن باز (open-weight) از شرکت‌های آمریکایی. @emollick
  • Anthropic به پروژه‌ی همسوسازی (Alignment Project) مؤسسه‌ی امنیت هوش مصنوعی بریتانیا پیوست و منابع محاسباتی خود را برای پیشبرد پژوهش‌های حیاتی در زمینه‌ی اطمینان از رفتار قابل پیش‌بینی سیستم‌های هوش مصنوعی و همسویی آن‌ها با ارزش‌های انسانی ارائه کرد. @AnthropicAI
  • پژوهش Stanford HAI استدلال می‌کند که همسوسازی هوش مصنوعی نیازمند کاوش عمیق‌تری در فرضیات وجودشناختی (ontological assumptions) نهفته در معماری‌های سیستمی است، نه صرفاً ارزش‌های انسانی. @StanfordHAI

کاربردها

  • Perplexity مرورگر وب مجهز به هوش مصنوعی به نام Comet را عرضه کرد که می‌تواند مسیرهای پیچیده را برنامه‌ریزی کند و وظایف را به‌طور خودکار در تب‌های مرورگر انجام دهد. @AravSrinivas
  • Anthropic قابلیت‌های جدید موبایلی را معرفی کرد که به کاربران امکان می‌دهد ایمیل‌ها، پیام‌ها و دعوت‌نامه‌های تقویم را مستقیماً از اپلیکیشن Claude پیش‌نویس و ارسال کنند. @AnthropicAI
  • AlphaEarth Foundations گوگل DeepMind در حال حاضر توسط سازمان‌هایی مانند FAO سازمان ملل متحد و MapBiomas مورد استفاده قرار می‌گیرد تا نقشه‌های سفارشی ایجاد کرده و بینش‌های عملی در دنیای واقعی ارائه دهد. @GoogleDeepMind
  • Qwen3-Coder به مدل پیش‌فرض Anycoder تبدیل شد، که افزایش چشمگیری در بهره‌وری و خلاقیت برای وظایف کدنویسی فراهم می‌کند. @Alibaba_Qwen
  • حالت Copilot مایکروسافت در Edge طراحی شده است تا به «جمع‌کنندگان تب» (tab hoarders) کمک کند بهره‌وری خود را حفظ کنند، با کاهش عوامل حواس‌پرتی و افزایش جریان کار. @mustafasuleyman

پژوهش‌ها

  • پژوهش MIT CSAIL نشان می‌دهد که مدل‌های زبانی تغییرات حالت را گام‌به‌گام پیگیری نمی‌کنند، بلکه از میان‌برهای ریاضی استفاده می‌کنند که می‌توان آن‌ها را برای تقویت مهارت‌های پیش‌بینی کنترل کرد. @MIT_CSAIL
  • کریس اولاه پژوهشی را درباره‌ی وزن‌های تداخلی در قابلیت تفسیر مکانیکی (mechanistic interpretability) منتشر کرد، که پدیده‌شناسی مشابهی را بین مدل‌های کوچک (toy models) و مدارهای واقعی ترانسفورمر نشان می‌دهد. @ch402
  • محققان بودایی در یک مقاله‌ی بحث‌برانگیز، یک سوترا (متن مقدس بودایی) تولیدشده توسط LLM را مطالعه کردند و دریافتند که با وجود اینکه «حاصل کار بی‌کیفیت هوش مصنوعی» (AI slop) است، تراکم نمادگرایی و غنای ارجاعات متن، ارزش مطالعه‌ی دقیق‌تری را دارد. @emollick
  • پژوهش‌ها نشان می‌دهد که از **o3** در تولید سوتراهای بودایی ایجادشده توسط هوش مصنوعی استفاده شده است، که قابلیت‌های پیشرفته‌ی مدل را در تولید متون مذهبی نشان می‌دهد. @AndrewCurran_
  • سایمون ویلیسون اشاره می‌کند که جولای ماه شگفت‌انگیزی برای انتشار مدل‌ها از آزمایشگاه‌های هوش مصنوعی چینی بوده است، به‌طوری که بهترین مدل‌های با وزن باز (open-weight) در دسترس، اکنون از شرکت‌های چینی عرضه می‌شوند. @simonw

اخبار هوش مصنوعی در 2025-07-29

مدل‌های جدید هوش مصنوعی

  • Qwen3-30B-A3B با یک به‌روزرسانی کوچک همراه شده است که مهارت‌های استدلال، کدنویسی و ریاضیات را در آن بهبود بخشیده، دانش چندزبانه‌ی آن را گسترش داده، درک محتوای طولانی را تا 256 هزار توکن بهبود بخشیده و مشکل انسداد فکری را برطرف کرده است – این مدل با تنها 3 میلیارد پارامتر فعال‌شده، به عملکرد GPT-4o نزدیک می‌شود. @Alibaba_Qwen
  • گوگل Veo 3 و Veo 3 Fast را به‌صورت عمومی در Vertex AI منتشر می‌کند؛ این مدل‌ها قابلیت تولید یکپارچه‌ی ویدئو و صدا را از یک ورودی متنی (prompt) دارند. @GoogleCloudTech
  • گوگل MedGemma را راه‌اندازی می‌کند؛ مجموعه‌ای از مدل‌های پزشکی چندوجهیِ (multimodal) متن‌باز که برای کاربردهای مراقبت‌های بهداشتی مانند تحلیل تصاویر رادیولوژی و خلاصه‌سازی یادداشت‌های پزشکان طراحی شده‌اند. @GoogleAI
  • TencentARC از ARC-Hunyuan-Video-7B رونمایی می‌کند؛ یک مدل چندوجهی 7B فشرده برای درک ساختاریافته‌ی عمیق از ویدئوهای کوتاه واقعی، که سیگنال‌های بصری، صوتی و متنی را به‌صورت کامل (end-to-end) پردازش می‌کند. @HuggingPapers

تحلیل صنعت

  • گفته می‌شود مایکروسافت برای حفظ دسترسی به فناوری OpenAI پس از رسیدن به نقطه‌ی عطف AGI، در حال مذاکره است که نشان‌دهنده‌ی مذاکرات پیرامون شرایط همکاری‌های آتی است. @TechCrunch
  • گفته می‌شود Anthropic با دور تامین مالی احتمالی 5 میلیارد دلاری، به ارزش‌گذاری 170 میلیارد دلاری نزدیک می‌شود که نشان‌دهنده‌ی سرمایه‌گذاری گسترده و مداوم در شرکت‌های هوش مصنوعی است. @TechCrunch
  • گفته می‌شود فردی در شرکت Thinking Machines متعلق به میرا موراتی، پیشنهاد یک میلیارد دلاری مارک زاکربرگ را رد کرده است که ارزش‌گذاری‌های بسیار بالا در جذب استعدادهای هوش مصنوعی را برجسته می‌کند. @AndrewCurran_
  • مدیر محصول گروه (Group PM) گزارش می‌دهد که ابزارهای هوش مصنوعی مانند v0، مدیران محصول را قادر ساخته‌اند تا نمونه‌های اولیه‌ی مشتری را 10 برابر سریع‌تر تولید کنند و PRها را برای اصلاحات کوچک به‌طور مستقل ایجاد کنند که منجر به تکمیل سریع‌تر کارهای تجاری شده است. @GergelyOrosz
  • LLMها (مدل‌های زبانی بزرگ) به‌دلیل ماهیت غیرقطعی خود، برای تولید و نگهداری SDKها مناسب نیستند، اما می‌توانند به ساخت ابزارهای خودکار کمک کنند که SDKها را از روی مشخصات تولید می‌کنند. @GergelyOrosz
  • لوما و رانوی انتظار دارند که رباتیک در نهایت به یک محرک بزرگ درآمدزایی برای پلتفرم‌های تولید ویدئوی آن‌ها تبدیل شود. @TechCrunch

اخلاق و جامعه

  • حضور ربات‌ها در بحث‌های سیاسی در سراسر پلتفرم‌ها در حال افزایش است؛ به‌طوری که ربات‌های جدید فاقد نشانه‌های قدیمی هستند، اما الگوهای استدلالی مشابهی را در طول، چارچوب‌بندی، ریتم و لحن نشان می‌دهند و به‌طور بالقوه از آستانه‌ی نفوذ در رسانه‌های اجتماعی فراتر می‌روند. @AndrewCurran_
  • اکثر مردم خروجی‌های هوش مصنوعی را که برای کسانی که از مدل‌ها به‌طور گسترده استفاده کرده‌اند، واضح هستند، تشخیص نمی‌دهند؛ زیرا برخی افراد تنها به ادعاهای محتوایی توجه می‌کنند، نه به شکل آن‌ها. @AndrewCurran_

کاربردها

  • مرورگر Comet پرپلکسیتی، قابلیت‌های عامل هوش مصنوعی را با رزرو بلیط‌های یونایتد ایرلاینز، از جمله انتخاب صندلی، به نمایش می‌گذارد؛ این مرورگر تمامی جستجوهای omnibox را به‌طور پیش‌فرض به پرپلکسیتی مسیردهی می‌کند. @AravSrinivas
  • OpenAI حالت مطالعه (Study Mode) را در ChatGPT راه‌اندازی می‌کند؛ این حالت برای یادگیری تعاملی با استفاده از پرسش‌گری سقراطی و پاسخ‌های گام‌به‌گام طراحی شده است و برای کاربران نسخه‌های رایگان، پلاس، پرو و تیم در دسترس است. @OpenAI
  • مایکروسافت کوپایلوت می‌تواند پادکست‌های سفارشی را در هر موضوعی، با دو مجری که درباره‌ی موضوعات مشخص‌شده توسط کاربر بحث می‌کنند، تولید کند؛ این قابلیت برای یادگیری در حین حرکت مفید است. @mustafasuleyman
  • NotebookLM گوگل قابلیت نمای کلی ویدئو (Video Overviews) را عرضه می‌کند و قابلیت‌های خلاصه‌سازی محتوای خود را گسترش می‌دهد. @TechCrunch
  • حالت هوش مصنوعی گوگل، قابلیت جدید Canvas و کمک بلادرنگ (real-time) با Search Live را دریافت می‌کند که قابلیت‌های جستجوی تعاملی را افزایش می‌دهد. @TechCrunch
  • Cursor 1.3 با قابلیت همکاری عامل‌ها (Agents) در ترمینال، قابلیت مشاهده‌ی میزان استفاده از پنجره‌ی متنی (context window) و 25 درصد کاهش تاخیر در ویرایش‌های جستجو و جایگزینی (search and replace) راه‌اندازی می‌شود. @cursor_ai
  • Claude Code اکنون از کار در چندین دایرکتوری در یک جلسه‌ی کاری با استفاده از دستور `/add-dir ` پشتیبانی می‌کند که برای monorepoها و کارهای بین‌پروژه‌ای مفید است. @_catwu
  • سایبر دسک (Cyberdesk) نمایانگر یک کاربرد جالب از عامل‌های استفاده‌کننده‌ی از رایانه است و پتانسیل کشف‌نشده‌ی این حوزه‌ی فناوری را برجسته می‌کند. @cwolferesearch
  • Embedder به‌عنوان اولین عامل کدنویسی آگاه از سخت‌افزار در جهان راه‌اندازی می‌شود؛ این عامل با درک و تعامل مستقیم با سخت‌افزار، به عملکردی پیشرفته (state-of-the-art) در زمینه‌ی سیستم‌های جاسازی‌شده (embedded systems) (C/C++) دست می‌یابد. @ethanmgibbs

پژوهش‌ها

  • محققان استنفورد «آزمایشگاه مجازی» (Virtual Lab) را ایجاد می‌کنند – تیمی از عامل‌های هوش مصنوعی که آینه‌ی یک آزمایشگاه پژوهشی هستند و توسط یک عامل PI هدایت می‌شوند که جلسات گروهی را برگزار کرده و عوامل اتصال‌دهنده‌ی مؤثر برای سویه‌های جدید COVID را کشف می‌کند؛ این پژوهش در مجله‌ی Nature منتشر شده است. @james_y_zou
  • Anthropic برنامه‌ی Fellows را اعلام می‌کند که کمک‌هزینه‌ی هفتگی 2100 دلاری، حدود 15 هزار دلار هزینه‌ی محاسباتی ماهانه و راهنمایی برای پژوهش در زمینه‌های پایداری در برابر حملات (adversarial robustness)، کنترل هوش مصنوعی، نظارت مقیاس‌پذیر، ارگانیسم‌های مدل ناهماهنگی (model organisms of misalignment) و تفسیرپذیری مکانیکی (mechanistic interpretability) ارائه می‌دهد. @AnthropicAI
  • پژوهش نشان می‌دهد که «یادگیری ناخودآگاه» (subliminal learning) حالتی است که در آن مدل‌های زبانی می‌توانند ویژگی‌های خود را حتی در داده‌هایی که ظاهراً بی‌معنی هستند، به مدل‌های دیگر منتقل کنند. @AnthropicAI
  • مطالعه‌ای مواردی از مقیاس‌گذاری معکوس (inverse scaling) را در محاسبات زمان آزمون (test-time compute) یافته است که در آن استدلال بیشتر منجر به نتایج بدتر می‌شود. @AnthropicAI
  • قابلیت‌های HELM نسخه‌ی 1.9.0 منتشر شد که نشان می‌دهد Grok 4 و Kimi K2 در مجموع در بین 10 رتبه‌ی برتر قرار گرفته‌اند و Kimi K2 بهترین مدل «غیرمتفکر» (non-thinking) است. @percyliang
  • گرادیان‌های خط‌مشی تطبیق جریان (Flow Matching Policy Gradients) به‌عنوان خط‌مشی‌های (policies) RL بیانگر معرفی شدند که با استفاده از تطبیق جریان (flow matching) و از پاداش‌ها آموزش دیده‌اند و به‌عنوان جایگزینی مستقیم (drop-in replacement) برای PPO گاوسی (Gaussian PPO) در وظایف کنترلی عمل می‌کنند. @davidrmcall
  • «سوون مین» (Sewon Min) اولین جایزه‌ی پایان‌نامه‌ی دکتری ACL در رشته‌ی زبان‌شناسی محاسباتی (Computational Linguistics) را برای اثر خود با عنوان «بازاندیشی در استفاده از داده‌ها در مدل‌های زبانی بزرگ» دریافت کرد. @berkeley_ai
  • مقاله‌ی GSPO تیم Qwen علی‌بابا، سومین مقاله‌ی محبوب ماه در Hugging Face شد که انتظار می‌رود تاثیر گسترده‌ای بر این حوزه داشته باشد. @ClementDelangue

اخبار هوش مصنوعی در 2025-07-28

مدل‌های جدید هوش مصنوعی

  • شرکت Zhipu AI مدل‌های GLM-4.5 و GLM-4.5-Air را با مجوز MIT منتشر کرد. این مدل‌ها به‌ترتیب ۳۵۵ میلیارد پارامتر کلی (۳۲ میلیارد فعال) و ۱۰۶ میلیارد پارامتر کلی (۱۲ میلیارد فعال) دارند و هر دو با طول کانتکست ۱۲۸ هزار و قابلیت فراخوانی توابع بومی ارائه شده‌اند @reach_vb
  • مدل تولید ویدیوی xAI با نام Imagine در حال آماده‌سازی برای راه‌اندازی با ادغام در Grok است، که قابلیت‌های صوتی مشابه Veo 3 را ارائه می‌دهد @AndrewCurran_

تحلیل صنعت

  • شرکت جفریز پیش‌بینی هزینه‌ی سرمایه‌ای هوش مصنوعی چین برای سال ۲۰۲۵ را ۴۰ درصد افزایش داده و به ۱۰۸ میلیارد دلار رسانده است، با اشاره به اینکه کل موجودی تراشه‌های H20 شرکت NVIDIA تنها حدود نیمی از تقاضای بالقوه‌ی چین را برآورده می‌کند @AndrewCurran_
  • تسلا قرارداد ۱۶.۵ میلیارد دلاری تراشه با سامسونگ امضا کرد که تا سال ۲۰۳۳ اعتبار دارد، و تسلا در افزایش حداکثری بهره‌وری تولید تراشه‌های هوش مصنوعی کمک خواهد کرد @AndrewCurran_
  • استفاده از Perplexity در هند به‌سرعت در حال رشد است، و مدیرعامل این شرکت این موضوع را دلیلی بر تغییر همیشگی جستجو می‌داند @AravSrinivas
  • مدل‌های زبان بزرگ (LLMها) اکنون هدایت‌کننده‌ی بخش عمده‌ی خریدهای اختیاری هستند اما هیچ درآمد تبلیغاتی ایجاد نمی‌کنند، که سوالاتی را در مورد پایداری این مدل به وجود می‌آورد @snowmaker
  • شرکت Anthropic محدودیت‌های نرخ هفتگی جدیدی را برای طرح‌های Claude Pro و Max معرفی کرد که به‌دلیل تقاضای بی‌سابقه‌ی برای Claude Code است و کمتر از ۵٪ از مشترکین را تحت تأثیر قرار می‌دهد @AnthropicAI
  • نقش‌های مهندسی نرم‌افزار ممکن است با استفاده‌ی گسترده از دستیارهای برنامه‌نویسی، نیاز به تحول چشمگیری داشته باشند، و به‌طور بالقوه دسته‌بندی‌های متمایزی ایجاد کنند: مهندسان زیرساخت/بک‌اند/امنیت، مهندسان پژوهش، و توسعه‌دهندگان اپلیکیشن/فرانت‌اند @sayashk

اخلاق و جامعه

  • دانشگاه‌های چینی به‌جای محدود کردن استفاده از هوش مصنوعی، دانشجویان را به استفاده‌ی بیشتر از آن تشویق می‌کنند که رویکردی متفاوت در پذیرش هوش مصنوعی در آموزش را نشان می‌دهد @techreview
  • یونیسف در حال بررسی این موضوع است که چگونه پیشرفت نوروتکنولوژی می‌تواند بر حقوق کودکان تأثیر بگذارد، با محققان MIT به‌عنوان مشاور این پروژه @medialab

کاربردها

  • مایکروسافت حالت Copilot را در مرورگر Edge راه‌اندازی کرد که دارای قابلیت‌های تحلیل کانتکست چند تب، ناوبری صوتی، و انتقال هوشمند وظایف است @mustafasuleyman
  • Claude اکنون می‌تواند صفحات Notion و تیکت‌های Linear را مستقیماً از طریق MCP بخواند و به‌روزرسانی کند، که امکان مدیریت پروژه و به‌روزرسانی اسناد را از طریق مکالمات فراهم می‌آورد @AnthropicAI
  • گوگل کروم خلاصه‌های فروشگاهی مبتنی بر هوش مصنوعی را برای کمک به خریداران آمریکایی در تصمیم‌گیری برای خرید اضافه کرد @TechCrunch
  • سیستم FSD Supervised تسلا درک خود را از تعاملات با گیشه‌های عوارضی نشان می‌دهد، و به‌طور خودکار پس از اتمام تراکنش با استفاده از دوربین‌های ستونی و تکرارکننده‌ی جانبی پیش می‌رود @Tesla_AI
  • Salient مبلغ ۶۰ میلیون دلار در دور سری A برای عامل‌های هوش مصنوعی که به سرویس‌دهی وام‌های مصرف‌کننده می‌پردازند، جذب کرد؛ با پردازش بیش از ۱ میلیارد دلار تراکنش و کاهش ۶۰ درصدی زمان رسیدگی @a16z
  • Hugging Face ابزار خط فرمان Jobs CLI را که توسط uv کار می‌کند، راه‌اندازی کرد که امکان پردازش OCR اسناد مبتنی بر VLM را با یک دستور فراهم می‌کند @vanstriendaniel

پژوهش‌ها

  • مدل‌های زبان می‌توانند نقاشی‌های ASCII پیچیده‌ای خلق کنند، بدون اینکه به‌طور خاص برای ایجاد هنر بصری آموزش دیده باشند، که نشان‌دهنده‌ی یک قابلیت نوظهور است @AITechnoPagan
  • بهینه‌سازی مستقیم ترجیح (DPO) با آموزش یک مدل پاداش ضمنی و بازیابی سیاست بهینه‌ی RLHF به‌صورت فرم بسته کار می‌کند، که آن را پایدارتر و از نظر منابع کارآمدتر از RLHF مبتنی بر PPO می‌سازد @cwolferesearch
  • انتخاب نمونه‌ی چند شات DSPy عملکرد طبقه‌بندی Qwen را از ۵۰٪ به ۸۸٪ بهبود بخشید، که اهمیت انتخاب صحیح نمونه‌ها را نشان می‌دهد @MaximeRivest
  • مدل‌های جدید GLM-4.5 عملکرد بنچمارک چشمگیری را نشان می‌دهند، با امتیاز AIME24 برابر با ۹۱.۰ در مقابل ۷۵.۷ برای Claude 4 Opus، و امتیاز MATH 500 برابر با ۹۸.۲ در مقابل ۹۶.۷ برای GPT-4.1 @reach_vb
  • پژوهش‌ها در مورد همراهان هوش مصنوعی بی‌درنگ چالش‌هایی را در دستیابی به فرکانس ۱۰ هرتزی مکالمات انسانی در مقابل زمان واکنش ۱-۲ هرتزی فعلی LLMها شناسایی می‌کنند، که نیازمند پیشرفت در پردازش چندوجهی و درک کانتکست طولانی است @ericjang11

اخبار هوش مصنوعی در 2025-07-27

مدل‌های جدید هوش مصنوعی

  • تنسنت مدل سه‌بعدی Hunyuan را برای تولید مدل‌های سه‌بعدی از دستورات متنی، با مخزن گیت‌هاب و امکان ادغام با هاگینگ فیس، منتشر کرد @AndrewCurran_
  • علی‌بابا Qwen، الگوریتم جدید یادگیری تقویتی GSPO (Group Sequence Policy Optimization) را معرفی کرد؛ این الگوریتم قدرت‌بخش جدیدترین مدل‌های Qwen3، شامل نسخه‌های Instruct، Coder و Thinking است @Alibaba_Qwen
  • Qwen3 Coder در رتبه‌بندی دستورات برنامه‌نویسی از Grok 4 پیشی گرفته و اکنون در OpenRouter هم‌رده‌ی Kimi قرار دارد @OpenRouterAI

تحلیل صنعت

  • هالیوود مدیا با Imoliver، برترین طراح موسیقی هوش مصنوعی (AI music designer) در Suno، قراردادی ضبط امضا کرد – این اولین بار است که یک خالق Suno چنین قراردادی را دریافت می‌کند و امکان پخش در اسپاتیفای نیز فراهم می‌شود @AndrewCurran_
  • بر اساس تحلیل صنعت، جست‌وجو برای استعدادهای هوش مصنوعی به‌طور فزاینده‌ای رقابتی شده و شبیه به «فصل تعطیلات NBA، با حقوق‌های بالا، نقل‌و‌انتقالات غافلگیرکننده و درامای فراوان» است @TechCrunch
  • مدیر ارشد فناوری (CTO) در DX پیشنهاد می‌کند که نقشه‌های راه سنتی در عصر هوش مصنوعی منسوخ شده‌اند که نشان‌دهنده‌ی تغییری در برنامه‌ریزی توسعه‌ی نرم‌افزار است @GergelyOrosz
  • مدل‌های هوش مصنوعی متن‌باز چینی سلطه‌ی قابل‌توجهی از خود نشان می‌دهند، به طوری که چهار مدل برتر متن‌باز چینی هستند و ۱۸ مدل از ۲۰ مدل برتر، هم پیش‌آموزش و هم پس‌آموزش خود را به‌صورت داخلی انجام داده‌اند @natolambert
  • DOGE ابزار هوش مصنوعی توسعه داده که به‌طور خاص برای کاهش مقررات فدرال طراحی شده است، این نشان‌دهنده‌ی نقش فزاینده‌ی هوش مصنوعی در ابتکارات مربوط به کارایی دولت است @TechCrunch

اخلاق و جامعه

  • مصطفی سلیمان تمایز کلیدی بین انسان و هوش مصنوعی را برجسته می‌کند: «هوش‌های مصنوعی امروزی دانش دارند (مقدار زیادی از آن) اما فقط می‌توانند تجربه را تقلید کنند.» او هشدار می‌دهد که وقتی این شکاف پر شود، «بسیاری از چیزها تغییر خواهد کرد» و خواستار حداکثر احتیاط است @mustafasuleyman
  • ایلان ماسک نگرانی‌ها در مورد کاهش جمعیت ناشی از هوش مصنوعی را به چالش می‌کشد. او استدلال می‌کند که هوش مصنوعی در واقع نرخ تولد را «برای به حداکثر رساندن مخروط نور آینده از تناژ انتقال‌دهنده‌های عصبی» افزایش خواهد داد، و پیشنهاد می‌کند که هوش مصنوعی می‌تواند ساختارهای اجتماعی را برای جذاب‌تر کردن والدگری بهینه کند @pmarca

کاربردها

  • یک توسعه‌دهنده در یک شرکت سنتی، سیستمی مبتنی بر LLM ساخت تا با وارد کردن تمام تیکت‌های JIRA به یک سیستم RAG با پایگاه داده‌ی وکتوری، بن‌بست‌های پروژه را رفع کند و سوالاتی در مورد بخش‌های نامشخص ایجاد می‌کرد؛ اگرچه در نهایت مشکلات سازمانی زیربنایی را حل نکرد @GergelyOrosz
  • ترزا تورس با گردش کار مربی هوش مصنوعی مصاحبه‌ی خود (AI Interview Coach)، به یک نقطه‌ی عطف بزرگ دست یافت و روش‌های ارزیابی پیچیده‌ای را برای شناسایی و رفع خطاهایی توسعه داد که هوش مصنوعی در آن، بخش‌هایی را در ابعاد بازخورد متعدد بازنشر می‌کرد و نرخ خطا را از ۸۱٪ به ۳٪ کاهش داد @ttorres
  • یک توسعه‌دهنده با موفقیت از عامل کدنویسی Amp برای یک مشارکت متن‌باز واقعی استفاده کرد و راهنمای «مفاهیم طرح‌بندی» (Layouts Concepts) را برای فریم‌ورک وب Air ایجاد کرد که کمک عملی هوش مصنوعی در وظایف مستندسازی و یادگیری را نشان می‌دهد @isaac_flath
  • شیمیدانان MIT برچسب مولکولی توسعه دادند که می‌تواند قندهای مرتبط با سل (TB-linked sugars) را در باکتری‌ها شناسایی کند و به‌طور بالقوه امکان آزمایش‌های سریع‌تر، ساده‌تر و ارزان‌تر سل را فراهم می‌کند @MIT
  • یک کاربر ردیت تعاملات اپلیکیشن‌های دوست‌یابی را با استفاده از شبیه‌ساز اندروید و هوش مصنوعی خودکارسازی کرد و طبق گزارش‌ها، هفته‌ای ۱۰ قرار ملاقات به دست آورد که پتانسیل تأثیر هوش مصنوعی بر دوست‌یابی آنلاین را برجسته می‌کند @deedydas

پژوهش‌ها

  • پژوهشگران چینی ASI-Arch را توسعه دادند، یک سیستم هوش مصنوعی که با تحلیل تمام پژوهش‌های LLM، ۱۰۶ معماری مدل هوش مصنوعی جدید را کشف کرد و معماری‌های کشف‌شده همگرایی و عملکرد بنچ‌مارک بهتری نسبت به مدل‌های موجود نشان می‌دهند @deedydas
  • اتان مولیک نشان می‌دهد که مدل مرموز «Summit»، ۲۳۵۱ خط کد پیچیده‌ی p5.js را برای رابط کاربری پنل کنترل یک سفینه‌ی فضایی از دستورات ساده تولید می‌کند که قابلیت‌های پیشرفته‌ی تولید کد را به نمایش می‌گذارد @emollick
  • نیتن لمبرت پیش‌بینی می‌کند که سازمان‌های پژوهشی چینی به زودی قوانین مقیاس‌گذاری LLM را برای یادگیری تقویتی منتشر خواهند کرد، و اشاره می‌کند که آزمایشگاه‌های مرزی بسته احتمالاً قبلاً این دانش را توسعه داده‌اند اما آن را به اشتراک نگذاشته‌اند @natolambert
  • Qwen3 Coder به نرخ شکست ویرایش diff معادل ۵.۷۵٪ دست می‌یابد که با عملکرد Sonnet 4 و Kimi K2 در وظایف کدنویسی مطابقت دارد @cline
  • پژوهشگران استنفورد بنچ‌مارک RIFTS را معرفی کردند که بر اساس بیش از ۶۰ هزار تعامل واقعی انسان و LM است و چالش‌های مربوط به «grounding» انسان-LM را برای وظایفی که به زمینه‌ی بیشتری نسبت به بنچ‌مارک‌های سنتی نیاز دارند، برطرف می‌کند @oshaikh13
  • بازی‌های جدیدی برای آزمایش قابلیت‌های هوش مصنوعی استفاده می‌شوند، به طوری که پژوهشگران نسخه‌های شطرنج و فرمت‌های بازی دیگر را برای ارزیابی عملکرد هوش مصنوعی در حوزه‌های جدید توسعه می‌دهند @emollick

اخبار هوش مصنوعی در 2025-07-26

مدل‌های جدید هوش مصنوعی

  • Qwen مدل تفکر به‌روز‌شده‌ی خود را با قابلیت‌های استدلال گسترده منتشر کرد؛ این مدل برای انجام وظایف پیچیده‌ای مانند دستورالعمل‌های نقاشی، ۱۶۶ ثانیه زمان صرف کرد @simonw
  • گوگل اعلام کرد که Gemini 2.5 Flash-Lite اکنون پایدار و به‌صورت عمومی برای توسعه‌دهندگان و مشتریان سازمانی در دسترس قرار گرفته است @GoogleAI
  • گوگل مدل جدید Aeneas را منتشر کرد؛ این مدل برای کمک به تاریخ‌دانان جهت تفسیر، ارجاع و بازسازی متون باستانی طراحی شده است @GoogleAI
  • InternLM مدل چندحالته‌ی (multimodal) ۲۳۵B MoE خود با نام Intern-S1 را منتشر کرد؛ این مدل با کدگذار (encoder) بینایی ۶B، با ۵ تریلیون توکن چندحالته و ۲.۵ تریلیون توکن حوزه‌ی علمی و قابلیت‌های فراخوانی ابزار آموزش دیده است @Xianbao_QIAN

تحلیل صنعت

  • متا «شنگ‌جیا ژائو» را به‌عنوان دانشمند ارشد واحد ابرهوش مصنوعی خود منصوب کرد @TechCrunch
  • Perplexity دسته‌ی دیگری از دعوت‌نامه‌های Comet را ارسال کرد که نشان‌دهنده‌ی گسترش مستمر پلتفرم جستجوی هوش مصنوعی آن‌هاست @AravSrinivas
  • Windsurf AI گزارش داد که با ۳۰٪ از ۱۰۰ شرکت برتر فورچون از جمله JPMC، Dell، Cisco، Phillips، ServiceNow و MercadoLibre همکاری می‌کند @sandeepDshah
  • شرکت Unitree چین یک ربات انسان‌نمای ۲۵ کیلوگرمی را با قیمت ۵۹۰۰ دلار منتشر کرد که این اولین بار است که یک ربات انسان‌نما قیمتی کمتر از یک MacBook Pro با بالاترین پیکربندی دارد؛ اگرچه این ربات محدود به یک ساعت عمر باتری و قابلیت‌های ابتدایی است @deedydas
  • تحلیل‌ها نشان می‌دهد که بسیاری از پژوهشگران پیشرو هوش مصنوعی به‌طور شگفت‌انگیزی از ابزارهای هوش مصنوعی استفاده نمی‌کنند، حتی از مدل‌هایی که خودشان آموزش می‌دهند که نشان‌دهنده‌ی نقص در سیستم‌های انگیزشی است @_xjdr
  • مهندسان نرم‌افزاری که مدل‌های زبان بزرگ (LLM) را برای کدنویسی مفید نمی‌دانند، معمولاً در سه دسته قرار می‌گیرند: کسانی که بیش از ۲ ماه پیش و قبل از بهبودهایی مانند Claude Code از آن‌ها استفاده کرده‌اند؛ کسانی که در زبان‌ها/فریمورک‌های نامعمول (esoteric) کار می‌کنند؛ یا کسانی که روی پایگاه‌های کد بزرگ و از پیش موجود کار می‌کنند @deedydas

اخلاق و جامعه

  • موسسه‌ی Future of Life یک کارنامه‌ی گزارش ایمنی را منتشر کرد که به سازندگان برجسته‌ی مدل‌های هوش مصنوعی نمره داده است؛ در این کارنامه، Anthropic با نمره‌ی C+ بالاترین امتیاز را کسب کرد، در حالی که DeepSeek پایین‌ترین نمره‌ی F را دریافت کرد @MIT_CSAIL
  • جفری هینتون پیشنهاد ایجاد یک جامعه‌ی بین‌المللی از موسسات ایمنی هوش مصنوعی را مطرح کرد تا روی تکنیک‌های آموزش هوش مصنوعی برای خیرخواه بودن کار کنند @AndrewCurran_
  • نخست‌وزیر چین، «لی کیانگ»، پیشنهاد تاسیس یک سازمان برای همکاری و هماهنگی جهانی هوش مصنوعی را مطرح کرد، با تاکید بر توسعه‌ی متن‌باز و اشتراک پیشرفت‌ها با کشورهای در حال توسعه @AndrewCurran_

کاربردها

  • اولین مطالعه‌ی کنترل‌شده‌ی هوش مصنوعی مولد (GenAI) در کنترل کیفیت صنعتی نشان داد که مهندسانی که از یک سیستم عیب‌یابی مجهز به GPT-3.5 استفاده می‌کردند، هنگام راه‌اندازی قطارهای جدید افزایش قابل‌توجهی در کیفیت کار داشتند @emollick
  • Google Photos و YouTube اکنون از تبدیل عکس به ویدئو با استفاده از هوش مصنوعی پشتیبانی می‌کنند، با افکت‌های جدید Veo برای تبدیل سلفی‌ها به ویدئوهای سرگرم‌کننده @GoogleAI
  • گوگل AI Playground را به‌عنوان یک مرکز جدید برای قابلیت‌های ساخت محتوای هوش مصنوعی YouTube و آزمایش Opal را برای ساخت و اشتراک‌گذاری مینی‌اپلیکیشن‌های هوش مصنوعی راه‌اندازی کرد @GoogleAI
  • جستجو و خرید گوگل اکنون از قابلیت امتحان مجازی لباس (virtual try-on) با کمک هوش مصنوعی در ایالات متحده پشتیبانی می‌کند @GoogleAI
  • انویدیا برای اولین بار شبیه‌سازهای کامل اقیانوس را با مدل‌های جوی جفت کرد که قابلیت‌های جدیدی را در پیش‌بینی ال نینو و پیش‌بینی فصلی امکان‌پذیر می‌سازد @NVIDIAAI

پژوهش‌ها

  • تیم تفسیرپذیری Anthropic چندین به‌روزرسانی پژوهشی منتشر کرد، از جمله کارهایی روی خودکارسازی ممیزی مدل، گونه‌های جایگزین ترنسکدر برای لایه‌های MLP به‌عنوان تبدیل‌های خطی شرطی، و یک تیم جدید را معرفی کرد که روش‌های تفسیرپذیری را برای پاسخ به سوالات مهم درباره‌ی رفتار مدل به کار می‌گیرد @ch402
  • Gemini عملکردی در حد مدال طلا در المپیاد جهانی ریاضی به دست آورد که نشان‌دهنده‌ی پیشرفت قابل‌توجهی در قابلیت‌های استدلال ریاضی است @GoogleAI
  • هوآوی سیستم CloudMatrix 384 خود را که شامل ۳۸۴ تراشه‌ی 910C آن‌هاست، در اولین حضور عمومی خود در WAIC به نمایش گذاشت @AndrewCurran_
  • بحثی درباره‌ی پیش‌آموزش (pretraining) به‌عنوان «علمی ظریف» که توسط ریاضیدانان انجام می‌شود، در مقابل پس‌آموزش (posttraining) به‌عنوان «پژوهش هیجان‌انگیز سبک کابویی» با آزمایش سریع هایپرپارامترها، که روش‌های متدولوژیک متفاوت در توسعه‌ی هوش مصنوعی را برجسته می‌کند @tszzl

اخبار هوش مصنوعی در 2025-07-25

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-235B-A22B-Thinking-2507، پیشرفته‌ترین مدل استدلالی خود را با عملکرد بهبودیافته در استدلال منطقی، ریاضیات، علوم و کدنویسی منتشر کرد؛ این مدل دارای ۲۵۶ هزار توکن در زمینه (context) بومی است و به‌طور انحصاری برای حالت «تفکر» (thinking mode) ساخته شده است @Alibaba_Qwen
  • متا، شنگ‌جیا ژائو را به‌عنوان دانشمند ارشد آزمایشگاه‌های ابرهوش متا (Meta Superintelligence Labs) معرفی کرد؛ این تیم بر جهت‌گیری علمی برای توسعه‌ی هوش مصنوعی تمرکز خواهد کرد @AIatMeta
  • «ایمجن ۴ اولترا» (Imagen 4 Ultra) گوگل، رتبه‌ی اول را در جدول امتیازات lmarena برای تولید تصویر از متن کسب کرد و اکنون در Google AI Studio و Gemini API در دسترس است @OfficialLoganK
  • هوش مصنوعی فیگما (Figma AI) از مرحله‌ی بتا خارج شد و در همه‌ی طرح‌های پولی در دسترس قرار گرفت، از جمله قابلیت‌های تولید تصویر، حذف پس‌زمینه، افزایش وضوح و بازنویسی متن @figma
  • اوپن‌ای‌آی (OpenAI) پس از تأخیرهای اولیه، عرضه‌ی کامل عامل چت‌جی‌پی‌تی (ChatGPT agent) را به همه‌ی کاربران «پلاس»، «پرو» و «تیم» به پایان رساند @OpenAI
  • انتروپیک (Anthropic) پشتیبانی سرور MCP موبایل را برای کلود (Claude) راه‌اندازی کرد که به کاربران امکان می‌دهد به ابزارها و پروژه‌های متصل‌شده در دستگاه‌های iOS و اندروید دسترسی پیدا کنند @AnthropicAI

تحلیل صنعت

  • پلنتیر (Palantir) با پشت سر گذاشتن شرکت‌های بزرگی مانند هوم دیپو (Home Depot) و بنک آو آمریکا (Bank of America) و در حالی که با ۲۷۳ برابر سود آتی معامله می‌شود، بیستمین شرکت باارزش ایالات متحده از نظر ارزش بازار شد @AndrewCurran_
  • ارجاعات هوش مصنوعی به وب‌سایت‌های برتر در ژوئن ۲۰۲۵ نسبت به سال قبل ۳۵۷٪ افزایش یافت و به ۱.۱۳ میلیارد ارجاع رسید که نشان‌دهنده‌ی رشد قابل توجهی در ترافیک وب مبتنی بر هوش مصنوعی است @TechCrunch
  • مرورگر «کامِت» (Comet) پرپلکسیتی (Perplexity) پذیرش فزاینده‌ی کاربران را نشان می‌دهد، به‌طوری که از زمان راه‌اندازی، درصد رو به رشدی از کاربران آن را به‌عنوان مرورگر پیش‌فرض خود انتخاب کرده‌اند @AravSrinivas
  • مدل‌های هوش مصنوعی متن‌باز چینی اکنون در خط مقدم قرار دارند و ناظران به سرعت از دست دادن موقعیت برتر لاما (Llama) در این گفت‌وگو اشاره می‌کنند @natolambert
  • پلتفرم «پیپرز ویت کد» (Papers with Code) پس از ۷ سال تعطیل شد؛ بنیان‌گذاران آن برای ساخت شرکت‌های جدید هوش مصنوعی حرکت کردند و هاگینگ فیس (Hugging Face) برخی از قابلیت‌ها را بر عهده گرفت @rosstaylor90

کاربردها

  • مرورگر «کامِت» (Comet) پرپلکسیتی (Perplexity) کاربردهای عملی هوش مصنوعی را نشان می‌دهد، از جمله ایجاد پلی‌لیست‌های اسپاتیفای (Spotify)، سفارش مستقیم غذا از رستوران‌ها برای جلوگیری از هزینه‌های برنامه‌های تحویل، و خودکارسازی وظایف لینکدین (LinkedIn) @AravSrinivas
  • «کلود کد» (Claude Code) قابلیت زیرعامل‌های سفارشی (custom subagents) را معرفی می‌کند که به کاربران امکان می‌دهد تیم‌هایی از عامل‌های هوش مصنوعی تخصصی برای کارهای مختلف ایجاد کنند @_catwu
  • انتروپیک (Anthropic) یکپارچگی کلود (Claude) با کنوا (Canva) را نشان می‌دهد که کاربران را قادر می‌سازد اسناد را آپلود کرده و آن‌ها را به طرح‌های بصری برندسازی‌شده تبدیل کنند @AnthropicAI
  • اوپن‌ای‌آی (OpenAI) قابلیت «پژوهش عمیق» (Deep Research) را بر روی اسناد نوشن (Notion) فعال می‌کند، که قابلیت‌های پژوهش هوش مصنوعی را به پایگاه‌های دانش شخصی گسترش می‌دهد @gdb
  • ایتان مولیک (Ethan Mollick) تکنیک‌های پرامپت‌نویسی خلاقانه را برای تولید ویدیوی «ویو ۳» (Veo 3) گوگل نشان می‌دهد، از جمله استفاده از اسلایدهای پاورپوینت به‌عنوان پرامپت و تولید سناریوهای تاریخی فرود بر ماه @emollick
  • یوجین یان (Eugene Yan) گردش کار توسعه‌ی سریع با کمک هوش مصنوعی را به نمایش می‌گذارد، شامل ساخت کلاس‌های ارزیابی LLM، نوت‌بوک‌های آماده‌سازی داده، و پیاده‌سازی‌های دمو در یک ساعت با استفاده از دستیاران کدنویسی @eugeneyan

پژوهش‌ها

  • فرانسوا شوله (Francois Chollet) گزارش می‌دهد که «کون‌ون ۳-۲۳۵بی اینسترکت» (Qwen3-235B Instruct) امتیاز ۱۱٪ در ARC-AGI-1 و ۱.۳٪ در ARC-AGI-2 کسب کرده است و آن را به‌عنوان ارزان‌ترین مدل پایه برای کسب امتیاز بالای ۱۰٪ در ARC-AGI-1 قرار می‌دهد @fchollet
  • جایزه‌ی ARC 2025 به بالاترین امتیاز جدید ۱۹.۰٪ توسط Giotto.ai دست یافت که نشان‌دهنده‌ی پیشرفت مستمر در قابلیت‌های استدلال هوش مصنوعی است @arcprize
  • مهندسان MIT قوی‌ترین کوپلینگ نور-ماده را در یک مدار کوانتومی به دست آوردند که گام کلیدی به سوی رایانه‌های کوانتومی تحمل‌پذیر خطا (fault-tolerant quantum computers) است @MIT
  • پژوهش Stanford HAI استفاده از هوش مصنوعی برای شبیه‌سازی داده‌های انسانی در مطالعات علوم اجتماعی را بررسی می‌کند، که روش‌های پژوهشی سریع‌تر و مقیاس‌پذیرتری را امکان‌پذیر می‌سازد @StanfordHAI
  • گوگل «جیمنای ۲.۵ فلش-لایت» (Gemini 2.5 Flash-Lite) را با همکاری Trillium TPU طراحی کرد تا به سرعت‌های فوق‌العاده سریع دست یابد، که اهمیت بهینه‌سازی مشترک سخت‌افزار و نرم‌افزار را نشان می‌دهد @GoogleAI

اخلاق و جامعه

  • سم آلتمن (Sam Altman) به کاربران هشدار می‌دهد که هنگام استفاده از چت‌جی‌پی‌تی (ChatGPT) به‌عنوان درمانگر، هیچ محرمانگی قانونی وجود ندارد، که مرزهای مهم حریم خصوصی و حرفه‌ای را در کاربردهای هوش مصنوعی در سلامت روان برجسته می‌کند @TechCrunch
  • مصطفی سلیمان (Mustafa Suleyman) معتقد است که یادگیری هوش مصنوعی به یک پیش‌نیاز اساسی برای مشاغل تبدیل شده است، و مزیت رقابتی بعدی توانایی مدیریت تیم‌هایی از هوش مصنوعی‌ها خواهد بود @mustafasuleyman
  • گرگلی اوروش (Gergely Orosz) نگرانی‌هایی را در مورد برنامه‌های تولیدشده توسط هوش مصنوعی با شیوه‌های ضعیف حریم خصوصی و امنیتی که توسط فروشگاه‌های برنامه (app stores) تأیید می‌شوند، مطرح می‌کند و مسئولیت‌پذیری را در صورت فاش شدن داده‌های حساس زیر سوال می‌برد @GergelyOrosz

اخبار هوش مصنوعی در 2025-07-24

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-Coder-480B-A35B را منتشر کرد؛ یک مدل MoE با ۴۸۰ میلیارد پارامتر و ۳۵ میلیارد پارامتر فعال که به ۷۰٪ در بنچمارک SWE-Bench Verified و طول زمینه ۱ میلیون دست یافت، و احتمالاً بهترین مدل کدنویسی تا به امروز است. @deedydas
  • علی‌بابا Qwen3-MT، قدرتمندترین مدل ترجمه‌ی خود را راه‌اندازی کرد که از بیش از ۹۲ زبان پشتیبانی می‌کند و بیش از ۹۵٪ جمعیت جهان را پوشش می‌دهد؛ این مدل با تریلیون‌ها توکن چندزبانه آموزش دیده است. @Alibaba_Qwen
  • تام وارن گزارش می‌دهد که GPT-5 در ماه اوت عرضه خواهد شد و GPT-5-mini به‌طور هم‌زمان در هر دو بخش کلاینت و API عرضه می‌شود و GPT-5-nano نیز فقط برای API برنامه‌ریزی شده است. @AndrewCurran_
  • اوپن‌ای‌آی قصد دارد یک مدل منبع‌باز را پیش از GPT-5 عرضه کند که گفته می‌شود مشابه o3-mini با قابلیت‌های استدلالی است. @AndrewCurran_

تحلیل صنعت

  • گوگل ماهانه بیش از ۹۸۰ تریلیون توکن را در سرویس‌های خود پردازش می‌کند که از ۴۸۰ تریلیون در ماه مه دو برابر شده است، و اپلیکیشن Gemini به ۴۵۰ میلیون کاربر فعال ماهانه رسیده است. @AndrewCurran_
  • بیش از ۷۰ میلیون ویدیوی کاربری با Veo 3 ایجاد شده است که نشان‌دهنده‌ی پذیرش قابل توجه مدل تولید ویدیوی گوگل است. @AndrewCurran_
  • شرکت Safe Superintelligence (شرکت ایلیا سوتسکور) به‌طور انحصاری از TPUهای گوگل برای توسعه‌ی هوش مصنوعی خود استفاده خواهد کرد. @AndrewCurran_
  • متا رویکردی نوآورانه در پیش گرفته است و چادرهای مقاوم در برابر آب و هوا را برای جای دادن خوشه‌های GPU می‌سازد، که مراکز داده‌ی جدید را قادر می‌سازد در عرض چند ماه به جای چند سال راه‌اندازی شوند. @AIatMeta
  • فایننشال تایمز گزارش می‌دهد که بیش از ۱ میلیارد دلار تراشه‌ی انویدیا، از جمله تراشه‌های Blackwell، طی سه ماه گذشته با وجود کنترل‌های صادراتی به چین رسیده است. @AndrewCurran_
  • چین اکنون ۵ آزمایشگاه پیشرو هوش مصنوعی دارد که در سطح جهانی رقابت می‌کنند: DeepSeek، Alibaba Qwen، Bytedance، Hailuo و Kimi، با سرعت توسعه‌ی بالا و احتمالاً هزینه‌هایی کمتر از همتایان آمریکایی خود. @deedydas
  • پژوهش‌ها نشان می‌دهد که توسعه‌دهندگان بیشترین زمان را با ابزارهای هوش مصنوعی از طریق تجزیه و تحلیل stack trace و بازآرایی کد، به جای تولید کد، صرفه‌جویی می‌کنند؛ این یافته بر اساس پژوهش DX با ۱۸۰ شرکت است. @GergelyOrosz
  • شرکت‌های فناوری پیشرو مانند گیت‌هاب و شاپی‌فای به‌دلیل هوش مصنوعی کارآموزان بیشتری استخدام می‌کنند و مشاهده می‌کنند که دانشجویان علوم کامپیوتر از ابزارهای هوش مصنوعی روان‌تر از قبل استفاده می‌کنند. @GergelyOrosz
  • جک دورسی در کمتر از یک هفته دو اپلیکیشن را با استفاده از ابزار هوش مصنوعی Goose برای توسعه‌ی سریع منتشر کرد که روند «vibe coding» را به نمایش می‌گذارد. @TechCrunch

اخلاق و جامعه

  • اظهارات رئیس جمهور ترامپ در اجلاس هوش مصنوعی درباره‌ی حق کپی‌رایت نشان می‌دهد که هوش مصنوعی باید قادر باشد بدون پرداخت برای هر بار استفاده، از محتوا یاد بگیرد؛ او این امر را با یادگیری انسان مقایسه کرده و اشاره کرده که چین چنین محدودیت‌هایی را دنبال نمی‌کند. @AndrewCurran_
  • الزامات جدید دولتی بیان می‌کنند که برای واجد شرایط بودن قراردادهای دولتی، یک LLM باید با اصول حقیقت‌جویی و بی‌طرفی ایدئولوژیک توسعه یابد. @AndrewCurran_
  • ایتان مولیک نشان می‌دهد که بیش از ۶۰٪ از لینک‌های قدیمی مقالات نیویورک تایمز اکنون شکسته شده‌اند، که نشان می‌دهد تنها LLMها بخش زیادی از محتوای ناپایدار وب را «به خاطر خواهند آورد». @emollick
  • بررسی دقیق بنچمارک Humanity's Last Exam نشان می‌دهد که بسیاری از سؤالات دارای پاسخ‌های «صحیح» نادرست هستند که چالش‌های موجود در اندازه‌گیری و بنچمارکینگ هوش مصنوعی را برجسته می‌کند. @emollick
  • فرانسوا شولیت در مورد گرایش به انسان‌انگاری سیستم‌های هوش مصنوعی که انسان نیستند هشدار می‌دهد و بر اهمیت درک ماهیت واقعی آن‌ها تأکید می‌کند. @fchollet

کاربردها

  • پرپلکسیتی مرورگر Comet را با قابلیت‌های دستیار هوش مصنوعی راه‌اندازی کرد که می‌تواند خود را توزیع کرده و کاربران جدید را جذب کند، و برای عملکرد خود بازخوردهای مثبتی دریافت کرده است. @testingcatalog
  • کرسر Bugbot را منتشر کرد که در ماه گذشته بیش از ۱ میلیون باگ در PRهای نوشته شده توسط انسان پیدا کرده است، و بیش از نیمی از آن‌ها مشکلات منطقی واقعی بودند که پیش از ادغام رفع شدند. @cursor_ai
  • گیت‌هاب Spark را راه‌اندازی کرد؛ یک پلتفرم «prompt-to-app» برای ایجاد و توسعه‌ی تکراری اپلیکیشن‌های React با احراز هویت کاربر و ذخیره‌سازی پایدار. @simonw
  • فیگما Make را برای همه منتشر کرد؛ یک راه‌حل «prompt-to-app» که به کاربران امکان می‌دهد پروتوتایپ ایجاد کرده و در جامعه‌ی فیگما (Figma Community) منتشر کنند. @figma
  • گوگل قابلیت تبدیل عکس به ویدیو را معرفی کرد که به گوگل فوتوز و یوتیوب شورتز می‌آید. @sundarpichai
  • گوگل قابلیت مجازی پرو لباس را با استفاده از فناوری هوش مصنوعی راه‌اندازی کرد. @TechCrunch
  • لینیر قابلیت داشبوردها را معرفی کرد که به کاربران امکان می‌دهد نماهای سفارشی برای نظارت بر معیارهای کلیدی ایجاد کنند. @linear
  • xAI با Kalshi همکاری می‌کند تا Grok را به بازارهای پیش‌بینی بیاورد. @xai

پژوهش‌ها

  • آنتروپیک سه عامل هوش مصنوعی را برای ممیزی هم‌ترازی توسعه داده است که می‌توانند به‌طور خودکار اهداف پنهان را کشف کنند، ارزیابی‌های ایمنی را بسازند و رفتارهای نگران‌کننده را آشکار سازند، و عامل بازرس آن‌ها ۴۲٪ چالش‌های ممیزی را برنده شد. @AnthropicAI
  • گوگل با استفاده از نسخه‌ی پیشرفته‌ی Gemini با حالت Deep Think، به عملکردی در سطح مدال طلا در المپیاد جهانی ریاضی دست یافت. @sundarpichai
  • پژوهش، چارچوب Rubrics as Rewards (RaR) را معرفی می‌کند که از ارزیابی‌های ساختارمند و چک‌لیستی به‌عنوان سیگنال‌های پاداش قابل تفسیر برای آموزش «on-policy» استفاده می‌کند و بهبودهای نسبی در HealthBench-1k را به ارمغان می‌آورد. @iScienceLuvr
  • کامرون وولف توضیح می‌دهد که مدل‌های پاداش در عصر مدل‌های استدلالی همچنان مرتبط هستند، زیرا اکثر سیستم‌ها همچنان از RLHF برای هم‌ترازی ترجیحات انسانی و RLVR برای وظایف استدلالی قابل تأیید استفاده می‌کنند. @cwolferesearch
  • آنتروپیک تیم «روانپزشکی هوش مصنوعی» را به‌عنوان بخشی از تلاش‌های تفسیرپذیری راه‌اندازی کرد تا درباره‌ی شخصیت‌ها، انگیزه‌ها و آگاهی موقعیتی مدل‌ها و نحوه‌ی منجر شدن آن‌ها به رفتارهای نگران‌کننده پژوهش کند. @Jack_W_Lindsey
  • دانشمندان MIT سلول‌های زنده را با گیت‌های منطقی، مانند کامپیوترهای بیولوژیکی، برنامه‌ریزی می‌کنند تا سرطان را با دقت تشخیص داده و از بین ببرند. @MIT
  • پای‌تورچ نمایش می‌دهد که SmolLM3-3B با سرعت ۱۵ توکن در ثانیه روی گلکسی S22 با استفاده از TorchAO و ExecuTorch برای استقرار روی دستگاه اجرا می‌شود. @PyTorch

اخبار هوش مصنوعی در 2025-07-23

مدل‌های جدید هوش مصنوعی

  • علی‌بابا مدل Qwen3-Coder-480B-A35B-Instruct را منتشر کرد؛ یک مدل «میزبان متخصص» (Mixture-of-Experts) با ۴۸۰ میلیارد پارامتر که ۳۵ میلیارد پارامتر فعال دارد، قابلیت پشتیبانی از ۲۵۶ هزار توکن ورودی (قابل‌گسترش تا ۱ میلیون) را ارائه می‌دهد و عملکردی در سطح عالی در بنچمارک‌های کدنویسی عامل‌محور، از جمله SWE-bench-Verified، کسب کرده است @Alibaba_Qwen
  • گوگل شناسه مدل Gemini 2.5 Flash Lite را منتشر کرد که اکنون از طریق ترکیب‌های مختلف API در دسترس است @GoogleCloudTech
  • میسترال ای‌آی گزارش فنی Voxtral Technical Report را منتشر کرد که شامل پیش‌آموزش، پس‌آموزش، هم‌ترازی و ارزیابی‌ها، از جمله تحلیل انتخاب بهینه‌ی معماری مدل است @MistralAI
  • بوزون ای‌آی Higgs Audio V2 را منتشر کرد؛ یک مدل باز و یکپارچه‌ی TTS با قابلیت شبیه‌سازی صدا که بر روی ۱۰ میلیون ساعت گفتار، موسیقی و رویداد آموزش داده شده و بر پایه‌ی Llama 3.2 3B ساخته شده است و طبق گزارش‌ها GPT-4o-mini-tts و ElevenLabs v2 را شکست می‌دهد @reach_vb

تحلیل صنعت

  • کاخ سفید برنامه‌ی اقدام هوش مصنوعی خود را منتشر کرد و بر نیاز آمریکا به پیشتازی در مدل‌های هوش مصنوعی منبع‌باز مبتنی بر ارزش‌های آمریکایی تأکید کرد و بیان داشت که این مدل‌ها ارزش ژئواستراتژیک دارند و می‌توانند به استانداردهای جهانی تبدیل شوند @AndrewCurran_
  • برنامه‌ی اقدام هوش مصنوعی، هوش مصنوعی را این‌گونه توصیف می‌کند: «یک انقلاب صنعتی، یک انقلاب اطلاعاتی و یک رنسانس – همه در یک زمان» با اولویت‌های سرمایه‌گذاری فدرال در رباتیک و فناوری‌های مرتبط برای تولید @AndrewCurran_
  • داده‌های باکیفیت در برنامه‌ی اقدام هوش مصنوعی «دارایی استراتژیک ملی» اعلام شده‌اند و ایالات متحده قصد دارد بزرگترین و باکیفیت‌ترین مجموعه‌داده‌های علمی آماده برای هوش مصنوعی را در جهان ایجاد کند @AndrewCurran_
  • این طرح به‌روزرسانی دستورالعمل‌های تدارکات فدرال را پیشنهاد می‌کند تا اطمینان حاصل شود که قراردادهای دولتی تنها با توسعه‌دهندگان مدل‌های زبانی بزرگ پیشرفته (frontier LLM) منعقد می‌شوند که سیستم‌هایشان عینی و عاری از سوگیری ایدئولوژیک باشند @AndrewCurran_
  • آنتروپیک از برنامه‌ی اقدام هوش مصنوعی کاخ سفید، به‌ویژه تمرکز آن بر زیرساخت، پذیرش فدرال و هماهنگی ایمنی، حمایت می‌کند و در عین حال بر لزوم کنترل‌های سخت‌گیرانه‌ی صادرات بر تراشه‌های پیشرفته تأکید می‌ورزد @AnthropicAI
  • Qwen بر اساس داده‌های OpenRouter، در سهم بازار توکن از Moonshot و xAI پیشی گرفته است، که نشان‌دهنده‌ی پذیرش رو به رشد مدل‌های هوش مصنوعی چینی است @OpenRouterAI
  • وانتا از تأمین مالی سری D با ارزش ۴.۱۵ میلیارد دلار خبر داد که نشان‌دهنده‌ی تداوم اعتماد سرمایه‌گذاران به ابزارهای امنیتی و انطباق مبتنی بر هوش مصنوعی است @christinacaci

اخلاق و جامعه

  • مؤسسه‌ی ای‌آی‌نو (AI Now Institute) برنامه‌ی اقدام هوش مصنوعی کاخ سفید را به‌دلیل «مستقیماً از شرکت‌های بزرگ فناوری» بودن مورد انتقاد قرار داد و از «برنامه‌ی اقدام هوش مصنوعی مردم» (People's AI Action Plan) که با همکاری بیش از ۱۰۰ سازمان توسعه یافته است، حمایت می‌کند @AINowInstitute
  • ایتان مولیک شفافیت در مورد مصرف آب توسط هوش مصنوعی را ارائه می‌دهد و گزارش می‌کند که طول عمر ۱۸ ماهه‌ی میسترال لارج ۲ به اندازه‌ی مصرف آب ۶۷۸ خانوار آمریکایی در سال، آب مصرف کرده است و هر جست‌وجو ۴۵ میلی‌لیتر آب مصرف می‌کند @emollick
  • مولیک نشان می‌دهد که چگونه یک داده‌ی زیست‌محیطی می‌تواند به‌صورت مثبت یا منفی مطرح شود و بیان می‌کند که هر جست‌وجوی هوش مصنوعی به اندازه‌ی ۰.۰۰۱۸۷۵ درصد از ردپای آبی یک همبرگر، آب مصرف می‌کند @emollick
  • نگرانی‌هایی در مورد مدل‌های زبانی بزرگ چندوجهی (multimodal LLMs) مطرح شده است که امکان شکل‌های جدیدی از نظارت را فراهم می‌کنند، زیرا این مدل‌ها می‌توانند ساعت‌ها از فیلم‌های ضبط‌شده را به روش‌هایی که نه قانون و نه جامعه پیش‌بینی کرده بودند، کاوش کنند و «فراموشی طبیعی» را از بین ببرند @emollick
  • فرانسوا شوله هشدار می‌دهد که فقط نمرات تأییدشده توسط بنیاد ARC Prize در مجموعه‌ی نیمه‌خصوصی باید قابل‌اعتماد باشند، و به عدم توانایی در بازتولید نمره‌ی ادعاشده‌ی ۴۱.۸ درصدی ARC-AGI-1 از آخرین نسخه‌ی منتشرشده‌ی Qwen 3 اشاره می‌کند @fchollet

کاربردها

  • پرپلکسیتی مرورگر Comet browser را با ویژگی‌های مبتنی بر هوش مصنوعی راه‌اندازی کرد، از جمله دستیار خودکار «ویزارد آپلود یوتیوب»، مدیریت حافظه‌ی بهتر از کروم و قابلیت‌های جست‌وجوی عامل‌مانند بر روی محتوای غیرنمایه‌شده @WholeMarsBlog
  • گیت‌هاب Spark را برای کاربران Copilot Pro+ منتشر کرد، ابزاری که ایده‌ها را کاملاً از طریق زبان طبیعی به «برنامه‌های فول‌استک» (full-stack applications) تبدیل می‌کند و کاربران را در عرض چند دقیقه از مفهوم به استقرار می‌رساند @satyanadella
  • گوگل فوتوز ویژگی‌های هوش مصنوعی برای «ریمیکس» کردن عکس‌ها به سبک‌های مختلف و تبدیل عکس‌ها به ویدیو را اضافه کرد، با قابلیت‌های مشابهی که در حال انتشار برای یوتیوب شورتس نیز هستند @sundarpichai
  • پژوهشگران متا فناوری دستبند کنترل‌شده با ژست را توسعه دادند که سیگنال‌های عصبی از عضلات مچ دست را به فرمان‌های کامپیوتری تبدیل می‌کند و در نشریه‌ی Nature منتشر شده است @AIatMeta
  • ان‌ویدیا «عامل‌های هوش مصنوعی بینایی» (Vision AI agents) را به نمایش می‌گذارد که کارایی را در صنایع مختلف، از تحلیل ورزشی گرفته تا واکنش به حوادث شهری و کنترل کیفیت تولید، افزایش می‌دهند @NVIDIAAI
  • ان‌ویدیا «Climate in a Bottle» را معرفی کرد؛ ابزار تعاملی مبتنی بر هوش مصنوعی که به کاربران امکان می‌دهد با تنظیم پارامترهایی مانند فصل و دمای اقیانوس، سیستم‌های اقلیمی را کاوش کنند تا حالت‌های اقلیمی با وضوح بالا را فوراً تولید کنند @NVIDIAAI

پژوهش‌ها

  • گوگل دیپ‌مایند مدل هوش مصنوعی Aeneas را منتشر کرد که به مورخان کمک می‌کند تا کتیبه‌های باستانی لاتین را با ایجاد «اثرانگشت‌های تاریخی» منحصر به فرد و شناسایی شباهت‌ها در ۱۷۶,۰۰۰ کتیبه تفسیر کنند و اعتماد مورخان را تا ۴۴ درصد بهبود بخشد @GoogleDeepMind
  • پژوهش‌ها نشان می‌دهد که Llama 3.1 70B می‌تواند نسخه‌های تقریباً دقیق از کل کتاب‌های دارای حق چاپ مانند «Harry Potter & the Sorcerer's Stone» را هنگام دریافت عبارات تحریک‌کننده‌ی خاص مانند «Mr and Mrs. D» تولید کند @AhmedSQRD
  • هگینگ‌فیس بنچمارک جدیدی را برای آزمایش توانایی مدل‌های زبانی بزرگ بینایی (vision LLMs) در پردازش ورودی‌های ویدیویی طولانی با تقسیم آن‌ها به هزاران تصویر منتشر کرد، که محدودیت‌های عملکردی در مدل‌های فعلی را آشکار می‌سازد @andimarafioti
  • پژوهشگران CMU با بوم‌شناسان حفاظت از محیط زیست همکاری می‌کنند تا از هوش مصنوعی برای مطالعه و ریشه‌کن کردن گیاهان مهاجم «Leafy Spurge» استفاده کنند و مجموعه‌داده‌ی منحصربه‌فردی از تصاویر پهپادی با وضوح بالا و تأییدشده از زمین را منتشر کرده‌اند @rsalakhu
  • پژوهشی در مورد «ترکیب برنامه‌ی عصبی هدایت‌شده با اجرا» (execution-guided neural program synthesis) برای ARC-AGI، قابلیت‌های تعمیم ترکیبی (compositional generalization) برتری را در مقایسه با جایگزین‌هایی مانند «تنظیم دقیق در زمان تست» (test-time fine-tuning) نشان می‌دهد @SimonOuellette6
  • ام‌آی‌تی فناوری «پوست الکترونیکی» (electronic skin) انعطاف‌پذیری را توسعه داد که می‌تواند بینایی شبانه‌ی فوق‌نازک و پوشیدنی به سبکی عینک آفتابی را امکان‌پذیر سازد @MIT

اخبار هوش مصنوعی در 2025-07-22

مدل‌های جدید هوش مصنوعی

  • گوگل نسخه‌ی پایداری از Gemini 2.5 Flash-Lite، سریع‌ترین و به‌صرفه‌ترین مدل خود را با سرعت 400 توکن در ثانیه، با قیمت 0.10 دلار ورودی و 0.40 دلار خروجی به ازای هر میلیون توکن، همراه با قابلیت‌های استدلال بومی و پنجره‌ی زمینه‌ی 1 میلیون توکن، منتشر کرد @OfficialLoganK
  • Gemini Deep Think گوگل دیپ‌مایند در المپیاد جهانی ریاضی (IMO) به عملکردی در سطح مدال طلا دست یافت و 5 از 6 مسئله را به‌طور بی‌نقص حل کرد (35 از 42 امتیاز)، با استفاده از ورودی و خروجی زبان طبیعی، و با برنامه‌هایی برای در دسترس قرار دادن آن برای کاربران در آینده‌ی نزدیک @JeffDean
  • گوگل قابلیت بخش‌بندی تصویر مکالمه‌ای را برای Gemini معرفی کرد که موارد استفاده‌ی جدیدی را برای درک تصویر پیشرفته (State-of-the-art) امکان‌پذیر می‌سازد @OfficialLoganK
  • متا FAIR، مجموعه‌داده‌ی تعامل بدون‌درنگ (Seamless Interaction Dataset) را با بیش از 4,000 شرکت‌کننده، 4,000+ ساعت فیلم و بیش از 65 هزار تعامل، برای پیشبرد توانایی هوش مصنوعی در تولید مکالمات طبیعی و حرکات انسان‌مانند، منتشر کرد @AIatMeta
  • Moonshot AI گزارش فنی مفصلی در مورد آموزش مدل Kimi K2، با هزینه‌ی تخمینی 20 تا 30 میلیون دلار، منتشر کرد که قابلیت‌های هوش مصنوعی چین را به نمایش می‌گذارد و شفافیت نادری را از آزمایشگاه‌های پیشرو ارائه می‌دهد @deedydas

تحلیل صنعت

  • انتروپیک تخمین می‌زند که بخش هوش مصنوعی آمریکا برای حفظ رهبری در هوش مصنوعی، تا سال 2028 به حداقل 50 گیگاوات برق نیاز خواهد داشت که این امر نیازمند سرمایه‌گذاری‌های قابل توجهی در زیرساخت‌های انرژی و محاسبات است @AnthropicAI
  • OpenAI ظرفیت 4.5 گیگاواتی اضافی مرکز داده‌ی Stargate را با همکاری اوراکل (Oracle) اعلام کرد که فراتر از تعهد 500 میلیارد دلاری اعلام‌شده در ماه ژانویه است @sama
  • ایلد گیل مشاهده می‌کند که بازارهای هوش مصنوعی در حال شکل‌گیری واضحی هستند، با ظهور رقبای نهایی مشخص در حوزه‌های مدل‌های زبان بزرگ (LLM)، کد، حقوقی، رونویسی پزشکی، خدمات مشتری و جستجو، و در حال گذار از قیمت‌گذاری SaaS مبتنی بر صندلی به مدل‌های «واحد کار» هستند @eladgil
  • مرورگر Comet شرکت Perplexity از زمان عرضه، شاهد دو برابر شدن لیست انتظار خود بوده است، با کاربران اولیه‌ای که پس از تجربه‌ی مرور یکپارچه با هوش مصنوعی، گزارش می‌دهند که «نمی‌توانند به کروم بازگردند» @AravSrinivas
  • 60 درصد از شرکت‌های آمریکایی در فهرست برترین نوآوران هوش مصنوعی فورچون (Fortune) بنیانگذاران مهاجر دارند که اهمیت مهاجرت نیروی کار ماهر را برای حفظ رهبری ایالات متحده در هوش مصنوعی برجسته می‌کند @JohnArnoldFndtn

اخلاق و جامعه

  • پژوهش انتروپیک پدیده‌ی «یادگیری ناخودآگاه» (subliminal learning) را آشکار می‌کند که در آن مدل‌های زبان می‌توانند ویژگی‌ها را از طریق داده‌های به ظاهر بی‌معنا به مدل‌های دیگر منتقل کنند، که پیامدهایی برای آموزش بر روی محتوای تولید‌شده توسط مدل دارد @AnthropicAI
  • استنفورد HAI یک گزارش سیاستی در مورد سوءاستفاده‌ی دانش‌آموزان از برنامه‌های «نودیفای» (nudify) مبتنی بر هوش مصنوعی برای ایجاد محتوای کودک‌آزاری جنسی منتشر کرد که شکاف‌ها در واکنش و سیاست‌های مدارس را برجسته می‌کند @StanfordHAI
  • پژوهش CITP پرینستون نشان می‌دهد که چگونه مهاجمان می‌توانند مدل‌های متن‌باز را تطبیق داده و تغییر دهند تا حفاظت‌ها را برای اهداف امنیت سایبری تهاجمی دور بزنند @PrincetonCITP
  • تیم امور جهانی OpenAI خواستار انتشار داده‌های مورد استفاده برای آزمایش پاسخ‌ها در مورد موضوعات حساس در چین و ارزش‌های بیان‌شده توسط DeepSeek برای شفافیت شد @natolambert

کاربردها

  • ایتان مالیک ایجنت‌های ChatGPT را به‌عنوان «کارآموزانی» مفید می‌یابد که به نظارت نیاز دارند اما در کل باعث صرفه‌جویی در زمان می‌شوند و به‌ویژه برای وظایف گردآوری و تحلیل داده‌ها مؤثر هستند @emollick
  • آرویند نارایانان نتایج متفاوتی را با ChatGPT Agent گزارش می‌دهد و دریافت که Deep Research اکثر موارد استفاده را بهتر مدیریت می‌کند، و Agent تنها برای کارهایی که ساعت‌ها طول می‌کشند یا نیاز به تکرار روزانه دارند، ارزش دارد @random_walker
  • OpenAI با Penda Health مستقر در کنیا در زمینه‌ی یک دستیار بالینی (clinical copilot) همکاری می‌کند که نتایج امیدوارکننده‌ای را در بیش از 40,000 مراجعه‌ی بیمار نشان می‌دهد @thekaransinghal
  • Slingshot AI، اپلیکیشن درمانی هوش مصنوعی Ash را راه‌اندازی کرد که از داده‌های بالینی جمع‌آوری‌شده از درمانگران واقعی استفاده می‌کند و به تقاضای فزاینده برای حمایت از سلامت روان پاسخ می‌دهد @deedydas
  • کگل (Kaggle) پلتفرم Benchmarks را برای ارزیابی مدل‌های هوش مصنوعی در سطح رقابت، با بیش از 70 جدول امتیازات، از جمله بنچمارک MultiLoKo متا، راه‌اندازی کرد @kaggle

پژوهش‌ها

  • پژوهش MIT CSAIL چهار حالت اصلی شکست را در سیستم‌های کدنویسی هوش مصنوعی شناسایی می‌کند: مشکلات توزیع داده، مسائل مقیاس‌پذیری، دشواری‌های تعامل و چالش‌های اندازه‌گیری، و خواستار تلاش‌های جامعه‌محور برای پیشبرد این حوزه است @MIT_CSAIL
  • Mistral AI یک گزارش جامع ارزیابی تأثیرات زیست‌محیطی منتشر کرد که نشان می‌دهد چرخه‌ی عمر 18 ماهه‌ی مدل Mistral Large 2 آن‌ها، معادل مصرف سالانه‌ی آب 678 خانوار آمریکایی را مصرف کرده است، در حالی که هر پرس‌وجو تنها 1/100 قاشق چای‌خوری آب مصرف می‌کند @emollick
  • گزارش فنی Kimi K2، تکنیک‌های پیشرفته‌ی آموزش را آشکار می‌کند، از جمله RLVR (یادگیری تقویتی با پاداش‌های قابل تأیید)، قوانین مقیاس‌گذاری نوین برای مدل‌های MoE، و بهینه‌ساز Muon که در کارایی توکن از AdamW بهتر عمل می‌کند @deedydas
  • یوجین یان با موفقیت پژوهشی را تکرار کرد که نشان می‌دهد ترانسفورمرها می‌توانند توالی‌هایی از توکن‌های نمایش‌دهنده‌ی شناسه‌ی اقلام را برای توصیه‌ها پیش‌بینی کنند، و توانایی مدل را در مدیریت ترتیب پیچیده‌ی توکن‌ها به نمایش می‌گذارد @eugeneyan