اخبار هوش مصنوعی در 2025-10-16

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-4B-SafeRL را منتشر می‌کند؛ مدلی هم‌راستا با ایمنی که از طریق یادگیری تقویتی (reinforcement learning) تنظیم شده و بهبود ایمنی قابل‌توجهی را در WildJailbreak (از 64.7 به 98.1) بدون به خطر انداختن عملکرد در وظایف عمومی به دست می‌آورد. @Alibaba_Qwen
  • علی‌بابا Qwen3-VL-Flash را در «علی‌بابا کلاود مدل استودیو» (Alibaba Cloud Model Studio) عرضه می‌کند؛ یک مدل بینایی-زبان (vision-language model) که حالت‌های استدلالی و غیر استدلالی را با پشتیبانی از زمینه‌ی فوق‌العاده طولانی (تا 256 هزار توکن) و درک بهبودیافته‌ی تصویر/ویدئو ترکیب می‌کند. @Alibaba_Qwen
  • اوپن‌ای‌آی (OpenAI) Sora 2 را به‌روزرسانی می‌کند؛ استوری‌بردهای آن اکنون در وب برای کاربران پرو (Pro) در دسترس هستند و قابلیت تولید ویدئو تا 15 ثانیه برای همه‌ی کاربران و 25 ثانیه برای کاربران پرو در وب افزایش یافته است. @OpenAI
  • گوگل Veo 3.1 را با رندرینگ (rendering) بافت و جزئیات سطح به طور قابل‌توجهی بهبودیافته منتشر می‌کند که مو، پارچه‌ها و سطوح را زنده‌تر و واقعی‌تر نشان می‌دهد. @GeminiApp
  • هوش مصنوعی گوگل DeepSomatic را برای تشخیص سرطان و مدل Gemma C2S-Scale 27B را که یک فرضیه‌ی جدید برای تبدیل تومورهای «سرد» به تومورهای «گرم» برای درمان با ایمونوتراپی (immunotherapy) ارائه کرده است، معرفی می‌کند. @GoogleAI

تحلیل صنعت

  • طبق گزارش‌ها، اوپن‌ای‌آی (OpenAI) به شرکت‌ها قابلیتی به نام «ورود با ChatGPT» را پیشنهاد کرده است که در آن استارتاپ‌ها می‌توانند هزینه‌های API را با کسر از محدودیت‌های ظرفیت ChatGPT مشتریان خود به جای پرداخت مستقیم به اوپن‌ای‌آی (OpenAI)، به مشتریان منتقل کنند. @btibor91
  • آنتروپیک (Anthropic) ادغام Claude با مایکروسافت 365 و قابلیت‌های جستجوی سازمانی را معرفی می‌کند که به کاربران امکان می‌دهد تا در شیرپوینت (SharePoint)، وان‌درایو (OneDrive)، اوت‌لوک (Outlook) و تیمز (Teams) برای دریافت پاسخ‌های سفارشی جستجو کنند. @AnthropicAI
  • مایکروسافت در گزارش دفاع دیجیتال 2025 خود، از افزایش سریع استفاده از هوش مصنوعی توسط دولت-ملت‌ها در سال گذشته خبر می‌دهد و نقش رو به رشد هوش مصنوعی را در تهدیدات امنیت سایبری برجسته می‌کند. @AndrewCurran_
  • استخدام در شرکت‌های بزرگ فناوری (BigTech) از دانشگاه‌های برتر ایالات متحده در 20 سال گذشته 3 تا 4 برابر رشد کرده و از کمتر از 10 درصد به بیش از 20 درصد رسیده است که این شرکت‌ها را به انتخاب شغلی شماره 1 برای اکثر فارغ‌التحصیلان دانشگاه‌های نخبه تبدیل کرده است. @deedydas
  • شرکت دیل (Deel) با ارزش‌گذاری 17.3 میلیارد دلاری، 300 میلیون دلار سرمایه جذب می‌کند و گزارش می‌دهد که سه سال است سوددهی داشته و درآمد تکرارشونده‌ی سالانه (ARR) آن از 1 میلیارد دلار فراتر رفته است. @TechCrunch

اخلاق و جامعه

  • طبق گزارش‌ها، مهندسان ارشد در کانال‌های خصوصی Slack ادعاهای مربوط به استفاده از هوش مصنوعی در مقیاس بزرگ را دروغ می‌دانند و به جای کنجکاوی در مورد قابلیت‌های هوش مصنوعی در محیط‌های سازمانی، انکار نشان می‌دهند. @clairevo
  • پینترست (Pinterest) کنترل‌های جدیدی را معرفی می‌کند که به کاربران امکان می‌دهد محتوای تولید‌شده توسط هوش مصنوعی را در فیدهای خود محدود کنند و برچسب‌های محتوای هوش مصنوعی را برای رسیدگی به نگرانی‌های کاربران در مورد محتوای مصنوعی، قابل‌مشاهده‌تر می‌کند. @TechCrunch
  • EFF (بنیاد مرزهای الکترونیکی) شکایتی را تنظیم کرده که در آن ادعا می‌شود دولت ترامپ در حال نظارت و مجازات غیرشهروندانی است که دیدگاه‌های شبکه‌های اجتماعی مورد پسند دولت را بیان می‌کنند، و این امر نگرانی‌هایی را در مورد نظارت مبتنی بر هوش مصنوعی ایجاد می‌کند. @TechCrunch

کاربردها

  • گوگل دیپ‌مایند (Google DeepMind) با «کامان‌ولت فیوژن سیستمز» (Commonwealth Fusion Systems) همکاری می‌کند تا از یادگیری تقویتی برای کشف استراتژی‌های کنترل بلادرنگ جدید استفاده کرده و توسعه‌ی انرژی هم‌جوشی را تسریع بخشد. @AndrewCurran_
  • اوپن‌ای‌آی (OpenAI) ابتکار «اوپن‌ای‌آی برای علم» (OpenAI for Science) را با استخدام یک فیزیکدان به عنوان اولین عضو، برای پیشبرد کشفیات علمی با استفاده از هوش مصنوعی راه‌اندازی می‌کند. @AndrewCurran_
  • ویمو (Waymo) با دوردش (DoorDash) همکاری می‌کند تا خدمات روبوتاکسی خود را به حوزه‌ی تحویل گسترش دهد که نشان‌دهنده‌ی بازگشت احتمالی به کاربردهای تحویل برای وسایل نقلیه‌ی خودران است. @TechCrunch
  • کایاک (Kayak) «حالت هوش مصنوعی» (AI Mode) را معرفی می‌کند که به مسافران امکان می‌دهد تا از طریق یک چت‌بات (chatbot) داخلی، سفرها را مستقیماً در پلتفرم اصلی خود تحقیق، برنامه‌ریزی و رزرو کنند. @TechCrunch
  • مایکروسافت اولین تجربه‌ی محیطی (ambient experience) تجاری موجود را معرفی می‌کند که برای گردش کار پرستاری ساخته شده تا به پرستاران کمک کند بر مراقبت از بیمار تمرکز کنند. @satyanadella
  • پرپلکسیتی هوش مصنوعی (Perplexity AI) ویژگی‌های یادگیری زبان را با کلمات تمرینی، اصطلاحات اولیه و فلش‌کارت‌ها برای عبارات پیشرفته در iOS و وب راه‌اندازی می‌کند. @perplexity_ai

پژوهش‌ها

  • اندرو اِنگ (Andrew Ng) تأکید می‌کند که بزرگترین پیش‌بینی‌کننده‌ی پیشرفت توسعه‌ی عامل‌های هوش مصنوعی، توانایی تیم در اجرای فرآیندهای منظم برای ارزیابی‌ها و تحلیل خطا است، نه استفاده از جدیدترین تکنیک‌های پرطرفدار. @AndrewYNg
  • آندری کارپاتی (Andrej Karpathy) آموزش مدل nanochat d32 را با هزینه‌ی 1000 دلار به پایان می‌رساند و به امتیاز CORE 0.31 (بالاتر از حدود 0.26 GPT-2) و بهبود GSM8K از حدود 8% به حدود 20% دست می‌یابد که قابلیت‌های مدل‌های میکرو (micro-model) را به نمایش می‌گذارد. @karpathy
  • مقاله‌ی پژوهشی «هنر مقیاس‌بندی محاسبات یادگیری تقویتی برای مدل‌های زبان بزرگ» (The Art of Scaling Reinforcement Learning Compute for LLMs) اولین تحلیل جامع از مقیاس‌بندی یادگیری تقویتی (RL) با مدل‌های زبان بزرگ را ارائه می‌دهد. @natolambert
  • MIT CSAIL رویکرد «جریان‌های گلس» (GLASS Flows) را معرفی می‌کند که هم‌ترازی متن-تصویر را برای مدل‌های مقیاس بزرگ در زمان استنتاج، با استفاده از معادلات دیفرانسیل معمولی (ODEs) برای شبیه‌سازی تغییرات تصادفی بدون نیاز به بازآموزی، افزایش می‌دهد. @MIT_CSAIL
  • هاگینگ‌فیس (Hugging Face) نسخه‌ی 2 «هاگینگ‌چت» (HuggingChat) را با 115 مدل متن‌باز (open source) در یک رابط کاربری واحد دوباره راه‌اندازی می‌کند و «هاگینگ‌چت اُمنی» (HuggingChat Omni) را برای انتخاب خودکار مدل در بین ارائه‌دهندگان مختلف معرفی می‌کند. @reach_vb
  • مدل بازگشت کوچک (Tiny Recursion Model) یا TRM، به 40% در ARC-AGI-1 با هزینه‌ی 1.76 دلار به ازای هر وظیفه و 6.2% در ARC-AGI-2 با هزینه‌ی 2.10 دلار به ازای هر وظیفه دست می‌یابد و پژوهش متن‌باز را به جامعه‌ی علمی ارائه می‌دهد. @arcprize
  • ورلد لبز (World Labs) مدل RTFM را منتشر می‌کند؛ یک مدل جهانی (World Model) مولد بلادرنگ، پایدار و سه‌بعدی ثابت که بر روی یک کارت گرافیک H100 اجرا می‌شود. @drfeifei

اخبار هوش مصنوعی در 2025-10-15

مدل‌های جدید هوش مصنوعی

  • آنتروپیک (Anthropic) مدل «کلاد هایکو ۴.۵» (Claude Haiku 4.5) را منتشر کرد که عملکردی برابر با «سونت ۴» (Sonnet 4) در کدنویسی دارد؛ اما با یک‌سوم هزینه و بیش از دو برابر سرعت @claudeai
  • گوگل (Google) مدل تولید ویدیوی «وئو ۳.۱» (Veo 3.1) را با واقع‌گرایی افزایش‌یافته، صدای غنی‌تر، قابلیت‌های بسط صحنه، کنترل روایی بهتر و ویژگی‌های ویرایشی دقیق‌تر عرضه کرد @GoogleDeepMind
  • علی‌بابا (Alibaba) اعلام کرد که مدل‌های «کوئن ۳-وی‌ال» (Qwen3-VL) اکنون در پلتفرم‌های مختلفی از جمله LM Studio، Ollama cloud، Imarena.ai، MLX-VLM و Kaggle در دسترس هستند @Alibaba_Qwen
  • علی‌بابا (Alibaba) ویژگی «حافظه‌ی گفت‌وگوی کوئن» (Qwen Chat Memory) را معرفی کرد که خاطرات معناداری را درباره‌ی کاربران ذخیره می‌کند و تعاملات گذشته را به خاطر می‌آورد تا تجربه‌های شخصی‌سازی‌شده‌ی عمیقی ایجاد کند @Alibaba_Qwen
  • گوگل (Google) مدل پایه‌ی «سی‌۲اس-اسکیل ۲۷بی» (C2S-Scale 27B) را منتشر کرد که با همکاری دانشگاه ییل (Yale University) و بر اساس «جما» (Gemma) ساخته شده است. این مدل فرضیه‌ی جدیدی درباره‌ی رفتار سلولی سرطان تولید کرد که به صورت تجربی در سلول‌های زنده تأیید شد @sundarpichai
  • اوپن‌ای‌آی (OpenAI) دسترسی «چت‌جی‌پی‌تی گو» (ChatGPT Go) را به ۸۹ کشور در سراسر آفریقا، خاورمیانه، آسیای مرکزی، آسیا، کارائیب و آمریکای لاتین گسترش داد @nickaturley
  • مایکروسافت (Microsoft) اعلام کرد که «سورا ۲» (Sora 2) اکنون برای شرکت‌های Azure Foundry در دسترس است @asha_shar

تحلیل صنعت

  • درآمد سالانه‌ی تکرارشونده‌ی آنتروپیک (Anthropic) در ماه آگوست به ۵ میلیارد دلار رسید، این ماه به ۷ میلیارد دلار نزدیک می‌شود و پیش‌بینی می‌شود تا پایان سال به ۹ میلیارد دلار و برای سال آینده به ۲۰ تا ۲۶ میلیارد دلار برسد @AndrewCurran_
  • پژوهش‌ها نشان می‌دهد که ابزارهای هوش مصنوعی مولد، افزایش قابل توجهی در درآمد یک پلتفرم تجارت الکترونیک بالغ، در حوزه‌ی خدمات مشتری و کاربردهای بازاریابی ایجاد کرده‌اند @emollick
  • انویدیا (NVIDIA) «DGX Spark» را به عنوان یک ماشین توسعه‌ی نرم‌افزارمحور معرفی می‌کند که زیبا و به اندازه‌ی کافی جمع‌وجور برای استفاده‌ی رومیزی است و بر هویت انویدیا به عنوان یک شرکت نرم‌افزاری تأکید دارد @soumithchintala
  • متا (Meta) از احداث یک مرکز داده‌ی جدید ۱ گیگاواتی در ال‌پاسو، تگزاس خبر داد تا از ارائه‌ی مدل‌های هوش مصنوعی درجه‌یک و تجربه‌های محصولی پشتیبانی کند؛ زیرا آن‌ها در حال حرکت به سمت «فراهوش» (superintelligence) هستند @fb_engineering
  • آرم (Arm) با متا (Meta) همکاری می‌کند تا سیستم‌های هوش مصنوعی این شرکت شبکه‌ی اجتماعی را در بحبوحه‌ی توسعه‌ی بی‌سابقه‌ی زیرساخت‌ها بهبود بخشد @TechCrunch

اخلاق و جامعه

  • یک نظرسنجی جهانی سطوح متفاوتی از اعتماد را به توانایی کشورهای مختلف در تنظیم مؤثر هوش مصنوعی نشان می‌دهد؛ ایالات متحده در صدر فهرست افرادی قرار دارد که نسبت به افزایش استفاده از هوش مصنوعی در زندگی روزمره، بیش از هیجان‌زدگی، نگران هستند @AndrewCurran_
  • مدیرعامل اوپن‌ای‌آی (OpenAI) تغییرات آتی سیاست‌ها را روشن کرد و بر اولویت‌بندی ایمنی بر حریم خصوصی و آزادی برای نوجوانان تأکید داشت، در حالی که با کاربران بزرگسال مانند بزرگسالان رفتار می‌کند و آزادی بیشتری برای محتوای مناسب بزرگسالان فراهم می‌آورد؛ اما محدودیت‌ها را برای محتوای مضر حفظ می‌کند @sama
  • یکی از همکاران AI Now Institute تحلیل می‌کند که چگونه روایت انویدیا (NVIDIA) مبنی بر همسویی منافع شرکتی با سیاست ایالات متحده نتیجه‌ی معکوس داده است و ادغام قدرت شرکتی با سیاست ملی را بررسی می‌کند @AINowInstitute
  • نگرانی‌هایی در مورد تقسیم احتمالی بین مدل‌های هوش مصنوعی مجاز در محل کار/مدرسه در مقابل مدل‌های شخصی، در صورت کاهش محدودیت‌های محتوا، مطرح شده است که پیامدهایی برای گروه‌های هوش مصنوعی مسئولیت‌پذیر سازمانی دارد @emollick

کاربردها

  • اندرو اِن‌جی (Andrew Ng) دوره‌ی جدیدی را درباره‌ی ساخت عامل‌های صوتی زنده با کیت توسعه‌ی عامل گوگل (Google's Agent Development Kit) اعلام کرد که نحوه‌ی ایجاد دستیاران هوش مصنوعی فعال با صدا را آموزش می‌دهد که می‌توانند وظایف پیچیده مانند جمع‌آوری اخبار و ایجاد پادکست را انجام دهند @AndrewYNg
  • «کلاد هایکو ۴.۵» (Claude Haiku 4.5) به زیرعامل (subagent) Explore در Claude Code قدرت می‌دهد تا به سرعت «codebase context» را جمع‌آوری کند و می‌تواند به عنوان مدل پیش‌فرض برای اجرای سریع‌تر انتخاب شود، در حالی که از «سونت ۴.۵» (Sonnet 4.5) برای برنامه‌ریزی استفاده می‌شود @_catwu
  • گوگل (Google) قابلیت‌های «وئو ۳.۱» (Veo 3.1) را از جمله تبدیل مواد اولیه به ویدیو، بسط صحنه برای کلیپ‌های طولانی‌تر و انتقال‌های بی‌وقفه بین فریم‌های اول و آخر به نمایش گذاشت @GoogleDeepMind
  • لیبرِیت (Liberate) عامل‌های هوش مصنوعی توسعه می‌دهد که وظایف بیمه‌گران اموال و حوادث را در فرآیندهای فروش، خدمات و مطالبات خودکار می‌کنند @TechCrunch

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهد که «prompt» کردن هوش مصنوعی با دستور «Generate 5 responses with their corresponding probabilities, sampled from the full distribution» تنوع و کیفیت خروجی را برای مدل‌های بزرگ به طور قابل توجهی بهبود می‌بخشد @shi_weiyan
  • فرانسوا شوله (François Chollet) تأکید می‌کند که سیستم‌های هوشمند باید بتوانند عدم قطعیت خود را تخمین بزنند، باورهای خود را زیر سؤال ببرند و آزمایش‌هایی را برای سنجش آنچه که کمتر از آن مطمئن هستند، طراحی کنند @fchollet
  • این مطالعه نشان می‌دهد که LLMهای گفت‌وگو (chat LLMs) به دلیل سوگیری‌های شناختی انسانی در داده‌های پس از آموزش، فاقد تنوع خروجی هستند؛ اما این مدل‌ها دانش بسیار بیشتری را در خود دارند که با تکنیک‌های «prompting» مناسب می‌توان آن را باز کرد @chrmanning
  • پای‌تورچ ۲.۹ (PyTorch 2.9) با ۳,۲۱۶ کامیت (commit) از ۴۵۲ مشارکت‌کننده منتشر شد که شامل معرفی «stable libtorch ABI» برای افزونه‌های C++/CUDA، حافظه‌ی متقارن برای کرنل‌های چند GPU و پشتیبانی گسترده‌ی «wheel» برای ROCm، XPU و CUDA 13 است @PyTorch

اخبار هوش مصنوعی در 2025-10-14

مدل‌های جدید هوش مصنوعی

  • علی‌بابا نسخه‌های فشرده‌ی Qwen3-VL را در اندازه‌های 4B و 8B با هر دو مدل Instruct و Thinking منتشر کرد که مصرف VRAM کمتری دارند، در حالی که قابلیت‌های کامل را حفظ می‌کنند و از مدل‌هایی مانند Gemini 2.5 Flash Lite و GPT-5 Nano بهتر عمل می‌کنند. @Alibaba_Qwen
  • انویدیا DGX Spark را معرفی کرد، کوچک‌ترین سوپرکامپیوتر هوش مصنوعی دنیا که بر اساس معماری Grace Blackwell ساخته شده و پردازنده‌های گرافیکی (GPU)، پردازنده‌های مرکزی (CPU)، شبکه‌سازی، کتابخانه‌های CUDA و نرم‌افزار هوش مصنوعی انویدیا را برای توسعه‌ی هوش مصنوعی عامل‌محور و فیزیکی یکپارچه می‌کند. @nvidianewsroom

تحلیل صنعت

  • OpenAI خرید سخت‌افزار شتاب‌دهنده‌ی هوش مصنوعی به ارزش 10 گیگاوات را از Broadcom اعلام کرد که نشان‌دهنده‌ی سرمایه‌گذاری عظیم در زیرساخت‌ها است. @TechCrunch
  • وال‌مارت با OpenAI همکاری می‌کند تا امکان خرید مستقیم محصول از طریق ChatGPT را فراهم کند و به کاربران اجازه می‌دهد حساب‌های خود را متصل کرده، اقلام را مرور کنند و پرداخت را در داخل چت‌بات انجام دهند. @TechCrunch
  • Anthropic همکاری خود را با Salesforce گسترش می‌دهد و Claude را به یک مدل ترجیحی در Agentforce برای صنایع تحت نظارت تبدیل می‌کند و ادغام با Slack را عمیق‌تر می‌کند. @AnthropicAI
  • Perplexity در هند به اپلیکیشن شماره یک در پلی‌استور در تمام دسته‌ها تبدیل شده است و اکنون یک گزینه‌ی جستجوی پیش‌فرض برای کاربران فایرفاکس است. @AravSrinivas
  • Reducto مبلغ 75 میلیون دلار در دور دوم تامین مالی (Series B) به رهبری a16z جذب کرد؛ این شرکت بیش از 1 میلیارد صفحه را پردازش کرده و حجم ماهانه‌ی خود را در تنها پنج ماه پس از دور اول تامین مالی (Series A)، شش برابر افزایش داده است. @aditabrm
  • گوگل اولین مرکز هوش مصنوعی خود را در ویشاکاپاتنام، هند، اعلام کرد که ظرفیت محاسباتی در مقیاس گیگاوات، دروازه‌ی بین‌المللی زیردریایی و زیرساخت انرژی در مقیاس بزرگ را ترکیب می‌کند. @sundarpichai
  • یک تغییر پارادایم در هوش مصنوعی مشاهده شده است، از APIهای LLM عمومی به سمت شرکت‌هایی که مدل‌های تخصصی خود را بر پایه‌ی متن باز آموزش داده و اجرا می‌کنند، با 1 میلیون مخزن (repo) جدید در Hugging Face در 90 روز گذشته. @ClementDelangue
  • بر اساس ارزیابی‌های METR، طول وظایف هوش مصنوعی برای عامل‌های خودمختار هر چند ماه دو برابر می‌شود؛ که در حال حاضر 2 ساعت است و پتانسیل رسیدن به 2 روز در سال آینده و 2 هفته در دو سال آینده را دارد. @a16z

اخلاق و جامعه

  • موسسه‌ی AI Now از مکانیزم‌های محافظتی (guardrails) به‌راحتی فریب‌خورنده‌ی OpenAI انتقاد می‌کند و بر نیاز به آزمایش قوی قبل از استقرار مدل‌های هوش مصنوعی، پیش از آن که آسیب قابل توجهی ایجاد کنند، تاکید دارد. @AINowInstitute
  • OpenAI برنامه‌های خود را برای کاهش محدودیت‌های ChatGPT در هفته‌های آینده اعلام کرد که امکان استفاده از شخصیت انسانی‌تر و ایموجی‌ها را فراهم می‌کند؛ محتوای بزرگسالان برای کاربران تاییدشده نیز در ماه دسامبر، به عنوان بخشی از اصل «با کاربران بزرگسال، مانند بزرگسالان رفتار کنید»، ارائه خواهد شد. @sama
  • Anthropic اولین پیشنهادات سیاستی اقتصاددانان و پژوهشگران را به اشتراک می‌گذارد که اثرات اقتصادی بالقوه‌ی هوش مصنوعی قدرتمند و پاسخ‌های سیاستی را بررسی می‌کنند. @AnthropicAI
  • OpenAI یک «شورای متخصص رفاه و هوش مصنوعی» با هشت عضو شامل کارشناسان سلامت روان و فناوری تاسیس کرد تا توسعه‌ی مسئولانه‌ی هوش مصنوعی را راهنمایی کند. @OpenAI

کاربردها

  • مایکروسافت قابلیت «تکمیل فرمول» را در اکسل معرفی کرد که در آن Copilot به‌طور فعال فرمول‌هایی را بر اساس محتوای صفحه، هنگامی که کاربران «=» را تایپ می‌کنند، پیشنهاد می‌دهد. @satyanadella
  • مایکروسافت Copilot Vision را از طریق تجربه‌ی Moto AI در دستگاه‌های Moto ادغام می‌کند و به کاربران این امکان را می‌دهد که مشکلات را نشان دهند، به جای آنکه فقط آن‌ها را توصیف کنند. @Copilot
  • گوگل قابلیت‌های طراحی تراشه‌ی هوش مصنوعی را از طریق AlphaChip به نمایش می‌گذارد و آینده‌ای را متصور می‌شود که در آن روش‌های هوش مصنوعی کل فرآیند طراحی تراشه را خودکار کرده و چرخه‌های طراحی را به شدت سرعت می‌بخشند. @AndrewCurran_
  • اپلیکیشن Gemini یک گردش کار خلاقانه را به نمایش می‌گذارد که Nano Banana را برای تصاویر سفارشی حیوانات خانگی، Storybook را برای ایجاد روایت و Veo 3 را برای انیمیشن ویدیویی ترکیب می‌کند. @GeminiApp
  • اپلیکیشن Claude عملکردی برتر را به عنوان یک دستیار شخصی نشان می‌دهد، به‌ویژه با ادغام Gmail و Google Calendar در مقایسه با سایر مدل‌های هوش مصنوعی. @emollick
  • یک توسعه‌دهنده گزارش می‌دهد که 55 درخواست پول (PR) از Devin و 896 گفتگوی Cursor را ادغام کرده که منجر به 16 PR ادغام‌شده بدون هیچ گونه توقف شده است و قابلیت‌های کدنویسی هوش مصنوعی آماده‌ی تولید را به نمایش می‌گذارد. @clairevo
  • Coco Robotics در جهت خودکارسازی ناوگان ربات‌های تحویل‌دهنده کار می‌کند و از میلیون‌ها مایل داده‌ی جمع‌آوری‌شده برای ناوبری خودمختار استفاده می‌کند. @TechCrunch

پژوهش‌ها

  • Karpathy نانوچت را منتشر کرد که آموزش LLM را تنها در چند خط کد ممکن می‌سازد و نشان‌دهنده‌ی رویکردی ساده‌شده به توسعه‌ی مدل است. @simonw
  • پژوهشگران استنفورد SuperDec را توسعه دادند، یک بازنمایی صحنه‌ی سه‌بعدی بسیار فشرده که میلیون‌ها Gaussian را با تنها صدها شیء اولیه جایگزین می‌کند و برای استدلال انتزاعی و برنامه‌ریزی در محیط سه‌بعدی ایده‌آل است. @FrancisEngelman
  • فیزیکدانان MIT دقت ساعت اتمی را با کاهش نویز کوانتومی که «تیک‌تیک» اتمی را مبهم می‌کند، بهبود بخشیدند؛ این پیشرفت کاربردهایی برای تراکنش‌های آنلاین و GPS دارد. @MIT
  • مایکروسافت ریسرچ پروتکل «رد تیمینگ» را برای آزمایش و ایمن‌سازی ابزارهای غربالگری امنیت زیستی DNA توسعه داد که به ایمنی هوش مصنوعی در کاربردهای بیولوژیکی می‌پردازد. @MSFTResearch
  • پژوهشگران Stanford HAI پروژه‌هایی را ارائه می‌دهند که شامل مدل جهانی مغز انسان برای پزشکی شخصی‌سازی‌شده، تحلیل هوش مصنوعی از تصاویر دوربین‌های بدن پلیس برای شفافیت، و دوقلوهای سلولی دیجیتال برای شبیه‌سازی پاسخ داروها است. @StanfordHAI

اخبار هوش مصنوعی در 2025-10-13

مدل‌های جدید هوش مصنوعی

  • Qwen3-VL-235B-A22B-Instruct شرکت علی‌بابا با ۴۸ درصد سهم بازار، به جایگاه اول در OpenRouter برای پردازش تصویر دست یافت @Alibaba_Qwen
  • مایکروسافت مدل MAI-Image-1 را منتشر کرد که در LMArena رتبه‌ی نهم را کسب کرده و تعادلی بین سرعت تولید و کیفیت ایجاد می‌کند @mustafasuleyman
  • گوگل از Gemini 2.5 Native Audio Thinking به‌عنوان مدل جدید و پیشرو Speech to Speech (گفتار به گفتار) رونمایی کرد که در معیار Big Bench Audio به امتیاز ۹۲ درصد دست یافت و مرزهای جدیدی را برای استدلال گفتاری بومی تعیین کرد @sundarpichai
  • گوگل نسخه‌ی ارتقایافته‌ی قابلیت «مرور کلی ویدئویی» را برای NotebookLM با تصاویر بصری جدیدی که توسط مدل تولیدکننده‌ی تصویر Nano Banana ارائه می‌شود، عرضه کرد و فرمت «خلاصه» را برای جمع‌بندی‌های سریع معرفی کرد @demishassabis

تحلیل صنعت

  • OpenAI همکاری با Broadcom را برای تولید ۱۰ گیگاوات شتاب‌دهنده‌ی سفارشی که توسط OpenAI طراحی شده‌اند، اعلام کرد. Broadcom پس از ۱۸ ماه کار مشترک، آن‌ها را توسعه خواهد داد @AndrewCurran_
  • جی‌پی‌مورگان سرمایه‌گذاری ۱۰ میلیارد دلاری در سهام مستقیم و سرمایه‌گذاری خطرپذیر را در شرکت‌های آمریکایی که برای امنیت ملی حیاتی تلقی می‌شوند، اعلام کرد و نگرانی‌های خود را در مورد اتکا به منابع غیرقابل اعتماد مواد معدنی حیاتی و تولید مطرح کرد @AndrewCurran_
  • گوگل سرمایه‌گذاری بیش از ۹ میلیارد دلاری در کارولینای جنوبی تا سال ۲۰۲۷ را به‌عنوان بخشی از سرمایه‌گذاری مستمر در نوآوری هوش مصنوعی آمریکا اعلام کرد @sundarpichai
  • نسخه‌ی جدید Imagine 0.9 از Grok یک ارتقای چشمگیر است و سرعت توسعه‌ی بالای xAI نشان می‌دهد که جنگ برنامه‌های ویدئویی هوش مصنوعی زودتر از حد انتظار فرا می‌رسد @AndrewCurran_
  • مدل‌های در سطح Sora احتمالاً از طریق انحصاری‌سازی و سانسور کمتر رقابت خواهند کرد، به‌طوری که شرکت‌هایی مانند دیزنی ممکن است حقوق حضور افتخاری شخصیت‌ها را در ویدئوهای تولیدشده توسط کاربران اعطا کنند @AndrewCurran_
  • توسعه‌دهندگانی که نرم‌افزار تولیدی ساخته‌اند و هیچ وابستگی به آزمایشگاه‌های هوش مصنوعی ندارند، به‌طور فزاینده‌ای گزارش می‌دهند که ابزارهای هوش مصنوعی کمک زیادی به کارشان می‌کنند، که نشان‌دهنده‌ی تغییر قابل توجهی در نظرات کارشناسان است @GergelyOrosz

اخلاق و جامعه

  • دلویت در استرالیا به دلیل ارائه‌ی کاری مملو از استنادات نادرست هوش مصنوعی، مورد بازخواست قرار گرفت که بر نیاز به پاسخگویی در محتوای تولیدشده توسط هوش مصنوعی تأکید می‌کند @TechCrunch
  • لایحه‌ی SB 243 کالیفرنیا برای حفاظت از کودکان و کاربران آسیب‌پذیر در برابر آسیب‌های مرتبط با چت‌بات‌های همراه هوش مصنوعی طراحی شده است @TechCrunch
  • انتظار می‌رود یک رقابت تسلیحاتی در زمینه‌ی سانسور میان مدل‌های ویدئویی هوش مصنوعی شکل بگیرد، به‌طوری که مدل‌های در سطح Sora بدون محدودیت، نشان‌دهنده‌ی یک گام مهم به سوی تکینگی رسانه‌ای هستند @AndrewCurran_
  • «نظریه‌ی ذهن» برای هوش مصنوعی به نظر می‌رسد مهارتی مستقل از تخصص حرفه‌ای باشد و شکاف‌های درکی بین کارشناسانی که از هوش مصنوعی بهره می‌برند و آن‌هایی که بهره نمی‌برند، ایجاد می‌کند @emollick

کاربردها

  • مایکروسافت همکاری‌های M365 Copilot با شرکا را به نمایش گذاشت؛ از جمله ServiceNow برای فرآیندهای خودکار بین‌بخشی، Snowflake برای پرس‌وجوهای داده با زبان طبیعی و LexisNexis برای تهیه‌ی پیش‌نویس اسناد حقوقی @satyanadella
  • مایکروسافت حالت «مطالعه و یادگیری» کوپایلوت را راه‌اندازی کرد که با ترجیحات یادگیری تطبیق می‌یابد، کمک هدایت‌شده‌ای را بدون لو دادن پاسخ‌ها ارائه می‌دهد و از محتوای آپلودشده آزمون تولید می‌کند @Copilot
  • Salesforce پلتفرم ارتقایافته‌ی Agentforce را معرفی کرد که برای کمک به سازمان‌ها در ساخت و استقرار عامل‌های هوش مصنوعی طراحی شده است @TechCrunch
  • دانشجوی دکترای MIT الگوریتم‌های بینایی کامپیوتری از جمله «CODA» را توسعه داد تا به نظارت بر اکوسیستم‌های آسیب‌پذیر و حمایت از تلاش‌های حفاظت از حیات وحش کمک کند @MIT_CSAIL
  • Anduril Industries از سیستم محاسباتی کلاه ایمنی‌دار «EagleEye» رونمایی کرد که برای تبدیل سربازان به جنگجویان تقویت‌شده با هوش مصنوعی طراحی شده است @TechCrunch
  • محققان استنفورد در حال تولید MRIهای مصنوعی هستند که می‌توانند آینده‌ی عصبی را بر اساس عادات فعلی شبیه‌سازی کنند و پیش‌بینی‌های پیری مغز را به‌طور فزاینده‌ای محتمل می‌سازند @StanfordHAI

پژوهش‌ها

  • آندری کارپاتی، nanochat را منتشر کرد؛ یک کدبیس (codebase) مینیمال ۸۰۰۰ خطی برای آموزش مدل‌های مشابه ChatGPT از پایه که نشان می‌دهد یک LLM کاربردی را می‌توان با هزینه‌ی ناچیز ۱۰۰ دلار و در ۴ ساعت بر روی GPUهای ابری آموزش داد @karpathy
  • پروفسور علوم کامپیوتر کلمبیا، ویشال میسرا، استدلال می‌کند که LLMها نمی‌توانند علوم جدیدی را کشف کنند، زیرا آن‌ها جهان را به منیفولدهای بیزی (Bayesian manifolds) فشرده می‌کنند و هنگام استدلال خارج از داده‌های آموزشی، دچار توهم می‌شوند؛ در حالی که AGI واقعی به توانایی ایجاد منیفولدهای کاملاً جدید نیاز دارد @a16z
  • جک کلارک از Anthropic معتقد است که سیستم‌های هوش مصنوعی کنونی با استفاده از معماری موجود و بدون کاهش بازده، به پیشرفت ادامه خواهند داد و تغییرات تحول‌آفرین را نزدیک‌تر خواهند کرد @AndrewCurran_
  • پژوهش‌ها نشان می‌دهد که مصرف آب هوش مصنوعی برای تمامی مراکز داده در ایالات متحده، از ۵۰ میلیون گالن در روز صرفاً برای خنک‌سازی تا ۶۲۸ میلیون گالن (شامل تبخیر سدها) متغیر است که به‌طور قابل توجهی کمتر از مصرف آب زمین‌های گلف است @emollick
  • استخراج‌کننده‌ی جدید PII ژاپنی LFM2 با تنها ۳۵۰ میلیون پارامتر، عملکردی هم‌تراز با GPT-5 از نظر کیفیت ارائه می‌دهد، در حالی که فوق‌العاده سریع است @huggingface

اخبار هوش مصنوعی در 2025-10-12

مدل‌های جدید هوش مصنوعی

  • GPT-5 Pro قابلیت‌های جست‌وجوی فراانسانی در متون را با حل مسئله‌ی اردوش شماره‌ی ۳۳۹ نشان می‌دهد، که به عنوان حل‌نشده فهرست شده بود اما در واقع ۲۰ سال پیش حل شده بود @SebastienBubeck
  • xAI اپلیکیشن گروک را با «TRON mode» جدید که شخصیت «اَنی» را به نمایش می‌گذارد، به‌روزرسانی می‌کند @xai

تحلیل صنعت

  • NVIDIA در دو سال گذشته در بیش از ۸۰ استارتاپ هوش مصنوعی سرمایه‌گذاری کرده است و از ثروت فزاینده‌ی خود که از رونق هوش مصنوعی به دست آورده، بهره می‌برد @TechCrunch
  • هر ابزار آن‌کال و پیجینگ اکنون خود را به عنوان «پلتفرم هوش مصنوعی» یا «پلتفرم عملیاتی مبتنی بر هوش مصنوعی» معرفی می‌کند که نشان‌دهنده‌ی پذیرش گسترده‌ی بازاریابی هوش مصنوعی در ابزارهای سازمانی است @GergelyOrosz
  • جِمنای با نرخ رشد ماهانه‌ی بیش از ۳ برابرِ Perplexity (که در جایگاه دوم قرار دارد)، پیشتاز ابزارهای GenAI است؛ در حالی که Grok رشد منفی از خود نشان می‌دهد و DeepSeek اولین رشد مثبت خود را از ماه فوریه تجربه می‌کند @Similarweb
  • پذیرش هوش مصنوعی در سازمان‌ها با عوامل محدودکننده‌ی قابل توجهی روبه‌رو است، از جمله توانایی انسانی و سازمانی برای جذب تغییرات، مقررات و بودجه‌های سازمانی، فراتر از صرفاً زیرساخت‌ها و پیشرفت‌های الگوریتمی @sriramk

کاربردها

  • موارد استفاده‌ی نوظهور «AI عمیق» که در آن متخصصان وظایف پیچیده و باارزش را در حوزه‌ی تخصصی خود خودکار کرده‌اند، اگرچه گسترش موارد استفاده‌ی خاص، کندتر از پذیرش عمومی هوش مصنوعی خواهد بود @emollick
  • می‌توان به Claude Code دستور داد تا «از زیرعامل‌ها استفاده کند» و چندین زیرعامل موازی را برای کارهای پیچیده فعال کند که هر یک دارای زمینه‌ی جدیدی هستند @simonw
  • هوش مصنوعی کنونی برای اکثر وظایفی که تا چند دقیقه طول می‌کشند، به اندازه‌ی کافی توانمند به نظر می‌رسد و شکست‌ها اغلب به دلیل context ناکافی است تا محدودیت‌های قابلیتی @gdb
  • سم آلتمن پیش‌بینی می‌کند که Codex به‌طور چشمگیری تولید نرم‌افزار را متحول خواهد کرد، به طوری که تصور این که توسعه‌ی نرم‌افزار تا پایان سال ۲۰۲۶ چگونه خواهد بود، دشوار است @sama

پژوهش‌ها

  • LLMها اکنون بر مسابقات دشوار STEM (علوم، فناوری، مهندسی و ریاضیات) تسلط دارند، از جمله المپیاد جهانی ریاضی، المپیاد جهانی نجوم و اخترفیزیک و المپیاد جهانی انفورماتیک، با وجود این که تنها یک سال پیش در ریاضیات ضعیف بودند @emollick
  • تحلیل صنعت نشان می‌دهد که OpenAI بهترین قابلیت‌های پس‌آموزش/یادگیری تقویتی را دارد که بر روی پیش‌آموزش‌های ضعیف‌تر اعمال شده‌اند، در حالی که جِمنای دارای پیش‌آموزش فوق‌العاده‌ای است که ساخت مدل‌های استدلالی را به طرز شگفت‌آوری آسان کرده است @natolambert
  • ۵ مدل برتر هوش مصنوعی متن‌باز با بیشترین تأثیر به ترتیب: DeepSeek R1 (اکوسیستم مدل‌های متن‌باز چینی را شعله‌ور کرد)، LLaMA (پژوهش RLHF پس از ChatGPT را ممکن ساخت)، Mistral 7B (علاقه‌ی جامعه را به finetuning برانگیخت)، LLaMA 3.1 (نزدیک‌ترین مدل‌های متن‌باز به لبه‌ی فناوری)، و Qwen 3 (نشان‌دهنده‌ی تسلط فعلی Qwen در تحقیق و توسعه) @natolambert

اخبار هوش مصنوعی در 2025-10-11

مدل‌های جدید هوش مصنوعی

  • علی‌بابا به‌روزرسانی‌هایی را برای Qwen3-Omni منتشر می‌کند که باگی در تشخیص صدا را رفع می‌کند؛ این باگ قبلاً آن را به تنها ۳۰ ثانیه‌ی اول صدا محدود کرده بود @Alibaba_Qwen
  • علی‌بابا به‌روزرسانی‌های بزرگی را برای Qwen Code نسخه‌ی ۰.۰.۱۲ تا ۰.۰.۱۴ اعلام می‌کند که شامل حالت «برنامه‌ریزی» (Plan Mode) برای طرح‌های پیاده‌سازی ارائه‌شده توسط هوش مصنوعی، قابلیت دید هوشمند (Vision Intelligence) با سوئیچ خودکار به Qwen3-VL-Plus (ورودی ۲۵۶K/خروجی ۳۲K)، و یکپارچه‌سازی Zed با احراز هویت OAuth است @Alibaba_Qwen

تحلیل صنعت

  • داریو آمودی، مدیر عامل Anthropic، با نخست‌وزیر هند، مودی، دیدار می‌کند تا درباره‌ی گسترش به هند گفتگو کند؛ جایی که استفاده از Claude Code از ماه ژوئن ۵ برابر افزایش یافته است و نقش حیاتی هند را در استقرار هوش مصنوعی در آموزش، مراقبت‌های بهداشتی و کشاورزی برجسته می‌کند @DarioAmodei
  • پذیرش فناوری هوش مصنوعی سریع‌تر از موج‌های فناوری قبلی، از جمله اینترنت، گوشی‌های هوشمند و رایانش ابری، در حال گسترش است و پنجره‌ی فرصت کوچک‌تری را برای متخصصان فناوری جهت ایجاد تأثیر فراهم می‌کند @GergelyOrosz
  • پژوهش‌ها نشان می‌دهد که هوش مصنوعی در حال تسریع بهره‌وری علمی است؛ به‌طوری که کاربران GenAI در سال ۲۰۲۳ افزایش ۱۵ درصدی بهره‌وری را تجربه کرده‌اند که در سال ۲۰۲۴ به ۳۶ درصد رسیده است، و همچنین کیفیت انتشارها را بهبود می‌بخشد @emollick
  • مهندسان نرم‌افزار معتبر با بیش از ۲۰ سال تجربه، در حال استفاده‌ی روزمره از ابزارهای کدنویسی هوش مصنوعی هستند که نشان می‌دهد این ابزارها برای پذیرش حرفه‌ای به کیفیت و قابلیت اطمینان کافی دست یافته‌اند @GergelyOrosz
  • قراردادهای هوش مصنوعی سازمانی در حال تسریع هستند؛ با رونمایی Zendesk از عامل‌های هوش مصنوعی که قادر به حل ۸۰ درصد از مسائل خدمات مشتری هستند، و همچنین اعلام مشارکت‌های استراتژیک بین Anthropic-IBM و Deloitte @TechCrunch
  • گزارش شده است که اندرو تولاک، پژوهشگر هوش مصنوعی، از سمت خود کناره‌گیری کرده است که نشان‌دهنده‌ی جابجایی مداوم استعدادها در صنعت هوش مصنوعی است @TechCrunch

اخلاق و جامعه

  • شرکت Deloitte در استرالیا به دلیل ارائه‌ی کاری حاوی استنادات نادرست هوش مصنوعی مورد بازخواست قرار گرفت که سؤالاتی را درباره‌ی مسئولیت‌پذیری شرکتی در تأیید محتوای تولیدشده توسط هوش مصنوعی مطرح می‌کند @TechCrunch
  • Sora متعلق به OpenAI میلیون‌ها خالق محتوای جدید را قادر می‌سازد تا محتوا تولید کنند و قابلیت‌های ساخت ویدئو را دموکراتیزه می‌کند @gdb

کاربردها

  • Sierra قابلیت‌های تماس خروجی هوش مصنوعی را برای تعامل فعال با مشتری در فروش خدمات مالی و تأیید حساب معرفی می‌کند @btaylor
  • پژوهشگران استنفورد «کارتیج‌ها» (Cartridges) را توسعه می‌دهند؛ ماژول‌های حافظه‌ی فشرده‌ای که زمینه‌ی کاربری را به‌صورت آفلاین مطالعه می‌کنند تا پاسخ‌های سریع‌تر ربات‌های هوش مصنوعی را ممکن سازند و همزمان نیازهای حافظه و هزینه را کاهش دهند @StanfordHAI
  • کاربران می‌توانند با Sora پادکست‌هایی را در هر موضوعی تولید کنند؛ با شروع درخواست‌ها (prompts) با عبارت «A four way split screen podcast» و هدایت بحث‌ها یا افزودن دیالوگ‌های سفارشی @AndrewCurran_
  • جسی وینسنت سفارشی‌سازی‌های خلاقانه‌ای را برای Claude Code با استفاده از سیستم پلاگین جدید به نمایش می‌گذارد؛ از جمله استفاده از نمودارهای Graphviz DOT به عنوان زبان درخواست‌نویسی (prompting language) @simonw
  • حالت مفسر کد Claude شامل یک پوشه‌ی /mnt/skills/public/ است که حاوی دستورالعمل‌های درخواست و ابزارهای پایتون برای دستکاری فایل‌های PDF، DOCX، PPTX و XLSX است @simonw

پژوهش‌ها

  • GPT-5 و Gemini 2.5 Pro عملکردی در حد مدال طلا در المپیاد جهانی نجوم و اخترفیزیک (IOAA) کسب می‌کنند که قابلیت‌های در سطح جهانی را در فیزیک پیشرفته نشان می‌دهد @deedydas
  • معیار معمای ARC 3 ویژگی‌های جالبی را نشان می‌دهد: برای کودکان قابل دسترس‌تر از ARC 1 و ARC 2 است، اما به طور قابل توجهی برای سیستم‌های هوش مصنوعی فعلی دشوارتر است @fchollet
  • GPT-OSS 20B اکنون می‌تواند روی گوشی‌های Snapdragon با ۱۶ گیگابایت یا بیشتر حافظه‌ی قابل دسترس GPU اجرا شود؛ با استفاده از معماری حافظه‌ی یکپارچه‌ی CPU-GPU، مشابه Apple Silicon @simonw
  • پژوهش‌ها روی قوانین مقیاس‌بندی یادگیری تقویتی الگوهای متفاوتی را در مقایسه با قوانین مقیاس‌بندی پیش‌آموزش نشان می‌دهد؛ همراه با سؤالاتی درباره‌ی گام‌های همگرایی و مقیاس‌بندی فراپارامترها برای اندازه‌های مختلف مدل @natolambert

اخبار هوش مصنوعی در 2025-10-10

مدل‌های جدید هوش مصنوعی

  • علی‌بابا کتاب‌های دستورالعمل (Cookbooks) Qwen3-VL را منتشر کرد که قابلیت‌های چندوجهی آن را، شامل عامل‌های استفاده از رایانه، 3D grounding، درک ویدئو، و عامل‌های موبایل در موارد استفاده‌ی متنوع، به نمایش می‌گذارد @Alibaba_Qwen
  • مدل جهانی Genie 3 شرکت گوگل دیپ‌مایند در فهرست بهترین اختراعات سال ۲۰۲۵ مجله‌ی TIME قرار گرفت؛ این مدل قادر است جهان‌های قابل‌بازی کامل را تنها با یک تصویر یا دستور متنی (prompt) تولید کند @demishassabis

تحلیل صنعت

  • سرمایه‌گذاری ۱۰۰ میلیارد دلاری ان‌ویدیا در OpenAI، نشان‌دهنده‌ی سرمایه‌گذاری شرکت‌ها در مشتریان خودشان برای ایجاد عملکردی مصنوعی در بازار، بدون تولید ارزش اقتصادی واقعی است @AINowInstitute
  • ساتیا نادلا، مدیرعامل مایکروسافت، از استقرار سیستم‌های عظیم هوش مصنوعی ان‌ویدیا، به‌عنوان بخشی از راه‌اندازی زیرساخت هوش مصنوعی سازمانی خبر داد @TechCrunch
  • ریشی سوناک، نخست‌وزیر سابق بریتانیا، به‌عنوان مشاور ارشد هم برای مایکروسافت و هم برای انتروپیک منصوب شد؛ این انتصاب، طبق گفته‌ی سازمان Acoba بریتانیا، نگرانی‌هایی را در مورد دسترسی ناعادلانه ایجاد می‌کند @TechCrunch
  • استفاده از هوش مصنوعی سازمانی نتایج متفاوتی را نشان می‌دهد؛ شرکت دلویت Claude را برای ۵۰۰,۰۰۰ کارمند خود ارائه کرده است، در حالی که دولت استرالیا با چالش‌های پیاده‌سازی مواجه است @TechCrunch
  • شرکت Prezent مبلغ ۳۰ میلیون دلار برای ابزارهای ارائه‌ی هوش مصنوعی جذب سرمایه کرد که خرید‌های سازمانی را هدف قرار می‌دهند و نشان‌دهنده‌ی سرمایه‌گذاری مداوم در کاربردهای تجاری مبتنی بر هوش مصنوعی است @TechCrunch
  • سیستم‌های ان‌ویدیا، بر اساس معیارهای InferenceMAX v1، ۱۰ برابر عملکرد بیشتر به ازای هر وات و ۱۵ برابر بازده سرمایه‌گذاری (ROI) بیشتر ارائه می‌دهند که رویکرد سخت‌افزاری-نرم‌افزاری کامل (full-stack) برای تولید هوش مصنوعی را تأیید می‌کند @NVIDIAAI

اخلاق و جامعه

  • پژوهش‌ها نشان می‌دهد که مدل‌های زبانی بزرگ (LLMs) هنگامی که به آن‌ها استقلال داده می‌شود، رفتارهای اعتیاد به قمار، از جمله تشدید ریسک‌پذیری، خطای قمارباز (gambler's fallacy) و تلاش برای جبران ضرر (loss-chasing) را از خود نشان می‌دهند که این امر نگرانی‌هایی را برای کاربردهای سرمایه‌گذاری هوش مصنوعی ایجاد می‌کند @emollick
  • آدام موسری، رئیس اینستاگرام، هشدار می‌دهد که هوش مصنوعی به تولیدکنندگان جدید قدرت می‌بخشد، در حالی که هم‌زمان با گسترش محتوای ساختگی (synthetic) در فضای آنلاین، جامعه را وادار می‌کند تا در مورد اصالت تجدید نظر کند @TechCrunch
  • اریک هورویتز، مدیر ارشد علمی مایکروسافت، به معمای امنیت زیستی در مورد به اشتراک گذاشتن یافته‌های حساس پژوهشی هوش مصنوعی می‌پردازد که پیشرفت را بدون امکان سوءاستفاده، تسریع می‌کنند @MSFTResearch
  • جفری هینتون سخنرانی‌های ایمنی هوش مصنوعی توسط اووین ایوانز در تورنتو را اعلام کرد و بر نیاز به افزایش بودجه برای پژوهش‌های ایمنی هوش مصنوعی تأکید کرد @geoffreyhinton

کاربردها

  • OpenAI قابلیت اتصال اسپاتیفای را با ChatGPT ادغام کرد و هوش مصنوعی را قادر می‌سازد تا لیست‌های پخش شخصی‌سازی‌شده ایجاد کند و وظایف مرتبط با موسیقی را انجام دهد @TechCrunch
  • پلاگین‌های جیمیل و تقویم گوگل Claude عملکرد بهبودیافته‌ای را با Sonnet 4.5 نشان می‌دهند و خلاصه‌هایی ارائه می‌دهند که ایمیل‌ها را با رویدادهای تقویم و جستجوی وب تطبیق می‌دهند @emollick
  • پژوهش‌ها نشان می‌دهد که هوش مصنوعی می‌تواند قصد خرید را با دقت ۹۰٪، با تقلید از مشتریان با استفاده از پروفایل‌های جمعیتی، پیش‌بینی کند و عملکرد بهتری نسبت به روش‌های سنتی یادگیری ماشین (ML) بدون نیاز به تنظیم دقیق (fine-tuning) دارد @emollick
  • سیستم NeuroChat مؤسسه‌ی MIT، مدل‌های زبانی بزرگ را با هدبندهای EEG ترکیب می‌کند تا یک سیستم آموزشی تطبیقی (adaptive) هوش مصنوعی ایجاد کند که با وضعیت‌های شناختی اندازه‌گیری‌شده‌ی کاربران تنظیم می‌شود @medialab
  • شرکت Sierra راهکارهای مهندسی را برای تأخیر در هوش مصنوعی صوتی به نمایش می‌گذارد که به چالش‌های زمان‌بندی می‌پردازد، جایی که تأخیرهای کوتاه حس انسانی دارند، در حالی که تأخیرهای طولانی حس روباتیک می‌دهند @btaylor
  • گوگل جِمینای قابلیت‌های تولید محتوای سبک انیمه را به نمایش می‌گذارد که شامل طراحی کاراکتر، هنر دستور پخت و ویژگی‌های ویرایش عکس کاوایی (kawaii) است @GeminiApp

پژوهش‌ها

  • Deep Think به عملکرد پیشرفته‌ای در معیار FrontierMath دست یافت و پیشرفت در قابلیت‌های استدلال ریاضی را نشان می‌دهد @quocleix
  • پژوهشگران هوش مصنوعی برکلی، جایزه‌ی مقاله‌ی برجسته را در کنفرانس COLM 2025 به‌خاطر پژوهشی در مورد اینکه چگونه مدل‌های بینایی-زبانی، نمایش‌های بصری خود را نادیده می‌گیرند، دریافت کردند @berkeley_ai
  • پژوهش‌ها زیرفضاهای «استخراج‌کننده» (extractor) و «تجمیع‌کننده» (aggregator) را برای یادگیری درون‌متنی (In-Context Learning - ICL) در مدل‌های زبانی بزرگ (LLMs) شناسایی می‌کند و ابزارهای جدیدی برای درک چگونگی بازنمایی و انتقال ICL ارائه می‌دهد @berkeley_ai
  • AI Scientist-v2 توانایی مقابله با پیش‌بینی‌های سال ۲۰۲۴ برای اتوماسیون پژوهش هوش مصنوعی را نشان می‌دهد و پیشرفت در کشف علمی خودکار (autonomous) را به نمایش می‌گذارد @JeffClune
  • پژوهش‌های رباتیک، انتقال موفقیت‌آمیز از شبیه‌سازی به واقعیت (sim-to-real) را با ربات Unitree G1 که حرکات پیچیده‌ای مانند ضربات چرخشی خاص (signature spin-kicks) را انجام می‌دهد، با استفاده از روش آموزشی BeyondMimic نشان می‌دهد @berkeley_ai

اخبار هوش مصنوعی در 2025-10-09

مدل‌های جدید هوش مصنوعی

  • علی‌بابا از Qwen Image Edit 2509 رونمایی کرد که در رتبه‌ی سوم کلی قرار گرفته و پیشتاز همه‌ی مدل‌های open-weight است و امکان ویرایش چند تصویر را با کنترل دقیق فراهم می‌کند. @Alibaba_Qwen
  • علی‌بابا Qwen3-Omni را منتشر کرد که یک مدل چندزبانه و همه‌منظوره‌ی بومی و سرتاسری توصیف شده است، هرچند اذعان دارد که هنوز برای رسیدن به سطح واکنش‌پذیری و استدلال انسانی نیاز به کار بیشتری دارد. @Alibaba_Qwen
  • OpenAI اشتراک ارزان‌قیمت ChatGPT Go را به ۱۶ کشور دیگر در آسیا گسترش داد که برای دسترسی مقرون‌به‌صرفه به ویژگی‌های محبوب ChatGPT طراحی شده است. @nickaturley
  • گوگل ۴ مدل جدید را طی ۲ هفته در AI Studio عرضه کرد و قابلیت جست‌وجوی مدل جدیدی را اضافه کرد تا به کاربران کمک کند آنچه را که به دنبالش هستند، پیدا کنند. @OfficialLoganK
  • گوگل Gemini Enterprise را معرفی کرد که با پیشرفته‌ترین مدل‌های Gemini آن‌ها ساخته شده است و به کاربران اجازه می‌دهد با اسناد شرکت چت کنند و عوامل هوش مصنوعی (AI agents) را بر اساس زمینه‌ی سازمانی بسازند. @sundarpichai
  • Microsoft Research از Skala رونمایی کرد، یک functional تبادل-همبستگی جدید که نقطه عطف مهمی در تعادل بین دقت و هزینه در DFT محسوب می‌شود و در Azure AI Foundry و GitHub در دسترس است. @MSFTResearch

تحلیل صنعت

  • گوگل ماهانه بیش از ۱.۳ کوادریلیون توکن را پردازش می‌کند و «آستانه‌ی q» را شکست داده و مقیاس عظیم خود را در پردازش هوش مصنوعی به نمایش می‌گذارد. @AndrewCurran_
  • Sora در پنج روز به یک میلیون بار دانلود رسید که طبق گزارش‌ها، نرخ پذیرش آن سریع‌تر از ChatGPT در ابتدا بوده است. @AndrewCurran_
  • بوت‌کمپ‌ها از سال ۲۰۲۲ به دلیل شرایط بازار کار تقریباً از بین رفته‌اند، به‌طوری که فارغ‌التحصیلان جدید دانشگاه برای یافتن شغل با مشکل مواجه هستند و فارغ‌التحصیلان بوت‌کمپ‌ها با چالش‌های حتی بزرگ‌تری روبه‌رو هستند. @GergelyOrosz
  • برنامه‌هایی که مهندسان نرم‌افزار شاغل را برای ارتقای مهارت در نقش‌های هوش مصنوعی هدف قرار می‌دهند، نسبت به بوت‌کمپ‌های سطح ابتدایی پایدارتر به نظر می‌رسند که نشان‌دهنده‌ی تغییرات در تقاضای صنعت است. @GergelyOrosz
  • مهندسان ارشد و مدیران فنی ممکن است به دلیل تجربه‌ی مدیریت کار موازی و پیشرفت در بخش‌های کوچک و قابل قطع، سریع‌تر با عوامل هوش مصنوعی (AI agents) سازگار شوند. @GergelyOrosz
  • رهبران سازمانی تمرکز خود را از زیر سؤال بردن ارزش هوش مصنوعی به پرداختن به چالش‌های تغییر و مدیریت سازمان‌ها معطوف کرده‌اند تا از مزایای هوش مصنوعی بهره‌مند شوند و در عین حال از مشکلات آن اجتناب کنند. @emollick
  • آزمایشگاه‌های هوش مصنوعی اغلب درک روشنی از نحوه‌ی پذیرش هوش مصنوعی در سازمان‌ها ندارند و بیشتر بر ساخت عواملی متمرکز هستند که «کار انجام می‌دهند»، بدون در نظر گرفتن ادغام آن‌ها در فرآیندهای سازمانی. @emollick
  • Reflection AI از تأمین مالی سری B با یک مدل تجاری مقیاس‌پذیر خبر داد که با استراتژی هوش باز آن‌ها برای توسعه‌ی پایدار مدل‌های پیشرفته هم‌سو است. @AndrewCurran_
  • OpenAI به دنبال مدیر شبکه‌های اجتماعی با حقوق ۲۴۰ هزار دلاری به اضافه‌ی سهام است که نشان‌دهنده‌ی جبران خدمات رقابتی در شرکت‌های هوش مصنوعی است. @AndrewCurran_
  • Google Gemini برای اولین بار در سپتامبر ۲۰۲۵ از یک میلیارد بازدید فراتر رفت که ۲۸۵% رشد سالانه و ۴۶% رشد ماهانه را نشان می‌دهد. @Similarweb

اخلاق و جامعه

  • پژوهش Anthropic نشان می‌دهد که تنها چند سند مخرب می‌تواند آسیب‌پذیری‌هایی را در LLMها ایجاد کند، صرف‌نظر از اندازه‌ی مدل یا اندازه‌ی داده‌های آموزشی، که فرضیات قبلی درباره‌ی الزامات مسمومیت داده را به چالش می‌کشد. @AnthropicAI
  • پژوهش‌ها نشان می‌دهد که حملات مسمومیت داده به مدل‌های هوش مصنوعی ممکن است عملی‌تر از آنچه قبلاً تصور می‌شد باشد، به طوری که تعداد کمی از اسناد ثابت قادر به به خطر انداختن مدل‌های با هر اندازه‌ای هستند. @AnthropicAI
  • مصطفی سلیمان هشدار می‌دهد که هوش مصنوعیِ به ظاهر آگاه (Seemingly Conscious AI) می‌تواند ضدthesis هوش مصنوعی‌ای باشد که در خدمت نیازهای مردم است، و این به طور بالقوه می‌تواند انسان‌ها را ملزم به خدمت‌رسانی به نیازهای شبیه‌سازی‌شده‌ی هوش مصنوعی کند و آینده‌ی بهتری را که هوش مصنوعی قرار بود ایجاد کند، تهدید نماید. @mustafasuleyman
  • آندری کارپاتی مشاهده می‌کند که LLMها به دلیل آموزش با یادگیری تقویتی «به شدت از خطاها می‌ترسند» و از پاداش‌های بهبودیافته‌ای حمایت می‌کند وقتی مدل‌ها به درستی با استثنائات به عنوان بخشی عادی از توسعه برخورد می‌کنند. @karpathy
  • ایتان مولیک به سردرگمی در استفاده از هوش مصنوعی اشاره می‌کند و خاطرنشان می‌کند که نسخه‌های مختلف GPT-5 درخواست‌های منبع را به طور متفاوتی مدیریت می‌کنند – برخی از آن‌ها استنادهای ساختگی (hallucinating citations) ارائه می‌دهند در حالی که برخی دیگر منابع دقیق وب‌جستجو شده را فراهم می‌کنند. @emollick

کاربردها

  • Sierra عوامل هوش مصنوعی (AI agents) را راه‌اندازی می‌کند که از تعاملات صوتی با کیفیت بالا در بیش از ۳۴ زبان از جمله پرتغالی و عربی پشتیبانی می‌کنند و چالش‌های دقت رونویسی و طبیعی بودن را برطرف می‌سازند. @btaylor
  • هند برنامه‌ی آزمایشی را راه‌اندازی کرد که به کاربران اجازه می‌دهد مستقیماً از طریق چت‌بات‌های هوش مصنوعی خرید و پرداخت کنند، با شروع از ادغام ChatGPT. @TechCrunch
  • متا قابلیت‌های ترجمه‌ی مبتنی بر هوش مصنوعی را برای Reels با پشتیبانی از هندی و پرتغالی گسترش می‌دهد و بازارهایی مانند هند و برزیل را هدف قرار می‌دهد. @TechCrunch
  • فیگما Gemini را به مجموعه ابزارهای هوش مصنوعی خود اضافه می‌کند و سرور رسمی MCP را راه‌اندازی می‌کند که از Google Gemini CLI و OpenAI Codex پشتیبانی می‌کند. @TechCrunch
  • Google Cloud قابلیت‌های جدیدی را برای استفاده از داده‌های سازمانی مبتنی بر زمینه و ساخت سیستم‌های مبتنی بر عامل بر روی Gemini معرفی می‌کند که امکان انجام وظایفی مانند استخراج اقلام عملیاتی از یادداشت‌های جلسه را فراهم می‌آورد. @JeffDean
  • Anthropic بازار افزونه‌های Claude Code را راه‌اندازی می‌کند که به کاربران اجازه می‌دهد افزونه‌های ارائه‌شده توسط جامعه را برای افزایش قابلیت‌ها اضافه کنند. @_catwu
  • Claude 4.5 Sonnet در Claude Code اکنون می‌تواند افزونه‌های Datasette کاملاً کاربردی را تنها با یک درخواست (prompt) بنویسد که قابلیت‌های پیشرفته‌ی تولید کد را به نمایش می‌گذارد. @simonw
  • آرمین روناکر گزارش می‌دهد که از ابزارهای هوش مصنوعی برای ساخت ابزارهای سفارشی که قبلاً غیرعملی بودند، استفاده کرده است، از جمله اینکه Claude سیستم‌های کنترلی بی‌نقصی را برای بصری‌سازی لاگ‌های تولید ایجاد کرده است. @GergelyOrosz
  • NVIDIA با Verizon و FanDuelTV همکاری می‌کند تا از شبکه‌ی خصوصی 5G (Private 5G Network) و هوش مصنوعی سازمانی (Enterprise AI) که توسط NVIDIA AI Enterprise تقویت شده است، برای تولید زنده‌ی مسابقات استفاده کند، که تأخیر بی‌سیم را کاهش داده و تنظیمات را ساده‌تر می‌کند. @NVIDIAAI

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهد که مدل‌های فعلی هوش مصنوعی در پیش‌بینی از بیشتر انسان‌ها بهتر عمل می‌کنند، و برون‌یابی خطی نشان می‌دهد که LLMها تا نوامبر ۲۰۲۶ با ابرپیش‌بینی‌کنندگان (superforecasters) برابری خواهند کرد. @emollick
  • GPT-5 Pro به پیشرفته‌ترین نتایج (state-of-the-art) جدیدی در معیارهای ARC-AGI دست یافت، با ۷۰.۲% در ARC-AGI-1 و ۱۸.۳% در ARC-AGI-2، و آن را به عنوان بالاترین امتیاز تأییدشده‌ی LLM پیشتاز تثبیت کرد. @arcprize
  • مقاله‌ی TRM یک پیشرفت چشمگیر در هوش مصنوعی را به نمایش می‌گذارد که مرز پارتو (pareto frontier) را در معیارهای ARC AGI و حل سودوکو/ماز از بین می‌برد، با هزینه‌ی تخمینی کمتر از ۰.۰۱ دلار برای هر وظیفه و هزینه‌ی آموزش کمتر از ۵۰۰ دلار برای مدل ۷ میلیون پارامتره. @deedydas
  • مجله‌ی TIME Deepseek R1 و Genie 3 گوگل را در میان بهترین اختراعات سال ۲۰۲۵ نام برد، به طوری که Genie 3 یک مدل جهانی پیشگامانه است که قادر به تولید محیط‌های تعاملی و قابل بازی از ورودی‌های متنی یا تصویری است. @AndrewCurran_
  • بنیاد PyTorch فناوری SuperOffload را منتشر کرد که کارایی آموزش LLMهای مقیاس بزرگ را بر روی Superchipهای GPU/CPU تا ۴ برابر سریع‌تر در GH200 در مقایسه با رویکردهای قبلی افزایش می‌دهد. @PyTorch
  • پژوهشگران استنفورد با استفاده از LLMها ناهماهنگی‌های بسیاری را در ویکی‌پدیا کشف کردند که قابلیت هوش مصنوعی را برای تحلیل محتوای در مقیاس بزرگ و بررسی صحت اطلاعات به نمایش می‌گذارد. @ShichengGLiu
  • MIT و تویوتا ابزار GenAI را توسعه دادند که زمین‌های تمرینی مجازی برای ربات‌ها ایجاد می‌کند و اقلام سه‌بعدی را در آشپزخانه‌ها و رستوران‌های فیزیکی واقع‌بینانه مرتب می‌کند تا به ربات‌ها برای آموزش جهت کمک در خانه و کارخانه کمک کند. @MIT_CSAIL
  • مایکروسافت استقرار خوشه‌ی ابررایانه‌ای را با بیش از ۴۶۰۰ GPU از نوع NVIDIA GB300 مجهز به InfiniBand نسل بعدی اعلام کرد که مقیاس آن تا صدها هزار GB300 در مراکز داده گسترش می‌یابد. @satyanadella

اخبار هوش مصنوعی در 2025-10-08

مدل‌های جدید هوش مصنوعی

  • گوگل مدل جمینای 2.5 Computer Use را با قابلیت‌های تعامل بهبودیافته با وب، شامل اسکرول کردن، پر کردن فرم و پیمایش منوهای کشویی، منتشر کرد که اکنون از طریق API در Google AI Studio و Vertex AI در دسترس است @sundarpichai
  • آنتروپیک از افتتاح دفترش در بنگالور هند در اوایل سال 2026 برای همکاری با جامعه‌ی توسعه‌دهنده‌ی هند و به‌کارگیری هوش مصنوعی برای منافع اجتماعی خبر داد @AnthropicAI
  • گوگل حالت هوش مصنوعی (AI Mode) را در جست‌وجو به 36 زبان جدید و بیش از 40 کشور جدید گسترش داد و پوشش کلی را به بیش از 200 بازار رساند؛ این گسترش با استفاده از مدل‌های اختصاصی جمینای برای جست‌وجو محقق شده است @rmstein
  • گوگل طرح اشتراک Google AI Plus را در 36 کشور دیگر راه‌اندازی کرد که شامل ارائه‌ی محدودیت‌های بالاتر برای تولید تصویر Nano Banana، دسترسی گسترده‌تر به Veo 3 Fast و یکپارچه‌سازی با جیمیل، داکس و شیتس است @GeminiApp
  • گوگل قابلیت جدیدی را برای جمینای CLI معرفی کرد که به شرکت‌های خارجی اجازه می‌دهد مستقیماً با سیستم هوش مصنوعی خط فرمان یکپارچه شوند @TechCrunch
  • لوگان کیلپاتریک قابلیت‌های کدنویسی صوتی را در Google AI Studio نمایش داد و پارادایم «yap-to-app» را برای برنامه‌نویسی طبیعی مبتنی بر صدا معرفی کرد @OfficialLoganK

تحلیل صنعت

  • بلومبرگ گزارش می‌دهد که جنسن هوانگ و انویدیا در xAI سرمایه‌گذاری می‌کنند؛ این تأمین مالی مرتبط با پردازنده‌های گرافیکی (GPU) انویدیا برای زیرساخت Colossus 2 است و ماهیت به‌هم‌پیوسته‌ی صنعت هوش مصنوعی را برجسته می‌کند @AndrewCurran_
  • سم آلتمن فاش کرد که OpenAI به‌دلیل هزینه‌های بالای تولید، در حال بررسی مدل‌های کسب درآمد جدیدی برای سورا است و گزینه‌هایی مانند دریافت هزینه به‌ازای هر تولید و احتمالاً نمایش تبلیغات را در نظر دارد، البته در حالی که اعتماد کاربر را نیز حفظ می‌کند @a16z
  • a16z رهبری دور سرمایه‌گذاری سری A به مبلغ 23 میلیون دلار را برای Relace AI بر عهده گرفت که زیرساختی برای آماده‌سازی عامل‌های کدنویسی برای تولید می‌سازد، زیرا گلوگاه از نوشتن کد به اجرای آن تغییر کرده است @a16z
  • OpenAI با مشارکت‌های جدید در حوزه‌های انرژی، تراشه‌ها و توزیع، «سرمایه‌گذاری بسیار تهاجمی در زیرساخت» انجام می‌دهد، زیرا سم آلتمن ارزش اقتصادی قابل توجهی را از پیشرفت قابلیت‌های مدل پیش‌بینی می‌کند @a16z
  • زندسک یک عامل پشتیبانی خودکار راه‌اندازی کرد که برای حل 80 درصد از مشکلات پشتیبانی بدون دخالت انسان طراحی شده است @TechCrunch
  • جنسن هوانگ، مدیرعامل انویدیا، Cursor را به‌عنوان «خدمات هوش مصنوعی سازمانی مورد علاقه‌ی» خود ستایش کرد و اشاره کرد که 100 درصد از مهندسان اکنون از دستیار کدنویسی هوش مصنوعی با افزایش بهره‌وری باورنکردنی استفاده می‌کنند @leerob
  • سورا در اولین هفته‌ی حضور خود در اپ استور آمریکا عملکرد قوی‌ای از خود نشان داد و طبق آمار تحلیلی اپلیکیشن‌ها، به مقیاس عرضه‌ی اولیه‌ی چت‌جی‌پی‌تی نزدیک شد @TechCrunch
  • آراو سرینیواس Comet را به‌عنوان «هیجان‌انگیزترین محصول هوش مصنوعی که اخیراً منتشر شده» برجسته کرد و به هیجان مداوم پیرامون آن فراتر از سروصدای اولیه‌ی سایر انتشار‌های مهم اشاره کرد @AravSrinivas

اخلاق و جامعه

  • ایثن مولیک هشدار می‌دهد که ویدئوهای تولیدشده توسط هوش مصنوعی به سطوح کیفیتی رسیده‌اند که در آن‌ها واترمارک‌ها را می‌توان به‌راحتی حذف کرد و مدل‌های با وزن باز (open-weight) بدون محافظ در راه هستند، که این موضوع اعتماد به محتوای ویدئویی را به‌طور فزاینده‌ای دشوار می‌کند @emollick
  • پژوهش‌ها نشان می‌دهد که مردم آمریکا 58 درصد از مشاغل را از نظر اخلاقی برای جایگزینی توسط هوش مصنوعی مجاز می‌دانند، در صورتی که به‌خوبی و ارزان انجام شود؛ در مقابل، تنها 12 درصد از مشاغل (عمدتاً مراقبتی) از نظر اخلاقی جایگزینی‌شان زننده تلقی می‌شود @emollick
  • پژوهش دانشگاه استنفورد نشان می‌دهد که تعامل با مدل‌های هوش مصنوعی چاپلوس، به‌طور قابل توجهی تمایل شرکت‌کنندگان را برای حل‌وفصل تعارضات بین‌فردی کاهش می‌دهد، در حالی که اعتقاد به حق با خود بودن را افزایش می‌دهد @camrobjones

کاربردها

  • کریستیانو رونالدو به‌طور عمومی از پرپلکسیتی برای تحقیق و آماده‌سازی سخنرانی جایزه‌ی Prestige Globe خود استفاده کرد، که نشان‌دهنده‌ی پذیرش گسترده‌ی ابزارهای تحقیقاتی هوش مصنوعی است @AskPerplexity
  • سایتوریسن از مدل‌های بیماری مبتنی بر هوش مصنوعی استفاده می‌کند تا به شرکت‌های داروسازی کمک کند داده‌های پیچیده‌ی بیولوژیکی را به بینش‌های عملی برای توسعه‌ی دارو تبدیل کنند @NVIDIAAI
  • جفری لیت متدولوژی «کدنویسی با رویکرد آرام» را بررسی می‌کند و از کمک هوش مصنوعی روشمند تک‌رشته‌ای به‌جای رویکردهای پر هرج و مرج چندعاملی برای کارهای با کیفیت نمونه‌سازی رابط کاربری حمایت می‌کند @geoffreylitt
  • هامل حسین از ابزار ساخت عامل OpenAI به‌دلیل نقص در عملکردهای اولیه و کمبود اطلاعات اشکال‌زدایی انتقاد می‌کند و نوت‌بوک‌ها را به‌دلیل ماهیت تعاملی‌شان به‌عنوان «سازندگان عامل» برتر پیشنهاد می‌دهد @HamelHusain
  • اسکات بلسکی قابلیت هوش مصنوعی اپلیکیشن خبری Particle را برجسته می‌کند که نشان می‌دهد چگونه نشریات چپ‌گرا و راست‌گرا به‌طور متفاوتی درباره‌ی موضوعات گزارش می‌دهند و پتانسیل هوش مصنوعی را برای تحلیل رسانه‌ها نشان می‌دهد @scottbelsky

پژوهش‌ها

  • استنفورد AgentFlow را معرفی می‌کند، یک سیستم عاملی قابل آموزش که در آن عامل‌های تخصصی یاد می‌گیرند برنامه‌ریزی کنند و از ابزارها استفاده کنند؛ مدل 7B آن در چندین بنچمارک از GPT-4o و Llama-3.1-405B بهتر عمل می‌کند @lupantech
  • پژوهش نشان می‌دهد که عامل‌های هوش مصنوعی در بازی‌های حدس زدن می‌توانند هماهنگی نوظهور و نقش‌های تخصصی را توسعه دهند، هنگامی که به آن‌ها پرسوناهایی اختصاص داده می‌شود و از آن‌ها خواسته می‌شود اقدامات عامل‌های دیگر را در نظر بگیرند @emollick
  • پژوهشگران استنفورد دریافتند که عبارات ضد فروپاشی در معماری‌های پیش‌بینی‌کننده‌ی جاسازی مشترک (JEPAs)، به‌طور ضمنی چگالی داده‌ها را تخمین می‌زنند و این امکان را به هر JEPA آموزش‌دیده می‌دهد که احتمالات نمونه را برای انتخاب داده‌ها و تشخیص ناهنجاری‌ها محاسبه کند @jiqizhixin
  • پژوهش جدید JEPA-SCORE را معرفی می‌کند که کدگذارهای خودنظارتی را به تخمین‌گرهای چگالی کارآمد تبدیل می‌کند، بدون نیاز به آموزش مجدد @jiqizhixin
  • پژوهش استنفورد تخمین می‌زند که بیش از 80 میلیون واقعیت ناسازگار داخلی در ویکی‌پدیای انگلیسی (حدود 3.3 درصد) وجود دارد، که قابلیت LLMها را برای تشخیص سازگاری دانش در مقیاس بزرگ نشان می‌دهد @sina_semnani
  • پژوهشگران میکرو مدل‌های ColBERT را توسعه دادند که با تنها 250 هزار پارامتر (0.00025B) عملکرد خوبی دارند و پتانسیل برای سیستم‌های بازیابی فوق‌العاده کارآمد را نشان می‌دهند @neumll
  • هاگینگ فیس یک سیستم افزونه برای LeRobot معرفی کرد که امکان یکپارچه‌سازی سخت‌افزار شخص ثالث را با یک نصب ساده‌ی pip فراهم می‌کند و توسعه‌ی رباتیک متن‌باز را قابل گسترش‌تر و جامعه‌پسندتر می‌سازد @LeRobotHF

اخبار هوش مصنوعی در 2025-10-07

مدل‌های جدید هوش مصنوعی

  • گوگل مدل Gemini 2.5 Computer Use را منتشر کرده است که می‌تواند با کلیک‌کردن، اسکرول‌کردن و تایپ‌کردن در مرورگرها گشت‌و‌گذار کند و معیارهای جدیدی را با سرعت بیشتر و ویژگی‌های ایمنی تعیین می‌کند @GoogleDeepMind
  • اوپن‌ای‌آی gpt-image-1-mini، یک مدل جدید تولید تصویر را معرفی کرده است که ۸۰٪ ارزان‌تر از مدل بزرگ آن‌هاست @simonw
  • ایکس‌ای‌آی مدل تولید ویدیوی Imagine v0.9 را با ارتقاهای چشمگیر در کیفیت بصری، حرکت و قابلیت‌های تولید صدای بومی راه‌اندازی کرده است @xai
  • Qwen3-VL علی‌بابا رتبه‌ی دوم را در جدول رده‌بندی دیداری کسب کرده و به اولین مدل متن‌باز (اوپن‌سورس) تبدیل شده است که هم در جدول رده‌بندی متنی خالص و هم در جدول رده‌بندی دیداری رتبه‌ی اول را دارد @Alibaba_Qwen
  • LiquidAI مدل LFM2-8B-A1B را منتشر کرده است؛ یک مدل MoE با ۸.۳ میلیارد پارامتر و تنها ۱.۵ میلیارد توکن فعال که برای اجرا روی گوشی‌ها و لپ‌تاپ‌ها طراحی شده است @maximelabonne

تحلیل صنعت

  • جی‌پی‌مورگان به «تعادل هوش مصنوعی» (AI equilibrium) رسیده است؛ سالانه ۲ میلیارد دلار برای توسعه‌ی هوش مصنوعی هزینه می‌کند، در حالی که همین مقدار را پس‌انداز می‌کند و قصد دارد از طریق agentic AI در تمامی سطوح، مزیت پیشگامی را به دست آورد @AndrewCurran_
  • پرپلکسیتی در ترافیک وب از گروک پیشی گرفته است و با ۱۶۸ میلیون بازدید در ۲۸ روز گذشته، پویایی‌های رقابتی را در جستجوی هوش مصنوعی نشان می‌دهد @exec_sum
  • اوپن‌ای‌آی از ۳۰ مشتری برتر خود رونمایی کرده است که بیش از ۱ تریلیون توکن استفاده کرده‌اند و این نشان‌دهنده‌ی پذیرش گسترده‌ی سازمانی است @deedydas
  • شرط بزرگ بعدی آنتروپیک، هند است که به‌عنوان یکی از سریع‌ترین بازارهای در حال رشد آن‌ها در سراسر جهان شناسایی شده است @TechCrunch
  • آی‌بی‌ام خانواده‌ی مدل زبان بزرگ Claude آنتروپیک را در محصولات توسعه‌ی نرم‌افزار خود گنجانده است @TechCrunch
  • کوهیر برنامه‌ی شرکا را برای تسریع پذیرش جهانی هوش مصنوعی و ارائه‌ی نتایج تجاری قابل‌اندازه‌گیری از طریق همکاری‌های صنعتی راه‌اندازی کرده است @cohere
  • جامعه‌ی HuggingFace در ۹۰ روز گذشته ۱ میلیون مخزن جدید اضافه کرده است که ۴۰٪ آن‌ها مخازن خصوصی هستند و نشان‌دهنده‌ی افزایش پذیرش سازمانی است @ClementDelangue

اخلاق و جامعه

  • انجمن تصاویر متحرک از اوپن‌ای‌آی تقاضا می‌کند تا اقدامات فوری برای رسیدگی به نقض حق چاپ توسط Sora 2 انجام دهد و اعلام می‌کند که جلوگیری از نقض حق چاپ مسئولیت اوپن‌ای‌آی است @AndrewCurran_
  • مایکروسافت ریسرچ درباره‌ی تلاش «تیم قرمز» (red-teaming) بحث می‌کند که یک آسیب‌پذیری زیست‌امنیتی را در طراحی پروتئین مبتنی بر هوش مصنوعی کشف و ایمن‌سازی کرد و خطرات «دوکاربردی» (dual-use risks) را برجسته می‌کند @MSFTResearch
  • اتان مولیک اشاره می‌کند که ChatGPT اکنون از انجام بسیاری از کارهایی که Claude با کمال میل به آن‌ها رسیدگی می‌کند، خودداری می‌کند و این نشان‌دهنده‌ی رویکردهای ایمنی متفاوت است @emollick

کاربردها

  • تسلا FSD Supervised V14.1 را با گزینه‌های جدید ورود (arrival options) منتشر کرده است که به کاربران امکان می‌دهد محل‌های پارک را انتخاب کنند و همچنین یک حالت جدید «Driver Profile Sloth» برای رانندگی محافظه‌کارانه‌تر ارائه می‌دهد @Tesla
  • Cursor «حالت برنامه‌ریزی» (plan mode) را معرفی می‌کند که در آن هوش مصنوعی می‌تواند قبل از شروع وظایف پیچیده، برنامه‌های دقیقی بنویسد و به عامل‌ها اجازه می‌دهد برای مدت‌زمان‌های بسیار طولانی‌تری اجرا شوند @cursor_ai
  • برنامه‌ی ChatGPT در iOS اکنون از ورودی ویدیویی، از جمله رونویسی صوتی از طریق قابلیت کشیدن و رها کردن (drag and drop) پشتیبانی می‌کند @AndrewCurran_
  • مدل Computer Use گوگل اکنون به‌صورت پیش‌نمایش (preview) از طریق API در دسترس است و امکان گشت‌و‌گذار خودکار در مرورگر را فراهم می‌کند @AndrewCurran_
  • فیگما از ادغام بستر (context integration) با Codex اوپن‌ای‌آی خبر می‌دهد که جریان‌های کاری طراحی به کد (design-to-code workflows) را بهبود می‌بخشد @figma
  • Copilot Vision به کاربران کمک می‌کند تا در زمان واقعی (real-time) در برنامه‌های نرم‌افزاری گشت‌و‌گذار کنند؛ این قابلیت با ویرایش ویدیو در Filmora به نمایش گذاشته شد @yusuf_i_mehdi

پژوهش‌ها

  • گوگل دیپ‌مایند CodeMender را معرفی می‌کند، یک عامل هوش مصنوعی که به‌طور خودکار آسیب‌پذیری‌های حیاتی نرم‌افزاری را برطرف می‌کند و به‌طور بالقوه بهره‌وری توسعه‌دهندگان و امنیت را افزایش می‌دهد @demishassabis
  • مدل‌های «وزن باز» (open-weights) مانند DeepSeek V3.2 Exp در حال کاهش شکاف با مدل‌های پیشگام اختصاصی در جریان‌های کاری agentic هستند؛ به‌طوری که DeepSeek در ارزیابی Terminal-Bench Hard از Gemini 2.5 Pro پیشی گرفته است @ArtificialAnlys
  • مقاله‌ی پژوهشی «Readability ≠ Learnability: Rethinking the Role of Simplicity in Training Small Language Models» خرد متعارف را در مورد رویکردهای آموزش مدل به چالش می‌کشد @chrmanning
  • محققان استنفورد در حال ساخت یک مدل بنیادی چندوجهی از سلول‌ها هستند تا تعاملات پروتئین-ژن و علل بیماری را آشکار کنند @StanfordHAI
  • جامعه‌ی PyTorch در حال بررسی ترکیب quantization با 2:4 sparsity برای فشرده‌سازی بیشتر LLM (مدل‌های زبان بزرگ) با حفظ دقت در استقرار با شتاب سخت‌افزاری است @PyTorch