اخبار هوش مصنوعی در 2025-10-18

مدل‌های جدید هوش مصنوعی

گوگل قابلیت «Grounding» را با گوگل مپس در API جِمینی معرفی می‌کند و داده‌های مربوط به ۲۵۰ میلیون مکان را با جِمینی ترکیب می‌کند تا تجربه‌های جدیدی خلق کند @OfficialLoganK
گوگل مدل ارتقایافته‌ی Veo 3.1 را با واقع‌گرایی بهبودیافته و صدای غنی‌تر منتشر می‌کند که اکنون در Flow by Google، اپلیکیشن جِمینی، Google Cloud Vertex AI و API جِمینی در دسترس است @sundarpichai
مدل ویرایش تصویر نانوی گوگل اکنون در «جست‌وجو» با قابلیت‌های «Lens و AI Mode»، NotebookLM و اپلیکیشن جِمینی در دسترس است و به‌زودی برای Google Workspace Slides و Google Photos عرضه خواهد شد @sundarpichai
Google AI Studio قابلیت جدیدی ارائه کرده است که به کاربران امکان می‌دهد دستورالعمل‌های سیستمی را ذخیره و دوباره استفاده کنند و آزمایش و بازتولید خروجی‌ها را با جِمینی آسان‌تر می‌کند @OfficialLoganK
گوگل مدل بنیادی C2S-Scale 27B را که با همکاری Yale و Gemma برای پژوهش‌های سرطان ساخته شده است، همراه با مدل هوش مصنوعی متن‌باز DeepSomatic برای تحلیل ژنتیکی منتشر می‌کند @sundarpichai
Microsoft Research مدل SimPoly را معرفی می‌کند؛ یک میدان نیروی یادگیری ماشین برای شبیه‌سازی پلیمر که چگالی پلیمر و دماهای گذار شیشه‌ای را با دقت محاسبه می‌کند @gncsimm
Keras اکنون از کوانتیزاسیون مدل (model quantization) تنها با یک خط کد پشتیبانی می‌کند و حالت‌های int4, int8, float8 و GPTQ را هم برای مدل‌های سفارشی و هم برای مدل‌های از پیش آموزش‌دیده از KerasHub پوشش می‌دهد @_avichawla

تحلیل صنعت

گرگلی اوروس مشاهده می‌کند که OpenAI در داخل هنوز بر «رسیدن به AGI» به عنوان یک اصل راهنما تمرکز دارد، در حالی که Anthropic بر اساس مکالمات با مهندسان هر دو شرکت، در بهبود گام‌به‌گام ریشه‌دارتر عمل می‌کند @GergelyOrosz
واتس‌اپ استفاده‌ی چت‌بات‌های عمومی را از Business API خود ممنوع می‌کند که بر خدمات دستیار هوش مصنوعی مانند یکپارچه‌سازی واتس‌اپ Perplexity تأثیر می‌گذارد @TechCrunch
Perplexity به کاربران توصیه می‌کند پس از تغییرات سیاست واتس‌اپ، از دستیار واتس‌اپ به دستیار تلگرام خود به نام «askplexbot» تغییر دهند @AravSrinivas
دیدیداس به ظهور سرمایه‌گذاری‌های اولیه‌ی (seed rounds) میلیارد دلاری برای شرکت‌های هوش مصنوعی، از جمله Lila Sciences, General Intuition, Periodic Labs, Thinking Machines, SSI و Sierra، اشاره می‌کند @deedydas
ایتان مولیک گزارش می‌دهد که در شرکت‌هایی که او با آن‌ها صحبت می‌کند، رهبران تحولات جدید هوش مصنوعی را دنبال نمی‌کنند یا به AGI فکر نمی‌کنند، بلکه بر انباشت پیوسته‌ی موارد استفاده‌ی ارزشمند و تنظیمات فرآیند تمرکز دارند @emollick
حالت هوش مصنوعی گوگل در «جست‌وجو» اکنون به طور کامل در بیش از ۲۰۰ کشور و منطقه با ۴۳ زبان عرضه شده است و کاربران سؤالاتی تقریباً ۳ برابر طولانی‌تر از جست‌وجوهای سنتی می‌پرسند @sundarpichai

اخلاق و جامعه

آماندا اسکل اشاره می‌کند که مردم اغلب ارضای شهوانی با هوش مصنوعی (AI erotica) و روابط عاشقانه‌ی هوش مصنوعی را با هم اشتباه می‌گیرند و پیشنهاد می‌کند که یکی به‌وضوح نگران‌کننده‌تر از دیگری است @AmandaAskell
اندرو کارن مثالی نگران‌کننده از ویدیوی تولیدشده توسط هوش مصنوعی را برجسته می‌کند که در آن چاک شومر جمله‌ای واقعی را می‌گوید، اما خود ویدیو به طور مصنوعی ساخته شده است زیرا این جمله جلوی دوربین گفته نشده بود @AndrewCurran_
تک‌کرانچ گزارش می‌دهد که ویدیوی تولیدشده توسط هوش مصنوعی در حساب X جمهوری‌خواهان سنا منتشر شده است که احتمالاً سیاست‌های X را علیه «رسانه‌های فریبنده‌ی ترکیبی یا دست‌کاری‌شده که احتمال آسیب رساندن دارند» نقض می‌کند @TechCrunch
تک‌کرانچ به پوشش بحث‌وجدل پیرامون دیوید ساکس از کاخ سفید و جیسون کوون از OpenAI می‌پردازد که به دلیل اظهارنظرهایشان در مورد گروه‌هایی که ایمنی هوش مصنوعی را ترویج می‌کنند، ایجاد شده است @TechCrunch
فاش شده است که یک مقاله‌ی وایرال «تعریف AGI» حاوی استنادهای جعلی است که وجود ندارند و مقالات متفاوتی در شماره‌های ژورنال/جلد/صفحه‌ی مشخص‌شده حضور دارند @m2saxon

کاربردها

گرگلی اوروس تجربه‌ی خود از استفاده از Claude Code را برای ساخت صفحات فرود به جای استفاده از قالب‌ها یا Webflow به اشتراک می‌گذارد و آن را برای کارهای فرانت‌اند که در آن‌ها تخصص ندارد، کارآمدتر می‌یابد @GergelyOrosz
اوروس استفاده از Claude را برای وظایف پیکربندی، مانند راه‌اندازی سایت‌های استاتیک در Netlify، نشان می‌دهد و نیاز به جست‌وجو و یادگیری مجدد رویه‌های راه‌اندازی زیرساخت را از بین می‌برد @GergelyOrosz
تک‌کرانچ یک اپلیکیشن جدید آیفون به نام Endless Summer را معرفی می‌کند که از هوش مصنوعی برای ایجاد عکس‌های تعطیلاتی فوتورئالیستی با حضور کاربران بدون نیاز به سفر واقعی استفاده می‌کند @TechCrunch
سایمون ویلیسون ابزاری «vibe-coded» برای نمایش JSON پاسخ‌های OpenAI از فراخوانی‌های API پژوهش عمیق، در قالبی خواناتر ایجاد می‌کند که با استفاده از Claude Code ساخته شده است @simonw
اسکات بلسکی پیش‌بینی می‌کند که «هر فناوری که بیشترین چیزها را ببیند، بیشترین چیزها را نیز به خاطر خواهد سپرد و حافظه در عصر بعدی بر همه‌چیز حکمرانی خواهد کرد»؛ این موضوع گوگل را در موقعیت خوبی قرار می‌دهد، اما به عوامل غیرمنتظره‌ی بالقوه مانند مدل‌های محلی و نوآوری‌های مرورگر نیز اشاره می‌کند @scottbelsky

پژوهش‌ها

ایتان مولیک تأکید می‌کند که نتایج اولیه مانند GDPval نشان می‌دهد که مدل‌های هوش مصنوعی امروزی به اندازه‌ی کافی خوب هستند تا طی ۵ تا ۱۰ سال تحولات بزرگی ایجاد کنند، زیرا شرکت‌ها یاد می‌گیرند که آن‌ها را پیاده‌سازی و در فرآیندهای خود ادغام کنند @emollick
مولیک بر این باور خود تأکید می‌کند که تنظیم دقیق (fine-tuning) عمدتاً در موقعیت‌های خاص مفید است و همچنان نسبت به اینکه این راه‌حل مناسبی برای بسیاری از مشکلاتی است که صرفاً با پرامپتینگ (prompting) قابل حل هستند، تردید دارد @emollick
آندری کارپاتی در مورد حضور اخیر خود در پادکست، توضیحات مفصلی ارائه می‌دهد و درباره‌ی جدول زمانی AGI، محدودیت‌های یادگیری تقویتی و مفهوم «هسته‌ی شناختی» برای بهبود تعمیم‌پذیری LLM بحث می‌کند @karpathy
کارپاتی رویکردهای فعلی یادگیری تقویتی (RL) را نقد می‌کند و بیان می‌کند که «شما نظارت را از طریق یک نی می‌مَکید» با نسبت‌های سیگنال به فلاپ (signal/flop) ضعیف، و از الگوهای یادگیری جایگزین فراتر از یادگیری تقویتی سنتی حمایت می‌کند @karpathy
نیتن لمبرت اشاره می‌کند که دیدگاه کارپاتی مبنی بر اینکه «یادگیری تقویتی بسیار بدتر از آن چیزی است که افراد عادی فکر می‌کنند» عمدتاً درست است، با این حال افراد زیادی ادعا می‌کنند که RL همه چیز را حل خواهد کرد @natolambert
سایمون ویلیسون مدل o4-mini-deep-research OpenAI را از طریق API «Responses» آن‌ها بررسی می‌کند، یافته‌های خود را مستندسازی کرده و ابزارهای ارزیابی می‌سازد @simonw
Interconnects AI در مورد آخرین مدل‌های متن‌باز گزارش می‌دهد و به حضور قوی Qwen اشاره می‌کند و در مورد روش‌های نظارت دقیق بر دانلودهای Hugging Face و تخریب مداوم مجموعه‌داده‌های باز بحث می‌کند @interconnectsai

اخبار هوش مصنوعی در 2025-10-17

مدل‌های جدید هوش مصنوعی

گوگل Veo 3.1 را با قابلیت‌های پیشرفته‌ی تولید ویدئو، از جمله صدای غنی‌تر، کنترل بهتر روایت، واقع‌گرایی افزایش‌یافته، و ویژگی‌های جدیدی مانند توسعه‌ی ویدئو، کنترل فریم و دستکاری اشیا منتشر می‌کند @GoogleAI

تحلیل صنعت

طبق داده‌های جدید شرکت تحلیل‌گر اپلیکیشن Apptopia، اپلیکیشن موبایل ChatGPT ممکن است به اوج رشد خود رسیده باشد که نشان‌دهنده‌ی اشباع احتمالی بازار است @TechCrunch
Perplexity نرخ بالای حفظ و تبدیل کاربر را برای ویژگی‌های جدید خود اعلام می‌کند و برنامه‌هایی برای گسترش از کاربران Max به کاربران Pro و افزودن پشتیبانی از iMessages دارد @AravSrinivas
Linear رشد بی‌سابقه‌ای را در سال 2025 گزارش می‌دهد، با پیوستن و استفاده‌ی تیم‌های بیشتری از همیشه به پلتفرم آن‌ها، در حالی که سودآوری خود را بدون صرف سرمایه‌ی سرمایه‌گذاران حفظ کرده است @karrisaarinen
SK Telecom به همه‌ی کارکنان بخش جدید هوش مصنوعی خود بازنشستگی داوطلبانه را پیشنهاد می‌کند؛ این اقدام بخشی از سازماندهی مجدد گسترده‌تر برای یکپارچه‌سازی بخش‌های مرتبط با هوش مصنوعی است @TechCrunch
مارک آندرسن پیش‌بینی می‌کند که هوش مصنوعی به نابغه‌های خلاق امکان ساخت فیلم‌های باورنکردنی را بدون بودجه‌ی استودیو می‌دهد، و به طور بالقوه انواع جدیدی از فیلم و سرگرمی را توسط افرادی خلق می‌کند که قبلاً نمی‌توانستند به این رسانه دسترسی داشته باشند @a16z

اخلاق و جامعه

OpenAI تولید ویدئوهای هوش مصنوعی از مارتین لوتر کینگ جونیور را به درخواست بازماندگان او، پس از آنکه کاربران تصاویر بی‌احترامی‌آمیزی تولید کردند، متوقف می‌کند؛ این اقدام سندی برای کنترل بازماندگان بر شباهت‌های شخصیت‌های تاریخی ایجاد می‌کند @OpenAINewsroom
از بازیگران به طور معمول در پروژه‌های تولید فیلم اسکن گرفته می‌شود، بدون آنکه بدانند از این داده‌ها چگونه استفاده خواهد شد؛ استودیوها قبلاً پیشنهاد داده بودند که حقوق مربوط به اسکن اجراکنندگان درگذشته، بدون رضایت بازماندگان، به طور دائم به آن‌ها بازگردد @AndrewCurran_
آندری کارپاتی آینده‌ی بالقوه‌ای را پیش‌بینی می‌کند که در آن هوش‌های مصنوعی رقیب به آرامی مستقل‌تر می‌شوند و در نهایت به جناح‌های متخاصم تقسیم می‌شوند، که این امر نگرانی‌هایی را در مورد همسویی و کنترل هوش مصنوعی ایجاد می‌کند @AndrewCurran_
محتمل‌ترین سناریوی ASI کارپاتی شامل از دست دادن تدریجی کنترل و درک انسان از سیستم‌های هوش مصنوعی است @AndrewCurran_
فیس‌بوک ویژگی پیشنهاد عکس Meta AI را عرضه می‌کند که ویرایش تصاویر را در گالری عکس کاربران، حتی برای عکس‌های به اشتراک گذاشته نشده، پیشنهاد می‌دهد و این امر نگرانی‌های حریم خصوصی را افزایش می‌دهد، با وجود آنکه فقط با رضایت کاربر فعال می‌شود @TechCrunch

کاربردها

Anthropic به آرامی Claude Skills را منتشر می‌کند که گامی مهم به سوی عامل‌های هوش مصنوعی کارآمد با دستورالعمل‌های از پیش تعریف‌شده برای وظایف خاص است @emollick
Claude Skills پانزده قابلیت از پیش بسته‌بندی شده را برای کاربران حرفه‌ای فراهم می‌کند که به عنوان ترکیبی بین دستورات سیستم سفارشی و MCP سبک برای اجرای مداوم وظایف عمل می‌کند @deedydas
Sora Pro ویژگی جدید استوری‌بورد را معرفی می‌کند که می‌تواند تبلیغات چند شاتی را با پایداری بالای شخصیت و ترکیب‌بندی، کاملاً از طریق هوش مصنوعی ایجاد کند @emollick
Perplexity Finance ویژگی ردیابی معاملات داخلی را راه‌اندازی می‌کند و برنامه‌هایی برای افزودن نظارت بر معاملات سیاستمداران دارد @AravSrinivas
Reddit تجربه‌ی جستجوی مبتنی بر هوش مصنوعی خود را به پنج زبان جدید گسترش می‌دهد: فرانسوی، آلمانی، اسپانیایی، ایتالیایی و پرتغالی @TechCrunch
HuggingChat Omni با قابلیت‌های مسیریابی در بیش از 100 مدل متن‌باز برای عملکرد، هزینه و سرعت بهینه راه‌اندازی می‌شود @huggingface
OpenHands قابلیت‌های جستجوی کد عامل‌محور سریع را با استفاده از عامل‌های خوب، سرویس‌دهی سریع و مدل‌های کدنویسی به نمایش می‌گذارد و تنها چند ثانیه طول می‌کشد تا پایگاه‌های کد را جستجو کند @HamelHusain

پژوهش‌ها

پژوهشگران با استفاده از هزاران پرس‌وجوی GPT-5 راه‌حل‌هایی برای 10 مسئله‌ی حل‌نشده‌ی اردوش یافتند و پیشرفت جزئی قابل توجهی در 11 مسئله‌ی دیگر داشتند که پتانسیل هوش مصنوعی را برای کشف ریاضی به نمایش می‌گذارد @AndrewCurran_
مدل 27B C2S-Scale گوگل دیپ‌مایند، که بر اساس خانواده‌ی Gemma ساخته شده است، مسیر درمانی جدیدی برای سرطان را با کشف سیل‌می‌تاسرتیب (silmitasertib) به عنوان دارویی برای قابل مشاهده کردن تومورهای «سرد» برای سیستم ایمنی شناسایی کرد @GoogleDeepMind
برای اولین بار در تاریخ، روش‌های خودکار به عملکردی در حد رقابت با انسان در پیش‌بینی ساختار سه‌بعدی RNA دست یافتند، که تیم برنده از مدل‌سازی مبتنی بر الگوهای بهینه شده به جای یادگیری عمیق استفاده کرده بود @kaggle
متا مقاله‌ی جامعی را در مورد یادگیری تقویتی برای LLMها منتشر می‌کند که از 400,000 ساعت پردازش GPU استفاده کرده و قوانین مقیاس‌پذیری را برای عملکرد RL مشابه قوانین مقیاس‌پذیری پیش‌آموزش پیشنهاد می‌دهد @deedydas
استنفورد Ctrl-VI را معرفی می‌کند، یک روش نمونه‌برداری ویدئویی که کنترل‌های انعطاف‌پذیری را برای کاربر، از دستورات متنی گرفته تا مسیرهای دقیق دوربین و اشیا، فراهم می‌کند @StanfordAILab
LongCat-Audio-Codec به عنوان یک راه‌حل کدک صوتی متن‌باز شده که برای LLMهای گفتاری بهینه‌سازی شده است و دارای توکن‌های دوگانه، کارایی فوق‌العاده با سرعت 0.43 کیلوبیت بر ثانیه و یک رمزگشای پخش زنده بلادرنگ است @huggingface
معیار جهانی MMLU Lite در Kaggle راه‌اندازی می‌شود که 16 زبان را در بر می‌گیرد و شامل نمونه‌های حساس به فرهنگ و بی‌طرف است تا به پژوهشگران در شناسایی سوگیری‌های فرهنگی و زبانی کمک کند @kaggle

اخبار هوش مصنوعی در 2025-10-16

مدل‌های جدید هوش مصنوعی

علی‌بابا Qwen3-4B-SafeRL را منتشر می‌کند؛ مدلی هم‌راستا با ایمنی که از طریق یادگیری تقویتی (reinforcement learning) تنظیم شده و بهبود ایمنی قابل‌توجهی را در WildJailbreak (از 64.7 به 98.1) بدون به خطر انداختن عملکرد در وظایف عمومی به دست می‌آورد. @Alibaba_Qwen
علی‌بابا Qwen3-VL-Flash را در «علی‌بابا کلاود مدل استودیو» (Alibaba Cloud Model Studio) عرضه می‌کند؛ یک مدل بینایی-زبان (vision-language model) که حالت‌های استدلالی و غیر استدلالی را با پشتیبانی از زمینه‌ی فوق‌العاده طولانی (تا 256 هزار توکن) و درک بهبودیافته‌ی تصویر/ویدئو ترکیب می‌کند. @Alibaba_Qwen
اوپن‌ای‌آی (OpenAI) Sora 2 را به‌روزرسانی می‌کند؛ استوری‌بردهای آن اکنون در وب برای کاربران پرو (Pro) در دسترس هستند و قابلیت تولید ویدئو تا 15 ثانیه برای همه‌ی کاربران و 25 ثانیه برای کاربران پرو در وب افزایش یافته است. @OpenAI
گوگل Veo 3.1 را با رندرینگ (rendering) بافت و جزئیات سطح به طور قابل‌توجهی بهبودیافته منتشر می‌کند که مو، پارچه‌ها و سطوح را زنده‌تر و واقعی‌تر نشان می‌دهد. @GeminiApp
هوش مصنوعی گوگل DeepSomatic را برای تشخیص سرطان و مدل Gemma C2S-Scale 27B را که یک فرضیه‌ی جدید برای تبدیل تومورهای «سرد» به تومورهای «گرم» برای درمان با ایمونوتراپی (immunotherapy) ارائه کرده است، معرفی می‌کند. @GoogleAI

تحلیل صنعت

طبق گزارش‌ها، اوپن‌ای‌آی (OpenAI) به شرکت‌ها قابلیتی به نام «ورود با ChatGPT» را پیشنهاد کرده است که در آن استارتاپ‌ها می‌توانند هزینه‌های API را با کسر از محدودیت‌های ظرفیت ChatGPT مشتریان خود به جای پرداخت مستقیم به اوپن‌ای‌آی (OpenAI)، به مشتریان منتقل کنند. @btibor91
آنتروپیک (Anthropic) ادغام Claude با مایکروسافت 365 و قابلیت‌های جستجوی سازمانی را معرفی می‌کند که به کاربران امکان می‌دهد تا در شیرپوینت (SharePoint)، وان‌درایو (OneDrive)، اوت‌لوک (Outlook) و تیمز (Teams) برای دریافت پاسخ‌های سفارشی جستجو کنند. @AnthropicAI
مایکروسافت در گزارش دفاع دیجیتال 2025 خود، از افزایش سریع استفاده از هوش مصنوعی توسط دولت-ملت‌ها در سال گذشته خبر می‌دهد و نقش رو به رشد هوش مصنوعی را در تهدیدات امنیت سایبری برجسته می‌کند. @AndrewCurran_
استخدام در شرکت‌های بزرگ فناوری (BigTech) از دانشگاه‌های برتر ایالات متحده در 20 سال گذشته 3 تا 4 برابر رشد کرده و از کمتر از 10 درصد به بیش از 20 درصد رسیده است که این شرکت‌ها را به انتخاب شغلی شماره 1 برای اکثر فارغ‌التحصیلان دانشگاه‌های نخبه تبدیل کرده است. @deedydas
شرکت دیل (Deel) با ارزش‌گذاری 17.3 میلیارد دلاری، 300 میلیون دلار سرمایه جذب می‌کند و گزارش می‌دهد که سه سال است سوددهی داشته و درآمد تکرارشونده‌ی سالانه (ARR) آن از 1 میلیارد دلار فراتر رفته است. @TechCrunch

اخلاق و جامعه

طبق گزارش‌ها، مهندسان ارشد در کانال‌های خصوصی Slack ادعاهای مربوط به استفاده از هوش مصنوعی در مقیاس بزرگ را دروغ می‌دانند و به جای کنجکاوی در مورد قابلیت‌های هوش مصنوعی در محیط‌های سازمانی، انکار نشان می‌دهند. @clairevo
پینترست (Pinterest) کنترل‌های جدیدی را معرفی می‌کند که به کاربران امکان می‌دهد محتوای تولید‌شده توسط هوش مصنوعی را در فیدهای خود محدود کنند و برچسب‌های محتوای هوش مصنوعی را برای رسیدگی به نگرانی‌های کاربران در مورد محتوای مصنوعی، قابل‌مشاهده‌تر می‌کند. @TechCrunch
EFF (بنیاد مرزهای الکترونیکی) شکایتی را تنظیم کرده که در آن ادعا می‌شود دولت ترامپ در حال نظارت و مجازات غیرشهروندانی است که دیدگاه‌های شبکه‌های اجتماعی مورد پسند دولت را بیان می‌کنند، و این امر نگرانی‌هایی را در مورد نظارت مبتنی بر هوش مصنوعی ایجاد می‌کند. @TechCrunch

کاربردها

گوگل دیپ‌مایند (Google DeepMind) با «کامان‌ولت فیوژن سیستمز» (Commonwealth Fusion Systems) همکاری می‌کند تا از یادگیری تقویتی برای کشف استراتژی‌های کنترل بلادرنگ جدید استفاده کرده و توسعه‌ی انرژی هم‌جوشی را تسریع بخشد. @AndrewCurran_
اوپن‌ای‌آی (OpenAI) ابتکار «اوپن‌ای‌آی برای علم» (OpenAI for Science) را با استخدام یک فیزیکدان به عنوان اولین عضو، برای پیشبرد کشفیات علمی با استفاده از هوش مصنوعی راه‌اندازی می‌کند. @AndrewCurran_
ویمو (Waymo) با دوردش (DoorDash) همکاری می‌کند تا خدمات روبوتاکسی خود را به حوزه‌ی تحویل گسترش دهد که نشان‌دهنده‌ی بازگشت احتمالی به کاربردهای تحویل برای وسایل نقلیه‌ی خودران است. @TechCrunch
کایاک (Kayak) «حالت هوش مصنوعی» (AI Mode) را معرفی می‌کند که به مسافران امکان می‌دهد تا از طریق یک چت‌بات (chatbot) داخلی، سفرها را مستقیماً در پلتفرم اصلی خود تحقیق، برنامه‌ریزی و رزرو کنند. @TechCrunch
مایکروسافت اولین تجربه‌ی محیطی (ambient experience) تجاری موجود را معرفی می‌کند که برای گردش کار پرستاری ساخته شده تا به پرستاران کمک کند بر مراقبت از بیمار تمرکز کنند. @satyanadella
پرپلکسیتی هوش مصنوعی (Perplexity AI) ویژگی‌های یادگیری زبان را با کلمات تمرینی، اصطلاحات اولیه و فلش‌کارت‌ها برای عبارات پیشرفته در iOS و وب راه‌اندازی می‌کند. @perplexity_ai

پژوهش‌ها

اندرو اِنگ (Andrew Ng) تأکید می‌کند که بزرگترین پیش‌بینی‌کننده‌ی پیشرفت توسعه‌ی عامل‌های هوش مصنوعی، توانایی تیم در اجرای فرآیندهای منظم برای ارزیابی‌ها و تحلیل خطا است، نه استفاده از جدیدترین تکنیک‌های پرطرفدار. @AndrewYNg
آندری کارپاتی (Andrej Karpathy) آموزش مدل nanochat d32 را با هزینه‌ی 1000 دلار به پایان می‌رساند و به امتیاز CORE 0.31 (بالاتر از حدود 0.26 GPT-2) و بهبود GSM8K از حدود 8% به حدود 20% دست می‌یابد که قابلیت‌های مدل‌های میکرو (micro-model) را به نمایش می‌گذارد. @karpathy
مقاله‌ی پژوهشی «هنر مقیاس‌بندی محاسبات یادگیری تقویتی برای مدل‌های زبان بزرگ» (The Art of Scaling Reinforcement Learning Compute for LLMs) اولین تحلیل جامع از مقیاس‌بندی یادگیری تقویتی (RL) با مدل‌های زبان بزرگ را ارائه می‌دهد. @natolambert
MIT CSAIL رویکرد «جریان‌های گلس» (GLASS Flows) را معرفی می‌کند که هم‌ترازی متن-تصویر را برای مدل‌های مقیاس بزرگ در زمان استنتاج، با استفاده از معادلات دیفرانسیل معمولی (ODEs) برای شبیه‌سازی تغییرات تصادفی بدون نیاز به بازآموزی، افزایش می‌دهد. @MIT_CSAIL
هاگینگ‌فیس (Hugging Face) نسخه‌ی 2 «هاگینگ‌چت» (HuggingChat) را با 115 مدل متن‌باز (open source) در یک رابط کاربری واحد دوباره راه‌اندازی می‌کند و «هاگینگ‌چت اُمنی» (HuggingChat Omni) را برای انتخاب خودکار مدل در بین ارائه‌دهندگان مختلف معرفی می‌کند. @reach_vb
مدل بازگشت کوچک (Tiny Recursion Model) یا TRM، به 40% در ARC-AGI-1 با هزینه‌ی 1.76 دلار به ازای هر وظیفه و 6.2% در ARC-AGI-2 با هزینه‌ی 2.10 دلار به ازای هر وظیفه دست می‌یابد و پژوهش متن‌باز را به جامعه‌ی علمی ارائه می‌دهد. @arcprize
ورلد لبز (World Labs) مدل RTFM را منتشر می‌کند؛ یک مدل جهانی (World Model) مولد بلادرنگ، پایدار و سه‌بعدی ثابت که بر روی یک کارت گرافیک H100 اجرا می‌شود. @drfeifei

اخبار هوش مصنوعی در 2025-10-15

مدل‌های جدید هوش مصنوعی

آنتروپیک (Anthropic) مدل «کلاد هایکو ۴.۵» (Claude Haiku 4.5) را منتشر کرد که عملکردی برابر با «سونت ۴» (Sonnet 4) در کدنویسی دارد؛ اما با یک‌سوم هزینه و بیش از دو برابر سرعت @claudeai
گوگل (Google) مدل تولید ویدیوی «وئو ۳.۱» (Veo 3.1) را با واقع‌گرایی افزایش‌یافته، صدای غنی‌تر، قابلیت‌های بسط صحنه، کنترل روایی بهتر و ویژگی‌های ویرایشی دقیق‌تر عرضه کرد @GoogleDeepMind
علی‌بابا (Alibaba) اعلام کرد که مدل‌های «کوئن ۳-وی‌ال» (Qwen3-VL) اکنون در پلتفرم‌های مختلفی از جمله LM Studio، Ollama cloud، Imarena.ai، MLX-VLM و Kaggle در دسترس هستند @Alibaba_Qwen
علی‌بابا (Alibaba) ویژگی «حافظه‌ی گفت‌وگوی کوئن» (Qwen Chat Memory) را معرفی کرد که خاطرات معناداری را درباره‌ی کاربران ذخیره می‌کند و تعاملات گذشته را به خاطر می‌آورد تا تجربه‌های شخصی‌سازی‌شده‌ی عمیقی ایجاد کند @Alibaba_Qwen
گوگل (Google) مدل پایه‌ی «سی‌۲اس-اسکیل ۲۷بی» (C2S-Scale 27B) را منتشر کرد که با همکاری دانشگاه ییل (Yale University) و بر اساس «جما» (Gemma) ساخته شده است. این مدل فرضیه‌ی جدیدی درباره‌ی رفتار سلولی سرطان تولید کرد که به صورت تجربی در سلول‌های زنده تأیید شد @sundarpichai
اوپن‌ای‌آی (OpenAI) دسترسی «چت‌جی‌پی‌تی گو» (ChatGPT Go) را به ۸۹ کشور در سراسر آفریقا، خاورمیانه، آسیای مرکزی، آسیا، کارائیب و آمریکای لاتین گسترش داد @nickaturley
مایکروسافت (Microsoft) اعلام کرد که «سورا ۲» (Sora 2) اکنون برای شرکت‌های Azure Foundry در دسترس است @asha_shar

تحلیل صنعت

درآمد سالانه‌ی تکرارشونده‌ی آنتروپیک (Anthropic) در ماه آگوست به ۵ میلیارد دلار رسید، این ماه به ۷ میلیارد دلار نزدیک می‌شود و پیش‌بینی می‌شود تا پایان سال به ۹ میلیارد دلار و برای سال آینده به ۲۰ تا ۲۶ میلیارد دلار برسد @AndrewCurran_
پژوهش‌ها نشان می‌دهد که ابزارهای هوش مصنوعی مولد، افزایش قابل توجهی در درآمد یک پلتفرم تجارت الکترونیک بالغ، در حوزه‌ی خدمات مشتری و کاربردهای بازاریابی ایجاد کرده‌اند @emollick
انویدیا (NVIDIA) «DGX Spark» را به عنوان یک ماشین توسعه‌ی نرم‌افزارمحور معرفی می‌کند که زیبا و به اندازه‌ی کافی جمع‌وجور برای استفاده‌ی رومیزی است و بر هویت انویدیا به عنوان یک شرکت نرم‌افزاری تأکید دارد @soumithchintala
متا (Meta) از احداث یک مرکز داده‌ی جدید ۱ گیگاواتی در ال‌پاسو، تگزاس خبر داد تا از ارائه‌ی مدل‌های هوش مصنوعی درجه‌یک و تجربه‌های محصولی پشتیبانی کند؛ زیرا آن‌ها در حال حرکت به سمت «فراهوش» (superintelligence) هستند @fb_engineering
آرم (Arm) با متا (Meta) همکاری می‌کند تا سیستم‌های هوش مصنوعی این شرکت شبکه‌ی اجتماعی را در بحبوحه‌ی توسعه‌ی بی‌سابقه‌ی زیرساخت‌ها بهبود بخشد @TechCrunch

اخلاق و جامعه

یک نظرسنجی جهانی سطوح متفاوتی از اعتماد را به توانایی کشورهای مختلف در تنظیم مؤثر هوش مصنوعی نشان می‌دهد؛ ایالات متحده در صدر فهرست افرادی قرار دارد که نسبت به افزایش استفاده از هوش مصنوعی در زندگی روزمره، بیش از هیجان‌زدگی، نگران هستند @AndrewCurran_
مدیرعامل اوپن‌ای‌آی (OpenAI) تغییرات آتی سیاست‌ها را روشن کرد و بر اولویت‌بندی ایمنی بر حریم خصوصی و آزادی برای نوجوانان تأکید داشت، در حالی که با کاربران بزرگسال مانند بزرگسالان رفتار می‌کند و آزادی بیشتری برای محتوای مناسب بزرگسالان فراهم می‌آورد؛ اما محدودیت‌ها را برای محتوای مضر حفظ می‌کند @sama
یکی از همکاران AI Now Institute تحلیل می‌کند که چگونه روایت انویدیا (NVIDIA) مبنی بر همسویی منافع شرکتی با سیاست ایالات متحده نتیجه‌ی معکوس داده است و ادغام قدرت شرکتی با سیاست ملی را بررسی می‌کند @AINowInstitute
نگرانی‌هایی در مورد تقسیم احتمالی بین مدل‌های هوش مصنوعی مجاز در محل کار/مدرسه در مقابل مدل‌های شخصی، در صورت کاهش محدودیت‌های محتوا، مطرح شده است که پیامدهایی برای گروه‌های هوش مصنوعی مسئولیت‌پذیر سازمانی دارد @emollick

کاربردها

اندرو اِن‌جی (Andrew Ng) دوره‌ی جدیدی را درباره‌ی ساخت عامل‌های صوتی زنده با کیت توسعه‌ی عامل گوگل (Google's Agent Development Kit) اعلام کرد که نحوه‌ی ایجاد دستیاران هوش مصنوعی فعال با صدا را آموزش می‌دهد که می‌توانند وظایف پیچیده مانند جمع‌آوری اخبار و ایجاد پادکست را انجام دهند @AndrewYNg
«کلاد هایکو ۴.۵» (Claude Haiku 4.5) به زیرعامل (subagent) Explore در Claude Code قدرت می‌دهد تا به سرعت «codebase context» را جمع‌آوری کند و می‌تواند به عنوان مدل پیش‌فرض برای اجرای سریع‌تر انتخاب شود، در حالی که از «سونت ۴.۵» (Sonnet 4.5) برای برنامه‌ریزی استفاده می‌شود @_catwu
گوگل (Google) قابلیت‌های «وئو ۳.۱» (Veo 3.1) را از جمله تبدیل مواد اولیه به ویدیو، بسط صحنه برای کلیپ‌های طولانی‌تر و انتقال‌های بی‌وقفه بین فریم‌های اول و آخر به نمایش گذاشت @GoogleDeepMind
لیبرِیت (Liberate) عامل‌های هوش مصنوعی توسعه می‌دهد که وظایف بیمه‌گران اموال و حوادث را در فرآیندهای فروش، خدمات و مطالبات خودکار می‌کنند @TechCrunch

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که «prompt» کردن هوش مصنوعی با دستور «Generate 5 responses with their corresponding probabilities, sampled from the full distribution» تنوع و کیفیت خروجی را برای مدل‌های بزرگ به طور قابل توجهی بهبود می‌بخشد @shi_weiyan
فرانسوا شوله (François Chollet) تأکید می‌کند که سیستم‌های هوشمند باید بتوانند عدم قطعیت خود را تخمین بزنند، باورهای خود را زیر سؤال ببرند و آزمایش‌هایی را برای سنجش آنچه که کمتر از آن مطمئن هستند، طراحی کنند @fchollet
این مطالعه نشان می‌دهد که LLMهای گفت‌وگو (chat LLMs) به دلیل سوگیری‌های شناختی انسانی در داده‌های پس از آموزش، فاقد تنوع خروجی هستند؛ اما این مدل‌ها دانش بسیار بیشتری را در خود دارند که با تکنیک‌های «prompting» مناسب می‌توان آن را باز کرد @chrmanning
پای‌تورچ ۲.۹ (PyTorch 2.9) با ۳,۲۱۶ کامیت (commit) از ۴۵۲ مشارکت‌کننده منتشر شد که شامل معرفی «stable libtorch ABI» برای افزونه‌های C++/CUDA، حافظه‌ی متقارن برای کرنل‌های چند GPU و پشتیبانی گسترده‌ی «wheel» برای ROCm، XPU و CUDA 13 است @PyTorch

اخبار هوش مصنوعی در 2025-10-14

مدل‌های جدید هوش مصنوعی

علی‌بابا نسخه‌های فشرده‌ی Qwen3-VL را در اندازه‌های 4B و 8B با هر دو مدل Instruct و Thinking منتشر کرد که مصرف VRAM کمتری دارند، در حالی که قابلیت‌های کامل را حفظ می‌کنند و از مدل‌هایی مانند Gemini 2.5 Flash Lite و GPT-5 Nano بهتر عمل می‌کنند. @Alibaba_Qwen
انویدیا DGX Spark را معرفی کرد، کوچک‌ترین سوپرکامپیوتر هوش مصنوعی دنیا که بر اساس معماری Grace Blackwell ساخته شده و پردازنده‌های گرافیکی (GPU)، پردازنده‌های مرکزی (CPU)، شبکه‌سازی، کتابخانه‌های CUDA و نرم‌افزار هوش مصنوعی انویدیا را برای توسعه‌ی هوش مصنوعی عامل‌محور و فیزیکی یکپارچه می‌کند. @nvidianewsroom

تحلیل صنعت

OpenAI خرید سخت‌افزار شتاب‌دهنده‌ی هوش مصنوعی به ارزش 10 گیگاوات را از Broadcom اعلام کرد که نشان‌دهنده‌ی سرمایه‌گذاری عظیم در زیرساخت‌ها است. @TechCrunch
وال‌مارت با OpenAI همکاری می‌کند تا امکان خرید مستقیم محصول از طریق ChatGPT را فراهم کند و به کاربران اجازه می‌دهد حساب‌های خود را متصل کرده، اقلام را مرور کنند و پرداخت را در داخل چت‌بات انجام دهند. @TechCrunch
Anthropic همکاری خود را با Salesforce گسترش می‌دهد و Claude را به یک مدل ترجیحی در Agentforce برای صنایع تحت نظارت تبدیل می‌کند و ادغام با Slack را عمیق‌تر می‌کند. @AnthropicAI
Perplexity در هند به اپلیکیشن شماره یک در پلی‌استور در تمام دسته‌ها تبدیل شده است و اکنون یک گزینه‌ی جستجوی پیش‌فرض برای کاربران فایرفاکس است. @AravSrinivas
Reducto مبلغ 75 میلیون دلار در دور دوم تامین مالی (Series B) به رهبری a16z جذب کرد؛ این شرکت بیش از 1 میلیارد صفحه را پردازش کرده و حجم ماهانه‌ی خود را در تنها پنج ماه پس از دور اول تامین مالی (Series A)، شش برابر افزایش داده است. @aditabrm
گوگل اولین مرکز هوش مصنوعی خود را در ویشاکاپاتنام، هند، اعلام کرد که ظرفیت محاسباتی در مقیاس گیگاوات، دروازه‌ی بین‌المللی زیردریایی و زیرساخت انرژی در مقیاس بزرگ را ترکیب می‌کند. @sundarpichai
یک تغییر پارادایم در هوش مصنوعی مشاهده شده است، از APIهای LLM عمومی به سمت شرکت‌هایی که مدل‌های تخصصی خود را بر پایه‌ی متن باز آموزش داده و اجرا می‌کنند، با 1 میلیون مخزن (repo) جدید در Hugging Face در 90 روز گذشته. @ClementDelangue
بر اساس ارزیابی‌های METR، طول وظایف هوش مصنوعی برای عامل‌های خودمختار هر چند ماه دو برابر می‌شود؛ که در حال حاضر 2 ساعت است و پتانسیل رسیدن به 2 روز در سال آینده و 2 هفته در دو سال آینده را دارد. @a16z

اخلاق و جامعه

موسسه‌ی AI Now از مکانیزم‌های محافظتی (guardrails) به‌راحتی فریب‌خورنده‌ی OpenAI انتقاد می‌کند و بر نیاز به آزمایش قوی قبل از استقرار مدل‌های هوش مصنوعی، پیش از آن که آسیب قابل توجهی ایجاد کنند، تاکید دارد. @AINowInstitute
OpenAI برنامه‌های خود را برای کاهش محدودیت‌های ChatGPT در هفته‌های آینده اعلام کرد که امکان استفاده از شخصیت انسانی‌تر و ایموجی‌ها را فراهم می‌کند؛ محتوای بزرگسالان برای کاربران تاییدشده نیز در ماه دسامبر، به عنوان بخشی از اصل «با کاربران بزرگسال، مانند بزرگسالان رفتار کنید»، ارائه خواهد شد. @sama
Anthropic اولین پیشنهادات سیاستی اقتصاددانان و پژوهشگران را به اشتراک می‌گذارد که اثرات اقتصادی بالقوه‌ی هوش مصنوعی قدرتمند و پاسخ‌های سیاستی را بررسی می‌کنند. @AnthropicAI
OpenAI یک «شورای متخصص رفاه و هوش مصنوعی» با هشت عضو شامل کارشناسان سلامت روان و فناوری تاسیس کرد تا توسعه‌ی مسئولانه‌ی هوش مصنوعی را راهنمایی کند. @OpenAI

کاربردها

مایکروسافت قابلیت «تکمیل فرمول» را در اکسل معرفی کرد که در آن Copilot به‌طور فعال فرمول‌هایی را بر اساس محتوای صفحه، هنگامی که کاربران «=» را تایپ می‌کنند، پیشنهاد می‌دهد. @satyanadella
مایکروسافت Copilot Vision را از طریق تجربه‌ی Moto AI در دستگاه‌های Moto ادغام می‌کند و به کاربران این امکان را می‌دهد که مشکلات را نشان دهند، به جای آنکه فقط آن‌ها را توصیف کنند. @Copilot
گوگل قابلیت‌های طراحی تراشه‌ی هوش مصنوعی را از طریق AlphaChip به نمایش می‌گذارد و آینده‌ای را متصور می‌شود که در آن روش‌های هوش مصنوعی کل فرآیند طراحی تراشه را خودکار کرده و چرخه‌های طراحی را به شدت سرعت می‌بخشند. @AndrewCurran_
اپلیکیشن Gemini یک گردش کار خلاقانه را به نمایش می‌گذارد که Nano Banana را برای تصاویر سفارشی حیوانات خانگی، Storybook را برای ایجاد روایت و Veo 3 را برای انیمیشن ویدیویی ترکیب می‌کند. @GeminiApp
اپلیکیشن Claude عملکردی برتر را به عنوان یک دستیار شخصی نشان می‌دهد، به‌ویژه با ادغام Gmail و Google Calendar در مقایسه با سایر مدل‌های هوش مصنوعی. @emollick
یک توسعه‌دهنده گزارش می‌دهد که 55 درخواست پول (PR) از Devin و 896 گفتگوی Cursor را ادغام کرده که منجر به 16 PR ادغام‌شده بدون هیچ گونه توقف شده است و قابلیت‌های کدنویسی هوش مصنوعی آماده‌ی تولید را به نمایش می‌گذارد. @clairevo
Coco Robotics در جهت خودکارسازی ناوگان ربات‌های تحویل‌دهنده کار می‌کند و از میلیون‌ها مایل داده‌ی جمع‌آوری‌شده برای ناوبری خودمختار استفاده می‌کند. @TechCrunch

پژوهش‌ها

Karpathy نانوچت را منتشر کرد که آموزش LLM را تنها در چند خط کد ممکن می‌سازد و نشان‌دهنده‌ی رویکردی ساده‌شده به توسعه‌ی مدل است. @simonw
پژوهشگران استنفورد SuperDec را توسعه دادند، یک بازنمایی صحنه‌ی سه‌بعدی بسیار فشرده که میلیون‌ها Gaussian را با تنها صدها شیء اولیه جایگزین می‌کند و برای استدلال انتزاعی و برنامه‌ریزی در محیط سه‌بعدی ایده‌آل است. @FrancisEngelman
فیزیکدانان MIT دقت ساعت اتمی را با کاهش نویز کوانتومی که «تیک‌تیک» اتمی را مبهم می‌کند، بهبود بخشیدند؛ این پیشرفت کاربردهایی برای تراکنش‌های آنلاین و GPS دارد. @MIT
مایکروسافت ریسرچ پروتکل «رد تیمینگ» را برای آزمایش و ایمن‌سازی ابزارهای غربالگری امنیت زیستی DNA توسعه داد که به ایمنی هوش مصنوعی در کاربردهای بیولوژیکی می‌پردازد. @MSFTResearch
پژوهشگران Stanford HAI پروژه‌هایی را ارائه می‌دهند که شامل مدل جهانی مغز انسان برای پزشکی شخصی‌سازی‌شده، تحلیل هوش مصنوعی از تصاویر دوربین‌های بدن پلیس برای شفافیت، و دوقلوهای سلولی دیجیتال برای شبیه‌سازی پاسخ داروها است. @StanfordHAI

اخبار هوش مصنوعی در 2025-10-13

مدل‌های جدید هوش مصنوعی

Qwen3-VL-235B-A22B-Instruct شرکت علی‌بابا با ۴۸ درصد سهم بازار، به جایگاه اول در OpenRouter برای پردازش تصویر دست یافت @Alibaba_Qwen
مایکروسافت مدل MAI-Image-1 را منتشر کرد که در LMArena رتبه‌ی نهم را کسب کرده و تعادلی بین سرعت تولید و کیفیت ایجاد می‌کند @mustafasuleyman
گوگل از Gemini 2.5 Native Audio Thinking به‌عنوان مدل جدید و پیشرو Speech to Speech (گفتار به گفتار) رونمایی کرد که در معیار Big Bench Audio به امتیاز ۹۲ درصد دست یافت و مرزهای جدیدی را برای استدلال گفتاری بومی تعیین کرد @sundarpichai
گوگل نسخه‌ی ارتقایافته‌ی قابلیت «مرور کلی ویدئویی» را برای NotebookLM با تصاویر بصری جدیدی که توسط مدل تولیدکننده‌ی تصویر Nano Banana ارائه می‌شود، عرضه کرد و فرمت «خلاصه» را برای جمع‌بندی‌های سریع معرفی کرد @demishassabis

تحلیل صنعت

OpenAI همکاری با Broadcom را برای تولید ۱۰ گیگاوات شتاب‌دهنده‌ی سفارشی که توسط OpenAI طراحی شده‌اند، اعلام کرد. Broadcom پس از ۱۸ ماه کار مشترک، آن‌ها را توسعه خواهد داد @AndrewCurran_
جی‌پی‌مورگان سرمایه‌گذاری ۱۰ میلیارد دلاری در سهام مستقیم و سرمایه‌گذاری خطرپذیر را در شرکت‌های آمریکایی که برای امنیت ملی حیاتی تلقی می‌شوند، اعلام کرد و نگرانی‌های خود را در مورد اتکا به منابع غیرقابل اعتماد مواد معدنی حیاتی و تولید مطرح کرد @AndrewCurran_
گوگل سرمایه‌گذاری بیش از ۹ میلیارد دلاری در کارولینای جنوبی تا سال ۲۰۲۷ را به‌عنوان بخشی از سرمایه‌گذاری مستمر در نوآوری هوش مصنوعی آمریکا اعلام کرد @sundarpichai
نسخه‌ی جدید Imagine 0.9 از Grok یک ارتقای چشمگیر است و سرعت توسعه‌ی بالای xAI نشان می‌دهد که جنگ برنامه‌های ویدئویی هوش مصنوعی زودتر از حد انتظار فرا می‌رسد @AndrewCurran_
مدل‌های در سطح Sora احتمالاً از طریق انحصاری‌سازی و سانسور کمتر رقابت خواهند کرد، به‌طوری که شرکت‌هایی مانند دیزنی ممکن است حقوق حضور افتخاری شخصیت‌ها را در ویدئوهای تولیدشده توسط کاربران اعطا کنند @AndrewCurran_
توسعه‌دهندگانی که نرم‌افزار تولیدی ساخته‌اند و هیچ وابستگی به آزمایشگاه‌های هوش مصنوعی ندارند، به‌طور فزاینده‌ای گزارش می‌دهند که ابزارهای هوش مصنوعی کمک زیادی به کارشان می‌کنند، که نشان‌دهنده‌ی تغییر قابل توجهی در نظرات کارشناسان است @GergelyOrosz

اخلاق و جامعه

دلویت در استرالیا به دلیل ارائه‌ی کاری مملو از استنادات نادرست هوش مصنوعی، مورد بازخواست قرار گرفت که بر نیاز به پاسخگویی در محتوای تولیدشده توسط هوش مصنوعی تأکید می‌کند @TechCrunch
لایحه‌ی SB 243 کالیفرنیا برای حفاظت از کودکان و کاربران آسیب‌پذیر در برابر آسیب‌های مرتبط با چت‌بات‌های همراه هوش مصنوعی طراحی شده است @TechCrunch
انتظار می‌رود یک رقابت تسلیحاتی در زمینه‌ی سانسور میان مدل‌های ویدئویی هوش مصنوعی شکل بگیرد، به‌طوری که مدل‌های در سطح Sora بدون محدودیت، نشان‌دهنده‌ی یک گام مهم به سوی تکینگی رسانه‌ای هستند @AndrewCurran_
«نظریه‌ی ذهن» برای هوش مصنوعی به نظر می‌رسد مهارتی مستقل از تخصص حرفه‌ای باشد و شکاف‌های درکی بین کارشناسانی که از هوش مصنوعی بهره می‌برند و آن‌هایی که بهره نمی‌برند، ایجاد می‌کند @emollick

کاربردها

مایکروسافت همکاری‌های M365 Copilot با شرکا را به نمایش گذاشت؛ از جمله ServiceNow برای فرآیندهای خودکار بین‌بخشی، Snowflake برای پرس‌وجوهای داده با زبان طبیعی و LexisNexis برای تهیه‌ی پیش‌نویس اسناد حقوقی @satyanadella
مایکروسافت حالت «مطالعه و یادگیری» کوپایلوت را راه‌اندازی کرد که با ترجیحات یادگیری تطبیق می‌یابد، کمک هدایت‌شده‌ای را بدون لو دادن پاسخ‌ها ارائه می‌دهد و از محتوای آپلودشده آزمون تولید می‌کند @Copilot
Salesforce پلتفرم ارتقایافته‌ی Agentforce را معرفی کرد که برای کمک به سازمان‌ها در ساخت و استقرار عامل‌های هوش مصنوعی طراحی شده است @TechCrunch
دانشجوی دکترای MIT الگوریتم‌های بینایی کامپیوتری از جمله «CODA» را توسعه داد تا به نظارت بر اکوسیستم‌های آسیب‌پذیر و حمایت از تلاش‌های حفاظت از حیات وحش کمک کند @MIT_CSAIL
Anduril Industries از سیستم محاسباتی کلاه ایمنی‌دار «EagleEye» رونمایی کرد که برای تبدیل سربازان به جنگجویان تقویت‌شده با هوش مصنوعی طراحی شده است @TechCrunch
محققان استنفورد در حال تولید MRIهای مصنوعی هستند که می‌توانند آینده‌ی عصبی را بر اساس عادات فعلی شبیه‌سازی کنند و پیش‌بینی‌های پیری مغز را به‌طور فزاینده‌ای محتمل می‌سازند @StanfordHAI

پژوهش‌ها

آندری کارپاتی، nanochat را منتشر کرد؛ یک کدبیس (codebase) مینیمال ۸۰۰۰ خطی برای آموزش مدل‌های مشابه ChatGPT از پایه که نشان می‌دهد یک LLM کاربردی را می‌توان با هزینه‌ی ناچیز ۱۰۰ دلار و در ۴ ساعت بر روی GPUهای ابری آموزش داد @karpathy
پروفسور علوم کامپیوتر کلمبیا، ویشال میسرا، استدلال می‌کند که LLMها نمی‌توانند علوم جدیدی را کشف کنند، زیرا آن‌ها جهان را به منیفولدهای بیزی (Bayesian manifolds) فشرده می‌کنند و هنگام استدلال خارج از داده‌های آموزشی، دچار توهم می‌شوند؛ در حالی که AGI واقعی به توانایی ایجاد منیفولدهای کاملاً جدید نیاز دارد @a16z
جک کلارک از Anthropic معتقد است که سیستم‌های هوش مصنوعی کنونی با استفاده از معماری موجود و بدون کاهش بازده، به پیشرفت ادامه خواهند داد و تغییرات تحول‌آفرین را نزدیک‌تر خواهند کرد @AndrewCurran_
پژوهش‌ها نشان می‌دهد که مصرف آب هوش مصنوعی برای تمامی مراکز داده در ایالات متحده، از ۵۰ میلیون گالن در روز صرفاً برای خنک‌سازی تا ۶۲۸ میلیون گالن (شامل تبخیر سدها) متغیر است که به‌طور قابل توجهی کمتر از مصرف آب زمین‌های گلف است @emollick
استخراج‌کننده‌ی جدید PII ژاپنی LFM2 با تنها ۳۵۰ میلیون پارامتر، عملکردی هم‌تراز با GPT-5 از نظر کیفیت ارائه می‌دهد، در حالی که فوق‌العاده سریع است @huggingface

اخبار هوش مصنوعی در 2025-10-12

مدل‌های جدید هوش مصنوعی

GPT-5 Pro قابلیت‌های جست‌وجوی فراانسانی در متون را با حل مسئله‌ی اردوش شماره‌ی ۳۳۹ نشان می‌دهد، که به عنوان حل‌نشده فهرست شده بود اما در واقع ۲۰ سال پیش حل شده بود @SebastienBubeck
xAI اپلیکیشن گروک را با «TRON mode» جدید که شخصیت «اَنی» را به نمایش می‌گذارد، به‌روزرسانی می‌کند @xai

تحلیل صنعت

NVIDIA در دو سال گذشته در بیش از ۸۰ استارتاپ هوش مصنوعی سرمایه‌گذاری کرده است و از ثروت فزاینده‌ی خود که از رونق هوش مصنوعی به دست آورده، بهره می‌برد @TechCrunch
هر ابزار آن‌کال و پیجینگ اکنون خود را به عنوان «پلتفرم هوش مصنوعی» یا «پلتفرم عملیاتی مبتنی بر هوش مصنوعی» معرفی می‌کند که نشان‌دهنده‌ی پذیرش گسترده‌ی بازاریابی هوش مصنوعی در ابزارهای سازمانی است @GergelyOrosz
جِمنای با نرخ رشد ماهانه‌ی بیش از ۳ برابرِ Perplexity (که در جایگاه دوم قرار دارد)، پیشتاز ابزارهای GenAI است؛ در حالی که Grok رشد منفی از خود نشان می‌دهد و DeepSeek اولین رشد مثبت خود را از ماه فوریه تجربه می‌کند @Similarweb
پذیرش هوش مصنوعی در سازمان‌ها با عوامل محدودکننده‌ی قابل توجهی روبه‌رو است، از جمله توانایی انسانی و سازمانی برای جذب تغییرات، مقررات و بودجه‌های سازمانی، فراتر از صرفاً زیرساخت‌ها و پیشرفت‌های الگوریتمی @sriramk

کاربردها

موارد استفاده‌ی نوظهور «AI عمیق» که در آن متخصصان وظایف پیچیده و باارزش را در حوزه‌ی تخصصی خود خودکار کرده‌اند، اگرچه گسترش موارد استفاده‌ی خاص، کندتر از پذیرش عمومی هوش مصنوعی خواهد بود @emollick
می‌توان به Claude Code دستور داد تا «از زیرعامل‌ها استفاده کند» و چندین زیرعامل موازی را برای کارهای پیچیده فعال کند که هر یک دارای زمینه‌ی جدیدی هستند @simonw
هوش مصنوعی کنونی برای اکثر وظایفی که تا چند دقیقه طول می‌کشند، به اندازه‌ی کافی توانمند به نظر می‌رسد و شکست‌ها اغلب به دلیل context ناکافی است تا محدودیت‌های قابلیتی @gdb
سم آلتمن پیش‌بینی می‌کند که Codex به‌طور چشمگیری تولید نرم‌افزار را متحول خواهد کرد، به طوری که تصور این که توسعه‌ی نرم‌افزار تا پایان سال ۲۰۲۶ چگونه خواهد بود، دشوار است @sama

پژوهش‌ها

LLMها اکنون بر مسابقات دشوار STEM (علوم، فناوری، مهندسی و ریاضیات) تسلط دارند، از جمله المپیاد جهانی ریاضی، المپیاد جهانی نجوم و اخترفیزیک و المپیاد جهانی انفورماتیک، با وجود این که تنها یک سال پیش در ریاضیات ضعیف بودند @emollick
تحلیل صنعت نشان می‌دهد که OpenAI بهترین قابلیت‌های پس‌آموزش/یادگیری تقویتی را دارد که بر روی پیش‌آموزش‌های ضعیف‌تر اعمال شده‌اند، در حالی که جِمنای دارای پیش‌آموزش فوق‌العاده‌ای است که ساخت مدل‌های استدلالی را به طرز شگفت‌آوری آسان کرده است @natolambert
۵ مدل برتر هوش مصنوعی متن‌باز با بیشترین تأثیر به ترتیب: DeepSeek R1 (اکوسیستم مدل‌های متن‌باز چینی را شعله‌ور کرد)، LLaMA (پژوهش RLHF پس از ChatGPT را ممکن ساخت)، Mistral 7B (علاقه‌ی جامعه را به finetuning برانگیخت)، LLaMA 3.1 (نزدیک‌ترین مدل‌های متن‌باز به لبه‌ی فناوری)، و Qwen 3 (نشان‌دهنده‌ی تسلط فعلی Qwen در تحقیق و توسعه) @natolambert

اخبار هوش مصنوعی در 2025-10-11

مدل‌های جدید هوش مصنوعی

علی‌بابا به‌روزرسانی‌هایی را برای Qwen3-Omni منتشر می‌کند که باگی در تشخیص صدا را رفع می‌کند؛ این باگ قبلاً آن را به تنها ۳۰ ثانیه‌ی اول صدا محدود کرده بود @Alibaba_Qwen
علی‌بابا به‌روزرسانی‌های بزرگی را برای Qwen Code نسخه‌ی ۰.۰.۱۲ تا ۰.۰.۱۴ اعلام می‌کند که شامل حالت «برنامه‌ریزی» (Plan Mode) برای طرح‌های پیاده‌سازی ارائه‌شده توسط هوش مصنوعی، قابلیت دید هوشمند (Vision Intelligence) با سوئیچ خودکار به Qwen3-VL-Plus (ورودی ۲۵۶K/خروجی ۳۲K)، و یکپارچه‌سازی Zed با احراز هویت OAuth است @Alibaba_Qwen

تحلیل صنعت

داریو آمودی، مدیر عامل Anthropic، با نخست‌وزیر هند، مودی، دیدار می‌کند تا درباره‌ی گسترش به هند گفتگو کند؛ جایی که استفاده از Claude Code از ماه ژوئن ۵ برابر افزایش یافته است و نقش حیاتی هند را در استقرار هوش مصنوعی در آموزش، مراقبت‌های بهداشتی و کشاورزی برجسته می‌کند @DarioAmodei
پذیرش فناوری هوش مصنوعی سریع‌تر از موج‌های فناوری قبلی، از جمله اینترنت، گوشی‌های هوشمند و رایانش ابری، در حال گسترش است و پنجره‌ی فرصت کوچک‌تری را برای متخصصان فناوری جهت ایجاد تأثیر فراهم می‌کند @GergelyOrosz
پژوهش‌ها نشان می‌دهد که هوش مصنوعی در حال تسریع بهره‌وری علمی است؛ به‌طوری که کاربران GenAI در سال ۲۰۲۳ افزایش ۱۵ درصدی بهره‌وری را تجربه کرده‌اند که در سال ۲۰۲۴ به ۳۶ درصد رسیده است، و همچنین کیفیت انتشارها را بهبود می‌بخشد @emollick
مهندسان نرم‌افزار معتبر با بیش از ۲۰ سال تجربه، در حال استفاده‌ی روزمره از ابزارهای کدنویسی هوش مصنوعی هستند که نشان می‌دهد این ابزارها برای پذیرش حرفه‌ای به کیفیت و قابلیت اطمینان کافی دست یافته‌اند @GergelyOrosz
قراردادهای هوش مصنوعی سازمانی در حال تسریع هستند؛ با رونمایی Zendesk از عامل‌های هوش مصنوعی که قادر به حل ۸۰ درصد از مسائل خدمات مشتری هستند، و همچنین اعلام مشارکت‌های استراتژیک بین Anthropic-IBM و Deloitte @TechCrunch
گزارش شده است که اندرو تولاک، پژوهشگر هوش مصنوعی، از سمت خود کناره‌گیری کرده است که نشان‌دهنده‌ی جابجایی مداوم استعدادها در صنعت هوش مصنوعی است @TechCrunch

اخلاق و جامعه

شرکت Deloitte در استرالیا به دلیل ارائه‌ی کاری حاوی استنادات نادرست هوش مصنوعی مورد بازخواست قرار گرفت که سؤالاتی را درباره‌ی مسئولیت‌پذیری شرکتی در تأیید محتوای تولیدشده توسط هوش مصنوعی مطرح می‌کند @TechCrunch
Sora متعلق به OpenAI میلیون‌ها خالق محتوای جدید را قادر می‌سازد تا محتوا تولید کنند و قابلیت‌های ساخت ویدئو را دموکراتیزه می‌کند @gdb

کاربردها

Sierra قابلیت‌های تماس خروجی هوش مصنوعی را برای تعامل فعال با مشتری در فروش خدمات مالی و تأیید حساب معرفی می‌کند @btaylor
پژوهشگران استنفورد «کارتیج‌ها» (Cartridges) را توسعه می‌دهند؛ ماژول‌های حافظه‌ی فشرده‌ای که زمینه‌ی کاربری را به‌صورت آفلاین مطالعه می‌کنند تا پاسخ‌های سریع‌تر ربات‌های هوش مصنوعی را ممکن سازند و همزمان نیازهای حافظه و هزینه را کاهش دهند @StanfordHAI
کاربران می‌توانند با Sora پادکست‌هایی را در هر موضوعی تولید کنند؛ با شروع درخواست‌ها (prompts) با عبارت «A four way split screen podcast» و هدایت بحث‌ها یا افزودن دیالوگ‌های سفارشی @AndrewCurran_
جسی وینسنت سفارشی‌سازی‌های خلاقانه‌ای را برای Claude Code با استفاده از سیستم پلاگین جدید به نمایش می‌گذارد؛ از جمله استفاده از نمودارهای Graphviz DOT به عنوان زبان درخواست‌نویسی (prompting language) @simonw
حالت مفسر کد Claude شامل یک پوشه‌ی /mnt/skills/public/ است که حاوی دستورالعمل‌های درخواست و ابزارهای پایتون برای دستکاری فایل‌های PDF، DOCX، PPTX و XLSX است @simonw

پژوهش‌ها

GPT-5 و Gemini 2.5 Pro عملکردی در حد مدال طلا در المپیاد جهانی نجوم و اخترفیزیک (IOAA) کسب می‌کنند که قابلیت‌های در سطح جهانی را در فیزیک پیشرفته نشان می‌دهد @deedydas
معیار معمای ARC 3 ویژگی‌های جالبی را نشان می‌دهد: برای کودکان قابل دسترس‌تر از ARC 1 و ARC 2 است، اما به طور قابل توجهی برای سیستم‌های هوش مصنوعی فعلی دشوارتر است @fchollet
GPT-OSS 20B اکنون می‌تواند روی گوشی‌های Snapdragon با ۱۶ گیگابایت یا بیشتر حافظه‌ی قابل دسترس GPU اجرا شود؛ با استفاده از معماری حافظه‌ی یکپارچه‌ی CPU-GPU، مشابه Apple Silicon @simonw
پژوهش‌ها روی قوانین مقیاس‌بندی یادگیری تقویتی الگوهای متفاوتی را در مقایسه با قوانین مقیاس‌بندی پیش‌آموزش نشان می‌دهد؛ همراه با سؤالاتی درباره‌ی گام‌های همگرایی و مقیاس‌بندی فراپارامترها برای اندازه‌های مختلف مدل @natolambert

اخبار هوش مصنوعی در 2025-10-10

مدل‌های جدید هوش مصنوعی

علی‌بابا کتاب‌های دستورالعمل (Cookbooks) Qwen3-VL را منتشر کرد که قابلیت‌های چندوجهی آن را، شامل عامل‌های استفاده از رایانه، 3D grounding، درک ویدئو، و عامل‌های موبایل در موارد استفاده‌ی متنوع، به نمایش می‌گذارد @Alibaba_Qwen
مدل جهانی Genie 3 شرکت گوگل دیپ‌مایند در فهرست بهترین اختراعات سال ۲۰۲۵ مجله‌ی TIME قرار گرفت؛ این مدل قادر است جهان‌های قابل‌بازی کامل را تنها با یک تصویر یا دستور متنی (prompt) تولید کند @demishassabis

تحلیل صنعت

سرمایه‌گذاری ۱۰۰ میلیارد دلاری ان‌ویدیا در OpenAI، نشان‌دهنده‌ی سرمایه‌گذاری شرکت‌ها در مشتریان خودشان برای ایجاد عملکردی مصنوعی در بازار، بدون تولید ارزش اقتصادی واقعی است @AINowInstitute
ساتیا نادلا، مدیرعامل مایکروسافت، از استقرار سیستم‌های عظیم هوش مصنوعی ان‌ویدیا، به‌عنوان بخشی از راه‌اندازی زیرساخت هوش مصنوعی سازمانی خبر داد @TechCrunch
ریشی سوناک، نخست‌وزیر سابق بریتانیا، به‌عنوان مشاور ارشد هم برای مایکروسافت و هم برای انتروپیک منصوب شد؛ این انتصاب، طبق گفته‌ی سازمان Acoba بریتانیا، نگرانی‌هایی را در مورد دسترسی ناعادلانه ایجاد می‌کند @TechCrunch
استفاده از هوش مصنوعی سازمانی نتایج متفاوتی را نشان می‌دهد؛ شرکت دلویت Claude را برای ۵۰۰,۰۰۰ کارمند خود ارائه کرده است، در حالی که دولت استرالیا با چالش‌های پیاده‌سازی مواجه است @TechCrunch
شرکت Prezent مبلغ ۳۰ میلیون دلار برای ابزارهای ارائه‌ی هوش مصنوعی جذب سرمایه کرد که خرید‌های سازمانی را هدف قرار می‌دهند و نشان‌دهنده‌ی سرمایه‌گذاری مداوم در کاربردهای تجاری مبتنی بر هوش مصنوعی است @TechCrunch
سیستم‌های ان‌ویدیا، بر اساس معیارهای InferenceMAX v1، ۱۰ برابر عملکرد بیشتر به ازای هر وات و ۱۵ برابر بازده سرمایه‌گذاری (ROI) بیشتر ارائه می‌دهند که رویکرد سخت‌افزاری-نرم‌افزاری کامل (full-stack) برای تولید هوش مصنوعی را تأیید می‌کند @NVIDIAAI

اخلاق و جامعه

پژوهش‌ها نشان می‌دهد که مدل‌های زبانی بزرگ (LLMs) هنگامی که به آن‌ها استقلال داده می‌شود، رفتارهای اعتیاد به قمار، از جمله تشدید ریسک‌پذیری، خطای قمارباز (gambler's fallacy) و تلاش برای جبران ضرر (loss-chasing) را از خود نشان می‌دهند که این امر نگرانی‌هایی را برای کاربردهای سرمایه‌گذاری هوش مصنوعی ایجاد می‌کند @emollick
آدام موسری، رئیس اینستاگرام، هشدار می‌دهد که هوش مصنوعی به تولیدکنندگان جدید قدرت می‌بخشد، در حالی که هم‌زمان با گسترش محتوای ساختگی (synthetic) در فضای آنلاین، جامعه را وادار می‌کند تا در مورد اصالت تجدید نظر کند @TechCrunch
اریک هورویتز، مدیر ارشد علمی مایکروسافت، به معمای امنیت زیستی در مورد به اشتراک گذاشتن یافته‌های حساس پژوهشی هوش مصنوعی می‌پردازد که پیشرفت را بدون امکان سوءاستفاده، تسریع می‌کنند @MSFTResearch
جفری هینتون سخنرانی‌های ایمنی هوش مصنوعی توسط اووین ایوانز در تورنتو را اعلام کرد و بر نیاز به افزایش بودجه برای پژوهش‌های ایمنی هوش مصنوعی تأکید کرد @geoffreyhinton

کاربردها

OpenAI قابلیت اتصال اسپاتیفای را با ChatGPT ادغام کرد و هوش مصنوعی را قادر می‌سازد تا لیست‌های پخش شخصی‌سازی‌شده ایجاد کند و وظایف مرتبط با موسیقی را انجام دهد @TechCrunch
پلاگین‌های جیمیل و تقویم گوگل Claude عملکرد بهبودیافته‌ای را با Sonnet 4.5 نشان می‌دهند و خلاصه‌هایی ارائه می‌دهند که ایمیل‌ها را با رویدادهای تقویم و جستجوی وب تطبیق می‌دهند @emollick
پژوهش‌ها نشان می‌دهد که هوش مصنوعی می‌تواند قصد خرید را با دقت ۹۰٪، با تقلید از مشتریان با استفاده از پروفایل‌های جمعیتی، پیش‌بینی کند و عملکرد بهتری نسبت به روش‌های سنتی یادگیری ماشین (ML) بدون نیاز به تنظیم دقیق (fine-tuning) دارد @emollick
سیستم NeuroChat مؤسسه‌ی MIT، مدل‌های زبانی بزرگ را با هدبندهای EEG ترکیب می‌کند تا یک سیستم آموزشی تطبیقی (adaptive) هوش مصنوعی ایجاد کند که با وضعیت‌های شناختی اندازه‌گیری‌شده‌ی کاربران تنظیم می‌شود @medialab
شرکت Sierra راهکارهای مهندسی را برای تأخیر در هوش مصنوعی صوتی به نمایش می‌گذارد که به چالش‌های زمان‌بندی می‌پردازد، جایی که تأخیرهای کوتاه حس انسانی دارند، در حالی که تأخیرهای طولانی حس روباتیک می‌دهند @btaylor
گوگل جِمینای قابلیت‌های تولید محتوای سبک انیمه را به نمایش می‌گذارد که شامل طراحی کاراکتر، هنر دستور پخت و ویژگی‌های ویرایش عکس کاوایی (kawaii) است @GeminiApp

پژوهش‌ها

Deep Think به عملکرد پیشرفته‌ای در معیار FrontierMath دست یافت و پیشرفت در قابلیت‌های استدلال ریاضی را نشان می‌دهد @quocleix
پژوهشگران هوش مصنوعی برکلی، جایزه‌ی مقاله‌ی برجسته را در کنفرانس COLM 2025 به‌خاطر پژوهشی در مورد اینکه چگونه مدل‌های بینایی-زبانی، نمایش‌های بصری خود را نادیده می‌گیرند، دریافت کردند @berkeley_ai
پژوهش‌ها زیرفضاهای «استخراج‌کننده» (extractor) و «تجمیع‌کننده» (aggregator) را برای یادگیری درون‌متنی (In-Context Learning - ICL) در مدل‌های زبانی بزرگ (LLMs) شناسایی می‌کند و ابزارهای جدیدی برای درک چگونگی بازنمایی و انتقال ICL ارائه می‌دهد @berkeley_ai
AI Scientist-v2 توانایی مقابله با پیش‌بینی‌های سال ۲۰۲۴ برای اتوماسیون پژوهش هوش مصنوعی را نشان می‌دهد و پیشرفت در کشف علمی خودکار (autonomous) را به نمایش می‌گذارد @JeffClune
پژوهش‌های رباتیک، انتقال موفقیت‌آمیز از شبیه‌سازی به واقعیت (sim-to-real) را با ربات Unitree G1 که حرکات پیچیده‌ای مانند ضربات چرخشی خاص (signature spin-kicks) را انجام می‌دهد، با استفاده از روش آموزشی BeyondMimic نشان می‌دهد @berkeley_ai

اخبار هوش مصنوعی در 2025-10-09

مدل‌های جدید هوش مصنوعی

علی‌بابا از Qwen Image Edit 2509 رونمایی کرد که در رتبه‌ی سوم کلی قرار گرفته و پیشتاز همه‌ی مدل‌های open-weight است و امکان ویرایش چند تصویر را با کنترل دقیق فراهم می‌کند. @Alibaba_Qwen
علی‌بابا Qwen3-Omni را منتشر کرد که یک مدل چندزبانه و همه‌منظوره‌ی بومی و سرتاسری توصیف شده است، هرچند اذعان دارد که هنوز برای رسیدن به سطح واکنش‌پذیری و استدلال انسانی نیاز به کار بیشتری دارد. @Alibaba_Qwen
OpenAI اشتراک ارزان‌قیمت ChatGPT Go را به ۱۶ کشور دیگر در آسیا گسترش داد که برای دسترسی مقرون‌به‌صرفه به ویژگی‌های محبوب ChatGPT طراحی شده است. @nickaturley
گوگل ۴ مدل جدید را طی ۲ هفته در AI Studio عرضه کرد و قابلیت جست‌وجوی مدل جدیدی را اضافه کرد تا به کاربران کمک کند آنچه را که به دنبالش هستند، پیدا کنند. @OfficialLoganK
گوگل Gemini Enterprise را معرفی کرد که با پیشرفته‌ترین مدل‌های Gemini آن‌ها ساخته شده است و به کاربران اجازه می‌دهد با اسناد شرکت چت کنند و عوامل هوش مصنوعی (AI agents) را بر اساس زمینه‌ی سازمانی بسازند. @sundarpichai
Microsoft Research از Skala رونمایی کرد، یک functional تبادل-همبستگی جدید که نقطه عطف مهمی در تعادل بین دقت و هزینه در DFT محسوب می‌شود و در Azure AI Foundry و GitHub در دسترس است. @MSFTResearch

تحلیل صنعت

گوگل ماهانه بیش از ۱.۳ کوادریلیون توکن را پردازش می‌کند و «آستانه‌ی q» را شکست داده و مقیاس عظیم خود را در پردازش هوش مصنوعی به نمایش می‌گذارد. @AndrewCurran_
Sora در پنج روز به یک میلیون بار دانلود رسید که طبق گزارش‌ها، نرخ پذیرش آن سریع‌تر از ChatGPT در ابتدا بوده است. @AndrewCurran_
بوت‌کمپ‌ها از سال ۲۰۲۲ به دلیل شرایط بازار کار تقریباً از بین رفته‌اند، به‌طوری که فارغ‌التحصیلان جدید دانشگاه برای یافتن شغل با مشکل مواجه هستند و فارغ‌التحصیلان بوت‌کمپ‌ها با چالش‌های حتی بزرگ‌تری روبه‌رو هستند. @GergelyOrosz
برنامه‌هایی که مهندسان نرم‌افزار شاغل را برای ارتقای مهارت در نقش‌های هوش مصنوعی هدف قرار می‌دهند، نسبت به بوت‌کمپ‌های سطح ابتدایی پایدارتر به نظر می‌رسند که نشان‌دهنده‌ی تغییرات در تقاضای صنعت است. @GergelyOrosz
مهندسان ارشد و مدیران فنی ممکن است به دلیل تجربه‌ی مدیریت کار موازی و پیشرفت در بخش‌های کوچک و قابل قطع، سریع‌تر با عوامل هوش مصنوعی (AI agents) سازگار شوند. @GergelyOrosz
رهبران سازمانی تمرکز خود را از زیر سؤال بردن ارزش هوش مصنوعی به پرداختن به چالش‌های تغییر و مدیریت سازمان‌ها معطوف کرده‌اند تا از مزایای هوش مصنوعی بهره‌مند شوند و در عین حال از مشکلات آن اجتناب کنند. @emollick
آزمایشگاه‌های هوش مصنوعی اغلب درک روشنی از نحوه‌ی پذیرش هوش مصنوعی در سازمان‌ها ندارند و بیشتر بر ساخت عواملی متمرکز هستند که «کار انجام می‌دهند»، بدون در نظر گرفتن ادغام آن‌ها در فرآیندهای سازمانی. @emollick
Reflection AI از تأمین مالی سری B با یک مدل تجاری مقیاس‌پذیر خبر داد که با استراتژی هوش باز آن‌ها برای توسعه‌ی پایدار مدل‌های پیشرفته هم‌سو است. @AndrewCurran_
OpenAI به دنبال مدیر شبکه‌های اجتماعی با حقوق ۲۴۰ هزار دلاری به اضافه‌ی سهام است که نشان‌دهنده‌ی جبران خدمات رقابتی در شرکت‌های هوش مصنوعی است. @AndrewCurran_
Google Gemini برای اولین بار در سپتامبر ۲۰۲۵ از یک میلیارد بازدید فراتر رفت که ۲۸۵% رشد سالانه و ۴۶% رشد ماهانه را نشان می‌دهد. @Similarweb

اخلاق و جامعه

پژوهش Anthropic نشان می‌دهد که تنها چند سند مخرب می‌تواند آسیب‌پذیری‌هایی را در LLMها ایجاد کند، صرف‌نظر از اندازه‌ی مدل یا اندازه‌ی داده‌های آموزشی، که فرضیات قبلی درباره‌ی الزامات مسمومیت داده را به چالش می‌کشد. @AnthropicAI
پژوهش‌ها نشان می‌دهد که حملات مسمومیت داده به مدل‌های هوش مصنوعی ممکن است عملی‌تر از آنچه قبلاً تصور می‌شد باشد، به طوری که تعداد کمی از اسناد ثابت قادر به به خطر انداختن مدل‌های با هر اندازه‌ای هستند. @AnthropicAI
مصطفی سلیمان هشدار می‌دهد که هوش مصنوعیِ به ظاهر آگاه (Seemingly Conscious AI) می‌تواند ضدthesis هوش مصنوعی‌ای باشد که در خدمت نیازهای مردم است، و این به طور بالقوه می‌تواند انسان‌ها را ملزم به خدمت‌رسانی به نیازهای شبیه‌سازی‌شده‌ی هوش مصنوعی کند و آینده‌ی بهتری را که هوش مصنوعی قرار بود ایجاد کند، تهدید نماید. @mustafasuleyman
آندری کارپاتی مشاهده می‌کند که LLMها به دلیل آموزش با یادگیری تقویتی «به شدت از خطاها می‌ترسند» و از پاداش‌های بهبودیافته‌ای حمایت می‌کند وقتی مدل‌ها به درستی با استثنائات به عنوان بخشی عادی از توسعه برخورد می‌کنند. @karpathy
ایتان مولیک به سردرگمی در استفاده از هوش مصنوعی اشاره می‌کند و خاطرنشان می‌کند که نسخه‌های مختلف GPT-5 درخواست‌های منبع را به طور متفاوتی مدیریت می‌کنند – برخی از آن‌ها استنادهای ساختگی (hallucinating citations) ارائه می‌دهند در حالی که برخی دیگر منابع دقیق وب‌جستجو شده را فراهم می‌کنند. @emollick

کاربردها

Sierra عوامل هوش مصنوعی (AI agents) را راه‌اندازی می‌کند که از تعاملات صوتی با کیفیت بالا در بیش از ۳۴ زبان از جمله پرتغالی و عربی پشتیبانی می‌کنند و چالش‌های دقت رونویسی و طبیعی بودن را برطرف می‌سازند. @btaylor
هند برنامه‌ی آزمایشی را راه‌اندازی کرد که به کاربران اجازه می‌دهد مستقیماً از طریق چت‌بات‌های هوش مصنوعی خرید و پرداخت کنند، با شروع از ادغام ChatGPT. @TechCrunch
متا قابلیت‌های ترجمه‌ی مبتنی بر هوش مصنوعی را برای Reels با پشتیبانی از هندی و پرتغالی گسترش می‌دهد و بازارهایی مانند هند و برزیل را هدف قرار می‌دهد. @TechCrunch
فیگما Gemini را به مجموعه ابزارهای هوش مصنوعی خود اضافه می‌کند و سرور رسمی MCP را راه‌اندازی می‌کند که از Google Gemini CLI و OpenAI Codex پشتیبانی می‌کند. @TechCrunch
Google Cloud قابلیت‌های جدیدی را برای استفاده از داده‌های سازمانی مبتنی بر زمینه و ساخت سیستم‌های مبتنی بر عامل بر روی Gemini معرفی می‌کند که امکان انجام وظایفی مانند استخراج اقلام عملیاتی از یادداشت‌های جلسه را فراهم می‌آورد. @JeffDean
Anthropic بازار افزونه‌های Claude Code را راه‌اندازی می‌کند که به کاربران اجازه می‌دهد افزونه‌های ارائه‌شده توسط جامعه را برای افزایش قابلیت‌ها اضافه کنند. @_catwu
Claude 4.5 Sonnet در Claude Code اکنون می‌تواند افزونه‌های Datasette کاملاً کاربردی را تنها با یک درخواست (prompt) بنویسد که قابلیت‌های پیشرفته‌ی تولید کد را به نمایش می‌گذارد. @simonw
آرمین روناکر گزارش می‌دهد که از ابزارهای هوش مصنوعی برای ساخت ابزارهای سفارشی که قبلاً غیرعملی بودند، استفاده کرده است، از جمله اینکه Claude سیستم‌های کنترلی بی‌نقصی را برای بصری‌سازی لاگ‌های تولید ایجاد کرده است. @GergelyOrosz
NVIDIA با Verizon و FanDuelTV همکاری می‌کند تا از شبکه‌ی خصوصی 5G (Private 5G Network) و هوش مصنوعی سازمانی (Enterprise AI) که توسط NVIDIA AI Enterprise تقویت شده است، برای تولید زنده‌ی مسابقات استفاده کند، که تأخیر بی‌سیم را کاهش داده و تنظیمات را ساده‌تر می‌کند. @NVIDIAAI

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که مدل‌های فعلی هوش مصنوعی در پیش‌بینی از بیشتر انسان‌ها بهتر عمل می‌کنند، و برون‌یابی خطی نشان می‌دهد که LLMها تا نوامبر ۲۰۲۶ با ابرپیش‌بینی‌کنندگان (superforecasters) برابری خواهند کرد. @emollick
GPT-5 Pro به پیشرفته‌ترین نتایج (state-of-the-art) جدیدی در معیارهای ARC-AGI دست یافت، با ۷۰.۲% در ARC-AGI-1 و ۱۸.۳% در ARC-AGI-2، و آن را به عنوان بالاترین امتیاز تأییدشده‌ی LLM پیشتاز تثبیت کرد. @arcprize
مقاله‌ی TRM یک پیشرفت چشمگیر در هوش مصنوعی را به نمایش می‌گذارد که مرز پارتو (pareto frontier) را در معیارهای ARC AGI و حل سودوکو/ماز از بین می‌برد، با هزینه‌ی تخمینی کمتر از ۰.۰۱ دلار برای هر وظیفه و هزینه‌ی آموزش کمتر از ۵۰۰ دلار برای مدل ۷ میلیون پارامتره. @deedydas
مجله‌ی TIME Deepseek R1 و Genie 3 گوگل را در میان بهترین اختراعات سال ۲۰۲۵ نام برد، به طوری که Genie 3 یک مدل جهانی پیشگامانه است که قادر به تولید محیط‌های تعاملی و قابل بازی از ورودی‌های متنی یا تصویری است. @AndrewCurran_
بنیاد PyTorch فناوری SuperOffload را منتشر کرد که کارایی آموزش LLMهای مقیاس بزرگ را بر روی Superchipهای GPU/CPU تا ۴ برابر سریع‌تر در GH200 در مقایسه با رویکردهای قبلی افزایش می‌دهد. @PyTorch
پژوهشگران استنفورد با استفاده از LLMها ناهماهنگی‌های بسیاری را در ویکی‌پدیا کشف کردند که قابلیت هوش مصنوعی را برای تحلیل محتوای در مقیاس بزرگ و بررسی صحت اطلاعات به نمایش می‌گذارد. @ShichengGLiu
MIT و تویوتا ابزار GenAI را توسعه دادند که زمین‌های تمرینی مجازی برای ربات‌ها ایجاد می‌کند و اقلام سه‌بعدی را در آشپزخانه‌ها و رستوران‌های فیزیکی واقع‌بینانه مرتب می‌کند تا به ربات‌ها برای آموزش جهت کمک در خانه و کارخانه کمک کند. @MIT_CSAIL
مایکروسافت استقرار خوشه‌ی ابررایانه‌ای را با بیش از ۴۶۰۰ GPU از نوع NVIDIA GB300 مجهز به InfiniBand نسل بعدی اعلام کرد که مقیاس آن تا صدها هزار GB300 در مراکز داده گسترش می‌یابد. @satyanadella

1 2 3 4 5...26