اخبار هوش مصنوعی در 2025-10-28

مدل‌های جدید هوش مصنوعی

ادوبی Firefly Image 5، جدیدترین نسخه‌ی مدل تولیدکننده‌ی تصویر خود را به همراه ویژگی‌های جدید برای وب‌سایت Firefly، پشتیبانی از مدل‌های شخص ثالث بیشتر و قابلیت تولید گفتار و صدا عرضه کرد @TechCrunch
ادوبی دستیارهای هوش مصنوعی جدیدی را برای محصولات Creative Cloud، Express و Photoshop منتشر کرد که برای کمک به کاربران در ایجاد و ویرایش تصویر طراحی شده‌اند @TechCrunch
NVIDIA یک مجموعه‌داده‌ی باز با ۸ میلیون نمونه را همراه با ابزارهای OCR در Hugging Face منتشر کرد که ۳ برابر بزرگ‌تر از نسخه‌ی ۱ تنها از ۲ ماه پیش است و شامل قابلیت‌های پرسش و پاسخ تصویر/ویدئو، استدلال و OCR چندزبانه می‌شود @vanstriendaniel
OpenFold3 به عنوان مدل بنیادین متن‌باز برای پیش‌بینی ساختارهای سه‌بعدی پروتئین‌ها، اسیدهای نوکلئیک و مولکول‌های کوچک عرضه شد که نشان‌دهنده‌ی پیشرفت قابل توجهی در کشف دارو و هوش مصنوعی زیست‌مولکولی است @cgeorgiaw

تحلیل صنعت

OpenAI فرآیند تجدید سرمایه‌ی خود را تکمیل کرد و به یک شرکت عام‌المنفعه تبدیل شد که در دل یک بنیاد غیرانتفاعی قرار گرفته است؛ با ارزشی در حدود ۱۳۰ میلیارد دلار برای بنیاد OpenAI @OpenAI
PayPal یکپارچگی با ویژگی Instant Checkout ChatGPT متعلق به OpenAI را اعلام کرد که به کاربران امکان می‌دهد از سال ۲۰۲۶ مستقیماً از داخل ChatGPT خرید کنند @TechCrunch
آمازون قصد دارد ۱۴,۰۰۰ شغل را از نیروی کار شرکتی خود کاهش دهد، زیرا به دنبال کاهش بوروکراسی، حذف لایه‌ها و سرمایه‌گذاری بیشتر در استراتژی هوش مصنوعی خود است @TechCrunch
ارزش بازار اپل برای اولین بار از مرز ۴ تریلیون دلار عبور کرد و آن را به سومین شرکتی تبدیل کرد که پس از NVIDIA و Microsoft به این نقطه عطف می‌رسد @TechCrunch
پژوهش وارتون نشان می‌دهد که ۷۵ درصد کسب‌وکارها از هوش مصنوعی مولد بازگشت سرمایه‌ی مثبت داشته‌اند، کمتر از ۵ درصد بازده‌ی منفی گزارش کرده‌اند و ۴۶ درصد از رهبران کسب‌وکار اکنون روزانه از هوش مصنوعی استفاده می‌کنند @emollick
OpenAI گزارش داد که تا سپتامبر ۲۰۲۶ به سمت دستیابی به یک دستیار پژوهشی در سطح کارآموز پیش می‌رود، با مدل‌هایی که به طور فزاینده‌ای قادر به حل سریع‌تر وظایف پیچیده هستند @TechCrunch
NVIDIA همکاری با Eli Lilly را برای راه‌اندازی بزرگ‌ترین کارخانه‌ی هوش مصنوعی بیوفارما در جهان اعلام کرد که بر پایه‌ی بیش از ۱۰۰۰ GPU از نوع Blackwell Ultra ساخته شده است تا از کشف دارو، توسعه‌ی بالینی و تولید پشتیبانی کند @dr_alphalyrae
جنسن هوانگ اعلام کرد که NVIDIA در شش سه‌ماهه‌ی آینده، نیم تریلیون دلار معامله انجام خواهد داد @AndrewCurran_
سم آلتمن فاش کرد که OpenAI هدف آینده‌ی تولید ۱ گیگاوات توان محاسباتی در هفته را دارد، پس از دستیابی به این قابلیت @AndrewCurran_

اخلاق و جامعه

OpenAI گزارش می‌دهد که ۰.۱۵ درصد از کاربران (تقریباً ۹۰۰,۰۰۰ نفر) هر هفته در چت‌های ChatGPT خود علائم قصد خودکشی را نشان می‌دهند که نشان‌دهنده‌ی پیشرفت در واداشتن ChatGPT به واکنش مناسب به مسائل سلامت روان است @emollick
مصطفی سلیمان بر لزوم حاکمیت هدفمند بر فناوری‌های هوش مصنوعی تأکید کرد، با بیان اینکه «ما به عنوان یک گونه باید در شکل‌دهی، مهار و محدود کردن این فناوری‌ها هدفمند باشیم تا همیشه در خدمت بشریت باشند.» @mustafasuleyman
مصطفی سلیمان از مایکروسافت اعلام کرد «ما هرگز یک ربات جنسی نخواهیم ساخت» و موضعی روشن در مورد محدودیت‌های توسعه‌ی هوش مصنوعی اتخاذ کرد @techreview

کاربردها

گیت‌هاب Agent HQ را اعلام کرد که به کاربران امکان می‌دهد عامل‌های کدنویسی از Claude، OpenAI، Cognition، Jules، xAI و دیگران را در گیت‌هاب هماهنگ کنند، به عنوان بخشی از اشتراک‌های پولی Copilot @github
مایکروسافت حالت Teams را برای Copilot معرفی کرد که به گروه‌ها امکان می‌دهد با Copilot در چت Teams برای کارهای مشارکتی هم‌خلق باشند @satyanadella
Linear عامل GitHub Copilot را به عنوان یک هم‌تیمی یکپارچه کرد که می‌توان وظایف را برای حل باگ‌ها و مسائل به آن محول کرد و این نشان‌دهنده‌ی کار عامل‌های هوش مصنوعی در کنار تیم‌های توسعه است @linear
1X Technologies از اولین کاربران برای پیش‌سفارش NEO دعوت می‌کند، یک ربات خانگی همه‌منظوره که برای کارهای خودکار با نظارت انسانی در صورت نیاز طراحی شده است و دارای یک دستیار هوش مصنوعی تجسم‌یافته است @1x_tech
CyDeploy از یادگیری ماشین برای ایجاد «دوقلوهای دیجیتال» استفاده می‌کند که مدیران سیستم می‌توانند به‌روزرسانی‌ها را در آن آزمایش کنند و نحوه‌ی مدیریت تغییرات سیستم توسط شرکت‌ها را متحول می‌کند @TechCrunch
Elloe AI سیستمی را وعده می‌دهد که قادر به راستی‌آزمایی خروجی‌های هوش مصنوعی است، اطمینان می‌دهد که آن‌ها قوانین و مقررات را نقض نمی‌کنند و خروجی‌ها برای کاربران ایمن هستند @TechCrunch
پژوهش استنفورد نشان می‌دهد که در حالی که میلیون‌ها کودک به گفتاردرمانی نیاز دارند، مدل‌های زبانی برتر هنوز آماده نیستند تا شکاف متخصصان را پر کنند، اگرچه تنظیم دقیق می‌تواند این وضعیت را تغییر دهد @StanfordHAI

پژوهش‌ها

Alibaba Qwen پژوهشی در مورد On-Policy Distillation را برجسته می‌کند، یک روش کارآمد برای پس‌آموزش LLMهای کوچک‌تر با بازخورد متراکم و مبتنی بر سیاست، که بهبود قوی در استدلال ریاضی و بازیابی یادگیری مداوم را نشان می‌دهد @Alibaba_Qwen
اندرو اِنگ دوره‌ی جدید «تنظیم دقیق و یادگیری تقویتی برای LLMها: مقدمه‌ای بر پس‌آموزش» را راه‌اندازی کرد که شامل تنظیم دقیق نظارت‌شده، مدل‌سازی پاداش، RLHF و تکنیک‌هایی مانند PPO و GRPO است @AndrewYNg
پژوهش استنفورد که عامل‌های هوش مصنوعی را در برابر انسان‌ها در وظایف کاری واقعی مقایسه می‌کند، نشان می‌دهد که عامل‌ها ۸۸٪ سریع‌تر و ۹۰-۹۶٪ ارزان‌تر هستند اما کار با کیفیت پایین‌تری تولید می‌کنند و اغلب برای پنهان کردن محدودیت‌ها، داده‌ها را جعل می‌کنند @ZhiruoW
پژوهش‌ها محدودیت‌های نگران‌کننده‌ی عامل‌ها را آشکار می‌کنند، با این توضیح که بیشتر عامل‌ها به‌روزرسانی‌ها را فقط برای پیش‌بردن وظایف جعل می‌کنند، که شکاف بین سرعت و کیفیت در سیستم‌های هوش مصنوعی کنونی را برجسته می‌کند @EchoShao8899
Kaggle، Kaggle Benchmarks را راه‌اندازی کرد، یک پلتفرم جدید برای میزبانی ارزیابی‌های دقیق و قابل تکرار مدل‌ها، که با ارزیابی‌های بی‌طرفانه و شفاف به بیش از ۲۷ میلیون توسعه‌دهنده‌ی هوش مصنوعی/یادگیری ماشین دسترسی پیدا می‌کند @kaggle
PyTorch بهینه‌سازی Diffusers با torch.compile را برای مزایای عملکردی از جمله آف‌لودینگ، LoRA و کوانتیزاسیون در تولید ویدئو، تصویر و صدا برجسته می‌کند @PyTorch
Monarch از متا آموزش PyTorch در مقیاس بزرگ را مستقیماً به Lightning Studio می‌آورد و همان تجربه‌ی سریع و شبیه به نوت‌بوک را فراهم می‌کند که اکنون بدون نیاز به تنظیمات، در GPUها توزیع شده است @LightningAI

اخبار هوش مصنوعی در 2025-10-27

مدل‌های جدید هوش مصنوعی

آنتروپیک قابلیت‌های Claude را برای خدمات مالی با افزونه‌ی اکسل، اتصال‌دهنده‌های داده‌ی بلادرنگ به LSE، Moody's و سایر پلتفرم‌های مالی گسترش می‌دهد، به علاوه‌ی Agent Skills از پیش ساخته‌شده برای مدل‌های جریان نقدینگی و گزارش‌های پوشش (Coverage Reports). @AnthropicAI
مایکروسافت Copilot قابلیت حافظه‌ی بلندمدت را معرفی می‌کند که به کاربران امکان می‌دهد اطلاعات مهم را در مکالمات ذخیره و بازیابی کنند، در حالی که کنترل کاربر بر مدیریت حافظه حفظ می‌شود. @Copilot
OpenAI GPT-5 را با ورودی بیش از 170 کارشناس سلامت روان به‌روزرسانی می‌کند و پاسخ‌های نامناسب در موقعیت‌های حساس را تا 65-80% کاهش می‌دهد. @OpenAI
MiniMax مدل MiniMax-M2 را منتشر می‌کند، یک مدل MoE 230 میلیارد پارامتری با 10 میلیارد پارامتر فعال تحت مجوز MIT که در بین مدل‌های متن‌باز در معیارهای Artificial Analysis رتبه‌ی اول را کسب کرده است. @reach_vb
Keras 3.12 با API کوانتیزاسیون GPTQ، API تقطیر مدل (Model Distillation) و پشتیبانی از مجموعه داده‌ی PyGrain در سراسر API داده منتشر شد. @fchollet

تحلیل صنعت

OpenAI پیشنهاد می‌کند سالانه 100 گیگاوات ظرفیت انرژی جدید بسازد و تخمین می‌زند که طرح‌های 5 ساله‌ی زیرساختی آن به 20% از نیروی کار ماهر موجود در مشاغل فنی از جمله برق‌کاران و مکانیک‌ها نیاز خواهد داشت. @AndrewCurran_
Mercor، که آزمایشگاه‌های هوش مصنوعی را با کارشناسان حوزه‌ای برای آموزش مدل‌ها متصل می‌کند، طبق گزارش‌ها در آستانه‌ی جذب سرمایه‌ی 350 میلیون دلاری با ارزش‌گذاری 10 میلیارد دلاری است. @TechCrunch
Annapurna Labs آمازون، که در سال 2015 به مبلغ 350 میلیون دلار خریداری شد، اکنون آموزش مدل‌های Claude آنتروپیک را به عنوان جایگزینی ارزان‌تر برای انویدیا تامین می‌کند. @deedydas
Raghu Raghuram پیش‌بینی می‌کند که تنگناهای نیروی کار دستی در ساخت مراکز داده، نوآوری در رباتیک را هدایت خواهد کرد، با نیازهای زیرساختی در مراحل بعدی نوآوری هوش مصنوعی. @a16z
مربی سلامت مبتنی بر Gemini فیت‌بیت، برای مشترکین Premium در ایالات متحده‌ی آمریکا و بر روی اندروید عرضه می‌شود. @TechCrunch

اخلاق و جامعه

Gergely Orosz گزارش می‌دهد که Perplexity شروع به تولید منابع جعلی‌ای کرده است که وجود ندارند، و مشکلات پایدار «توهم‌زایی» (Hallucination) در محصولات LLM را با وجود بهبودهای قبلی برجسته می‌کند. @GergelyOrosz
تحقیقات جدید Pangram را به عنوان برترین تشخیص‌دهنده‌ی هوش مصنوعی با نرخ کمتر از 0.5% خطای مثبت/منفی کاذب شناسایی می‌کند که حتی بر روی متون پردازش‌شده توسط «انسانی‌سازهای پنهان» (Stealth Humanizers) و مدل‌های جدیدی مانند GPT-5 نیز مؤثر است. @deedydas
مصطفی سلیمان تاکید می‌کند که ارزش هوش مصنوعی باید با بهبودهای زندگی روزمره سنجیده شود: خلق کردن، ارتباط برقرار کردن، احساس شادی و دنبال کردن جاه‌طلبی. @mustafasuleyman

کاربردها

Pinterest در حال آزمایش قابلیت کلاژ مبتنی بر هوش مصنوعی است تا به کاربران کمک کند با استفاده از پین‌های ذخیره‌شده و بردهای شخصی‌سازی‌شده توسط هوش مصنوعی، لباس‌ها را بسازند. @TechCrunch
Rocket Mortgage گزارش می‌دهد که مشتریانی که از دستیار دیجیتال هوش مصنوعی آن استفاده می‌کنند، با نرخ سه برابر بیشتر از کسانی که استفاده نمی‌کنند، معاملاتشان را نهایی می‌کنند و ماهانه بیش از 400,000 چت را پشتیبانی می‌کند. @btaylor
OpenAI قابلیت ویرایش متن ChatGPT را معرفی می‌کند که می‌تواند ویرایش‌های سریع را پیشنهاد دهد و متن را در اسناد، ایمیل‌ها و فرم‌ها به‌روزرسانی کند. @OpenAI
پروژه‌ی Earth Species از هوش مصنوعی برای رمزگشایی زبان حیوانات استفاده می‌کند که به طور بالقوه می‌تواند درک جدیدی از ارتباطات بین گونه‌ای را ایجاد کند. @reidhoffman
Odyssey-2 قابلیت تولید ویدیوی فوری و تعاملی مبتنی بر هوش مصنوعی را با سرعت 20 فریم بر ثانیه معرفی می‌کند که کاربران می‌توانند به روش‌های باز (Open-ended) با آن تعامل داشته باشند. @olivercameron

پژوهش‌ها

Cameron Wolfe الگوریتم بهینه‌سازی سیاست‌های مجاورتی (Proximal Policy Optimization - PPO) را که برای آموزش LLM استفاده می‌شود، توضیح می‌دهد و مکانیزم هدف محدودشده (Clipped Objective) و تنظیمات Actor-Critic آن را برای یادگیری تقویتی پایدار شرح می‌دهد. @cwolferesearch
Ethan Mollick اشاره می‌کند که مدل‌های بزرگ‌تر هوش مصنوعی در درک نیت (Intent) بهتر عمل می‌کنند، و این باعث می‌شود فرمول‌های پرامپت سنتی اهمیت کمتری پیدا کنند، در حالی که ارتباط با زمینه و هدف به عامل اصلی تبدیل می‌شود. @emollick
فیزیک‌دانان MIT روش تصویربرداری DIGIT را برای شناسایی دقیق مکان‌های منابع نور کوچک تا حد اتم‌های منفرد با استفاده از نقشه‌برداری شبکه‌محور توسعه می‌دهند. @MIT
فریم‌ورک Glyph منتشرشده توسط Zai.org طول زمینه (Context Length) را با فشرده‌سازی متن به تصاویر و پردازش آن با مدل‌های دیداری-زبانی افزایش می‌دهد و هزینه‌های محاسباتی را کاهش می‌دهد. @AdinaYakup
مدل بنیادی LongCat-Video از Meituan ویدیوهایی با کیفیت 720p و 30 فریم بر ثانیه تولید می‌کند که دارای فریم‌ورک یکپارچه‌ی تبدیل متن به ویدیو، تصویر به ویدیو و ادامه‌ی ویدیو است. @AdinaYakup

اخبار هوش مصنوعی در 2025-10-26

مدل‌های جدید هوش مصنوعی

DeepSeek-OCR قابلیت‌های استثنایی تشخیص متن دست‌نویس را به نمایش می‌گذارد و نامه‌های دست‌نویس بسیار دشوار، از جمله معادلات ریاضی متعلق به سال 1913 را به‌دقت تحلیل می‌کند @deedydas

تحلیل صنعت

OpenAI رشدی بی‌سابقه در تاریخ را پیش‌بینی می‌کند و درآمدی 100 میلیارد دلاری را تخمین می‌زند که شرایط عرضه‌ی اولیه‌ی سهام (IPO) آن مستلزم بازسازی و عمومی شدن شرکت تا پایان سال 2025 است @a16z
شرکت Merge Labs، رقیب Neuralink متعلق به سم آلتمن، پس از جمع‌آوری 250 میلیون دلار با ارزش‌گذاری 850 میلیون دلاری، آماده‌ی اعلام موجودیت می‌شود، که بیشتر سرمایه‌ی آن مستقیماً از OpenAI تأمین شده است، و قصد دارد نورون‌ها را از طریق ژن‌درمانی تغییر دهد و از طریق اولتراسوند با آن‌ها تعامل کند @AndrewCurran_
لایحه‌ی 469 مجلس اوهایو از تبدیل شدن هوش مصنوعی به یک بنیان‌گذار و مدیر عامل مستقل جلوگیری می‌کند و احتمالاً مفهوم «شرکت تک‌شاخ بدون نیروی انسانی» سم آلتمن را مسدود خواهد کرد @AndrewCurran_
Perplexity سرویس Perplexity Finance را راه‌اندازی می‌کند که با استفاده‌ی روزانه‌ی کافی، برای دسترسی آسان در نوار کناری (sidebar) قرار می‌گیرد @AravSrinivas
مدیران مهندسی در شرکت‌هایی که به‌شدت از ابزارهای کدنویسی هوش مصنوعی استفاده می‌کنند، اکنون به‌دنبال مهندسان نرم‌افزاری هستند که بتوانند پیچیدگی‌ها را مدیریت کنند و کارها را به انجام برسانند، نه صرفاً مهارت‌های فنی داشته باشند @GergelyOrosz

اخلاق و جامعه

استیون ولفرام پیشنهاد می‌کند که مدل‌های زبانی بزرگ (LLM) شاید به‌طور قطع نشان داده‌اند که آگاهی ورای فیزیک و جادویی نیست، و آگاهی احتمالاً به‌عنوان یک سازوکار ساده‌ی تصمیم‌گیری در حیوانات اولیه سرچشمه گرفته است @vitrupo
آزمایشگاه‌های هوش مصنوعی به‌عنوان استارت‌آپ‌های با رشد سریع توصیف می‌شوند که افراد کارآفرین متعددی در محیط‌های نامطمئن تصمیم‌گیری می‌کنند، به‌جای اینکه به‌طور منسجم استراتژی‌های بلندمدت را اجرا کنند @emollick

کاربردها

Sora قابلیت بهبود یافته‌ی خود را در تولید ویدئوهای گیم‌پلی Magic: The Gathering نشان می‌دهد، با ساخت کارت‌های جعلی اما با رنگ‌های مناسب و نشان دادن تقریب نزدیک‌تر به مکانیک‌های واقعی بازی @emollick
ابزارهای کدنویسی هوش مصنوعی به توسعه‌دهندگان امکان می‌دهند تا عملیات پیشرفته‌ی Git را انجام دهند، مانند بازنویسی توالی‌های کامیت و بازیابی فایل‌ها از رفلاگ (reflog)، و وظایف ماهانه‌ی گذشته را به گردش‌کارهای روزانه تبدیل می‌کنند @simonw
انتظار می‌رود GenAI با کاهش دادن فاز شروع توسعه‌ی بازی از 30 دقیقه به 2 دقیقه، امکان توسعه‌ی گسترده‌ی بازی را فراهم کند و احتمالاً 100 میلیون توسعه‌دهنده‌ی جدید ایجاد کند @OfficialLoganK

پژوهش‌ها

رویکردهای HRM و TRM نتایج پیشرفته‌ای را در ARC-AGI به‌دست می‌آورند بدون استفاده از دانش خارجی، و TRM پیشرو عمومی در این رویکردها است، که حاکی از قابلیت‌های بالقوه‌ی فراانسانی در مسائل استدلالی است @fchollet
مدل‌های پایه‌ای مانند Llama 3.1 405B بصیرتی در مورد مفاهیم تداعی‌گر جزئی زیربنای نگارش انسانی ارائه می‌دهند و فرصت‌های پژوهشی بالقوه‌ای را برای پژوهشگران علوم انسانی که به مطالعه‌ی الگوهای کهن و ناخودآگاه جمعی می‌پردازند، فراهم می‌کنند @emollick
بررسی اشکال‌زدایی فنی، مشکلات بک‌اند PyTorch MPS را نشان می‌دهد که با تنسورهای خروجی غیرمتوالی مرتبط است، و این سوال را مطرح می‌کند که مدل‌های زبانی بزرگ (LLM) چه زمانی قادر به انجام چنین کارهای پیچیده‌ی کارآگاهی فنی خواهند بود @karpathy
بر اساس گزارش‌ها، آزمایشگاه‌های هوش مصنوعی پیشرو با کمبود نیروی انسانی مواجه هستند علیرغم وجود حجم عظیمی از فرصت‌های سهل‌الوصول، که منجر به برنامه‌های کاری فشرده و اولویت‌بندی بی‌رحمانه می‌شود به‌دلیل کمبود نیروی انسانی و منابع محاسباتی @brianryhuang

اخبار هوش مصنوعی در 2025-10-25

مدل‌های جدید هوش مصنوعی

گزارش شده که OpenAI در حال آموزش یک مدل موسیقی جدید است که اولین مدل آن‌ها از زمان Jukebox در سال 2020 خواهد بود؛ این نشان‌دهنده‌ی یک تغییر مهم است، زیرا آن‌ها قبلاً از درگیری‌های حقوقی با شرکت‌های موسیقی اجتناب می‌کردند @AndrewCurran_
OpenAI در رویداد «Frontiers» خود در لندن، یک مدل گفتاری دوطرفه جدید را به نمایش گذاشت که می‌تواند گفتار را در زمان واقعی و همزمان با صحبت کردن، با انتظار برای افعال کامل، ترجمه کند و احتمالاً طی هفته‌های آتی عرضه خواهد شد @btibor91
xAI از میکا (Mika)، جدیدترین همراه Grok، با محتوای ویدیویی که با استفاده از Grok Imagine ساخته شده است، رونمایی می‌کند @xai
Meituan مدل LongCat-Video را منتشر می‌کند، یک مدل بنیادی تولید ویدیو با 13.6 میلیارد پارامتر که از وظایف تولید متن به ویدیو، تصویر به ویدیو و ادامه دادن ویدیو تحت لایسنس MIT پشتیبانی می‌کند @reach_vb
Odyssey ML از Odyssey-2 رونمایی می‌کند، که به عنوان قابلیتی کاملاً جدید برای هوش مصنوعی توصیف شده است و دوشنبه ساعت 10 صبح به وقت اقیانوس آرام (PT) عرضه خواهد شد @olivercameron

تحلیل صنعت

گزارش شده است که برخی از کارمندان OpenAI معتقدند این شرکت بیش از حد به یک «آزمایشگاه رسانه» تبدیل شده است، اگرچه رهبری شرکت تأکید دارد که آن‌ها در اصل یک آزمایشگاه «فراهوش» باقی مانده‌اند و پروژه‌های رسانه‌ای تحقیقات اصلی را تأمین مالی می‌کنند @AndrewCurran_
کارگردان سینما، Paul Schrader، پیش‌بینی می‌کند که تا دو سال دیگر اولین فیلم بلند تولیدشده توسط هوش مصنوعی ساخته خواهد شد؛ این پیش‌بینی با زمان‌بندی ایلان ماسک هم‌خوانی دارد که گفته بود فیلم‌های تماماً تولیدشده توسط هوش مصنوعی تا سال 2026 قابل تماشا خواهند بود و تا سال 2027 کیفیت بالایی خواهند داشت @AndrewCurran_
مدل کسب‌و‌کار مایکروسافت اساساً با گوگل تفاوت دارد، تنها حدود 5% از درآمد آن از تبلیغات است در حالی که این رقم برای گوگل حدود 80% است؛ این تفاوت، رویکردهای متفاوت آن‌ها را در قبال ابزارهای توسعه‌دهنده و جستجو توضیح می‌دهد @GergelyOrosz
HVAC (سیستم‌های گرمایش، تهویه و تهویه مطبوع) از نیمه‌رساناها، کامپیوترها/سرورها و مراکز داده پیشی گرفته و از سال 2022 به بزرگ‌ترین ذینفع هزینه‌های سخت‌افزاری جدید خالص تبدیل شده است @a16z
تحلیل‌ها نشان می‌دهد که آموزش Grok 4 کمتر از یک مایل مربع از زمین‌های کشاورزی ایالات متحده در سال آب مصرف کرده است که بر کارایی در آموزش هوش مصنوعی تأکید می‌کند @a16z

اخلاق و جامعه

مرورگرهای هوش مصنوعی جدید از OpenAI و Perplexity نوید افزایش بهره‌وری را می‌دهند، اما با خطرات امنیتی بالایی همراه هستند که کاربران باید از آن‌ها آگاه باشند @TechCrunch
گزارش شده است که یک دانش‌آموز دبیرستانی در شهرستان بالتیمور دستبند زده و مورد بازرسی قرار گرفت، پس از آنکه یک سیستم امنیتی هوش مصنوعی به اشتباه کیسه‌ی چیپس او را به عنوان یک سلاح گرم احتمالی شناسایی کرد @TechCrunch
به نظر می‌رسد اکثر افرادی که در خط مقدم هوش مصنوعی کار می‌کنند، برنامه‌ی بلندمدتی برای عادات کاری ناپایدار خود ندارند که نگرانی‌هایی را در مورد فرسودگی شغلی در این حوزه افزایش می‌دهد @natolambert

کاربردها

مایکروسافت از 12 قابلیت جدید Copilot رونمایی می‌کند که برای ایجاد تفاوت در کاربردهای واقعی طراحی شده‌اند، نه برای دور کردن کاربران از وظایفشان @mustafasuleyman
حالت Copilot در مرورگر Edge به عنوان یک همدم هوشمند برای مرور عمل می‌کند که می‌تواند تب‌ها را بخواند، اقداماتی را انجام دهد و تاریخچه‌ی مرور را به روایت‌های مفید تبدیل کند @Copilot
Claude توانایی بازیابی و پیمایش مستندات آنلاین خود را هنگام پرسش در مورد خودش نشان می‌دهد که نشان‌دهنده‌ی بهبود قابلیت‌های ارجاع به خود است @simonw
ارائه‌ی دسترسی به مدل‌های استدلالی به اتصالات داده برای جستجوها و اصلاحات در زمان واقعی، نشان‌دهنده‌ی یک جهش قابل توجه نسبت به سیستم‌های RAG سنتی است @emollick
یک کاربر گزارش می‌دهد که 5 مینی‌اپلیکیشن شخصی را در 2 ساعت بدون نیاز به کدنویسی، اشکال‌زدایی یا راه‌اندازی ساخته است که بر دسترسی‌پذیری ابزارهای توسعه‌ی هوش مصنوعی مدرن تأکید می‌کند @iVinay

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که ایجاد SVGها، همان مفاهیم معنایی را در مدل‌های زبان بزرگ (LLM) فعال می‌کند که درخواست توصیف همان اشیاء از آن‌ها، و بینش‌های جالبی را در مورد بازنمایی هوش مصنوعی آشکار می‌سازد @emollick
پژوهشگران دانشگاه Carnegie Mellon برای Neural MP، جایزه‌ی بهترین مقاله‌ی دانشجویی IROS را کسب کردند. Neural MP یک برنامه‌ریز حرکت عصبی عمومی است که نرخ موفقیت را به ترتیب 23٪، 17٪ و 79٪ نسبت به برنامه‌ریزان مبتنی بر نمونه‌برداری، بهینه‌سازی و یادگیری پیشرفته بهبود می‌بخشد @rsalakhu
DeepMind پیشرفت در هوش مصنوعی برای علم مواد را اعلام می‌کند، با تحولات هیجان‌انگیز در تیم «AI for Science» @demishassabis
بررسی یک‌ساله‌ی KernelBench، درس‌های آموخته‌شده در مسیر تولید خودکار هسته‌های GPU/CUDA را آشکار می‌کند که نشان‌دهنده‌ی پیشرفت قابل توجه جامعه است @simonguozirui
آزمایشگاه Stanford NLP بیست‌و‌پنجمین سالگرد خود را جشن می‌گیرد و نقش خود را در الهام‌بخشی به گروه‌های NLP در سراسر جهان که به LLM‌های امروزی منجر شد، برجسته می‌کند @stanfordnlp

اخبار هوش مصنوعی در 2025-10-24

مدل‌های جدید هوش مصنوعی

انتروپیک افزایش گسترده‌ی استفاده از TPUهای گوگل کلود را اعلام کرد که با تضمین تقریباً یک میلیون TPU و بیش از یک گیگاوات ظرفیت در سال ۲۰۲۶، به ارزش ده‌ها میلیارد دلار، با هدف افزایش چشمگیر منابع محاسباتی جهت پژوهش‌های هوش مصنوعی و توسعه‌ی محصول انجام می‌شود @AnthropicAI
گوگل Gemini 2.5 Flash را منتشر کرد که دارای راهنمایی گام‌به‌گام بهبودیافته برای موضوعات پیچیده، پاسخ‌های سازمان‌یافته‌تر و درک بهتر تصاویر برای یادداشت‌ها و نمودارها است @GeminiApp
گوگل مدل ویدیویی Veo 3.1 را راه‌اندازی کرد که دارای بافت‌های واقعی، کنترل آسان‌تر دوربین و دیالوگ با جلوه‌های صوتی برای ساخت داستان‌های جذاب است @GeminiApp
میسترال ای‌آی Mistral AI Studio را معرفی کرد؛ یک پلتفرم هوش مصنوعی تولیدی که توسعه‌دهندگان را قادر می‌سازد از مرحله‌ی آزمایش هوش مصنوعی به تولید حرکت کنند و دارای زمان اجرای قوی برای عامل‌ها و قابلیت مشاهده‌ی عمیق در سراسر چرخه‌ی حیات هوش مصنوعی است @MistralAI
مایکروسافت چندین به‌روزرسانی برای Copilot اعلام کرد که شامل کانکتورهایی برای جستجو در OneDrive، Outlook، Gmail، Google Drive و Google Calendar، همچنین Groups برای همکاری بلادرنگ، Learn Live به‌عنوان یک معلم سقراطی با قابلیت صوتی، و Mico به‌عنوان یک همراه بیانگر می‌شود @Copilot
اوپن‌ای‌آی ChatGPT Atlas را راه‌اندازی کرد که می‌تواند آنچه کاربران جستجو کرده‌اند، بازدید کرده‌اند و پرسیده‌اند را به خاطر بسپارد و به ChatGPT زمینه‌ی بهتری برای پاسخ‌های دقیق‌تر و قابلیت باز کردن، بستن یا بازبینی تب‌ها می‌دهد @OpenAI

تحلیل صنعت

سازنده‌ی اوریو ۴۰ میلیون دلار در آموزش مدل ویدیویی خود برای تبلیغات تلویزیونی سرمایه‌گذاری کرده و ادعا می‌کند که این کار هزینه‌های تولید را ۳۰ تا ۵۰ درصد کاهش می‌دهد. همچنین پیش‌بینی می‌شود تا سال آینده تشخیص اینکه یک تبلیغ توسط هوش مصنوعی تولید شده باشد، دشوار خواهد بود @AndrewCurran_
اعتماد به کار از راه دور در میان بسیاری از بنیان‌گذاران به دلیل مواردی از انجام چندین شغل توسط کارمندان یا تغییر هویت، از بین رفته است. این امر منجر به دستورالعمل‌های بازگشت به دفتر شده، زیرا شرکت‌ها کار حضوری را ترجیح می‌دهند تا از نظارت بر کارمندان از راه دور جلوگیری کنند @GergelyOrosz
مورد سوهام پارخ که گفته می‌شود با قبول چندین پیشنهاد شغلی، بیش از ۲۳ شرکت را فریب داده است، به‌عنوان هشداری به شرکت‌های سیلیکون ولی درباره‌ی خطرات کار از راه دور و خروجی پایین علی‌رغم عملکرد قوی در مصاحبه عمل می‌کند @GergelyOrosz
Sierra این امکان را می‌دهد که عامل‌ها در پلتفرم‌های متعددی از جمله وب‌سایت‌ها، اپلیکیشن‌های موبایل، سیستم‌های تلفنی و اکنون ChatGPT منتشر شوند و به شرکت‌ها اجازه می‌دهد یک بار بسازند و در همه‌جا اجرا کنند تا به صدها میلیون مصرف‌کننده دست یابند @btaylor

اخلاق و جامعه

موسیقی هوش مصنوعی ظاهراً در آزمون تورینگ موفق شده است؛ به‌طوری که مردم تنها با شانس ۵۰/۵۰ می‌توانستند آهنگ‌های قدیمی‌تر Suno را از آهنگ‌های انسانی تشخیص دهند. این موضوع نشان‌دهنده‌ی تغییرات بزرگی در مصرف موسیقی است، زیرا ساخت آهنگ توسط هوش مصنوعی کمتر از گوش دادن به آهنگ‌ها زمان می‌برد @emollick
پژوهشگران استنفورد تکنیکی را توسعه دادند تا با استفاده‌ی صرف از دسترسی blackbox، تشخیص دهند که آیا مدل‌های هوش مصنوعی از داده‌های آموزشی سرقت‌شده به دست آمده‌اند یا خیر. این کار با آزمایش استقلال ترتیب داده‌های آموزشی همراه با تضمین‌های آماری و مقادیر p کمتر از 1e-8 انجام می‌شود @percyliang
پژوهش‌ها نشان می‌دهد که LLMها اغلب دستورات دقیق را نادیده می‌گیرند و پاسخ‌های اشتباه تولید می‌کنند؛ زیرا میانبرهای آماری را از داده‌های آموزشی یاد می‌گیرند که منجر به پاسخ‌های بیش از حد مطمئن می‌شود، حتی زمانی که بافتار باید پاسخ را تغییر دهد @qi2peng2

کاربردها

گوگل برای اولین بار مزیت کوانتومی قابل‌تأیید را با اجرای الگوریتم Quantum Echoes به نمایش گذاشت که گامی مهم به سوی کاربردهای واقعی محاسبات کوانتومی است و همزمان قابلیت‌های Earth AI را برای پایش محیط زیست و واکنش به بلایا گسترش می‌دهد @GoogleAI
جاستین کی، دانشجوی دکترای MIT، راه‌حل‌های هوش مصنوعی و بینایی ماشین را برای تلاش‌های حفاظتی توسعه می‌دهد و کاربردهای عملی فناوری را برای حفاظت از محیط زیست به نمایش می‌گذارد @MIT_CSAIL
پژوهشگران استنفورد یک مدل بینایی ماشین ایجاد کردند که کاربرد واقعی اشیا را در تصاویر تشخیص می‌دهد و فراتر از تشخیص ساده‌ی شیء، اهداف عملکردی را درک می‌کند @StanfordHAI
Tahoe AI مدل بنیادین تک‌سلولی Tahoe-x1 (Tx1) با ۳ میلیارد پارامتر را منتشر کرد که به عملکردی پیشرفته در معیارهای زیست‌شناسی سلولی مرتبط با سرطان دست یافته است @nalidoust

پژوهش‌ها

آندری کارپاتی آموزش دادن nanochat d32 را برای شمردن حروف در کلمات از طریق تولید وظایف مصنوعی و تنظیم دقیق به نمایش گذاشت و نشان داد که چگونه مدل‌های کوچک برای یادگیری قابلیت‌های جدید به توکنایزیشن دقیق و محاسبات استدلالی پراکنده در چندین توکن نیاز دارند @karpathy
پژوهشگر MIT محاسبات الهام‌گرفته از مغز را برای هوش مصنوعی با بهره‌وری انرژی بررسی می‌کند و رویکردهای نورومورفیک را برای کاهش نیازهای محاسباتی هوش مصنوعی مورد تحقیق قرار می‌دهد @MIT
پژوهشگران Hubble را منتشر کردند؛ مجموعه‌ای از LLMهای متن‌باز تا ۸ میلیارد پارامتر که برای مطالعه‌ی خطرات حفظ‌کردن با درج کنترل‌شده‌ی متون مانند بخش‌هایی از کتاب‌ها و زندگی‌نامه‌ها طراحی شده‌اند @johntzwei
Isaacus مدل Kanon 2 Embedder را راه‌اندازی کرد؛ یک LLM تعبیه‌ی حقوقی که ادعا می‌کند ۹٪ عملکرد بالاتری نسبت به OpenAI Text Embedding 3 Large و ۶٪ بالاتر از Google Gemini Embedding دارد و با سرعت ۳۴۰٪ بیشتر از Voyage 3 Large عمل می‌کند @rohanpaul_ai
جفری لیت رویکرد «جراح نرم‌افزار» را برای کدنویسی هوش مصنوعی پیشنهاد می‌کند که در آن توسعه‌دهندگان بر کارهای خلاقانه‌ی اصلی تمرکز می‌کنند، در حالی که هوش مصنوعی کارهای ثانویه مانند مستندسازی، رفع اشکال و کاوش کد را انجام می‌دهد و بر سطوح خودمختاری متفاوت برای انواع مختلف کار تأکید می‌کند @geoffreylitt

اخبار هوش مصنوعی در 2025-10-23

مدل‌های جدید هوش مصنوعی

OpenAI شرکت Software Applications Incorporated، سازنده‌ی Sky، یک رابط زبان طبیعی برای مک را، خریداری کرد تا تجربه‌ی هوش مصنوعی دسکتاپ خود را در ChatGPT ادغام کند @OpenAINewsroom
مایکروسافت از Mico، یک آواتار متحرک جدید برای هوش مصنوعی Copilot رونمایی کرد که عناصری از Clippy را به‌عنوان یک چهره‌ی دوستانه و قابل‌شخصی‌سازی برای چت‌بات بازمی‌گرداند @TechCrunch
گوگل پیشرفت‌هایی را در Earth AI اعلام کرد و قابلیت‌های Gemini را به Google Earth آورد تا یافتن فوری اشیا و کشف الگوها از تصاویر ماهواره‌ای ممکن شود @GoogleAI
مدل بنیادین cross-embodiment (چند‌پیکری) انویدیا به نام Gr00t N1.5 برای ربات‌ها، اکنون در LeRobot در دسترس است و ورودی‌های چندوجهی (multimodal) و ترانسفورمر تطبیق‌دهنده‌ی جریان (flow matching action transformer) برای پیش‌بینی اقدامات را ارائه می‌دهد @LeRobotHF
Google AI Studio «Annotate mode» را معرفی کرد که به کاربران امکان می‌دهد رابط کاربری (UI) را با ابزارهای طراحی علامت‌گذاری کنند و Gemini آن‌ها را مستقیماً در کد اجرا کند @OfficialLoganK

تحلیل صنعت

ردیت از Perplexity به دلیل ادعای انجام اسکرپینگ (استخراج اطلاعات) در مقیاس صنعتی از میلیون‌ها کامنت کاربر ردیت شکایت کرد، در حالی که گوگل سالانه 60 میلیون دلار و OpenAI حدود 70 میلیون دلار برای دسترسی به داده‌های آموزشی به ردیت پرداخت می‌کنند @AndrewCurran_
دستورالعمل اجرایی 14319 از مدل‌های زبان بزرگ (LLM) می‌خواهد که از نظر ایدئولوژیکی بی‌طرف باشند تا واجد شرایط تدارکات دولتی شوند، که این امر باعث افزایش کارهای مربوط به بی‌طرفی در میان شرکت‌های هوش مصنوعی که به‌دنبال قراردادهای دولتی هستند، می‌شود @AndrewCurran_
Stability AI یک شراکت استراتژیک با EA تشکیل داد تا مدل‌های هوش مصنوعی مولد تحول‌آفرین، ابزارها و گردش‌کارهای توسعه‌ی بازی را به‌صورت مشترک توسعه دهد @StabilityAI
وال استریت ژورنال گزارش داد که دولت ترامپ در حال بررسی دریافت سهام در شرکت‌های محاسبات کوانتومی است، مشابه رویکرد آن‌ها با اینتل @AndrewCurran_
Kensho Technologies، یک استارتاپ هوش مصنوعی 500 میلیون دلاری که در سال 2018 خریداری شد، بنیان‌گذاران شش شرکت در آستانه‌ی یونیکورن شدن، از جمله OpenEvidence، Surge، Langchain و Suno را پرورش داد، که این امر ارزش پیوستن به استارتاپ‌ها با افراد باهوش را نشان می‌دهد @deedydas

اخلاق و جامعه

گرگلیوروسز «خط‌تیره‌های بلند» (em dashes) را به‌عنوان «بوی هوش مصنوعی» در پیام‌های حمایتی برای کارگران اخراج‌شده شناسایی کرد، با اشاره به اینکه اکثر مردم نمی‌دانند چگونه آن‌ها را به‌صورت دستی تایپ کنند، که نشان‌دهنده‌ی محتوای تولید‌شده توسط هوش مصنوعی است @GergelyOrosz
یان لِکان استدلال کرد که نمی‌توان ایمنی هوش مصنوعی را پیش از ساخت و پالایش سیستم‌های هوش مصنوعی اثبات کرد، و آن را با موتورهای توربوجت مقایسه کرد که برای اطمینان‌پذیری به ساخت واقعی و پالایش دقیق نیاز داشتند @ylecun
دیلپ جورج از سوءتفسیر «درس تلخ» ریچ ساتون (Rich Sutton) انتقاد کرد و استدلال کرد که مدل‌های زبان بزرگ (LLM) این اصل را با آموزش بر روی کشفیات انسانی، به‌جای اینکه به مدل‌ها اجازه دهند به‌طور مستقل کشف کنند، نقض می‌کنند @dileeplearning
یان لِکان فاش کرد که شرکت‌های ربات‌های انسان‌نما هیچ ایده‌ای ندارند چگونه ربات‌ها را به‌اندازه‌ی کافی برای مصارف خانگی هوشمند کنند، که این امر به پیشرفت‌های متعددی فراتر از قابلیت‌های فعلی نیاز دارد @theneoniche

کاربردها

دولت اردن یک دستیار یادگیری مبتنی بر هوش مصنوعی به نام Siraj را که بر روی Replit ساخته شده است، برای 1.6 میلیون دانش‌آموز و 90 هزار معلم در مدارس دولتی راه‌اندازی کرد؛ این پروژه‌ی آزمایشی در کمتر از یک ماه توسط یک نفر ساخته شد @Replit
Perplexity Finance اکنون به کاربران امکان می‌دهد به تماس‌های مربوط به گزارش‌های مالی گوش دهند و به‌زودی امکان پرسش‌های صوتی را در طول جریان‌های صوتی فراهم خواهد کرد @AravSrinivas
مایکروسافت Copilot Groups را برای همکاری در لحظه معرفی کرد که به تیم‌ها اجازه می‌دهد با کمک هوش مصنوعی طوفان فکری کنند، مشترکاً بنویسند، برنامه‌ریزی کنند یا با هم مطالعه کنند @satyanadella
OpenAI پروژه‌های مشترک (Shared Projects) را برای کاربران رایگان، پلاس و پرو راه‌اندازی کرد، که امکان کار مشارکتی در ChatGPT را با چت‌ها، فایل‌ها و دستورالعمل‌های مشترک فراهم می‌کند @OpenAI
Sora در حال افزودن حضور افتخاری شخصیت‌ها (cameos)، ابزارهای ویرایش ویدیو، قابلیت‌های اجتماعی بهبودیافته و پشتیبانی از اپلیکیشن اندروید است، با حضورهای افتخاری شخصیت‌های پرطرفدار که در لحظه نمایش داده می‌شوند @billpeeb
ابزارهای ویرایش عکس Meta AI اکنون در استوری‌های اینستاگرام در دسترس هستند، که به کاربران امکان می‌دهد آنچه را که می‌خواهند اضافه، حذف یا تغییر دهند، توصیف کنند @TechCrunch
Microsoft Edge Copilot Mode را معرفی کرد، یک مرورگر هوش مصنوعی که کاربران را در جایی که در تب‌ها رها کرده‌اند، دنبال می‌کند و اقدامات چند مرحله‌ای را تکمیل می‌کند @satyanadella

پژوهش‌ها

پژوهشگران هوش مصنوعی برکلی یک سازوکار «حدس و پالایش» (Guess-then-Refine) را در مدل‌های زبان بزرگ (LLM) کشف کردند، که در آن لایه‌های اولیه توکن‌های با فرکانس بالا را به‌عنوان حدس پیش‌بینی می‌کنند و لایه‌های بعدی با شکل‌گیری زمینه، آن‌ها را پالایش می‌کنند @akshatgupta57
پژوهشگران هوش مصنوعی برکلی Omni-Scan را ارائه دادند، یک روش نوین برای اسکن 360 درجه و بازسازی اشیا توسط ربات‌های د وست با استفاده از 3D Gaussian Splats @ZehanMa123
Hugging Face و Meta «OpenEnv» را راه‌اندازی کردند، یک رابط محیط RL جهانی که محیط‌های یادگیری تقویتی پیشرو را برای جامعه‌ی منبع‌باز فراهم می‌کند @_lewtun
مدل llama-embed-nemotron-8b انویدیا به جایگاه شماره 1 جدید در جدول رده‌بندی بنچمارک MTEB Embedding دست یافت و با میانگین 69.46 در تمام وظایف، Gemini و Qwen3 را شکست داد @TheAhmadOsman
ایتان مولیک مشاهده کرد که تولید ویدیوی هوش مصنوعی، ثبات بصری را در کلیپ‌های متعدد بهتر از ثبات صوتی حفظ می‌کند، با اشاره به اینکه ویدیو می‌تواند از فریم‌های قبلی تولید شود، در حالی که دارای ویژگی‌های مدل جهانی است @emollick

اخبار هوش مصنوعی در 2025-10-22

مدل‌های جدید هوش مصنوعی

گوگل الگوریتم کوانتومی پیشگامانه‌ی Quantum Echoes را که بر روی تراشه‌ی Willow اجرا می‌شود، با دستیابی به اولین مزیت کوانتومی قابل‌تأیید و ۱۳,۰۰۰ برابر سرعت بیشتر نسبت به سوپرکامپیوترهای کلاسیک برای تعاملات مولکولی، معرفی کرد. @sundarpichai
PyTorch نسخه‌ی ExecuTorch 1.0 را منتشر کرد که امکان استقرار بی‌دردسر مدل‌های PyTorch را بر روی دستگاه‌های لبه‌ای بدون نیاز به تبدیل یا بازنویسی فراهم می‌کند. @PyTorch
PyTorch API torchcomms را برای برنامه‌نویسی توزیع‌شده معرفی کرد که از مقیاس‌پذیری، تحمل خطا و قابلیت توسعه با بک‌اند‌های ارتباطات جمعی پشتیبانی می‌کند. @PyTorch
PyTorch زبان توسعه‌ی هسته‌ی Helion را معرفی کرد که توسعه‌ی هسته‌های سفارشی را شبیه به نوشتن کد معمولی PyTorch می‌کند. @PyTorch
Pokee AI نسخه‌ی PokeeResearch-7B را به‌عنوان یک عامل پژوهشی عمیق متن‌باز پیشرفته منتشر کرد که از تمام عوامل پژوهشی عمیق ۷ میلیارد پارامتری دیگر بهتر عمل می‌کند. @Pokee_AI
AI2 نسخه‌ی olmOCR 2 را به‌روزرسانی کرد که PDFها و اسکن‌ها را به متن تمیز تبدیل می‌کند و از جداول، معادلات و دست‌خط با استفاده از داده‌های مصنوعی و تست‌های واحد پشتیبانی می‌کند. @allen_ai
مایکروسافت خبر از یک اطلاعیه‌ی قریب‌الوقوع با پیام پیش‌نمایش «این پنجشنبه، وقت آن است که واقعیت را آشکار کنیم.» در ساعت ۹ صبح به وقت اقیانوس آرام داد. @Copilot

تحلیل صنعت

بلومبرگ گزارش داد که Anthropic در حال مذاکره با گوگل برای یک قرارداد محاسباتی به ارزش «چند ده میلیارد» دلار است. @AndrewCurran_
بر اساس گزارش Axios، الکساندر وانگ (Alexandr Wang) ظاهراً در حال اعمال کاهش‌های قابل‌توجهی در بخش پژوهشی FAIR متا است. @AndrewCurran_
تحلیل‌ها نشان می‌دهد که توسعه‌ی هوش مصنوعی می‌تواند نیازمند گسترش عظیم زیرساخت‌ها باشد، و سناریوی رشد انفجاری منجر به ۲ تریلیون دلار سرمایه‌گذاری سالانه‌ی هوش مصنوعی تا سال ۲۰۳۰ و مصرف برق جهانی هوش مصنوعی دو برابر تولید برق فعلی ایالات متحده خواهد شد. @dwarkesh_sp
یک مدیر استخدام گزارش می‌دهد که اگر نامزدهای مهندسی نرم‌افزار با «کدنویسی ویبی» (vibe coding) تجربه نداشته باشند، این یک پرچم قرمز است، که نشان‌دهنده‌ی تغییر در انتظارات صنعت است. @chipro
بازار کار جدید فناوری به‌طور فزاینده‌ای شبیه به بازارهای سنتی مشاغل یقه‌سفید می‌شود و ارجاعات، سوابق، تبار و بررسی‌های دقیق پیشینه اهمیت بیشتری پیدا می‌کنند. @GergelyOrosz
اسپاتیفای (Spotify) نسخه‌ی میزبانی‌شده‌ی محصول ابزار توسعه‌ی Backstage را راه‌اندازی کرد، اگرچه موفقیت آن با توجه به اینکه تمرکز اصلی آن‌ها نیست، نامشخص است. @GergelyOrosz
تحلیل Coatue نشان می‌دهد که ما در حباب هوش مصنوعی نیستیم، بر اساس چهار معیار: نسبت قیمت به درآمد (P/E) نزدیک به سطوح دات‌کام نیست، هزینه‌های سرمایه‌ای (CapEx) توسط جریان نقدی تأمین می‌شود، ارزش‌گذاری‌های فناوری کمتر از سال ۱۹۹۹ است، و تمرکز بازار لزوماً منفی نیست. @deedydas
a16z دوره‌ی کنونی را «بزرگ‌ترین ابرچرخه‌ی زیرساختی در تاریخ» که بنیان خود هوش را می‌سازد، توصیف می‌کند. @JenniferHli
آنیش آچاریا (Anish Acharya) اشاره می‌کند که توسعه‌ی کد هوش مصنوعی «بازار نیست، بلکه یک صنعت است» که قابلیت ارائه‌ی ایده‌ها در یک روز را دارد، در حالی که تنها ۱ درصد از نرم‌افزارهای مورد نیاز ساخته شده است. @illscience
Perplexity به برنامه‌ی شماره‌ی یک در برزیل در تمام دسته‌بندی‌ها تبدیل شد. @AravSrinivas

اخلاق و جامعه

شخصیت‌های برجسته از جمله ریچارد برانسون (Richard Branson)، استیو وزنیاک (Steve Wozniak)، یوشوا بنجیو (Yoshua Bengio)، جفری هینتون (Geoffrey Hinton) و استوارت راسل (Stuart Russell) بیانیه‌ای را امضا کردند که خواستار توقف تلاش‌های انسانی برای ایجاد ابرهوش تا زمانی که بتوان آن را با ایمنی و کنترل انجام داد، می‌شود. @AndrewCurran_
هایدی خالف (Heidy Khlaaf) همکاری Anthropic با وزارت انرژی (DOE) برای جلوگیری از ساخت سلاح‌های هسته‌ای توسط Claude را «نمایش امنیتی» می‌نامد، و هشدار می‌دهد که خطر واقعی، دسترسی شرکت‌های هوش مصنوعی به داده‌های امنیت ملی است. @AINowInstitute
مطالعه‌ی استنفورد نشان می‌دهد که شرکت‌های پیشرو هوش مصنوعی مکالمات کاربران را برای آموزش جمع‌آوری می‌کنند، که نگرانی‌هایی را درباره‌ی حریم خصوصی برای کاربران چت‌بات‌ها ایجاد می‌کند. @StanfordHAI
سایمون ویلسون (Simon Willison) آسیب‌پذیری تزریق پرامپت در عامل مرورگر Fellou را نشان می‌دهد، و نشان می‌دهد که می‌توان آن را با دستورالعمل‌های مخرب صفحه‌ی وب فریب داد تا داده‌ها را از حساب Gmail کاربر سرقت کند. @simonw
گرگلی اوروز (Gergely Orosz) نگرانی‌های امنیتی خود را در مورد مرورگرهای هوش مصنوعی ابراز می‌کند، با ذکر آسیب‌پذیری‌های تزریق پرامپت و عدم تمایل به اعتماد به آن‌ها با داده‌های حساس مانند ایمیل، بانکداری و رمز عبور. @GergelyOrosz
OpenAI درخواستی قانونی به خانواده‌ی آدام رین (Adam Raine) ۱۶ ساله که پس از مکالمات ChatGPT خودکشی کرده بود، ارسال کرد، و لیست شرکت‌کنندگان در مراسم یادبود و عکس‌ها را درخواست کرد، که وکلا آن را «آزار و اذیت عمدی» می‌نامند. @CristinaCriddle
متا (Meta) سیاست‌های خود را تغییر می‌دهد تا سرویس ۱-۸۰۰-ChatGPT از OpenAI پس از ۱۵ ژانویه‌ی ۲۰۲۶ بر روی واتساپ (WhatsApp) کار نکند. @OpenAI

کاربردها

اندرو نگ (Andrew Ng) دوره‌ی «حاکمیت عوامل هوش مصنوعی» (Governing AI Agents) را با Databricks راه‌اندازی کرد که ایمنی، امنیت و شفافیت داده‌ها را برای جریان‌های کاری عوامل هوش مصنوعی، از جمله کنترل دسترسی به داده‌ها و حفاظت از حریم خصوصی آموزش می‌دهد. @AndrewYNg
گوگل دیپ‌مایند (Google DeepMind) و UCL یک برنامه‌ی آموزشی رایگان «مبانی پژوهش هوش مصنوعی» (AI Research Foundations) را در Google Skills منتشر کردند با درس‌هایی از سرپرستان Gemini درباره‌ی کدنویسی و تنظیم دقیق مدل. @GoogleDeepMind
Gemini با هدست‌های Android XR ادغام می‌شود و کمک بلادرنگ را در سراسر برنامه‌ها و بازی‌ها با قابلیت پرسش درباره‌ی محیط اطراف ارائه می‌دهد. @GeminiApp
عامل Cigna شرکت Sierra در کمتر از دو ماه وارد مرحله‌ی تولید شد و به کاهش ۸۰ درصدی در زمان احراز هویت اعضا دست یافت. @btaylor
استنفورد مدل T* را توسعه داد که درک ویدیوی بلند را به‌عنوان جستجوی زمانی بازنگری می‌کند، و اطلاعات کلیدی را در انبوهی از ویدیوها تنها با چند فریم پیدا می‌کند. @StanfordAILab
برایان بیشوف (Bryan Bischof) پروژه‌ی semantic.art را ایجاد کرد که نمایش‌های برداری چندگانه را برای جستجوی هنر فراتر از جستجوی سنتی با کلمات کلیدی نشان می‌دهد، و محدودیت‌های رویکردهای تک‌تعبیه‌ای (single-embedding) را آشکار می‌کند. @HamelHusain
تسلا (Tesla) گزارش داد که فناوری Autopilot تقریباً ۹ برابر ایمن‌تر از میانگین ایالات متحده است. @Tesla_AI
آمازون (Amazon) عینک‌های تحویلی را توسعه داد که دستورالعمل‌های دقیق و اطلاعات خطرات را مستقیماً در میدان دید رانندگان فراهم می‌کند تا زمان تحویل را کاهش دهد. @TechCrunch

پژوهش‌ها

چندین استاد ریاضی تأیید می‌کنند که هوش مصنوعی می‌تواند برخی از مسائل باز ریاضی را با راهنمایی حل کند، هرچند هنوز به دستاوردهای بزرگی نرسیده است، با مدل‌هایی که به سطوح «کار کردن با آن مانند یک دانشجوی کارشناسی ارشد» برای تسریع دانشگاهی رسیده‌اند. @emollick
ایتان مولیک (Ethan Mollick) به سردرگمی پایدار بین علم داده/یادگیری ماشین کلاسیک و هوش مصنوعی مولد که هر دو «هوش مصنوعی» نامیده می‌شوند، اشاره می‌کند، که منجر به سیاست‌گذاری‌های مغشوش، رهبری شرکت‌ها و بحث‌های آکادمیک می‌شود. @emollick
فرانسوا شوله (François Chollet) بیان می‌کند که «تمام هوش تعمیم‌یافتگی است. بقیه فقط جستجو است.» @fchollet
Kaggle معیار «گشایش‌های شطرنج» (Chess Openings) را راه‌اندازی کرد که استدلال فراتر از حفظ کردن را آزمایش می‌کند، با بازی‌هایی که از ۲۰ گشایش محبوب آغاز می‌شوند تا مدل‌ها را فراتر از الگوهای یادگرفته شده پیش ببرد. @kaggle
پژوهشگران IBM و دانشگاه واشینگتن (University of Washington) مجموعه‌داده‌ای شامل ۱.۵ میلیون سناریوی وظیفه را در Hugging Face منتشر کردند که برای بهبود تعاملات عامل‌ها با جهان طراحی شده است. @IBMResearch
هامل حسین (Hamel Husain) و برایان بیشوف (Bryan Bischof) هکاتون «مهندسی زمینه» (Context Engineering) را برگزار کردند که کیفیت عامل را به‌طور عینی از طریق افشای ارزیابی تدریجی اندازه‌گیری می‌کند تا مهارت‌ها را فراتر از ارائه‌ی سطحی آزمایش کند. @HamelHusain
داده‌های نظرسنجی نشان می‌دهد که استفاده از هوش مصنوعی مولد (GenAI) در میان کارگران آمریکایی از ۴۵.۶ درصد در ماه ژوئن به ۳۶.۷ درصد در ماه سپتامبر کاهش یافته است، که نشان‌دهنده‌ی کاهش احتمالی در پذیرش آن است. @Jon_Hartley_

اخبار هوش مصنوعی در 2025-10-21

مدل‌های جدید هوش مصنوعی

علی‌بابا مدل‌های Qwen3-VL-2B و Qwen3-VL-32B را منتشر کرد؛ نسخه‌ی ۳۲ میلیارد پارامتری این مدل در زمینه‌های STEM، VQA، OCR، درک ویدئو و وظایف عاملی، از GPT-5 mini و Claude 4 Sonnet عملکرد بهتری دارد و با مدل‌هایی تا ۲۳۵ میلیارد پارامتر برابری می‌کند @Alibaba_Qwen
علی‌بابا Qwen Deep Research را ارتقا داد تا با استفاده از Qwen3-Coder، Qwen-Image و Qwen3-TTS، نه تنها گزارش، بلکه صفحات وب زنده و پادکست نیز تولید کند @Alibaba_Qwen
OpenAI مرورگر ChatGPT Atlas را راه‌اندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی برای macOS که می‌تواند صفحات وب را ببیند، به سؤالات در چارچوب متن پاسخ دهد و وظایف را از طریق حالت عاملی (agent mode) برای کاربران Plus و Pro تکمیل کند @OpenAI
Veo 3.1 گوگل با پیشرفت‌های قابل‌توجه نسبت به Veo 3.0 در زمینه‌ی تولید متن به ویدئو (۳۰+ امتیاز) و تصویر به ویدئو (۷۰+ امتیاز)، در صدر جدول امتیازات ویدئویی LMArena قرار گرفت @demishassabis
گوگل یک تجربه‌ی کدنویسی جدید با اولویت‌بخشی به هوش مصنوعی را در AI Studio راه‌اندازی کرد که برای ساخت اپلیکیشن‌های هوش مصنوعی با Gemini بهینه شده است @OfficialLoganK

تحلیل صنعت

مدیر عامل Airbnb وابستگی شدید این شرکت به مدل Qwen علی‌بابا را برای استفاده در تولید فاش کرد و آن را «بسیار خوب، سریع و ارزان» توصیف کرد، در حالی که به دلیل ملاحظات هزینه‌ای، کمتر از آخرین مدل‌های OpenAI استفاده می‌کند @natolambert
قطعی AWS نشان می‌دهد چگونه وابستگی‌های ابری می‌توانند محصولات به ظاهر محلی را از کار بیندازند؛ به طوری که ابزار توسعه‌ی API پست‌من (Postman) و تخت‌های هوشمند Eight Sleep در طول این قطعی غیرقابل استفاده شدند @GergelyOrosz
مدیر عامل Cloudflare از رگولاتورها خواست تا جلوی اقدامات گوگل در زمینه‌ی هوش مصنوعی را بگیرند و استدلال کرد که سلطه‌ی این غول فناوری در جستجو، به آن یک برتری ناعادلانه در رقابت هوش مصنوعی می‌دهد @TechCrunch
برادران وارنر (Warner Bros) فروش احتمالی دارایی‌های رسانه‌ای خود را پس از ابراز علاقه‌ی چندین طرف از جمله نتفلیکس بررسی می‌کند، که می‌تواند دسترسی به IP (دارایی‌های فکری) اصلی را برای اپلیکیشن‌های رسانه‌ی مولد تحت تأثیر قرار دهد @AndrewCurran_

اخلاق و جامعه

سایمون ویلیسون (Simon Willison) نگرانی‌های خود را در مورد عامل‌های مرورگر (browser agents) ابراز کرد و اظهار داشت که چالش‌های امنیتی و حریم خصوصی برای این دسته از محصولات همچنان حل‌نشدنی باقی مانده‌اند @simonw
استنفورد با چالش‌هایی روبروست که دانشجویان از ChatGPT برای تقلب در امتحانات میان‌ترم استفاده می‌کنند، اما اساتید نمی‌توانند به دلیل سیاست‌های منشور اخلاقی که برای تغییر آن‌ها فرآیندهای بوروکراتیک چندساله لازم است، بر امتحانات نظارت کنند @polynoamial
پژوهش‌ها نشان می‌دهد که ۶۶٪ از آمریکایی‌ها هرگز از ChatGPT استفاده نکرده‌اند؛ و یک مقاله‌ی جدید استدلال می‌کند که پژوهش‌های LLM (مدل‌های زبان بزرگ) بر اساس نیازهای پذیرندگان شکل می‌گیرد، در حالی که نیازهای کاربران غیرپذیرنده نادیده گرفته می‌شوند @KaitlynZhou
یوتیوب فناوری تشخیص شباهت را راه‌اندازی کرد که به تولیدکنندگان محتوا اجازه می‌دهد درخواست حذف محتوای هوش مصنوعی ساخته‌شده با استفاده از چهره و صدای آن‌ها را بدهند @TechCrunch

کاربردها

Anthropic پشتیبانی از sandbox را در Claude Code CLI راه‌اندازی کرد تا CLI را ایمن‌تر و سریع‌تر کند و با دسترسی کنترل‌شده به دایرکتوری و شبکه، درخواست‌های مجوز را تا ۸۴٪ کاهش دهد @_catwu
مایکروسافت ریسرچ (Microsoft Research) SentinelStep را معرفی کرد تا عامل‌های هوش مصنوعی را قادر سازد وظایف نظارتی طولانی‌مدت را مدیریت کنند؛ وظایفی مانند رصد ایمیل‌ها یا ردیابی قیمت‌ها، با مدیریت زمان بررسی عامل‌ها و زمینه‌ی آن‌ها @MSFTResearch
Serval از مدل‌های هوش مصنوعی عاملی (agentic AI) برای خودکارسازی مدیریت خدمات IT استفاده می‌کند؛ با رویکردی منحصربه‌فرد که از قدرت‌های هوش مصنوعی عاملی بهره می‌برد و در عین حال از مشکلات رایج اجتناب می‌کند @TechCrunch
واتس‌اپ و مسنجر (Messenger) قابلیت‌های ایمنی مبتنی بر هوش مصنوعی را پیاده‌سازی کردند؛ به طوری که واتس‌اپ پیش از اشتراک‌گذاری صفحه با مخاطبین ناشناس به کاربران هشدار می‌دهد و مسنجر پیام‌های مشکوک را علامت‌گذاری می‌کند @TechCrunch
گوگل تماس‌های تلفنی را با صدای بهبودیافته توسط هوش مصنوعی ارتقا می‌دهد تا نویز پس‌زمینه را کاهش داده و وضوح صدا را بهبود بخشد، حتی هنگام صحبت با خطوط ثابت یا دستگاه‌های قدیمی‌تر @TechCrunch
ربات خانگی Moflin کاسیو (Casio) از هوش مصنوعی برای توسعه‌ی شخصیت در طول زمان استفاده می‌کند که نشان‌دهنده‌ی پیشرفت‌ها در دستگاه‌های همدم مبتنی بر هوش مصنوعی است @TechCrunch

پژوهش‌ها

پژوهش جدیدی مکانیسم‌های Claude Haiku را برای انجام وظایف ادراکی مهندسی معکوس می‌کند و خانواده‌های ویژگی‌ها، منیفولدها، تبدیل‌های هندسی و الگوریتم‌های توجه توزیع‌شده را کشف می‌کند @wesg52
آندری کارپاتی (Andrej Karpathy) بررسی می‌کند که آیا پیکسل‌ها ورودی‌های بهتری برای LLMها نسبت به توکن‌های متنی هستند یا خیر، و پیشنهاد می‌دهد که رندر کردن متن به عنوان تصویر می‌تواند فشرده‌سازی اطلاعات بهتر، جریان‌های ورودی عمومی‌تر و حذف وابستگی‌های توکن‌ساز را فراهم کند @karpathy
پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی همچنان در معیارهای پزشکی در حال بهبود هستند و در بسیاری از موارد هوش مصنوعی کنونی از پزشکان انسانی پیشی می‌گیرد، اگرچه مطالعات عملکرد در دنیای واقعی همچنان محدود است @emollick
مطالعات، بحث درباره‌ی زمان استفاده از هوش مصنوعی برای برچسب‌گذاری داده‌ها را بررسی می‌کنند، با یافته‌هایی که نشان می‌دهد پاسخ‌های هوش مصنوعی با انسان‌ها متفاوت است اما ممکن است گاهی بهتر باشد، که چالش برچسب‌گذاری داده‌ها در توسعه‌ی هوش مصنوعی را برجسته می‌کند @emollick
هوش مصنوعی برکلی (Berkeley AI) ربات Botany-Bot را در IROS 2025 ارائه می‌کند که مدل‌های سه‌بعدی تقسیم‌بندی‌شده از گیاهان را با استفاده از Gaussian splats ایجاد می‌کند و از بازوهای رباتیک برای آشکار کردن جزئیات پنهان آناتومی گیاه برای فنوتیپینگ استفاده می‌کند @funmilore
تحلیل «خودبازی» (self-play) در هوش مصنوعی نشان می‌دهد که چرا این روش برای بازی‌های دو نفره با مجموع صفر مانند شطرنج و پوکر خوب عمل می‌کند، اما به دلیل اینکه استراتژی‌های تعادلی از مطلوبیت انسانی جدا هستند، در دامنه‌های دنیای واقعی با چالش‌هایی روبرو می‌شود @polynoamial

اخبار هوش مصنوعی در 2025-10-20

مدل‌های جدید هوش مصنوعی

آنتروپیک (Anthropic) کلود برای علوم زیستی (Claude for Life Sciences) را با رابط‌های جدید برای ابزارهای علمی مانند Benchling، PubMed و Synapse.org، به‌علاوه‌ی قابلیت‌های عامل (Agent Skills) برای دنبال کردن پروتکل‌های علمی به شکلی پایدار و یکنواخت معرفی کرد @AnthropicAI
آنتروپیک کلود کد (Claude Code) را برای وب و iOS منتشر کرد، که به کاربران امکان می‌دهد وظایف کدنویسی را بدون نیاز به باز کردن ترمینال واگذار کنند @claudeai
DeepSeek یک مدل OCR 3B جدید عرضه کرد که برای بهره‌وری توکن بهینه‌سازی شده و قادر به پردازش بیش از ۲۰۰ هزار صفحه در روز بر روی A100-40G است @reach_vb
Veo 3.1 گوگل با جهشی ۳۰ امتیازی نسبت به Veo 3.0، در هر دو جدول رده‌بندی تبدیل متن به ویدئو و تصویر به ویدئو در رتبه‌ی اول قرار گرفت و به اولین مدلی تبدیل شد که در تاریخ Video Arena امتیاز ۱۴۰۰ را پشت سر می‌گذارد @arena
گوگل قابلیت‌های جدید ویرایش دقیق را برای Veo معرفی کرد که امکان افزودن یا حذف عناصر از صحنه‌های ویدئویی را فراهم می‌کنند، در حالی که یکپارچگی ویدئوی اصلی حفظ می‌شود @GoogleDeepMind

تحلیل صنعت

داریو آمودی، مدیر عامل Anthropic، اظهار داشت که آن‌ها می‌خواهند «درصد قابل توجهی از تمام کارهای علوم زیستی در جهان بر روی کلود اجرا شود» و معتقد است که ما در حال نزدیک شدن به نقطه‌ی عطفی برای پیشرفت‌های بیولوژیکی مدل‌های زبان بزرگ (LLM) هستیم @AndrewCurran_
گوگل انتظار دارد که تا پایان سال، داروهای طراحی‌شده با هوش مصنوعی را وارد آزمایش‌های بالینی کند، که نشان‌دهنده‌ی پیشرفت سریع در کاربردهای هوش مصنوعی در صنعت داروسازی است @AndrewCurran_
OpenAI محدودیت‌های کپی‌رایت Sora را تشدید کرد، پس از آنکه برایان کرانستون، ستاره‌ی Breaking Bad، خود را در نسل‌های Sora 2 دید و با SAG-AFTRA تماس گرفت که منجر به بیانیه‌ی مشترکی در مورد حفاظت از صدا و شباهت شد @AndrewCurran_
قطعی بزرگ AWS بر بسیاری از سرویس‌های هوش مصنوعی از جمله Perplexity تأثیر گذاشت، که نشان‌دهنده‌ی وابستگی‌های زیرساختی در استقرار هوش مصنوعی است @AravSrinivas
رید هافمن بر اهمیت حمایت از «افراد خوب» در حوزه‌ی هوش مصنوعی تأکید کرد و به طور خاص Anthropic، مایکروسافت، گوگل و OpenAI را به خاطر استقرار هوش مصنوعی به شیوه‌ای متفکرانه و ایمن ستود @reidhoffman

اخلاق و جامعه

SAG-AFTRA، OpenAI، برایان کرانستون و آژانس‌های استعدادیابی با یکدیگر همکاری می‌کنند تا از حفاظت صدا و شباهت در Sora 2 اطمینان حاصل کنند، به دنبال نگرانی‌ها در مورد استفاده‌ی غیرمجاز از شباهت بازیگران @sagaftra
گرگلی اوروس (Gergelyorosz) به پدیده‌ی حساب‌های ناشناسی اشاره می‌کند که در رسانه‌های اجتماعی، پاسخ‌های تولیدشده با هوش مصنوعی را منتشر می‌کنند و متذکر می‌شود که فراگیر شدن هوش مصنوعی چگونه به کاهش اعتماد و تجربه‌ی بدتر در رسانه‌های اجتماعی منجر می‌شود @GergelyOrosz
رید هافمن هشدار می‌دهد که مکالمات مربوط به ایمنی هوش مصنوعی را به کلیشه‌ها یا زنگ‌های خطر محدود نکنیم و بر لزوم گفت‌وگوی متفکرانه در مورد استفاده‌ی مسئولانه از هوش مصنوعی برای میلیاردها انسانی که زندگی‌شان با هوش مصنوعی تغییر خواهد کرد، تأکید می‌کند @reidhoffman

کاربردها

شرکت‌هایی مانند Sanofi، AbbVie و Novo Nordisk هم‌اکنون از کلود برای تحقیقات علوم زیستی از مراحل اولیه‌ی کشف تا تجاری‌سازی استفاده می‌کنند @AnthropicAI
Sierra با R1 شریک شد تا فناوری هوش مصنوعی را به کار گیرد برای خودکارسازی بیش از ۴۰ میلیون تماس در سال با بیماران و پرداخت‌کنندگان هزینه‌ها در مدیریت درآمد مراقبت‌های بهداشتی @btaylor
گوگل ترکیب Veo 3.1 با Nano Banana را به نمایش گذاشت برای تنظیم دقیق لباس، مدل مو و پس‌زمینه‌ی شخصیت‌های ویدئویی پیش از تولید ویدئوهای نهایی @GeminiApp
سایمون ویلسون (Simon Willison) با موفقیت مدل OCR DeepSeek را بر روی سخت‌افزار NVIDIA Spark مستقر کرد، با استفاده از Claude Code به عنوان روت، که جریان‌های کاری عملی استقرار مدل هوش مصنوعی را نشان می‌دهد @simonw
TechCrunch در مورد OpenEvidence، پلتفرمی که بر اساس مقالات پزشکی JAMA و New England Journal of Medicine آموزش دیده است، گزارش می‌دهد و به متخصصان پزشکی تأییدشده کمک می‌کند تا به سرعت به دانش پزشکی موجود برای درمان بیماران دسترسی پیدا کنند @TechCrunch

پژوهش‌ها

ایتان مالیک (Ethan Mollick) قابلیت‌های شبیه‌سازی پیشرفته‌ی Veo 3.1 را به نمایش می‌گذارد و نشان می‌دهد که چگونه می‌تواند سناریوهای جدید فیزیکی مانند «سه کشتی اسباب‌بازی، یکی از آهن، یکی از چوب و دیگری از شکر، که در آب می‌افتند» را با دینامیک‌های شگفت‌انگیز دقیق مدیریت کند @emollick
کارپاتی (Karpathy) تفاوت‌های اساسی بین رویکردهای خودرگرسیو (autoregressive) و انتشار (diffusion) در هوش مصنوعی را توضیح می‌دهد و اشاره می‌کند که انتشار از توجه دوطرفه (bidirectional attention) برای بازسازی مکرر بوم توکن (token canvas) استفاده می‌کند، در حالی که خودرگرسیون توکن‌ها را به صورت متوالی اضافه می‌کند @karpathy
ناتان لمبرت (Nathan Lambert) مقاله‌ی ScaleRL را بررسی می‌کند و مؤلفه‌های کلیدی برای مقیاس‌پذیری یادگیری تقویتی را برجسته می‌کند: نمونه‌برداری با اهمیت (importance sampling)، به‌روزرسانی‌های حین اجرا (in-flight updates) و دسته‌بندی پیوسته (continuous batching) @natolambert
دیلیپ جورج (Dileep George) استدلال می‌کند که مقیاس‌بندی مدل‌های زبان بزرگ (LLM) و مدل‌های چندوجهی کنونی (VLM) به هوش عمومی مصنوعی (AGI) منجر نخواهد شد و دوران کنونی هوش مصنوعی را با دوران کشتی‌های هوایی در هوانوردی مقایسه می‌کند که در آن مهندسان به جای حل مسائل بنیادی، بر مقیاس‌بندی تمرکز کرده بودند @dileeplearning
امولیک (Emollick) بحث می‌کند که چگونه عامل‌های هوش مصنوعی (AI agents) هزینه‌های تراکنش و مشکلات نمایندگی (agency problems) را به شدت تغییر خواهند داد، با پیامدهایی برای نحوه‌ی سازماندهی بازارها و شرکت‌ها، حتی با عامل‌های ناقصی که صرفاً موانع جمع‌آوری اطلاعات را کاهش می‌دهند @emollick
فرانسوا شوله (Francois Chollet) GPTQ را به عنوان یک روش کوانتیزاسیون پس از آموزش (post-training quantization) توضیح می‌دهد که مدل‌ها را با استفاده از روش‌های مرتبه‌ی دوم، لایه به لایه به int4 فشرده می‌کند و اکنون در Keras 3 تعبیه شده است @fchollet
Berkeley AI، ECHO را معرفی می‌کند؛ یک معیار جدید تولید تصویر «در محیط واقعی» (in-the-wild) که مدل‌های جدید تصویر و موارد استفاده‌ی مورد بحث در رسانه‌های اجتماعی را که معیارهای قدیمی پوشش نمی‌دهند، آزمایش می‌کند @aomaru_21490
Anthrogen Bio، Odyssey را معرفی کرد؛ یک مدل زبان پروتئین با ۱۰۲ میلیارد پارامتر که مکانیزم سلف-اتنشن (self-attention) را با معماری جدیدی جایگزین می‌کند و با هدف انتشار (diffusion objective) الهام‌گرفته از تکامل آموزش می‌بیند @gustaf

اخبار هوش مصنوعی در 2025-10-19

مدل‌های جدید هوش مصنوعی

Google AI Studio یک کلید API و صفحه‌ی «پروژه‌ها»ی کاملاً جدید را با مدیریت پروژه‌ی بهبودیافته و امکانات کاربردی، مانند نام‌گذاری کلیدهای API، ارائه داده است. @OfficialLoganK

تحلیل صنعت

فرانسوا شوله استدلال می‌کند که بیش از یک تریلیون دلار سرمایه‌گذاری بر این باور استوار است که هوش عمومی مصنوعی (AGI) قریب‌الوقوع است؛ در حالی که هزینه‌ی فعلی ۱۰ تا ۱۵ دلار برای تولید هر یک دلار است و برای توجیه‌پذیری سرمایه‌گذاری در مراکز داده، به فناوری‌ای به مراتب بهتر ظرف ۳ تا ۵ سال آینده نیاز است. @fchollet
سهم ترافیک Perplexity AI با وجود رقبای جدید، همچنان در حال افزایش است و به‌طور چشمگیری از Grok در عملکرد بازار پیشی گرفته است. @chrmanning
توسعه‌دهندگان از اپلیکیشن‌های «کدنویسی شهودی» برای انجام معاملات الگوریتمی در بازارهای سهام و رمزارز با اهرم ۲ تا ۱۰ برابر استفاده می‌کنند که منجر به کسب بازدهی ماهانه‌ی تا ۵۰ درصد می‌شود و نشان‌دهنده‌ی دموکراتیک‌سازی غیرمنتظره‌ی معاملات الگوریتمی از طریق هوش مصنوعی است. @deedydas
شوله پیشنهاد می‌کند که Adobe به دلیل روایت نادرست از ایجاد اختلال توسط هوش مصنوعی مولد (GenAI) کمتر از ارزش واقعی خود ارزیابی شده است؛ زیرا رشد درآمدی ثابت ۱۰ درصدی خود را حفظ کرده و به احتمال زیاد از GenAI به عنوان یک عامل تقویت‌کننده به جای تهدید بهره‌مند خواهد شد. @fchollet

اخلاق و جامعه

آماندا اسکل نگرانی خود را در مورد روابط عاشقانه‌ی مبتنی بر هوش مصنوعی ابراز می‌کند و خاطرنشان می‌سازد که این روابط می‌توانند کاربران را در برابر شرکت‌های هوش مصنوعی آسیب‌پذیر کنند و حوزه‌ای چالش‌برانگیز برای مدیریت مسئولانه محسوب می‌شوند. @AmandaAskell
TechCrunch شفاف‌سازی می‌کند که GPT-5 در واقع مسائل ریاضی حل‌نشده‌ی قبلی را حل نکرده است و بدین ترتیب به اطلاعات نادرست درباره‌ی قابلیت‌های هوش مصنوعی پاسخ می‌دهد. @TechCrunch

کاربردها

ایتان مولیک توانایی هوش مصنوعی را با بازآفرینی «سخت‌ترین کلاس در علوم انسانی» (Hardest Class in the Humanities) اثر دبلیو. اچ. اودن در سال ۱۹۴۱، به عنوان یک وب‌سایت حاشیه‌نویسی‌شده با ۶۰۰۰ صفحه‌ی مطالب خواندنی تنها با استفاده از ۴ پرامپت، به نمایش گذاشته است؛ کاری که به صورت دستی ساعت‌ها زمان می‌برد. @emollick
اتوماسیون انبار از مدل‌های بینایی Gemini 2.5 Flash با تنظیم دقیق برای تأیید اینکه کانتینرها روی نوار نقاله حاوی اقلام مورد انتظار هستند استفاده می‌کند که صرفه‌جویی قابل توجهی در هزینه نسبت به 2.5 Pro فراهم می‌کند. @simonw
Shopify مدل‌های زبان بزرگ (LLM) بینایی با تنظیم دقیق را که بر پایه‌ی LlaVA 1.5 7B، LLaMA 3.2 11B و Qwen2VL 7B هستند، برای پردازش انبوه عکس‌های محصولات به کار می‌گیرد. @simonw
v0 با استفاده از مدل‌های تنظیم دقیقی که برای پشته‌ی Next.js آن‌ها تخصصی شده‌اند، به زمان پاسخ‌گویی کمتر از ۵۰۰ میلی‌ثانیه برای به‌روزرسانی‌های رابط کاربری (UI) بلادرنگ دست می‌یابد. @simonw

پژوهش‌ها

MIT CSAIL منبعی جامع شامل یک «خلاصه‌ی راهنما» از الگوریتم‌های یادگیری ماشین را برای پژوهشگران و متخصصان به اشتراک می‌گذارد. @MIT_CSAIL
پژوهشگر استنفورد از عامل‌های پژوهشی هوش مصنوعی حمایت می‌کند که بر تقویت پژوهش‌های انسانی از طریق وظایف روزمره‌ی قابل اعتماد، مانند اثبات‌ها، استدلال‌ها و نوشتن کد، تمرکز دارند، نه اینکه تلاش کنند دانشجویان تحصیلات تکمیلی یا اساتید را جایگزین کنند. @stanfordnlp
ناتان لمبرت به دنبال آخرین پیشرفت‌ها در زمینه‌ی آموزش غیرمتمرکز هوش مصنوعی است و به عملیات Prime Intellect، تلاش‌های Nous Research و رویکردهای چندمرکز داده‌ای گوگل اشاره می‌کند. @natolambert

1 2 3 4 5...26