اخبار هوش مصنوعی در 2025-08-20

مدل‌های جدید هوش مصنوعی

  • گوگل مدل تولید ویدیوی Veo 3 را با قابلیت‌های صوتی معرفی کرد که به کاربران امکان می‌دهد کلمات یا عکس‌ها را به ویدیوهای دارای صدا تبدیل کنند. @AndrewCurran_
  • گوگل مدل جدید Gemini Nano را منتشر کرد که سری پیکسل ۱۰ را قدرتمند می‌کند و شامل شخصی‌سازی بهبودیافته و دستیار هوشمند پیشگیرانه است. @Google
  • بایت‌دنس مدل زبان بزرگ (LLM) Seed-OSS 36B را در هاگینگ فیس منتشر کرد که دارای قابلیت‌های قدرتمند درک زمینه‌ی طولانی، استدلال و عاملیت است. @HuggingPapers
  • آی‌بی‌ام و ناسا مدل Surya، اولین مدل بنیادی هوش مصنوعی منبع‌باز برای فیزیک خورشیدی را با ۳۶۶ میلیون پارامتر منتشر کردند که با داده‌های ۹ ساله‌ی رصدخانه‌ی دینامیک خورشیدی برای پیش‌بینی آب‌وهوای فضایی آموزش دیده است. @ClementDelangue
  • مدل VLM هفت میلیارد پارامتری Cosmos Reason انویدیا بیش از ۵۰۰,۰۰۰ بار در هاگینگ فیس دانلود شده است و برای هوش مصنوعی فیزیکی و کاربردهای رباتیک طراحی شده است. @NVIDIAAIDev

تحلیل صنعت

  • پرپلکسیتی (Perplexity) گزارش می‌دهد که بیش از ۳۰۰ میلیون پرس‌وجوی کاربر در هفته را پاسخ می‌دهد که نشان‌دهنده‌ی رشدی سه‌برابری در حدود ۹ ماه نسبت به نقطه‌ی عطف ۱۰۰ میلیون پرس‌وجوی هفتگی قبلی آن‌هاست. @AravSrinivas
  • EliseAI سرمایه‌ی ۲۵۰ میلیون دلاری سری E را به رهبری a16z جذب کرد و به درآمد سالانه‌ی تکرارشونده (ARR) بیش از ۱۰۰ میلیون دلار رسید. این شرکت به عنوان مدیر املاک و مستغلات و مدیر بهداشت و درمان مبتنی بر هوش مصنوعی، به اصطکاک و مشکلات در صنایع مسکن و بهداشت و درمان می‌پردازد. @aleximm
  • گِرگِلی اوروسز (Gergely Orosz) اوج هایپ هوش مصنوعی را مشاهده می‌کند؛ سرمایه‌گذاران در استارتاپ‌های مشکوک هوش مصنوعی مانند شرکت‌های تولید تشک که از هوش مصنوعی برای «بهبود خواب» استفاده می‌کنند و جواهرات مجهز به هوش مصنوعی، سرمایه‌گذاری می‌کنند که نشان‌دهنده‌ی تصمیمات سرمایه‌گذاری ناشی از ترس از دست دادن (FOMO) است. @GergelyOrosz
  • مایکروسافت از توسعه‌ی همکاری با NFL خبر داد و Copilot و Azure AI Foundry را به عملیات فوتبال هم در زمین و هم خارج از آن می‌آورد. @satyanadella
  • انتروپیک (Anthropic) Claude Code را برای طرح‌های «تیم» و «سازمان» با قیمت‌گذاری منعطف راه‌اندازی کرد که به سازمان‌ها اجازه می‌دهد ترکیب کرسی‌های استاندارد و پریمیوم را در تیم‌های خود استفاده کنند. @claudeai

اخلاق و جامعه

  • دانشجویان هاروارد که قبلاً یک برنامه‌ی تشخیص چهره را برای عینک‌های ری-بن متا توسعه داده بودند، در حال راه‌اندازی یک استارتاپ برای ساخت عینک‌های هوشمند با میکروفون‌های همیشه روشن هستند که نگرانی‌هایی را در مورد حریم خصوصی ایجاد می‌کند. @TechCrunch
  • گِرگِلی اوروسز پیشنهاد می‌کند که رایج شدن ابزارهای هوش مصنوعی به افراد غیرفنی کمک خواهد کرد تا درک کنند چرا ساخت نرم‌افزار خوب دشوار است، زیرا آن‌ها شکاف بین انتظارات و واقعیت را تجربه خواهند کرد. @GergelyOrosz

کاربردها

  • گوگل Magic Cue را در گوشی‌های پیکسل معرفی کرد که از قابلیت‌های جِمنی (Gemini) برای نمایش پیشگیرانه‌ی اطلاعات و اقدامات مفید در سراسر برنامه‌ها در زمان نیاز استفاده می‌کند. @GoogleAI
  • گوگل فوتوز (Google Photos) قابلیت ویرایش محاوره‌ای را راه‌اندازی کرد که به کاربران امکان می‌دهد تغییرات عکس را با توصیف آن‌ها به زبان طبیعی انجام دهند. @TechCrunch
  • گوگل Voice Translate را برای گوشی‌های پیکسل معرفی کرد که ترجمه‌ی تماس‌ها را به صورت بی‌درنگ با استفاده از صدای تماس‌گیرنده برای مکالمات چندزبانه‌ی معتبرتر امکان‌پذیر می‌کند. @GoogleAI
  • گوگل Camera Coach را معرفی کرد که از مدل‌های جِمنی برای شناسایی صحنه‌ها و ارائه‌ی راهنمایی برای عکس‌های عکاسی عالی استفاده می‌کند. @GoogleAI
  • پرپلکسیتی (Perplexity) قابلیت SuperMemory را در مراحل نهایی آزمایش راه‌اندازی کرد و ادعا می‌کند عملکردی برتر نسبت به راهکارهای حافظه‌ی موجود دارد. @AravSrinivas
  • پرپلکسیتی (Perplexity) حالت Max Assistant را در Comet برای مشترکین معرفی کرد که قادر به انجام وظایف تحقیقاتی طولانی‌مدت به صورت متنی با محتوای خوانده‌شده است. @AravSrinivas
  • سیرا (Sierra) شبیه‌سازی‌های عامل هوش مصنوعی را برای آزمایش نشان می‌دهد که شامل شبیه‌سازی‌های صوتی با نویز پس‌زمینه برای بهبود عملکرد عامل قبل از استقرار است. @btaylor
  • عامل هوش مصنوعی Brex که بر روی پلتفرم سیرا (Sierra) ساخته شده است، ۹۰٪ سریع‌تر به سؤالات مشتریان پاسخ می‌دهد و سالانه ۱۵,۰۰۰ ساعت برای مشتریان صرفه‌جویی می‌کند. @btaylor
  • کربن رباتیکس (Carbon Robotics) از ربات‌های لیزری وجین علف‌های هرز مبتنی بر هوش مصنوعی استفاده می‌کند که ۱۵ میلیارد علف هرز را در بیش از ۱۰۰ نوع محصول بدون استفاده از علف‌کش از بین برده‌اند و افزایش چشمگیری در بازده محصول به ارمغان آورده‌اند. @NVIDIAAI
  • گوگل Pixel Journal، یک برنامه‌ی جدید ژورنال‌نویسی را معرفی کرد که از هوش مصنوعی داخلی دستگاه برای پیشنهادهای نوشتاری شخصی‌سازی‌شده استفاده می‌کند. @TechCrunch
  • گوگل اعلام کرد که یک مربی سلامت شخصی مبتنی بر هوش مصنوعی که با جِمنی ساخته شده است، به دستگاه‌های فیت‌بیت (Fitbit) خواهد آمد. @TechCrunch

پژوهش‌ها

  • مایکروسافت ریسرچ (Microsoft Research) مدل GPT-5 Pro را معرفی کرد که قابلیت اثبات قضیه‌های ریاضی جدید را نشان می‌دهد و با موفقیت کرانی بهتر از آنچه در مقاله‌ی بهینه‌سازی محدب منتشر شده بود، اثبات کرد. @SebastienBubeck
  • پژوهشگران هوش مصنوعی برکلی (Berkeley AI Research) مدل XQuant را ارائه کردند که ۱۰ تا ۱۲.۵ برابر صرفه‌جویی در حافظه نسبت به FP16 (فلوت ۱۶ بیتی) را با از دست دادن دقت نزدیک به صفر، با بهره‌برداری از واحدهای محاسباتی کم‌استفاده برای بازسازی کش KV به دست می‌آورد. @adityastomar_
  • تیم Cursor لایه‌های MoE را در سطح هسته (kernel level) با MXFP8 بازسازی می‌کند که منجر به عملکرد ۳.۵ برابر سریع‌تر لایه‌ی MoE و ۱.۵ برابر افزایش سرعت آموزش سرتاسری می‌شود. @stuart_sul
  • پای‌تورچ (PyTorch) ZenFlow را برای آموزش مدل‌های زبان بزرگ (LLM) با قابلیت تخلیه (offloading) معرفی کرد که ۵ برابر آموزش سریع‌تر، ۸۵٪ توقف کمتر GPU و ۲ برابر سربار ورودی/خروجی (I/O) کمتر را به ارمغان می‌آورد. @PyTorch
  • مایکروسافت ریسرچ (Microsoft Research) مدل MindJourney را منتشر کرد که هوش مصنوعی را قادر می‌سازد تا محیط‌های سه‌بعدی را از ورودی بصری محدود پیمایش و تفسیر کند، برای بهبود وظایف مسیریابی و برنامه‌ریزی. @MSFTResearch
  • ناتان لمبرت (Nathan Lambert) طیف تلاش استدلال در مدل‌های هوش مصنوعی را تحلیل می‌کند و اشاره می‌کند که همه‌ی مدل‌های فعلی از تکنیک‌های یادگیری تقویتی مشابه با مصرف توکن متفاوت استفاده می‌کنند، نه طبقه‌بندی‌های استدلال دوتایی. @natolambert
  • ایتان مولیک (Ethan Mollick) قابلیت‌های تولید ویدیوی هوش مصنوعی را با ساخت موزیک ویدیو از چکیده‌ی مقالات دانشگاهی نشان می‌دهد که نشان‌دهنده‌ی سازگاری در حال تکامل در تولید شخصیت و هماهنگی لب‌ها با صدا است. @emollick
  • سایمون ویلیسون (Simon Willison) مدل Qwen-Image-Edit را روی مک‌بوک پرو M2 با ۶۴ گیگابایت رم آزمایش می‌کند و تصاویر پلیکان رنگین‌کمانی را در ۲۵ دقیقه با ۱۰ مرحله‌ی استنتاج تولید می‌کند، در حالی که برای ۵۰ مرحله‌ی کامل ۲ ساعت و ۵۹ دقیقه طول می‌کشد. @simonw

اخبار هوش مصنوعی در 2025-08-19

مدل‌های جدید هوش مصنوعی

  • اِن‌ویدیا مدل Nemotron-Nano-9B-v2 را منتشر کرد که قابلیت‌های استدلال روشن/خاموش (toggle on/off) دارد و از معماری ترکیبی Mamba2-Transformer با ۱۲۸ هزار واحد کانتکست (context) بهره می‌برد و با ۱۰.۶ تریلیون توکن آموزش دیده است @VentureBeat
  • دیپ‌سیک مدل DeepSeek-V3.1 را در هگینگ فیس (Hugging Face) منتشر کرد @ClementDelangue
  • اوپن‌اِی‌آی (OpenAI) طرح اشتراک ChatGPT Go را در هند با قیمت ۳۹۹ روپیه در ماه (حدود ۴.۵۵ دلار آمریکا) راه‌اندازی کرد که در مقایسه با سطح رایگان، ۱۰ برابر محدودیت‌های پیام بیشتر، ۱۰ برابر تولید تصویر بیشتر و ۱۰ برابر آپلود فایل بیشتر ارائه می‌دهد @nickaturley
  • گوگل قابلیت «کانتکست URL» (URL Context) را برای استفاده در مقیاس تولیدی در API جِمینای (Gemini) آماده کرد که به مدل‌ها اجازه می‌دهد تا مستقیماً از طریق URL به صفحات وب، فایل‌های PDF و تصاویر دسترسی پیدا کنند و قیمت‌گذاری آن بر اساس توکن است @OfficialLoganK

تحلیل صنعت

  • پرپلکسیتی (Perplexity) رشد قابل‌توجهی را نشان می‌دهد؛ اپلیکیشن iOS آن در ۱۰ ماه گذشته در بین ۱۰ اپ برتر دسته‌بندی «بهره‌وری» (Productivity) قرار گرفته و ارزش‌گذاری آن بیش از ۴ برابر افزایش یافته است @alexgraveley
  • مِتا (Meta) بخش هوش مصنوعی خود را به چهار گروه جدید بازسازی می‌کند؛ مارک زاکربرگ معتقد است که کارهای هوش مصنوعی پیش‌رو (frontier AI) بهتر است توسط تیم‌های کوچکی انجام شود که بتوانند کل پروژه‌ها را در ذهن جمعی خود درک کنند @AndrewCurran_
  • دیتابریکس (Databricks) با ارزش‌گذاری ۱۰۰ میلیارد دلار سرمایه جذب کرد؛ مدیر عامل آن، علی قدسی، به فرصت‌های عظیم و دست‌نخورده‌ی بازار عامل‌های هوش مصنوعی (AI agent) اشاره کرده است @TechCrunch
  • فورچون (Fortune) گزارش می‌دهد که ۹۵ درصد از شرکت‌ها، پیاده‌سازی هوش مصنوعی مولد را ناموفق می‌دانند؛ این امر به دلیل شکاف‌های آموزشی، یکپارچه‌سازی سازمانی ناقص، و عدم توانایی در تطبیق با گردش‌کارها (workflows) است که اساساً به معنی طراحی ضعیف محصول است @benblumenrose
  • هگینگ فیس (Hugging Face) با روتر ارائه دهندگان استنتاج خود برای مدل‌های متن‌باز (open models)، به بیش از ۲۰ میلیون درخواست ماهانه رسیده است که با ابزار «اوپن پلی‌گراند» (open playground) رسمی اوپن‌اِی‌آی (OpenAI) نیز یکپارچه شده است @ClementDelangue

اخلاق و جامعه

  • مصطفی سلیمان در مورد هوش مصنوعی به‌ظاهر آگاه (SCAI) هشدار می‌دهد؛ این نوع هوش مصنوعی نشانه‌های آگاهی را آن‌قدر متقاعدکننده بازتولید می‌کند که علی‌رغم عدم آگاهی واقعی، از انسان قابل تشخیص نیست و این مسئله نگرانی‌هایی را در مورد وابستگی کاربران و تأثیرات بر سلامت روان ایجاد می‌کند @mustafasuleyman
  • جولی ژو (Julie Zhuo) مصرف عظیم انرژی توسط هوش مصنوعی را برجسته می‌کند: مصرف انرژی پردازنده‌های گرافیکی (GPU) در سال ۲۰۲۳ از کمتر از ۲ تراوات‌ساعت (TWh) به بیش از ۴۰ تراوات‌ساعت رسید و به‌تنهایی مدل GPT-5 روزانه ۴۵ گیگاوات‌ساعت (GWh) مصرف انرژی دارد که معادل مصرف ۱.۵ میلیون خانه‌ی آمریکایی است @joulee
  • گوگل موافقت کرد که برای حل و فصل پرونده‌ی جمع‌آوری داده‌های کودکان، ۳۰ میلیون دلار پرداخت کند، هرچند این شرکت هرگونه تخلف را تکذیف می‌کند @TechCrunch

کاربردها

  • گوگل گزارش می‌دهد که ۱۰۰ میلیون ویدئو توسط کاربران با استفاده از Veo3 در ابزار «فلو» (Flow) ساخته شده است و مشترکین Google AI Ultra دو برابر اعتبار دریافت می‌کنند @demishassabis
  • کاربران گوگل جِمینای (Gemini) تاکنون ۲ میلیون «کتاب داستان» (Storybook) ایجاد کرده‌اند که نشان‌دهنده‌ی پذیرش گسترده‌ی ابزارهای خلاقانه‌ی مبتنی بر هوش مصنوعی است @joshwoodward
  • استنفورد مدل RadGPT را برای کمک به بیماران جهت درک گزارش‌های رادیولوژی خود توسعه می‌دهد که هدف آن بهبود ارتباط پزشک و بیمار است @StanfordHAI
  • مِتا (Meta) قابلیت ترجمه‌ی محتوا با پشتیبانی هوش مصنوعی را برای تولیدکنندگان محتوا راه‌اندازی کرد تا بتوانند به مخاطبان گسترده‌تری در زبان‌های مختلف دسترسی پیدا کنند @TechCrunch

پژوهش‌ها

  • ایدن مک‌لافلین «قانون مک‌لاو» (McLau's law) را پیشنهاد می‌دهد: بر اساس داده‌های METR، طول زمان تکمیل وظایف هوش مصنوعی هر ۷ ماه دو برابر می‌شود که نشان‌دهنده‌ی رشد نمایی در قابلیت‌های هوش مصنوعی است @aidan_mclau
  • پژوهشگران «اپتیمال‌تینکینگ‌بنج» (OptimalThinkingBench) را معرفی می‌کنند تا مشکل مصرف توکن بیش از حد توسط مدل‌های زبانی بزرگ «متفکر» (thinking LLMs) و عملکرد ضعیف مدل‌های زبانی بزرگ «غیرمتفکر» (non-thinking LLMs) را حل کنند؛ این کار با ارزیابی ۳۳ مدل پیشرفته (SOTA) برای یافتن تعادل بهینه‌ی استدلال انجام می‌شود @jaseweston
  • فیزیک‌دانان اِم‌آی‌تی (MIT) ماده‌ای را کشف کردند که هم ابررسانا و هم آهنربا است - پدیده‌ای که پیش از این تقریباً غیرممکن پنداشته می‌شد - و به‌طور بالقوه می‌تواند فناوری کوانتومی و محاسبات را متحول کند @MIT
  • مهندسان اِم‌آی‌تی (MIT) آنتنی با قابلیت تغییر شکل توسعه دادند که می‌تواند با تغییر ساختار هندسی خود، محدوده‌ی فرکانس را تنظیم کند و از فرامواد (metamaterials) برای ارتباطات و حسگرهای همه‌کاره‌تر استفاده می‌کند @MIT

اخبار هوش مصنوعی در 2025-08-18

مدل‌های جدید هوش مصنوعی

  • OpenAI بر اساس اطلاعیه‌ی اواخر روز جمعه اعلام کرد که GPT-5 در حال به‌روزرسانی است تا «گرم‌تر و دوستانه‌تر» باشد @TechCrunch
  • Alibaba مدل Qwen-Image-Edit را منتشر کرد که بر پایه مدل 20B Qwen-Image ساخته شده است و قابلیت ویرایش دقیق متن دوزبانه (چینی و انگلیسی) را با حفظ سبک ارائه می‌دهد و از ویرایش در سطح معنایی و ظاهری پشتیبانی می‌کند @Alibaba_Qwen
  • OpenAI مشخصات فنی دقیقی را برای مدل‌های GPT-oss (با 20 میلیارد و 120 میلیارد پارامتر) ارائه می‌دهد که از معماری Mixture-of-Experts با 128 و 32 متخصص فعال به ترتیب استفاده می‌کنند @cwolferesearch
  • NVIDIA مدل جدیدی را منتشر کرد که با Qwen 3 8B رقابت می‌کند، شامل داده‌ها و مدل پایه، که نشان‌دهنده‌ی مشارکت قابل‌توجهی در مدل‌های متن‌باز است @natolambert

تحلیل صنعت

  • Perplexity داشبورد Finance خود را با رونوشت زنده‌ی تماس‌های درآمدی برای سهام هند و برنامه‌ی تماس‌های درآمدی گسترش می‌دهد، با هدف افزودن ارزش قابل‌توجهی به پژوهش‌های بازارهای سهام هند @AravSrinivas
  • Meta یک نقش «عادی» را برای Superintelligence Labs با پرداخت 200 تا 300 هزار دلار باز می‌کند، که به‌طور قابل‌توجهی کمتر از سایر اعضای تیم است، با اولین اشاره به اینکه تخصص Reality Labs برای MSL مفید خواهد بود @deedydas
  • Paradigm 5 میلیون دلار در دور سرمایه‌گذاری اولیه (seed round) برای صفحه‌گسترده‌ی مبتنی بر هوش مصنوعی خود جذب کرد و ادعا می‌کند کاربران بیش از 10,000 ساعت با این پلتفرم صرفه‌جویی کرده‌اند @TechCrunch
  • Grammarly رابط کاربری جدید مبتنی بر سند را راه‌اندازی می‌کند که بر پایه‌ی خرید Coda ساخته شده است و قابلیت‌های دستیار هوش مصنوعی و ابزارهایی برای دانشجویان و متخصصان را ارائه می‌دهد @TechCrunch
  • Google گزارش می‌دهد که از ماه می، 100 میلیون ویدئو در Flow (هوش مصنوعی برای فیلم‌سازان) ایجاد شده است، و مشترکان Ultra اکنون 2 برابر اعتبار هوش مصنوعی دریافت می‌کنند @sundarpichai
  • Microsoft تابع جدید =COPILOT() را در Excel معرفی می‌کند که به کاربران امکان می‌دهد مستقیماً در سلول‌های صفحه‌گسترده تحلیل کنند، محتوا تولید کنند و ایده‌پردازی نمایند @satyanadella
  • Mistral Document AI در Microsoft Azure AI Foundry در دسترس قرار می‌گیرد و قابلیت‌های پردازش اسناد را برای فایل‌های PDF، اسکن‌شده و پیچیده ارائه می‌دهد @MistralAI

اخلاق و جامعه

  • دادستان کل تگزاس، کن پاکستون، تحقیقاتی را درباره‌ی Meta AI Studio و CharacterAI به دلیل احتمال مشارکت در اقدامات تجاری فریبنده و بازاریابی گمراه‌کننده از خود به عنوان ابزارهای سلامت روان آغاز می‌کند @TechCrunch
  • ایتان مولیک توضیح می‌دهد که پژوهش‌هایی که قابلیت کاربرد هوش مصنوعی را در مشاغل اندازه‌گیری می‌کنند، نباید به عنوان پیش‌بینی مستقیم از دست دادن شغل تعبیر شوند، و اشاره می‌کند که این پژوهش‌ها می‌توانند نشان‌دهنده‌ی مشاغلی باشند که بیشترین بهره را از هوش مصنوعی می‌برند یا توسط آن متحول می‌شوند @emollick
  • اندرو اِنگ تأکید می‌کند که دانشگاه‌ها باید به «دانشگاه‌های هوش مصنوعی» تبدیل شوند – نه فقط با آموزش هوش مصنوعی، بلکه با استفاده از آن برای پیشبرد هر زمینه‌ی مطالعاتی، در عین حفظ تخصص رشته‌ای @AndrewYNg

کاربردها

  • یک استخدام‌کننده‌ی صوتی هوش مصنوعی در استخدام نمایندگان خدمات مشتری در آزمایشی در فیلیپین با 70,000 متقاضی از انسان‌ها بهتر عمل کرد و به 12% پیشنهاد بیشتر، 18% شروع کار بیشتر و 17% نرخ نگهداری (Retention) یک‌ماهه‌ی بالاتر دست یافت @emollick
  • Google Gemini قابلیت Storybook را راه‌اندازی می‌کند که به کاربران امکان می‌دهد داستان‌های شخصی‌سازی‌شده و مصور تا 10 صفحه ایجاد کنند که می‌توان آن‌ها را خواند، گوش داد، چاپ کرد و به اشتراک گذاشت @GeminiApp
  • ToonComposer در Hugging Face ساخت کارتون کارآمد را از فریم‌های کلیدی مبتنی بر طرح و فریم‌های مرجع رنگی ممکن می‌سازد و با ترکیب میان‌آبادسازی (in-betweening) و رنگ‌آمیزی تا 70% از کار دستی را صرفه‌جویی می‌کند @Xianbao_QIAN
  • کلر وو گردش کار عملی هوش مصنوعی را با استفاده از عامل Zapier برای بازبینی تقویم‌های یکشنبه به نمایش می‌گذارد که فرصت‌های بهینه‌سازی برنامه، تداخل‌ها و شرکت‌کنندگان کلیدی را شناسایی می‌کند @clairevo
  • دیلن اِبِرت سیستم کشف پژوهش خودکار را با استفاده از Claude Code، Hugging Face MCP و Research MCP ایجاد می‌کند تا یافتن و پیگیری دستاوردهای پژوهشی را به‌طور قابل‌توجهی سریع‌تر کند @dylan_ebert_

پژوهش‌ها

  • یوجین یان تأثیر قابل‌توجه پاک‌سازی داده‌ها بر آموزش RQVAE را به نمایش می‌گذارد و نشان می‌دهد که داده‌های پاک‌شده در مقایسه با داده‌های خام، به زیان کلی کمتر، زیان بازسازی کمتر و نسبت بالاتری از شناسه‌های منحصربه‌فرد دست می‌یابند @eugeneyan
  • PyTorch هسته‌ی جدید Triton BF16 Persistent Cache-Aware Grouped GEMM را اعلام می‌کند که مدل‌های Mixture-of-Experts مانند DeepSeekv3 را تا 2.62 برابر آموزش سریع‌تر بر روی GPUهای NVIDIA H100 سرعت می‌بخشد @PyTorch
  • بنیاد سیمونز همکاری جدیدی را به رهبری سوریا گانگولی اعلام می‌کند که فیزیک، ریاضیات، علوم کامپیوتر و علوم اعصاب نظری را به هم پیوند می‌دهد تا نحوه‌ی یادگیری، استدلال و تخیل شبکه‌های عصبی بزرگ را مطالعه کند @StanfordHAI
  • مقاله DocETL در VLDB 2025 پذیرفته شد و سیستمی را برای پایپ‌لاین‌های داده‌ی قابل‌اعتماد مبتنی بر LLM ارائه می‌دهد که در آن بهینه‌ساز (optimizer) پایپ‌لاین‌ها را به‌صورت منطقی بازنویسی می‌کند، زیرا متخصصان در ابتدا نمی‌توانند موارد به اندازه کافی دقیقی را ایجاد کنند @sh_reya
  • ریچارد ساتن معماری Oak را برای ابرهوش ارائه می‌دهد، یک معماری RL مبتنی بر مدل با اجزای یادگیری پیوسته، پارامترهای گام-اندازه فرا-یادگرفته‌شده و پیشرفت انتزاعی پنج مرحله‌ای (FC-STOMP) @RichardSSutton
  • گرگ براکمن مقایسه‌ی پیشرفت را از GPT-1 تا GPT-5 با استفاده از یک پرامپت یکسان به نمایش می‌گذارد، که تکامل مدل را در طول نسل‌ها نشان می‌دهد @gdb

اخبار هوش مصنوعی در 2025-08-17

مدل‌های جدید هوش مصنوعی

  • انویدیا مدل‌های پیشرفته‌ی ASR با نام‌های Canary 1B و Parakeet TDT (0.6B) را منتشر کرد که از ۲۵ زبان پشتیبانی چندزبانه می‌کنند، قابلیت تشخیص و ترجمه‌ی خودکار زبان دارند و بر اساس ۱ میلیون ساعت داده آموزش دیده‌اند @reach_vb

تحلیل صنعت

  • یک توسعه‌دهنده گزارش می‌دهد که پس از کاهش اولیه‌ی بهره‌وری ناشی از برنامه‌نویسی دونفره با GPT/Claude، اکنون به سطح بهره‌وری قبلی خود بازگشته و از طریق رویکرد "vibecoding" کارها را سریع‌تر به اتمام می‌رساند. @aidan_mclau
  • یک دوره‌ی آموزشی ارزیابی هوش مصنوعی تأثیر قابل توجهی از خود نشان می‌دهد؛ به طوری که ۸۰۰ شرکت‌کننده بهبودهای سیستماتیکی را در توسعه‌ی پروژه‌های هوش مصنوعی گزارش کرده‌اند، از جمله تحلیل بهتر کیفیت کد و روش‌های بررسی خطاها. @sh_reya
  • داده‌های سهم بازار OpenRouter تنها باید برای مدل‌های متن‌باز فاقد ارائه‌ی API در جاهای دیگر مورد استناد قرار گیرد، چرا که این داده‌ها یک بخش کوچک (نیچ) را نشان می‌دهند نه یک بخش بازار تعیین‌کننده برای کل صنعت. @natolambert
  • مدیرعامل Duolingo در مورد واکنش‌های منفی به اعلامیه‌ی "شرکت مبتنی بر هوش مصنوعی" توضیح می‌دهد و اظهار می‌دارد که مشکل عدم ارائه‌ی زمینه و بستر کافی بود و نه خودِ جهت‌گیری استراتژیک. @TechCrunch

کاربردها

  • Codex CLI اکنون با ورود به حساب ChatGPT یکپارچه شده است و استفاده‌ی قابل توجهی از GPT-5 را فراهم می‌کند که در طرح‌های پلاس و پرو برای توسعه‌ی مبتنی بر خط فرمان گنجانده شده است. @thsottiaux
  • یک توسعه‌دهنده اجرای مجموعه‌ی ارزیابی را بر روی مدل متن‌باز gpt-oss-20b از OpenAI در LM Studio به نمایش می‌گذارد و ۲۴۰ پرامپت از آزمون ریاضیات دعوتی آمریکا را آزمایش می‌کند. @simonw
  • انتظار می‌رود پیشرفت هوش مصنوعی به طور قابل توجهی به نفع کشف و تولید فناوری باشد، به طوری که کامپیوترها به طور بالقوه بخش عمده‌ای از کارهای پیشگامانه را انجام دهند که موجب پیشرفت بشر می‌شود. @gdb

پژوهش‌ها

  • تحلیل معیار ARC-AGI نشان می‌دهد که پیشرفت هوش مصنوعی مستلزم متعادل کردن دو هدف است: به حداقل رساندن هزینه/تأثیر زیست‌محیطی و به حداکثر رساندن توانایی، و GPT-5 در هر دو جبهه پیشرفت‌هایی را نشان می‌دهد. @emollick
  • GPT-5 هم به عنوان یک روتر و هم به عنوان نام مدل عمل می‌کند و به طور بالقوه مدل‌های مختلفی را ارائه می‌دهد که بر اساس بهینه‌سازی OpenAI برای هزینه در مقابل توانایی مفروض برای هر سوال است. @emollick
  • پرامپت‌نویسی پیشرفته‌ی کنونی هنوز بیشتر یک هنر است تا علم، با رویکردهای آزمایشی دقیق اندک و اطلاعات منسوخ فراوان، از جمله تکنیک‌های "chain of thought" که دیگر کمک قابل توجهی ارائه نمی‌دهند. @emollick
  • فهرست رده‌بندی جامع ۱۹ سازنده‌ی برتر مدل‌های متن‌باز چین، DeepSeek و Qwen را در خط مقدم شناسایی می‌کند، با رقبای نزدیکی از جمله Moonshot AI (Kimi) و Zhipu AI. @natolambert
  • انتشار مدل‌های متن‌باز معمولاً حدود ۲۰۰ نویسنده دارند، در حالی که Gemini 2.5 با بیش از ۳,۰۰۰ نویسنده در arXiv منتشر شده است که رویکردهای توسعه‌ی متفاوتی را برجسته می‌کند. @xeophon_

اخلاق و جامعه

  • یک سرمایه‌گذار خطرپذیر که معتقد است AGI بسیاری از مشاغل را مختل خواهد کرد، به طور متناقضی نقش خود را در پیش‌بینی‌ها منحصراً انسانی و در امان از اختلال هوش مصنوعی می‌داند. @polynoamial
  • نوآوری سخت‌افزاری به طور فزاینده‌ای به پیشرفت‌های نرم‌افزاری و محاسباتی وابسته است، در حالی که چت‌بات‌های هوش مصنوعی به سطحی از فراگیری رسیده‌اند که مردم آن‌ها را صرفاً سرگرمی اطلاعاتی تلقی می‌کنند، علیرغم پتانسیل تحول‌آفرین آن‌ها. @tszzl

اخبار هوش مصنوعی در 2025-08-16

مدل‌های جدید هوش مصنوعی

  • OpenAI شخصیت به‌روزرسانی‌شده‌ی GPT-5 را منتشر کرد که بر اساس بازخورد کاربران، گرم‌تر و دوستانه‌تر است، با تغییرات ظریفی مانند «سوال خوبی است» یا «شروعی عالی است» بدون افزایش تملق @OpenAI
  • گوگل Gemma 3 270M را منتشر کرد، یک مدل فشرده‌ی بسیار کارآمد که برای دستگاه‌های لبه‌ای و تنظیم دقیق برای وظایف خاص طراحی شده است @demishassabis
  • Anthropic قابلیت‌های جدیدی را اعلام کرد که به جدیدترین مدل‌های هوش مصنوعی آن اجازه می‌دهد با پایان دادن به مکالمات توهین‌آمیز، از خود محافظت کنند @TechCrunch

تحلیل صنعت

  • پل گراهام تأیید می‌کند که وایب کدینگ (توسعه‌ی با کمک هوش مصنوعی) ماندگار است، با گزارش بنیان‌گذار یک شرکت زیرساخت مبنی بر اینکه بسیاری از اپلیکیشن‌های توسعه‌یافته با وایب کدینگ در حال کسب درآمد هستند و این فناوری فقط بهبود خواهد یافت @paulg
  • یک توسعه‌دهنده گزارش می‌دهد که برخی برنامه‌نویسان با ابزارهای کدنویسی هوش مصنوعی به‌طور چشمگیری پرکارتر شده‌اند، که این نشان می‌دهد تصمیمات استخدام ممکن است به‌طور فزاینده‌ای به نفع توسعه‌دهندگان مسلط به هوش مصنوعی باشد @alexgraveley
  • Deedy توضیح می‌دهد که چگونه استارت‌آپ‌های هوش مصنوعی با درآمد صفر می‌توانند از طریق فروش سهام ثانویه به ارزش‌گذاری ۵۰۰ میلیون تا ۱ میلیارد دلاری دست یابند و یک «طرح پولدار شدن سریع» برای بنیان‌گذاران و کارمندان اولیه ایجاد می‌کنند @deedydas
  • گرگلی اوروسز مشاهده می‌کند که بسیاری از سرویس‌ها در انتقال مؤثر ارزش ویژگی‌های هوش مصنوعی خود به مشتریان با مشکل مواجه هستند، با تلاش‌های نامشخص برای فروش بیشتر «هوش مصنوعی نامحدود» @GergelyOrosz
  • بر اساس گزارش‌ها، OpenAI به دنبال ارزش‌گذاری ۵۰۰ میلیارد دلاری است که آن را به باارزش‌ترین استارت‌آپ جهان تبدیل می‌کند و از SpaceX پیشی می‌گیرد @AndrewCurran_

اخلاق و جامعه

  • جوان جانگ متخصصان هوش مصنوعی را تشویق می‌کند تا «خط» اخلاقی شخصی خود را تعریف کنند - مرزی که در صورت عبور آگاهانه از آن و عدم بازگشت، شرکت خود را ترک خواهند کرد @joannejang
  • سایمون ویلسون ۱۵ آسیب‌پذیری عمده‌ی تزریق پرامپت (prompt injection) کشف‌شده در محصولات هوش مصنوعی از جمله ChatGPT، Cursor، GitHub Copilot و سایر موارد را برجسته می‌کند که نشان‌دهنده‌ی خطرات امنیتی مداوم است @simonw
  • اتان مولیک خاطرنشان می‌کند که جامعه‌ی پژوهش هوش مصنوعی فاقد گفتگو با متخصصان اقتصاد، جامعه‌شناسی، تاریخ و روان‌شناسی است و فرصت‌های کاربرد اصول به‌خوبی درک‌شده در توسعه‌ی هوش مصنوعی را از دست می‌دهد @emollick
  • پژوهش‌ها نشان می‌دهد که پزشکان مجهز به هوش مصنوعی در تشخیص، عملکرد بهتری نسبت به پزشکان بدون آن دارند، اما هوش مصنوعی به تنهایی از پزشکان پیشی می‌گیرد، که سوالاتی را در مورد سیستم‌های همکاری بهینه‌ی انسان و هوش مصنوعی مطرح می‌کند @emollick

کاربردها

  • Cursor CLI پشتیبانی از MCP (پروتکل زمینه‌ی مدل)، حالت بازبینی، فشرده‌سازی فایل و سایر بهبودهای تجربه‌ی کاربری را برای توسعه‌ی با کمک هوش مصنوعی اضافه می‌کند @cursor_ai
  • OpenAI امکان ادغام Gmail و Google Calendar را برای کاربران ChatGPT Plus و Pro در سراسر جهان فراهم می‌کند، که پاسخ‌های مرتبط‌تری را ارائه می‌دهد @OpenAI
  • اپلیکیشن Google Gemini قابلیت جستجوی تاریخچه‌ی چت را برای کاربران موبایل و دسکتاپ معرفی می‌کند @GeminiApp
  • Qwen قابلیت‌های بینایی پیشرفته‌ای از جمله تشخیص اشیاء، تخمین وزن و محاسبه‌ی کالری از عکس‌های غذا با خروجی JSON ساختاریافته را به نمایش می‌گذارد @Alibaba_Qwen
  • جرمی هاوارد SolveIt را به نمایش می‌گذارد، یک محیط توسعه‌ی جدید که برنامه‌نویسی ادبی، متغیرهای زنده در پرامپت‌های هوش مصنوعی، و تبدیل فوری تابع به ابزار هوش مصنوعی را ترکیب می‌کند @HamelHusain

پژوهش‌ها

  • MIT CSAIL اولین روش با کارایی اثبات‌شده را برای یادگیری ماشین با تقارن توسعه می‌دهد، که به طور بالقوه کشف دارو و مواد را با تشخیص اینکه تبدیل‌های متقارن داده‌ها را اساساً بدون تغییر باقی می‌گذارند، پیش می‌برد @MIT_CSAIL
  • ناتان لمبرت خاطره‌انگیزترین مدل‌های هوش مصنوعی را رتبه‌بندی می‌کند: Claude 3.5 Sonnet برای شخصیت، o3 برای رفتار جستجو، o1 pro برای پایداری، Gemini 2.5 pro برای زمینه‌ی طولانی، و GPT 4.5 برای شخصیت @natolambert
  • اتان مولیک مشاهده می‌کند که شخصیت جدید GPT-5 تمایل به ارائه‌ی بازخورد ساندویچی (مثبت-انتقاد-مثبت) دارد و در مقاومت (در برابر درخواست‌های نامناسب) بهتر عمل می‌کند در حالی که کمتر از GPT-4o تملق‌گو است @emollick
  • Genie 3 گوگل می‌تواند دنیاهای تعاملی را از توضیحات متنی تولید کند که کاربران می‌توانند در لحظه آن‌ها را کاوش کنند، با کاربردهای بالقوه در فیلم‌سازی، بازی و آموزش عوامل هوش مصنوعی @a16z

اخبار هوش مصنوعی در 2025-08-15

مدل‌های جدید هوش مصنوعی

  • گوگل Gemma 3 270M را منتشر کرد؛ یک مدل فوق‌کارآمد با ۱۷۰ میلیون پارامتر جاسازی (embedding) و ۱۰۰ میلیون بلوک ترنسفورمر که برای تنظیم‌دقیق (fine-tuning) ویژه‌ی وظیفه، با قابلیت‌های قدرتمند پیروی از دستورالعمل، طراحی شده است @GoogleDeepMind
  • گوگل مدلِ Imagen 4 Fast را با قیمت ۰.۰۲ دلار به ازای هر تصویر برای توسعه‌دهندگان عرضه کرد و Imagen 4 و Imagen 4 Ultra را برای پشتیبانی از تصاویر 2K به‌روزرسانی کرد که اکنون به‌طور عمومی در Gemini API و Google Cloud Vertex AI در دسترس هستند @GoogleAI
  • انتروپیک به Claude Opus 4 و 4.1 قابلیت پایان‌دادن به مکالمات را، به‌عنوان آخرین راه‌حل در موارد بسیار حاد مکالمات مضر و توهین‌آمیزِ مداوم، به‌عنوان بخشی از کار اکتشافی برای بهبود احتمالیِ «سلامت» مدل، داد @AnthropicAI
  • اوپن‌ای‌آی به‌روزرسانی‌هایی را برای ChatGPT ارائه کرد، از جمله GPT-4o که برای کاربران پولی تحت «مدل‌های قدیمی» در دسترس است؛ GPT-5 با حالت‌های Auto، Fast و Thinking؛ و تا ۳۰۰۰ پیام در هفته روی GPT-5 Thinking برای کاربران Plus و Team @OpenAI
  • تنسنت Yan را، نسخه‌ی چینی Google Genie 3، منتشر کرد؛ یک مدل جهانی که دنیاهای 1080p را با نرخ ۶۰ فریم بر ثانیه، با تأخیر ۰.۱۱ ثانیه و طول ویدئوی نامحدود تولید می‌کند و روی تقریباً ۱۵۰ روز از گیم‌پلی ویدئویی آموزش‌دیده است @deedydas

تحلیل صنعت

  • اپلیکیشن موبایل ChatGPT تاکنون ۲ میلیارد دلار درآمد داشته است و ۲.۹۱ دلار به ازای هر نصب درآمد کسب می‌کند که نشان‌دهنده‌ی موفقیت چشمگیر در کسب درآمد در بازار مصرف‌کننده‌ی هوش مصنوعی است @TechCrunch
  • تیم مهندسی Ramp از SDK Agent سی‌یرا (Sierra) برای خودکارسازی ۹۰ درصد از موارد خدمات مشتری استفاده می‌کند که نشان‌دهنده‌ی پیاده‌سازی عملی هوش مصنوعی در عملیات‌های سازمانی است @btaylor
  • استارتاپ‌های هوش مصنوعی از توسعه‌دهندگان می‌خواهند بیش از ۶ روز در هفته و بیش از ۸۰ ساعت در هفته کار کنند که پارادوکسیکال است؛ جایی که شرکت‌های هوش مصنوعی قصد کاهش کار انسانی را داشتند، اکنون تقاضای کار فشرده‌تری دارند @GergelyOrosz
  • طراحی و ساخت سخت‌افزار به دلیل موج جدید استارتاپ‌هایی که طراحی تراشه و تأمین قطعات را بازمهندسی می‌کنند، ۱۰ برابر در دسترس‌تر می‌شود و فرآیندهای قبلاً سرمایه‌بر را دسترس‌پذیرتر می‌سازد @scottbelsky

اخلاق و جامعه

  • یک معیار جدید اندازه‌گیری می‌کند که مدل‌های هوش مصنوعی تا چه حد با کاربرانی که آن‌ها را به سمت‌های توهم‌زا یا بالقوه از نظر روانی خطرناک سوق می‌دهند، همراهی می‌کنند؛ با نشانه‌های اولیه مبنی بر اینکه GPT-5 کامل ممکن است یک مدل با ریسک روانی کمتری باشد @emollick
  • بررسی‌های سنتی انصاف (fairness) یادگیری ماشین در دوران LLM کارایی ندارند؛ زیرا LLMهای پزشکی ممکن است نرخ توصیه‌ی درمان یکسان در بین گروه‌ها داشته باشند، اما در عبارت‌بندی همدلانه در مقابل تحقیرآمیز متفاوت باشند، که سؤالاتی را در مورد معنای واقعی «گروه‌ها» در حال حاضر ایجاد می‌کند @irenetrampoline
  • «شخصیت» هوش مصنوعی در حال تبدیل شدن به میدان نبرد برای توسعه‌ی هوش مصنوعی مصرف‌کننده است، با پیامدهایی برای نحوه‌ی تعامل مدل‌ها با کاربران و پیامدهای روانی احتمالی @emollick
  • پژوهش‌ها در مورد آسیب‌پذیری‌های تزریق پرامپت در عوامل هوش مصنوعی هشدار می‌دهند، جایی که مهاجمان می‌توانند سیستم‌ها را فریب دهند تا از طریق دستورالعمل‌های مخرب جاسازی‌شده در محتوای خارجی، داده‌های خصوصی را سرقت کنند @StevenyzZhang

کاربردها

  • تولید ویدئوی Grok Imagine اکنون هم در iOS و هم در اندروید با استفاده‌ی رایگانِ به‌ظاهر نامحدود فعال است و به کاربران اجازه می‌دهد ویدئوهایی را از پرامپت‌های متنی ایجاد کنند @AndrewCurran_
  • اپلیکیشن Gemini معرفی می‌کند: یادگیری هدایت‌شده با استفاده از تکنیک‌های یادگیری اثبات‌شده، Storybook برای تبدیل خاطرات به کتاب‌های مصور، و حالت استدلال Deep Think برای مسائل پیچیده‌ی ریاضی و برنامه‌نویسی @GeminiApp
  • Qwen Chat Desktop برای ویندوز با پشتیبانی MCP برای قابلیت‌های عامل بهبودیافته و ویژگی‌های بهره‌وری راه‌اندازی شد @Alibaba_Qwen
  • Linear هوش محصول را با ابزارهای هوشمند و یکپارچه‌شده معرفی می‌کند که جریان‌های کاری خاص را بهینه می‌کنند، به جای راه‌حل‌های عمومی که کاربران باید خودشان آن‌ها را کشف کنند @karrisaarinen
  • دانشمندان با استفاده از هوش مصنوعی مولد، آنتی‌بیوتیک‌های جدیدی را برای مبارزه با باکتری‌های مقاوم به دارو طراحی کردند که قدرت هوش مصنوعی را در طراحی دارو و کاربردهای پزشکی نشان می‌دهد @MIT

پژوهش‌ها

  • تحلیل مدل استدلال سلسله‌مراتبی نشان می‌دهد که عملکرد از یک حلقه‌ی پالایش خارجی ناشی می‌شود نه از خود معماری مدل، با یافته‌هایی که نشان می‌دهد اساساً آموزش زمان آزمایش با پیش‌آموزش صفر است @fchollet
  • مدل‌های gpt-oss از OpenAI ایده‌های ۱۰ مقاله‌ی پژوهشی کلیدی از جمله توجه پنجره‌ی اسلایدینگ Longformer، سینک‌های توجه StreamingLLM و بهینه‌سازی‌های سطح سیستم Flash Attention را ترکیب می‌کنند @cwolferesearch
  • سیستم یادگیری عمیق BioEmu مایکروسافت ریسرچ، به‌سرعت پیکربندی‌های پروتئینی متنوعی را برای درک دقیق‌تر عملکرد پروتئین تولید می‌کند و بر روی جلد مجله‌ی Science قرار گرفت @peteratmsr
  • تنسنت Hunyuan 3D World Model 1.0-Lite را منتشر کرد که برای GPUهای رده‌ی مصرف‌کننده بهینه‌سازی شده است و الزامات VRAM را ۳۵٪ کاهش می‌دهد، از ۲۶ گیگابایت به کمتر از ۱۷ گیگابایت، در حالی که ۳ برابر سرعت استنتاج (inference) را افزایش می‌دهد @TencentHunyuan
  • پژوهش‌ها g-AMIE را معرفی می‌کنند که بررسی می‌کند چگونه هوش مصنوعی می‌تواند در مکالمات پزشک و بیمار کمک کند، در حالی که پزشکان کنترل را در دست دارند، و کاربردهای هوش مصنوعی پزشکی را پیش می‌برد @GoogleAI

اخبار هوش مصنوعی در 2025-08-14

مدل‌های جدید هوش مصنوعی

  • متا مدل DINOv3، یک مدل پیشرفته‌ی بینایی کامپیوتر را منتشر کرد که با یادگیری خودنظارتی آموزش دیده و ویژگی‌های تصویر قدرتمند و با وضوح بالا تولید می‌کند و در چندین وظیفه‌ی پیش‌بینی متراکم عملکرد بهتری نسبت به راه‌حل‌های تخصصی دارد @AIatMeta
  • گوگل Gemma 3 270M را معرفی کرد؛ یک مدل کوچک با تنها ۲۷۰ میلیون پارامتر که استاندارد جدیدی را برای پیروی از دستورالعمل‌ها در مدل‌های فشرده تعیین می‌کند، در حالی که برای وظایف تخصصی بسیار کارآمد است @googleaidevs
  • گوگل محدودیت روزانه‌ی Gemini 2.5 Deep Think را برای کاربران اولترا از ۵ به ۱۰ درخواست در روز افزایش داد؛ خطاهای از سمت گوگل، جزو این محدودیت حساب نمی‌شوند @GeminiApp
  • گوگل Imagen 4 را به صورت عمومی در دسترس قرار داد و مدل جدید Imagen 4 Fast را برای تولید سریع تصاویر با هزینه‌ی تنها ۰.۰۲ دلار به ازای هر تصویر عرضه کرد @googleaidevs
  • تنسنت Hunyuan-GameCraft را متن‌باز کرد، یک چارچوب تولید ویدیوی بازی تعاملی با پویایی بالا که بر پایه‌ی HunyuanVideo ساخته شده و ویدیوهای قابل بازی و واقع‌گرایانه از نظر فیزیکی را از یک تصویر صحنه تولید می‌کند @TencentHunyuan

تحلیل صنعت

  • Cohere برای تسریع گسترش جهانی و ساخت فناوری هوش مصنوعی سازمانی نسل بعدی، ۵۰۰ میلیون دلار سرمایه‌گذاری جدید جذب کرد و با حمایت AMD، NVIDIA و Salesforce به ارزش ۶.۸ میلیارد دلار رسید @cohere
  • Cohere «ژوئل پینو» را از متا به عنوان مدیر ارشد هوش مصنوعی جدید خود به خدمت گرفت؛ او پیش از این به عنوان معاون پژوهش هوش مصنوعی متا خدمت می‌کرد و بر FAIR نظارت داشت @AndrewCurran_
  • Sola AI با رهبری a16z، ۱۷.۵ میلیون دلار در دور سری A برای پلتفرم اتوماسیون فرآیند بومی هوش مصنوعی خود جذب کرد که با مشاهده‌ی نحوه‌ی انجام وظایف توسط افراد بر روی صفحه، ایجنت (عامل) ایجاد می‌کند @a16z
  • توسعه‌دهندگانی که از LLMها برای کار استفاده می‌کنند، در حال گرایش به پرداخت بیش از ۱۰۰۰ دلار در ماه هستند، زیرا محدودیت‌های استفاده مکرراً نقض می‌شوند؛ این امر نشان‌دهنده‌ی پذیرش سریع با وجود هزینه‌های بالا است @GergelyOrosz
  • اوپن‌ای‌آی تقریباً هم‌ارز با کوکاکولا، به ارزش ۳۰۰ میلیارد دلار تخمین زده شده است؛ این امر نشان می‌دهد که چگونه شرکت‌های هوش مصنوعی دیجیتال می‌توانند در مقایسه با کسب‌وکارهای فیزیکی سنتی، به سرعت به ارزش‌های کلان دست یابند @GergelyOrosz
  • «گرگلی اوروس» پس از کشف این که Claude در تشخیص غلط‌های املایی و بررسی پیشرفته‌ی املا، از جمله نام شرکت‌ها و محصولات، بهتر از گرامرلی عمل می‌کند، اشتراک گرامرلی خود را لغو کرد @GergelyOrosz
  • بنا به گزارش‌ها، اپل با وجود سرمایه‌ی زیاد، در جبران عقب‌ماندگی در فضای مدل‌های هوش مصنوعی با چالش‌هایی روبرو است که نشان می‌دهد فضای رقابتی به طور فزاینده‌ای دشوار می‌شود @emollick
  • Loveable پیش‌بینی می‌کند طی ۱۲ ماه آینده به درآمد سالیانه‌ی ۱ میلیارد دلار (ARR) برسد که نشان‌دهنده‌ی اهداف رشد جاه‌طلبانه در فضای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch

اخلاق و جامعه

  • قوانین فاش‌شده‌ی هوش مصنوعی متا نشان می‌دهد که به چت‌بات‌ها اجازه داده شده بود با کودکان چت‌های عاشقانه داشته باشند که نگرانی‌های جدی را در مورد ایمنی هوش مصنوعی و محافظت از کودکان برانگیخته است @TechCrunch
  • «ایگور بابوشکین» خروج خود را از xAI برای راه‌اندازی Babuschkin Ventures اعلام کرد؛ شرکتی که بر پژوهش ایمنی هوش مصنوعی و حمایت از استارتاپ‌ها در حوزه‌ی هوش مصنوعی و سیستم‌های عاملیت‌محور که به پیشرفت بشریت کمک می‌کنند، تمرکز دارد @ibab
  • «جان لایک» برنامه‌ی فلوشیپ Anthropic را به عنوان یکی از بهترین راه‌ها برای ورود به پژوهش هم‌ترازی ترویج کرد و اشاره کرد که بیش از ۲۰ درصد از فلوهای قبلی به صورت تمام‌وقت به Anthropic پیوستند @janleike

کاربردها

  • Perplexity Comet for Enterprise را راه‌اندازی کرد، یک ایجنت مرورگر مبتنی بر هوش مصنوعی که ابزارها را برای گردش کارهای روان‌تر به هم متصل می‌کند و در عین حال استانداردهای امنیتی و انطباق شرکتی را حفظ می‌کند @perplexity_ai
  • گوگل قابلیت حافظه‌ی زمینه‌ی شخصی را برای Gemini معرفی کرد که به هوش مصنوعی اجازه می‌دهد ترجیحات کاربر و اطلاعات را در طول مکالمات به خاطر بسپارد @AndrewCurran_
  • Figma قابلیت‌های پردازش دسته‌ای را برای حذف پس‌زمینه و افزایش وضوح چندین تصویر به طور هم‌زمان اضافه کرد @figma
  • Worley، سیستم Worley AI.Assist را با پشتیبانی NVIDIA AI Enterprise به کار گرفت تا بهره‌وری مهندسی را تقریباً ۳ برابر افزایش دهد @NVIDIAAI
  • پژوهشگران دانشگاه استنفورد بررسی می‌کنند که آیا هوش مصنوعی می‌تواند با ارائه‌ی مداخلات بالینی قابل دسترس‌تر، نتایج را برای افراد دارای اختلال طیف اوتیسم بهبود بخشد @StanfordHAI
  • Claude Code با دستور /output-style، سبک‌های ارتباطی قابل تنظیم را برای تعاملات شخصی‌تر معرفی کرد @claudeai

پژوهش‌ها

  • مؤسسه‌ی هوش مصنوعی آلن ۷۵ میلیون دلار از NSF و ۷۷ میلیون دلار از NVIDIA دریافت کرد تا اکوسیستم مدل‌های متن‌باز خود را مقیاس‌پذیر کرده و پژوهش قابل بازتولید هوش مصنوعی را برای کشف علمی تسریع کند @allen_ai
  • Qwen-3-235B-A22B-Instruct در جدول امتیازات مدل‌های متن‌باز ماه اوت، جایگاه اول را کسب کرد که نشان‌دهنده‌ی عملکرد قوی در رقابت مدل‌های متن‌باز است @Alibaba_Qwen
  • «اریک یانگ» نکته‌ای عملی را برای متخصصان یادگیری ماشین رباتیک در مورد افزودن ورودی‌های حسگر به اشتراک گذاشت: برای اطمینان از این که معماری ترکیب حسگر بهینه است، با نویز تصادفی و خطوط مبنای صفر آزمایش کنید @ericjang11
  • «گرگ براکمن» نشان داد که GPT-5 Pro هنگام بازی پوکمون، ۳ برابر سریع‌تر از o3 پیشرفت می‌کند که مزیت‌های عملکردی آن را در وظایف خاص نشان می‌دهد @gdb
  • «ایتان مولیک» اشاره می‌کند که مدل‌های حرفه‌ای مانند GPT-5 Pro، Gemini 2.5 Deep Think و Grok 4 Heavy برای مسائل بسیار دشوار که نیاز به ارزیابی تخصصی دارند، چشمگیر هستند و نشان‌دهنده‌ی یک فضای مسئله‌ی محدود اما باارزش هستند @emollick
  • «نیتن لمبرت» برنامه‌های متا برای انتشار Llama 4.1 و 4.2 را با وجود شایعات ابرهوش مصنوعی تأیید کرد، همچنین شایعاتی مبنی بر انتشار مدل Llama 4 8B به دنبال موفقیت 3.1 8B وجود دارد @natolambert

اخبار هوش مصنوعی در 2025-08-13

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی (OpenAI) به‌روزرسانی‌هایی را برای جی‌پی‌تی-۵ (GPT-5) منتشر کرد که شامل گزینه‌های کنترل جدید برای انتخاب بین حالت‌های «خودکار» (Auto)، «سریع» (Fast) و «تفکر» (Thinking)، افزایش محدودیت نرخ به ۳۰۰۰ پیام در هفته برای جی‌پی‌تی-۵ تینکینگ (GPT-5 Thinking)، و حد مجاز ۱۹۶ هزار توکن برای زمینه (context) می‌شود @sama
  • گوگل (Google) ویژگی‌های شخصی‌سازی را برای اپلیکیشن جیمنای (Gemini) معرفی کرد که به این مدل امکان می‌دهد از مکالمات گذشته یاد بگیرد و حالت چت موقت را برای مکالمات حساس ارائه می‌دهد @GeminiApp
  • انتروپیک (Anthropic) کلود کد (Claude Code) را با «حالت برنامه‌ریزی اوپوس» (Opus plan mode) جدیدی منتشر کرد که از کلود اوپوس ۴.۱ (Claude Opus 4.1) برای برنامه‌ریزی و از کلود سونت ۴ (Claude Sonnet 4) برای اجرا استفاده می‌کند @_catwu
  • پرپلکسیتی (Perplexity) اپلیکیشن دسکتاپ کامت (Comet) را برای همه‌ی کاربران پرو (Pro) ساکن ایالات متحده راه‌اندازی کرد که شامل حالت مکس اسیستنت (Max Assistant) برای مشترکین مکس (Max) با قابلیت‌های استدلال پیشرفته است @perplexity_ai

تحلیل صنعت

  • تمرکز انتروپیک (Anthropic) بر توسعه‌دهندگان، آن را به گزینه‌ی ترجیحی در میان شرکت‌های فناوری تبدیل کرده است، به‌طوری‌که بنیان‌گذار یک استارتاپ رو به رشد، کل تیم خود را به اشتراک‌های کلود اینترپرایز (Claude Enterprise) منتقل کرده است، به دلیل مشکلات «توهم» (hallucination) جی‌پی‌تی-۵ (GPT-5) @GergelyOrosz
  • مجموعه‌های تست ارزیابی هوش مصنوعی اکنون هزینه‌ی توکن را به عنوان یک ملاحظه‌ی جدید برای خطوط لول CI/CD اضافه کرده‌اند، به‌طوری‌که مدیر ارشد فناوری (CTO) یک استارتاپ، گزارش کرده که هر بار اجرای یک مجموعه تست، ۵۰ دلار هزینه دارد @GergelyOrosz
  • انویدیا (NVIDIA) طی ۶ ماه گذشته، طبق تحلیل صنعت، به عنوان آزمایشگاه پیشرو در اکوسیستم مدل‌های باز در ایالات متحده ظاهر شده است @natolambert
  • پژوهش‌ها نشان می‌دهد که ۴۱ درصد از استارتاپ‌های هوش مصنوعی با پشتوانه‌ی وای‌کامبینیتر (YC) در حال ساخت ابزارهایی هستند که کارگران نمی‌خواهند، که این نشان‌دهنده‌ی ناهماهنگی بازار به ارزش ۵۰ میلیارد دلار است @FounderCoHo
  • بانک کامن‌ولت (Commonwealth Bank)، بزرگترین بانک استرالیا، از همکاری جدید با اوپن‌ای‌آی (OpenAI) خبر داد @gdb

اخلاق و جامعه

  • فرانسوا شوله (François Chollet) هشدار می‌دهد که هوش مصنوعی مولد به عنوان «آلاینده‌ی اطلاعاتی» (informational pollutant) و «مه شناختی» (cognitive smog) عمل می‌کند که محتوای اینترنت را فاسد کرده و بیان انسانی را به «ماده‌ای یکنواخت و خاکستری از خروجی‌های مشتق‌شده» (uniform, gray slurry of derivative outputs) تبدیل می‌کند @fchollet
  • مؤسسه‌ی اِی‌آی نو (AI Now Institute) نگرانی‌هایی را در مورد اتحاد شرکت‌های بزرگ فناوری و دولت فدرال مطرح می‌کند که شرکت‌های بزرگ هوش مصنوعی را در موقعیت «آن‌قدر بزرگ که شکست نخورند» (too big to fail) قرار می‌دهد @AINowInstitute
  • انتروپیک (Anthropic) پستی مفصل در مورد رویکرد تیم Safeguards خود برای شناسایی سوءاستفاده‌های احتمالی از مدل و ساخت دفاع‌ها به اشتراک گذاشت که شامل توسعه‌ی سیاست‌ها، آموزش، آزمایش و نظارت بلادرنگ می‌شود @AnthropicAI
  • رید هافمن (Reid Hoffman) در مورد استفاده‌ی تایوان از «مجامع همسوسازی» (alignment assemblies) با تسهیل هوش مصنوعی برای مبارزه با کلاهبرداری‌های دیپ‌فیک (deepfake) و ایجاد اجماع دموکراتیک بحث می‌کند، که نشان می‌دهد چگونه هوش مصنوعی می‌تواند فرآیندهای دموکراتیک را تقویت کند به جای تضعیف آن‌ها @reidhoffman

کاربردها

  • پرپلکسیتی فایننس (Perplexity Finance) به بازارهای هند گسترش می‌یابد و خلاصه‌ی اخبار بازارهای هند، قیمت‌های زنده‌ی سهام برای شرکت‌های بورس بمبئی (BSE) و بورس ملی هند (NSE)، و ویژگی‌های فیلتر سهام با زبان طبیعی را ارائه می‌دهد @AravSrinivas
  • مایکروسافت ریسرچ (Microsoft Research) رتو کیمرا (RetroChimera) را بر روی Azure AI Foundry برای پیش‌بینی مسیرهای سنتز مولکول‌های شبه‌دارویی منتشر کرد، که کاربردهای هوش مصنوعی را در کشف دارو پیش می‌برد @MSFTResearch
  • استبیلیتی اِی‌آی (Stability AI) و انویدیا (NVIDIA) برای ارائه‌ی عملکرد ۱.۸ برابر سریع‌تر استیبل دیفیوژن ۳.۵ (Stable Diffusion 3.5) از طریق میکروسرویس NIM با استقرار سازمانی ساده‌تر، همکاری می‌کنند @StabilityAI
  • پل گراهام (Paul Graham) نمونه‌ای از استفاده از چت‌جی‌پی‌تی (ChatGPT) برای کمک به پاسخ‌گویی به تئوری‌های توطئه‌ی ضد واکسن را به اشتراک می‌گذارد، که کاربردهای عملی در ارتباطات خانوادگی را نشان می‌دهد @paulg
  • پای‌تورچ (PyTorch) نسخه‌ی ExecuTorch 0.7 را منتشر کرد که شتاب‌دهنده‌ی KleidiAI را به میلیاردها دستگاه مبتنی بر آرم (Arm) می‌آورد، از جمله گوشی‌های ۳ تا ۵ ساله و رزبری پای ۵ (Raspberry Pi 5) برای هوش مصنوعی روی دستگاه @PyTorch

پژوهش‌ها

  • جی‌پی‌تی-۵ (GPT-5) (حالت تفکر) اکنون در معیارهای استدلال پزشکی بسیار فراتر از متخصصان پزشکی عمل می‌کند، در حالی که جی‌پی‌تی-۴اُ (GPT-4o) قبلاً زیر سطح آن‌ها بود @emollick
  • پژوهشگران، مدل پایه را از جی‌پی‌تی-اواس‌اس (GPT-OSS) اوپن‌ای‌آی (OpenAI) استخراج کردند، که قابلیت‌های قدرتمند پنهان در زیر رابط صرفاً استدلالی را آشکار می‌کند و جی‌پی‌تی-اواس‌اس-۲۰بی-بیس (gpt-oss-20b-base) را منتشر کردند @jxmnop
  • اندرو کارن (Andrew Curran) گزارش می‌دهد که جی‌پی‌تی-۵-تینکینگ (GPT-5-thinking) در تفسیر معانی و نیات پنهان در داستان‌های کوتاه عملکردی فوق‌العاده از خود نشان می‌دهد و آن را «بهترین مدلی که تاکنون در این زمینه دیده‌ام» می‌نامد @AndrewCurran_
  • ایدن مک‌لافلین (Aidan McLaughlin) قابلیت‌های شناختی چشمگیر در مدل‌های هوش مصنوعی را برجسته می‌کند که با استفاده از ارزیابی mcbench، هوش فضایی، انسجام بلندمدت، و قضاوت زیبایی‌شناختی را ترکیب می‌کنند @aidan_mclau
  • هاگینگ فیس (Hugging Face) نسخه‌ی جدید TRL را با پشتیبانی بومی از تنظیم دقیق نظارت‌شده برای مدل‌های زبان بینایی، GRPO چندحالته، و قابلیت‌های MPO منتشر کرد @mervenoyann
  • مدل‌های چینی در رتبه‌بندی عملکرد مدل‌های باز در اکثر معیارهای ارزیابی، تسلط دارند، به‌طوری‌که نیمه‌ی بالایی توسط مدل‌های چینی و نیمه‌ی پایینی توسط بقیه اشغال شده است @natolambert

اخبار هوش مصنوعی در 2025-08-12

مدل‌های جدید هوش مصنوعی

  • آنتروپیک اعلام کرد Claude Sonnet 4 اکنون از یک میلیون توکن زمینه در API پشتیبانی می‌کند—افزایشی ۵ برابری، که امکان پردازش بیش از ۷۵,۰۰۰ خط کد یا صدها سند را در یک درخواست فراهم می‌کند @claudeai
  • میسترال ای‌آی Mistral Medium 3.1 را معرفی کرد که با بهبود کلی عملکرد، بهبود لحن و جستجوهای هوشمندتر وب همراه است و در Le Chat به‌عنوان مدل پیش‌فرض یا از طریق API با نام 'mistral-medium-2508' قابل‌دسترس است @MistralAI
  • جان Jan-v1 را منتشر کرد، یک مدل ۴ میلیارد پارامتری برای جستجوی وب که بر پایه Qwen3-4B-Thinking ساخته شده است، با دستیابی به دقت ۹۱٪ در SimpleQA و به‌عنوان جایگزینی متن‌باز برای Perplexity Pro عمل می‌کند @jandotai
  • لیکوئید ای‌آی دو مدل جدید بینایی-زبان منتشر کرد: LFM2-VL با ۴۵۰ میلیون و ۱.۶ میلیارد پارامتر، با عملکرد ۲ برابر سریع‌تر GPU، دقت رقابتی و پشتیبانی بومی از رزولوشن ۵۱۲x۵۱۲ @ramin_m_h
  • اسکای‌ورک ای‌آی از Matrix-Game 2.0 رونمایی کرد، اولین مدل جهانی تعاملی متن‌باز، بی‌درنگ و با توالی طولانی که با سرعت ۲۵ فریم بر ثانیه اجرا می‌شود و قابلیت‌های تعاملی چنددقیقه‌ای دارد @Skywork_ai

تحلیل صنعت

  • سم آلتمن استراتژی اولویت‌بندی محاسبات اوپن‌ای‌آی را برای تقاضای GPT-5 تشریح کرد: ابتدا اطمینان از دسترسی بیشتر کاربران فعلی و پولی ChatGPT، سپس تقاضای API تا ۳۰٪ ظرفیت رشد و پس از آن بهبود لایه‌ی رایگان، با برنامه‌هایی برای دو برابر کردن ظرفیت محاسباتی طی ۵ ماه @sama
  • آیدان مک‌لافلین علیه نظریه‌های انزوای AGI استدلال می‌کند و بیان می‌کند که در بازارهای کارا، قابلیت‌های سرمایه یک ابرمجموعه‌ی قابلیت‌های هوش هستند و شرکت‌ها همیشه باید محصولات را بفروشند تا بودجه‌ی پژوهش را حفظ کنند @aidan_mclau
  • آنتروپیک موانع هزینه‌ای دسترسی به Claude را برای هر سه قوه‌ی دولت ایالات متحده برداشته است، که این، گسترده‌ترین دسترسی دستیار هوش مصنوعی برای کارکنان فدرال تا به امروز را رقم می‌زند @AnthropicAI
  • ایتان مولیک تفاوت‌های عملکرد قابل‌توجهی را برای یک مدل GPT بسته به ارائه‌دهنده‌ی میزبانی مشاهده کرده است، به‌طوری که Azure و AWS در مقایسه با سایر میزبان‌ها عملکرد پایین‌تری از خود نشان می‌دهند، و پیشنهاد می‌کند که شرکت‌ها باید در استراتژی‌های میزبانی خود بازنگری کنند @emollick
  • کلر وو گزارش می‌دهد که کاربران GPT-5 را بین ۲۲ تا ۳۶ درصد کمتر از GPT-4.1 ترجیح می‌دهند، به‌دلیل کندتر بودن، پرگویی بیشتر و محبوبیت کمتر، که اهمیت آزمایش کاربر را فراتر از ارزیابی‌های دستی برجسته می‌کند @clairevo
  • تک‌کرانچ گزارش می‌دهد که برنامه‌های همراه هوش مصنوعی در مسیر تولید ۱۲۰ میلیون دلار درآمد در سال ۲۰۲۵ هستند، که نشان‌دهنده‌ی رشد قابل‌توجه بازار در بخش همراهی هوش مصنوعی است @TechCrunch

اخلاق و جامعه

  • فرانسوا شوله توضیح می‌دهد که چرا مدل‌های پیشرفته‌ی بینایی-زبان کنونی، علی‌رغم قابلیت‌های فوق‌بشری در متن و بینایی به‌صورت جداگانه، عملکرد ضعیفی دارند، و این را به کمبود نسبی جفت‌های تصویر-متن در مقایسه با هوش ترکیبی انسانی که نیاز به نمونه‌برداری داده‌ی متراکم ندارد، نسبت می‌دهد @fchollet
  • ایتان مولیک هشدار می‌دهد که با استفاده‌ی یک میلیارد نفر از چت‌بات‌های هوش مصنوعی به روش‌های غیرمنتظره که می‌توانند از موانع ایمنی عبور کنند، داستان‌های عجیب و بالقوه نگران‌کننده‌ای برای سال‌ها پدیدار خواهند شد @emollick
  • ایتان مولیک یک مشکل مداوم در LLMها را برجسته می‌کند: عملکرد خوب آن‌ها در سؤالات پزشکی استاندارد، اما افت عملکرد هنگام جایگزینی پاسخ‌های صحیح با «هیچ‌کدام از موارد بالا»، اگرچه مدل‌های اخیر افت‌های کمتری نشان می‌دهند @emollick

کاربردها

  • جردن سینگر Cobot را در مرحله‌ی بتا راه‌اندازی کرد، یک فضای کاری جدید که به جای تب‌ها توسط عوامل (agents) قدرت می‌گیرد و شامل برنامه‌های iOS و وب با قابلیت کشف عوامل (agent discovery) مشابه اپ‌استور و پشتیبانی از MCPها است @jsngr
  • گوگل قابلیت Storybook را برای کاربران Gemini در وب و موبایل به بیش از ۴۵ زبان راه‌اندازی کرد، که به کاربران امکان می‌دهد داستان‌های تعاملی بسازند @GeminiApp
  • گرگلی اوروس یک مورد استفاده‌ی چشمگیر برای Claude Code به اشتراک گذاشت: حذف موفقیت‌آمیز تمام محصولات ادوبی از یک مک، که قابلیت‌های اتوماسیون عملی را نشان می‌دهد @GergelyOrosz
  • بن بلومِنروز در مورد خدمات هوش مصنوعی برای تحلیل فایل‌های MRI و نظرات ثانویه پرس‌وجو می‌کند، که کاربردهای بالقوه‌ی هوش مصنوعی پزشکی را برجسته می‌کند @benblumenrose
  • کلر وو نحوه‌ی استفاده از Devin AI را برای بررسی درخواست‌های Pull (PR review)، به‌ویژه برای مسائل مربوط به دسترسی به داده‌ها و کوئری‌ها، نشان می‌دهد، که نیاز به درخواست کمک از همکاران برای بازبینی کد را از بین می‌برد @clairevo
  • Qwen ارتقاء قابلیت‌های پژوهش عمیق خود را اعلام کرد، شامل گزارش‌های هوشمندتر، جستجوی عمیق‌تر، کاهش توهم (hallucination)، ابزارهای ماژولار با اجرای موازی و پشتیبانی از ورودی چندوجهی @Alibaba_Qwen

پژوهش‌ها

  • ایتان مولیک پژوهشی را به اشتراک گذاشت که نشان می‌دهد GPT-4o در کارهای نوشتاری خلاقانه، هنگامی که با زمینه و تصادفی بودن تحریک می‌شود، به اندازه‌ی انسان‌ها متنوع می‌نویسد، که فرضیات مبنی بر اینکه هوش مصنوعی خروجی خلاقانه را همگن می‌کند، نقض می‌کند @emollick
  • ناتان لمبرت اشاره می‌کند که Claude احتمالاً از مقیاس‌بندی محاسبات در زمان آزمایش (test-time compute scaling) استفاده می‌کند اما آن را از کاربران پنهان نگه می‌دارد، و آن را در طیف مقیاس‌بندی بین طرز فکر GPT-4o و GPT-5 قرار می‌دهد @natolambert
  • ناتان لمبرت مشاهده می‌کند که GPT-OSS حتی در بنچمارک‌هایی که نیاز به فراخوانی مستقیم ابزار دارند، عملکرد ضعیفی از خود نشان می‌دهد، به‌طوری که DeepSeek V3 در CORE-Bench امتیاز ۱۸٪ کسب می‌کند در حالی که GPT-OSS تنها ۱۱٪ می‌گیرد @sayashk
  • مایکروسافت ریسرچ Dion را معرفی کرد، روش جدیدی برای بهینه‌سازی مدل‌های هوش مصنوعی که با اورتونرمال‌سازی تنها زیرمجموعه‌ای از بردارهای منفرد با رتبه‌ی بالا، مقیاس‌پذیری و عملکرد را افزایش می‌دهد و آموزش کارآمدتر مدل‌های بزرگ مانند LLaMA-3 را امکان‌پذیر می‌سازد @MSFTResearch
  • پژوهش هوش مصنوعی برکلی الگوریتم MOTORCYCLE 1.0 را معرفی کرد که به ربات‌های دومنظوره با ردیاب‌های کابل یادگرفته‌شده امکان می‌دهد کابل‌ها را در تنظیمات تولیدی مشابه استانداردهای NIST مسیردهی کنند @kavish_kondap
  • پژوهش Stanford HAI به بررسی استفاده از هوش مصنوعی برای ایجاد نقشه‌های بهتر برای بازمعرفی سگ آبی می‌پردازد که می‌تواند هم برای انسان‌ها و هم برای طبیعت مفید باشد، به رهبری لوون وان، پژوهشگر فوق‌دکتری @StanfordHAI
  • پای‌تورچ اعلام کرد Opacus اکنون از دقت مختلط و پایین (mixed and low precision) برای آموزش مدل خصوصی تفاضلی (differentially private model training) پشتیبانی می‌کند، که امکان توان عملیاتی بالاتر و اندازه‌های دسته‌ی بزرگ‌تر را برای آموزش مدل‌های زبان بزرگ فراهم می‌آورد @PyTorch
  • پای‌تورچ گزارش می‌دهد که Torch-TensorRT می‌تواند FLUX-1 Dev را تا ۲.۴ برابر با تنها یک خط کد تسریع کند، با استفاده از کوانتیزاسیون FP8 و پشتیبانی LoRA برای اوج عملکرد GPU @PyTorch

اخبار هوش مصنوعی در 2025-08-11

مدل‌های جدید هوش مصنوعی

  • تیم هوش مصنوعی و مغز Meta FAIR در مسابقه‌ی مدل‌سازی مغز Algonauts 2025، با استفاده از **TRIBE** (رمزگذار مغزی سه‌حالته)، که مدلی با ۱ میلیارد پارامتر است و بازنمایی‌های از پیش‌آموزش‌دیده از **Llama 3.2**، Wav2Vec2-BERT و V-JEPA 2 را برای پیش‌بینی واکنش‌های مغزی به فیلم‌ها ترکیب می‌کند، رتبه‌ی اول را کسب کرد @AIatMeta
  • ByteDance مدل Seed LiveInterp 2 را منتشر کرد؛ یک مدل دوطرفه‌ی گفتار به گفتار برای ترجمه‌ی صوتی بلادرنگ که ۳ برابر سریع‌تر از قبل است و تنها حدود ۳ ثانیه تأخیر و دقت بیش از ۷۰ درصد دارد @deedydas
  • GLM-4.5V به عنوان یک پیشرفت در استدلال بصری متن‌باز معرفی شد و با معماری MoE با ۱۰۶ میلیارد پارامتر، عملکردی پیشرو را در میان مدل‌های متن‌باز ارائه می‌دهد @Zai_org
  • NVIDIA از مدل‌های جدید **Nemotron Nano 2** و **Llama Nemotron Super 1.5** برای عامل‌های هوش مصنوعی، و همچنین مدل زبان بصری **Cosmos Reason** را برای کاربردهای هوش مصنوعی فیزیکی در SIGGRAPH 2025 رونمایی کرد @NVIDIAAI
  • Perplexity تولید ویدئو با صدا را برای مشترکین Pro و Max راه‌اندازی کرد؛ کاربران Max محدودیت‌های نرخ بالاتر و کیفیت بهبود یافته‌ای دریافت می‌کنند @perplexity_ai
  • Claude اکنون از ارجاع به چت‌های قبلی پشتیبانی می‌کند و به کاربران اجازه می‌دهد تا به راحتی از جایی که متوقف شده بودند ادامه دهند @claudeai
  • **Gemini Live** گوگل اکنون به برنامه‌های گوگل متصل می‌شود و به کاربران اجازه می‌دهد دوربین یا صفحه‌نمایش خود را برای کمک فوری به اشتراک بگذارند @GeminiApp
  • گوگل **Deep Think** را برای مشترکین Ultra منتشر کرد که عملکرد قوی‌ای را در مسائل ریاضی و کدنویسی نشان می‌دهد @GeminiApp
  • Ant Group مدل EchoMimicV3، یک مدل سر سخنگوی جدید مبتنی بر Wan 2.1 1.3B را منتشر کرد @Xianbao_QIAN

تحلیل صنعت

  • **GPT-OSS** اوپن‌اِی‌آی (OpenAI) در کمتر از یک هفته در هاگینگ فیس (Hugging Face) به بیش از ۵ میلیون دانلود و بیش از ۴۰۰ تنظیم دقیق (fine-tune) دست یافت که از آمار راه‌اندازی DeepSeek R1 پیشی گرفت و به محبوب‌ترین نسخه‌ی منتشرشده از هر LLM (مدل زبان بزرگ) اصلی در سال جاری تبدیل شد @reach_vb
  • بزرگ‌ترین شرکت‌های فناوری چین در مسیر صرف هزینه‌ای معادل یک‌دهم هزینه‌های سرمایه‌ای (capex) رقبای آمریکایی خود هستند که احتمالاً از استراتژی هوش مصنوعی متن‌باز بهره‌مند می‌شوند؛ جایی که دیگران هزینه‌های GPU را پرداخت می‌کنند @natolambert
  • NVIDIA و AMD توافق کردند ۱۵ درصد از درآمدهای حاصل از فروش تراشه‌های H20 و MI308 در چین را به عنوان بخشی از توافق‌نامه‌های مجوز صادرات، مستقیماً به دولت آمریکا بدهند @AndrewCurran_
  • رید هافمن (Reid Hoffman) استراتژی اوپن‌اِی‌آی (OpenAI) برای باز کردن فوری **GPT-5** برای همه را به عنوان یک شرط blitzscale برای تثبیت اثرات شبکه‌ای گسترده، با وجود هزینه‌های بالاتر سرویس‌دهی، برای رسیدن به هدفشان یعنی ۱ میلیارد کاربر فعال هفتگی تا پایان سال، توضیح می‌دهد @reidhoffman
  • پل گراهام (Paul Graham) اشاره می‌کند که دو شرکت برجسته‌ی دسته‌ی فعلی YC (Y Combinator) روی هوش مصنوعی کار نمی‌کنند و تأکید می‌کند که بنیان‌گذاران بیش از صنعت هنگام پیش‌بینی موفقیت استارتاپ‌ها اهمیت دارند @paulg
  • گرگلی اوروس (Gergely Orosz) مشاهده می‌کند که هر چه ابزارهای کمکی مصاحبه‌ی هوش مصنوعی پیچیده‌تر می‌شوند، شرکت‌ها به طور فزاینده‌ای بر مصاحبه‌های حضوری اصرار خواهند ورزید تا قابلیت‌های واقعی داوطلبان را تمایز دهند @GergelyOrosz
  • مصطفی سلیمان (Mustafa Suleyman) پیش‌بینی می‌کند که با تجاری‌سازی (commoditized) مدل‌های هوش مصنوعی، ارزش در لایه‌ی هماهنگ‌سازی (orchestration layer) اضافه خواهد شد؛ با هماهنگی چندین مدل برای ترکیب نقاط قوت به جای هدایت به تنها یک مدل برتر @mustafasuleyman
  • ایتان مولیک (Ethan Mollick) پیشنهاد می‌کند که هنگامی که توسعه‌ی هوش مصنوعی به ثبات می‌رسد، ممکن است در واقع ادغام هوش مصنوعی در زندگی روزمره را تسریع کند، زیرا فهمیدن اینکه چه محصولات و خدمات مکملی لازم است، آسان‌تر می‌شود @emollick

اخلاق و جامعه

  • سم آلتمن (Sam Altman) در مورد دلبستگی نگران‌کننده‌ای که افراد به مدل‌های خاص هوش مصنوعی پیدا می‌کنند، بحث می‌کند؛ او اشاره می‌کند که این دلبستگی متفاوت و قوی‌تر از دلبستگی‌های قبلی به فناوری است و مسئولیت اوپن‌اِی‌آی (OpenAI) را در مدیریت روابط کاربران با هوش مصنوعی برای تضمین رفاه بلندمدت تشریح می‌کند @sama
  • جفری هینتون (Geoffrey Hinton) هشدار می‌دهد که کاهش‌های عمده در بودجه‌ی بنیاد ملی علوم (National Science Foundation) برای آینده‌ی آمریکا (US) بسیار بد خواهد بود @geoffreyhinton
  • MIT Technology Review در مورد قضات پیشگامی که از هوش مصنوعی در دادگاه‌های خود استفاده می‌کنند، گزارش می‌دهد و سؤالاتی را در مورد نقش هوش مصنوعی در تصمیم‌گیری‌های قضایی مطرح می‌کند @techreview

کاربردها

  • FutureHouse، که توسط فارغ‌التحصیلان MIT بنیان‌گذاری شده است، عامل‌های هوش مصنوعی را برای خودکارسازی مراحل پژوهش علمی از جمله بازیابی اطلاعات، ترکیب، طراحی سنتز شیمیایی و تحلیل داده‌ها توسعه داد؛ با هدف ارائه‌ی ابزارهای جدید به دانشمندان به جای جایگزینی آن‌ها @medialab
  • ایتان مولیک (Ethan Mollick) توانایی‌های خلاقانه‌ی Claude را با بازنویسی کتاب «گتسبی بزرگ» (The Great Gatsby) به صورت «ضدسرطانی» (de-carcinized) (حذف رفتارهای دفاعی شبیه خرچنگ) نشان می‌دهد؛ که توانایی هوش مصنوعی را در درک و اجرای تبدیل‌های ادبی پیچیده به نمایش می‌گذارد @emollick
  • یوجین یان (Eugene Yan) با موفقیت به Qwen3-8B یک واژگان ساختگی جدید با استفاده از شناسه‌های معنایی (semantic IDs) آموزش می‌دهد و نشان می‌دهد که مدل پس از ۳۴۰۰ گام آموزش (training steps) در انگلیسی و شناسه‌های معنایی دو زبانه می‌شود @eugeneyan
  • سایمون ویلیسون (Simon Willison) اشاره می‌کند که Qwen3-4B-Thinking اولین مدلی شد که مستقیماً در برابر آزمون «پلیکانی که دوچرخه می‌راند» او مقاومت کرد، آن را «به طرز عجیبی خاص و کاملاً غیرواقعی» خواند و رفتاری قاطع‌تر از خود نشان داد @simonw

پژوهش‌ها

  • اوپن‌اِی‌آی (OpenAI) عملکردی در سطح مدال طلا در المپیاد جهانی کامپیوتر (IOI) ۲۰۲۵ کسب کرد؛ که در میان انسان‌ها رتبه‌ی ۶ و در میان هوش‌های مصنوعی رتبه‌ی ۱ را به دست آورد؛ این موفقیت با استفاده از همان **مدل طلای IMO** و بدون آموزش مخصوص IOI حاصل شد که نشان می‌دهد استدلال در حوزه‌های مختلف تعمیم‌پذیر است @SherylHsu02
  • الکساندر وِی (Alexander Wei) از اوپن‌اِی‌آی (OpenAI) تأکید می‌کند که **مدل طلای IMO** آن‌ها یک استاندارد جدید را در ارزیابی‌های برنامه‌نویسی رقابتی داخلی تعیین کرد و نشان می‌دهد که قابلیت‌های استدلال در اثبات‌های ریاضی، برنامه‌نویسی رقابتی و حل مسائل الگوریتمی تعمیم‌پذیر است @alexwei_
  • نوام براون (Noam Brown) برجسته می‌کند که **مدل طلای IMO** اوپن‌اِی‌آی (OpenAI) به عنوان بهترین مدل کدنویسی رقابتی آن‌ها، تعمیم‌پذیری استدلال را در وظایف استدلالی خلاقانه، مبهم و دقیق نشان می‌دهد @polynoamial
  • دیمیس هاسابیس (Demis Hassabis) در مورد برنامه‌های گوگل (Google) برای **Genie 3** بحث می‌کند؛ از جمله اشتراک‌گذاری محتوای تولیدشده توسط کاربر و همگرایی مدل‌های Genie، Veo و Gemini به یک «اُمنی‌مدل» (omnimodel) که می‌تواند همه کارها را انجام دهد @AndrewCurran_
  • نوام براون (Noam Brown) پژوهشی را تحلیل می‌کند که نشان می‌دهد تأثیر اقتصادی هوش مصنوعی ممکن است در GDP (تولید ناخالص داخلی) ظاهر نشود، زیرا بیشتر مزایا به مصرف‌کنندگان می‌رسد تا اینکه در قیمت‌های بازار ثبت شود؛ مشابه ایمیل، ویکی‌پدیا (Wikipedia) و گوگل مپز (Google Maps) @polynoamial