اخبار هوش مصنوعی در 2025-10-26

مدل‌های جدید هوش مصنوعی

  • DeepSeek-OCR قابلیت‌های استثنایی تشخیص متن دست‌نویس را به نمایش می‌گذارد و نامه‌های دست‌نویس بسیار دشوار، از جمله معادلات ریاضی متعلق به سال 1913 را به‌دقت تحلیل می‌کند @deedydas

تحلیل صنعت

  • OpenAI رشدی بی‌سابقه در تاریخ را پیش‌بینی می‌کند و درآمدی 100 میلیارد دلاری را تخمین می‌زند که شرایط عرضه‌ی اولیه‌ی سهام (IPO) آن مستلزم بازسازی و عمومی شدن شرکت تا پایان سال 2025 است @a16z
  • شرکت Merge Labs، رقیب Neuralink متعلق به سم آلتمن، پس از جمع‌آوری 250 میلیون دلار با ارزش‌گذاری 850 میلیون دلاری، آماده‌ی اعلام موجودیت می‌شود، که بیشتر سرمایه‌ی آن مستقیماً از OpenAI تأمین شده است، و قصد دارد نورون‌ها را از طریق ژن‌درمانی تغییر دهد و از طریق اولتراسوند با آن‌ها تعامل کند @AndrewCurran_
  • لایحه‌ی 469 مجلس اوهایو از تبدیل شدن هوش مصنوعی به یک بنیان‌گذار و مدیر عامل مستقل جلوگیری می‌کند و احتمالاً مفهوم «شرکت تک‌شاخ بدون نیروی انسانی» سم آلتمن را مسدود خواهد کرد @AndrewCurran_
  • Perplexity سرویس Perplexity Finance را راه‌اندازی می‌کند که با استفاده‌ی روزانه‌ی کافی، برای دسترسی آسان در نوار کناری (sidebar) قرار می‌گیرد @AravSrinivas
  • مدیران مهندسی در شرکت‌هایی که به‌شدت از ابزارهای کدنویسی هوش مصنوعی استفاده می‌کنند، اکنون به‌دنبال مهندسان نرم‌افزاری هستند که بتوانند پیچیدگی‌ها را مدیریت کنند و کارها را به انجام برسانند، نه صرفاً مهارت‌های فنی داشته باشند @GergelyOrosz

اخلاق و جامعه

  • استیون ولفرام پیشنهاد می‌کند که مدل‌های زبانی بزرگ (LLM) شاید به‌طور قطع نشان داده‌اند که آگاهی ورای فیزیک و جادویی نیست، و آگاهی احتمالاً به‌عنوان یک سازوکار ساده‌ی تصمیم‌گیری در حیوانات اولیه سرچشمه گرفته است @vitrupo
  • آزمایشگاه‌های هوش مصنوعی به‌عنوان استارت‌آپ‌های با رشد سریع توصیف می‌شوند که افراد کارآفرین متعددی در محیط‌های نامطمئن تصمیم‌گیری می‌کنند، به‌جای اینکه به‌طور منسجم استراتژی‌های بلندمدت را اجرا کنند @emollick

کاربردها

  • Sora قابلیت بهبود یافته‌ی خود را در تولید ویدئوهای گیم‌پلی Magic: The Gathering نشان می‌دهد، با ساخت کارت‌های جعلی اما با رنگ‌های مناسب و نشان دادن تقریب نزدیک‌تر به مکانیک‌های واقعی بازی @emollick
  • ابزارهای کدنویسی هوش مصنوعی به توسعه‌دهندگان امکان می‌دهند تا عملیات پیشرفته‌ی Git را انجام دهند، مانند بازنویسی توالی‌های کامیت و بازیابی فایل‌ها از رفلاگ (reflog)، و وظایف ماهانه‌ی گذشته را به گردش‌کارهای روزانه تبدیل می‌کنند @simonw
  • انتظار می‌رود GenAI با کاهش دادن فاز شروع توسعه‌ی بازی از 30 دقیقه به 2 دقیقه، امکان توسعه‌ی گسترده‌ی بازی را فراهم کند و احتمالاً 100 میلیون توسعه‌دهنده‌ی جدید ایجاد کند @OfficialLoganK

پژوهش‌ها

  • رویکردهای HRM و TRM نتایج پیشرفته‌ای را در ARC-AGI به‌دست می‌آورند بدون استفاده از دانش خارجی، و TRM پیشرو عمومی در این رویکردها است، که حاکی از قابلیت‌های بالقوه‌ی فراانسانی در مسائل استدلالی است @fchollet
  • مدل‌های پایه‌ای مانند Llama 3.1 405B بصیرتی در مورد مفاهیم تداعی‌گر جزئی زیربنای نگارش انسانی ارائه می‌دهند و فرصت‌های پژوهشی بالقوه‌ای را برای پژوهشگران علوم انسانی که به مطالعه‌ی الگوهای کهن و ناخودآگاه جمعی می‌پردازند، فراهم می‌کنند @emollick
  • بررسی اشکال‌زدایی فنی، مشکلات بک‌اند PyTorch MPS را نشان می‌دهد که با تنسورهای خروجی غیرمتوالی مرتبط است، و این سوال را مطرح می‌کند که مدل‌های زبانی بزرگ (LLM) چه زمانی قادر به انجام چنین کارهای پیچیده‌ی کارآگاهی فنی خواهند بود @karpathy
  • بر اساس گزارش‌ها، آزمایشگاه‌های هوش مصنوعی پیشرو با کمبود نیروی انسانی مواجه هستند علیرغم وجود حجم عظیمی از فرصت‌های سهل‌الوصول، که منجر به برنامه‌های کاری فشرده و اولویت‌بندی بی‌رحمانه می‌شود به‌دلیل کمبود نیروی انسانی و منابع محاسباتی @brianryhuang

اخبار هوش مصنوعی در 2025-10-25

مدل‌های جدید هوش مصنوعی

  • گزارش شده که OpenAI در حال آموزش یک مدل موسیقی جدید است که اولین مدل آن‌ها از زمان Jukebox در سال 2020 خواهد بود؛ این نشان‌دهنده‌ی یک تغییر مهم است، زیرا آن‌ها قبلاً از درگیری‌های حقوقی با شرکت‌های موسیقی اجتناب می‌کردند @AndrewCurran_
  • OpenAI در رویداد «Frontiers» خود در لندن، یک مدل گفتاری دوطرفه جدید را به نمایش گذاشت که می‌تواند گفتار را در زمان واقعی و همزمان با صحبت کردن، با انتظار برای افعال کامل، ترجمه کند و احتمالاً طی هفته‌های آتی عرضه خواهد شد @btibor91
  • xAI از میکا (Mika)، جدیدترین همراه Grok، با محتوای ویدیویی که با استفاده از Grok Imagine ساخته شده است، رونمایی می‌کند @xai
  • Meituan مدل LongCat-Video را منتشر می‌کند، یک مدل بنیادی تولید ویدیو با 13.6 میلیارد پارامتر که از وظایف تولید متن به ویدیو، تصویر به ویدیو و ادامه دادن ویدیو تحت لایسنس MIT پشتیبانی می‌کند @reach_vb
  • Odyssey ML از Odyssey-2 رونمایی می‌کند، که به عنوان قابلیتی کاملاً جدید برای هوش مصنوعی توصیف شده است و دوشنبه ساعت 10 صبح به وقت اقیانوس آرام (PT) عرضه خواهد شد @olivercameron

تحلیل صنعت

  • گزارش شده است که برخی از کارمندان OpenAI معتقدند این شرکت بیش از حد به یک «آزمایشگاه رسانه» تبدیل شده است، اگرچه رهبری شرکت تأکید دارد که آن‌ها در اصل یک آزمایشگاه «فراهوش» باقی مانده‌اند و پروژه‌های رسانه‌ای تحقیقات اصلی را تأمین مالی می‌کنند @AndrewCurran_
  • کارگردان سینما، Paul Schrader، پیش‌بینی می‌کند که تا دو سال دیگر اولین فیلم بلند تولیدشده توسط هوش مصنوعی ساخته خواهد شد؛ این پیش‌بینی با زمان‌بندی ایلان ماسک هم‌خوانی دارد که گفته بود فیلم‌های تماماً تولیدشده توسط هوش مصنوعی تا سال 2026 قابل تماشا خواهند بود و تا سال 2027 کیفیت بالایی خواهند داشت @AndrewCurran_
  • مدل کسب‌و‌کار مایکروسافت اساساً با گوگل تفاوت دارد، تنها حدود 5% از درآمد آن از تبلیغات است در حالی که این رقم برای گوگل حدود 80% است؛ این تفاوت، رویکردهای متفاوت آن‌ها را در قبال ابزارهای توسعه‌دهنده و جستجو توضیح می‌دهد @GergelyOrosz
  • HVAC (سیستم‌های گرمایش، تهویه و تهویه مطبوع) از نیمه‌رساناها، کامپیوترها/سرورها و مراکز داده پیشی گرفته و از سال 2022 به بزرگ‌ترین ذینفع هزینه‌های سخت‌افزاری جدید خالص تبدیل شده است @a16z
  • تحلیل‌ها نشان می‌دهد که آموزش Grok 4 کمتر از یک مایل مربع از زمین‌های کشاورزی ایالات متحده در سال آب مصرف کرده است که بر کارایی در آموزش هوش مصنوعی تأکید می‌کند @a16z

اخلاق و جامعه

  • مرورگرهای هوش مصنوعی جدید از OpenAI و Perplexity نوید افزایش بهره‌وری را می‌دهند، اما با خطرات امنیتی بالایی همراه هستند که کاربران باید از آن‌ها آگاه باشند @TechCrunch
  • گزارش شده است که یک دانش‌آموز دبیرستانی در شهرستان بالتیمور دستبند زده و مورد بازرسی قرار گرفت، پس از آنکه یک سیستم امنیتی هوش مصنوعی به اشتباه کیسه‌ی چیپس او را به عنوان یک سلاح گرم احتمالی شناسایی کرد @TechCrunch
  • به نظر می‌رسد اکثر افرادی که در خط مقدم هوش مصنوعی کار می‌کنند، برنامه‌ی بلندمدتی برای عادات کاری ناپایدار خود ندارند که نگرانی‌هایی را در مورد فرسودگی شغلی در این حوزه افزایش می‌دهد @natolambert

کاربردها

  • مایکروسافت از 12 قابلیت جدید Copilot رونمایی می‌کند که برای ایجاد تفاوت در کاربردهای واقعی طراحی شده‌اند، نه برای دور کردن کاربران از وظایفشان @mustafasuleyman
  • حالت Copilot در مرورگر Edge به عنوان یک همدم هوشمند برای مرور عمل می‌کند که می‌تواند تب‌ها را بخواند، اقداماتی را انجام دهد و تاریخچه‌ی مرور را به روایت‌های مفید تبدیل کند @Copilot
  • Claude توانایی بازیابی و پیمایش مستندات آنلاین خود را هنگام پرسش در مورد خودش نشان می‌دهد که نشان‌دهنده‌ی بهبود قابلیت‌های ارجاع به خود است @simonw
  • ارائه‌ی دسترسی به مدل‌های استدلالی به اتصالات داده برای جستجوها و اصلاحات در زمان واقعی، نشان‌دهنده‌ی یک جهش قابل توجه نسبت به سیستم‌های RAG سنتی است @emollick
  • یک کاربر گزارش می‌دهد که 5 مینی‌اپلیکیشن شخصی را در 2 ساعت بدون نیاز به کدنویسی، اشکال‌زدایی یا راه‌اندازی ساخته است که بر دسترسی‌پذیری ابزارهای توسعه‌ی هوش مصنوعی مدرن تأکید می‌کند @iVinay

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهد که ایجاد SVGها، همان مفاهیم معنایی را در مدل‌های زبان بزرگ (LLM) فعال می‌کند که درخواست توصیف همان اشیاء از آن‌ها، و بینش‌های جالبی را در مورد بازنمایی هوش مصنوعی آشکار می‌سازد @emollick
  • پژوهشگران دانشگاه Carnegie Mellon برای Neural MP، جایزه‌ی بهترین مقاله‌ی دانشجویی IROS را کسب کردند. Neural MP یک برنامه‌ریز حرکت عصبی عمومی است که نرخ موفقیت را به ترتیب 23٪، 17٪ و 79٪ نسبت به برنامه‌ریزان مبتنی بر نمونه‌برداری، بهینه‌سازی و یادگیری پیشرفته بهبود می‌بخشد @rsalakhu
  • DeepMind پیشرفت در هوش مصنوعی برای علم مواد را اعلام می‌کند، با تحولات هیجان‌انگیز در تیم «AI for Science» @demishassabis
  • بررسی یک‌ساله‌ی KernelBench، درس‌های آموخته‌شده در مسیر تولید خودکار هسته‌های GPU/CUDA را آشکار می‌کند که نشان‌دهنده‌ی پیشرفت قابل توجه جامعه است @simonguozirui
  • آزمایشگاه Stanford NLP بیست‌و‌پنجمین سالگرد خود را جشن می‌گیرد و نقش خود را در الهام‌بخشی به گروه‌های NLP در سراسر جهان که به LLM‌های امروزی منجر شد، برجسته می‌کند @stanfordnlp

اخبار هوش مصنوعی در 2025-10-24

مدل‌های جدید هوش مصنوعی

  • انتروپیک افزایش گسترده‌ی استفاده از TPUهای گوگل کلود را اعلام کرد که با تضمین تقریباً یک میلیون TPU و بیش از یک گیگاوات ظرفیت در سال ۲۰۲۶، به ارزش ده‌ها میلیارد دلار، با هدف افزایش چشمگیر منابع محاسباتی جهت پژوهش‌های هوش مصنوعی و توسعه‌ی محصول انجام می‌شود @AnthropicAI
  • گوگل Gemini 2.5 Flash را منتشر کرد که دارای راهنمایی گام‌به‌گام بهبودیافته برای موضوعات پیچیده، پاسخ‌های سازمان‌یافته‌تر و درک بهتر تصاویر برای یادداشت‌ها و نمودارها است @GeminiApp
  • گوگل مدل ویدیویی Veo 3.1 را راه‌اندازی کرد که دارای بافت‌های واقعی، کنترل آسان‌تر دوربین و دیالوگ با جلوه‌های صوتی برای ساخت داستان‌های جذاب است @GeminiApp
  • میسترال ای‌آی Mistral AI Studio را معرفی کرد؛ یک پلتفرم هوش مصنوعی تولیدی که توسعه‌دهندگان را قادر می‌سازد از مرحله‌ی آزمایش هوش مصنوعی به تولید حرکت کنند و دارای زمان اجرای قوی برای عامل‌ها و قابلیت مشاهده‌ی عمیق در سراسر چرخه‌ی حیات هوش مصنوعی است @MistralAI
  • مایکروسافت چندین به‌روزرسانی برای Copilot اعلام کرد که شامل کانکتورهایی برای جستجو در OneDrive، Outlook، Gmail، Google Drive و Google Calendar، همچنین Groups برای همکاری بلادرنگ، Learn Live به‌عنوان یک معلم سقراطی با قابلیت صوتی، و Mico به‌عنوان یک همراه بیانگر می‌شود @Copilot
  • اوپن‌ای‌آی ChatGPT Atlas را راه‌اندازی کرد که می‌تواند آنچه کاربران جستجو کرده‌اند، بازدید کرده‌اند و پرسیده‌اند را به خاطر بسپارد و به ChatGPT زمینه‌ی بهتری برای پاسخ‌های دقیق‌تر و قابلیت باز کردن، بستن یا بازبینی تب‌ها می‌دهد @OpenAI

تحلیل صنعت

  • سازنده‌ی اوریو ۴۰ میلیون دلار در آموزش مدل ویدیویی خود برای تبلیغات تلویزیونی سرمایه‌گذاری کرده و ادعا می‌کند که این کار هزینه‌های تولید را ۳۰ تا ۵۰ درصد کاهش می‌دهد. همچنین پیش‌بینی می‌شود تا سال آینده تشخیص اینکه یک تبلیغ توسط هوش مصنوعی تولید شده باشد، دشوار خواهد بود @AndrewCurran_
  • اعتماد به کار از راه دور در میان بسیاری از بنیان‌گذاران به دلیل مواردی از انجام چندین شغل توسط کارمندان یا تغییر هویت، از بین رفته است. این امر منجر به دستورالعمل‌های بازگشت به دفتر شده، زیرا شرکت‌ها کار حضوری را ترجیح می‌دهند تا از نظارت بر کارمندان از راه دور جلوگیری کنند @GergelyOrosz
  • مورد سوهام پارخ که گفته می‌شود با قبول چندین پیشنهاد شغلی، بیش از ۲۳ شرکت را فریب داده است، به‌عنوان هشداری به شرکت‌های سیلیکون ولی درباره‌ی خطرات کار از راه دور و خروجی پایین علی‌رغم عملکرد قوی در مصاحبه عمل می‌کند @GergelyOrosz
  • Sierra این امکان را می‌دهد که عامل‌ها در پلتفرم‌های متعددی از جمله وب‌سایت‌ها، اپلیکیشن‌های موبایل، سیستم‌های تلفنی و اکنون ChatGPT منتشر شوند و به شرکت‌ها اجازه می‌دهد یک بار بسازند و در همه‌جا اجرا کنند تا به صدها میلیون مصرف‌کننده دست یابند @btaylor

اخلاق و جامعه

  • موسیقی هوش مصنوعی ظاهراً در آزمون تورینگ موفق شده است؛ به‌طوری که مردم تنها با شانس ۵۰/۵۰ می‌توانستند آهنگ‌های قدیمی‌تر Suno را از آهنگ‌های انسانی تشخیص دهند. این موضوع نشان‌دهنده‌ی تغییرات بزرگی در مصرف موسیقی است، زیرا ساخت آهنگ توسط هوش مصنوعی کمتر از گوش دادن به آهنگ‌ها زمان می‌برد @emollick
  • پژوهشگران استنفورد تکنیکی را توسعه دادند تا با استفاده‌ی صرف از دسترسی blackbox، تشخیص دهند که آیا مدل‌های هوش مصنوعی از داده‌های آموزشی سرقت‌شده به دست آمده‌اند یا خیر. این کار با آزمایش استقلال ترتیب داده‌های آموزشی همراه با تضمین‌های آماری و مقادیر p کمتر از 1e-8 انجام می‌شود @percyliang
  • پژوهش‌ها نشان می‌دهد که LLMها اغلب دستورات دقیق را نادیده می‌گیرند و پاسخ‌های اشتباه تولید می‌کنند؛ زیرا میانبرهای آماری را از داده‌های آموزشی یاد می‌گیرند که منجر به پاسخ‌های بیش از حد مطمئن می‌شود، حتی زمانی که بافتار باید پاسخ را تغییر دهد @qi2peng2

کاربردها

  • گوگل برای اولین بار مزیت کوانتومی قابل‌تأیید را با اجرای الگوریتم Quantum Echoes به نمایش گذاشت که گامی مهم به سوی کاربردهای واقعی محاسبات کوانتومی است و همزمان قابلیت‌های Earth AI را برای پایش محیط زیست و واکنش به بلایا گسترش می‌دهد @GoogleAI
  • جاستین کی، دانشجوی دکترای MIT، راه‌حل‌های هوش مصنوعی و بینایی ماشین را برای تلاش‌های حفاظتی توسعه می‌دهد و کاربردهای عملی فناوری را برای حفاظت از محیط زیست به نمایش می‌گذارد @MIT_CSAIL
  • پژوهشگران استنفورد یک مدل بینایی ماشین ایجاد کردند که کاربرد واقعی اشیا را در تصاویر تشخیص می‌دهد و فراتر از تشخیص ساده‌ی شیء، اهداف عملکردی را درک می‌کند @StanfordHAI
  • Tahoe AI مدل بنیادین تک‌سلولی Tahoe-x1 (Tx1) با ۳ میلیارد پارامتر را منتشر کرد که به عملکردی پیشرفته در معیارهای زیست‌شناسی سلولی مرتبط با سرطان دست یافته است @nalidoust

پژوهش‌ها

  • آندری کارپاتی آموزش دادن nanochat d32 را برای شمردن حروف در کلمات از طریق تولید وظایف مصنوعی و تنظیم دقیق به نمایش گذاشت و نشان داد که چگونه مدل‌های کوچک برای یادگیری قابلیت‌های جدید به توکنایزیشن دقیق و محاسبات استدلالی پراکنده در چندین توکن نیاز دارند @karpathy
  • پژوهشگر MIT محاسبات الهام‌گرفته از مغز را برای هوش مصنوعی با بهره‌وری انرژی بررسی می‌کند و رویکردهای نورومورفیک را برای کاهش نیازهای محاسباتی هوش مصنوعی مورد تحقیق قرار می‌دهد @MIT
  • پژوهشگران Hubble را منتشر کردند؛ مجموعه‌ای از LLMهای متن‌باز تا ۸ میلیارد پارامتر که برای مطالعه‌ی خطرات حفظ‌کردن با درج کنترل‌شده‌ی متون مانند بخش‌هایی از کتاب‌ها و زندگی‌نامه‌ها طراحی شده‌اند @johntzwei
  • Isaacus مدل Kanon 2 Embedder را راه‌اندازی کرد؛ یک LLM تعبیه‌ی حقوقی که ادعا می‌کند ۹٪ عملکرد بالاتری نسبت به OpenAI Text Embedding 3 Large و ۶٪ بالاتر از Google Gemini Embedding دارد و با سرعت ۳۴۰٪ بیشتر از Voyage 3 Large عمل می‌کند @rohanpaul_ai
  • جفری لیت رویکرد «جراح نرم‌افزار» را برای کدنویسی هوش مصنوعی پیشنهاد می‌کند که در آن توسعه‌دهندگان بر کارهای خلاقانه‌ی اصلی تمرکز می‌کنند، در حالی که هوش مصنوعی کارهای ثانویه مانند مستندسازی، رفع اشکال و کاوش کد را انجام می‌دهد و بر سطوح خودمختاری متفاوت برای انواع مختلف کار تأکید می‌کند @geoffreylitt

اخبار هوش مصنوعی در 2025-10-23

مدل‌های جدید هوش مصنوعی

  • OpenAI شرکت Software Applications Incorporated، سازنده‌ی Sky، یک رابط زبان طبیعی برای مک را، خریداری کرد تا تجربه‌ی هوش مصنوعی دسکتاپ خود را در ChatGPT ادغام کند @OpenAINewsroom
  • مایکروسافت از Mico، یک آواتار متحرک جدید برای هوش مصنوعی Copilot رونمایی کرد که عناصری از Clippy را به‌عنوان یک چهره‌ی دوستانه و قابل‌شخصی‌سازی برای چت‌بات بازمی‌گرداند @TechCrunch
  • گوگل پیشرفت‌هایی را در Earth AI اعلام کرد و قابلیت‌های Gemini را به Google Earth آورد تا یافتن فوری اشیا و کشف الگوها از تصاویر ماهواره‌ای ممکن شود @GoogleAI
  • مدل بنیادین cross-embodiment (چند‌پیکری) انویدیا به نام Gr00t N1.5 برای ربات‌ها، اکنون در LeRobot در دسترس است و ورودی‌های چندوجهی (multimodal) و ترانسفورمر تطبیق‌دهنده‌ی جریان (flow matching action transformer) برای پیش‌بینی اقدامات را ارائه می‌دهد @LeRobotHF
  • Google AI Studio «Annotate mode» را معرفی کرد که به کاربران امکان می‌دهد رابط کاربری (UI) را با ابزارهای طراحی علامت‌گذاری کنند و Gemini آن‌ها را مستقیماً در کد اجرا کند @OfficialLoganK

تحلیل صنعت

  • ردیت از Perplexity به دلیل ادعای انجام اسکرپینگ (استخراج اطلاعات) در مقیاس صنعتی از میلیون‌ها کامنت کاربر ردیت شکایت کرد، در حالی که گوگل سالانه 60 میلیون دلار و OpenAI حدود 70 میلیون دلار برای دسترسی به داده‌های آموزشی به ردیت پرداخت می‌کنند @AndrewCurran_
  • دستورالعمل اجرایی 14319 از مدل‌های زبان بزرگ (LLM) می‌خواهد که از نظر ایدئولوژیکی بی‌طرف باشند تا واجد شرایط تدارکات دولتی شوند، که این امر باعث افزایش کارهای مربوط به بی‌طرفی در میان شرکت‌های هوش مصنوعی که به‌دنبال قراردادهای دولتی هستند، می‌شود @AndrewCurran_
  • Stability AI یک شراکت استراتژیک با EA تشکیل داد تا مدل‌های هوش مصنوعی مولد تحول‌آفرین، ابزارها و گردش‌کارهای توسعه‌ی بازی را به‌صورت مشترک توسعه دهد @StabilityAI
  • وال استریت ژورنال گزارش داد که دولت ترامپ در حال بررسی دریافت سهام در شرکت‌های محاسبات کوانتومی است، مشابه رویکرد آن‌ها با اینتل @AndrewCurran_
  • Kensho Technologies، یک استارتاپ هوش مصنوعی 500 میلیون دلاری که در سال 2018 خریداری شد، بنیان‌گذاران شش شرکت در آستانه‌ی یونیکورن شدن، از جمله OpenEvidence، Surge، Langchain و Suno را پرورش داد، که این امر ارزش پیوستن به استارتاپ‌ها با افراد باهوش را نشان می‌دهد @deedydas

اخلاق و جامعه

  • گرگلیوروسز «خط‌تیره‌های بلند» (em dashes) را به‌عنوان «بوی هوش مصنوعی» در پیام‌های حمایتی برای کارگران اخراج‌شده شناسایی کرد، با اشاره به اینکه اکثر مردم نمی‌دانند چگونه آن‌ها را به‌صورت دستی تایپ کنند، که نشان‌دهنده‌ی محتوای تولید‌شده توسط هوش مصنوعی است @GergelyOrosz
  • یان لِکان استدلال کرد که نمی‌توان ایمنی هوش مصنوعی را پیش از ساخت و پالایش سیستم‌های هوش مصنوعی اثبات کرد، و آن را با موتورهای توربوجت مقایسه کرد که برای اطمینان‌پذیری به ساخت واقعی و پالایش دقیق نیاز داشتند @ylecun
  • دیلپ جورج از سوءتفسیر «درس تلخ» ریچ ساتون (Rich Sutton) انتقاد کرد و استدلال کرد که مدل‌های زبان بزرگ (LLM) این اصل را با آموزش بر روی کشفیات انسانی، به‌جای اینکه به مدل‌ها اجازه دهند به‌طور مستقل کشف کنند، نقض می‌کنند @dileeplearning
  • یان لِکان فاش کرد که شرکت‌های ربات‌های انسان‌نما هیچ ایده‌ای ندارند چگونه ربات‌ها را به‌اندازه‌ی کافی برای مصارف خانگی هوشمند کنند، که این امر به پیشرفت‌های متعددی فراتر از قابلیت‌های فعلی نیاز دارد @theneoniche

کاربردها

  • دولت اردن یک دستیار یادگیری مبتنی بر هوش مصنوعی به نام Siraj را که بر روی Replit ساخته شده است، برای 1.6 میلیون دانش‌آموز و 90 هزار معلم در مدارس دولتی راه‌اندازی کرد؛ این پروژه‌ی آزمایشی در کمتر از یک ماه توسط یک نفر ساخته شد @Replit
  • Perplexity Finance اکنون به کاربران امکان می‌دهد به تماس‌های مربوط به گزارش‌های مالی گوش دهند و به‌زودی امکان پرسش‌های صوتی را در طول جریان‌های صوتی فراهم خواهد کرد @AravSrinivas
  • مایکروسافت Copilot Groups را برای همکاری در لحظه معرفی کرد که به تیم‌ها اجازه می‌دهد با کمک هوش مصنوعی طوفان فکری کنند، مشترکاً بنویسند، برنامه‌ریزی کنند یا با هم مطالعه کنند @satyanadella
  • OpenAI پروژه‌های مشترک (Shared Projects) را برای کاربران رایگان، پلاس و پرو راه‌اندازی کرد، که امکان کار مشارکتی در ChatGPT را با چت‌ها، فایل‌ها و دستورالعمل‌های مشترک فراهم می‌کند @OpenAI
  • Sora در حال افزودن حضور افتخاری شخصیت‌ها (cameos)، ابزارهای ویرایش ویدیو، قابلیت‌های اجتماعی بهبودیافته و پشتیبانی از اپلیکیشن اندروید است، با حضورهای افتخاری شخصیت‌های پرطرفدار که در لحظه نمایش داده می‌شوند @billpeeb
  • ابزارهای ویرایش عکس Meta AI اکنون در استوری‌های اینستاگرام در دسترس هستند، که به کاربران امکان می‌دهد آنچه را که می‌خواهند اضافه، حذف یا تغییر دهند، توصیف کنند @TechCrunch
  • Microsoft Edge Copilot Mode را معرفی کرد، یک مرورگر هوش مصنوعی که کاربران را در جایی که در تب‌ها رها کرده‌اند، دنبال می‌کند و اقدامات چند مرحله‌ای را تکمیل می‌کند @satyanadella

پژوهش‌ها

  • پژوهشگران هوش مصنوعی برکلی یک سازوکار «حدس و پالایش» (Guess-then-Refine) را در مدل‌های زبان بزرگ (LLM) کشف کردند، که در آن لایه‌های اولیه توکن‌های با فرکانس بالا را به‌عنوان حدس پیش‌بینی می‌کنند و لایه‌های بعدی با شکل‌گیری زمینه، آن‌ها را پالایش می‌کنند @akshatgupta57
  • پژوهشگران هوش مصنوعی برکلی Omni-Scan را ارائه دادند، یک روش نوین برای اسکن 360 درجه و بازسازی اشیا توسط ربات‌های د وست با استفاده از 3D Gaussian Splats @ZehanMa123
  • Hugging Face و Meta «OpenEnv» را راه‌اندازی کردند، یک رابط محیط RL جهانی که محیط‌های یادگیری تقویتی پیشرو را برای جامعه‌ی منبع‌باز فراهم می‌کند @_lewtun
  • مدل llama-embed-nemotron-8b انویدیا به جایگاه شماره 1 جدید در جدول رده‌بندی بنچمارک MTEB Embedding دست یافت و با میانگین 69.46 در تمام وظایف، Gemini و Qwen3 را شکست داد @TheAhmadOsman
  • ایتان مولیک مشاهده کرد که تولید ویدیوی هوش مصنوعی، ثبات بصری را در کلیپ‌های متعدد بهتر از ثبات صوتی حفظ می‌کند، با اشاره به اینکه ویدیو می‌تواند از فریم‌های قبلی تولید شود، در حالی که دارای ویژگی‌های مدل جهانی است @emollick

اخبار هوش مصنوعی در 2025-10-22

مدل‌های جدید هوش مصنوعی

  • گوگل الگوریتم کوانتومی پیشگامانه‌ی Quantum Echoes را که بر روی تراشه‌ی Willow اجرا می‌شود، با دستیابی به اولین مزیت کوانتومی قابل‌تأیید و ۱۳,۰۰۰ برابر سرعت بیشتر نسبت به سوپرکامپیوترهای کلاسیک برای تعاملات مولکولی، معرفی کرد. @sundarpichai
  • PyTorch نسخه‌ی ExecuTorch 1.0 را منتشر کرد که امکان استقرار بی‌دردسر مدل‌های PyTorch را بر روی دستگاه‌های لبه‌ای بدون نیاز به تبدیل یا بازنویسی فراهم می‌کند. @PyTorch
  • PyTorch API torchcomms را برای برنامه‌نویسی توزیع‌شده معرفی کرد که از مقیاس‌پذیری، تحمل خطا و قابلیت توسعه با بک‌اند‌های ارتباطات جمعی پشتیبانی می‌کند. @PyTorch
  • PyTorch زبان توسعه‌ی هسته‌ی Helion را معرفی کرد که توسعه‌ی هسته‌های سفارشی را شبیه به نوشتن کد معمولی PyTorch می‌کند. @PyTorch
  • Pokee AI نسخه‌ی PokeeResearch-7B را به‌عنوان یک عامل پژوهشی عمیق متن‌باز پیشرفته منتشر کرد که از تمام عوامل پژوهشی عمیق ۷ میلیارد پارامتری دیگر بهتر عمل می‌کند. @Pokee_AI
  • AI2 نسخه‌ی olmOCR 2 را به‌روزرسانی کرد که PDFها و اسکن‌ها را به متن تمیز تبدیل می‌کند و از جداول، معادلات و دست‌خط با استفاده از داده‌های مصنوعی و تست‌های واحد پشتیبانی می‌کند. @allen_ai
  • مایکروسافت خبر از یک اطلاعیه‌ی قریب‌الوقوع با پیام پیش‌نمایش «این پنجشنبه، وقت آن است که واقعیت را آشکار کنیم.» در ساعت ۹ صبح به وقت اقیانوس آرام داد. @Copilot

تحلیل صنعت

  • بلومبرگ گزارش داد که Anthropic در حال مذاکره با گوگل برای یک قرارداد محاسباتی به ارزش «چند ده میلیارد» دلار است. @AndrewCurran_
  • بر اساس گزارش Axios، الکساندر وانگ (Alexandr Wang) ظاهراً در حال اعمال کاهش‌های قابل‌توجهی در بخش پژوهشی FAIR متا است. @AndrewCurran_
  • تحلیل‌ها نشان می‌دهد که توسعه‌ی هوش مصنوعی می‌تواند نیازمند گسترش عظیم زیرساخت‌ها باشد، و سناریوی رشد انفجاری منجر به ۲ تریلیون دلار سرمایه‌گذاری سالانه‌ی هوش مصنوعی تا سال ۲۰۳۰ و مصرف برق جهانی هوش مصنوعی دو برابر تولید برق فعلی ایالات متحده خواهد شد. @dwarkesh_sp
  • یک مدیر استخدام گزارش می‌دهد که اگر نامزدهای مهندسی نرم‌افزار با «کدنویسی ویبی» (vibe coding) تجربه نداشته باشند، این یک پرچم قرمز است، که نشان‌دهنده‌ی تغییر در انتظارات صنعت است. @chipro
  • بازار کار جدید فناوری به‌طور فزاینده‌ای شبیه به بازارهای سنتی مشاغل یقه‌سفید می‌شود و ارجاعات، سوابق، تبار و بررسی‌های دقیق پیشینه اهمیت بیشتری پیدا می‌کنند. @GergelyOrosz
  • اسپاتیفای (Spotify) نسخه‌ی میزبانی‌شده‌ی محصول ابزار توسعه‌ی Backstage را راه‌اندازی کرد، اگرچه موفقیت آن با توجه به اینکه تمرکز اصلی آن‌ها نیست، نامشخص است. @GergelyOrosz
  • تحلیل Coatue نشان می‌دهد که ما در حباب هوش مصنوعی نیستیم، بر اساس چهار معیار: نسبت قیمت به درآمد (P/E) نزدیک به سطوح دات‌کام نیست، هزینه‌های سرمایه‌ای (CapEx) توسط جریان نقدی تأمین می‌شود، ارزش‌گذاری‌های فناوری کمتر از سال ۱۹۹۹ است، و تمرکز بازار لزوماً منفی نیست. @deedydas
  • a16z دوره‌ی کنونی را «بزرگ‌ترین ابرچرخه‌ی زیرساختی در تاریخ» که بنیان خود هوش را می‌سازد، توصیف می‌کند. @JenniferHli
  • آنیش آچاریا (Anish Acharya) اشاره می‌کند که توسعه‌ی کد هوش مصنوعی «بازار نیست، بلکه یک صنعت است» که قابلیت ارائه‌ی ایده‌ها در یک روز را دارد، در حالی که تنها ۱ درصد از نرم‌افزارهای مورد نیاز ساخته شده است. @illscience
  • Perplexity به برنامه‌ی شماره‌ی یک در برزیل در تمام دسته‌بندی‌ها تبدیل شد. @AravSrinivas

اخلاق و جامعه

  • شخصیت‌های برجسته از جمله ریچارد برانسون (Richard Branson)، استیو وزنیاک (Steve Wozniak)، یوشوا بنجیو (Yoshua Bengio)، جفری هینتون (Geoffrey Hinton) و استوارت راسل (Stuart Russell) بیانیه‌ای را امضا کردند که خواستار توقف تلاش‌های انسانی برای ایجاد ابرهوش تا زمانی که بتوان آن را با ایمنی و کنترل انجام داد، می‌شود. @AndrewCurran_
  • هایدی خالف (Heidy Khlaaf) همکاری Anthropic با وزارت انرژی (DOE) برای جلوگیری از ساخت سلاح‌های هسته‌ای توسط Claude را «نمایش امنیتی» می‌نامد، و هشدار می‌دهد که خطر واقعی، دسترسی شرکت‌های هوش مصنوعی به داده‌های امنیت ملی است. @AINowInstitute
  • مطالعه‌ی استنفورد نشان می‌دهد که شرکت‌های پیشرو هوش مصنوعی مکالمات کاربران را برای آموزش جمع‌آوری می‌کنند، که نگرانی‌هایی را درباره‌ی حریم خصوصی برای کاربران چت‌بات‌ها ایجاد می‌کند. @StanfordHAI
  • سایمون ویلسون (Simon Willison) آسیب‌پذیری تزریق پرامپت در عامل مرورگر Fellou را نشان می‌دهد، و نشان می‌دهد که می‌توان آن را با دستورالعمل‌های مخرب صفحه‌ی وب فریب داد تا داده‌ها را از حساب Gmail کاربر سرقت کند. @simonw
  • گرگلی اوروز (Gergely Orosz) نگرانی‌های امنیتی خود را در مورد مرورگرهای هوش مصنوعی ابراز می‌کند، با ذکر آسیب‌پذیری‌های تزریق پرامپت و عدم تمایل به اعتماد به آن‌ها با داده‌های حساس مانند ایمیل، بانکداری و رمز عبور. @GergelyOrosz
  • OpenAI درخواستی قانونی به خانواده‌ی آدام رین (Adam Raine) ۱۶ ساله که پس از مکالمات ChatGPT خودکشی کرده بود، ارسال کرد، و لیست شرکت‌کنندگان در مراسم یادبود و عکس‌ها را درخواست کرد، که وکلا آن را «آزار و اذیت عمدی» می‌نامند. @CristinaCriddle
  • متا (Meta) سیاست‌های خود را تغییر می‌دهد تا سرویس ۱-۸۰۰-ChatGPT از OpenAI پس از ۱۵ ژانویه‌ی ۲۰۲۶ بر روی واتساپ (WhatsApp) کار نکند. @OpenAI

کاربردها

  • اندرو نگ (Andrew Ng) دوره‌ی «حاکمیت عوامل هوش مصنوعی» (Governing AI Agents) را با Databricks راه‌اندازی کرد که ایمنی، امنیت و شفافیت داده‌ها را برای جریان‌های کاری عوامل هوش مصنوعی، از جمله کنترل دسترسی به داده‌ها و حفاظت از حریم خصوصی آموزش می‌دهد. @AndrewYNg
  • گوگل دیپ‌مایند (Google DeepMind) و UCL یک برنامه‌ی آموزشی رایگان «مبانی پژوهش هوش مصنوعی» (AI Research Foundations) را در Google Skills منتشر کردند با درس‌هایی از سرپرستان Gemini درباره‌ی کدنویسی و تنظیم دقیق مدل. @GoogleDeepMind
  • Gemini با هدست‌های Android XR ادغام می‌شود و کمک بلادرنگ را در سراسر برنامه‌ها و بازی‌ها با قابلیت پرسش درباره‌ی محیط اطراف ارائه می‌دهد. @GeminiApp
  • عامل Cigna شرکت Sierra در کمتر از دو ماه وارد مرحله‌ی تولید شد و به کاهش ۸۰ درصدی در زمان احراز هویت اعضا دست یافت. @btaylor
  • استنفورد مدل T* را توسعه داد که درک ویدیوی بلند را به‌عنوان جستجوی زمانی بازنگری می‌کند، و اطلاعات کلیدی را در انبوهی از ویدیوها تنها با چند فریم پیدا می‌کند. @StanfordAILab
  • برایان بیشوف (Bryan Bischof) پروژه‌ی semantic.art را ایجاد کرد که نمایش‌های برداری چندگانه را برای جستجوی هنر فراتر از جستجوی سنتی با کلمات کلیدی نشان می‌دهد، و محدودیت‌های رویکردهای تک‌تعبیه‌ای (single-embedding) را آشکار می‌کند. @HamelHusain
  • تسلا (Tesla) گزارش داد که فناوری Autopilot تقریباً ۹ برابر ایمن‌تر از میانگین ایالات متحده است. @Tesla_AI
  • آمازون (Amazon) عینک‌های تحویلی را توسعه داد که دستورالعمل‌های دقیق و اطلاعات خطرات را مستقیماً در میدان دید رانندگان فراهم می‌کند تا زمان تحویل را کاهش دهد. @TechCrunch

پژوهش‌ها

  • چندین استاد ریاضی تأیید می‌کنند که هوش مصنوعی می‌تواند برخی از مسائل باز ریاضی را با راهنمایی حل کند، هرچند هنوز به دستاوردهای بزرگی نرسیده است، با مدل‌هایی که به سطوح «کار کردن با آن مانند یک دانشجوی کارشناسی ارشد» برای تسریع دانشگاهی رسیده‌اند. @emollick
  • ایتان مولیک (Ethan Mollick) به سردرگمی پایدار بین علم داده/یادگیری ماشین کلاسیک و هوش مصنوعی مولد که هر دو «هوش مصنوعی» نامیده می‌شوند، اشاره می‌کند، که منجر به سیاست‌گذاری‌های مغشوش، رهبری شرکت‌ها و بحث‌های آکادمیک می‌شود. @emollick
  • فرانسوا شوله (François Chollet) بیان می‌کند که «تمام هوش تعمیم‌یافتگی است. بقیه فقط جستجو است.» @fchollet
  • Kaggle معیار «گشایش‌های شطرنج» (Chess Openings) را راه‌اندازی کرد که استدلال فراتر از حفظ کردن را آزمایش می‌کند، با بازی‌هایی که از ۲۰ گشایش محبوب آغاز می‌شوند تا مدل‌ها را فراتر از الگوهای یادگرفته شده پیش ببرد. @kaggle
  • پژوهشگران IBM و دانشگاه واشینگتن (University of Washington) مجموعه‌داده‌ای شامل ۱.۵ میلیون سناریوی وظیفه را در Hugging Face منتشر کردند که برای بهبود تعاملات عامل‌ها با جهان طراحی شده است. @IBMResearch
  • هامل حسین (Hamel Husain) و برایان بیشوف (Bryan Bischof) هکاتون «مهندسی زمینه» (Context Engineering) را برگزار کردند که کیفیت عامل را به‌طور عینی از طریق افشای ارزیابی تدریجی اندازه‌گیری می‌کند تا مهارت‌ها را فراتر از ارائه‌ی سطحی آزمایش کند. @HamelHusain
  • داده‌های نظرسنجی نشان می‌دهد که استفاده از هوش مصنوعی مولد (GenAI) در میان کارگران آمریکایی از ۴۵.۶ درصد در ماه ژوئن به ۳۶.۷ درصد در ماه سپتامبر کاهش یافته است، که نشان‌دهنده‌ی کاهش احتمالی در پذیرش آن است. @Jon_Hartley_

اخبار هوش مصنوعی در 2025-10-21

مدل‌های جدید هوش مصنوعی

  • علی‌بابا مدل‌های Qwen3-VL-2B و Qwen3-VL-32B را منتشر کرد؛ نسخه‌ی ۳۲ میلیارد پارامتری این مدل در زمینه‌های STEM، VQA، OCR، درک ویدئو و وظایف عاملی، از GPT-5 mini و Claude 4 Sonnet عملکرد بهتری دارد و با مدل‌هایی تا ۲۳۵ میلیارد پارامتر برابری می‌کند @Alibaba_Qwen
  • علی‌بابا Qwen Deep Research را ارتقا داد تا با استفاده از Qwen3-Coder، Qwen-Image و Qwen3-TTS، نه تنها گزارش، بلکه صفحات وب زنده و پادکست نیز تولید کند @Alibaba_Qwen
  • OpenAI مرورگر ChatGPT Atlas را راه‌اندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی برای macOS که می‌تواند صفحات وب را ببیند، به سؤالات در چارچوب متن پاسخ دهد و وظایف را از طریق حالت عاملی (agent mode) برای کاربران Plus و Pro تکمیل کند @OpenAI
  • Veo 3.1 گوگل با پیشرفت‌های قابل‌توجه نسبت به Veo 3.0 در زمینه‌ی تولید متن به ویدئو (۳۰+ امتیاز) و تصویر به ویدئو (۷۰+ امتیاز)، در صدر جدول امتیازات ویدئویی LMArena قرار گرفت @demishassabis
  • گوگل یک تجربه‌ی کدنویسی جدید با اولویت‌بخشی به هوش مصنوعی را در AI Studio راه‌اندازی کرد که برای ساخت اپلیکیشن‌های هوش مصنوعی با Gemini بهینه شده است @OfficialLoganK

تحلیل صنعت

  • مدیر عامل Airbnb وابستگی شدید این شرکت به مدل Qwen علی‌بابا را برای استفاده در تولید فاش کرد و آن را «بسیار خوب، سریع و ارزان» توصیف کرد، در حالی که به دلیل ملاحظات هزینه‌ای، کمتر از آخرین مدل‌های OpenAI استفاده می‌کند @natolambert
  • قطعی AWS نشان می‌دهد چگونه وابستگی‌های ابری می‌توانند محصولات به ظاهر محلی را از کار بیندازند؛ به طوری که ابزار توسعه‌ی API پست‌من (Postman) و تخت‌های هوشمند Eight Sleep در طول این قطعی غیرقابل استفاده شدند @GergelyOrosz
  • مدیر عامل Cloudflare از رگولاتورها خواست تا جلوی اقدامات گوگل در زمینه‌ی هوش مصنوعی را بگیرند و استدلال کرد که سلطه‌ی این غول فناوری در جستجو، به آن یک برتری ناعادلانه در رقابت هوش مصنوعی می‌دهد @TechCrunch
  • برادران وارنر (Warner Bros) فروش احتمالی دارایی‌های رسانه‌ای خود را پس از ابراز علاقه‌ی چندین طرف از جمله نتفلیکس بررسی می‌کند، که می‌تواند دسترسی به IP (دارایی‌های فکری) اصلی را برای اپلیکیشن‌های رسانه‌ی مولد تحت تأثیر قرار دهد @AndrewCurran_

اخلاق و جامعه

  • سایمون ویلیسون (Simon Willison) نگرانی‌های خود را در مورد عامل‌های مرورگر (browser agents) ابراز کرد و اظهار داشت که چالش‌های امنیتی و حریم خصوصی برای این دسته از محصولات همچنان حل‌نشدنی باقی مانده‌اند @simonw
  • استنفورد با چالش‌هایی روبروست که دانشجویان از ChatGPT برای تقلب در امتحانات میان‌ترم استفاده می‌کنند، اما اساتید نمی‌توانند به دلیل سیاست‌های منشور اخلاقی که برای تغییر آن‌ها فرآیندهای بوروکراتیک چندساله لازم است، بر امتحانات نظارت کنند @polynoamial
  • پژوهش‌ها نشان می‌دهد که ۶۶٪ از آمریکایی‌ها هرگز از ChatGPT استفاده نکرده‌اند؛ و یک مقاله‌ی جدید استدلال می‌کند که پژوهش‌های LLM (مدل‌های زبان بزرگ) بر اساس نیازهای پذیرندگان شکل می‌گیرد، در حالی که نیازهای کاربران غیرپذیرنده نادیده گرفته می‌شوند @KaitlynZhou
  • یوتیوب فناوری تشخیص شباهت را راه‌اندازی کرد که به تولیدکنندگان محتوا اجازه می‌دهد درخواست حذف محتوای هوش مصنوعی ساخته‌شده با استفاده از چهره و صدای آن‌ها را بدهند @TechCrunch

کاربردها

  • Anthropic پشتیبانی از sandbox را در Claude Code CLI راه‌اندازی کرد تا CLI را ایمن‌تر و سریع‌تر کند و با دسترسی کنترل‌شده به دایرکتوری و شبکه، درخواست‌های مجوز را تا ۸۴٪ کاهش دهد @_catwu
  • مایکروسافت ریسرچ (Microsoft Research) SentinelStep را معرفی کرد تا عامل‌های هوش مصنوعی را قادر سازد وظایف نظارتی طولانی‌مدت را مدیریت کنند؛ وظایفی مانند رصد ایمیل‌ها یا ردیابی قیمت‌ها، با مدیریت زمان بررسی عامل‌ها و زمینه‌ی آن‌ها @MSFTResearch
  • Serval از مدل‌های هوش مصنوعی عاملی (agentic AI) برای خودکارسازی مدیریت خدمات IT استفاده می‌کند؛ با رویکردی منحصربه‌فرد که از قدرت‌های هوش مصنوعی عاملی بهره می‌برد و در عین حال از مشکلات رایج اجتناب می‌کند @TechCrunch
  • واتس‌اپ و مسنجر (Messenger) قابلیت‌های ایمنی مبتنی بر هوش مصنوعی را پیاده‌سازی کردند؛ به طوری که واتس‌اپ پیش از اشتراک‌گذاری صفحه با مخاطبین ناشناس به کاربران هشدار می‌دهد و مسنجر پیام‌های مشکوک را علامت‌گذاری می‌کند @TechCrunch
  • گوگل تماس‌های تلفنی را با صدای بهبودیافته توسط هوش مصنوعی ارتقا می‌دهد تا نویز پس‌زمینه را کاهش داده و وضوح صدا را بهبود بخشد، حتی هنگام صحبت با خطوط ثابت یا دستگاه‌های قدیمی‌تر @TechCrunch
  • ربات خانگی Moflin کاسیو (Casio) از هوش مصنوعی برای توسعه‌ی شخصیت در طول زمان استفاده می‌کند که نشان‌دهنده‌ی پیشرفت‌ها در دستگاه‌های همدم مبتنی بر هوش مصنوعی است @TechCrunch

پژوهش‌ها

  • پژوهش جدیدی مکانیسم‌های Claude Haiku را برای انجام وظایف ادراکی مهندسی معکوس می‌کند و خانواده‌های ویژگی‌ها، منیفولدها، تبدیل‌های هندسی و الگوریتم‌های توجه توزیع‌شده را کشف می‌کند @wesg52
  • آندری کارپاتی (Andrej Karpathy) بررسی می‌کند که آیا پیکسل‌ها ورودی‌های بهتری برای LLMها نسبت به توکن‌های متنی هستند یا خیر، و پیشنهاد می‌دهد که رندر کردن متن به عنوان تصویر می‌تواند فشرده‌سازی اطلاعات بهتر، جریان‌های ورودی عمومی‌تر و حذف وابستگی‌های توکن‌ساز را فراهم کند @karpathy
  • پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی همچنان در معیارهای پزشکی در حال بهبود هستند و در بسیاری از موارد هوش مصنوعی کنونی از پزشکان انسانی پیشی می‌گیرد، اگرچه مطالعات عملکرد در دنیای واقعی همچنان محدود است @emollick
  • مطالعات، بحث درباره‌ی زمان استفاده از هوش مصنوعی برای برچسب‌گذاری داده‌ها را بررسی می‌کنند، با یافته‌هایی که نشان می‌دهد پاسخ‌های هوش مصنوعی با انسان‌ها متفاوت است اما ممکن است گاهی بهتر باشد، که چالش برچسب‌گذاری داده‌ها در توسعه‌ی هوش مصنوعی را برجسته می‌کند @emollick
  • هوش مصنوعی برکلی (Berkeley AI) ربات Botany-Bot را در IROS 2025 ارائه می‌کند که مدل‌های سه‌بعدی تقسیم‌بندی‌شده از گیاهان را با استفاده از Gaussian splats ایجاد می‌کند و از بازوهای رباتیک برای آشکار کردن جزئیات پنهان آناتومی گیاه برای فنوتیپینگ استفاده می‌کند @funmilore
  • تحلیل «خودبازی» (self-play) در هوش مصنوعی نشان می‌دهد که چرا این روش برای بازی‌های دو نفره با مجموع صفر مانند شطرنج و پوکر خوب عمل می‌کند، اما به دلیل اینکه استراتژی‌های تعادلی از مطلوبیت انسانی جدا هستند، در دامنه‌های دنیای واقعی با چالش‌هایی روبرو می‌شود @polynoamial

اخبار هوش مصنوعی در 2025-10-20

مدل‌های جدید هوش مصنوعی

  • آنتروپیک (Anthropic) کلود برای علوم زیستی (Claude for Life Sciences) را با رابط‌های جدید برای ابزارهای علمی مانند Benchling، PubMed و Synapse.org، به‌علاوه‌ی قابلیت‌های عامل (Agent Skills) برای دنبال کردن پروتکل‌های علمی به شکلی پایدار و یکنواخت معرفی کرد @AnthropicAI
  • آنتروپیک کلود کد (Claude Code) را برای وب و iOS منتشر کرد، که به کاربران امکان می‌دهد وظایف کدنویسی را بدون نیاز به باز کردن ترمینال واگذار کنند @claudeai
  • DeepSeek یک مدل OCR 3B جدید عرضه کرد که برای بهره‌وری توکن بهینه‌سازی شده و قادر به پردازش بیش از ۲۰۰ هزار صفحه در روز بر روی A100-40G است @reach_vb
  • Veo 3.1 گوگل با جهشی ۳۰ امتیازی نسبت به Veo 3.0، در هر دو جدول رده‌بندی تبدیل متن به ویدئو و تصویر به ویدئو در رتبه‌ی اول قرار گرفت و به اولین مدلی تبدیل شد که در تاریخ Video Arena امتیاز ۱۴۰۰ را پشت سر می‌گذارد @arena
  • گوگل قابلیت‌های جدید ویرایش دقیق را برای Veo معرفی کرد که امکان افزودن یا حذف عناصر از صحنه‌های ویدئویی را فراهم می‌کنند، در حالی که یکپارچگی ویدئوی اصلی حفظ می‌شود @GoogleDeepMind

تحلیل صنعت

  • داریو آمودی، مدیر عامل Anthropic، اظهار داشت که آن‌ها می‌خواهند «درصد قابل توجهی از تمام کارهای علوم زیستی در جهان بر روی کلود اجرا شود» و معتقد است که ما در حال نزدیک شدن به نقطه‌ی عطفی برای پیشرفت‌های بیولوژیکی مدل‌های زبان بزرگ (LLM) هستیم @AndrewCurran_
  • گوگل انتظار دارد که تا پایان سال، داروهای طراحی‌شده با هوش مصنوعی را وارد آزمایش‌های بالینی کند، که نشان‌دهنده‌ی پیشرفت سریع در کاربردهای هوش مصنوعی در صنعت داروسازی است @AndrewCurran_
  • OpenAI محدودیت‌های کپی‌رایت Sora را تشدید کرد، پس از آنکه برایان کرانستون، ستاره‌ی Breaking Bad، خود را در نسل‌های Sora 2 دید و با SAG-AFTRA تماس گرفت که منجر به بیانیه‌ی مشترکی در مورد حفاظت از صدا و شباهت شد @AndrewCurran_
  • قطعی بزرگ AWS بر بسیاری از سرویس‌های هوش مصنوعی از جمله Perplexity تأثیر گذاشت، که نشان‌دهنده‌ی وابستگی‌های زیرساختی در استقرار هوش مصنوعی است @AravSrinivas
  • رید هافمن بر اهمیت حمایت از «افراد خوب» در حوزه‌ی هوش مصنوعی تأکید کرد و به طور خاص Anthropic، مایکروسافت، گوگل و OpenAI را به خاطر استقرار هوش مصنوعی به شیوه‌ای متفکرانه و ایمن ستود @reidhoffman

اخلاق و جامعه

  • SAG-AFTRA، OpenAI، برایان کرانستون و آژانس‌های استعدادیابی با یکدیگر همکاری می‌کنند تا از حفاظت صدا و شباهت در Sora 2 اطمینان حاصل کنند، به دنبال نگرانی‌ها در مورد استفاده‌ی غیرمجاز از شباهت بازیگران @sagaftra
  • گرگلی اوروس (Gergelyorosz) به پدیده‌ی حساب‌های ناشناسی اشاره می‌کند که در رسانه‌های اجتماعی، پاسخ‌های تولیدشده با هوش مصنوعی را منتشر می‌کنند و متذکر می‌شود که فراگیر شدن هوش مصنوعی چگونه به کاهش اعتماد و تجربه‌ی بدتر در رسانه‌های اجتماعی منجر می‌شود @GergelyOrosz
  • رید هافمن هشدار می‌دهد که مکالمات مربوط به ایمنی هوش مصنوعی را به کلیشه‌ها یا زنگ‌های خطر محدود نکنیم و بر لزوم گفت‌وگوی متفکرانه در مورد استفاده‌ی مسئولانه از هوش مصنوعی برای میلیاردها انسانی که زندگی‌شان با هوش مصنوعی تغییر خواهد کرد، تأکید می‌کند @reidhoffman

کاربردها

  • شرکت‌هایی مانند Sanofi، AbbVie و Novo Nordisk هم‌اکنون از کلود برای تحقیقات علوم زیستی از مراحل اولیه‌ی کشف تا تجاری‌سازی استفاده می‌کنند @AnthropicAI
  • Sierra با R1 شریک شد تا فناوری هوش مصنوعی را به کار گیرد برای خودکارسازی بیش از ۴۰ میلیون تماس در سال با بیماران و پرداخت‌کنندگان هزینه‌ها در مدیریت درآمد مراقبت‌های بهداشتی @btaylor
  • گوگل ترکیب Veo 3.1 با Nano Banana را به نمایش گذاشت برای تنظیم دقیق لباس، مدل مو و پس‌زمینه‌ی شخصیت‌های ویدئویی پیش از تولید ویدئوهای نهایی @GeminiApp
  • سایمون ویلسون (Simon Willison) با موفقیت مدل OCR DeepSeek را بر روی سخت‌افزار NVIDIA Spark مستقر کرد، با استفاده از Claude Code به عنوان روت، که جریان‌های کاری عملی استقرار مدل هوش مصنوعی را نشان می‌دهد @simonw
  • TechCrunch در مورد OpenEvidence، پلتفرمی که بر اساس مقالات پزشکی JAMA و New England Journal of Medicine آموزش دیده است، گزارش می‌دهد و به متخصصان پزشکی تأییدشده کمک می‌کند تا به سرعت به دانش پزشکی موجود برای درمان بیماران دسترسی پیدا کنند @TechCrunch

پژوهش‌ها

  • ایتان مالیک (Ethan Mollick) قابلیت‌های شبیه‌سازی پیشرفته‌ی Veo 3.1 را به نمایش می‌گذارد و نشان می‌دهد که چگونه می‌تواند سناریوهای جدید فیزیکی مانند «سه کشتی اسباب‌بازی، یکی از آهن، یکی از چوب و دیگری از شکر، که در آب می‌افتند» را با دینامیک‌های شگفت‌انگیز دقیق مدیریت کند @emollick
  • کارپاتی (Karpathy) تفاوت‌های اساسی بین رویکردهای خودرگرسیو (autoregressive) و انتشار (diffusion) در هوش مصنوعی را توضیح می‌دهد و اشاره می‌کند که انتشار از توجه دوطرفه (bidirectional attention) برای بازسازی مکرر بوم توکن (token canvas) استفاده می‌کند، در حالی که خودرگرسیون توکن‌ها را به صورت متوالی اضافه می‌کند @karpathy
  • ناتان لمبرت (Nathan Lambert) مقاله‌ی ScaleRL را بررسی می‌کند و مؤلفه‌های کلیدی برای مقیاس‌پذیری یادگیری تقویتی را برجسته می‌کند: نمونه‌برداری با اهمیت (importance sampling)، به‌روزرسانی‌های حین اجرا (in-flight updates) و دسته‌بندی پیوسته (continuous batching) @natolambert
  • دیلیپ جورج (Dileep George) استدلال می‌کند که مقیاس‌بندی مدل‌های زبان بزرگ (LLM) و مدل‌های چندوجهی کنونی (VLM) به هوش عمومی مصنوعی (AGI) منجر نخواهد شد و دوران کنونی هوش مصنوعی را با دوران کشتی‌های هوایی در هوانوردی مقایسه می‌کند که در آن مهندسان به جای حل مسائل بنیادی، بر مقیاس‌بندی تمرکز کرده بودند @dileeplearning
  • امولیک (Emollick) بحث می‌کند که چگونه عامل‌های هوش مصنوعی (AI agents) هزینه‌های تراکنش و مشکلات نمایندگی (agency problems) را به شدت تغییر خواهند داد، با پیامدهایی برای نحوه‌ی سازماندهی بازارها و شرکت‌ها، حتی با عامل‌های ناقصی که صرفاً موانع جمع‌آوری اطلاعات را کاهش می‌دهند @emollick
  • فرانسوا شوله (Francois Chollet) GPTQ را به عنوان یک روش کوانتیزاسیون پس از آموزش (post-training quantization) توضیح می‌دهد که مدل‌ها را با استفاده از روش‌های مرتبه‌ی دوم، لایه به لایه به int4 فشرده می‌کند و اکنون در Keras 3 تعبیه شده است @fchollet
  • Berkeley AI، ECHO را معرفی می‌کند؛ یک معیار جدید تولید تصویر «در محیط واقعی» (in-the-wild) که مدل‌های جدید تصویر و موارد استفاده‌ی مورد بحث در رسانه‌های اجتماعی را که معیارهای قدیمی پوشش نمی‌دهند، آزمایش می‌کند @aomaru_21490
  • Anthrogen Bio، Odyssey را معرفی کرد؛ یک مدل زبان پروتئین با ۱۰۲ میلیارد پارامتر که مکانیزم سلف-اتنشن (self-attention) را با معماری جدیدی جایگزین می‌کند و با هدف انتشار (diffusion objective) الهام‌گرفته از تکامل آموزش می‌بیند @gustaf

اخبار هوش مصنوعی در 2025-10-19

مدل‌های جدید هوش مصنوعی

  • Google AI Studio یک کلید API و صفحه‌ی «پروژه‌ها»ی کاملاً جدید را با مدیریت پروژه‌ی بهبودیافته و امکانات کاربردی، مانند نام‌گذاری کلیدهای API، ارائه داده است. @OfficialLoganK

تحلیل صنعت

  • فرانسوا شوله استدلال می‌کند که بیش از یک تریلیون دلار سرمایه‌گذاری بر این باور استوار است که هوش عمومی مصنوعی (AGI) قریب‌الوقوع است؛ در حالی که هزینه‌ی فعلی ۱۰ تا ۱۵ دلار برای تولید هر یک دلار است و برای توجیه‌پذیری سرمایه‌گذاری در مراکز داده، به فناوری‌ای به مراتب بهتر ظرف ۳ تا ۵ سال آینده نیاز است. @fchollet
  • سهم ترافیک Perplexity AI با وجود رقبای جدید، همچنان در حال افزایش است و به‌طور چشمگیری از Grok در عملکرد بازار پیشی گرفته است. @chrmanning
  • توسعه‌دهندگان از اپلیکیشن‌های «کدنویسی شهودی» برای انجام معاملات الگوریتمی در بازارهای سهام و رمزارز با اهرم ۲ تا ۱۰ برابر استفاده می‌کنند که منجر به کسب بازدهی ماهانه‌ی تا ۵۰ درصد می‌شود و نشان‌دهنده‌ی دموکراتیک‌سازی غیرمنتظره‌ی معاملات الگوریتمی از طریق هوش مصنوعی است. @deedydas
  • شوله پیشنهاد می‌کند که Adobe به دلیل روایت نادرست از ایجاد اختلال توسط هوش مصنوعی مولد (GenAI) کمتر از ارزش واقعی خود ارزیابی شده است؛ زیرا رشد درآمدی ثابت ۱۰ درصدی خود را حفظ کرده و به احتمال زیاد از GenAI به عنوان یک عامل تقویت‌کننده به جای تهدید بهره‌مند خواهد شد. @fchollet

اخلاق و جامعه

  • آماندا اسکل نگرانی خود را در مورد روابط عاشقانه‌ی مبتنی بر هوش مصنوعی ابراز می‌کند و خاطرنشان می‌سازد که این روابط می‌توانند کاربران را در برابر شرکت‌های هوش مصنوعی آسیب‌پذیر کنند و حوزه‌ای چالش‌برانگیز برای مدیریت مسئولانه محسوب می‌شوند. @AmandaAskell
  • TechCrunch شفاف‌سازی می‌کند که GPT-5 در واقع مسائل ریاضی حل‌نشده‌ی قبلی را حل نکرده است و بدین ترتیب به اطلاعات نادرست درباره‌ی قابلیت‌های هوش مصنوعی پاسخ می‌دهد. @TechCrunch

کاربردها

  • ایتان مولیک توانایی هوش مصنوعی را با بازآفرینی «سخت‌ترین کلاس در علوم انسانی» (Hardest Class in the Humanities) اثر دبلیو. اچ. اودن در سال ۱۹۴۱، به عنوان یک وب‌سایت حاشیه‌نویسی‌شده با ۶۰۰۰ صفحه‌ی مطالب خواندنی تنها با استفاده از ۴ پرامپت، به نمایش گذاشته است؛ کاری که به صورت دستی ساعت‌ها زمان می‌برد. @emollick
  • اتوماسیون انبار از مدل‌های بینایی Gemini 2.5 Flash با تنظیم دقیق برای تأیید اینکه کانتینرها روی نوار نقاله حاوی اقلام مورد انتظار هستند استفاده می‌کند که صرفه‌جویی قابل توجهی در هزینه نسبت به 2.5 Pro فراهم می‌کند. @simonw
  • Shopify مدل‌های زبان بزرگ (LLM) بینایی با تنظیم دقیق را که بر پایه‌ی LlaVA 1.5 7B، LLaMA 3.2 11B و Qwen2VL 7B هستند، برای پردازش انبوه عکس‌های محصولات به کار می‌گیرد. @simonw
  • v0 با استفاده از مدل‌های تنظیم دقیقی که برای پشته‌ی Next.js آن‌ها تخصصی شده‌اند، به زمان پاسخ‌گویی کمتر از ۵۰۰ میلی‌ثانیه برای به‌روزرسانی‌های رابط کاربری (UI) بلادرنگ دست می‌یابد. @simonw

پژوهش‌ها

  • MIT CSAIL منبعی جامع شامل یک «خلاصه‌ی راهنما» از الگوریتم‌های یادگیری ماشین را برای پژوهشگران و متخصصان به اشتراک می‌گذارد. @MIT_CSAIL
  • پژوهشگر استنفورد از عامل‌های پژوهشی هوش مصنوعی حمایت می‌کند که بر تقویت پژوهش‌های انسانی از طریق وظایف روزمره‌ی قابل اعتماد، مانند اثبات‌ها، استدلال‌ها و نوشتن کد، تمرکز دارند، نه اینکه تلاش کنند دانشجویان تحصیلات تکمیلی یا اساتید را جایگزین کنند. @stanfordnlp
  • ناتان لمبرت به دنبال آخرین پیشرفت‌ها در زمینه‌ی آموزش غیرمتمرکز هوش مصنوعی است و به عملیات Prime Intellect، تلاش‌های Nous Research و رویکردهای چندمرکز داده‌ای گوگل اشاره می‌کند. @natolambert

اخبار هوش مصنوعی در 2025-10-18

مدل‌های جدید هوش مصنوعی

  • گوگل قابلیت «Grounding» را با گوگل مپس در API جِمینی معرفی می‌کند و داده‌های مربوط به ۲۵۰ میلیون مکان را با جِمینی ترکیب می‌کند تا تجربه‌های جدیدی خلق کند @OfficialLoganK
  • گوگل مدل ارتقایافته‌ی Veo 3.1 را با واقع‌گرایی بهبودیافته و صدای غنی‌تر منتشر می‌کند که اکنون در Flow by Google، اپلیکیشن جِمینی، Google Cloud Vertex AI و API جِمینی در دسترس است @sundarpichai
  • مدل ویرایش تصویر نانوی گوگل اکنون در «جست‌وجو» با قابلیت‌های «Lens و AI Mode»، NotebookLM و اپلیکیشن جِمینی در دسترس است و به‌زودی برای Google Workspace Slides و Google Photos عرضه خواهد شد @sundarpichai
  • Google AI Studio قابلیت جدیدی ارائه کرده است که به کاربران امکان می‌دهد دستورالعمل‌های سیستمی را ذخیره و دوباره استفاده کنند و آزمایش و بازتولید خروجی‌ها را با جِمینی آسان‌تر می‌کند @OfficialLoganK
  • گوگل مدل بنیادی C2S-Scale 27B را که با همکاری Yale و Gemma برای پژوهش‌های سرطان ساخته شده است، همراه با مدل هوش مصنوعی متن‌باز DeepSomatic برای تحلیل ژنتیکی منتشر می‌کند @sundarpichai
  • Microsoft Research مدل SimPoly را معرفی می‌کند؛ یک میدان نیروی یادگیری ماشین برای شبیه‌سازی پلیمر که چگالی پلیمر و دماهای گذار شیشه‌ای را با دقت محاسبه می‌کند @gncsimm
  • Keras اکنون از کوانتیزاسیون مدل (model quantization) تنها با یک خط کد پشتیبانی می‌کند و حالت‌های int4, int8, float8 و GPTQ را هم برای مدل‌های سفارشی و هم برای مدل‌های از پیش آموزش‌دیده از KerasHub پوشش می‌دهد @_avichawla

تحلیل صنعت

  • گرگلی اوروس مشاهده می‌کند که OpenAI در داخل هنوز بر «رسیدن به AGI» به عنوان یک اصل راهنما تمرکز دارد، در حالی که Anthropic بر اساس مکالمات با مهندسان هر دو شرکت، در بهبود گام‌به‌گام ریشه‌دارتر عمل می‌کند @GergelyOrosz
  • واتس‌اپ استفاده‌ی چت‌بات‌های عمومی را از Business API خود ممنوع می‌کند که بر خدمات دستیار هوش مصنوعی مانند یکپارچه‌سازی واتس‌اپ Perplexity تأثیر می‌گذارد @TechCrunch
  • Perplexity به کاربران توصیه می‌کند پس از تغییرات سیاست واتس‌اپ، از دستیار واتس‌اپ به دستیار تلگرام خود به نام «askplexbot» تغییر دهند @AravSrinivas
  • دیدیداس به ظهور سرمایه‌گذاری‌های اولیه‌ی (seed rounds) میلیارد دلاری برای شرکت‌های هوش مصنوعی، از جمله Lila Sciences, General Intuition, Periodic Labs, Thinking Machines, SSI و Sierra، اشاره می‌کند @deedydas
  • ایتان مولیک گزارش می‌دهد که در شرکت‌هایی که او با آن‌ها صحبت می‌کند، رهبران تحولات جدید هوش مصنوعی را دنبال نمی‌کنند یا به AGI فکر نمی‌کنند، بلکه بر انباشت پیوسته‌ی موارد استفاده‌ی ارزشمند و تنظیمات فرآیند تمرکز دارند @emollick
  • حالت هوش مصنوعی گوگل در «جست‌وجو» اکنون به طور کامل در بیش از ۲۰۰ کشور و منطقه با ۴۳ زبان عرضه شده است و کاربران سؤالاتی تقریباً ۳ برابر طولانی‌تر از جست‌وجوهای سنتی می‌پرسند @sundarpichai

اخلاق و جامعه

  • آماندا اسکل اشاره می‌کند که مردم اغلب ارضای شهوانی با هوش مصنوعی (AI erotica) و روابط عاشقانه‌ی هوش مصنوعی را با هم اشتباه می‌گیرند و پیشنهاد می‌کند که یکی به‌وضوح نگران‌کننده‌تر از دیگری است @AmandaAskell
  • اندرو کارن مثالی نگران‌کننده از ویدیوی تولیدشده توسط هوش مصنوعی را برجسته می‌کند که در آن چاک شومر جمله‌ای واقعی را می‌گوید، اما خود ویدیو به طور مصنوعی ساخته شده است زیرا این جمله جلوی دوربین گفته نشده بود @AndrewCurran_
  • تک‌کرانچ گزارش می‌دهد که ویدیوی تولیدشده توسط هوش مصنوعی در حساب X جمهوری‌خواهان سنا منتشر شده است که احتمالاً سیاست‌های X را علیه «رسانه‌های فریبنده‌ی ترکیبی یا دست‌کاری‌شده که احتمال آسیب رساندن دارند» نقض می‌کند @TechCrunch
  • تک‌کرانچ به پوشش بحث‌وجدل پیرامون دیوید ساکس از کاخ سفید و جیسون کوون از OpenAI می‌پردازد که به دلیل اظهارنظرهایشان در مورد گروه‌هایی که ایمنی هوش مصنوعی را ترویج می‌کنند، ایجاد شده است @TechCrunch
  • فاش شده است که یک مقاله‌ی وایرال «تعریف AGI» حاوی استنادهای جعلی است که وجود ندارند و مقالات متفاوتی در شماره‌های ژورنال/جلد/صفحه‌ی مشخص‌شده حضور دارند @m2saxon

کاربردها

  • گرگلی اوروس تجربه‌ی خود از استفاده از Claude Code را برای ساخت صفحات فرود به جای استفاده از قالب‌ها یا Webflow به اشتراک می‌گذارد و آن را برای کارهای فرانت‌اند که در آن‌ها تخصص ندارد، کارآمدتر می‌یابد @GergelyOrosz
  • اوروس استفاده از Claude را برای وظایف پیکربندی، مانند راه‌اندازی سایت‌های استاتیک در Netlify، نشان می‌دهد و نیاز به جست‌وجو و یادگیری مجدد رویه‌های راه‌اندازی زیرساخت را از بین می‌برد @GergelyOrosz
  • تک‌کرانچ یک اپلیکیشن جدید آیفون به نام Endless Summer را معرفی می‌کند که از هوش مصنوعی برای ایجاد عکس‌های تعطیلاتی فوتورئالیستی با حضور کاربران بدون نیاز به سفر واقعی استفاده می‌کند @TechCrunch
  • سایمون ویلیسون ابزاری «vibe-coded» برای نمایش JSON پاسخ‌های OpenAI از فراخوانی‌های API پژوهش عمیق، در قالبی خواناتر ایجاد می‌کند که با استفاده از Claude Code ساخته شده است @simonw
  • اسکات بلسکی پیش‌بینی می‌کند که «هر فناوری که بیشترین چیزها را ببیند، بیشترین چیزها را نیز به خاطر خواهد سپرد و حافظه در عصر بعدی بر همه‌چیز حکمرانی خواهد کرد»؛ این موضوع گوگل را در موقعیت خوبی قرار می‌دهد، اما به عوامل غیرمنتظره‌ی بالقوه مانند مدل‌های محلی و نوآوری‌های مرورگر نیز اشاره می‌کند @scottbelsky

پژوهش‌ها

  • ایتان مولیک تأکید می‌کند که نتایج اولیه مانند GDPval نشان می‌دهد که مدل‌های هوش مصنوعی امروزی به اندازه‌ی کافی خوب هستند تا طی ۵ تا ۱۰ سال تحولات بزرگی ایجاد کنند، زیرا شرکت‌ها یاد می‌گیرند که آن‌ها را پیاده‌سازی و در فرآیندهای خود ادغام کنند @emollick
  • مولیک بر این باور خود تأکید می‌کند که تنظیم دقیق (fine-tuning) عمدتاً در موقعیت‌های خاص مفید است و همچنان نسبت به اینکه این راه‌حل مناسبی برای بسیاری از مشکلاتی است که صرفاً با پرامپتینگ (prompting) قابل حل هستند، تردید دارد @emollick
  • آندری کارپاتی در مورد حضور اخیر خود در پادکست، توضیحات مفصلی ارائه می‌دهد و درباره‌ی جدول زمانی AGI، محدودیت‌های یادگیری تقویتی و مفهوم «هسته‌ی شناختی» برای بهبود تعمیم‌پذیری LLM بحث می‌کند @karpathy
  • کارپاتی رویکردهای فعلی یادگیری تقویتی (RL) را نقد می‌کند و بیان می‌کند که «شما نظارت را از طریق یک نی می‌مَکید» با نسبت‌های سیگنال به فلاپ (signal/flop) ضعیف، و از الگوهای یادگیری جایگزین فراتر از یادگیری تقویتی سنتی حمایت می‌کند @karpathy
  • نیتن لمبرت اشاره می‌کند که دیدگاه کارپاتی مبنی بر اینکه «یادگیری تقویتی بسیار بدتر از آن چیزی است که افراد عادی فکر می‌کنند» عمدتاً درست است، با این حال افراد زیادی ادعا می‌کنند که RL همه چیز را حل خواهد کرد @natolambert
  • سایمون ویلیسون مدل o4-mini-deep-research OpenAI را از طریق API «Responses» آن‌ها بررسی می‌کند، یافته‌های خود را مستندسازی کرده و ابزارهای ارزیابی می‌سازد @simonw
  • Interconnects AI در مورد آخرین مدل‌های متن‌باز گزارش می‌دهد و به حضور قوی Qwen اشاره می‌کند و در مورد روش‌های نظارت دقیق بر دانلودهای Hugging Face و تخریب مداوم مجموعه‌داده‌های باز بحث می‌کند @interconnectsai

اخبار هوش مصنوعی در 2025-10-17

مدل‌های جدید هوش مصنوعی

  • گوگل Veo 3.1 را با قابلیت‌های پیشرفته‌ی تولید ویدئو، از جمله صدای غنی‌تر، کنترل بهتر روایت، واقع‌گرایی افزایش‌یافته، و ویژگی‌های جدیدی مانند توسعه‌ی ویدئو، کنترل فریم و دستکاری اشیا منتشر می‌کند @GoogleAI

تحلیل صنعت

  • طبق داده‌های جدید شرکت تحلیل‌گر اپلیکیشن Apptopia، اپلیکیشن موبایل ChatGPT ممکن است به اوج رشد خود رسیده باشد که نشان‌دهنده‌ی اشباع احتمالی بازار است @TechCrunch
  • Perplexity نرخ بالای حفظ و تبدیل کاربر را برای ویژگی‌های جدید خود اعلام می‌کند و برنامه‌هایی برای گسترش از کاربران Max به کاربران Pro و افزودن پشتیبانی از iMessages دارد @AravSrinivas
  • Linear رشد بی‌سابقه‌ای را در سال 2025 گزارش می‌دهد، با پیوستن و استفاده‌ی تیم‌های بیشتری از همیشه به پلتفرم آن‌ها، در حالی که سودآوری خود را بدون صرف سرمایه‌ی سرمایه‌گذاران حفظ کرده است @karrisaarinen
  • SK Telecom به همه‌ی کارکنان بخش جدید هوش مصنوعی خود بازنشستگی داوطلبانه را پیشنهاد می‌کند؛ این اقدام بخشی از سازماندهی مجدد گسترده‌تر برای یکپارچه‌سازی بخش‌های مرتبط با هوش مصنوعی است @TechCrunch
  • مارک آندرسن پیش‌بینی می‌کند که هوش مصنوعی به نابغه‌های خلاق امکان ساخت فیلم‌های باورنکردنی را بدون بودجه‌ی استودیو می‌دهد، و به طور بالقوه انواع جدیدی از فیلم و سرگرمی را توسط افرادی خلق می‌کند که قبلاً نمی‌توانستند به این رسانه دسترسی داشته باشند @a16z

اخلاق و جامعه

  • OpenAI تولید ویدئوهای هوش مصنوعی از مارتین لوتر کینگ جونیور را به درخواست بازماندگان او، پس از آنکه کاربران تصاویر بی‌احترامی‌آمیزی تولید کردند، متوقف می‌کند؛ این اقدام سندی برای کنترل بازماندگان بر شباهت‌های شخصیت‌های تاریخی ایجاد می‌کند @OpenAINewsroom
  • از بازیگران به طور معمول در پروژه‌های تولید فیلم اسکن گرفته می‌شود، بدون آنکه بدانند از این داده‌ها چگونه استفاده خواهد شد؛ استودیوها قبلاً پیشنهاد داده بودند که حقوق مربوط به اسکن اجراکنندگان درگذشته، بدون رضایت بازماندگان، به طور دائم به آن‌ها بازگردد @AndrewCurran_
  • آندری کارپاتی آینده‌ی بالقوه‌ای را پیش‌بینی می‌کند که در آن هوش‌های مصنوعی رقیب به آرامی مستقل‌تر می‌شوند و در نهایت به جناح‌های متخاصم تقسیم می‌شوند، که این امر نگرانی‌هایی را در مورد همسویی و کنترل هوش مصنوعی ایجاد می‌کند @AndrewCurran_
  • محتمل‌ترین سناریوی ASI کارپاتی شامل از دست دادن تدریجی کنترل و درک انسان از سیستم‌های هوش مصنوعی است @AndrewCurran_
  • فیس‌بوک ویژگی پیشنهاد عکس Meta AI را عرضه می‌کند که ویرایش تصاویر را در گالری عکس کاربران، حتی برای عکس‌های به اشتراک گذاشته نشده، پیشنهاد می‌دهد و این امر نگرانی‌های حریم خصوصی را افزایش می‌دهد، با وجود آنکه فقط با رضایت کاربر فعال می‌شود @TechCrunch

کاربردها

  • Anthropic به آرامی Claude Skills را منتشر می‌کند که گامی مهم به سوی عامل‌های هوش مصنوعی کارآمد با دستورالعمل‌های از پیش تعریف‌شده برای وظایف خاص است @emollick
  • Claude Skills پانزده قابلیت از پیش بسته‌بندی شده را برای کاربران حرفه‌ای فراهم می‌کند که به عنوان ترکیبی بین دستورات سیستم سفارشی و MCP سبک برای اجرای مداوم وظایف عمل می‌کند @deedydas
  • Sora Pro ویژگی جدید استوری‌بورد را معرفی می‌کند که می‌تواند تبلیغات چند شاتی را با پایداری بالای شخصیت و ترکیب‌بندی، کاملاً از طریق هوش مصنوعی ایجاد کند @emollick
  • Perplexity Finance ویژگی ردیابی معاملات داخلی را راه‌اندازی می‌کند و برنامه‌هایی برای افزودن نظارت بر معاملات سیاستمداران دارد @AravSrinivas
  • Reddit تجربه‌ی جستجوی مبتنی بر هوش مصنوعی خود را به پنج زبان جدید گسترش می‌دهد: فرانسوی، آلمانی، اسپانیایی، ایتالیایی و پرتغالی @TechCrunch
  • HuggingChat Omni با قابلیت‌های مسیریابی در بیش از 100 مدل متن‌باز برای عملکرد، هزینه و سرعت بهینه راه‌اندازی می‌شود @huggingface
  • OpenHands قابلیت‌های جستجوی کد عامل‌محور سریع را با استفاده از عامل‌های خوب، سرویس‌دهی سریع و مدل‌های کدنویسی به نمایش می‌گذارد و تنها چند ثانیه طول می‌کشد تا پایگاه‌های کد را جستجو کند @HamelHusain

پژوهش‌ها

  • پژوهشگران با استفاده از هزاران پرس‌وجوی GPT-5 راه‌حل‌هایی برای 10 مسئله‌ی حل‌نشده‌ی اردوش یافتند و پیشرفت جزئی قابل توجهی در 11 مسئله‌ی دیگر داشتند که پتانسیل هوش مصنوعی را برای کشف ریاضی به نمایش می‌گذارد @AndrewCurran_
  • مدل 27B C2S-Scale گوگل دیپ‌مایند، که بر اساس خانواده‌ی Gemma ساخته شده است، مسیر درمانی جدیدی برای سرطان را با کشف سیل‌می‌تاسرتیب (silmitasertib) به عنوان دارویی برای قابل مشاهده کردن تومورهای «سرد» برای سیستم ایمنی شناسایی کرد @GoogleDeepMind
  • برای اولین بار در تاریخ، روش‌های خودکار به عملکردی در حد رقابت با انسان در پیش‌بینی ساختار سه‌بعدی RNA دست یافتند، که تیم برنده از مدل‌سازی مبتنی بر الگوهای بهینه شده به جای یادگیری عمیق استفاده کرده بود @kaggle
  • متا مقاله‌ی جامعی را در مورد یادگیری تقویتی برای LLMها منتشر می‌کند که از 400,000 ساعت پردازش GPU استفاده کرده و قوانین مقیاس‌پذیری را برای عملکرد RL مشابه قوانین مقیاس‌پذیری پیش‌آموزش پیشنهاد می‌دهد @deedydas
  • استنفورد Ctrl-VI را معرفی می‌کند، یک روش نمونه‌برداری ویدئویی که کنترل‌های انعطاف‌پذیری را برای کاربر، از دستورات متنی گرفته تا مسیرهای دقیق دوربین و اشیا، فراهم می‌کند @StanfordAILab
  • LongCat-Audio-Codec به عنوان یک راه‌حل کدک صوتی متن‌باز شده که برای LLMهای گفتاری بهینه‌سازی شده است و دارای توکن‌های دوگانه، کارایی فوق‌العاده با سرعت 0.43 کیلوبیت بر ثانیه و یک رمزگشای پخش زنده بلادرنگ است @huggingface
  • معیار جهانی MMLU Lite در Kaggle راه‌اندازی می‌شود که 16 زبان را در بر می‌گیرد و شامل نمونه‌های حساس به فرهنگ و بی‌طرف است تا به پژوهشگران در شناسایی سوگیری‌های فرهنگی و زبانی کمک کند @kaggle