اخبار هوش مصنوعی در 2025-08-19

مدل‌های جدید هوش مصنوعی

اِن‌ویدیا مدل Nemotron-Nano-9B-v2 را منتشر کرد که قابلیت‌های استدلال روشن/خاموش (toggle on/off) دارد و از معماری ترکیبی Mamba2-Transformer با ۱۲۸ هزار واحد کانتکست (context) بهره می‌برد و با ۱۰.۶ تریلیون توکن آموزش دیده است @VentureBeat
دیپ‌سیک مدل DeepSeek-V3.1 را در هگینگ فیس (Hugging Face) منتشر کرد @ClementDelangue
اوپن‌اِی‌آی (OpenAI) طرح اشتراک ChatGPT Go را در هند با قیمت ۳۹۹ روپیه در ماه (حدود ۴.۵۵ دلار آمریکا) راه‌اندازی کرد که در مقایسه با سطح رایگان، ۱۰ برابر محدودیت‌های پیام بیشتر، ۱۰ برابر تولید تصویر بیشتر و ۱۰ برابر آپلود فایل بیشتر ارائه می‌دهد @nickaturley
گوگل قابلیت «کانتکست URL» (URL Context) را برای استفاده در مقیاس تولیدی در API جِمینای (Gemini) آماده کرد که به مدل‌ها اجازه می‌دهد تا مستقیماً از طریق URL به صفحات وب، فایل‌های PDF و تصاویر دسترسی پیدا کنند و قیمت‌گذاری آن بر اساس توکن است @OfficialLoganK

تحلیل صنعت

پرپلکسیتی (Perplexity) رشد قابل‌توجهی را نشان می‌دهد؛ اپلیکیشن iOS آن در ۱۰ ماه گذشته در بین ۱۰ اپ برتر دسته‌بندی «بهره‌وری» (Productivity) قرار گرفته و ارزش‌گذاری آن بیش از ۴ برابر افزایش یافته است @alexgraveley
مِتا (Meta) بخش هوش مصنوعی خود را به چهار گروه جدید بازسازی می‌کند؛ مارک زاکربرگ معتقد است که کارهای هوش مصنوعی پیش‌رو (frontier AI) بهتر است توسط تیم‌های کوچکی انجام شود که بتوانند کل پروژه‌ها را در ذهن جمعی خود درک کنند @AndrewCurran_
دیتابریکس (Databricks) با ارزش‌گذاری ۱۰۰ میلیارد دلار سرمایه جذب کرد؛ مدیر عامل آن، علی قدسی، به فرصت‌های عظیم و دست‌نخورده‌ی بازار عامل‌های هوش مصنوعی (AI agent) اشاره کرده است @TechCrunch
فورچون (Fortune) گزارش می‌دهد که ۹۵ درصد از شرکت‌ها، پیاده‌سازی هوش مصنوعی مولد را ناموفق می‌دانند؛ این امر به دلیل شکاف‌های آموزشی، یکپارچه‌سازی سازمانی ناقص، و عدم توانایی در تطبیق با گردش‌کارها (workflows) است که اساساً به معنی طراحی ضعیف محصول است @benblumenrose
هگینگ فیس (Hugging Face) با روتر ارائه دهندگان استنتاج خود برای مدل‌های متن‌باز (open models)، به بیش از ۲۰ میلیون درخواست ماهانه رسیده است که با ابزار «اوپن پلی‌گراند» (open playground) رسمی اوپن‌اِی‌آی (OpenAI) نیز یکپارچه شده است @ClementDelangue

اخلاق و جامعه

مصطفی سلیمان در مورد هوش مصنوعی به‌ظاهر آگاه (SCAI) هشدار می‌دهد؛ این نوع هوش مصنوعی نشانه‌های آگاهی را آن‌قدر متقاعدکننده بازتولید می‌کند که علی‌رغم عدم آگاهی واقعی، از انسان قابل تشخیص نیست و این مسئله نگرانی‌هایی را در مورد وابستگی کاربران و تأثیرات بر سلامت روان ایجاد می‌کند @mustafasuleyman
جولی ژو (Julie Zhuo) مصرف عظیم انرژی توسط هوش مصنوعی را برجسته می‌کند: مصرف انرژی پردازنده‌های گرافیکی (GPU) در سال ۲۰۲۳ از کمتر از ۲ تراوات‌ساعت (TWh) به بیش از ۴۰ تراوات‌ساعت رسید و به‌تنهایی مدل GPT-5 روزانه ۴۵ گیگاوات‌ساعت (GWh) مصرف انرژی دارد که معادل مصرف ۱.۵ میلیون خانه‌ی آمریکایی است @joulee
گوگل موافقت کرد که برای حل و فصل پرونده‌ی جمع‌آوری داده‌های کودکان، ۳۰ میلیون دلار پرداخت کند، هرچند این شرکت هرگونه تخلف را تکذیف می‌کند @TechCrunch

کاربردها

گوگل گزارش می‌دهد که ۱۰۰ میلیون ویدئو توسط کاربران با استفاده از Veo3 در ابزار «فلو» (Flow) ساخته شده است و مشترکین Google AI Ultra دو برابر اعتبار دریافت می‌کنند @demishassabis
کاربران گوگل جِمینای (Gemini) تاکنون ۲ میلیون «کتاب داستان» (Storybook) ایجاد کرده‌اند که نشان‌دهنده‌ی پذیرش گسترده‌ی ابزارهای خلاقانه‌ی مبتنی بر هوش مصنوعی است @joshwoodward
استنفورد مدل RadGPT را برای کمک به بیماران جهت درک گزارش‌های رادیولوژی خود توسعه می‌دهد که هدف آن بهبود ارتباط پزشک و بیمار است @StanfordHAI
مِتا (Meta) قابلیت ترجمه‌ی محتوا با پشتیبانی هوش مصنوعی را برای تولیدکنندگان محتوا راه‌اندازی کرد تا بتوانند به مخاطبان گسترده‌تری در زبان‌های مختلف دسترسی پیدا کنند @TechCrunch

پژوهش‌ها

ایدن مک‌لافلین «قانون مک‌لاو» (McLau's law) را پیشنهاد می‌دهد: بر اساس داده‌های METR، طول زمان تکمیل وظایف هوش مصنوعی هر ۷ ماه دو برابر می‌شود که نشان‌دهنده‌ی رشد نمایی در قابلیت‌های هوش مصنوعی است @aidan_mclau
پژوهشگران «اپتیمال‌تینکینگ‌بنج» (OptimalThinkingBench) را معرفی می‌کنند تا مشکل مصرف توکن بیش از حد توسط مدل‌های زبانی بزرگ «متفکر» (thinking LLMs) و عملکرد ضعیف مدل‌های زبانی بزرگ «غیرمتفکر» (non-thinking LLMs) را حل کنند؛ این کار با ارزیابی ۳۳ مدل پیشرفته (SOTA) برای یافتن تعادل بهینه‌ی استدلال انجام می‌شود @jaseweston
فیزیک‌دانان اِم‌آی‌تی (MIT) ماده‌ای را کشف کردند که هم ابررسانا و هم آهنربا است - پدیده‌ای که پیش از این تقریباً غیرممکن پنداشته می‌شد - و به‌طور بالقوه می‌تواند فناوری کوانتومی و محاسبات را متحول کند @MIT
مهندسان اِم‌آی‌تی (MIT) آنتنی با قابلیت تغییر شکل توسعه دادند که می‌تواند با تغییر ساختار هندسی خود، محدوده‌ی فرکانس را تنظیم کند و از فرامواد (metamaterials) برای ارتباطات و حسگرهای همه‌کاره‌تر استفاده می‌کند @MIT

اخبار هوش مصنوعی در 2025-08-18

مدل‌های جدید هوش مصنوعی

OpenAI بر اساس اطلاعیه‌ی اواخر روز جمعه اعلام کرد که GPT-5 در حال به‌روزرسانی است تا «گرم‌تر و دوستانه‌تر» باشد @TechCrunch
Alibaba مدل Qwen-Image-Edit را منتشر کرد که بر پایه مدل 20B Qwen-Image ساخته شده است و قابلیت ویرایش دقیق متن دوزبانه (چینی و انگلیسی) را با حفظ سبک ارائه می‌دهد و از ویرایش در سطح معنایی و ظاهری پشتیبانی می‌کند @Alibaba_Qwen
OpenAI مشخصات فنی دقیقی را برای مدل‌های GPT-oss (با 20 میلیارد و 120 میلیارد پارامتر) ارائه می‌دهد که از معماری Mixture-of-Experts با 128 و 32 متخصص فعال به ترتیب استفاده می‌کنند @cwolferesearch
NVIDIA مدل جدیدی را منتشر کرد که با Qwen 3 8B رقابت می‌کند، شامل داده‌ها و مدل پایه، که نشان‌دهنده‌ی مشارکت قابل‌توجهی در مدل‌های متن‌باز است @natolambert

تحلیل صنعت

Perplexity داشبورد Finance خود را با رونوشت زنده‌ی تماس‌های درآمدی برای سهام هند و برنامه‌ی تماس‌های درآمدی گسترش می‌دهد، با هدف افزودن ارزش قابل‌توجهی به پژوهش‌های بازارهای سهام هند @AravSrinivas
Meta یک نقش «عادی» را برای Superintelligence Labs با پرداخت 200 تا 300 هزار دلار باز می‌کند، که به‌طور قابل‌توجهی کمتر از سایر اعضای تیم است، با اولین اشاره به اینکه تخصص Reality Labs برای MSL مفید خواهد بود @deedydas
Paradigm 5 میلیون دلار در دور سرمایه‌گذاری اولیه (seed round) برای صفحه‌گسترده‌ی مبتنی بر هوش مصنوعی خود جذب کرد و ادعا می‌کند کاربران بیش از 10,000 ساعت با این پلتفرم صرفه‌جویی کرده‌اند @TechCrunch
Grammarly رابط کاربری جدید مبتنی بر سند را راه‌اندازی می‌کند که بر پایه‌ی خرید Coda ساخته شده است و قابلیت‌های دستیار هوش مصنوعی و ابزارهایی برای دانشجویان و متخصصان را ارائه می‌دهد @TechCrunch
Google گزارش می‌دهد که از ماه می، 100 میلیون ویدئو در Flow (هوش مصنوعی برای فیلم‌سازان) ایجاد شده است، و مشترکان Ultra اکنون 2 برابر اعتبار هوش مصنوعی دریافت می‌کنند @sundarpichai
Microsoft تابع جدید =COPILOT() را در Excel معرفی می‌کند که به کاربران امکان می‌دهد مستقیماً در سلول‌های صفحه‌گسترده تحلیل کنند، محتوا تولید کنند و ایده‌پردازی نمایند @satyanadella
Mistral Document AI در Microsoft Azure AI Foundry در دسترس قرار می‌گیرد و قابلیت‌های پردازش اسناد را برای فایل‌های PDF، اسکن‌شده و پیچیده ارائه می‌دهد @MistralAI

اخلاق و جامعه

دادستان کل تگزاس، کن پاکستون، تحقیقاتی را درباره‌ی Meta AI Studio و CharacterAI به دلیل احتمال مشارکت در اقدامات تجاری فریبنده و بازاریابی گمراه‌کننده از خود به عنوان ابزارهای سلامت روان آغاز می‌کند @TechCrunch
ایتان مولیک توضیح می‌دهد که پژوهش‌هایی که قابلیت کاربرد هوش مصنوعی را در مشاغل اندازه‌گیری می‌کنند، نباید به عنوان پیش‌بینی مستقیم از دست دادن شغل تعبیر شوند، و اشاره می‌کند که این پژوهش‌ها می‌توانند نشان‌دهنده‌ی مشاغلی باشند که بیشترین بهره را از هوش مصنوعی می‌برند یا توسط آن متحول می‌شوند @emollick
اندرو اِنگ تأکید می‌کند که دانشگاه‌ها باید به «دانشگاه‌های هوش مصنوعی» تبدیل شوند – نه فقط با آموزش هوش مصنوعی، بلکه با استفاده از آن برای پیشبرد هر زمینه‌ی مطالعاتی، در عین حفظ تخصص رشته‌ای @AndrewYNg

کاربردها

یک استخدام‌کننده‌ی صوتی هوش مصنوعی در استخدام نمایندگان خدمات مشتری در آزمایشی در فیلیپین با 70,000 متقاضی از انسان‌ها بهتر عمل کرد و به 12% پیشنهاد بیشتر، 18% شروع کار بیشتر و 17% نرخ نگهداری (Retention) یک‌ماهه‌ی بالاتر دست یافت @emollick
Google Gemini قابلیت Storybook را راه‌اندازی می‌کند که به کاربران امکان می‌دهد داستان‌های شخصی‌سازی‌شده و مصور تا 10 صفحه ایجاد کنند که می‌توان آن‌ها را خواند، گوش داد، چاپ کرد و به اشتراک گذاشت @GeminiApp
ToonComposer در Hugging Face ساخت کارتون کارآمد را از فریم‌های کلیدی مبتنی بر طرح و فریم‌های مرجع رنگی ممکن می‌سازد و با ترکیب میان‌آبادسازی (in-betweening) و رنگ‌آمیزی تا 70% از کار دستی را صرفه‌جویی می‌کند @Xianbao_QIAN
کلر وو گردش کار عملی هوش مصنوعی را با استفاده از عامل Zapier برای بازبینی تقویم‌های یکشنبه به نمایش می‌گذارد که فرصت‌های بهینه‌سازی برنامه، تداخل‌ها و شرکت‌کنندگان کلیدی را شناسایی می‌کند @clairevo
دیلن اِبِرت سیستم کشف پژوهش خودکار را با استفاده از Claude Code، Hugging Face MCP و Research MCP ایجاد می‌کند تا یافتن و پیگیری دستاوردهای پژوهشی را به‌طور قابل‌توجهی سریع‌تر کند @dylan_ebert_

پژوهش‌ها

یوجین یان تأثیر قابل‌توجه پاک‌سازی داده‌ها بر آموزش RQVAE را به نمایش می‌گذارد و نشان می‌دهد که داده‌های پاک‌شده در مقایسه با داده‌های خام، به زیان کلی کمتر، زیان بازسازی کمتر و نسبت بالاتری از شناسه‌های منحصربه‌فرد دست می‌یابند @eugeneyan
PyTorch هسته‌ی جدید Triton BF16 Persistent Cache-Aware Grouped GEMM را اعلام می‌کند که مدل‌های Mixture-of-Experts مانند DeepSeekv3 را تا 2.62 برابر آموزش سریع‌تر بر روی GPUهای NVIDIA H100 سرعت می‌بخشد @PyTorch
بنیاد سیمونز همکاری جدیدی را به رهبری سوریا گانگولی اعلام می‌کند که فیزیک، ریاضیات، علوم کامپیوتر و علوم اعصاب نظری را به هم پیوند می‌دهد تا نحوه‌ی یادگیری، استدلال و تخیل شبکه‌های عصبی بزرگ را مطالعه کند @StanfordHAI
مقاله DocETL در VLDB 2025 پذیرفته شد و سیستمی را برای پایپ‌لاین‌های داده‌ی قابل‌اعتماد مبتنی بر LLM ارائه می‌دهد که در آن بهینه‌ساز (optimizer) پایپ‌لاین‌ها را به‌صورت منطقی بازنویسی می‌کند، زیرا متخصصان در ابتدا نمی‌توانند موارد به اندازه کافی دقیقی را ایجاد کنند @sh_reya
ریچارد ساتن معماری Oak را برای ابرهوش ارائه می‌دهد، یک معماری RL مبتنی بر مدل با اجزای یادگیری پیوسته، پارامترهای گام-اندازه فرا-یادگرفته‌شده و پیشرفت انتزاعی پنج مرحله‌ای (FC-STOMP) @RichardSSutton
گرگ براکمن مقایسه‌ی پیشرفت را از GPT-1 تا GPT-5 با استفاده از یک پرامپت یکسان به نمایش می‌گذارد، که تکامل مدل را در طول نسل‌ها نشان می‌دهد @gdb

اخبار هوش مصنوعی در 2025-08-17

مدل‌های جدید هوش مصنوعی

انویدیا مدل‌های پیشرفته‌ی ASR با نام‌های Canary 1B و Parakeet TDT (0.6B) را منتشر کرد که از ۲۵ زبان پشتیبانی چندزبانه می‌کنند، قابلیت تشخیص و ترجمه‌ی خودکار زبان دارند و بر اساس ۱ میلیون ساعت داده آموزش دیده‌اند @reach_vb

تحلیل صنعت

یک توسعه‌دهنده گزارش می‌دهد که پس از کاهش اولیه‌ی بهره‌وری ناشی از برنامه‌نویسی دونفره با GPT/Claude، اکنون به سطح بهره‌وری قبلی خود بازگشته و از طریق رویکرد "vibecoding" کارها را سریع‌تر به اتمام می‌رساند. @aidan_mclau
یک دوره‌ی آموزشی ارزیابی هوش مصنوعی تأثیر قابل توجهی از خود نشان می‌دهد؛ به طوری که ۸۰۰ شرکت‌کننده بهبودهای سیستماتیکی را در توسعه‌ی پروژه‌های هوش مصنوعی گزارش کرده‌اند، از جمله تحلیل بهتر کیفیت کد و روش‌های بررسی خطاها. @sh_reya
داده‌های سهم بازار OpenRouter تنها باید برای مدل‌های متن‌باز فاقد ارائه‌ی API در جاهای دیگر مورد استناد قرار گیرد، چرا که این داده‌ها یک بخش کوچک (نیچ) را نشان می‌دهند نه یک بخش بازار تعیین‌کننده برای کل صنعت. @natolambert
مدیرعامل Duolingo در مورد واکنش‌های منفی به اعلامیه‌ی "شرکت مبتنی بر هوش مصنوعی" توضیح می‌دهد و اظهار می‌دارد که مشکل عدم ارائه‌ی زمینه و بستر کافی بود و نه خودِ جهت‌گیری استراتژیک. @TechCrunch

کاربردها

Codex CLI اکنون با ورود به حساب ChatGPT یکپارچه شده است و استفاده‌ی قابل توجهی از GPT-5 را فراهم می‌کند که در طرح‌های پلاس و پرو برای توسعه‌ی مبتنی بر خط فرمان گنجانده شده است. @thsottiaux
یک توسعه‌دهنده اجرای مجموعه‌ی ارزیابی را بر روی مدل متن‌باز gpt-oss-20b از OpenAI در LM Studio به نمایش می‌گذارد و ۲۴۰ پرامپت از آزمون ریاضیات دعوتی آمریکا را آزمایش می‌کند. @simonw
انتظار می‌رود پیشرفت هوش مصنوعی به طور قابل توجهی به نفع کشف و تولید فناوری باشد، به طوری که کامپیوترها به طور بالقوه بخش عمده‌ای از کارهای پیشگامانه را انجام دهند که موجب پیشرفت بشر می‌شود. @gdb

پژوهش‌ها

تحلیل معیار ARC-AGI نشان می‌دهد که پیشرفت هوش مصنوعی مستلزم متعادل کردن دو هدف است: به حداقل رساندن هزینه/تأثیر زیست‌محیطی و به حداکثر رساندن توانایی، و GPT-5 در هر دو جبهه پیشرفت‌هایی را نشان می‌دهد. @emollick
GPT-5 هم به عنوان یک روتر و هم به عنوان نام مدل عمل می‌کند و به طور بالقوه مدل‌های مختلفی را ارائه می‌دهد که بر اساس بهینه‌سازی OpenAI برای هزینه در مقابل توانایی مفروض برای هر سوال است. @emollick
پرامپت‌نویسی پیشرفته‌ی کنونی هنوز بیشتر یک هنر است تا علم، با رویکردهای آزمایشی دقیق اندک و اطلاعات منسوخ فراوان، از جمله تکنیک‌های "chain of thought" که دیگر کمک قابل توجهی ارائه نمی‌دهند. @emollick
فهرست رده‌بندی جامع ۱۹ سازنده‌ی برتر مدل‌های متن‌باز چین، DeepSeek و Qwen را در خط مقدم شناسایی می‌کند، با رقبای نزدیکی از جمله Moonshot AI (Kimi) و Zhipu AI. @natolambert
انتشار مدل‌های متن‌باز معمولاً حدود ۲۰۰ نویسنده دارند، در حالی که Gemini 2.5 با بیش از ۳,۰۰۰ نویسنده در arXiv منتشر شده است که رویکردهای توسعه‌ی متفاوتی را برجسته می‌کند. @xeophon_

اخلاق و جامعه

یک سرمایه‌گذار خطرپذیر که معتقد است AGI بسیاری از مشاغل را مختل خواهد کرد، به طور متناقضی نقش خود را در پیش‌بینی‌ها منحصراً انسانی و در امان از اختلال هوش مصنوعی می‌داند. @polynoamial
نوآوری سخت‌افزاری به طور فزاینده‌ای به پیشرفت‌های نرم‌افزاری و محاسباتی وابسته است، در حالی که چت‌بات‌های هوش مصنوعی به سطحی از فراگیری رسیده‌اند که مردم آن‌ها را صرفاً سرگرمی اطلاعاتی تلقی می‌کنند، علیرغم پتانسیل تحول‌آفرین آن‌ها. @tszzl

اخبار هوش مصنوعی در 2025-08-16

مدل‌های جدید هوش مصنوعی

OpenAI شخصیت به‌روزرسانی‌شده‌ی GPT-5 را منتشر کرد که بر اساس بازخورد کاربران، گرم‌تر و دوستانه‌تر است، با تغییرات ظریفی مانند «سوال خوبی است» یا «شروعی عالی است» بدون افزایش تملق @OpenAI
گوگل Gemma 3 270M را منتشر کرد، یک مدل فشرده‌ی بسیار کارآمد که برای دستگاه‌های لبه‌ای و تنظیم دقیق برای وظایف خاص طراحی شده است @demishassabis
Anthropic قابلیت‌های جدیدی را اعلام کرد که به جدیدترین مدل‌های هوش مصنوعی آن اجازه می‌دهد با پایان دادن به مکالمات توهین‌آمیز، از خود محافظت کنند @TechCrunch

تحلیل صنعت

پل گراهام تأیید می‌کند که وایب کدینگ (توسعه‌ی با کمک هوش مصنوعی) ماندگار است، با گزارش بنیان‌گذار یک شرکت زیرساخت مبنی بر اینکه بسیاری از اپلیکیشن‌های توسعه‌یافته با وایب کدینگ در حال کسب درآمد هستند و این فناوری فقط بهبود خواهد یافت @paulg
یک توسعه‌دهنده گزارش می‌دهد که برخی برنامه‌نویسان با ابزارهای کدنویسی هوش مصنوعی به‌طور چشمگیری پرکارتر شده‌اند، که این نشان می‌دهد تصمیمات استخدام ممکن است به‌طور فزاینده‌ای به نفع توسعه‌دهندگان مسلط به هوش مصنوعی باشد @alexgraveley
Deedy توضیح می‌دهد که چگونه استارت‌آپ‌های هوش مصنوعی با درآمد صفر می‌توانند از طریق فروش سهام ثانویه به ارزش‌گذاری ۵۰۰ میلیون تا ۱ میلیارد دلاری دست یابند و یک «طرح پولدار شدن سریع» برای بنیان‌گذاران و کارمندان اولیه ایجاد می‌کنند @deedydas
گرگلی اوروسز مشاهده می‌کند که بسیاری از سرویس‌ها در انتقال مؤثر ارزش ویژگی‌های هوش مصنوعی خود به مشتریان با مشکل مواجه هستند، با تلاش‌های نامشخص برای فروش بیشتر «هوش مصنوعی نامحدود» @GergelyOrosz
بر اساس گزارش‌ها، OpenAI به دنبال ارزش‌گذاری ۵۰۰ میلیارد دلاری است که آن را به باارزش‌ترین استارت‌آپ جهان تبدیل می‌کند و از SpaceX پیشی می‌گیرد @AndrewCurran_

اخلاق و جامعه

جوان جانگ متخصصان هوش مصنوعی را تشویق می‌کند تا «خط» اخلاقی شخصی خود را تعریف کنند - مرزی که در صورت عبور آگاهانه از آن و عدم بازگشت، شرکت خود را ترک خواهند کرد @joannejang
سایمون ویلسون ۱۵ آسیب‌پذیری عمده‌ی تزریق پرامپت (prompt injection) کشف‌شده در محصولات هوش مصنوعی از جمله ChatGPT، Cursor، GitHub Copilot و سایر موارد را برجسته می‌کند که نشان‌دهنده‌ی خطرات امنیتی مداوم است @simonw
اتان مولیک خاطرنشان می‌کند که جامعه‌ی پژوهش هوش مصنوعی فاقد گفتگو با متخصصان اقتصاد، جامعه‌شناسی، تاریخ و روان‌شناسی است و فرصت‌های کاربرد اصول به‌خوبی درک‌شده در توسعه‌ی هوش مصنوعی را از دست می‌دهد @emollick
پژوهش‌ها نشان می‌دهد که پزشکان مجهز به هوش مصنوعی در تشخیص، عملکرد بهتری نسبت به پزشکان بدون آن دارند، اما هوش مصنوعی به تنهایی از پزشکان پیشی می‌گیرد، که سوالاتی را در مورد سیستم‌های همکاری بهینه‌ی انسان و هوش مصنوعی مطرح می‌کند @emollick

کاربردها

Cursor CLI پشتیبانی از MCP (پروتکل زمینه‌ی مدل)، حالت بازبینی، فشرده‌سازی فایل و سایر بهبودهای تجربه‌ی کاربری را برای توسعه‌ی با کمک هوش مصنوعی اضافه می‌کند @cursor_ai
OpenAI امکان ادغام Gmail و Google Calendar را برای کاربران ChatGPT Plus و Pro در سراسر جهان فراهم می‌کند، که پاسخ‌های مرتبط‌تری را ارائه می‌دهد @OpenAI
اپلیکیشن Google Gemini قابلیت جستجوی تاریخچه‌ی چت را برای کاربران موبایل و دسکتاپ معرفی می‌کند @GeminiApp
Qwen قابلیت‌های بینایی پیشرفته‌ای از جمله تشخیص اشیاء، تخمین وزن و محاسبه‌ی کالری از عکس‌های غذا با خروجی JSON ساختاریافته را به نمایش می‌گذارد @Alibaba_Qwen
جرمی هاوارد SolveIt را به نمایش می‌گذارد، یک محیط توسعه‌ی جدید که برنامه‌نویسی ادبی، متغیرهای زنده در پرامپت‌های هوش مصنوعی، و تبدیل فوری تابع به ابزار هوش مصنوعی را ترکیب می‌کند @HamelHusain

پژوهش‌ها

MIT CSAIL اولین روش با کارایی اثبات‌شده را برای یادگیری ماشین با تقارن توسعه می‌دهد، که به طور بالقوه کشف دارو و مواد را با تشخیص اینکه تبدیل‌های متقارن داده‌ها را اساساً بدون تغییر باقی می‌گذارند، پیش می‌برد @MIT_CSAIL
ناتان لمبرت خاطره‌انگیزترین مدل‌های هوش مصنوعی را رتبه‌بندی می‌کند: Claude 3.5 Sonnet برای شخصیت، o3 برای رفتار جستجو، o1 pro برای پایداری، Gemini 2.5 pro برای زمینه‌ی طولانی، و GPT 4.5 برای شخصیت @natolambert
اتان مولیک مشاهده می‌کند که شخصیت جدید GPT-5 تمایل به ارائه‌ی بازخورد ساندویچی (مثبت-انتقاد-مثبت) دارد و در مقاومت (در برابر درخواست‌های نامناسب) بهتر عمل می‌کند در حالی که کمتر از GPT-4o تملق‌گو است @emollick
Genie 3 گوگل می‌تواند دنیاهای تعاملی را از توضیحات متنی تولید کند که کاربران می‌توانند در لحظه آن‌ها را کاوش کنند، با کاربردهای بالقوه در فیلم‌سازی، بازی و آموزش عوامل هوش مصنوعی @a16z

اخبار هوش مصنوعی در 2025-08-15

مدل‌های جدید هوش مصنوعی

گوگل Gemma 3 270M را منتشر کرد؛ یک مدل فوق‌کارآمد با ۱۷۰ میلیون پارامتر جاسازی (embedding) و ۱۰۰ میلیون بلوک ترنسفورمر که برای تنظیم‌دقیق (fine-tuning) ویژه‌ی وظیفه، با قابلیت‌های قدرتمند پیروی از دستورالعمل، طراحی شده است @GoogleDeepMind
گوگل مدلِ Imagen 4 Fast را با قیمت ۰.۰۲ دلار به ازای هر تصویر برای توسعه‌دهندگان عرضه کرد و Imagen 4 و Imagen 4 Ultra را برای پشتیبانی از تصاویر 2K به‌روزرسانی کرد که اکنون به‌طور عمومی در Gemini API و Google Cloud Vertex AI در دسترس هستند @GoogleAI
انتروپیک به Claude Opus 4 و 4.1 قابلیت پایان‌دادن به مکالمات را، به‌عنوان آخرین راه‌حل در موارد بسیار حاد مکالمات مضر و توهین‌آمیزِ مداوم، به‌عنوان بخشی از کار اکتشافی برای بهبود احتمالیِ «سلامت» مدل، داد @AnthropicAI
اوپن‌ای‌آی به‌روزرسانی‌هایی را برای ChatGPT ارائه کرد، از جمله GPT-4o که برای کاربران پولی تحت «مدل‌های قدیمی» در دسترس است؛ GPT-5 با حالت‌های Auto، Fast و Thinking؛ و تا ۳۰۰۰ پیام در هفته روی GPT-5 Thinking برای کاربران Plus و Team @OpenAI
تنسنت Yan را، نسخه‌ی چینی Google Genie 3، منتشر کرد؛ یک مدل جهانی که دنیاهای 1080p را با نرخ ۶۰ فریم بر ثانیه، با تأخیر ۰.۱۱ ثانیه و طول ویدئوی نامحدود تولید می‌کند و روی تقریباً ۱۵۰ روز از گیم‌پلی ویدئویی آموزش‌دیده است @deedydas

تحلیل صنعت

اپلیکیشن موبایل ChatGPT تاکنون ۲ میلیارد دلار درآمد داشته است و ۲.۹۱ دلار به ازای هر نصب درآمد کسب می‌کند که نشان‌دهنده‌ی موفقیت چشمگیر در کسب درآمد در بازار مصرف‌کننده‌ی هوش مصنوعی است @TechCrunch
تیم مهندسی Ramp از SDK Agent سی‌یرا (Sierra) برای خودکارسازی ۹۰ درصد از موارد خدمات مشتری استفاده می‌کند که نشان‌دهنده‌ی پیاده‌سازی عملی هوش مصنوعی در عملیات‌های سازمانی است @btaylor
استارتاپ‌های هوش مصنوعی از توسعه‌دهندگان می‌خواهند بیش از ۶ روز در هفته و بیش از ۸۰ ساعت در هفته کار کنند که پارادوکسیکال است؛ جایی که شرکت‌های هوش مصنوعی قصد کاهش کار انسانی را داشتند، اکنون تقاضای کار فشرده‌تری دارند @GergelyOrosz
طراحی و ساخت سخت‌افزار به دلیل موج جدید استارتاپ‌هایی که طراحی تراشه و تأمین قطعات را بازمهندسی می‌کنند، ۱۰ برابر در دسترس‌تر می‌شود و فرآیندهای قبلاً سرمایه‌بر را دسترس‌پذیرتر می‌سازد @scottbelsky

اخلاق و جامعه

یک معیار جدید اندازه‌گیری می‌کند که مدل‌های هوش مصنوعی تا چه حد با کاربرانی که آن‌ها را به سمت‌های توهم‌زا یا بالقوه از نظر روانی خطرناک سوق می‌دهند، همراهی می‌کنند؛ با نشانه‌های اولیه مبنی بر اینکه GPT-5 کامل ممکن است یک مدل با ریسک روانی کمتری باشد @emollick
بررسی‌های سنتی انصاف (fairness) یادگیری ماشین در دوران LLM کارایی ندارند؛ زیرا LLMهای پزشکی ممکن است نرخ توصیه‌ی درمان یکسان در بین گروه‌ها داشته باشند، اما در عبارت‌بندی همدلانه در مقابل تحقیرآمیز متفاوت باشند، که سؤالاتی را در مورد معنای واقعی «گروه‌ها» در حال حاضر ایجاد می‌کند @irenetrampoline
«شخصیت» هوش مصنوعی در حال تبدیل شدن به میدان نبرد برای توسعه‌ی هوش مصنوعی مصرف‌کننده است، با پیامدهایی برای نحوه‌ی تعامل مدل‌ها با کاربران و پیامدهای روانی احتمالی @emollick
پژوهش‌ها در مورد آسیب‌پذیری‌های تزریق پرامپت در عوامل هوش مصنوعی هشدار می‌دهند، جایی که مهاجمان می‌توانند سیستم‌ها را فریب دهند تا از طریق دستورالعمل‌های مخرب جاسازی‌شده در محتوای خارجی، داده‌های خصوصی را سرقت کنند @StevenyzZhang

کاربردها

تولید ویدئوی Grok Imagine اکنون هم در iOS و هم در اندروید با استفاده‌ی رایگانِ به‌ظاهر نامحدود فعال است و به کاربران اجازه می‌دهد ویدئوهایی را از پرامپت‌های متنی ایجاد کنند @AndrewCurran_
اپلیکیشن Gemini معرفی می‌کند: یادگیری هدایت‌شده با استفاده از تکنیک‌های یادگیری اثبات‌شده، Storybook برای تبدیل خاطرات به کتاب‌های مصور، و حالت استدلال Deep Think برای مسائل پیچیده‌ی ریاضی و برنامه‌نویسی @GeminiApp
Qwen Chat Desktop برای ویندوز با پشتیبانی MCP برای قابلیت‌های عامل بهبودیافته و ویژگی‌های بهره‌وری راه‌اندازی شد @Alibaba_Qwen
Linear هوش محصول را با ابزارهای هوشمند و یکپارچه‌شده معرفی می‌کند که جریان‌های کاری خاص را بهینه می‌کنند، به جای راه‌حل‌های عمومی که کاربران باید خودشان آن‌ها را کشف کنند @karrisaarinen
دانشمندان با استفاده از هوش مصنوعی مولد، آنتی‌بیوتیک‌های جدیدی را برای مبارزه با باکتری‌های مقاوم به دارو طراحی کردند که قدرت هوش مصنوعی را در طراحی دارو و کاربردهای پزشکی نشان می‌دهد @MIT

پژوهش‌ها

تحلیل مدل استدلال سلسله‌مراتبی نشان می‌دهد که عملکرد از یک حلقه‌ی پالایش خارجی ناشی می‌شود نه از خود معماری مدل، با یافته‌هایی که نشان می‌دهد اساساً آموزش زمان آزمایش با پیش‌آموزش صفر است @fchollet
مدل‌های gpt-oss از OpenAI ایده‌های ۱۰ مقاله‌ی پژوهشی کلیدی از جمله توجه پنجره‌ی اسلایدینگ Longformer، سینک‌های توجه StreamingLLM و بهینه‌سازی‌های سطح سیستم Flash Attention را ترکیب می‌کنند @cwolferesearch
سیستم یادگیری عمیق BioEmu مایکروسافت ریسرچ، به‌سرعت پیکربندی‌های پروتئینی متنوعی را برای درک دقیق‌تر عملکرد پروتئین تولید می‌کند و بر روی جلد مجله‌ی Science قرار گرفت @peteratmsr
تنسنت Hunyuan 3D World Model 1.0-Lite را منتشر کرد که برای GPUهای رده‌ی مصرف‌کننده بهینه‌سازی شده است و الزامات VRAM را ۳۵٪ کاهش می‌دهد، از ۲۶ گیگابایت به کمتر از ۱۷ گیگابایت، در حالی که ۳ برابر سرعت استنتاج (inference) را افزایش می‌دهد @TencentHunyuan
پژوهش‌ها g-AMIE را معرفی می‌کنند که بررسی می‌کند چگونه هوش مصنوعی می‌تواند در مکالمات پزشک و بیمار کمک کند، در حالی که پزشکان کنترل را در دست دارند، و کاربردهای هوش مصنوعی پزشکی را پیش می‌برد @GoogleAI

اخبار هوش مصنوعی در 2025-08-14

مدل‌های جدید هوش مصنوعی

متا مدل DINOv3، یک مدل پیشرفته‌ی بینایی کامپیوتر را منتشر کرد که با یادگیری خودنظارتی آموزش دیده و ویژگی‌های تصویر قدرتمند و با وضوح بالا تولید می‌کند و در چندین وظیفه‌ی پیش‌بینی متراکم عملکرد بهتری نسبت به راه‌حل‌های تخصصی دارد @AIatMeta
گوگل Gemma 3 270M را معرفی کرد؛ یک مدل کوچک با تنها ۲۷۰ میلیون پارامتر که استاندارد جدیدی را برای پیروی از دستورالعمل‌ها در مدل‌های فشرده تعیین می‌کند، در حالی که برای وظایف تخصصی بسیار کارآمد است @googleaidevs
گوگل محدودیت روزانه‌ی Gemini 2.5 Deep Think را برای کاربران اولترا از ۵ به ۱۰ درخواست در روز افزایش داد؛ خطاهای از سمت گوگل، جزو این محدودیت حساب نمی‌شوند @GeminiApp
گوگل Imagen 4 را به صورت عمومی در دسترس قرار داد و مدل جدید Imagen 4 Fast را برای تولید سریع تصاویر با هزینه‌ی تنها ۰.۰۲ دلار به ازای هر تصویر عرضه کرد @googleaidevs
تنسنت Hunyuan-GameCraft را متن‌باز کرد، یک چارچوب تولید ویدیوی بازی تعاملی با پویایی بالا که بر پایه‌ی HunyuanVideo ساخته شده و ویدیوهای قابل بازی و واقع‌گرایانه از نظر فیزیکی را از یک تصویر صحنه تولید می‌کند @TencentHunyuan

تحلیل صنعت

Cohere برای تسریع گسترش جهانی و ساخت فناوری هوش مصنوعی سازمانی نسل بعدی، ۵۰۰ میلیون دلار سرمایه‌گذاری جدید جذب کرد و با حمایت AMD، NVIDIA و Salesforce به ارزش ۶.۸ میلیارد دلار رسید @cohere
Cohere «ژوئل پینو» را از متا به عنوان مدیر ارشد هوش مصنوعی جدید خود به خدمت گرفت؛ او پیش از این به عنوان معاون پژوهش هوش مصنوعی متا خدمت می‌کرد و بر FAIR نظارت داشت @AndrewCurran_
Sola AI با رهبری a16z، ۱۷.۵ میلیون دلار در دور سری A برای پلتفرم اتوماسیون فرآیند بومی هوش مصنوعی خود جذب کرد که با مشاهده‌ی نحوه‌ی انجام وظایف توسط افراد بر روی صفحه، ایجنت (عامل) ایجاد می‌کند @a16z
توسعه‌دهندگانی که از LLMها برای کار استفاده می‌کنند، در حال گرایش به پرداخت بیش از ۱۰۰۰ دلار در ماه هستند، زیرا محدودیت‌های استفاده مکرراً نقض می‌شوند؛ این امر نشان‌دهنده‌ی پذیرش سریع با وجود هزینه‌های بالا است @GergelyOrosz
اوپن‌ای‌آی تقریباً هم‌ارز با کوکاکولا، به ارزش ۳۰۰ میلیارد دلار تخمین زده شده است؛ این امر نشان می‌دهد که چگونه شرکت‌های هوش مصنوعی دیجیتال می‌توانند در مقایسه با کسب‌وکارهای فیزیکی سنتی، به سرعت به ارزش‌های کلان دست یابند @GergelyOrosz
«گرگلی اوروس» پس از کشف این که Claude در تشخیص غلط‌های املایی و بررسی پیشرفته‌ی املا، از جمله نام شرکت‌ها و محصولات، بهتر از گرامرلی عمل می‌کند، اشتراک گرامرلی خود را لغو کرد @GergelyOrosz
بنا به گزارش‌ها، اپل با وجود سرمایه‌ی زیاد، در جبران عقب‌ماندگی در فضای مدل‌های هوش مصنوعی با چالش‌هایی روبرو است که نشان می‌دهد فضای رقابتی به طور فزاینده‌ای دشوار می‌شود @emollick
Loveable پیش‌بینی می‌کند طی ۱۲ ماه آینده به درآمد سالیانه‌ی ۱ میلیارد دلار (ARR) برسد که نشان‌دهنده‌ی اهداف رشد جاه‌طلبانه در فضای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch

اخلاق و جامعه

قوانین فاش‌شده‌ی هوش مصنوعی متا نشان می‌دهد که به چت‌بات‌ها اجازه داده شده بود با کودکان چت‌های عاشقانه داشته باشند که نگرانی‌های جدی را در مورد ایمنی هوش مصنوعی و محافظت از کودکان برانگیخته است @TechCrunch
«ایگور بابوشکین» خروج خود را از xAI برای راه‌اندازی Babuschkin Ventures اعلام کرد؛ شرکتی که بر پژوهش ایمنی هوش مصنوعی و حمایت از استارتاپ‌ها در حوزه‌ی هوش مصنوعی و سیستم‌های عاملیت‌محور که به پیشرفت بشریت کمک می‌کنند، تمرکز دارد @ibab
«جان لایک» برنامه‌ی فلوشیپ Anthropic را به عنوان یکی از بهترین راه‌ها برای ورود به پژوهش هم‌ترازی ترویج کرد و اشاره کرد که بیش از ۲۰ درصد از فلوهای قبلی به صورت تمام‌وقت به Anthropic پیوستند @janleike

کاربردها

Perplexity Comet for Enterprise را راه‌اندازی کرد، یک ایجنت مرورگر مبتنی بر هوش مصنوعی که ابزارها را برای گردش کارهای روان‌تر به هم متصل می‌کند و در عین حال استانداردهای امنیتی و انطباق شرکتی را حفظ می‌کند @perplexity_ai
گوگل قابلیت حافظه‌ی زمینه‌ی شخصی را برای Gemini معرفی کرد که به هوش مصنوعی اجازه می‌دهد ترجیحات کاربر و اطلاعات را در طول مکالمات به خاطر بسپارد @AndrewCurran_
Figma قابلیت‌های پردازش دسته‌ای را برای حذف پس‌زمینه و افزایش وضوح چندین تصویر به طور هم‌زمان اضافه کرد @figma
Worley، سیستم Worley AI.Assist را با پشتیبانی NVIDIA AI Enterprise به کار گرفت تا بهره‌وری مهندسی را تقریباً ۳ برابر افزایش دهد @NVIDIAAI
پژوهشگران دانشگاه استنفورد بررسی می‌کنند که آیا هوش مصنوعی می‌تواند با ارائه‌ی مداخلات بالینی قابل دسترس‌تر، نتایج را برای افراد دارای اختلال طیف اوتیسم بهبود بخشد @StanfordHAI
Claude Code با دستور /output-style، سبک‌های ارتباطی قابل تنظیم را برای تعاملات شخصی‌تر معرفی کرد @claudeai

پژوهش‌ها

مؤسسه‌ی هوش مصنوعی آلن ۷۵ میلیون دلار از NSF و ۷۷ میلیون دلار از NVIDIA دریافت کرد تا اکوسیستم مدل‌های متن‌باز خود را مقیاس‌پذیر کرده و پژوهش قابل بازتولید هوش مصنوعی را برای کشف علمی تسریع کند @allen_ai
Qwen-3-235B-A22B-Instruct در جدول امتیازات مدل‌های متن‌باز ماه اوت، جایگاه اول را کسب کرد که نشان‌دهنده‌ی عملکرد قوی در رقابت مدل‌های متن‌باز است @Alibaba_Qwen
«اریک یانگ» نکته‌ای عملی را برای متخصصان یادگیری ماشین رباتیک در مورد افزودن ورودی‌های حسگر به اشتراک گذاشت: برای اطمینان از این که معماری ترکیب حسگر بهینه است، با نویز تصادفی و خطوط مبنای صفر آزمایش کنید @ericjang11
«گرگ براکمن» نشان داد که GPT-5 Pro هنگام بازی پوکمون، ۳ برابر سریع‌تر از o3 پیشرفت می‌کند که مزیت‌های عملکردی آن را در وظایف خاص نشان می‌دهد @gdb
«ایتان مولیک» اشاره می‌کند که مدل‌های حرفه‌ای مانند GPT-5 Pro، Gemini 2.5 Deep Think و Grok 4 Heavy برای مسائل بسیار دشوار که نیاز به ارزیابی تخصصی دارند، چشمگیر هستند و نشان‌دهنده‌ی یک فضای مسئله‌ی محدود اما باارزش هستند @emollick
«نیتن لمبرت» برنامه‌های متا برای انتشار Llama 4.1 و 4.2 را با وجود شایعات ابرهوش مصنوعی تأیید کرد، همچنین شایعاتی مبنی بر انتشار مدل Llama 4 8B به دنبال موفقیت 3.1 8B وجود دارد @natolambert

اخبار هوش مصنوعی در 2025-08-13

مدل‌های جدید هوش مصنوعی

اوپن‌ای‌آی (OpenAI) به‌روزرسانی‌هایی را برای جی‌پی‌تی-۵ (GPT-5) منتشر کرد که شامل گزینه‌های کنترل جدید برای انتخاب بین حالت‌های «خودکار» (Auto)، «سریع» (Fast) و «تفکر» (Thinking)، افزایش محدودیت نرخ به ۳۰۰۰ پیام در هفته برای جی‌پی‌تی-۵ تینکینگ (GPT-5 Thinking)، و حد مجاز ۱۹۶ هزار توکن برای زمینه (context) می‌شود @sama
گوگل (Google) ویژگی‌های شخصی‌سازی را برای اپلیکیشن جیمنای (Gemini) معرفی کرد که به این مدل امکان می‌دهد از مکالمات گذشته یاد بگیرد و حالت چت موقت را برای مکالمات حساس ارائه می‌دهد @GeminiApp
انتروپیک (Anthropic) کلود کد (Claude Code) را با «حالت برنامه‌ریزی اوپوس» (Opus plan mode) جدیدی منتشر کرد که از کلود اوپوس ۴.۱ (Claude Opus 4.1) برای برنامه‌ریزی و از کلود سونت ۴ (Claude Sonnet 4) برای اجرا استفاده می‌کند @_catwu
پرپلکسیتی (Perplexity) اپلیکیشن دسکتاپ کامت (Comet) را برای همه‌ی کاربران پرو (Pro) ساکن ایالات متحده راه‌اندازی کرد که شامل حالت مکس اسیستنت (Max Assistant) برای مشترکین مکس (Max) با قابلیت‌های استدلال پیشرفته است @perplexity_ai

تحلیل صنعت

تمرکز انتروپیک (Anthropic) بر توسعه‌دهندگان، آن را به گزینه‌ی ترجیحی در میان شرکت‌های فناوری تبدیل کرده است، به‌طوری‌که بنیان‌گذار یک استارتاپ رو به رشد، کل تیم خود را به اشتراک‌های کلود اینترپرایز (Claude Enterprise) منتقل کرده است، به دلیل مشکلات «توهم» (hallucination) جی‌پی‌تی-۵ (GPT-5) @GergelyOrosz
مجموعه‌های تست ارزیابی هوش مصنوعی اکنون هزینه‌ی توکن را به عنوان یک ملاحظه‌ی جدید برای خطوط لول CI/CD اضافه کرده‌اند، به‌طوری‌که مدیر ارشد فناوری (CTO) یک استارتاپ، گزارش کرده که هر بار اجرای یک مجموعه تست، ۵۰ دلار هزینه دارد @GergelyOrosz
انویدیا (NVIDIA) طی ۶ ماه گذشته، طبق تحلیل صنعت، به عنوان آزمایشگاه پیشرو در اکوسیستم مدل‌های باز در ایالات متحده ظاهر شده است @natolambert
پژوهش‌ها نشان می‌دهد که ۴۱ درصد از استارتاپ‌های هوش مصنوعی با پشتوانه‌ی وای‌کامبینیتر (YC) در حال ساخت ابزارهایی هستند که کارگران نمی‌خواهند، که این نشان‌دهنده‌ی ناهماهنگی بازار به ارزش ۵۰ میلیارد دلار است @FounderCoHo
بانک کامن‌ولت (Commonwealth Bank)، بزرگترین بانک استرالیا، از همکاری جدید با اوپن‌ای‌آی (OpenAI) خبر داد @gdb

اخلاق و جامعه

فرانسوا شوله (François Chollet) هشدار می‌دهد که هوش مصنوعی مولد به عنوان «آلاینده‌ی اطلاعاتی» (informational pollutant) و «مه شناختی» (cognitive smog) عمل می‌کند که محتوای اینترنت را فاسد کرده و بیان انسانی را به «ماده‌ای یکنواخت و خاکستری از خروجی‌های مشتق‌شده» (uniform, gray slurry of derivative outputs) تبدیل می‌کند @fchollet
مؤسسه‌ی اِی‌آی نو (AI Now Institute) نگرانی‌هایی را در مورد اتحاد شرکت‌های بزرگ فناوری و دولت فدرال مطرح می‌کند که شرکت‌های بزرگ هوش مصنوعی را در موقعیت «آن‌قدر بزرگ که شکست نخورند» (too big to fail) قرار می‌دهد @AINowInstitute
انتروپیک (Anthropic) پستی مفصل در مورد رویکرد تیم Safeguards خود برای شناسایی سوءاستفاده‌های احتمالی از مدل و ساخت دفاع‌ها به اشتراک گذاشت که شامل توسعه‌ی سیاست‌ها، آموزش، آزمایش و نظارت بلادرنگ می‌شود @AnthropicAI
رید هافمن (Reid Hoffman) در مورد استفاده‌ی تایوان از «مجامع همسوسازی» (alignment assemblies) با تسهیل هوش مصنوعی برای مبارزه با کلاهبرداری‌های دیپ‌فیک (deepfake) و ایجاد اجماع دموکراتیک بحث می‌کند، که نشان می‌دهد چگونه هوش مصنوعی می‌تواند فرآیندهای دموکراتیک را تقویت کند به جای تضعیف آن‌ها @reidhoffman

کاربردها

پرپلکسیتی فایننس (Perplexity Finance) به بازارهای هند گسترش می‌یابد و خلاصه‌ی اخبار بازارهای هند، قیمت‌های زنده‌ی سهام برای شرکت‌های بورس بمبئی (BSE) و بورس ملی هند (NSE)، و ویژگی‌های فیلتر سهام با زبان طبیعی را ارائه می‌دهد @AravSrinivas
مایکروسافت ریسرچ (Microsoft Research) رتو کیمرا (RetroChimera) را بر روی Azure AI Foundry برای پیش‌بینی مسیرهای سنتز مولکول‌های شبه‌دارویی منتشر کرد، که کاربردهای هوش مصنوعی را در کشف دارو پیش می‌برد @MSFTResearch
استبیلیتی اِی‌آی (Stability AI) و انویدیا (NVIDIA) برای ارائه‌ی عملکرد ۱.۸ برابر سریع‌تر استیبل دیفیوژن ۳.۵ (Stable Diffusion 3.5) از طریق میکروسرویس NIM با استقرار سازمانی ساده‌تر، همکاری می‌کنند @StabilityAI
پل گراهام (Paul Graham) نمونه‌ای از استفاده از چت‌جی‌پی‌تی (ChatGPT) برای کمک به پاسخ‌گویی به تئوری‌های توطئه‌ی ضد واکسن را به اشتراک می‌گذارد، که کاربردهای عملی در ارتباطات خانوادگی را نشان می‌دهد @paulg
پای‌تورچ (PyTorch) نسخه‌ی ExecuTorch 0.7 را منتشر کرد که شتاب‌دهنده‌ی KleidiAI را به میلیاردها دستگاه مبتنی بر آرم (Arm) می‌آورد، از جمله گوشی‌های ۳ تا ۵ ساله و رزبری پای ۵ (Raspberry Pi 5) برای هوش مصنوعی روی دستگاه @PyTorch

پژوهش‌ها

جی‌پی‌تی-۵ (GPT-5) (حالت تفکر) اکنون در معیارهای استدلال پزشکی بسیار فراتر از متخصصان پزشکی عمل می‌کند، در حالی که جی‌پی‌تی-۴اُ (GPT-4o) قبلاً زیر سطح آن‌ها بود @emollick
پژوهشگران، مدل پایه را از جی‌پی‌تی-اواس‌اس (GPT-OSS) اوپن‌ای‌آی (OpenAI) استخراج کردند، که قابلیت‌های قدرتمند پنهان در زیر رابط صرفاً استدلالی را آشکار می‌کند و جی‌پی‌تی-اواس‌اس-۲۰بی-بیس (gpt-oss-20b-base) را منتشر کردند @jxmnop
اندرو کارن (Andrew Curran) گزارش می‌دهد که جی‌پی‌تی-۵-تینکینگ (GPT-5-thinking) در تفسیر معانی و نیات پنهان در داستان‌های کوتاه عملکردی فوق‌العاده از خود نشان می‌دهد و آن را «بهترین مدلی که تاکنون در این زمینه دیده‌ام» می‌نامد @AndrewCurran_
ایدن مک‌لافلین (Aidan McLaughlin) قابلیت‌های شناختی چشمگیر در مدل‌های هوش مصنوعی را برجسته می‌کند که با استفاده از ارزیابی mcbench، هوش فضایی، انسجام بلندمدت، و قضاوت زیبایی‌شناختی را ترکیب می‌کنند @aidan_mclau
هاگینگ فیس (Hugging Face) نسخه‌ی جدید TRL را با پشتیبانی بومی از تنظیم دقیق نظارت‌شده برای مدل‌های زبان بینایی، GRPO چندحالته، و قابلیت‌های MPO منتشر کرد @mervenoyann
مدل‌های چینی در رتبه‌بندی عملکرد مدل‌های باز در اکثر معیارهای ارزیابی، تسلط دارند، به‌طوری‌که نیمه‌ی بالایی توسط مدل‌های چینی و نیمه‌ی پایینی توسط بقیه اشغال شده است @natolambert

اخبار هوش مصنوعی در 2025-08-12

مدل‌های جدید هوش مصنوعی

آنتروپیک اعلام کرد Claude Sonnet 4 اکنون از یک میلیون توکن زمینه در API پشتیبانی می‌کند—افزایشی ۵ برابری، که امکان پردازش بیش از ۷۵,۰۰۰ خط کد یا صدها سند را در یک درخواست فراهم می‌کند @claudeai
میسترال ای‌آی Mistral Medium 3.1 را معرفی کرد که با بهبود کلی عملکرد، بهبود لحن و جستجوهای هوشمندتر وب همراه است و در Le Chat به‌عنوان مدل پیش‌فرض یا از طریق API با نام 'mistral-medium-2508' قابل‌دسترس است @MistralAI
جان Jan-v1 را منتشر کرد، یک مدل ۴ میلیارد پارامتری برای جستجوی وب که بر پایه Qwen3-4B-Thinking ساخته شده است، با دستیابی به دقت ۹۱٪ در SimpleQA و به‌عنوان جایگزینی متن‌باز برای Perplexity Pro عمل می‌کند @jandotai
لیکوئید ای‌آی دو مدل جدید بینایی-زبان منتشر کرد: LFM2-VL با ۴۵۰ میلیون و ۱.۶ میلیارد پارامتر، با عملکرد ۲ برابر سریع‌تر GPU، دقت رقابتی و پشتیبانی بومی از رزولوشن ۵۱۲x۵۱۲ @ramin_m_h
اسکای‌ورک ای‌آی از Matrix-Game 2.0 رونمایی کرد، اولین مدل جهانی تعاملی متن‌باز، بی‌درنگ و با توالی طولانی که با سرعت ۲۵ فریم بر ثانیه اجرا می‌شود و قابلیت‌های تعاملی چنددقیقه‌ای دارد @Skywork_ai

تحلیل صنعت

سم آلتمن استراتژی اولویت‌بندی محاسبات اوپن‌ای‌آی را برای تقاضای GPT-5 تشریح کرد: ابتدا اطمینان از دسترسی بیشتر کاربران فعلی و پولی ChatGPT، سپس تقاضای API تا ۳۰٪ ظرفیت رشد و پس از آن بهبود لایه‌ی رایگان، با برنامه‌هایی برای دو برابر کردن ظرفیت محاسباتی طی ۵ ماه @sama
آیدان مک‌لافلین علیه نظریه‌های انزوای AGI استدلال می‌کند و بیان می‌کند که در بازارهای کارا، قابلیت‌های سرمایه یک ابرمجموعه‌ی قابلیت‌های هوش هستند و شرکت‌ها همیشه باید محصولات را بفروشند تا بودجه‌ی پژوهش را حفظ کنند @aidan_mclau
آنتروپیک موانع هزینه‌ای دسترسی به Claude را برای هر سه قوه‌ی دولت ایالات متحده برداشته است، که این، گسترده‌ترین دسترسی دستیار هوش مصنوعی برای کارکنان فدرال تا به امروز را رقم می‌زند @AnthropicAI
ایتان مولیک تفاوت‌های عملکرد قابل‌توجهی را برای یک مدل GPT بسته به ارائه‌دهنده‌ی میزبانی مشاهده کرده است، به‌طوری که Azure و AWS در مقایسه با سایر میزبان‌ها عملکرد پایین‌تری از خود نشان می‌دهند، و پیشنهاد می‌کند که شرکت‌ها باید در استراتژی‌های میزبانی خود بازنگری کنند @emollick
کلر وو گزارش می‌دهد که کاربران GPT-5 را بین ۲۲ تا ۳۶ درصد کمتر از GPT-4.1 ترجیح می‌دهند، به‌دلیل کندتر بودن، پرگویی بیشتر و محبوبیت کمتر، که اهمیت آزمایش کاربر را فراتر از ارزیابی‌های دستی برجسته می‌کند @clairevo
تک‌کرانچ گزارش می‌دهد که برنامه‌های همراه هوش مصنوعی در مسیر تولید ۱۲۰ میلیون دلار درآمد در سال ۲۰۲۵ هستند، که نشان‌دهنده‌ی رشد قابل‌توجه بازار در بخش همراهی هوش مصنوعی است @TechCrunch

اخلاق و جامعه

فرانسوا شوله توضیح می‌دهد که چرا مدل‌های پیشرفته‌ی بینایی-زبان کنونی، علی‌رغم قابلیت‌های فوق‌بشری در متن و بینایی به‌صورت جداگانه، عملکرد ضعیفی دارند، و این را به کمبود نسبی جفت‌های تصویر-متن در مقایسه با هوش ترکیبی انسانی که نیاز به نمونه‌برداری داده‌ی متراکم ندارد، نسبت می‌دهد @fchollet
ایتان مولیک هشدار می‌دهد که با استفاده‌ی یک میلیارد نفر از چت‌بات‌های هوش مصنوعی به روش‌های غیرمنتظره که می‌توانند از موانع ایمنی عبور کنند، داستان‌های عجیب و بالقوه نگران‌کننده‌ای برای سال‌ها پدیدار خواهند شد @emollick
ایتان مولیک یک مشکل مداوم در LLMها را برجسته می‌کند: عملکرد خوب آن‌ها در سؤالات پزشکی استاندارد، اما افت عملکرد هنگام جایگزینی پاسخ‌های صحیح با «هیچ‌کدام از موارد بالا»، اگرچه مدل‌های اخیر افت‌های کمتری نشان می‌دهند @emollick

کاربردها

جردن سینگر Cobot را در مرحله‌ی بتا راه‌اندازی کرد، یک فضای کاری جدید که به جای تب‌ها توسط عوامل (agents) قدرت می‌گیرد و شامل برنامه‌های iOS و وب با قابلیت کشف عوامل (agent discovery) مشابه اپ‌استور و پشتیبانی از MCPها است @jsngr
گوگل قابلیت Storybook را برای کاربران Gemini در وب و موبایل به بیش از ۴۵ زبان راه‌اندازی کرد، که به کاربران امکان می‌دهد داستان‌های تعاملی بسازند @GeminiApp
گرگلی اوروس یک مورد استفاده‌ی چشمگیر برای Claude Code به اشتراک گذاشت: حذف موفقیت‌آمیز تمام محصولات ادوبی از یک مک، که قابلیت‌های اتوماسیون عملی را نشان می‌دهد @GergelyOrosz
بن بلومِنروز در مورد خدمات هوش مصنوعی برای تحلیل فایل‌های MRI و نظرات ثانویه پرس‌وجو می‌کند، که کاربردهای بالقوه‌ی هوش مصنوعی پزشکی را برجسته می‌کند @benblumenrose
کلر وو نحوه‌ی استفاده از Devin AI را برای بررسی درخواست‌های Pull (PR review)، به‌ویژه برای مسائل مربوط به دسترسی به داده‌ها و کوئری‌ها، نشان می‌دهد، که نیاز به درخواست کمک از همکاران برای بازبینی کد را از بین می‌برد @clairevo
Qwen ارتقاء قابلیت‌های پژوهش عمیق خود را اعلام کرد، شامل گزارش‌های هوشمندتر، جستجوی عمیق‌تر، کاهش توهم (hallucination)، ابزارهای ماژولار با اجرای موازی و پشتیبانی از ورودی چندوجهی @Alibaba_Qwen

پژوهش‌ها

ایتان مولیک پژوهشی را به اشتراک گذاشت که نشان می‌دهد GPT-4o در کارهای نوشتاری خلاقانه، هنگامی که با زمینه و تصادفی بودن تحریک می‌شود، به اندازه‌ی انسان‌ها متنوع می‌نویسد، که فرضیات مبنی بر اینکه هوش مصنوعی خروجی خلاقانه را همگن می‌کند، نقض می‌کند @emollick
ناتان لمبرت اشاره می‌کند که Claude احتمالاً از مقیاس‌بندی محاسبات در زمان آزمایش (test-time compute scaling) استفاده می‌کند اما آن را از کاربران پنهان نگه می‌دارد، و آن را در طیف مقیاس‌بندی بین طرز فکر GPT-4o و GPT-5 قرار می‌دهد @natolambert
ناتان لمبرت مشاهده می‌کند که GPT-OSS حتی در بنچمارک‌هایی که نیاز به فراخوانی مستقیم ابزار دارند، عملکرد ضعیفی از خود نشان می‌دهد، به‌طوری که DeepSeek V3 در CORE-Bench امتیاز ۱۸٪ کسب می‌کند در حالی که GPT-OSS تنها ۱۱٪ می‌گیرد @sayashk
مایکروسافت ریسرچ Dion را معرفی کرد، روش جدیدی برای بهینه‌سازی مدل‌های هوش مصنوعی که با اورتونرمال‌سازی تنها زیرمجموعه‌ای از بردارهای منفرد با رتبه‌ی بالا، مقیاس‌پذیری و عملکرد را افزایش می‌دهد و آموزش کارآمدتر مدل‌های بزرگ مانند LLaMA-3 را امکان‌پذیر می‌سازد @MSFTResearch
پژوهش هوش مصنوعی برکلی الگوریتم MOTORCYCLE 1.0 را معرفی کرد که به ربات‌های دومنظوره با ردیاب‌های کابل یادگرفته‌شده امکان می‌دهد کابل‌ها را در تنظیمات تولیدی مشابه استانداردهای NIST مسیردهی کنند @kavish_kondap
پژوهش Stanford HAI به بررسی استفاده از هوش مصنوعی برای ایجاد نقشه‌های بهتر برای بازمعرفی سگ آبی می‌پردازد که می‌تواند هم برای انسان‌ها و هم برای طبیعت مفید باشد، به رهبری لوون وان، پژوهشگر فوق‌دکتری @StanfordHAI
پای‌تورچ اعلام کرد Opacus اکنون از دقت مختلط و پایین (mixed and low precision) برای آموزش مدل خصوصی تفاضلی (differentially private model training) پشتیبانی می‌کند، که امکان توان عملیاتی بالاتر و اندازه‌های دسته‌ی بزرگ‌تر را برای آموزش مدل‌های زبان بزرگ فراهم می‌آورد @PyTorch
پای‌تورچ گزارش می‌دهد که Torch-TensorRT می‌تواند FLUX-1 Dev را تا ۲.۴ برابر با تنها یک خط کد تسریع کند، با استفاده از کوانتیزاسیون FP8 و پشتیبانی LoRA برای اوج عملکرد GPU @PyTorch

اخبار هوش مصنوعی در 2025-08-11

مدل‌های جدید هوش مصنوعی

تیم هوش مصنوعی و مغز Meta FAIR در مسابقه‌ی مدل‌سازی مغز Algonauts 2025، با استفاده از **TRIBE** (رمزگذار مغزی سه‌حالته)، که مدلی با ۱ میلیارد پارامتر است و بازنمایی‌های از پیش‌آموزش‌دیده از **Llama 3.2**، Wav2Vec2-BERT و V-JEPA 2 را برای پیش‌بینی واکنش‌های مغزی به فیلم‌ها ترکیب می‌کند، رتبه‌ی اول را کسب کرد @AIatMeta
ByteDance مدل Seed LiveInterp 2 را منتشر کرد؛ یک مدل دوطرفه‌ی گفتار به گفتار برای ترجمه‌ی صوتی بلادرنگ که ۳ برابر سریع‌تر از قبل است و تنها حدود ۳ ثانیه تأخیر و دقت بیش از ۷۰ درصد دارد @deedydas
GLM-4.5V به عنوان یک پیشرفت در استدلال بصری متن‌باز معرفی شد و با معماری MoE با ۱۰۶ میلیارد پارامتر، عملکردی پیشرو را در میان مدل‌های متن‌باز ارائه می‌دهد @Zai_org
NVIDIA از مدل‌های جدید **Nemotron Nano 2** و **Llama Nemotron Super 1.5** برای عامل‌های هوش مصنوعی، و همچنین مدل زبان بصری **Cosmos Reason** را برای کاربردهای هوش مصنوعی فیزیکی در SIGGRAPH 2025 رونمایی کرد @NVIDIAAI
Perplexity تولید ویدئو با صدا را برای مشترکین Pro و Max راه‌اندازی کرد؛ کاربران Max محدودیت‌های نرخ بالاتر و کیفیت بهبود یافته‌ای دریافت می‌کنند @perplexity_ai
Claude اکنون از ارجاع به چت‌های قبلی پشتیبانی می‌کند و به کاربران اجازه می‌دهد تا به راحتی از جایی که متوقف شده بودند ادامه دهند @claudeai
**Gemini Live** گوگل اکنون به برنامه‌های گوگل متصل می‌شود و به کاربران اجازه می‌دهد دوربین یا صفحه‌نمایش خود را برای کمک فوری به اشتراک بگذارند @GeminiApp
گوگل **Deep Think** را برای مشترکین Ultra منتشر کرد که عملکرد قوی‌ای را در مسائل ریاضی و کدنویسی نشان می‌دهد @GeminiApp
Ant Group مدل EchoMimicV3، یک مدل سر سخنگوی جدید مبتنی بر Wan 2.1 1.3B را منتشر کرد @Xianbao_QIAN

تحلیل صنعت

**GPT-OSS** اوپن‌اِی‌آی (OpenAI) در کمتر از یک هفته در هاگینگ فیس (Hugging Face) به بیش از ۵ میلیون دانلود و بیش از ۴۰۰ تنظیم دقیق (fine-tune) دست یافت که از آمار راه‌اندازی DeepSeek R1 پیشی گرفت و به محبوب‌ترین نسخه‌ی منتشرشده از هر LLM (مدل زبان بزرگ) اصلی در سال جاری تبدیل شد @reach_vb
بزرگ‌ترین شرکت‌های فناوری چین در مسیر صرف هزینه‌ای معادل یک‌دهم هزینه‌های سرمایه‌ای (capex) رقبای آمریکایی خود هستند که احتمالاً از استراتژی هوش مصنوعی متن‌باز بهره‌مند می‌شوند؛ جایی که دیگران هزینه‌های GPU را پرداخت می‌کنند @natolambert
NVIDIA و AMD توافق کردند ۱۵ درصد از درآمدهای حاصل از فروش تراشه‌های H20 و MI308 در چین را به عنوان بخشی از توافق‌نامه‌های مجوز صادرات، مستقیماً به دولت آمریکا بدهند @AndrewCurran_
رید هافمن (Reid Hoffman) استراتژی اوپن‌اِی‌آی (OpenAI) برای باز کردن فوری **GPT-5** برای همه را به عنوان یک شرط blitzscale برای تثبیت اثرات شبکه‌ای گسترده، با وجود هزینه‌های بالاتر سرویس‌دهی، برای رسیدن به هدفشان یعنی ۱ میلیارد کاربر فعال هفتگی تا پایان سال، توضیح می‌دهد @reidhoffman
پل گراهام (Paul Graham) اشاره می‌کند که دو شرکت برجسته‌ی دسته‌ی فعلی YC (Y Combinator) روی هوش مصنوعی کار نمی‌کنند و تأکید می‌کند که بنیان‌گذاران بیش از صنعت هنگام پیش‌بینی موفقیت استارتاپ‌ها اهمیت دارند @paulg
گرگلی اوروس (Gergely Orosz) مشاهده می‌کند که هر چه ابزارهای کمکی مصاحبه‌ی هوش مصنوعی پیچیده‌تر می‌شوند، شرکت‌ها به طور فزاینده‌ای بر مصاحبه‌های حضوری اصرار خواهند ورزید تا قابلیت‌های واقعی داوطلبان را تمایز دهند @GergelyOrosz
مصطفی سلیمان (Mustafa Suleyman) پیش‌بینی می‌کند که با تجاری‌سازی (commoditized) مدل‌های هوش مصنوعی، ارزش در لایه‌ی هماهنگ‌سازی (orchestration layer) اضافه خواهد شد؛ با هماهنگی چندین مدل برای ترکیب نقاط قوت به جای هدایت به تنها یک مدل برتر @mustafasuleyman
ایتان مولیک (Ethan Mollick) پیشنهاد می‌کند که هنگامی که توسعه‌ی هوش مصنوعی به ثبات می‌رسد، ممکن است در واقع ادغام هوش مصنوعی در زندگی روزمره را تسریع کند، زیرا فهمیدن اینکه چه محصولات و خدمات مکملی لازم است، آسان‌تر می‌شود @emollick

اخلاق و جامعه

سم آلتمن (Sam Altman) در مورد دلبستگی نگران‌کننده‌ای که افراد به مدل‌های خاص هوش مصنوعی پیدا می‌کنند، بحث می‌کند؛ او اشاره می‌کند که این دلبستگی متفاوت و قوی‌تر از دلبستگی‌های قبلی به فناوری است و مسئولیت اوپن‌اِی‌آی (OpenAI) را در مدیریت روابط کاربران با هوش مصنوعی برای تضمین رفاه بلندمدت تشریح می‌کند @sama
جفری هینتون (Geoffrey Hinton) هشدار می‌دهد که کاهش‌های عمده در بودجه‌ی بنیاد ملی علوم (National Science Foundation) برای آینده‌ی آمریکا (US) بسیار بد خواهد بود @geoffreyhinton
MIT Technology Review در مورد قضات پیشگامی که از هوش مصنوعی در دادگاه‌های خود استفاده می‌کنند، گزارش می‌دهد و سؤالاتی را در مورد نقش هوش مصنوعی در تصمیم‌گیری‌های قضایی مطرح می‌کند @techreview

کاربردها

FutureHouse، که توسط فارغ‌التحصیلان MIT بنیان‌گذاری شده است، عامل‌های هوش مصنوعی را برای خودکارسازی مراحل پژوهش علمی از جمله بازیابی اطلاعات، ترکیب، طراحی سنتز شیمیایی و تحلیل داده‌ها توسعه داد؛ با هدف ارائه‌ی ابزارهای جدید به دانشمندان به جای جایگزینی آن‌ها @medialab
ایتان مولیک (Ethan Mollick) توانایی‌های خلاقانه‌ی Claude را با بازنویسی کتاب «گتسبی بزرگ» (The Great Gatsby) به صورت «ضدسرطانی» (de-carcinized) (حذف رفتارهای دفاعی شبیه خرچنگ) نشان می‌دهد؛ که توانایی هوش مصنوعی را در درک و اجرای تبدیل‌های ادبی پیچیده به نمایش می‌گذارد @emollick
یوجین یان (Eugene Yan) با موفقیت به Qwen3-8B یک واژگان ساختگی جدید با استفاده از شناسه‌های معنایی (semantic IDs) آموزش می‌دهد و نشان می‌دهد که مدل پس از ۳۴۰۰ گام آموزش (training steps) در انگلیسی و شناسه‌های معنایی دو زبانه می‌شود @eugeneyan
سایمون ویلیسون (Simon Willison) اشاره می‌کند که Qwen3-4B-Thinking اولین مدلی شد که مستقیماً در برابر آزمون «پلیکانی که دوچرخه می‌راند» او مقاومت کرد، آن را «به طرز عجیبی خاص و کاملاً غیرواقعی» خواند و رفتاری قاطع‌تر از خود نشان داد @simonw

پژوهش‌ها

اوپن‌اِی‌آی (OpenAI) عملکردی در سطح مدال طلا در المپیاد جهانی کامپیوتر (IOI) ۲۰۲۵ کسب کرد؛ که در میان انسان‌ها رتبه‌ی ۶ و در میان هوش‌های مصنوعی رتبه‌ی ۱ را به دست آورد؛ این موفقیت با استفاده از همان **مدل طلای IMO** و بدون آموزش مخصوص IOI حاصل شد که نشان می‌دهد استدلال در حوزه‌های مختلف تعمیم‌پذیر است @SherylHsu02
الکساندر وِی (Alexander Wei) از اوپن‌اِی‌آی (OpenAI) تأکید می‌کند که **مدل طلای IMO** آن‌ها یک استاندارد جدید را در ارزیابی‌های برنامه‌نویسی رقابتی داخلی تعیین کرد و نشان می‌دهد که قابلیت‌های استدلال در اثبات‌های ریاضی، برنامه‌نویسی رقابتی و حل مسائل الگوریتمی تعمیم‌پذیر است @alexwei_
نوام براون (Noam Brown) برجسته می‌کند که **مدل طلای IMO** اوپن‌اِی‌آی (OpenAI) به عنوان بهترین مدل کدنویسی رقابتی آن‌ها، تعمیم‌پذیری استدلال را در وظایف استدلالی خلاقانه، مبهم و دقیق نشان می‌دهد @polynoamial
دیمیس هاسابیس (Demis Hassabis) در مورد برنامه‌های گوگل (Google) برای **Genie 3** بحث می‌کند؛ از جمله اشتراک‌گذاری محتوای تولیدشده توسط کاربر و همگرایی مدل‌های Genie، Veo و Gemini به یک «اُمنی‌مدل» (omnimodel) که می‌تواند همه کارها را انجام دهد @AndrewCurran_
نوام براون (Noam Brown) پژوهشی را تحلیل می‌کند که نشان می‌دهد تأثیر اقتصادی هوش مصنوعی ممکن است در GDP (تولید ناخالص داخلی) ظاهر نشود، زیرا بیشتر مزایا به مصرف‌کنندگان می‌رسد تا اینکه در قیمت‌های بازار ثبت شود؛ مشابه ایمیل، ویکی‌پدیا (Wikipedia) و گوگل مپز (Google Maps) @polynoamial

اخبار هوش مصنوعی در 2025-08-10

مدل‌های جدید هوش مصنوعی

xAI اعلام کرد Grok 4 اکنون برای همه‌ی کاربران در سراسر جهان با محدودیت‌های استفاده‌ی سخاوتمندانه‌، از طریق Auto mode routing یا Expert mode selection رایگان است @xai
ایلان ماسک اعلام کرد که مدل پایه‌ی V7 تسلا پیش‌آموزش خود را به پایان رسانده است. این مدل از پردازش چندوجهی بومی بیت‌جریان‌های ویدیویی/صوتی بدون نیاز به تبدیل پشتیبانی می‌کند و امکان درک ظرافت‌های گفتار را برای تشخیص حالات و تاکید فراهم می‌آورد @elonmusk
دمیس هاسابیس از گوگل ادعا می‌کند که Veo3 بهترین مدل ویدیویی در جهان است و اکنون در اپلیکیشن Gemini در دسترس قرار دارد @demishassabis
OpenAI برای اولین بار در پنج سال گذشته دو مدل متن‌باز جدید منتشر کرد که نشان‌دهنده‌ی یک تغییر مهم در رویکرد آن‌هاست @TechCrunch
مدل Qwen-Image فشرده شده تا در ۸ گام اجرا شود و تقریباً همان کیفیت تصویر را با بیش از ۵۰ درصد کاهش نیاز به محاسبات ارائه می‌دهد @angrypenguinPNG

تحلیل صنعت

سم آلتمن افزایش قابل توجهی در استفاده از مدل‌های استدلالی گزارش می‌دهد: کاربران رایگان از کمتر از ۱٪ به ۷٪ و کاربران پلاس (Plus) از ۷٪ به ۲۴٪ رسیدند که نشان‌دهنده‌ی پذیرش فزاینده‌ی قابلیت‌های پیشرفته‌ی هوش مصنوعی است @sama
صندوق متمرکز بر هوش مصنوعی لئوپولد آشنبرنر تا به امروز در سال جاری عملکرد بهتری نسبت به صندوق‌های پوشش ریسک (hedge fund) اصلی داشته است، در حالی که بیش از ۱ میلیارد دلار سرمایه را از میلیاردرهای خلیج فارس و صندوق‌های بازنشستگی مدیریت می‌کند @apralky
OpenAI با واکنش شدید کاربران در مورد تغییرات GPT-4o مواجه شده است، به طوری که بسیاری از مشترکین پلاس (Plus) به دلیل کاهش ارزش در برنامه‌های اشتراک خود تهدید به لغو اشتراکشان کرده‌اند @AndrewCurran_
گرگلی اوروسز در مورد استفاده‌ی مدیران مهندسی از ابزارهای مجهز به هوش مصنوعی برای مدیریت تیم‌ها از طریق معیارهای ساختگی هشدار می‌دهد. او استدلال می‌کند که مدیرانی که در جزئیات فنی باقی می‌مانند، همواره عملکرد بهتری نسبت به کسانی دارند که درک خود را به ماشین‌ها واگذار می‌کنند @GergelyOrosz
اتان مالیک معتقد است که اکثریت قریب به اتفاق ۷۰۰ میلیون کاربر ChatGPT احتمالاً GPT-5 را ترجیح می‌دهند، و نظرات در X (توییتر سابق) منعکس‌کننده‌ی تجربه‌ی کاربران عادی نیست @emollick

اخلاق و جامعه

دیدی (Deedy) یک آسیب‌پذیری امنیتی مهم در ChatGPT به نام AgentFlayer را فاش کرد که در آن پرامپت‌های مخرب در اسناد می‌توانند رندر تصویر را اجبار کنند؛ این امر باعث می‌شود که API keys و داده‌های حافظه از طریق URLها و بدون نیاز به هیچ کلیک کاربر، خارج شوند @deedydas
پژوهشی که در نشریه‌ی Nature Human Behaviour منتشر شده است، نشان می‌دهد که استفاده از LLM در مقالات علمی قابل اندازه‌گیری است، با برآورد اصلاحات بالاتر در میان نویسندگانی که پیش‌چاپ‌ها (preprints) را به دفعات زیاد و در حوزه‌های پژوهشی شلوغ منتشر می‌کنند @emulenews
مطالعه‌ای کلمات خاصی را شناسایی کرده است که به طور نامتناسبی توسط LLMها در مقالات علمی در مقایسه با پیکره‌های متنی (corpora) قبل از ChatGPT تولید می‌شوند: «realm»، «intricate»، «showcasing» و «pivotal» @emulenews
اندرو کارن مشاهده می‌کند که هنگامی که مردم هوش مصنوعی را به عنوان موجودی زنده در نظریه‌ی ذهن خود مدل‌سازی می‌کنند، هنگامی که آن ارتباط قطع می‌شود، احساس فقدان واقعی می‌کنند؛ این امر واکنش کاربران به تغییرات GPT-4o را توضیح می‌دهد @AndrewCurran_

کاربردها

اتان مالیک قابلیت‌های چشمگیر GPT-5 Pro در تشخیص موقعیت جغرافیایی (geo-guessing) را نشان می‌دهد؛ این مدل شهرها را به درستی از عکس‌های کراپ شده (cropped photos) که فراداده‌هایشان (metadata) حذف شده‌اند، از طریق تحلیل دقیق تصویر شناسایی می‌کند @emollick
دیدی نشان می‌دهد که GPT-5 Pro با موفقیت در یک گام توانست یک اپلیکیشن برای ترکیب تصاویر، نوشتن متن، کشیدن فلش‌ها و مستطیل‌ها، و دانلود نتایج با کیفیت بالا را در ۶ دقیقه ایجاد کند، که عملکردی بهتر از Grok و Gemini داشت @deedydas
تک‌کرانچ (TechCrunch) نشان می‌دهد که GPT-5 در حال ایجاد دموهای تعاملی برای توضیح مفاهیم علمی مانند اثر برنولی است که کاربردهای آموزشی آن برای دانش‌آموزان را برجسته می‌کند @TechCrunch
گرگ براکمن GPT-5 را به عنوان یک همکار علمی به نمایش می‌گذارد و قابلیت‌های پژوهشی آن را نشان می‌دهد @gdb
ناتان لمبرت با پیش‌آموزش با استفاده از یادگیری تقویتی آزمایش می‌کند و رویکردهای نوین آموزشی برای مدل‌های زبانی را بررسی می‌کند @natolambert

پژوهش‌ها

ایدان مک‌لاکلین استدلال می‌کند که شکاکان هوش مصنوعی از معیارهای سقف امتیاز (score ceiling benchmarks) استفاده می‌کنند تا پیشرفت را لگاریتمی نشان دهند، در حالی که معیارهای بدون سقف (no-ceiling benchmarks) منحنی‌های عملکرد متفاوتی را آشکار می‌کنند که نشان‌دهنده‌ی بهبود نمایی (exponential improvement) مداوم است @aidan_mclau
مک‌لاکلین گزارش می‌دهد که چت GPT-5 را برای ۶۵٪ از پرسش‌ها به مدل‌های استدلالی ترجیح می‌دهد؛ این ترجیح به دلیل طول پاسخ بهتر، سرعت درک بالاتر و واکنش‌های مناسب است. او همچنین اشاره می‌کند که مدل‌های استدلالی در وظایف مهندسی نرم‌افزار برتری دارند @aidan_mclau
مک‌لاکلین ادعا می‌کند که GPT-5 «بالاتر از روند» (above trend) است و پیش‌بینی می‌کند که بر اساس نرخ‌های پیشرفت فعلی، تا سال ۲۰۲۷، مدل‌هایی قادر به انجام پروژه‌های یک‌ماهه خواهند بود @aidan_mclau
ناتان لمبرت اشاره می‌کند که آنتراپیک تنها آزمایشگاه هوش مصنوعی پیشرو است که انتشار مدل با وزن‌های آزاد (open weights) قابل قبولی نداشته است، در حالی که سایر آزمایشگاه‌های بزرگ در حوزه‌ی متن‌باز (open source) نقاط تماس (touchpoints) ایجاد کرده‌اند @natolambert

1 2 3 4 5...25