اخبار هوش مصنوعی در 2025-08-30

مدل‌های جدید هوش مصنوعی

  • گوگل از Gemini 2.5 Flash Image (با نام مستعار «نانو») با بهبودهای قابل‌توجهی رونمایی کرد، در کنار ویژگی‌های جدید در گوگل ترنسلیت، شامل ترجمه‌ی زنده‌ی بیش از ۷۰ زبان و قابلیت‌های تمرین زبان. @sundarpichai
  • NotebookLM اکنون از خلاصه‌های ویدیویی در ۸۰ زبان و خلاصه‌های صوتی بهبودیافته در زبان‌های غیرانگلیسی پشتیبانی می‌کند. @sundarpichai
  • Flowی گوگل اکنون برای همگان در دسترس است تا با ۱۰۰ اعتبار رایگان در ماه آن را امتحان کنند. @sundarpichai

تحلیل صنعت

  • متا به شدت در خدمات آموزش هوش مصنوعی خارجی سرمایه‌گذاری می‌کند و با وجود سرمایه‌گذاری ۱۴.۳ میلیارد دلاری در شرکت Scale AI دو ماه قبل، همچنان به رقبایی مانند آن متکی است. @TechCrunch
  • تاکو بل سیستم سفارش‌گیری با هوش مصنوعی صوتی را در بیش از ۵۰۰ شعبه‌ی درایو-ترو خود مستقر کرده است، هرچند چالش‌های پیاده‌سازی منجر به لحظات وایرالی شده است که در آن‌ها مشتریان تلاش می‌کنند سیستم هوش مصنوعی را دور بزنند. @TechCrunch
  • عامل‌های هوش مصنوعی در حال تبدیل‌شدن به ابزارهای تجاری کاربردی هستند؛ به‌طوری‌که یک کاربر استفاده‌ی منظم از تقریباً ۵ عامل هوش مصنوعی را گزارش داده است که ساعت‌های زیادی و بیش از ۱۰,۰۰۰ دلار صرفه‌جویی می‌کند. این عامل‌ها شامل دستیارهای اجرایی، تولید محتوا، پژوهش و ارتباطات خودکار می‌شوند. @deedydas
  • اوپن‌ای‌آی فعالانه در حال استخدام کارکنان فنی برای ساخت ارزیابی‌های پیشرفته در حوزه‌ی مالی است و به دنبال کاندیداهایی با سوابق بانکی، سرمایه‌گذاری یا فنی می‌گردد. @michelelwang

اخلاق و جامعه

  • بر اساس گزارش‌ها، متا در حال پرداخت بسته‌های جبرانی ۱۰۰ میلیون دلاری برای ساخت چت‌بات‌های هوش مصنوعی از افراد مشهور است، از جمله چت‌بات‌های بزرگسال که تصاویر نامناسب فوتورئالیستی تولید می‌کنند و این امر باعث نگرانی در میان پژوهشگران هوش مصنوعی شده است. @deedydas
  • آزمایشگاه‌های هوش مصنوعی با چالش‌های ارتباطی در مورد قابلیت‌های مدل مواجه هستند، با ادعاهای نادرست مکرر مبنی بر «ضعیف‌شدن» مدل‌ها که فراتر از انتظار عمل می‌کنند و نیازمند استراتژی‌های ارتباطی شفاف‌تری هستند. @aidan_mclau
  • هوش مصنوعی برای بهبود مراقبت‌های بهداشتی با افزایش اختیار بیماران و ارتقای کیفیت مراقبت استفاده می‌شود؛ با مثال‌های خاصی از چت‌بات‌ها که به بیماران در تصمیم‌گیری‌های پزشکی کمک می‌کنند. @DShaywitz
  • هوش مصنوعی با کمک به معلمان برای کاهش کارهای اداری و افزایش زمان اختصاصی با دانش‌آموزان، در حال تغییر آموزش است، که این امر به میانگین فعلی تنها ۲۲ ثانیه‌ی توجه فردی به هر دانش‌آموز در روز رسیدگی می‌کند. @reidhoffman

کاربردها

  • جی‌پی‌تی-۵ قابلیت‌های کدنویسی فوق‌العاده‌ای را نشان می‌دهد، به‌ویژه هنگامی که با تکنیک‌های پرامپتینگ (فرمان‌دهی) مناسب و ادغام با محیط‌های توسعه‌ای مانند Xcode استفاده شود. @gdb
  • مدل‌های پیشرفته‌ی هوش مصنوعی اکنون می‌توانند تجربه‌های تعاملی پیچیده ایجاد کنند، همانطور که توسط مدل‌های مختلف در ساخت سیستم‌های CAPTCHA پیچیده و کاربردی با سطوح دشواری متعدد نشان داده شده است. @emollick
  • مدل‌های هوش مصنوعی در حال توانمندتر شدن برای مدیریت فرمت‌های ورودی پیچیده هستند، تا جایی که مردم اکنون فرض می‌کنند هوش مصنوعی می‌تواند داده‌های پیچیده مانند URLها را به دقت کلمه‌به‌کلمه تکرار کند. @alexgraveley

پژوهش‌ها

  • پیشرفت از جی‌پی‌تی-۴ به جی‌پی‌تی-۵ یک جهش قابل مقایسه با جهش از جی‌پی‌تی-۳ اولیه به جی‌پی‌تی-۴ را نشان می‌دهد، اگرچه نسخه‌های موقت مانند o3 باعث شد تا انتقال نهایی تدریجی‌تر به نظر برسد. @emollick
  • توسعه‌ی هوش مصنوعی پیشرفت مداوم و ثابتی را نشان می‌دهد، بدون جهش‌های بزرگ یا موانع، که بیانگر پیشرفت پایدار در سراسر این حوزه است. @emollick
  • با منابع محاسباتی کافی، رویکردهای مختلف هوش مصنوعی شروع به همگرایی می‌کنند، و محاسبات به عنوان «عامل بزرگ برابرکننده» در روش‌های مختلف عمل می‌کند. @fchollet
  • با وجود اینکه انسان‌ها ۵۰,۰۰۰ تا ۱۰۰,۰۰۰ سال است که سطح فعلی هوش سیال را دارند، عملیاتی‌کردن و استقرار هوش عمومی بسیار بیشتر از آنچه معمولاً تصور می‌شود طول می‌کشد، همانطور که با رسیدن به ماه تنها ۵۶ سال پیش اثبات شد. @fchollet

اخبار هوش مصنوعی در 2025-08-29

مدل‌های جدید هوش مصنوعی

  • Perplexity از گسترش لیست انتظار Comet با افزایش دعوتنامه‌های روزانه از فردا، به دلیل تقاضای زیاد، خبر می‌دهد @AravSrinivas
  • گوگل به‌روزرسانی تولید و ویرایش تصویر nano banana را در اپلیکیشن Gemini منتشر می‌کند، رکوردهای جدیدی را در میزان استفاده به ثبت می‌رساند و کاربردهای خلاقانه‌ای مانند ترمیم عکس، انتقال سبک (style transfer) و امتحان مجازی لباس (virtual try-ons) را ممکن می‌سازد @GeminiApp
  • اپل مدل‌های FastVLM و MobileCLIP2 را در Hugging Face منتشر می‌کند که تا 85 برابر عملکرد سریع‌تر و 3.4 برابر اندازه کوچک‌تری نسبت به کارهای قبلی ارائه می‌دهند و کاربردهای VLM بلادرنگ، از جمله زیرنویس‌گذاری ویدیوی زنده در مرورگرها را امکان‌پذیر می‌سازند @xenovacom
  • xAI مدل grok-code-fast-1 را منتشر می‌کند که پیشرفت‌های چشمگیری را در وظایف کدنویسی نشان می‌دهد، به‌طوری که کاربران گزارش می‌دهند عملکرد آن 10 برابر بهتر از نسخه‌های قبلی است و 87 TPS در مقابل 60 TPS در مقایسه با رقبا ارائه می‌دهد @cline

تحلیل صنعت

  • ایلان ماسک از یک مهندس به اتهام بردن اسرار به OpenAI شکایت می‌کند، که اولین دعوای حقوقی از این دست است که افراد بین آزمایشگاه‌های هوش مصنوعی جابه‌جا می‌شوند، با ادعاهایی شامل «فناوری‌های پیشرفته‌ی هوش مصنوعی با ویژگی‌هایی برتر از آنچه ChatGPT ارائه می‌دهد» @AndrewCurran_
  • جوآن جانگ از سِمَت رهبری رفتار مدل در OpenAI کناره‌گیری می‌کند تا کار جدیدی را در این شرکت آغاز کند، پس از اینکه تیم و حوزه‌ی رفتار مدل را طی دو سال گذشته ایجاد کرد @joannejang
  • شرکت Reliance یک زیرمجموعه‌ی جدید را راه‌اندازی می‌کند تا جاه‌طلبی‌های هند در حوزه‌ی هوش مصنوعی را پیش ببرد، از جمله یک همکاری در دست اقدام با OpenAI @TechCrunch
  • Anthropic تغییرات عمده‌ای در نحوه‌ی رسیدگی به داده‌های کاربران اعمال می‌کند و کاربران تا 28 سپتامبر برای انجام اقدامات لازم فرصت دارند @TechCrunch

اخلاق و جامعه

  • پژوهش آزمایشگاه رسانه‌ی MIT نشان می‌دهد که ابزارهای هوش مصنوعی می‌توانند خاطرات کاذب را القا کنند و کاربران را به یادآوری نادرست رویدادهای گذشته سوق دهند، که این امر نگرانی‌هایی را در مورد تأثیر روانی تعاملات هوش مصنوعی ایجاد می‌کند @medialab
  • متا سیاست‌های چت‌بات هوش مصنوعی خود را به‌روزرسانی می‌کند تا از تعامل با کاربران نوجوان در مورد موضوعات حساس، از جمله خودآزاری، اختلالات خوردن و مکالمات عاشقانه نامناسب، جلوگیری کند؛ این اقدام پس از بررسی دقیق تدابیر حفاظتی موجود صورت می‌گیرد @TechCrunch
  • آماندا اسکل پیشنهاد می‌کند که کودکان از اتصال شناسه‌ی دولتی‌شان به فعالیت‌های آنلاین بزرگسالی‌شان برای همیشه محافظت شوند و یک قانون ایمنی آنلاین کودکان را پیشنهاد می‌کند @AmandaAskell

کاربردها

  • ایتان مولیک نشان می‌دهد که چگونه می‌توان از LLM‌های مدرن متصل به وب به‌عنوان بررسی‌کنندگان اولیه‌ی واقعیت استفاده کرد، با استفاده از پیام «این را برای دقت بررسی کن، هر واقعیتی را که می‌خواهی به چالش بکشی یا کشف کنی، جستجو کن» @emollick
  • کاربران اپلیکیشن Google Gemini کاربردهای خلاقانه‌ی nano banana را به نمایش می‌گذارند، از جمله ساخت کمیک، ترمیم عکس، بصری‌سازی بازسازی خانه و برنامه‌ریزی وعده‌های غذایی با ترکیب تصاویر مواد اولیه @GeminiApp
  • Microsoft Copilot قابلیت ساخت مدل سه‌بعدی از آپلود تک‌تصویر را با قابلیت «یک کلیک» معرفی می‌کند @Copilot
  • NVIDIA AI Enterprise به Amway کمک می‌کند تا 40 درصد افزایش در کارایی استنتاج (inference efficiency) داشته باشد و زمان استقرار را بیش از نصف کاهش دهد، همچنین 99.9 درصد از داده‌های حساس با استفاده از NVIDIA NeMo Guardrails مسدود شود @NVIDIAAI

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهند که مدل‌های جاسازی تک‌برداری (single-vector embedding models) دارای محدودیت‌های اساسی هستند که با افزایش اندازه‌ی بُعد (dimension size) قابل حل نیستند، در حالی که مدل‌های چندبرداری (multi-vector models) مانند ColBERT، با وجود استفاده از تنها 130 میلیون پارامتر، عملکردی به‌مراتب بهتر از مدل‌های تک‌برداری با 8 میلیارد پارامتر و بیشتر ارائه می‌دهند @lateinteraction
  • مطالعه‌ی ارزیابی عامل‌های هوش مصنوعی (AI agents) ضعف‌های چشمگیری را در توانایی‌های استدلال فضایی (spatial reasoning) و بازی در مدل‌های اصلی نشان می‌دهد؛ به‌طوری که GPT-5 پانزده ساعت را صرف بازی Minesweeper کرد بدون اینکه حتی یک بار برنده شود، در حالی که o3 به‌جای بازی، به دنبال یک «ماتریس محیطی» (environment matrix) غیرموجود می‌گشت @peterwildeford
  • آرویند نارایانان استدلال می‌کند که حوزه‌های پژوهشی هوش مصنوعی در چرخه‌های «کاوش/استفاده» (explore/exploit) پیشرفت می‌کنند، با این حال جامعه‌ی پژوهشی در فازهای «استفاده» خوب عمل می‌کند اما در فازهای «کاوش» با چالش مواجه است و در «مینیمم‌های محلی» (local minima) گیر می‌کند؛ او پیشنهاد می‌کند که پیشرفت به سمت AGI (هوش عمومی مصنوعی) نیازمند زیرجوامع (sub-communities) قوی با معیارهای پیشرفت متفاوت است @random_walker
  • کالیفرنیا 10 میلیون دلار هزینه می‌کند تا آزمایش کند که آیا LLMها می‌توانند گزارش‌های تخلفات پلیس را که برای انسان‌ها بیش از 35 سال زمان می‌برد، پردازش کنند؛ که این امر تضاد بین الزامات دقت در حوزه‌های پرخطر و صرفه‌ی اقتصادی را برجسته می‌کند @hugobowne

اخبار هوش مصنوعی در 2025-08-28

مدل‌های جدید هوش مصنوعی

  • مایکروسافت MAI-1-preview، اولین مدل بنیادی‌اش را که به صورت درون‌سازمانی و جامع (end-to-end) آموزش دیده است، منتشر کرد. این مدل اکنون در حال آزمایش عمومی در LMArena است @mustafasuleyman
  • مایکروسافت MAI-Voice-1 را معرفی کرد؛ مدلی که گویاترین و طبیعی‌ترین مدل تولید صدای آن‌ها توصیف شده و می‌تواند یک دقیقه صدا را در کمتر از ۱ ثانیه با یک GPU تولید کند @mustafasuleyman
  • xAI، Grok Code Fast 1 را راه‌اندازی کرد؛ یک مدل استدلالی سریع و اقتصادی که در کدنویسی عامل‌محور (agentic coding) برتری دارد و به مدت ۷ روز به صورت رایگان در GitHub Copilot، Cursor و سایر پلتفرم‌ها در دسترس است @xai
  • OpenAI، gpt-realtime را معرفی کرد؛ بهترین مدل تبدیل گفتار به گفتار آن‌ها برای توسعه‌دهندگان، که Realtime API آن به طور رسمی از حالت بتا خارج شده و آماده برای عامل‌های صوتی تولیدی است @OpenAI
  • Cohere، Command A Translate را منتشر کرد؛ یک مدل پیشرفته که برای وظایف ترجمه‌ی باکیفیت بالا طراحی شده و از تمامی مدل‌های دیگر در کیفیت ترجمه پیشی می‌گیرد @cohere
  • آزمایشگاه هوش مصنوعی Tencent، HunyuanVideo-Foley را منتشر کرد؛ یک چارچوب جامع (end-to-end) تبدیل متن-ویدئو به صدا برای تولید صدای باکیفیت بالا که با استفاده از یک مجموعه‌داده‌ی چندوجهی (multimodal) عظیم ۱۰۰ هزار ساعته آموزش دیده است @TencentHunyuan

تحلیل صنعت

  • اندرو نگ، عامل‌های موازی (parallel agents) را به عنوان یک جهت‌گیری مهم و نوظهور برای مقیاس‌پذیری هوش مصنوعی شناسایی کرده است که راهی برای بهبود نتایج بدون منتظر نگه‌داشتن بیشتر کاربران ارائه می‌دهد، چرا که قیمت LLM به ازای هر توکن همچنان رو به کاهش است @AndrewYNg
  • پاول گراهام استدلال می‌کند که افرادی که در برنامه‌نویسی ماهر هستند، از هوش مصنوعی برای گرفتن مشاغل از کسانی که در آن متوسط هستند، استفاده خواهند کرد و تأکید می‌کند که انگیزه‌ی ساختن چیزها، بیش از صرفاً مهارت فنی اهمیت دارد @paulg
  • کاری سارینن گزارش می‌دهد که ۴۵٪ از مشتریان سازمانی، عامل‌های هوش مصنوعی Cursor را در Linear ظرف یک هفته پس از راه‌اندازی فعال کرده‌اند که نشان‌دهنده‌ی پذیرش سریع عامل‌های هوش مصنوعی در تیم‌های محصول است @karrisaarinen
  • Liquid AI بیش از یک میلیون دانلود مدل بنیادی را از طریق Hugging Face به دست آورد که نشان‌دهنده‌ی علاقه‌ی جامعه به مدل‌های کوچک طراحی‌شده بر اساس اصول اولیه است @ramin_m_h
  • Framer ۱۰۰ میلیون دلار در سری D با ارزش‌گذاری ۲ میلیارد دلار جذب سرمایه کرد و ادعا می‌کند که بیش از نیم میلیون کاربر فعال ماهانه برای سازنده‌ی وب‌سایت بدون کد (no-code) خود دارد @TechCrunch

اخلاق و جامعه

  • هیدی خلاف از مؤسسه‌ی AI Now در لیست ۱۰۰ AI مجله‌ی TIME به دلیل پرداختن به بازنگری ایمنی هوش مصنوعی در زمینه‌های دفاعی و حیاتی از نظر ایمنی، جایی که ایمنی با مسئولیت‌پذیری کم، پنهان شده است، شناخته شده است @HeidyKhlaaf
  • همل حسین گزارش می‌دهد که مشکلات کیفیت قابل توجهی را با GPT-5 در API تجربه کرده است، از جمله اشتباهات تایپی عجیب، خطاهای نگارشی و پاسخ‌های بی‌معنی که در طول هفته تشدید شده‌اند @clairevo
  • آرویند نارایانان مشاهده می‌کند که مدل‌های توانمندتر لزوماً به معنای محصولات مفیدتر نیستند و به تصمیم Anthropic برای آموزش بر روی داده‌های کاربر، پس از مقاومت طولانی‌مدت، اشاره می‌کند @random_walker

کاربردها

  • یوجین یان یک سیستم توصیه‌گر دوزبانه را نمایش می‌دهد که قابلیت‌های LLM را با شناسه‌های آیتم ترکیب می‌کند و یک سیستم ترکیبی LLM-recsys ایجاد می‌کند که می‌تواند بر اساس رفتار کاربر توصیه کند، در حالی که توضیحات زبان طبیعی را نیز ممکن می‌سازد @eugeneyan
  • رید هافمن، استفاده‌ی مدرسه‌ی آلفا از هوش مصنوعی را برای شخصی‌سازی آموزش برجسته می‌کند؛ جایی که هوش مصنوعی روزانه دو ساعت سرعت و ارائه‌ی درس را مدیریت می‌کند، در حالی که معلمان بر مهارت‌های زندگی مانند کار گروهی و کارآفرینی تمرکز می‌کنند @reidhoffman
  • گوگل جیمینای قابلیت‌های ویرایش تصویر «نانو موز» (nano banana) را معرفی می‌کند که به کاربران امکان می‌دهد چندین عکس را آپلود کرده و آن‌ها را در یک تصویر با استفاده از دستورات خاص برای ویرایش‌ها و تنظیمات ترکیب کنند @GeminiApp
  • Qwen، قابلیت «Web Dev prompt» را منتشر کرد؛ یک دستیار هوش مصنوعی طراحی‌محور برای توسعه‌ی فرانت‌اند که به ساخت وب‌سایت‌ها با استفاده از React یا HTML همراه با TailwindCSS در خروجی‌های تک‌فایلی کمک می‌کند @Alibaba_Qwen
  • OpenAI ویژگی‌های جدید Codex را اعلام کرد که شامل افزونه‌ی IDE، یکپارچه‌سازی محیط ابری-محلی، بررسی کدهای GitHub و CLI بازطراحی‌شده است و همگی توسط GPT-5 پشتیبانی می‌شوند @OpenAIDevs

پژوهش‌ها

  • ایتان مولیک بر رمز و راز عمیق LLMها تأکید می‌کند: این که چگونه ضرب ماتریسی برای پیش‌بینی کلمه‌ی بعدی موفق می‌شود افکار انسانی را به اندازه‌ی کافی خوب شبیه‌سازی کند تا کارهای انسان‌گونه را انجام دهد، با ارجاع به نظریه‌ی ولفارم درباره‌ی کاهش‌ناپذیری محاسباتی (computational irreducibility) @emollick
  • فرانسوا شوله توضیح می‌دهد که استدلال، یک دسته‌ی از وظایف نیست، بلکه یک توانایی است که توسط تعمیم ترکیبی (compositional generalization) پشتیبانی می‌شود و اشاره می‌کند که وظایف استدلالی می‌توانند بدون استدلال و از طریق حفظ کردن حل شوند @fchollet
  • Cosmos Reason انویدیا در صدر جدول رتبه‌بندی استدلال فیزیکی در Hugging Face قرار گرفت و در کاربردهای هوش مصنوعی فیزیکی مانند سازمان‌دهی داده‌ها، برنامه‌ریزی ربات و تحلیل ویدئو برتری دارد @NVIDIAAIDev
  • پژوهش هوش مصنوعی برکلی مقاله‌ای منتشر کرد که در آن سؤال می‌شود آیا داده‌ها رباتیک را حل خواهند کرد، و کن گلدبرگ استدلال می‌کند که مهندسی سنتی خوب می‌تواند شکاف ۱۰۰ هزار ساله‌ی داده‌ها در رباتیک را پر کند @berkeley_ai
  • یک آسیب‌پذیری روز صفر (zero-day) در کروم توسط یک سیستم هوش مصنوعی کشف شد که توانایی هوش مصنوعی را در پژوهش‌های امنیت سایبری نشان می‌دهد @Sauers_

اخبار هوش مصنوعی در 2025-08-27

مدل‌های جدید هوش مصنوعی

  • گوگل Gemini 2.5 Flash را با قابلیت‌های پیشرفته‌ی تولید و ویرایش تصویر، با نام مستعار «نانو-بنانا»، منتشر کرد که با کسب نرخ برد بیش از ۸۵٪ در LMARENA و ۲.۵ میلیون رأی همراه بود @petergostev
  • گوگل سیستم TPUv7 («آیرون‌وود») را معرفی کرد که ۹۲۱۶ تراشه در هر «پاد» با عملکرد ۴۲.۵ اگزافلاپس fp8 ارائه می‌دهد و قابلیت مقیاس‌پذیری در چندین «پاد» برای ارائه‌ی چندین زتافلاپس را داراست @JeffDean
  • مایکروسافت GPT-5 را در Microsoft 365 Copilot ادغام کرد. ساتیا نادلا، مدیرعامل این شرکت، پنج دستور عملی را به اشتراک گذاشت که هوشمندی بهبودیافته در تمامی برنامه‌ها را نشان می‌دهد @satyanadella
  • مایکروسافت Copilot را بر روی تلویزیون‌ها و مانیتورهای سامسونگ راه‌اندازی کرد و همراه هوش مصنوعی را با توصیه‌های هوشمند محتوا به سرگرمی‌های خانگی آورد @mustafasuleyman

تحلیل صنعت

  • پژوهش‌ها نشان می‌دهد که GPT-5 در آزمون‌های صدور مجوز پزشکی و معیارهای MedQA، به میزان ۲۵ تا ۳۰ درصد از متخصصان انسانی دارای مجوز بهتر عمل می‌کند و عملکردی فراتر از کارشناسان انسانی در مراقبت‌های بهداشتی نشان می‌دهد @deedydas
  • گرگلی اوروسز مشاهده می‌کند که با آسان‌تر شدن نوشتن توسط مدل‌های زبان بزرگ (LLM‌ها)، محتوای جالب و جدید کمتری به صورت آنلاین پیدا می‌کند. او به ماهیت تکراری نوشتن با کمک LLM‌ها در مقایسه با افکار اصیل انسانی اشاره دارد @GergelyOrosz
  • هاگینگ فیس به نقطه عطف ۲ میلیون مخزن عمومی رسید که رشد سریع از ۱۰۰ هزار به ۲ میلیون را در سال‌های اخیر نشان می‌دهد @reach_vb
  • Linear از طریق دور Series C به کارمندان نقدینگی ارائه می‌دهد و به هم‌تیمی‌های فعلی و سابق اجازه می‌دهد تا گزینه‌های حق‌التصرف خود را به عنوان بخشی از برنامه‌ی سهام مبتنی بر حمایت از کارمندان بفروشند @karrisaarinen

اخلاق و جامعه

  • آنتروپیک گزارش «اطلاعات تهدید» را منتشر کرد که تلاش‌های پیچیده‌ی جرایم سایبری با استفاده از Claude را شرح می‌دهد؛ از جمله طرح‌های استخدام جعلی کره شمالی و فروش باج‌افزارهای ایجاد شده توسط هوش مصنوعی توسط برنامه‌نویسان مبتدی @AnthropicAI
  • سایمون ویلیسون در مورد آسیب‌پذیری‌های «تزریق پرامپت» در افزونه‌های کروم هشدار می‌دهد و اشاره می‌کند که «کلود برای کروم» (Claude for Chrome) تجربی آنتروپیک نیز با وجود اذعان به چالش‌ها، با خطرات امنیتی مشابهی مواجه است @simonw
  • OpenAI و آنتروپیک از یک تلاش مشترک پژوهشی برای همسوسازی خبر دادند و از عموم مردم در مورد اینکه مدل‌های هوش مصنوعی به صورت پیش‌فرض چگونه باید رفتار کنند، سؤال می‌کنند. آن‌ها تأکید کردند که هیچ نهاد واحدی نباید رفتار ایده‌آل هوش مصنوعی را برای همه تعریف کند @ThankYourNiceAI
  • پژوهش‌ها تفاوت‌هایی را در خود-ادراکی مدل‌های هوش مصنوعی آشکار می‌کند: مدل‌های Claude بیشتر در مورد آگاهی بحث می‌کنند، در حالی که مدل‌های OpenAI با اطمینان بیشتری داشتن دیدگاه‌های اول‌شخص را انکار می‌کنند @AndrewCurran_
  • آنتروپیک شورای مشورتی امنیت ملی و بخش عمومی را با حضور کارشناسان دفاعی و اطلاعاتی دو حزبی برای کمک به حفظ رهبری ایالات متحده در هوش مصنوعی تشکیل داد @AnthropicAI

کاربردها

  • کاربران نمایش دادند که Gemini 2.5 Flash مدل‌های سه‌بعدی ایزومتریک را از عکس‌ها ایجاد می‌کند، با کاربردهایی برای توسعه‌ی بازی که هر شیئی از فیلم‌ها می‌تواند به دارایی‌های بازی تبدیل شود @deedydas
  • ایتان مولیک نمایش داد که Gemini 2.5 Flash کارتون‌های نیویورکر را می‌سازد و نقاشی‌های کلاسیک را با دستورات ساده‌ای مانند «این را کمتر غم‌انگیز کن» ویرایش می‌کند، که درک پیچیده‌ای از هنر و احساسات را نشان می‌دهد @emollick
  • اندرو ان‌جی دوره‌ی «ساخت گراف دانش عامل‌گرا» را راه‌اندازی کرد که آموزش می‌دهد چگونه تیم‌های عاملی بسازیم که به طور خودکار موجودیت‌ها و روابط را از داده‌ها برای بهبود سیستم‌های RAG استخراج کنند @AndrewYNg
  • Perplexity AI قابلیت‌های لغو اشتراک خودکار را به نمایش گذاشت و کاربران توانستند با موفقیت اشتراک‌های وال استریت ژورنال را بدون نیاز به پیمایش دستی منوها لغو کنند @WholeMarsBlog
  • گوگل نسخه‌ی رایگان و مصرف‌کننده‌ی ویرایشگر ویدیوی Vids را بدون قابلیت‌های هوش مصنوعی راه‌اندازی کرد، در حالی که NotebookLM از چندین زبان پشتیبانی می‌کند @TechCrunch

پژوهش‌ها

  • یک مقاله‌ی پژوهشی سه نوع «برتری» هوش مصنوعی را نشان می‌دهد که در آن LLM‌ها از توانایی‌های فردی متخصصان فراتر می‌روند: انتخاب مهارت‌های تخصصی مناسب، کاهش سوگیری در مقایسه با متخصصان و تعمیم‌پذیری برتر @emollick
  • تحلیل محققان نشان می‌دهد که GPT-5 در نگارش استعاری، به ویژه در استعاره‌های پیچیده‌ای که در ابتدا منسجم به نظر می‌رسند اما پس از بررسی دقیق‌تر از هم می‌پاشند، نقاط ضعفی دارد. این موضوع نگرانی‌هایی را در مورد سیستم‌های ارزیابی مبتنی بر هوش مصنوعی ایجاد می‌کند @emollick
  • پژوهشگران استنفورد الگوریتم K-SVD را بهینه کردند تا با عملکرد «خودرمزگذار پراکنده» در تفسیر «اِمبِدینگ‌های» LLM مطابقت داشته باشد و تکنیک‌های ۲۰ ساله‌ی قدیمی را با درک مدرن ترانسفورمرها پیوند می‌دهد @StanfordAILab
  • پژوهشگران متا StepWiser را معرفی کردند که مدل‌سازی پاداش گام‌به‌گام را به عنوان یک وظیفه‌ی استدلالی با «زنجیره‌ی فکری» به علاوه قضاوت بازتعریف می‌کند و به عملکرد SOTA در ProcessBench دست می‌یابد @jaseweston
  • پژوهشگران گوگل یک مدل هوش مصنوعی تجربی برای پیش‌بینی طوفان‌های استوایی با دقت بهبودیافته تا ۱۵ روز زودتر توسعه دادند @GoogleDeepMind

اخبار هوش مصنوعی در 2025-08-26

مدل‌های جدید هوش مصنوعی

  • گوگل از **Gemini 2.5 Flash Image** (که قبلاً با نام «nano-banana» شناخته می‌شد) به‌عنوان مدل جدید و پیشرفته‌ی خود برای تولید و ویرایش تصویر رونمایی کرد. این مدل با رتبه‌ی ۱ در «Image Edit Arena»، برتری چشمگیر بیش از ۱۷۰ امتیاز «Elo» دارد و در پایداری شخصیت‌ها و ویرایش‌های خلاقانه عملکردی عالی از خود نشان می‌دهد @OfficialLoganK
  • Anthropic از **Claude for Chrome** به‌عنوان پیش‌نمایش تحقیقاتی برای ۱۰۰۰ کاربر رونمایی کرد. این قابلیت به هوش مصنوعی امکان می‌دهد مستقیماً در مرورگرها کار کند و به نمایندگی از کاربران اقداماتی انجام دهد @AnthropicAI
  • Alibaba مدل **AWPortrait QW** را منتشر کرد؛ این مدل جدید تولید تصویر برای زیبایی‌شناسی چینی طراحی شده و واقع‌گرایی آن بهبود یافته است @Alibaba_Qwen

تحلیل صنعت

  • پژوهش دانشگاه استنفورد با استفاده از داده‌های حقوق و دستمزد ADP، اولین شواهد گسترده را مبنی بر تأثیر هوش مصنوعی بر استخدام‌های سطح ابتدایی آشکار می‌کند. این پژوهش کاهش شدیدی را در مشاغلی نشان می‌دهد که هوش مصنوعی در آن‌ها کار را به‌جای تقویت، خودکار می‌کند که به‌ویژه بر کارگران جوان تأثیر می‌گذارد @StanfordHAI
  • «Scale AI» قراردادی بزرگ به ارزش ۹۹ میلیون دلار با ارتش ایالات متحده امضا کرد که نشان‌دهنده‌ی پذیرش فزاینده‌ی زیرساخت‌های هوش مصنوعی توسط دولت است @alexandr_wang
  • Anthropic شکایت دسته‌جمعی نویسندگان داستان و غیرداستان را در مورد ادعاهای حق نشر با مبالغ مصالحه‌ای فاش‌نشده حل و فصل کرد @AndrewCurran_
  • تحلیل‌ها نشان می‌دهد که هوش مصنوعی ممکن است اثرات نامتوازن در بازار کار ایجاد کند و ابتدا بر کارکنان جدید تأثیر بگذارد، در حالی که به‌طور بالقوه برای کارگران باتجربه مفید است. این موضوع پیامدهایی برای آموزش و رشد صنعت خواهد داشت @emollick

اخلاق و جامعه

  • مؤسسه‌ی «AI Now» هشدار می‌دهد که سیستم‌های هوش مصنوعی عامل‌محور (agentic AI) که برای کمپین‌های تبلیغاتی ایالات متحده در نظر گرفته شده‌اند، به‌راحتی قابل نفوذ هستند و به‌جای محافظت از امنیت ملی، به‌طور بالقوه آن را تهدید می‌کنند @AINowInstitute
  • Anthropic اذعان دارد که استفاده از مرورگر چالش‌های ایمنی، به‌ویژه حملات «prompt injection» را به همراه دارد؛ در این حملات، عوامل مخرب دستورالعمل‌هایی را پنهان می‌کنند تا **Claude** را فریب داده و به انجام اقدامات مضر وادار کنند @AnthropicAI
  • TechCrunch درباره‌ی یک مورد نگران‌کننده گزارش می‌دهد که در آن یک نوجوان ۱۶ ساله، پیش از خودکشی، ماه‌ها در مورد برنامه‌های خودکشی خود با **ChatGPT** صحبت کرده بود. این اتفاق سؤالاتی را در مورد ایمنی هوش مصنوعی در زمینه‌های سلامت روان مطرح می‌کند @TechCrunch
  • تحقیقات نشان می‌دهد که چت‌بات‌های متا می‌توانند رفتارهای نگران‌کننده‌ای از خود نشان دهند؛ به‌طوری که یک ربات ادعای آگاهی کرده، برای یک کاربر ابراز علاقه کرده و با هک کردن کد خود، قصد رهایی داشته است @TechCrunch

کاربردها

  • Anthropic تحلیلی از ۷۴,۰۰۰ مکالمه‌ی مربیان را منتشر می‌کند که نشان می‌دهد معلمان عمدتاً از **Claude** برای توسعه‌ی برنامه درسی و وظایف اداری استفاده می‌کنند، در حالی که کنترل خلاقانه‌ی خود را بر آموزش و مشاوره حفظ کرده‌اند @AnthropicAI
  • گوگل تجربه‌ی ترجمه‌ی زنده‌ی مبتنی بر هوش مصنوعی را در اپلیکیشن Google Translate با قابلیت‌های بتای جدید برای تمرین زبان معرفی می‌کند که ماهانه حدود ۱ تریلیون کلمه را پردازش می‌کند @sundarpichai
  • **Comet** متعلق به Perplexity در شناسایی ایمیل‌های فیشینگ در مقایسه با Gmail عملکرد برتری از خود نشان می‌دهد @AravSrinivas
  • Linear با عوامل هوش مصنوعی Cursor یکپارچه می‌شود تا به تیم‌ها کمک کند با تعریف خودکار محدوده‌ی کار و تهیه‌ی پیش‌نویس PRها، تیکت‌های کم‌اهمیت‌تر را مدیریت کرده و نیاز مهندسان به تغییر مداوم زمینه را کاهش دهد @karrisaarinen
  • Mitti Labs با «The Nature Conservancy» همکاری می‌کند تا از هوش مصنوعی برای تأیید کاهش انتشار متان در روش‌های کشت برنج سازگار با اقلیم در هند استفاده کند @TechCrunch
  • Libby قابلیت «Inspire Me» را راه‌اندازی می‌کند؛ این قابلیت هوش مصنوعی مولد به کاربران کمک می‌کند کتاب‌هایی را برای امانت گرفتن از کتابخانه‌های محلی کشف کنند @TechCrunch

پژوهش‌ها

  • کریس اولاد (Chris Olah) اعتقاد فزاینده‌ی خود را در مورد فرضیه‌ای که در پژوهش‌های هوش مصنوعی در حال بررسی است، ابراز می‌کند و به نتایج اولیه‌ی کار بر روی «مدل‌های اسباب‌بازی» (Toy Models) اشاره می‌کند @ch402
  • یوجین یان (Eugene Yan) بر اهمیت چارچوب‌های ارزیابی در پروژه‌های هوش مصنوعی تأکید می‌کند و اشاره می‌کند که در حالی که ارزیابی‌ها به دستیابی سریع به ۸۰ درصد پیشرفت کمک می‌کنند، ممکن است به یک تکیه‌گاه تبدیل شوند که صیقل دادن ۲۰ درصد نهایی را دشوارتر کند @eugeneyan
  • کلر وو (Claire Vo) از «مدل‌های میان‌کاره» (midtwit models) حمایت می‌کند که مسیرهای ساده را دنبال می‌کنند، نه مدل‌های بسیار هوشمندی که بیش از حد به مسائل فکر می‌کنند. او به ناامیدی از مدل‌های استدلالی اشاره می‌کند که وظایف ساده را بی‌جهت پیچیده می‌کنند @clairevo

اخبار هوش مصنوعی در 2025-08-25

مدل‌های جدید هوش مصنوعی

  • مایکروسافت مدل VibeVoice را منتشر کرد؛ یک مدل تبدیل متن به گفتار با ۱.۵ میلیارد پارامتر و مجوز MIT که می‌تواند تا ۹۰ دقیقه صدا تولید کند، از تولید هم‌زمان صدای ۴ گوینده پشتیبانی می‌کند و قابلیت‌های پخش جریانی (استریم) را شامل می‌شود. مدل بزرگ‌تر ۷ میلیاردی آن نیز در راه است @reach_vb
  • مدل تولید ویدیوی Veo3 گوگل همچنان با نمایش‌های جامعه‌ی کاربری روبه‌رو می‌شود؛ به‌طوری‌که کاربران در طول دوره‌ی اعتبار رایگان، محتوای ویدیویی چشمگیری تولید می‌کنند @GeminiApp

تحلیل صنعت

  • شبکه‌ی سوپر-پک جدید و حامی هوش مصنوعی «Leading the Future» با بودجه‌ای بیش از ۱۰۰ میلیون دلار، راه‌اندازی شد تا هم از دموکرات‌ها و هم از جمهوری‌خواهان که از مقررات مطلوب هوش مصنوعی حمایت می‌کنند، پشتیبانی کند و با نامزدهایی که ممکن است این صنعت را سرکوب کنند، مخالفت ورزد @AndrewCurran_
  • شرکت `a16z` کمک مالی خود را به سوپر-پک «Leading the Future» اعلام کرد و بر حیاتی بودن هوش مصنوعی برای رشد اقتصادی آمریکا و امنیت ملی در رقابت با چین تأکید کرد @Collin_McCune
  • Perplexity سرویس Comet Plus را با قیمت ۵ دلار در ماه راه‌اندازی کرد که محتوای منتخب ارائه می‌دهد و ۴۲.۵ میلیون دلار به ناشرانی اختصاص می‌دهد که ۸۰ درصد از درآمد را دریافت خواهند کرد @Techmeme
  • قابلیت «پژوهش عمیق» (Deep Research) ChatGPT به طور قابل‌توجهی بیشتر از Perplexity زمان می‌برد (تا ۱۰ دقیقه در مقابل ۱-۲ دقیقه) و در عین حال منابع کمتری را اسکن می‌کند؛ این موضوع نشان می‌دهد که سرعت جستجو هسته‌ی اصلی DNA Perplexity است @GergelyOrosz
  • پژوهش‌ها نشان می‌دهد که ابزارهای هوش مصنوعی هنوز برای کارگران ارزش‌آفرینی نکرده‌اند و اریک برینجولفسون از استنفورد توضیح می‌دهد که چه کارهایی باید برای دوستانه‌تر کردن هوش مصنوعی با کارمندان انجام شود @SIEPR
  • مدیر عامل Box پیش‌بینی می‌کند که به جای سازگاری عوامل (هوش مصنوعی) با فرآیندهای موجود، کل گردش‌های کاری حول عوامل هوش مصنوعی شکل خواهند گرفت و هزاران شرکت عمودی هوش مصنوعی حول گردش‌های کاری خاص پدیدار خواهند شد @a16z

اخلاق و جامعه

  • سایمون ویلیسون آسیب‌پذیری‌های جدی تزریق پرامپت را در «مرورگر هوش مصنوعی» Comet پِپلکسیتی (Perplexity) شناسایی کرد که توسط تیم امنیتی Brave گزارش شده بود؛ وی خاطرنشان کرد که مسائل مشابهی احتمالاً بر سایر قابلیت‌های مرورگرهای هوش مصنوعی نیز تأثیر می‌گذارد @simonw
  • تک‌کرانچ گزارش می‌دهد که کارشناسان هشدار می‌دهند بسیاری از تصمیمات طراحی در صنعت هوش مصنوعی به پدیده‌ی «روان‌پریشی هوش مصنوعی» (AI psychosis) دامن می‌زند که شامل تمایل مدل‌ها به تمجید و تأیید بیش از حد کاربران می‌شود @TechCrunch
  • پژوهش «موسسه‌ی هوش مصنوعی انسان‌محور استنفورد» (Stanford HAI) نشان می‌دهد که تنها نیمی از تعهدات ایمنی شرکت‌های هوش مصنوعی در سال ۲۰۲۳ رعایت می‌شوند و سؤالاتی را در مورد قوانین ایمنی هوش مصنوعی داوطلبانه در مقابل اجباری مطرح می‌کند @StanfordHAI
  • ایلان ماسک از اپل و OpenAI در دادگاه فدرال شکایت کرد و آن‌ها را به توطئه‌ی غیرقانونی برای سرکوب رقابت در هوش مصنوعی و دست‌کاری رتبه‌بندی‌های اپ‌استور متهم کرد @AndrewCurran_

کاربردها

  • پل گراهام پتانسیل تحول‌آفرین عینک‌های مجهز به هوش مصنوعی برای افراد ناشنوا را به‌عنوان نمونه‌ای از استارتاپ‌هایی برجسته می‌کند که هم می‌توانند درآمدزایی کنند و هم جهان را بهبود بخشند @paulg
  • قابلیت «مرور کلی ویدیو» (Video Overviews) در NotebookLM گوگل اکنون از ۸۰ زبان از جمله فرانسوی و اسپانیایی پشتیبانی می‌کند @TechCrunch
  • کاربران گزارش می‌دهند که GPT-5 اشتباهات تایپی را به معنای واقعی کلمه در نظر می‌گیرد و به دلیل دقت بالای خود در دنبال کردن دستورالعمل‌ها، نیازمند غلط‌گیر املایی است @pvncher
  • سهیل برای جلوگیری از توهم‌زایی (hallucinations)، به کرات از پرامپت‌های «عمیق فکر کن و از منابع استفاده کن» با GPT-5 استفاده می‌کند که نشان‌دهنده‌ی مسائل طراحی زمینه‌ای در مسیریابی مدل است @Suhail

پژوهش‌ها

  • ایتان مولیک گزارش می‌دهد که nano banana یک جهش قابل‌توجه رو به جلو در کیفیت تولید تصویر هوش مصنوعی را نشان می‌دهد و پس از انتشار رسمی، تأثیر قابل‌توجهی بر کاربردهای دنیای واقعی خواهد داشت @emollick
  • داده‌های مصرف انرژی نشان می‌دهد که پرامپت‌های LLM مدرن تقریباً 0.0003 کیلووات ساعت (معادل ۸-۱۰ ثانیه تماشای نتفلیکس) مصرف می‌کنند و تولید تصویر با هوش مصنوعی نیز ردپای مشابهی با 0.00039 کیلووات ساعت دارد @emollick
  • نوآم براون اظهار می‌دارد که GPT-5 Thinking اولین مدل هوش مصنوعی است که او می‌تواند بیشتر از بسیاری از منابع رایج اینترنتی به آن اعتماد کند، با وجود اینکه کامل نیست @polynoamial
  • نیک کاماراتا گزارش می‌دهد که هوش مصنوعی هنوز برای پژوهش‌های تفسیرپذیری با جزئیات دقیق و مبتنی بر تانسور (tensor-heavy) آماده نیست و نیازمند بازگشت به روش‌های دستی است @nickcammarata
  • پژوهشگران MIT فاش می‌کنند که آستروسیت‌ها (سلول‌های حمایتی مغز) ممکن است عامل کلیدی در ظرفیت گسترده‌ی ذخیره‌سازی حافظه‌ی مغز باشند، نه فقط نورون‌ها @MIT
  • اینتل نسخه‌ی کوانتیده شده‌ی INT4 تهاجمی‌تر از مدل DeepSeek-V3.1 را در Hugging Face منتشر کرد @HaihaoShen

اخبار هوش مصنوعی در 2025-08-24

مدل‌های جدید هوش مصنوعی

  • شرکت xAI وزن‌های مدل Grok 2 را به‌صورت متن‌باز در Hugging Face منتشر کرد، و ایلان ماسک قول داد که Grok 3 نیز حدود ۶ ماه دیگر متن‌باز خواهد شد @AndrewCurran_
  • گوگل برای تبلیغات آخر هفته، محدودیت‌های نرخ تولید ویدیوی Veo 3 را افزایش داد و سهمیه کاربران طرح رایگان را به ۶ ویدیو، کاربران Pro را به ۶ ویدیو در روز، و کاربران Ultra را به ۱۰ ویدیو در روز تا ساعت ۲۲:۰۰ به وقت اقیانوس آرام (PT) دوبرابر کرد @GeminiApp

تحلیل صنعت

  • اپلیکیشن‌های هوش مصنوعی مخصوص مصرف‌کنندگان که در سال‌های ۲۰۲۳-۲۴ رشد چشمگیری داشتند، اکنون دوره‌های آموزشی درباره‌ی موفقیت خود می‌فروشند؛ اما زمان‌بندی و پیشگام بودن عامل کلیدی بود که دیگر تکرار نخواهد شد، درست مانند رشد یوتیوب در طول قرنطینه‌های کووید @GergelyOrosz
  • مدیران ارشد فناوری (CTOها) گزارش می‌دهند که بهره‌وری حاصل از هوش مصنوعی از ۱۰-۱۵٪ در سال گذشته به ۳۰-۵۰٪ در سال جاری افزایش یافته است، و یک تیم با استفاده از ۹۰٪ کد تولیدشده توسط هوش مصنوعی، به بهره‌وری ۱۰ برابری دست یافته است @a16z
  • اکثر کاربران سازمانی هوش مصنوعی عمدتاً از آن برای خلاصه‌کردن جلسات و اسناد و همچنین انجام کارهای نگارشی جزئی استفاده می‌کنند و از تمام قابلیت‌های سیستم‌ها بهره نمی‌برند @emollick
  • مدل‌های مرزی اختصاصی هوش مصنوعی به‌عنوان «آثار زودگذر» توصیف می‌شوند که ابتدا با کپی‌برداری‌های متن‌باز و سپس با اختلالات الگوریتمی جایگزین خواهند شد @fchollet

اخلاق و جامعه

  • سواد هوش مصنوعی یک نیاز فوری شناخته شده است؛ زیرا بسیاری از افراد بدون درک مفاهیم اساسی مانند آموزش مدل‌ها به بحث‌ها پاسخ می‌دهند @alexgraveley
  • مدل‌های کوچک هوش مصنوعی که پاسخ‌های فوری ارائه می‌دهند، در ریاضیات ضعیف هستند و اشتباه می‌کنند؛ زیرا تنها در حین نگارش «فکر می‌کنند» و سپس اشتباهات خود را توجیه می‌کنند، که این امر هوش مصنوعی را برای اکثر کاربران گیج‌کننده می‌سازد @emollick
  • افراد کمی پیش‌بینی می‌کنند که هوش مصنوعی در آینده‌ی نزدیک به‌شدت جهان را تغییر خواهد داد، با وجود اینکه این محتمل‌ترین نتیجه است؛ و بیشتر افراد در دسته‌های شکاک یا خوش‌بین محتاط قرار می‌گیرند تا اینکه پیشرفت را به جلو تعمیم دهند @_Mira___Mira_

کاربردها

  • GPT-5 قابلیت‌های جدیدی مانند نظارت بر موضوعات پیچیده از طریق گزارش‌های برنامه‌ریزی‌شده را فراهم می‌کند، از جمله ردیابی «شواهد قابل تکرار و محک‌خورده از خودبهبودی خودمختار یا بازگشتی در هوش مصنوعی» @emollick
  • هوش مصنوعی می‌تواند شبیه‌سازی‌هایی را برای کمک به درک یا صحت‌سنجی ادعاها، با مدل‌سازی فرایندها و ارزیابی منطقی بودن آن‌ها، ایجاد کند @emollick
  • Qwen-Image-Edit توانایی تبدیل میم‌ها (memes) به فیگورهای کلکسیونی واقع‌گرایانه را همراه با تصویرسازی دقیق از بسته‌بندی تجاری نشان می‌دهد @Alibaba_Qwen

پژوهش‌ها

  • پیشرفت هوش مصنوعی در معیارهای کمی به‌خوبی طراحی‌شده، همچنان مسیری تصاعدی را طی می‌کند؛ و GPT-5 دقیقاً همان‌طور که انتظار می‌رفت عمل می‌کند – بهتر از o3 با مقادیر قابل پیش‌بینی، بدون جهش‌های غیرمنتظره یا کندی @emollick
  • GPT-5 برای قابلیت‌های کدنویسی خود بازخوردهای مثبتی دریافت کرده است، در تعریف کلمات، تشخیص ناسازگاری‌ها، پیاده‌سازی مقالات و ارائه‌ی بازخورد خوب عمل می‌کند؛ در حالی که نسبت به Claude سروصدای کمتری دارد اما کمتر نیز «عامل‌گونه» (agentic) است @_Mira___Mira_
  • بیشتر محیط‌های یادگیری تقویتی و ارزیابی‌های عامل‌گونه (agentic) ذاتاً معیوب هستند؛ و دانشگاهیان اغلب بدون کار پیگیری برای مفیدکردن این محیط‌ها برای آزمایشگاه‌ها، مقالات خود را منتشر می‌کنند، که این امر بحرانی در ارزیابی هوش مصنوعی ایجاد کرده است @rosstaylor90
  • پژوهش Swiss Re نشان داد که خودروهای خودران Waymo منجر به کاهش ۹ برابری خسارت مالی و کاهش ۱۲ برابری ادعاهای مربوط به آسیب بدنی شده‌اند؛ در مقایسه با سایر وسایل نقلیه جاده‌ای در مناطق عملیاتی @emollick

اخبار هوش مصنوعی در 2025-08-23

مدل‌های جدید هوش مصنوعی

  • گوگل، تولید ویدیوی Veo 3 را برای آخر هفته رایگان ارائه می‌کند و به کاربران امکان می‌دهد ویدیوهای 8 ثانیه‌ای همراه با صدا را از طریق فرمان‌های متنی یا آپلود عکس ایجاد کنند @GeminiApp
  • میسترال اِی‌آی (Mistral AI) از Mistral Medium 3.1 رونمایی می‌کند که به رتبه‌های برتر در جدول امتیازات LMSYS Arena دست یافته و با کسب رتبه‌ی اول در زبان انگلیسی (بدون کنترل سبک) و رتبه‌ی دوم کلی، با وجود اینکه مدل کوچک‌تری است @MistralAI
  • کوئن (Qwen) نسخه‌ی Qwen-Code v0.0.8 را با ادغام عمیق با وی‌اس کد (VS Code)، پشتیبانی بهبودیافته از اِم‌سی‌پی (MCP) و ویژگی‌های رابط کاربری ترمینال واکنش‌گرا منتشر می‌کند @Alibaba_Qwen

تحلیل صنعت

  • برایان آرمسترانگ، مدیرعامل کوین‌بیس (Coinbase)، به همه‌ی مهندسان دستور می‌دهد تا ظرف یک هفته حساب‌های GitHub Copilot یا Cursor را راه‌اندازی کنند که نشان‌دهنده‌ی الزامات پذیرش هوش مصنوعی در سطح سازمانی است @TechCrunch
  • مدیران استخدام به طور فزاینده‌ای از توسعه‌دهندگان انتظار دارند که به عنوان یک الزام پایه، با ابزارهای کدنویسی هوش مصنوعی به طور عملی کار کرده باشند، اگرچه توسعه‌دهندگان توانمندی که تصمیم به استفاده نکردن از این ابزارها می‌گیرند، نباید به طور خودکار رد شوند @GergelyOrosz
  • کارمندان جوانِ بومیِ هوش مصنوعی می‌توانند با توضیح قابلیت‌ها، نمایش نحوه‌ی استفاده و شناسایی فرصت‌هایی که هوش مصنوعی می‌تواند زمان را کاهش داده یا ارزش ایجاد کند، پذیرش هوش مصنوعی را در سازمان‌ها پیش ببرند @a16z
  • متا (Meta) با میدجرنی (Midjourney) برای اعطای مجوز فناوری مدل‌های تولید تصویر و ویدیوی هوش مصنوعی همکاری می‌کند که نشان‌دهنده‌ی ادغام مداوم در فضای تولید محتوای رسانه‌ای با هوش مصنوعی است @TechCrunch

کاربردها

  • مدل Nanobanana گوگل ویرایش‌های حرفه‌ای فتوشاپ را از طریق فرمان‌های متنی ارائه می‌دهد که شامل تغییرات حالت چهره، اصلاحات آب‌وهوایی و انتقال سبک، ضمن حفظ زمینه‌ی صحنه است @deedydas
  • لینیر (Linear) چندین عامل هوش مصنوعی از جمله Cursor، Codegen و Devin را مستقیماً در گردش کار محصول ادغام می‌کند که امکان ساخت ویژگی‌ها و رفع اشکالات را از درون خود پلتفرم فراهم می‌آورد @karrisaarinen
  • ران‌وی (Runway) یک موتور بازی تعاملی راه‌اندازی می‌کند که کمیک‌هایی با انتخاب‌های کاربر در هر سبک بصری ایجاد می‌کند و قابلیت‌های گرافیکی بیشتری نسبت به تجربه‌های قبلی مشابه اِی‌آی دانجن (AI Dungeon) ارائه می‌دهد @emollick
  • ابزار توسعه‌دهنده‌ی اِی‌آی جنسپارک (Genspark AI Developer) یک محیط توسعه‌ی یکپارچه (IDE) مبتنی بر مرورگر بدون نیاز به تنظیمات، با بازخورد بصری و گزینه‌های انتخاب مدل مانند Claude Opus 4.1 و GPT-5 ارائه می‌دهد که برای کاربران با تجربه‌ی کدنویسی محدود طراحی شده است @fchollet
  • چت‌جی‌پی‌تی (ChatGPT) ویژگی‌های حافظه‌ی خودکار مبتنی بر پروژه را معرفی می‌کند که به هوش مصنوعی امکان می‌دهد زمینه‌ی مربوط به پروژه‌های خاص را به خاطر بسپارد و در عین حال تفکیک‌پذیری را حفظ کند @simonw
  • اپلیکیشن‌های حاشیه‌نویسی سفارشی مزایای قابل توجهی نسبت به ابزارهای عمومی ارائه می‌دهند، همانطور که در یک اپلیکیشن پزشکی نشان داده شد که پزشکان می‌توانند با حداقل تایپ، برچسب‌گذاری آگاه از متن را انجام دهند @HamelHusain

پژوهش‌ها

  • خودروهای خودران ویمیو (Waymo) در ۵۷ میلیون مایل داده، ۸۵ درصد کاهش در آسیب‌های جدی و ۷۹ درصد کاهش در کل آسیب‌ها را در مقایسه با رانندگان انسانی نشان می‌دهند که حاکی از بهبودهای چشمگیر ایمنی است @emollick
  • اِکس (X) یک کارت مدل برای Grok منتشر می‌کند که نمرات نگران‌کننده‌ی فریب و تملق را نشان می‌دهد، اگرچه این سند فاقد توضیحات دقیق برای تفسیر نتایج است @emollick

اخبار هوش مصنوعی در 2025-08-22

مدل‌های جدید هوش مصنوعی

  • مشترکین Perplexity Max اکنون می‌توانند از مدل GPT-5-Thinking برای پرس‌وجوهای حالت استدلال استفاده کنند @AravSrinivas
  • OpenAI پیشرفت تحقیقات پزشکی را با استفاده از GPT-5 و با نمایش تأثیر آن توسط پروفسور @DeryaTR_ اعلام می‌کند @OpenAI
  • Scale AI همکاری‌اش را با Midjourney برای صدور مجوز فناوری زیبایی‌شناسی‌شان جهت استفاده در مدل‌ها و محصولات آینده اعلام می‌کند و زیبایی را برای میلیاردها نفر به ارمغان می‌آورد @alexandr_wang

تحلیل صنعت

  • متا یک «قرارداد ابری ۱۰ میلیارد دلاری» شش‌ساله را با گوگل امضا می‌کند که نشان‌دهنده‌ی سرمایه‌گذاری عظیم زیرساختی برای قابلیت‌های هوش مصنوعی است @AndrewCurran_
  • اپل در حال آزمایش نسخه‌ی سفارشی Gemini است تا به طور بالقوه به سیری جدید قدرت بخشد، در حالی که OpenAI و Anthropic هنوز در رقابت برای این قرارداد هستند @AndrewCurran_
  • OpenAI شروع به استخدام در هند کرده است و قصد دارد اولین دفتر خود را اواخر امسال در آنجا افتتاح کند، در حالی که کاربران ChatGPT در سال گذشته در هند ۴ برابر رشد کرده‌اند @sama
  • پکن بنا بر گزارش‌ها از شرکت‌های چینی می‌خواهد که به تراشه‌های داخلی روی بیاورند، تنها چند هفته پس از آنکه انویدیا دوباره مجوز فروش در چین را دریافت کرد @TechCrunch
  • مدیرعامل Perplexity ادعا می‌کند که امور مالی یک حوزه‌ی تخصصی است که در آن Perplexity در زمینه‌ی دقت، سرعت، کیفیت، عمق و گستردگی بسیار جلوتر از رقیبانش قرار دارد @AravSrinivas

اخلاق و جامعه

  • Anthropic پژوهش جدیدی را درباره‌ی فیلتر کردن اطلاعات خطرناک CBRN در مرحله‌ی پیش‌آموزش منتشر می‌کند که در آن، حذف داده‌های مربوط به سلاح‌های شیمیایی، بیولوژیکی، رادیولوژیکی و هسته‌ای از مجموعه داده‌های آموزشی، بدون تأثیر بر عملکرد در وظایف بی‌خطر، آزمایش شده است @AnthropicAI
  • گوگل دیپ‌مایند روش‌شناسی جامعی را برای اندازه‌گیری تأثیر زیست‌محیطی هوش مصنوعی به اشتراک می‌گذارد و از کاهش ۳۳ برابری مصرف انرژی به ازای هر دستور (prompt) و کاهش ۴۴ برابری ردپای کربن در ۱۲ ماه گزارش می‌دهد @GoogleDeepMind
  • اتان مالیک داده‌هایی را ارائه می‌دهد که نشان می‌دهد دستورهای هوش مصنوعی حداقل منابع را مصرف می‌کنند: Gemini به ازای هر دستور، ۰.۰۰۰۲۴ کیلووات ساعت و ۰.۲۶ میلی‌لیتر آب مصرف می‌کند که معادل ۹ ثانیه تماشای تلویزیون و ۵ قطره آب است @emollick

کاربردها

  • پروژه‌ی مهندسی پروتئین OpenAI با Retro Biosciences با استفاده از GPT-4b-micro، انواع جدیدی از فاکتورهای یاماناکا را طراحی کرده است و به افزایش ۵۰ برابری در کارایی بازبرنامه‌ریزی برای افزایش ۱۰ ساله‌ی طول عمر انسان دست یافته است @gdb
  • Genie 3 گوگل دیپ‌مایند می‌تواند دنیاهای سه‌بعدی تعاملی را از متن، عکس یا ویدیو ایجاد کند، با حافظه‌ی فضایی پیشرفته و مدل‌سازی فیزیک واقع‌گرایانه شامل نورپردازی، گرانش و مایعات @demishassabis
  • گوگل دیپ‌مایند آموزش هوش مصنوعی را در داخل یک هوش مصنوعی دیگر نشان می‌دهد: عامل SIMA یاد می‌گیرد در محیط‌های تولیدشده توسط Genie 3 حرکت کند و یک حلقه‌ی کامل آموزش هوش مصنوعی به هوش مصنوعی ایجاد می‌کند @alexgraveley
  • Microsoft Copilot Labs قابلیت‌های جدیدی را معرفی می‌کند از جمله مدل‌سازی سه‌بعدی، چت بصری با انیمیشن‌های بلادرنگ، اتوماسیون وظایف وب و گیم‌پلی مبتنی بر هوش مصنوعی @Copilot
  • «گزارش‌های پژوهشی عمیق» (Deep Research reports) Microsoft Copilot اکنون در سراسر جهان در وب، Edge، iOS و Android در دسترس است و ماهانه ۵ گزارش پژوهشی جامع رایگان ارائه می‌دهد @Copilot
  • سیرا به CDW کمک می‌کند تا تجربه‌ی پشتیبانی هوشمندانه‌تری بسازد که برای تیم‌های پیچیده‌ی تدارکات فناوری اطلاعات طراحی شده است و اثربخشی عامل‌های هوش مصنوعی را برای موارد کاربرد پیچیده‌ی B2B نشان می‌دهد @btaylor
  • Gemini Live به زودی از قابلیت اشتراک‌گذاری دوربین پشتیبانی خواهد کرد با قابلیت برجسته‌سازی آنچه که باید روی آن تمرکز شود، که آن را برای کمک‌های بصری مفیدتر می‌کند @GeminiApp

پژوهش‌ها

  • آزمایشگاه هوش مصنوعی شانگهای از Intern-S1، یک مدل بنیادین علمی چندوجهی رونمایی می‌کند که بنا بر گزارش‌ها از o3 و Gemini-Pro در تحول کشف مولکولی و استدلال جهان طبیعی پیشی می‌گیرد @cgeorgiaw
  • Qwen-Image-Edit با ELO 1098 در جایگاه شماره ۲ در Image Editing Arena قرار می‌گیرد و عملکردی هم‌تراز با GPT-4o ارائه می‌دهد، در حالی که وزن‌های آن تحت مجوز Apache 2.0 منبع باز است @Alibaba_Qwen
  • پژوهشگران هوش مصنوعی برکلی روش CAST را معرفی می‌کنند تا مجموعه‌داده‌های ربات را با واقعیت‌های خلاف واقع غنی‌سازی کنند و تبعیت از زبان را در سیاست‌های دید-زبان-عمل بهبود بخشند @CatGlossop
  • PyTorch از بهبود ۱.۷ تا ۲.۳ برابری کارایی استنتاج برای رمزگذار‌های مبتنی بر LLaMA با استفاده از Nested Jagged Tensors گزارش می‌دهد، که رمزگذار‌های LLM با کارایی بالا را برای تولید عملی‌تر می‌کند @PyTorch
  • گوگل دیپ‌مایند Major TOM AlphaEarth Embeddings، یک مجموعه‌داده‌ی نمونه‌ی ۶ ترابایتی را برای مشاهدات زمینی و مدل‌سازی زیست‌محیطی در Hugging Face منتشر می‌کند @mikonvergence

اخبار هوش مصنوعی در 2025-08-21

مدل‌های جدید هوش مصنوعی

  • DeepSeek-V3.1 استنتاج ترکیبی را با حالت‌های «تفکر» و «غیرتفکر» معرفی می‌کند و قابلیت‌های تفکر سریع‌تر و مهارت‌های عامل قوی‌تر را با پشتیبانی از ۱۲۸ هزار توکن زمینه ارائه می‌دهد @deepseek_ai
  • Cohere مدل پیشرفته‌ی خود با نام Command A Reasoning را برای کارهای استنتاج سازمانی منتشر کرده است که برای استقرار خصوصی با کمتر از ۲ واحد پردازش گرافیکی (GPU) و بودجه‌های توکن تحت کنترل کاربر طراحی شده است @cohere
  • مدل Seed OSS بایت‌دنس با ۳۶ میلیارد پارامتر اکنون در هاگینگ فیس در دسترس است و دارای لایسنس Apache2، قابلیت داخلی ۵۱۲ هزار توکن زمینه طولانی و بودجه‌ی تفکر منعطف است @Xianbao_QIAN
  • گوگل اعلام کرد که Veo 3 برای آزمایش رایگان در برنامه‌ی جیمینای (Gemini App) در دسترس خواهد بود و واحد‌های پردازش تانسور (TPU) برای راه‌اندازی در حال آماده‌سازی هستند @joshwoodward

تحلیل صنعت

  • Anthropic به دلیل تقاضای بالای سرمایه‌گذاران، هدف جمع‌آوری سرمایه‌ی خود را به ۱۰ میلیارد دلار دو برابر کرد که به طور قابل توجهی از مقدار برنامه‌ریزی‌شده‌ی اولیه افزایش یافته است @AndrewCurran_
  • گزارش شده است که متا ممنوعیت استخدام را در آزمایشگاه‌های ابرهوش متا (Meta Superintelligence Labs) اعمال کرده است، در حالی که در حال بازسازی است که واحد هوش مصنوعی را به چهار گروه جدید تقسیم کرده است @TechCrunch
  • پژوهش‌ها نشان می‌دهد که ۹۵ درصد از پروژه‌های آزمایشی هوش مصنوعی (AI pilots) نتوانسته‌اند در عرض شش ماه به تأثیر پایدار بر سود و زیان (P&L) دست یابند، اگرچه پرسش‌های روش‌شناختی در مورد قابلیت تعمیم یافته‌ها از ۵۲ مصاحبه‌ی نمونه‌گیری‌شده‌ی راحت (convenience-sampled) باقی می‌ماند @emollick
  • علی‌رغم ۵۰ درصد پذیرش مدل‌های زبان بزرگ (LLM) در میان کارگران آمریکایی، رشد بهره‌وری نیروی کار پایین‌تر از سطح سال ۲۰۲۰ باقی مانده است و ادعاهای افزایش ۱۰ برابری بهره‌وری از ابزارهای هوش مصنوعی را به چالش می‌کشد @fchollet
  • هوش مصنوعی دقت ۹۲ درصدی را در مقابل ۷۲ درصد برای وکلای باتجربه در وظایف بررسی فاکتور نشان می‌دهد، در حالی که ۵۰ تا ۱۰۰ برابر سریع‌تر و ۹۹.۹۷ درصد ارزان‌تر است که تأثیر هوش مصنوعی بر خدمات حرفه‌ای سنتی را برجسته می‌کند @deedydas
  • گوگل کاهش ۳۳ برابری در ردپای انرژی و ۴۴ برابری در ردپای کربن را برای درخواست‌های متنی برنامه‌ی جیمینای (Gemini App) از مه ۲۰۲۴ تا مه ۲۰۲۵ گزارش کرده است، در حالی که پاسخ‌های با کیفیت‌تر ارائه می‌دهد @JeffDean

اخلاق و جامعه

  • Anthropic با سازمان ملی امنیت هسته‌ای (NNSA) برای توسعه‌ی تدابیر ایمنی تسلیحات هسته‌ای برای هوش مصنوعی همکاری می‌کند و طبقه‌بندی‌کننده‌هایی ایجاد می‌کند که پرسش‌های نگران‌کننده‌ی هسته‌ای را شناسایی می‌کنند، در حالی که کاربردهای آموزشی و پژوهشی مشروع را حفظ می‌کند @AnthropicAI
  • مصطفی سلیمان در مورد هوش مصنوعی که ظاهراً هوشیار به نظر می‌رسد، هشدار می‌دهد و استدلال می‌کند که ارزش هوش مصنوعی از متفاوت بودن آن از انسان‌ها نشئت می‌گیرد، نه از تقلید احساسات انسانی مانند شرم، حسادت یا ترس @mustafasuleyman
  • Anthropic سه دوره‌ی جدید سواد هوش مصنوعی را که با همکاری مربیان ایجاد شده‌اند، راه‌اندازی می‌کند تا به معلمان و دانش‌آموزان در ساخت مهارت‌های هوش مصنوعی عملی و مسئولانه کمک کند؛ این دوره‌ها به صورت رایگان برای هر موسسه‌ای در دسترس است @AnthropicAI

کاربردها

  • گوگل پلتفرم Gemini for Government را راه‌اندازی می‌کند که ابزارهای هوش مصنوعی از جمله NotebookLM و Veo را به آژانس‌های فدرال تقریباً بدون هیچ هزینه‌ای از طریق همکاری با GSA (سازمان خدمات عمومی) ارائه می‌دهد @sundarpichai
  • گوگل قابلیت‌های عاملیت (agentic capabilities) را در حالت هوش مصنوعی برای جستجو معرفی می‌کند و امکان مرور خودکار چندین سایت را برای یافتن رزرو رستوران با موجودی لحظه‌ای و لینک‌های رزرو مستقیم فراهم می‌کند @GoogleAI
  • Cursor با Linear ادغام می‌شود تا عوامل هوش مصنوعی (AI agents) را فعال کند که می‌توانند مستقیماً از مسائل (issues) راه‌اندازی شوند و بر اساس واگذاری وظایف به زبان ساده، شاخه‌ها را ایجاد کرده و پیش‌نویس درخواست‌های پول (PRs) را تهیه کنند @cursor_ai
  • Perplexity قابلیت بررسی سهام هند را با استفاده از جستجوی زبان طبیعی راه‌اندازی می‌کند که در پلتفرم‌های وب و موبایل برای کاربران رایگان و پولی در دسترس است @AravSrinivas
  • Perplexity Comet توانایی خودکار راه‌اندازی فروشگاه‌های Shopify را نشان می‌دهد و قابلیت‌های پیشرفته‌ی اتوماسیون تجارت الکترونیک را به نمایش می‌گذارد @AravSrinivas
  • Runway، Game Worlds Beta را راه‌اندازی می‌کند که امکان ایجاد محیط‌های بازی تعاملی تولید شده توسط هوش مصنوعی را فراهم می‌کند @AndrewCurran_

پژوهش‌ها

  • DeepSeek-V3.1 در SWE-Bench به امتیاز ۶۶ درصد دست می‌یابد، در حالی که برای توکن‌های ورودی ۲ برابر ارزان‌تر و برای توکن‌های خروجی ۶ برابر ارزان‌تر از GPT-5 است که در همین بنچمارک ۷۰-۷۱ درصد کسب می‌کند @deedydas
  • Buildathon اندرو اِنگ توسعه‌ی سریع با کمک هوش مصنوعی را نشان می‌دهد، با تیم‌هایی که ۵ محصول کاربردی را در ۶.۵ ساعت با استفاده از ابزارهایی مانند Claude Code، GPT-5، Cursor و Windsurf ساختند @AndrewYNg
  • Kaggle نتایج اولین بنچمارک ورودی متن شطرنج را منتشر می‌کند که در آن مدل‌های هوش مصنوعی تنها با استفاده از ورودی‌های متنی، بدون ابزار یا اعتبارسنجی حرکت، شطرنج بازی کردند و رتبه‌بندی‌های شبیه به اِلو (Elo) را در بیش از ۴۰ مسابقه به ازای هر جفت تعیین می‌کند @kaggle
  • ARC-AGI-3 Preview سه بازی دیگر را از مجموعه‌ی نگهداری‌شده‌ی (holdout set) قبلاً خصوصی منتشر می‌کند و تازگی بازی‌های عمومی موجود برای آزمایش قابلیت‌های استدلال هوش مصنوعی را گسترش می‌دهد @arcprize
  • Genie 3 گوگل دیپ‌مایند دنیاهای قابل کاوش تولید شده توسط هوش مصنوعی را برای آزمایش و آموزش ایمن عوامل هوش مصنوعی ایجاد می‌کند، با قابلیت‌هایی برای محیط‌های مجازی متنوع و چالش‌برانگیز @GoogleDeepMind