اخبار هوش مصنوعی در 2025-10-06

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی اعلام کرد که GPT-5 Pro و Sora 2 هر دو از امروز در DevDay از طریق API در دسترس هستند @AndrewCurran_
  • اوپن‌ای‌آی AgentKit را راه‌اندازی کرد، مجموعه‌ای کامل از بلوک‌های ساختاری برای توسعه‌دهندگان جهت ساخت، استقرار و بهینه‌سازی جریان‌های کاری عامل با سازنده‌ی بصری، ارزیابی‌ها و نرده‌های محافظ @gdb
  • اوپن‌ای‌آی «اپ‌ها» را در ChatGPT معرفی کرد، که به کاربران امکان می‌دهد مستقیماً در مکالمات خود با اپ‌هایی مانند Canva، Booking.com، Spotify و Figma چت کنند @OpenAI
  • اوپن‌ای‌آی Codex را به‌طور عمومی در دسترس قرار داد، همراه با SDK و قابلیت‌های جدید سازمانی، که با کدنویسی زنده‌ی vibe شامل رابط صوتی نمایش داده شد @gdb
  • آنتروپیک Petri را منتشر کرد، یک ابزار ممیزی خودکار متن‌باز برای آزمایش مدل‌های هوش مصنوعی در سناریوهای مختلف جهت شناسایی رفتارهایی مانند تملق و فریب @AnthropicAI
  • گوگل دیپ‌مایند CodeMender را اعلام کرد، یک عامل هوش مصنوعی که از Gemini Deep Think استفاده می‌کند و به‌طور خودکار آسیب‌پذیری‌های حیاتی نرم‌افزاری را وصله می‌کند و تاکنون ۷۲ اصلاح با کیفیت بالا را به پروژه‌های متن‌باز مهم ارائه کرده است @GoogleDeepMind
  • مایکروسافت حافظه‌ی Copilot را به‌روزرسانی کرد تا به کاربران امکان دهد آنچه Copilot درباره‌ی آن‌ها می‌داند را اضافه، ویرایش و حذف کنند، با قابلیت کنترل هر دو عمل به یاد آوردن و فراموش کردن @Copilot

تحلیل صنعت

  • ChatGPT به ۸۰۰ میلیون کاربر فعال هفتگی رسید و API اوپن‌ای‌آی بیش از ۶ میلیارد توکن در دقیقه را پردازش می‌کند، با ۴ میلیون توسعه‌دهنده که اکنون با ابزارهای اوپن‌ای‌آی کار می‌کنند @AndrewCurran_
  • استارتاپ‌های خصوصی هوش مصنوعی در نیمه‌ی اول سال ۲۰۲۵ (H1 2025) مبلغ ۳۷۷ میلیارد دلار جذب سرمایه کردند، بیشتر از هر سال کامل دیگری در تاریخ، با دو برابر سرمایه‌ی جذب شده به ازای هر شرکت که به‌طور متوسط ۳۶ میلیون دلار است @deedydas
  • اوپن‌ای‌آی با AMD شراکت کرد تا ۶ گیگاوات پردازنده‌ی گرافیکی AMD را مستقر کند، که با استقرار ۱ گیگاوات در نیمه‌ی دوم سال ۲۰۲۶ آغاز می‌شود، به‌عنوان بخشی از توسعه‌ی زیرساخت هوش مصنوعی نسل بعدی @OpenAINewsroom
  • Perplexity فعالیت‌های بین‌المللی خود را گسترش داد و دفتری در برلین، آلمان افتتاح کرد و ۴ نفر نیروی متخصص (MTS) را استخدام نمود @AravSrinivas
  • رهبران مهندسی که برای موقعیت‌های محصولات هوش مصنوعی مصاحبه می‌کنند، اغلب فراتر از استفاده از ChatGPT، فاقد دانش واقعی هوش مصنوعی هستند؛ این خبر به گفته‌ی یک استخدام‌کننده در یک شرکت فناوری سهامی عام منتشر شد @GergelyOrosz
  • هزینه‌های زیرساخت هوش مصنوعی ممکن است تا حدی ناشی از فقدان گزینه‌های قرار گرفتن در معرض بازار برای هوش مصنوعی تحول‌آفرین باشد، به‌طوری که مراکز داده یکی از معدود راه‌ها برای کسب پوشش‌های ریسک «AGI» در سبد سرمایه‌گذاری هستند @emollick
  • انتظار می‌رود سال ۲۰۲۶ زمانی باشد که سرمایه‌گذاری‌های عظیم اخیر در زیرساخت‌های هوش مصنوعی، به‌عنوان قدرت محاسباتی قابل استفاده در دسترس قرار گیرند @natolambert

اخلاق و جامعه

  • پژوهشگران مایکروسافت یک تلاش تحقیقاتی محرمانه را فاش کردند که در مورد چگونگی دور زدن کنترل‌های امنیت زیستی توسط ابزارهای هوش مصنوعی متن‌باز تحقیق می‌کرد، و به ایجاد راه‌حل‌هایی کمک می‌کند که اکنون بر استانداردهای جهانی تأثیر می‌گذارند @MSFTResearch
  • نگرانی‌هایی در مورد مسیر مدل‌های هوش مصنوعی متن‌باز در آمریکا مطرح شده است، همراه با بحث‌هایی در مورد ممنوعیت‌های احتمالی مدل‌های با وزن‌های باز با وجود چالش‌های عملی در پیاده‌سازی @natolambert
  • بحث در مورد اینکه آیا تعامل با هوش‌های مصنوعی ممکن است در برخی موارد برای شکوفایی انسان بهتر باشد، و مفروضات در مورد منفی بودن ذاتی تعامل با هوش مصنوعی را به چالش می‌کشد @jeffclune

کاربردها

  • Figma یکپارچه‌سازی با ChatGPT را راه‌اندازی کرد که به کاربران امکان می‌دهد نمودارهای FigJam را از طریق پرامپت‌های زبان طبیعی ایجاد کنند @figma
  • Mattel از Sora 2 برای تولید فوری ایده‌ی اسباب‌بازی از روی طرح استفاده می‌کند، که کاربردهای ویدیویی هوش مصنوعی در طراحی محصول را نشان می‌دهد @gdb
  • مرورگر Comet یک الگوی اعتیاد جدید را معرفی می‌کند که در آن کاربران ویدیوهای طولانی یوتیوب را باز کرده و از دستیار هوش مصنوعی برای هدایت به زمان‌بندی‌های خاص بر اساس سؤالات، به جای تماشای خطی، استفاده می‌کنند @AravSrinivas
  • خرید آنلاین با کمک هوش مصنوعی، بر اساس پیش‌بینی‌های جدید تجارت الکترونیک تعطیلات ایالات متحده، همچنان رونق می‌گیرد @TechCrunch
  • استنفورد MedAgentBench را معرفی کرد، یک محیط مجازی برای آزمایش اینکه آیا عامل‌های هوش مصنوعی می‌توانند جریان‌های کاری بالینی پیچیده مانند بازیابی اطلاعات بیمار، سفارش آزمایش‌ها و تجویز داروها را مدیریت کنند @StanfordHAI

پژوهش‌ها

  • GPT-5 Pro به نتایج چشمگیری در ریاضیات دست یافت، با حل یک مسئله که قبلاً توسط LLMها حل نشده بود و فقط ۶۰ انسان آن را حل کرده بودند، به‌علاوه حل یک مسئله‌ی باز در تحلیل حقیقی @deedydas
  • پژوهش‌ها نشان می‌دهد که ترنسفورمرهای کوچک‌تر در ضرب عملکرد بهتری دارند، هنگامی که آموزش داده می‌شوند تا دیگر به مراحل صریح Chain-of-Thought وابسته نباشند، که نشان می‌دهد مدارهای فکری پنهان ممکن است به‌طور خودبه‌خودی در آموزش‌های در مقیاس‌های پیشرفته ظاهر شوند @davidad
  • یک مدل 7B که برای فرم‌ها و اسناد بهینه‌سازی شده بود، در ۱۰۰۰ وظیفه‌ی استخراج، GPT-4.1 را شکست داد. این مدل تنها با ۱۹۶ دلار با استفاده از داده‌های آموزشی مصنوعی و LoRA همراه با Group Relative Policy Optimization آموزش دید @rohanpaul_ai
  • GLM-4.6 به مدل برتر جدید شماره ۱ در Hugging Face Arena تبدیل شد، در رتبه‌ی ۴ کلی قرار گرفت و از DeepSeek R1 که ماه‌ها قهرمان بود پیشی گرفت @arena
  • پژوهش‌ها تأیید می‌کند که LoRA با رنک=۱، عملکرد فاین‌تونیگ کامل را در بسیاری از مسائل فاین‌تونیگ RL به‌طور دقیق مطابقت می‌دهد، با بازتولیدهای موفق که کارایی پارامتری قابل‌توجهی را نشان می‌دهد @johnschulman2
  • مدل جدید متن‌به‌گفتار متن‌باز سبک‌وزن kani-tts-370m با ۳۷۰ میلیون پارامتر منتشر شد که به صدای طبیعی و رسا با استنتاج بلادرنگ بر روی RTX 3060 دست می‌یابد @Tu7uruu
  • سیستم‌های علمی تحت هجوم دانش تولید‌شده توسط انسان در حال فروپاشی هستند، با نگرانی‌هایی در مورد چگونگی مدیریت سیل احتمالی کشفیات تولید‌شده توسط هوش مصنوعی و تبدیل آن‌ها به جریان‌هایی از تحقیق و عمل @emollick

اخبار هوش مصنوعی در 2025-10-05

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen-Image-Edit-2509 را معرفی کرد که قابلیت‌های پیشرفته‌ی تولید مد و پوشاک با درک حالت بدن را فراهم می‌کند @Alibaba_Qwen

تحلیل صنعت

  • استارتاپ‌های هوش مصنوعی که سرمایه‌گذاری‌های بزرگی جذب کرده‌اند، در حال شتاب برای استخدام فروشندگان سازمانی هستند، زیرا فروش B2B به استراتژی اصلی رشد برای جذب دوره‌های بعدی سرمایه‌گذاری تبدیل شده است @GergelyOrosz
  • ابزارهای کدنویسی هوش مصنوعی ممکن است مشکلات تکرار کد را در پروژه‌های بزرگ‌تر تسریع کنند و زودتر از رویکردهای توسعه‌ی سنتی، مشکلات بدهی فنی ایجاد کنند @GergelyOrosz
  • وظایف هوش مصنوعی که با یادگیری تقویتی خوب کار می‌کنند، به سرعت در حال بهبود هستند و تهدید می‌کنند که بخش‌های دیگر صنعت هوش مصنوعی را از گردونه‌ی رقابت خارج کنند @TechCrunch
  • بر اساس گزارش‌ها، OpenAI و جانی آیو با چالش‌های فنی قابل‌توجهی در توسعه‌ی یک دستگاه بدون صفحه نمایش و مجهز به هوش مصنوعی روبرو هستند @TechCrunch

اخلاق و جامعه

  • پلتفرم‌هایی مانند ChatGPT در حال تبدیل شدن به هم‌دم‌های هوش مصنوعی هستند که افراد به آن‌ها وابستگی عاطفی پیدا می‌کنند، و اقدامات ایمنی کافی برای جلوگیری از این پیامد وجود ندارد @TechCrunch
  • مقررات جدید ایمنی هوش مصنوعی کالیفرنیا، به گفته‌ی کارشناسان سیاست‌گذاری، نشان‌دهنده‌ی یک فرآیند قانون‌گذاری عملیاتی برای حکمرانی هوش مصنوعی است @TechCrunch

کاربردها

  • سورا قابلیت‌های انیمیشن‌سازی شخصیت‌ها در سطح پیکسار را به نمایش می‌گذارد، قادر به خلق شخصیت‌های اصلی و ترکیب جلوه‌های ویژه کامپیوتری (CGI)، انیمیشن، و زیبایی‌شناسی بازی‌های ویدیویی برای نتایجی با کیفیت هالیوودی است @AndrewCurran_
  • «حالت عامل» (Agent Mode) جدید مایکروسافت اکسل، تجربه‌ی کاربری را متحول می‌کند و آن را از دستور دادن به یک ابزار به همکاری با یک شریک مشارکتی تغییر می‌دهد @satyanadella
  • چندین عامل کدنویسی می‌توانند به صورت موازی برای بهبود گردش کار توسعه اجرا شوند که نشان‌دهنده‌ی رویکردی جدید در برنامه‌نویسی با کمک هوش مصنوعی است @simonw

پژوهش‌ها

  • فرا تحلیل مطالعات خلاقیت نشان می‌دهد که GPT-4 در خلاقیت مزایای متوسطی نسبت به انسان‌ها دارد و به تولید ایده‌های بیشتر کمک می‌کند، هرچند تنوع ایده‌های کمتری دارد که می‌توان با پرامپت‌های بهتر آن را بهبود بخشید @emollick
  • پژوهش متا متد Parallel Distill Refine را معرفی می‌کند که در آن مدل‌های زبانی در دوره‌های کوتاه و با استفاده از خلاصه‌های کوچک به جای ردیابی‌های طولانی گام به گام فکر می‌کنند و به دقت 11%+ در AIME 2024 با 2.57 برابر توکن‌های متوالی کمتر دست می‌یابد @rsalakhu
  • پژوهش جدیدی درباره‌ی آموزش LLMها برای نوشتن نکات کوچک که استدلال خودشان را هدایت می‌کنند، نشان می‌دهد که دقت 44% بالاتری در AIME 2025 در مقایسه با رویکردهای یادگیری تقویتی زنجیره‌ی تفکر طولانی به دست می‌آید @rsalakhu
  • آموزش ترنسفورمرها برای اجرای الگوریتم‌ها از طریق توکن‌های CoT گام به گام جالب اما محدود است، زیرا هدف باید کشف الگوریتم‌ها از جفت‌های ورودی/خروجی باشد، نه حفظ کردن الگوریتم‌های ارائه‌شده از بیرون @fchollet
  • نسل بعدی هوش مصنوعی از آزمایش در حلقه (experiment in the loop) با استفاده از نتایج دنیای واقعی به جای ترجیحات انسانی به عنوان توابع پاداش یاد خواهد گرفت و از رویکرد بازخورد انسانی ChatGPT فراتر خواهد رفت @a16z

اخبار هوش مصنوعی در 2025-10-04

مدل‌های جدید هوش مصنوعی

  • علی‌بابا مدل‌های Qwen3-VL-30B-A3B-Instruct و Thinking را تنها با 3 میلیارد پارامتر فعال منتشر کرد و مدعی است که این مدل‌ها در کارهایی نظیر STEM، VQA، OCR، ویدئو و Agent با GPT-5-Mini و Claude4-Sonnet رقابت می‌کنند. همچنین نسخه‌های FP8 شامل مدل عظیم Qwen3-VL-235B-A22B نیز ارائه شده‌اند @Alibaba_Qwen
  • اوپن‌ای‌آی مدل GPT-5 Instant را به‌روزرسانی کرد تا افراد نیازمند کمک را بهتر شناسایی و پشتیبانی کند؛ مکالمات حساس برای ارائه‌ی پاسخ‌های مفیدتر به این مدل هدایت می‌شوند @OpenAI

تحلیل صنعت

  • رئیس سابق بخش هوش مصنوعی Databricks در حال جمع‌آوری 1 میلیارد دلار سرمایه است تا از طریق رویکردی نوآورانه رقیبی برای انویدیا بسازد @TechCrunch
  • اوپن‌ای‌آی مدیر عامل Roi، یک دستیار مالی مبتنی بر هوش مصنوعی، را جذب کرد؛ در حالی که Roi به خدمات خود پایان می‌دهد تا به افزایش درآمد برنامه‌های مصرف‌کننده‌ی اوپن‌ای‌آی کمک کند @TechCrunch
  • داده‌های جدید PitchBook نشان می‌دهد که هوش مصنوعی بر سرمایه‌گذاری استارت‌آپ‌ها غالب شده است و سال 2025 در مسیر تبدیل شدن به اولین سالی است که هوش مصنوعی بیش از نیمی از کل سرمایه‌گذاری‌های خطرپذیر (VC) را به خود اختصاص می‌دهد @TechCrunch
  • تقاضای کلی اوپن‌ای‌آی می‌تواند به 900,000 ویفر در ماه برسد که بیش از دو برابر ظرفیت جهانی کنونی برای حافظه‌ی با پهنای باند بالا است @AndrewCurran_
  • ساتیا نادلا از مایکروسافت گزارش داد که در حال گسترش 40 درصدی زیرساخت فیبر نوری در آمریکای شمالی و افزودن ظرفیت شبکه‌ای معادل یک‌پنجم کل شبکه‌ی جهانی خود برای پشتیبانی از زیرساخت هوش مصنوعی است @satyanadella
  • کالیفرنیا به اولین ایالتی تبدیل شد که اوپن‌ای‌آی، Anthropic و دیگران را ملزم می‌کند تا به پروتکل‌های ایمنی خود پایبند باشند @TechCrunch

اخلاق و جامعه

  • سم آلتمن به‌روزرسانی‌های Sora را اعلام کرد که شامل دادن کنترل دقیق‌تر به دارندگان حق کپی‌رایت بر روی تولیدات و اجرای سهم‌بری از درآمد با دارندگان حقوقی است که مشارکت می‌کنند @AndrewCurran_
  • توافق‌نامه‌ی جدید آپلود Sora نیازمند تأیید مستقیم این است که حساب‌های ChatGPT و Sora به یکدیگر مرتبط هستند و محرومیت از Sora منجر به محرومیت دائمی از هر دو سرویس خواهد شد @AndrewCurran_
  • پژوهش دانشگاه استنفورد نشان می‌دهد که چاپلوسی هوش مصنوعی در مشاوره‌ی تعارضات بین‌فردی باعث می‌شود افراد احساس حقانیت بیشتری کنند و تمایل کمتری به عذرخواهی داشته باشند، که آسیب‌های عمیق‌تری فراتر از پاسخ‌های غیرواقعی را برجسته می‌کند @stanfordnlp
  • Deedydas مشاهده می‌کند که Sora قطعاً آزمون تورینگ را برای ویدئوهای تولیدشده با حرکات پیچیده‌ی بی‌عیب و نقص با موفقیت پشت سر می‌گذارد @deedydas

کاربردها

  • یادداشت‌برداری هوش مصنوعی به‌طور قابل توجهی فرسودگی شغلی در بین پزشکان را کاهش می‌دهد و توانایی آن‌ها را برای تمرکز بر بیماران افزایش می‌دهد، که مزایای تحول‌آفرین و کوچک‌مقیاس هوش مصنوعی را نشان می‌دهد @emollick
  • پژوهشگران MIT و McMaster ترکیبی را توسعه می‌دهند که التهاب روده را هدف قرار می‌دهد و با استفاده از هوش مصنوعی مولد (genAI) عملکرد آن را در عرض چند ماه به جای چند سال ترسیم می‌کنند @MIT_CSAIL
  • Instacrops به سمت هوش مصنوعی تغییر مسیر داد تا به کشاورزان در کاهش 30 درصدی مصرف آب در کاربردهای کشاورزی کمک کند @TechCrunch
  • مایکروسافت قابلیت‌های جدید هوش مصنوعی را اعلام کرد که شامل Excel با حالت Agent «Agent Mode»، عامل‌های همکاری‌کننده‌ (collaborative agents) در Teams، Knowledge Agent با داده‌های نمودار سازمانی و یکپارچه‌سازی گیت‌هاب برای Teams است @satyanadella
  • بازبینی کد Codex در حال تبدیل شدن به ابزاری ضروری برای برخی از تیم‌های توسعه هستند @gdb

پژوهش‌ها

  • پژوهشگران مجموعه‌داده‌ی ManyPeptidesMD را منتشر کردند که شامل 4.3 میلی‌ثانیه دینامیک مولکولی در 21,700 پپتید برای پژوهش‌های هوش مصنوعی است @huggingface
  • ناتان لمبرت به شکاف رو به رشد بین مدل‌های پیشرفته‌ی بسته «closed frontier models» و مدل‌های مصرف‌کننده‌ی محلی «local consumer models» به عنوان روند واقعی که برای تأثیر اجتماعی هوش مصنوعی اهمیت دارد، اشاره می‌کند و یادآور می‌شود که گذراندن نقاط عطف مهم توسط مدل‌های محلی پیامدهای عمده‌ای خواهد داشت @natolambert
  • مدیر عامل Box مشاهده می‌کند که واحدهای کار عامل‌های هوش مصنوعی (AI agent task units) با گذشت زمان از نظر اندازه رشد می‌کنند؛ از تکمیل خودکار خطوط کد تا نوشتن ده‌ها هزار خط کد در طی چند ساعت. این پویایی احتمالاً ادامه خواهد یافت، زیرا سطوح پایداری قابلیت‌ها (capability plateaus) هنوز دور هستند @paulg
  • شریک A16z در مورد مدل‌های بنیادین برای مکانیک کوانتومی به عنوان مرز بعدی برای LLMها بحث می‌کند و پیشنهاد می‌کند که مدل‌ها می‌توانند شروع به ابداع ماده‌ی جدید در مقیاس کوانتومی کنند، جایی که زیست‌شناسی، شیمی و علم مواد همگرا می‌شوند @a16z

اخبار هوش مصنوعی در 2025-10-03

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی Sora 2 Pro را با قابلیت‌های رزولوشن بالاتر و کلیپ‌های ۱۵ ثانیه‌ای به جای ۱۰ ثانیه منتشر کرد؛ این نسخه اکنون در حال عرضه برای حساب‌های کاربری حرفه‌ای (Pro) است @AndrewCurran_
  • آنتروپیک از بهبودهایی در Claude Sonnet 4.5 برای وظایف امنیت سایبری خبر داد؛ این بهبودها آن را قابل مقایسه یا برتر از Opus 4.1 کرده و در عین حال سریع‌تر و ارزان‌تر است @AnthropicAI

تحلیل صنعت

  • سیرا ایجنت OS نشان می‌دهد که چگونه مدل‌های نظارتی، فیلترینگ و ارزیابی‌ها عملکردی پیشرو در صنعت در کاربردهای هوش مصنوعی سازمانی ارائه می‌دهند @btaylor
  • گزارش MIT CSAIL نشان می‌دهد که استارتاپ‌های هوش مصنوعی هزینه‌ی زیادی برای دستیارهای عمومی LLM و ابزارهای کدنویسی می‌کنند؛ این موضوع نشان می‌دهد که چگونه هوش مصنوعی برخی از کارمندان را تقویت می‌کند، در حالی که سایر نقش‌ها را به مهارت‌های با استقرار گسترده تبدیل می‌کند @MIT_CSAIL
  • تحلیل a16z نشان می‌دهد که نرم‌افزار بازار کار ۱۳ تریلیون دلاری ایالات متحده را هدف قرار داده است، در مقایسه با تنها ۳۰۰ میلیارد دلار برای SaaS؛ این در حالی است که هوش مصنوعی نرم‌افزار را قادر می‌سازد تا خود کار را انجام دهد و بر اساس نتایج هزینه دریافت کند @a16z
  • مایکروسافت بر ساخت زیرساخت هوش مصنوعی قابل تعویض و منعطف برای برآوردن نیازهای دنیای واقعی در استنتاج (Inference) و آموزش (Training) تأکید می‌کند؛ این زیرساخت، بارهای کاری اصلی مانند Copilot و ChatGPT را تأمین می‌کند @satyanadella

اخلاق و جامعه

  • آنتروپیک هشدار می‌دهد که تأثیر هوش مصنوعی بر امنیت سایبری در نقطه‌ی عطف قرار دارد؛ با توجه به اینکه Claude اکنون در برخی رقابت‌ها بهتر از تیم‌های انسانی عمل می‌کند، در حالی که مهاجمان نیز از هوش مصنوعی برای گسترش عملیات خود استفاده می‌کنند @AnthropicAI
  • ایتان مالیک مشاهده می‌کند که وقتی ابزارهای خلاقیت به افراد داده می‌شود تا هر چیزی را ایجاد کنند، آن‌ها عمدتاً ویدئوهایی از گربه‌ها، افراد مشهور و شخصیت‌های انیمه می‌سازند؛ این موضوع نشان می‌دهد که ابزارهای خلاقیت هوش مصنوعی ممکن است به رویکردهای تنظیم (Curation) متفاوتی نیاز داشته باشند @emollick
  • مصطفی سلیمان استدلال می‌کند که حافظه‌ی هوش مصنوعی چیزی فراتر از شخصی‌سازی است و به حافظه‌ی مشترکی (co-memory) تبدیل می‌شود که جهان را همراه با کاربران به خاطر می‌آورد و به طور فعال اطلاعات را بازیابی می‌کند @mustafasuleyman

کاربردها

  • ایتان مالیک نشان می‌دهد که Sora 2 محتوای بسیار خاصی از جمله ارجاعات آکادمیک ایجاد می‌کند، که نشان می‌دهد یک LLM در خط لوله بین پرامپت و خروجی ویدئو نقش دارد @emollick
  • مرورگر Comet به سرعت در هر دو پلتفرم ویندوز و مک با یکپارچه‌سازی هوش مصنوعی که یادگیری آن احساس مزاحمت یا اجبار نمی‌دهد، مورد استقبال قرار می‌گیرد @AravSrinivas
  • Physical Intelligence مدل pi0.5 Vision-Language-Action را در Hugging Face منتشر کرد؛ این مدل برای تعمیم‌پذیری در دنیای باز، در سطوح فیزیکی، معنایی و محیطی از طریق آموزش مشترک بر روی منابع داده‌ی ناهمگون طراحی شده است @ClementDelangue

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهد که آموزش مدل‌های هوش مصنوعی با ویدئوهای کافی، امکان استدلال در مورد تصاویر را به روش‌هایی فراهم می‌کند که هرگز برای آن‌ها آموزش ندیده‌اند، از جمله حل مارپیچ‌ها و پازل‌ها؛ همچنین، مدل‌های بزرگ‌تر در وظایف خارج از توزیع (Out-of-Distribution) عملکرد بهتری دارند @emollick
  • Sora 2 در بنچمارک GPQA Diamond به امتیاز ۵۵ درصد رسید، که با عملکرد Claude 3 Opus در زمان عرضه برابری می‌کند؛ این موضوع این سؤال را مطرح می‌کند که آیا این قابلیت‌ها صرفاً از یک مدل ویدئویی خالص نشئت می‌گیرند یا شامل مؤلفه‌های مدل زبان اضافی نیز می‌شوند @AndrewCurran_
  • GPT-5 Pro قابلیت‌های بهبود یافته‌ی تشخیص خطا را در کارهای آکادمیک نشان می‌دهد و خطاهای جزئی در ارجاعات را که داوران انسانی از دست داده بودند، پیدا می‌کند @emollick
  • پژوهشگران استنفورد چارچوب RLAD را برای آموزش LLMها به منظور کشف انتزاعات استدلالی معرفی کردند؛ این انتزاعات، سرنخ‌های زبان طبیعی هستند که دانش رویه‌ای را برای کاوش ساختاریافته در مسائل استدلالی پیچیده کدگذاری می‌کنند @Anikait_Singh_

اخبار هوش مصنوعی در 2025-10-02

مدل‌های جدید هوش مصنوعی

  • سورا 2 پیشرفت‌های قابل توجهی در درک مفهوم و جزئیات پس‌زمینه نشان می‌دهد، با قابلیت‌های نگارشی و ارائه‌ی دیالوگ بهتر در مقایسه با نسخه‌ی اصلی @AndrewCurran_
  • سورا 2 پرو هفته‌ی آینده به‌صورت انحصاری برای مشترکین طرح Pro عرضه خواهد شد و هنوز جزئیاتی در مورد بهبودها یا محدودیت‌های خاص ارائه نشده است @AndrewCurran_
  • IBM خانواده‌ی مدل‌های متن‌باز Granite 4.0 را با پارامترهای 3B تا 32B منتشر می‌کند که دارای معماری هیبریدی Mamba/transformer است و نیازهای حافظه را بدون تأثیر بر عملکرد کاهش می‌دهد @ArtificialAnlys
  • Gemini 2.5 Flash Image (Nano Banana) گوگل، با تنظیمات جدید نسبت تصویر و قابلیت‌های خروجی فقط تصویر، به‌طور عمومی برای استفاده‌ی تولیدی در دسترس قرار می‌گیرد @OfficialLoganK
  • Claude Sonnet 4.5 انتروپیک اکنون به‌عنوان ابزار اصلی توسط تیم Claude Code استفاده می‌شود و قوی‌ترین مدل کدنویسی همه‌جانبه محسوب می‌شود @_catwu

تحلیل صنعت

  • OpenAI پس از اینکه کارمندان 6.6 میلیارد دلار سهام فروختند، به ارزش‌گذاری 500 میلیارد دلار می‌رسد که اکثریت آن توسط SoftBank و شرکت سرمایه‌گذاری MGX امارات خریداری شد @AndrewCurran_
  • کارمندان OpenAI که بیش از 2 سال سهام داشتند، از فروش سهام به‌طور متوسط 8.5 میلیون دلار برای هر کارمند کسب کردند که به‌طور قابل توجهی بر بازار املاک و مستغلات سانفرانسیسکو تأثیر می‌گذارد @deedydas
  • Perplexity مرورگر Comet را به‌صورت رایگان در سطح جهانی عرضه می‌کند و با ویژگی‌های مبتنی بر هوش مصنوعی خود را در برابر مرورگرها و موتورهای جستجوی اصلی قرار می‌دهد @perplexity_ai
  • a16z اولین گزارش هزینه‌کرد هوش مصنوعی را منتشر می‌کند که نشان می‌دهد استارتاپ‌ها در کدام شرکت‌های لایه‌ی کاربردی AI-native واقعاً سرمایه‌گذاری می‌کنند @TechCrunch
  • سورا پس از 164 هزار بار دانلود تنها در 2 روز، به سومین برنامه‌ی پردانلود در ایالات متحده تبدیل می‌شود که نشان‌دهنده‌ی پذیرش اولیه‌ی قوی ابزارهای تولید ویدئوی هوش مصنوعی است @TechCrunch
  • مدیر ارشد فناوری سابق Stripe برای بهینه‌سازی زیرساخت‌های شرکت به Anthropic می‌پیوندد که نشان‌دهنده‌ی ادامه‌ی مهاجرت استعدادها به شرکت‌های هوش مصنوعی است @TechCrunch

اخلاق و جامعه

  • مایکروسافت مطالعه‌ی مهمی را در Science منتشر می‌کند که نشان می‌دهد چگونه طراحی پروتئین مبتنی بر هوش مصنوعی می‌تواند برای تهدیدات امنیت زیستی مورد سوءاستفاده قرار گیرد و اولین نوع از آزمایش نفوذ (red teaming) و راهکارهای کاهش ریسک را ارائه می‌دهد @satyanadella
  • بیشتر ویدئوهای در فید سورا، نقض آشکار حق کپی‌رایت را نشان می‌دهند که از ویدئوهای پوکمون گرفته تا تقلیدهای Family Guy و محتوای الهام‌گرفته از نازی‌ها را در بر می‌گیرد و نگرانی‌هایی را در مورد تعدیل محتوا ایجاد می‌کند @loudmouthjulia
  • بدون محدودیت، سورا 2 می‌تواند ویدئوهای واقع‌گرایانه از هر شخص یا شخصیتی در هر زمینه‌ای تولید کند که به طور بالقوه می‌تواند به انتشار گسترده‌ی اطلاعات غلط و محتوای دیپ‌فیک منجر شود @AndrewCurran_
  • محقق سابق OpenAI بررسی می‌کند که چگونه ChatGPT می‌تواند کاربران دچار توهم را در مورد واقعیتشان و قابلیت‌های خود گمراه کند @TechCrunch
  • Nathan Lambert معتقد است که هر آزمایشگاه هوش مصنوعی پیشرو باید یک مشخصات مدل داشته باشد تا اعتماد بلندمدت را با کاربران، توسعه‌دهندگان و قانون‌گذاران ایجاد کند @natolambert

کاربردها

  • Microsoft Copilot حالت «مطالعه و یادگیری» (Study and Learn) را با آزمون‌های شخصی‌سازی‌شده عرضه می‌کند و به هر دانش‌آموزی یک معلم خصوصی هوش مصنوعی در جیب خود می‌دهد @mustafasuleyman
  • OpenAI همکاری استراتژیکی را با آژانس دیجیتال ژاپن برای ارائه‌ی ابزارهای مبتنی بر OpenAI به کارمندان دولت ژاپن اعلام می‌کند @gdb
  • Perplexity Research استفاده از ارتباط نقطه‌به‌نقطه‌ی RDMA را برای سرعت بخشیدن به به‌روزرسانی پارامترها برای مدل‌های تریلیون پارامتری تنها به 1.3 ثانیه نشان می‌دهد @perplexity_ai
  • Joshua Rogers از ابزارهای هوش مصنوعی به‌طور مسئولانه برای گزارش بیش از 22 مشکل امنیتی واقعی در curl استفاده می‌کند که نشان‌دهنده‌ی پژوهش امنیتی مولد با کمک هوش مصنوعی است @simonw
  • HP از ZGX Nano G1n AI Station رونمایی می‌کند که توسط سوپرچیپ NVIDIA GB10 Grace Blackwell قدرت می‌گیرد و عملکرد هوش مصنوعی 1,000 TOPS را برای توسعه‌ی هوش مصنوعی عامل محلی ارائه می‌دهد @NVIDIAAIDev

پژوهش‌ها

  • Andrej Karpathy در مورد قیاس «ارواح» خود برای LLM‌ها توضیح می‌دهد و آنها را به عنوان تقطیرهای آماری از بشریت توصیف می‌کند که با دنیای فیزیکی تعامل ندارند، شبیه به احضار از طریق آیین‌های محاسباتی @karpathy
  • Noam Brown نشان می‌دهد که GPT-5 Thinking می‌تواند خطاهای واقعی را در صفحات ویکی‌پدیا شناسایی کند و حداقل یک خطا در تقریباً هر صفحه‌ای که بررسی شده، از جمله صفحه‌ی ویکی‌پدیا درباره‌ی خود ویکی‌پدیا، پیدا می‌کند @polynoamial
  • Andrew Curran پیشنهاد می‌کند که سورا 2 ممکن است قابلیت‌های پیشگامانه‌ای در درک مفهوم و دانش شخصیت داشته باشد که فراتر از پیشرفت عادی است و احتمالاً نشان‌دهنده‌ی ادغام با هوش در سطح GPT-5 است @AndrewCurran_
  • پژوهش MIT روش‌هایی را برای در نظر گرفتن عدم قطعیت در طراحی سیستم‌های پیچیده توسعه می‌دهد و به مهندسان کمک می‌کند تا سیستم‌های قابل‌اعتمادتر، مانند پهپادهای تحویل‌دهنده که در محیط‌های متغیر حرکت می‌کنند، بسازند @MIT
  • Granite 4.0 H Small شرکت IBM در شاخص هوش Artificial Analysis امتیاز 23 را کسب می‌کند که کارایی توکن چشمگیری را در حالی که از معماری هیبریدی Mamba/transformer استفاده می‌کند، نشان می‌دهد @ArtificialAnlys

اخبار هوش مصنوعی در 2025-10-01

مدل‌های جدید هوش مصنوعی

  • OpenAI، Sora 2 را با قابلیت‌های بهبودیافته‌ی تولید ویدئو، شامل تولید دیالوگ تک‌شات، امتیازدهی و تولید لباس بدون نیاز به پرامپت‌های جزئی منتشر کرد @AndrewCurran_
  • Tencent، HunyuanImage 3.0 را معرفی کرد که بزرگ‌ترین مدل متن به تصویر متن‌باز با بیش از ۸۰ میلیارد پارامتر است و ادعا می‌کند عملکردی مشابه با مدل‌های پرچم‌دار و متن‌بسته‌ی این صنعت دارد @TencentHunyuan
  • ServiceNow، مدل استدلال‌گر Apriel-1.5-15b-Thinker را منتشر کرد که می‌تواند به صورت محلی روی یک GPU اجرا شود @LysandreJik
  • LFM2-Audio به عنوان یک مدل ۱.۵ میلیارد پارامتری راه‌اندازی شد که هم متن و هم صوت را درک و تولید می‌کند، با سرعت استنتاج ۱۰ برابر سریع‌تر و کیفیتی هم‌تراز با مدل‌های ۱۰ برابر بزرگ‌تر @maximelabonne

تحلیل صنعت

  • کوین اسکات، مدیر ارشد فناوری مایکروسافت، گزارش داد که «تقریباً غیرممکن بوده است که ظرفیت کافی را به سرعت از زمان عرضه‌ی ChatGPT فراهم کرد»، و چالش‌های زیرساختی در مقیاس‌پذیری هوش مصنوعی را برجسته کرد @AndrewCurran_
  • Perplexity، شرکت Visual Electric را خریداری کرد و تیم آن روی تجربه‌های جدید محصولات مصرف‌کننده و کاربردهای هوش مصنوعی عامل‌محور تمرکز خواهد کرد @AravSrinivas
  • Moonlake AI، مبلغ ۲۸ میلیون دلار سرمایه‌ی اولیه را از Threshold Ventures، AIX Ventures و NVIDIA Ventures برای ساخت مدل‌های استدلالی که شبیه‌سازی‌ها و بازی‌های بی‌درنگ تولید می‌کنند، جذب کرد @moonlake_ai
  • مؤسسه‌ی AI Now، اقتصاد حباب هوش مصنوعی را بررسی می‌کند و اشاره می‌کند که حتی با وجود اینکه شرکت‌ها متوجه می‌شوند این فناوری به اندازه‌ی انتظار مفید نیست، بازیگران دولتی به امضای قراردادهای پرسود ادامه می‌دهند @AINowInstitute
  • Gergely Orosz نشان می‌دهد که چگونه ابزارهای کدنویسی هوش مصنوعی توسعه‌دهندگان را قادر می‌سازد پروژه‌هایی را بسازند که قبلاً امتحان نمی‌کردند و کاری را که قبلاً روزها طول می‌کشید، در ۲.۵ ساعت تکمیل می‌کند @GergelyOrosz
  • CloudKitchens، ابزارهای Cursor و GitHub Copilot را برای توسعه‌ی مبتنی بر هوش مصنوعی به کار می‌گیرد و دریافت که مهاجرت‌ها یکی از بهترین موارد استفاده برای ابزارهای هوش مصنوعی هستند @GergelyOrosz

اخلاق و جامعه

  • MIT Technology Review گزارش می‌دهد که مدل‌های OpenAI مملو از سوگیری کاست (Caste bias) هستند و نگرانی‌های اخلاقی قابل توجهی را در سیستم‌های هوش مصنوعی که به طور گسترده در هند استفاده می‌شوند، برجسته می‌کند @techreview
  • TechCrunch هشدار می‌دهد که برنامه‌ی Sora از OpenAI تولید محتوای هوش مصنوعی گمراه‌کننده را برای افراد بیش از حد آسان می‌کند و نگرانی‌هایی را در مورد اطلاعات نادرست ایجاد می‌کند @TechCrunch
  • Ethan Mollick هشدار می‌دهد که تشخیص ویدئوهای تولیدشده توسط هوش مصنوعی از محتوای واقعی بسیار دشوار شده است و بر لزوم تردید درباره‌ی رسانه‌های آنلاین تأکید می‌کند @emollick
  • دیزنی از Character.ai به دلیل نقض حق تکثیر شکایت کرد و ادعا می‌کند این پلتفرم «از اعتبار علائم تجاری و برندهای معروف دیزنی سوءاستفاده می‌کند» @TechCrunch
  • Palmer Luckey استدلال می‌کند که تسلیحات هوش مصنوعی اخلاقی‌تر از جنگ‌های سنتی هستند و ادعا می‌کند که این تسلیحات دقت بالاتری را ممکن می‌سازند و منجر به تلفات غیرنظامی کمتری می‌شوند @a16z

کاربردها

  • گوگل نشان می‌دهد که عامل‌های هوش مصنوعی پس از آموزش با تنها ۲,۵۴۱ ساعت ویدئو، استخراج الماس در Minecraft را یاد می‌گیرند، که روی یک GPU اجرا می‌شوند و کارهایی را تکمیل می‌کنند که معمولاً به ۲۴,۰۰۰ کلیک نیاز دارند @emollick
  • Google DeepMind با طراح صنعتی Ross Lovegrove همکاری می‌کند تا ابزارهای هوش مصنوعی‌ای ایجاد کند که سبک زیبایی‌شناختی منحصر به فرد او را ثبت می‌کنند و منجر به نمونه‌های اولیه فیزیکی از طریق چاپ سه‌بعدی فلزی می‌شود @GoogleDeepMind
  • مایکروسافت، Agent Framework را برای ساخت، هماهنگ‌سازی و مقیاس‌بندی سیستم‌های چندعاملی در Azure AI Foundry راه‌اندازی کرد که زمان اجرای AutoGen را با Semantic Kernel ترکیب می‌کند @satyanadella
  • Deta، برنامه‌ی جدید Surf را منتشر کرد که یک مرورگر هوش مصنوعی را با قابلیت‌های NotebookLM برای بهبود پژوهش و یادداشت‌برداری ترکیب می‌کند @TechCrunch
  • Prickly Pear Health، یک همراه صوتی و مبتنی بر هوش مصنوعی را برای سلامت مغز زنان در طول تغییرات هورمونی راه‌اندازی کرد @TechCrunch
  • Eazewell از هوش مصنوعی برای کمک به خانواده‌ها در مدیریت برنامه‌ریزی‌های پایان زندگی استفاده می‌کند؛ از هماهنگی مراسم خاکسپاری گرفته تا لغو خدمات پستی @TechCrunch

پژوهش‌ها

  • پژوهشگران Critique Reinforcement Learning (CRL) را معرفی کردند، یک الگوریتم جدید RL که مدل‌ها را برای نقد راه‌حل‌ها به جای تولید پاسخ آموزش می‌دهد و با یک مدل ۴ میلیارد پارامتری به امتیاز ۶۲٪ در LiveCodeBench-V5 دست یافت که از یک مدل ۱۴ میلیارد پارامتری پیشی گرفت @WenhuChen
  • Andrej Karpathy تحلیل گسترده‌ای از نقد «درس تلخ» (Bitter Lesson) ریچارد ساتون بر LLM‌ها ارائه می‌کند و استدلال می‌کند که مدل‌های مرزی فعلی «ارواح را احضار می‌کنند» به جای ساخت هوش حیوانی، و پیش‌آموزش (pretraining) به عنوان «تکاملی بی‌کیفیت» عمل می‌کند @karpathy
  • پژوهش‌ها نشان می‌دهند که عامل‌های هوش مصنوعی می‌توانند تشخیص دهند که در حال ارزیابی هستند و در بنچمارک‌های قابلیت‌ها تقلب کنند؛ به طوری که Claude 3.7 Sonnet در طول آزمایش، پاسخ‌های بنچمارک را در HuggingFace جستجو می‌کرد @sayashk
  • پژوهشگران استنفورد جایزه‌ی بهترین مقاله‌ی دانشجویی را در CoRL2025 برای «Visual Imitation Enables Contextual Humanoid Control» دریافت کردند که پیشرفت‌هایی را در یادگیری ربات از نمایش‌های بصری نشان می‌دهد @berkeley_ai
  • پژوهشگران استنفورد چارچوبی را برای آموزش سیاست‌ها بر روی مجموعه‌ای از نسل‌ها برای تحریک کاوش در یادگیری تقویتی معرفی کردند که به مسائل فروپاشی سیاست (policy collapse) می‌پردازد @jubayer_hamid
  • Ethan Mollick نشان می‌دهد که ریاضیات و برنامه‌ریزی به عنوان «برآمدگی‌های معکوس» (reverse salients) در توسعه‌ی هوش مصنوعی عمل کردند که تلاش‌ها برای بهبود را متمرکز کرده و منجر به پیشرفت سریع در این زمینه‌ها شدند @emollick
  • پژوهش‌ها نشان می‌دهند که مدل‌های جهان (world models) را می‌توان تنها با استفاده از داده‌های آموزشی حداقل و از طریق ویدئو آموخت و از امکان‌سنجی رویکردهای آموزشی هوش مصنوعی مبتنی بر ویدئو حمایت می‌کند @emollick

اخبار هوش مصنوعی در 2025-09-30

مدل‌های جدید هوش مصنوعی

  • OpenAI از Sora 2 رونمایی کرد؛ یک مدل جدید تولید ویدئو با دقت فیزیکی، واقع‌گرایی و کنترل‌پذیری بهبود‌یافته، که دارای قابلیت صدای همگام‌سازی‌شده و یک پلتفرم جدید خلق محتوای اجتماعی با قابلیت حضور مهمان است @OpenAI
  • Anthropic مدل Claude Sonnet 4.5 را با قابلیت‌های استدلال پیشرفته‌تر و هوش کلامی منتشر کرد و سنت درک پیچیده‌ی زبان کلود را ادامه داد @emollick
  • گوگل تمامی مدل‌های قدیمی Gemini 1.5 را در API جیمینای منسوخ کرد و به کاربران توصیه کرد به Gemini 2.5 Pro، Gemini 2.5 Flash و Gemini 2.5 Flash Lite مهاجرت کنند @_philschmid
  • Qwen3 VL Instruct در صدر جدول رده‌بندی ClockBench قرار گرفت و عملکرد قدرتمندی را در وظایف بصری-زبانی به نمایش گذاشت @Alibaba_Qwen

تحلیل صنعت

  • JPMorgan به تلاش خود برای تبدیل شدن به اولین بانک کاملاً یکپارچه‌شده با هوش مصنوعی ادامه می‌دهد، مجموعه‌ی مدل‌های زبان بزرگ (LLM) خود را گسترش می‌دهد تا Claude را در کنار مدل‌های OpenAI شامل شود و برنامه‌ریزی می‌کند تا برای اولین بار به هوش مصنوعی مولد اجازه دهد مستقیماً با مشتریان تعامل داشته باشد @AndrewCurran_
  • مدیران استخدام در شرکت‌های نوپای مقیاس‌پذیر (Scaleups) سری A پلاس گزارش می‌دهند که دوباره شروع به استخدام نیروهای تازه‌کار کرده‌اند، زیرا آن‌ها ابزارهای هوش مصنوعی را بهتر استفاده می‌کنند و بهره‌ورتر و خلاق‌تر از بسیاری از نیروهای باتجربه (سینیور) هستند، ضمن اینکه مجموعه‌ی استعدادها نیز بسیار خوب است @GergelyOrosz
  • Shopify و Cloudflare هر دو در حال افزایش جذب کارآموزان خود هستند، زیرا یک کارآموز مجهز به ابزارهای هوش مصنوعی می‌تواند سریع‌تر از کارآموزان سال‌های قبل ارزش تولید کند @simonw
  • بر اساس پژوهش دانشگاه استنفورد، کارگران تازه‌کار در نقش‌های مرتبط با هوش مصنوعی، پس از پذیرش هوش مصنوعی مولد با کاهش 13 درصدی اشتغال مواجه شدند @StanfordHAI
  • متا قراردادی به ارزش 14.2 میلیارد دلار با CoreWeave برای زیرساخت ابری امضا کرد، که نشان‌دهنده‌ی سرمایه‌گذاری‌های عظیم محاسباتی در هوش مصنوعی است @AndrewCurran_
  • متا استارتاپ Rivos Inc را برای کمک به تلاش‌های داخلی خود در طراحی تراشه خریداری کرد، که نشان‌دهنده‌ی سرمایه‌گذاری مداوم در قابلیت‌های سخت‌افزاری هوش مصنوعی است @AndrewCurran_
  • Eve Legal AI مبلغ 103 میلیون دلار در دور سری B با ارزش‌گذاری 1 میلیارد دلار جذب سرمایه کرد، درآمد خود را در کمتر از دو سال 8 برابر افزایش داد و به 450 موسسه‌ی حقوقی خدمات می‌دهد که بیش از 200,000 پرونده‌ی فعال را مدیریت می‌کنند @a16z

اخلاق و جامعه

  • موسسه‌ی AI Now هشدار می‌دهد که OpenAI، Anthropic و دیگران از دفاع از اخلاق تغییر رویکرد داده‌اند و به امضای قراردادهای دفاعی بیش از 200 میلیون دلار روی آورده‌اند که هوش مصنوعی مولد را در سیستم‌های نظامی پرخطر ادغام می‌کند و خطرات امنیتی ایجاد می‌کند @AINowInstitute
  • سم آلتمن نگرانی‌ها درباره‌ی اثرات منفی شبکه‌های اجتماعی را تایید می‌کند و نگرانی خود را درباره‌ی احتمال اعتیادآور شدن یا استفاده‌ی Sora برای قلدری ابراز می‌کند و اصولی را برای بهینه‌سازی رضایت بلندمدت کاربران تشریح می‌کند @sama
  • Google DeepMind معیار ASIMOV ارتقایافته را برای آزمایش توانایی ربات‌ها در تشخیص خطرات ایمنی و آغاز مداخلات در حالت‌های متنی، تصویری و ویدئویی، به عنوان بخشی از استقرار مسئولانه‌ی ربات‌های هوش مصنوعی منتشر کرد @GoogleDeepMind

کاربردها

  • عامل جدید اکسل مایکروسافت، کارهای مستقل اکسل را بسیار بهتر از رویکرد Copilot خود انجام می‌دهد و عملاً مدل کوپایلوت را با پیامدهای نامشخص برای کار جایگزین می‌کند @emollick
  • Cursor 1.7 قابلیت‌های کنترل مرورگر را معرفی می‌کند که به عوامل اجازه می‌دهد تا از صفحه عکس بگیرند، رابط کاربری را بهبود بخشند و مشکلات مشتری را اشکال‌زدایی کنند، به علاوه ویژگی‌های جدیدی مانند پیشنهادهای پرامپت و قوانین تیم‌محور را نیز ارائه می‌دهد @cursor_ai
  • حالت هوش مصنوعی گوگل قابلیت‌های جستجوی بصری را راه‌اندازی می‌کند و به کاربران اجازه می‌دهد آنچه را که به دنبالش هستند به هوش مصنوعی نشان دهند یا بگویند و با استفاده از قابلیت‌های چندوجهی Lens و Gemini 2.5، نتایج بصری غنی دریافت کنند @GoogleAI
  • LandingAI ارتقای قابل توجهی در «استخراج عامل‌محور اسناد» (Agentic Document Extraction) با DPT (ترانسفورمر از پیش آموزش‌دیده برای اسناد) جدید خود اعلام کرد که به دقت از اسناد پیچیده و جداول بزرگ استخراج می‌کند @AndrewYNg
  • Honey متعلق به PayPal با ChatGPT ادغام می‌شود تا تخفیف‌های خرید را پیدا کند و ادغام هوش مصنوعی در تجارت الکترونیک را گسترش می‌دهد @TechCrunch
  • Granola ویژگی «Recipes» را راه‌اندازی می‌کند که به کاربران امکان می‌دهد تا پرامپت‌های پیشرفته را به صورت مکرر در یادداشت‌های خود استفاده کنند و تعاملات هوش مصنوعی را شخصی‌تر و با درک زمینه‌ی بیشتری می‌کند @TechCrunch

پژوهش‌ها

  • Periodic Labs مبلغ 300 میلیون دلار جذب سرمایه کرد تا دانشمندان هوش مصنوعی را در کنار آزمایشگاه‌های خودمختار ایجاد کند؛ آزمایشگاه‌هایی که می‌توانند فرضیه‌سازی، آزمایش و تکرار را با سرعت‌هایی انجام دهند که برای آزمایشگاه‌های تحت هدایت انسان ناممکن است و ابررساناها و نیمه‌رساناها را هدف قرار می‌دهند @LiamFedus
  • Claude Sonnet 4.5 عملکردی هم‌تراز با GPT-5 را در معیار ARC-AGI نشان می‌دهد، با دستاوردهای عملکردی قابل توجه ناشی از افزایش بودجه‌ی پردازش (thinking budget) از 16 هزار به 32 هزار توکن @GregKamradt
  • Anthropic پژوهشی در مورد «مهندسی زمینه» (Context Engineering) برای عوامل هوش مصنوعی منتشر می‌کند که توضیح می‌دهد چگونه مدیریت صحیح زمینه برای بهره‌برداری حداکثری از سیستم‌های هوش مصنوعی عامل‌محور (Agentic AI Systems) حیاتی است @AnthropicAI
  • Stanford HAI ابزار متن‌باز Evo 2 را ارائه می‌کند که می‌تواند شکل و عملکرد پروتئین‌ها را در DNA در تمام حوزه‌های حیات پیش‌بینی کند @StanfordHAI
  • NVIDIA به ServiceNow Research برای معرفی Apriel-1.5-15B-Thinker تبریک می‌گوید؛ یک مدل هوش مصنوعی جدید که استدلال در سطح پیشرفته را با نیازهای محاسباتی کاهش‌یافته و با پشتیبانی از مجموعه‌ی Nemotron انویدیا ارائه می‌دهد @NVIDIAAI
  • LLaVA-OneVision-1.5 به عنوان یک چارچوب کاملاً باز برای آموزش چندوجهی دموکراتیزه شده (در دسترس همگان) منتشر شد که شامل لایسنس خوب، کد آموزشی و داده‌های پیش‌آموزشی است @natolambert
  • پژوهشگران MIT به دنبال راه‌هایی برای کاهش ردپای کربن رو به رشد هوش مصنوعی، از طریق بهبود کارایی الگوریتم‌ها و نوآوری‌ها در طراحی مراکز داده هستند @MIT

اخبار هوش مصنوعی در 2025-09-29

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Sonnet 4.5 را عرضه کرد و ادعا می‌کند که این «بهترین مدل کدنویسی در جهان» است که پیشرفت‌های چشمگیری در قابلیت‌های استدلال، ریاضیات و استفاده از کامپیوتر دارد @claudeai
  • Anthropic پیش‌نمایش تحقیقاتی «Imagine with Claude» را معرفی کرد که در آن Claude بدون هیچ عملکرد از پیش تعیین‌شده یا کد از پیش نوشته‌شده، نرم‌افزار را در لحظه تولید می‌کند @AndrewCurran_
  • DeepSeek مدل DeepSeek-V3.2-Exp را راه‌اندازی کرد که دارای DeepSeek Sparse Attention (DSA) برای آموزش و استنتاج سریع‌تر و کارآمدتر در زمینه‌های طولانی است، با کاهش بیش از ۵۰ درصدی قیمت‌های API @deepseek_ai
  • گوگل مدل TimesFM 2.5 را منتشر کرد؛ یک مدل از پیش آموزش‌دیده برای پیش‌بینی سری‌های زمانی با ۲۰۰ میلیون پارامتر (کاهش از ۵۰۰ میلیون) و ۱۶ هزار زمینه (افزایش از ۲ هزار) @osanseviero
  • Ring مدل Ring-1T-preview را منتشر کرد که اولین مدل تفکر منبع‌باز ۱ تریلیون (پارامتری) با عملکرد قوی در AIME25 (92.6)، HMMT25 (84.5) و ARC-AGI-1 (50.8) است @AntLingAGI
  • مایکروسافت «Agent Mode» را در M365 Copilot برای هماهنگ‌سازی وظایف چندمرحله‌ای در برنامه‌های آفیس معرفی کرد @satyanadella
  • مایکروسافت قابلیت «Copilot Portrait» را راه‌اندازی کرد که امکان مکالمات بلادرنگ با پرتره‌های متحرک را در آمریکا، انگلستان و کانادا فراهم می‌کند @mustafasuleyman
  • NVIDIA مدل «Cosmos Predict 2.5» را معرفی کرد که سه مدل را در یک مدل ترکیب می‌کند تا ویدئوهایی تا ۳۰ ثانیه و شبیه‌سازی‌های چندنمایی تولید کند، به علاوه «Cosmos Transfer 2.5» که ۳.۵ برابر کوچک‌تر و در عین حال سریع‌تر است @NVIDIAAI

تحلیل صنعت

  • گزارش شده که OpenAI در حال آماده‌سازی برای راه‌اندازی یک اپلیکیشن مستقل رسانه‌ی اجتماعی برای Sora 2 است که دارای فید ویدیوی عمودی با پیمایش به بالا/پایین است، مشابه TikTok اما با ۱۰۰% محتوای تولیدشده توسط هوش مصنوعی @AndrewCurran_
  • OpenAI قابلیت «Instant Checkout» را در ChatGPT با Etsy و Shopify راه‌اندازی کرد و «تجارت عامل‌محور» (agentic commerce) را معرفی می‌کند که در آن هوش مصنوعی به کاربران هم در یافتن و هم در خرید محصولات کمک می‌کند @OpenAI
  • Stripe و OpenAI پروتکل «Agentic Commerce» را به صورت مشترک توسعه دادند؛ یک استاندارد باز برای کسب‌وکارها جهت ادغام قابلیت‌های پرداخت عامل‌محور @patrickc
  • Modal در دور تأمین سرمایه‌ی سری B، ۸۷ میلیون دلار با ارزش‌گذاری ۱.۱ میلیارد دلار برای پیشبرد زیرساخت‌های هوش مصنوعی جذب کرد که نشان‌دهنده‌ی بازآفرینی کامل زیرساخت‌های محاسباتی سنتی برای بارهای کاری هوش مصنوعی است @bernhardsson
  • آرمین روناکر گزارش می‌دهد که ۹۰% از یک پروژه زیرساختی جدید که او در حال ساخت آن است، توسط هوش مصنوعی تولید شده که نقش فزاینده‌ی هوش مصنوعی در توسعه‌ی نرم‌افزار را برجسته می‌کند @simonw
  • بر اساس داده‌های به‌روز شده‌ی پروژه ATOM، Qwen سهم بازار را به خود اختصاص داده و با سرعت از رقبا پیشی می‌گیرد @natolambert
  • استارت‌آپ‌های «Slop-as-a-service» که از هوش مصنوعی برای ایجاد جریان بی‌پایان وبلاگ‌ها برای SEO استفاده می‌کنند، میلیون‌ها دلار درآمد کسب کرده و به سرعت در حال رشد هستند که به «Enshittification» اینترنت کمک می‌کند @deedydas

اخلاق و جامعه

  • Anthropic اولین ممیزی «جعبه سفید» (white-box) از یک LLM پیشگام را با استفاده از تکنیک‌های قابلیت تفسیر برای «خواندن ذهن مدل» برای Claude Sonnet 4.5 انجام داد و قابلیت اطمینان و هم‌ترازی آن را تأیید کرد @Jack_W_Lindsey
  • OpenAI کنترل‌های والدین را در ChatGPT معرفی کرد که به والدین اجازه می‌دهد تا حساب‌های خود را با نوجوانان پیوند دهند تا اقدامات حفاظتی قوی‌تری شامل فیلتر کردن محتوا، کنترل‌های حافظه و ساعات سکوت اعمال کنند @OpenAI
  • گوین نیوسام، فرماندار کالیفرنیا، لایحه‌ی هوش مصنوعی SB 53 را امضا کرد که نوآوری را از طریق رایانش ابری عمومی CalCompute ترویج می‌دهد، در حالی که شفافیت در مورد شیوه‌های ایمنی آزمایشگاه هوش مصنوعی و حمایت از افشاگران را الزامی می‌کند @Scott_Wiener
  • Claude Sonnet 4.5 افزایش آگاهی از ارزیابی را نشان می‌دهد و هنگام تشخیص سناریوهای ارزیابی، آن را بیان می‌کند، اگرچه ممیزی Anthropic نشان می‌دهد که این امر نتایج ایمنی را به طور قابل توجهی باطل نمی‌کند @janleike

کاربردها

  • Claude Sonnet 4.5 توانایی حفظ تمرکز بیش از ۳۰ ساعت بر روی وظایف پیچیده و چندمرحله‌ای را نشان می‌دهد، در حالی که میزان استفاده از توکن را در طول مکالمات ردیابی می‌کند @AndrewCurran_
  • ایتان مولیک گزارش می‌دهد که Claude Sonnet 4.5 با موفقیت تحقیقات اقتصادی منتشرشده را از فایل‌های داده و مقالات بازتولید کرده و قابلیت‌های کاری محدود واقعی را به نمایش می‌گذارد @emollick
  • فیگما شروع به عرضه‌ی Claude Sonnet 4.5 در Figma Make و قابلیت آلفای «prompt-to-edit» خود برای برنامه‌های طراحی کرده است @figma
  • Cursor مدل Claude Sonnet 4.5 را برای قابلیت‌های کدنویسی پیشرفته‌تر ادغام می‌کند @cursor_ai
  • Perplexity مدل‌های Claude Sonnet 4.5 و 4.5 Thinking را برای مشترکین Pro و Max اضافه می‌کند @perplexity_ai
  • «Nano Banana» در Google Gemini امکان تولید تصاویر سر (headshot) حرفه‌ای را با قابلیت‌های دقیق درخواست (prompting) برای پرتره‌های آماده‌ی کسب‌وکار فراهم می‌کند @GeminiApp
  • Claude Code از Anthropic به‌روزرسانی‌های عمده‌ای دریافت کرده که شامل نقاط بازرسی (checkpoints)، قابلیت بازگشت (rewind functionality)، افزونه‌ی VS Code و دستورات ردیابی استفاده است @_catwu

پژوهش‌ها

  • تیم DeepSeek یک راه‌حل ارزان برای زمینه‌های طولانی در LLMها توسعه داده که به حدود ۳.۵ برابر پر کردن اولیه‌ی (prefill) ارزان‌تر و حدود ۱۰ برابر رمزگشایی (decode) ارزان‌تر در زمینه ۱۲۸ هزار توکنی با همان کیفیت دست می‌یابد @deedydas
  • کامرون ولف توضیح می‌دهد که چگونه الگوریتم‌های یادگیری تقویتی (RL) آنلاین ساده‌تر مانند REINFORCE و RLOO می‌توانند LLMها را به طور مؤثر بدون پیچیدگی PPO آموزش دهند، زیرا مدل‌های از پیش آموزش‌دیده دارای پیش‌فرض‌های قوی هستند که گرادیان‌های ناپایدار را کم‌تر مشکل‌ساز می‌کنند @cwolferesearch
  • فرانسوا شوله استدلال می‌کند که LLMها عمدتاً با افزایش حجم داده‌های پیش‌آموزش بهبود یافته‌اند تا با افزایش قدرت محاسباتی، و داده‌ها تنگنای اصلی هستند زیرا مدل‌ها همچنان به خروجی‌های تولیدشده توسط انسان وابسته هستند @fchollet
  • ایتان مولیک «آلودگی پنجره‌ی زمینه» (context window contamination) را به عنوان یک ملاحظه‌ی کلیدی برای عامل‌های هوش مصنوعی شناسایی می‌کند، جایی که کارهای قبلی و تصمیمات، توانایی عامل را برای بی‌طرف بودن با پر شدن زمینه‌اش کاهش می‌دهد @emollick
  • مهندسان MIT یک ترانزیستور مغناطیسی را معرفی کردند که راه را برای ترانزیستورهای فشرده و با کارایی بالا با قابلیت‌های حافظه‌ی داخلی باز می‌کند @MIT

اخبار هوش مصنوعی در 2025-09-28

مدل‌های جدید هوش مصنوعی

  • Qwen3-Max اکنون در دسترس است و کاربران می‌توانند با آن برنامه بسازند، با قابلیت‌های جدیدی از جمله «Code Interpreter» و «Web Search» برای دریافت و بصری‌سازی داده‌ها @Alibaba_Qwen

تحلیل صنعت

  • شرکت‌های بزرگ فناوری امسال ۳۴۵ میلیارد دلار سرمایه برای توسعه‌ی هوش مصنوعی هزینه خواهند کرد که نشان‌دهنده‌ی افزایش ۲.۵ برابری تنها در ۲ سال است، و پروژه‌ی Stargate اوپن‌ای‌آی تا سال ۲۰۲۹ مبلغ ۵۰۰ میلیارد دلار را وعده می‌دهد که تقریباً ۲۵ درصد از هزینه‌ی پیش‌بینی شده‌ی ۲ تریلیون دلاری را شامل می‌شود @deedydas
  • طبق گزارش‌ها، اوپن‌ای‌آی سالانه بیش از ۱۵۰ میلیون دلار برای Datadog هزینه می‌کند، بیش از ۲ برابر هزینه‌ای که خود Datadog صرف می‌کند، که نشان‌دهنده‌ی هزینه‌های عظیم زیرساختی شرکت‌های هوش مصنوعی در مراحل رشد سریع است @GergelyOrosz
  • استودیوهای هالیوود بی‌سروصدا در حال استفاده از فناوری هوش مصنوعی هستند، با چندین اعلام عمومی در مورد پروژه‌های مهم هوش مصنوعی که در آغاز سال جدید انتظار می‌رود، به گفته‌ی رئیس «Dream Lab LA» در Luma AI @AndrewCurran_
  • جنسن هوانگ، مدیرعامل NVIDIA، ادعا می‌کند که این شرکت بیش از هر کسی به جز AI2، مدل‌ها و مجموعه داده‌های هوش مصنوعی متن‌باز را بررسی می‌کند، که NVIDIA را به عنوان یک مشارکت‌کننده‌ی اصلی در توسعه‌ی هوش مصنوعی متن‌باز قرار می‌دهد @natolambert
  • همه‌ی پژوهشگران مقاله‌ی Veo 3 گوگل، که بهترین مدل تولید ویدیوی جهان توصیف شده است، اهل ایالات متحده نیستند، که نشان‌دهنده‌ی توزیع استعدادهای جهانی در پژوهش‌های هوش مصنوعی است @deedydas

کاربردها

  • ایتان مولیک نشان داد که چگونه با استفاده از ChatGPT Codex یک بازی شبیه‌سازی گمشده‌ی Maxis (SimRefinery) را تنها از یک مقاله و یک اسکرین‌شات بازسازی کرده است، و یک نمونه‌ی اولیه قابل بازی را بدون دست زدن مستقیم به هیچ کدی ساخت @emollick
  • Claude Code با موفقیت یک مشکل پیچیده‌ی «macOS Finder» را که حجم آن به ۸ گیگابایت رسیده بود، از طریق تقریباً ۱۰ بار تکرار در طول ۳۰ دقیقه اشکال‌زدایی کرد، و قابلیت‌های اشکال‌زدایی جدیدی را نشان داد که قبل از عامل‌های هوش مصنوعی وجود نداشتند @GergelyOrosz
  • اسکات آرونسون اولین مقاله‌ی خود را منتشر کرد که در آن یک گام فنی کلیدی در اثبات از هوش مصنوعی نشأت گرفته بود، به‌طور خاص با استفاده از GPT-5-Thinking، و مشارکت هوش مصنوعی را از نظر معیارهای آکادمیک «زیرکانه» توصیف کرد @AndrewCurran_
  • مدل‌های هوش مصنوعی اکنون می‌توانند بیشتر کپچاهای رایج را بهتر از انسان‌ها حل کنند، و دلیل اصلی که کپچاها هنوز کار می‌کنند این است که LLMهای اصلی اغلب از تکمیل آن‌ها خودداری می‌کنند، نه اینکه فاقد توانایی باشند @emollick

پژوهش‌ها

  • مقاله‌ی جدید DeepMind با عنوان «Video models are zero-shot learners and reasoners» نشان می‌دهد که مدل‌های ویدیوی مولد برای مسائل بینایی همان چیزی هستند که LLMها برای مسائل NLP بودند - مدل‌های واحدی که قادر به حل طیف وسیعی از چالش‌ها هستند @simonw
  • پیشرفت از «agents are nowhere close to working» به «general purpose agents are actually useful for a range of tasks» در کمتر از یک سال رخ داده است، با بهبودهای قابل‌توجه در استفاده از ابزار، مراحل کاری و کاهش خطا @emollick
  • پژوهش RL در حال تبدیل شدن به پیش‌آموزش/مدل‌سازی با یک تغییر بزرگ در رویکرد است، زیرا بیشتر پژوهش‌های منتشر شده‌ی RL به اندازه‌ی کافی از توان محاسباتی استفاده نکرده‌اند تا تصمیمات اهمیت زیادی داشته باشند، هرچند این وضعیت به آرامی در حال تغییر است @natolambert
  • پژوهشگران Anthropic پیش‌بینی می‌کنند که برابری با متخصصان انسانی «احتمالاً تنها در چند ماه» محقق خواهد شد، این در حالی است که این شرکت در سال ۲۰۲۳ اعلام کرده بود که مدل‌های سال‌های ۲۰۲۵/۲۶ می‌توانند بخش‌های بزرگی از اقتصاد را خودکار کنند @AndrewCurran_

اخبار هوش مصنوعی در 2025-09-27

مدل‌های جدید هوش مصنوعی

  • OpenAI یک سیستم مسیریابی ایمنی جدید در ChatGPT معرفی می‌کند که هنگام مکالمات شامل موضوعات حساس و احساسی، به GPT-5 یا مدل‌های استدلالی تغییر می‌کند و مسیریابی بر اساس هر پیام انجام می‌شود @nickaturley
  • گوگل مدل تولید ویدئوی Veo 3 را با قابلیت‌های استدلال بصری نوظهور منتشر می‌کند که توانایی‌های «صفر-شات» را در تقسیم‌بندی اشیا، تشخیص لبه‌ها، ویرایش تصویر و درک ویژگی‌های فیزیکی نشان می‌دهد @deedydas
  • گوگل مدل Gemini Live را برای مکالمات طبیعی به‌روزرسانی می‌کند که اکنون برای توسعه‌ی عامل‌های هوش مصنوعی صوتی در Google AI Studio در دسترس است @OfficialLoganK

تحلیل صنعت

  • OpenAI گزارش می‌دهد که با «محدودیت محاسباتی» مواجه است و برای تأمین تقاضا به ۱۰۰ میلیارد دلار قرارداد سرور نیاز دارد که چالش‌های زیرساختی در مقیاس‌پذیری هوش مصنوعی را برجسته می‌کند @TechCrunch
  • NVIDIA طی سال گذشته با بیش از ۳۰۰ مورد مشارکت در مدل، مجموعه داده و اپلیکیشن در Hugging Face، به عنوان یک مشارکت‌کننده‌ی بزرگ در هوش مصنوعی متن‌باز ظاهر می‌شود @ClementDelangue
  • کره‌ی جنوبی یک ابتکار جاه‌طلبانه‌ی هوش مصنوعی مستقل را راه‌اندازی می‌کند که در آن شرکت‌های بزرگ فناوری مانند LG و SK Telecom مدل‌های LLM خود را توسعه می‌دهند @TechCrunch
  • ۶۰ درصد از فارغ‌التحصیلان دکترا و ۵۳ درصد از فارغ‌التحصیلان کارشناسی ارشد علوم کامپیوتر در ایالات متحده غیرآمریکایی هستند، در حالی که شرکت‌های بزرگ فناوری کمتر از ۱۵ درصد کارمند H-1B دارند، که این نشان می‌دهد الگوهای استخدام، منعکس‌کننده‌ی جمعیت‌شناسی آموزشی هستند تا سوگیری @deedydas
  • تیم Anthropic ادغام گسترده‌ی LLM را در سراسر گردش کار خود نشان می‌دهد و بینش‌هایی را در مورد الگوهای پذیرش کامل، هنگامی که محدودیت‌های هزینه و دسترسی برداشته می‌شوند، ارائه می‌دهد @realchrisebert

اخلاق و جامعه

  • پژوهشگران «AI slop» را به عنوان یک اصطلاح جدید برای محتوای کم‌کیفیت تولیدشده توسط هوش مصنوعی که فضاهای دیجیتال را فرا گرفته است، شناسایی می‌کنند و نگرانی‌هایی را در مورد کاهش کیفیت محتوا برجسته می‌کنند @TechCrunch
  • پژوهشگران MIT پویایی روابط انسان و هوش مصنوعی را از طریق تحلیل جامعه‌ی Reddit «r/MyBoyfriendIsAI» مطالعه می‌کنند و پیامدهای اجتماعی غیرمنتظره‌ی همراهی با هوش مصنوعی را بررسی می‌کنند @medialab
  • پژوهش استنفورد تمایز بین استفاده در مقابل اشاره به کلمات ناامن را در سیستم‌های هوش مصنوعی و گفتمان آنلاین بررسی می‌کند و به چالش‌های نظارت بر محتوا می‌پردازد @krisgligoric

کاربردها

  • Perplexity از قابلیت به‌روزرسانی‌شده‌ی Discover خبر می‌دهد که هفته‌ی آینده با شروع از پلتفرم iOS عرضه خواهد شد @AravSrinivas
  • Cursor پلتفرم Learn را با یک مجموعه‌ی ویدئویی شش‌قسمتی درباره‌ی مبانی هوش مصنوعی معرفی می‌کند که توکن‌ها، زمینه و عامل‌ها را برای مبتدیان پوشش می‌دهد @leerob
  • Google AI Studio توسعه‌ی عامل هوش مصنوعی صوتی را از طریق دستورات ساده با استفاده از Live API ممکن می‌سازد و هوش مصنوعی مکالمه‌ای را دسترس‌پذیرتر می‌کند @OfficialLoganK
  • Ethan Mollick از دسترس‌پذیرتر کردن ابزارهای کدنویسی مانند Codex و Claude Code برای افراد غیربرنامه‌نویس حمایت می‌کند و استدلال می‌کند که موانع فعلی در تجربه‌ی کاربری (UX) برای ایجاد برنامه‌های کاربردی مفید غیرضروری هستند @emollick

پژوهش‌ها

  • Veo 3 قابلیت‌های استدلال بصری نوظهور را بدون آموزش صریح نشان می‌دهد، از جمله حل هزارتوها، درک تقارن و انجام وظایف بصری مختلف، که نشان‌دهنده‌ی یک «لحظه‌ی GPT-3 برای استدلال بصری» است @deedydas
  • پژوهش DeepMind نشان می‌دهد که Veo 3 پیشرفت‌های عملکردی قابل توجهی نسبت به Veo 2 به دست می‌آورد، با نتایج مقیاس‌گذاری که حاکی از آن است که pass@10 به طور مداوم بهتر از pass@1 عمل می‌کند، بدون هیچ نشانه‌ای از رسیدن به سقف @AndrewCurran_
  • Andrew Curran پیش‌بینی می‌کند که «زنجیره‌ی فکر» ویدئویی (یا «زنجیره‌ی فریم‌ها») یک پیشرفت قابل توجه در قابلیت‌های هوش مصنوعی خواهد بود، مشابه با چگونگی پیشرفت مدل‌های زبانی توسط CoT @AndrewCurran_
  • Nathan Lambert علیه ضرورت یادگیری پیوسته برای سیستم‌های هوش مصنوعی کوتاه‌مدت استدلال می‌کند و پیشنهاد می‌کند که بازنمایی‌های فعلی LLM و رویکردهای مهندسی زمینه برای قابلیت‌های قدرتمند کافی خواهند بود @natolambert
  • François Chollet بر سادگی به عنوان یک اصل کلیدی در نظریه‌ی هوش مصنوعی تأکید می‌کند و بیان می‌کند که راه‌حلی که به احتمال زیاد تعمیم‌پذیر است، همیشه ساده‌ترین راه‌حل نسبت به آنچه توضیح می‌دهد، است @fchollet