اخبار هوش مصنوعی در 2025-11-02

مدل‌های جدید هوش مصنوعی

  • علی‌بابا اعلام کرد که «Qwen3-VL» اکنون می‌تواند به‌صورت محلی با «Unsloth AI» اجرا شود و قابلیت‌های تنظیم دقیق و یادگیری تقویتی را از طریق نوت‌بوک‌های رایگان ارائه می‌دهد. @Alibaba_Qwen

تحلیل صنعت

  • هزینه‌های هوش مصنوعی متا در حال برانگیختن نگرانی‌هایی در میان سرمایه‌گذاران وال‌استریت در مورد تعهدات مالی این شرکت است. @TechCrunch
  • سم آلتمن، مدیرعامل «اوپن‌ای‌آی»، فاش کرد که این شرکت بیش از ۱۳ میلیارد دلار درآمد سالانه تولید می‌کند و هنگام پرسش در مورد نحوه‌ی تأمین مالی تعهدات هزینه‌بر سنگین خود، حالت دفاعی به خود گرفت. @TechCrunch
  • یوتیوب به یک کسب‌وکار با ARR ۶۰ میلیارد دلاری تبدیل شده است که سال به سال ۱۵ درصد رشد می‌کند و ۱۵ درصد از درآمد گوگل را تشکیل می‌دهد، در حالی که بیش از ۲ درصد از کل زمان بیداری انسان در این پلتفرم سپری می‌شود. @deedydas
  • عرضه‌های انفرادی مدل‌های هوش مصنوعی متن‌باز تنها در کوتاه‌مدت اهمیت دارند، زیرا بدون عرضه‌های مداوم منسوخ می‌شوند؛ منحنی بهبود قابلیت/هزینه بسیار تند است. @emollick
  • یک سوال کلیدی باقی می‌ماند که آیا آزمایشگاه‌های چینی و «میسترال» به عرضه‌ی مدل‌های با وزن‌های باز ادامه خواهند داد یا خیر، زیرا هزینه‌های اقتصادی و ارزش آن‌ها همچنان در حال افزایش است، چرا که هوش مصنوعی متن‌باز فاقد مکانیزم‌های جذب ارزش مشابه پلتفرم‌های نرم‌افزاری متن‌باز است. @emollick
  • هدف نهایی استراتژی هوش مصنوعی با وزن‌های باز نامشخص است، زیرا برخلاف نرم‌افزار متن‌باز که ارزش را از طریق خدمات یا سخت‌افزار جذب می‌کند، ارزش به همان شیوه از مدل‌های با وزن‌های باز بازنمی‌گردد. @emollick
  • بازار کار فناوری در حال فشرده‌شدن است و اخذ مدارک از دانشگاه‌های برتر علوم کامپیوتر و کار در شرکت‌هایی با برندهای معتبر را به‌طور فزاینده‌ای سودمند می‌کند؛ ایجاد سابقه‌ی حرفه‌ای بیش از پیش اهمیت یافته است. @GergelyOrosz
  • با فشرده‌شدن بازار کار فناوری و وجود نامزدهای واجد شرایط بیشتر از موقعیت‌های شغلی خالی، استخدام به‌طور فزاینده‌ای بر اساس سابقه‌ی تحصیلی یا کاری در مدارس یا محل‌های کار برتر انجام می‌شود، اگرچه مصاحبه‌های الگوریتمی به افراد بدون سابقه‌ی حرفه‌ای فرصت مناسبی می‌دهند. @GergelyOrosz

اخلاق و جامعه

  • بزرگترین چالش‌های بشریت تنها با ۱۰۰۰ ساعت تفکر هوش مصنوعی حل نخواهد شد، بلکه با همکاری بسیاری از انسان‌ها و هوش مصنوعی که مهارت‌ها، اهداف و ارزش‌های متفاوت آن‌ها را درک می‌کند تا اقدام جمعی را توانمند سازد. @ericzelikman
  • یان لکون استدلال می‌کند که مقیاس‌بندی مدل‌های زبانی بزرگ مبتنی بر ترنسفورمر، هوش مصنوعی در سطح انسان را محقق نخواهد کرد و اظهار می‌دارد که راهی برای دستیابی به سیستمی که بتواند راه‌حل‌هایی برای مشکلات جدید ابداع کند، نه فقط از حافظه‌ی عظیم بازیابی کند، وجود ندارد. @rohanpaul_ai
  • لکون توصیه می‌کند که برای دستیابی به هوش مصنوعی در سطح انسان، مدل‌های زبانی بزرگ (LLMs) کنار گذاشته شوند و به جای آن از معماری‌های جاسازی مشترک، مدل‌های مبتنی بر انرژی به جای مدل‌های احتمالی، روش‌های منظم‌سازی‌شده به جای روش‌های مقایسه‌ای و کنترل پیش‌بین مدل به جای یادگیری تقویتی استفاده شود. @rohanpaul_ai
  • افراد ماهر ابزارهای هوش مصنوعی را بهتر از کاربران غیرماهر به کار می‌برند؛ برنامه‌نویسان عالی کدهای بهتر، تمیزتر و سازمان‌یافته‌تری را سریع‌تر تولید می‌کنند، در حالی که کسانی که مهارت‌های توسعه‌یافته‌ای ندارند، نمی‌توانند تشخیص دهند که خروجی هوش مصنوعی برنده جایزه است یا بی‌ارزش. @Dan_Jeffries1

کاربردها

  • گوگل شیتس و اکسل به لطف کمک هوش مصنوعی دیگر منحنی یادگیری ندارند و «GPT-5 Pro» به‌ویژه در انجام وظایف پیچیده‌ی صفحه‌گسترده مؤثر است. @natolambert
  • اهمیت یادگیری «وایب کد»، مهندس هوش مصنوعی و «پرامپت» به این دلیل نیست که ساخت محصولات پیش‌پاافتاده است، بلکه به این دلیل است که فرآیند ساخت باید کالایی شود تا زمان و خلاقیت صرف کشف مشکل صحیح، انطباق با بازار و تجاری‌سازی شود. @clairevo
  • با ۱۲ دقیقه تفکر، «GPT-5 Pro» استفاده‌ی مجدد از یک داروی شناخته‌شده را برای درمان یک آلرژی غذایی غیرقابل درمان پیشنهاد کرد که با نتایج یک مطالعه‌ی منتشرنشده و داوری‌شده مطابقت داشت و پتانسیل کشف علمی مبتنی بر LLM را نشان می‌دهد. @DeryaTR_
  • عوامل کدنویسی ساخت وب‌سایت‌ها و محتوای پویا را بسیار لذت‌بخش می‌کنند و توسعه‌ی سریع ابزارها و مخازن برای تولید محتوا را امکان‌پذیر می‌سازند. @natolambert
  • «Odyssey-2» اکنون ویدئوی ۱۶:۹ را در نمایشگرهای بزرگ پخش می‌کند و مزیت مدل‌های ویدئویی تعاملی را نشان می‌دهد، جایی که ویدئوی تولیدشده در زمان واقعی به‌صورت هوشمندانه با صفحه، بیننده و دستگاه ورودی تطبیق می‌یابد، برخلاف ویدئوی از پیش ضبط‌شده. @olivercameron
  • «Odyssey-2» بلافاصله با تأخیر کمتر از یک ثانیه پس از کلیک بر روی شروع استریم، ویدئو تولید می‌کند که همگی رایگان در دسترس است. @odysseyml

پژوهش‌ها

  • یک دستور آزمایشی آشکارساز از مدل‌ها می‌خواهد که پاراگرافی بنویسند که قابلیت‌ها را در ابعاد مختلف نشان دهد، سپس رویکرد خود را توضیح دهند؛ در این میان «کلود» در نوشتن عالی عمل کرده و «GPT-5 Pro» ترفندهای فکری را به خوبی به کار گرفته است. @emollick
  • یادگیری تقویتی دقت رأی اکثریت را افزایش می‌دهد اما «pass@k» را خیر، که احتمال تکمیل‌های صحیح موجود در «top-k» را بدون افزایش واضح قابلیت‌های کلی مدل، طبق پژوهش DeepSeekMath، بالا می‌برد. @cwolferesearch
  • «GPT-5» در این مرحله به‌وضوح کمتر از «کلود» تملق‌گو است، که توسعه‌ای قابل توجه است. @xlr8harder
  • بهترین مدل‌های زبانی جهان در جزئیات پیچیده‌ی الگوریتم‌های RL بسیار بهتر از ارائه‌ی توصیه‌های پزشکی برای بیماری‌های حیوانات خانگی عمل می‌کنند که شکاف‌های قابلیت را برجسته می‌کند. @natolambert
  • طبق آزمایش کاربر، «Claude 4.1 Opus» از «Claude 4.5 Sonnet» بهتر عمل می‌کند. @natolambert
  • محققان MIT «BoltzGen» را توسعه دادند، یک مدل هوش مصنوعی مولد که پروتئین‌ها و پپتیدها را با هر روشی برای اتصال به اهداف زیست‌مولکولی مختلف طراحی می‌کند و طراحی و پیش‌بینی ساختار را یکپارچه می‌سازد؛ این مدل به‌صورت رایگان برای استفاده‌ی آکادمیک و تجاری نامحدود در دسترس است. @MIT_CSAIL
  • محققان MIT روشی را توسعه دادند که به هنرمندان امکان می‌دهد شبیه‌سازی‌های واقع‌گرایانه‌ای از اشیاء الاستیک مانند شخصیت‌های جهنده یا نرم را برای فیلم‌های انیمیشنی یا بازی‌های ویدئویی طراحی کنند. @MIT