اخبار هوش مصنوعی در 2025-11-02

مدل‌های جدید هوش مصنوعی

علی‌بابا اعلام کرد که «Qwen3-VL» اکنون می‌تواند به‌صورت محلی با «Unsloth AI» اجرا شود و قابلیت‌های تنظیم دقیق و یادگیری تقویتی را از طریق نوت‌بوک‌های رایگان ارائه می‌دهد. @Alibaba_Qwen

تحلیل صنعت

هزینه‌های هوش مصنوعی متا در حال برانگیختن نگرانی‌هایی در میان سرمایه‌گذاران وال‌استریت در مورد تعهدات مالی این شرکت است. @TechCrunch
سم آلتمن، مدیرعامل «اوپن‌ای‌آی»، فاش کرد که این شرکت بیش از ۱۳ میلیارد دلار درآمد سالانه تولید می‌کند و هنگام پرسش در مورد نحوه‌ی تأمین مالی تعهدات هزینه‌بر سنگین خود، حالت دفاعی به خود گرفت. @TechCrunch
یوتیوب به یک کسب‌وکار با ARR ۶۰ میلیارد دلاری تبدیل شده است که سال به سال ۱۵ درصد رشد می‌کند و ۱۵ درصد از درآمد گوگل را تشکیل می‌دهد، در حالی که بیش از ۲ درصد از کل زمان بیداری انسان در این پلتفرم سپری می‌شود. @deedydas
عرضه‌های انفرادی مدل‌های هوش مصنوعی متن‌باز تنها در کوتاه‌مدت اهمیت دارند، زیرا بدون عرضه‌های مداوم منسوخ می‌شوند؛ منحنی بهبود قابلیت/هزینه بسیار تند است. @emollick
یک سوال کلیدی باقی می‌ماند که آیا آزمایشگاه‌های چینی و «میسترال» به عرضه‌ی مدل‌های با وزن‌های باز ادامه خواهند داد یا خیر، زیرا هزینه‌های اقتصادی و ارزش آن‌ها همچنان در حال افزایش است، چرا که هوش مصنوعی متن‌باز فاقد مکانیزم‌های جذب ارزش مشابه پلتفرم‌های نرم‌افزاری متن‌باز است. @emollick
هدف نهایی استراتژی هوش مصنوعی با وزن‌های باز نامشخص است، زیرا برخلاف نرم‌افزار متن‌باز که ارزش را از طریق خدمات یا سخت‌افزار جذب می‌کند، ارزش به همان شیوه از مدل‌های با وزن‌های باز بازنمی‌گردد. @emollick
بازار کار فناوری در حال فشرده‌شدن است و اخذ مدارک از دانشگاه‌های برتر علوم کامپیوتر و کار در شرکت‌هایی با برندهای معتبر را به‌طور فزاینده‌ای سودمند می‌کند؛ ایجاد سابقه‌ی حرفه‌ای بیش از پیش اهمیت یافته است. @GergelyOrosz
با فشرده‌شدن بازار کار فناوری و وجود نامزدهای واجد شرایط بیشتر از موقعیت‌های شغلی خالی، استخدام به‌طور فزاینده‌ای بر اساس سابقه‌ی تحصیلی یا کاری در مدارس یا محل‌های کار برتر انجام می‌شود، اگرچه مصاحبه‌های الگوریتمی به افراد بدون سابقه‌ی حرفه‌ای فرصت مناسبی می‌دهند. @GergelyOrosz

اخلاق و جامعه

بزرگترین چالش‌های بشریت تنها با ۱۰۰۰ ساعت تفکر هوش مصنوعی حل نخواهد شد، بلکه با همکاری بسیاری از انسان‌ها و هوش مصنوعی که مهارت‌ها، اهداف و ارزش‌های متفاوت آن‌ها را درک می‌کند تا اقدام جمعی را توانمند سازد. @ericzelikman
یان لکون استدلال می‌کند که مقیاس‌بندی مدل‌های زبانی بزرگ مبتنی بر ترنسفورمر، هوش مصنوعی در سطح انسان را محقق نخواهد کرد و اظهار می‌دارد که راهی برای دستیابی به سیستمی که بتواند راه‌حل‌هایی برای مشکلات جدید ابداع کند، نه فقط از حافظه‌ی عظیم بازیابی کند، وجود ندارد. @rohanpaul_ai
لکون توصیه می‌کند که برای دستیابی به هوش مصنوعی در سطح انسان، مدل‌های زبانی بزرگ (LLMs) کنار گذاشته شوند و به جای آن از معماری‌های جاسازی مشترک، مدل‌های مبتنی بر انرژی به جای مدل‌های احتمالی، روش‌های منظم‌سازی‌شده به جای روش‌های مقایسه‌ای و کنترل پیش‌بین مدل به جای یادگیری تقویتی استفاده شود. @rohanpaul_ai
افراد ماهر ابزارهای هوش مصنوعی را بهتر از کاربران غیرماهر به کار می‌برند؛ برنامه‌نویسان عالی کدهای بهتر، تمیزتر و سازمان‌یافته‌تری را سریع‌تر تولید می‌کنند، در حالی که کسانی که مهارت‌های توسعه‌یافته‌ای ندارند، نمی‌توانند تشخیص دهند که خروجی هوش مصنوعی برنده جایزه است یا بی‌ارزش. @Dan_Jeffries1

کاربردها

گوگل شیتس و اکسل به لطف کمک هوش مصنوعی دیگر منحنی یادگیری ندارند و «GPT-5 Pro» به‌ویژه در انجام وظایف پیچیده‌ی صفحه‌گسترده مؤثر است. @natolambert
اهمیت یادگیری «وایب کد»، مهندس هوش مصنوعی و «پرامپت» به این دلیل نیست که ساخت محصولات پیش‌پاافتاده است، بلکه به این دلیل است که فرآیند ساخت باید کالایی شود تا زمان و خلاقیت صرف کشف مشکل صحیح، انطباق با بازار و تجاری‌سازی شود. @clairevo
با ۱۲ دقیقه تفکر، «GPT-5 Pro» استفاده‌ی مجدد از یک داروی شناخته‌شده را برای درمان یک آلرژی غذایی غیرقابل درمان پیشنهاد کرد که با نتایج یک مطالعه‌ی منتشرنشده و داوری‌شده مطابقت داشت و پتانسیل کشف علمی مبتنی بر LLM را نشان می‌دهد. @DeryaTR_
عوامل کدنویسی ساخت وب‌سایت‌ها و محتوای پویا را بسیار لذت‌بخش می‌کنند و توسعه‌ی سریع ابزارها و مخازن برای تولید محتوا را امکان‌پذیر می‌سازند. @natolambert
«Odyssey-2» اکنون ویدئوی ۱۶:۹ را در نمایشگرهای بزرگ پخش می‌کند و مزیت مدل‌های ویدئویی تعاملی را نشان می‌دهد، جایی که ویدئوی تولیدشده در زمان واقعی به‌صورت هوشمندانه با صفحه، بیننده و دستگاه ورودی تطبیق می‌یابد، برخلاف ویدئوی از پیش ضبط‌شده. @olivercameron
«Odyssey-2» بلافاصله با تأخیر کمتر از یک ثانیه پس از کلیک بر روی شروع استریم، ویدئو تولید می‌کند که همگی رایگان در دسترس است. @odysseyml

پژوهش‌ها

یک دستور آزمایشی آشکارساز از مدل‌ها می‌خواهد که پاراگرافی بنویسند که قابلیت‌ها را در ابعاد مختلف نشان دهد، سپس رویکرد خود را توضیح دهند؛ در این میان «کلود» در نوشتن عالی عمل کرده و «GPT-5 Pro» ترفندهای فکری را به خوبی به کار گرفته است. @emollick
یادگیری تقویتی دقت رأی اکثریت را افزایش می‌دهد اما «pass@k» را خیر، که احتمال تکمیل‌های صحیح موجود در «top-k» را بدون افزایش واضح قابلیت‌های کلی مدل، طبق پژوهش DeepSeekMath، بالا می‌برد. @cwolferesearch
«GPT-5» در این مرحله به‌وضوح کمتر از «کلود» تملق‌گو است، که توسعه‌ای قابل توجه است. @xlr8harder
بهترین مدل‌های زبانی جهان در جزئیات پیچیده‌ی الگوریتم‌های RL بسیار بهتر از ارائه‌ی توصیه‌های پزشکی برای بیماری‌های حیوانات خانگی عمل می‌کنند که شکاف‌های قابلیت را برجسته می‌کند. @natolambert
طبق آزمایش کاربر، «Claude 4.1 Opus» از «Claude 4.5 Sonnet» بهتر عمل می‌کند. @natolambert
محققان MIT «BoltzGen» را توسعه دادند، یک مدل هوش مصنوعی مولد که پروتئین‌ها و پپتیدها را با هر روشی برای اتصال به اهداف زیست‌مولکولی مختلف طراحی می‌کند و طراحی و پیش‌بینی ساختار را یکپارچه می‌سازد؛ این مدل به‌صورت رایگان برای استفاده‌ی آکادمیک و تجاری نامحدود در دسترس است. @MIT_CSAIL
محققان MIT روشی را توسعه دادند که به هنرمندان امکان می‌دهد شبیه‌سازی‌های واقع‌گرایانه‌ای از اشیاء الاستیک مانند شخصیت‌های جهنده یا نرم را برای فیلم‌های انیمیشنی یا بازی‌های ویدئویی طراحی کنند. @MIT