اخبار هوش مصنوعی در 2025-05-13

مدل‌های جدید هوش مصنوعی

‏@Alibaba_Qwen گزارش فنی Qwen3 را منتشر کرد که معماری و قابلیت‌های جدیدترین مدل خود را مستند می‌کند.

پژوهش‌ها

‏@berkeley_ai پژوهشی را در مورد یادگیری سیاست ناوبری بصری تعمیم‌یافته از منابع داده غیرفعال مقیاس‌پذیر اما کم‌کیفیت و بدون اقدام منتشر کرد.
‏@AIatMeta قسمت 4 فیزیک مدل‌های زبانی را منتشر کرد و Canon layers را معرفی کرد که «پیوندهای پسماند افقی» را در سراسر توکن‌ها اضافه می‌کند تا استدلال و تعمیم در Transformers، Mamba، GLA و فراتر از آن را به طور قابل توجهی بهبود بخشد.
‏@AIatMeta، CATransformers را معرفی کرد، یک معماری عصبی مبتنی بر کربن و چارچوب طراحی مشترک سخت‌افزار سیستم که به 9.1٪ کاهش در کل انتشار کربن چرخه عمر دست می‌یابد در حالی که دقت را حفظ یا افزایش می‌دهد.
‏@ch402 در مورد منطق نام‌گذاری مقاله خود با عنوان «در مورد زیست‌شناسی یک مدل زبانی بزرگ» بحث کرد و توضیح داد که چگونه زیبایی‌شناسی علمی زیست‌شناسی با یادگیری عمیق و تحقیقات قابلیت تفسیر مرتبط است.
‏@GoogleAI پژوهشی را در مورد استفاده از نمودارهای اعتماد برای مدل‌سازی روابط و اعمال Differential Privacy برای انعکاس ترجیحات حریم خصوصی نامتقارن کاربران در سناریوهای اشتراک‌گذاری داده‌ها به اشتراک گذاشت.
‏@MIT_CSAIL، CausVid را معرفی کرد، یک مدل هوش مصنوعی جدید که با ترکیب واقع‌گرایی عکس‌مانند مدل‌های انتشار با سرعت رویکردهای خودرگرسیونی، ویدیوهای روان و با کیفیت بالا را در عرض چند ثانیه می‌سازد.
‏@huggingface از Ultra-FineWeb، یک پایه 1.1T-توکنی تمیزتر برای LLMهای بهتر با 1T توکن انگلیسی + 120B چینی، فیلتر شده برای کیفیت، خبر داد که بهبود 3.6+ امتیازی در MMLU و 3.7+ در CMMLU در مقایسه با FineWeb نشان می‌دهد.
‏@huggingface، Step1X-3D را منتشر کرد، یک چارچوب تولید سه‌بعدی کاملاً متن‌باز برای تولید با کیفیت بالا و قابل کنترل دارایی‌های سه‌بعدی با بافت.
‏@emollick خاطرنشان کرد که در سپتامبر 2024، پزشکانی که با هوش مصنوعی کار می‌کردند، در بنچمارک پزشک Healthbench بهتر از هوش مصنوعی یا پزشکان به تنهایی عمل کردند، اما با o3 و GPT-4.1، پاسخ‌های هوش مصنوعی دیگر توسط پزشکان بهبود نمی‌یابد.
‏@natolambert اشاره کرد که مقاله Tulu 3 اصطلاح RLVR (Reinforcement Learning from Value Ranking) را ابداع کرد.

کاربردها

‏@GeminiApp، Veo 2 را برای کاربران Gemini Advanced راه‌اندازی کرد و به کاربران این امکان را می‌دهد تا با دستورات متنی ساده، در عرض چند دقیقه از ایده به ویدیو برسند.
‏@GeminiApp یک برنامه iPad را منتشر کرد که محدودیت قبلی در دسترسی به پلتفرم را برطرف می‌کند.
‏@Alibaba_Qwen، Deep Research را در Qwen Chat پس از چند هفته آزمایش مرحله‌ای برای همه در دسترس قرار داد.
‏@gdb به اشتراک گذاشت که Deep Research اکنون می‌تواند به Sharepoint سازمان‌ها متصل شود و قابلیت‌های دسترسی به داده‌های سازمانی خود را گسترش دهد.
‏@simonw خاطرنشان کرد که Gemini، OpenAI، Perplexity و Qwen همگی ویژگی‌هایی به نام «Deep Research» دارند، در حالی که Grok با نامیدن ویژگی خود به عنوان «DeepSearch» از این روند پیروی نکرد.
‏@huggingface از رونویسی 8 برابر سریع‌تر Whisper بر روی یک GPU L4 واحد، با پشتیبانی از vllm_project خبر داد.
‏@_catwu از ویژگی‌های جدید Claude Code از جمله multipaste برای تکه‌های بزرگ متن یا تصاویر، هدایت بی‌درنگ برای تنظیم رویکرد در طول کار و پشتیبانی از OpenTelemetry برای ردیابی معیارها خبر داد.
‏@ycombinator، OpenMemory MCP را راه‌اندازی کرد، یک حافظه خصوصی برای مشتریان سازگار با MCP که یک لایه حافظه دائمی و قابل حمل برای ابزارهای هوش مصنوعی که 100٪ به صورت محلی اجرا می‌شوند، فراهم می‌کند.
‏@windsurf_ai قابلیت ویرایش پیشنهادات ترمینال Cascade's را قبل از اجرای آن‌ها اضافه کرد.
‏@TechCrunch گزارش داد که TikTok، TikTok AI Alive را راه‌اندازی کرده است، یک ابزار جدید تبدیل تصویر به ویدیو.

تحلیل صنعت

‏@NVIDIAAI برنامه‌هایی را برای ساخت کارخانه‌های هوش مصنوعی با HUMAIN (یک شرکت تابعه هوش مصنوعی از صندوق سرمایه‌گذاری عمومی عربستان سعودی) اعلام کرد که عربستان سعودی را به یک رهبر جهانی هوش مصنوعی تبدیل می‌کند و تا 500 مگاوات نیرو با استفاده از چند صد هزار GPU NVIDIA مستقر می‌کند.
‏@AndrewCurran_ گزارش داد که NVIDIA توافقی را تأیید کرده است که شامل صدها هزار «پیشرفته‌ترین GPUهای NVIDIA در پنج سال آینده» برای عربستان سعودی است.
‏@AndrewCurran_ به اشتراک گذاشت که اپل در حال کار بر روی Brain-Computer Interface (BCI) خود با شرکتی به نام Synchron است و دستگاهی به نام Stentrode را توسعه می‌دهد که در یک رگ در بالای قشر حرکتی مغز کاشته می‌شود.
‏@_amankhan نموداری را به اشتراک گذاشت که رشد AI Product Management را به عنوان یک مسیر شغلی نشان می‌دهد.
‏@GergelyOrosz خاطرنشان کرد که داده‌ها نشان می‌دهند AI Product Managers که می‌دانند چگونه محصولات هوش مصنوعی بسازند، مورد تقاضا هستند، برخلاف ادعاهایی مبنی بر اینکه فناوری و مهندسی نرم‌افزار به دلیل هوش مصنوعی در حال کاهش است.
‏@garrytan مشاهده کرد که کسب‌وکارهایی که به دنبال مشتریان جدید هستند، باید جستجوی مبتنی بر عامل هوش مصنوعی را دوباره یاد بگیرند و برای آن بهینه‌سازی کنند، مشابه نحوه بهینه‌سازی قبلی برای موتورهای جستجو.
‏@Deedy گزارش داد که مایکروسافت 3٪ از نیروی کار خود (تقریباً 7000 کارمند) را اخراج کرده است و خاطرنشان کرد که تعداد کارکنان مایکروسافت از سال 2022، همزمان با راه‌اندازی ChatGPT، به مدت 3 سال ثابت مانده است.
‏@scottbelsky تأکید کرد که تغییرات پلتفرمی مانند هوش مصنوعی فرصت‌های آربیتراژ دانش را ایجاد می‌کند و به تازه‌واردان بومی هوش مصنوعی به نیروی کار مزیتی مشابه پذیرندگان اولیه رسانه‌های اجتماعی می‌دهد.
‏@ylecun از متن آشتی تجاری مجلس نمایندگان که شامل تعلیق 10 ساله مقررات هوش مصنوعی در سطح ایالتی است، حمایت کرد، که او آن را به عنوان محافظت از نوآوری آمریکایی در هوش مصنوعی می‌داند.

اخلاق و جامعه

‏@medialab مقاله‌ای از Nature را به اشتراک گذاشت که در مورد چگونگی تأثیر چت‌بات‌ها و همراهان دیجیتال بر افراد و جامعه بحث می‌کند و شامل بینش‌هایی از محقق Media Lab، @patpat_mit است.
‏@StanfordAILab، minions secure chat را منتشر کرد، یک پروتکل متن‌باز برای چت LLM رمزگذاری‌شده سرتاسر با کمتر از 1٪ سربار تأخیر، که تضمین می‌کند ارائه‌دهندگان ابر نمی‌توانند به پیام‌ها دسترسی داشته باشند زیرا فقط در داخل یک محفظه GPU امن رمزگشایی می‌شوند.
‏@stanfordnlp تأکید کرد که متن آشتی انرژی و تجارت مجلس نمایندگان شامل زبانی است که تمام مقررات هوش مصنوعی ایالتی را برای یک دوره 10 ساله مقدم می‌شمارد و نشان‌دهنده یک فشار مقررات‌زدایی قابل توجه است.
‏@simonw نگرانی‌هایی را در مورد قابلیت استفاده و مستندات ویژگی حافظه ChatGPT، به‌ویژه در مورد چگونگی داشتن مکالمات بدون در نظر گرفتن آن‌ها به عنوان بخشی از حافظه آینده، مطرح کرد.