اخبار هوش مصنوعی در 2025-05-13
مدلهای جدید هوش مصنوعی
- @Alibaba_Qwen گزارش فنی Qwen3 را منتشر کرد که معماری و قابلیتهای جدیدترین مدل خود را مستند میکند.
پژوهشها
- @berkeley_ai پژوهشی را در مورد یادگیری سیاست ناوبری بصری تعمیمیافته از منابع داده غیرفعال مقیاسپذیر اما کمکیفیت و بدون اقدام منتشر کرد.
- @AIatMeta قسمت 4 فیزیک مدلهای زبانی را منتشر کرد و Canon layers را معرفی کرد که «پیوندهای پسماند افقی» را در سراسر توکنها اضافه میکند تا استدلال و تعمیم در Transformers، Mamba، GLA و فراتر از آن را به طور قابل توجهی بهبود بخشد.
- @AIatMeta، CATransformers را معرفی کرد، یک معماری عصبی مبتنی بر کربن و چارچوب طراحی مشترک سختافزار سیستم که به 9.1٪ کاهش در کل انتشار کربن چرخه عمر دست مییابد در حالی که دقت را حفظ یا افزایش میدهد.
- @ch402 در مورد منطق نامگذاری مقاله خود با عنوان «در مورد زیستشناسی یک مدل زبانی بزرگ» بحث کرد و توضیح داد که چگونه زیباییشناسی علمی زیستشناسی با یادگیری عمیق و تحقیقات قابلیت تفسیر مرتبط است.
- @GoogleAI پژوهشی را در مورد استفاده از نمودارهای اعتماد برای مدلسازی روابط و اعمال Differential Privacy برای انعکاس ترجیحات حریم خصوصی نامتقارن کاربران در سناریوهای اشتراکگذاری دادهها به اشتراک گذاشت.
- @MIT_CSAIL، CausVid را معرفی کرد، یک مدل هوش مصنوعی جدید که با ترکیب واقعگرایی عکسمانند مدلهای انتشار با سرعت رویکردهای خودرگرسیونی، ویدیوهای روان و با کیفیت بالا را در عرض چند ثانیه میسازد.
- @huggingface از Ultra-FineWeb، یک پایه 1.1T-توکنی تمیزتر برای LLMهای بهتر با 1T توکن انگلیسی + 120B چینی، فیلتر شده برای کیفیت، خبر داد که بهبود 3.6+ امتیازی در MMLU و 3.7+ در CMMLU در مقایسه با FineWeb نشان میدهد.
- @huggingface، Step1X-3D را منتشر کرد، یک چارچوب تولید سهبعدی کاملاً متنباز برای تولید با کیفیت بالا و قابل کنترل داراییهای سهبعدی با بافت.
- @emollick خاطرنشان کرد که در سپتامبر 2024، پزشکانی که با هوش مصنوعی کار میکردند، در بنچمارک پزشک Healthbench بهتر از هوش مصنوعی یا پزشکان به تنهایی عمل کردند، اما با o3 و GPT-4.1، پاسخهای هوش مصنوعی دیگر توسط پزشکان بهبود نمییابد.
- @natolambert اشاره کرد که مقاله Tulu 3 اصطلاح RLVR (Reinforcement Learning from Value Ranking) را ابداع کرد.
کاربردها
- @GeminiApp، Veo 2 را برای کاربران Gemini Advanced راهاندازی کرد و به کاربران این امکان را میدهد تا با دستورات متنی ساده، در عرض چند دقیقه از ایده به ویدیو برسند.
- @GeminiApp یک برنامه iPad را منتشر کرد که محدودیت قبلی در دسترسی به پلتفرم را برطرف میکند.
- @Alibaba_Qwen، Deep Research را در Qwen Chat پس از چند هفته آزمایش مرحلهای برای همه در دسترس قرار داد.
- @gdb به اشتراک گذاشت که Deep Research اکنون میتواند به Sharepoint سازمانها متصل شود و قابلیتهای دسترسی به دادههای سازمانی خود را گسترش دهد.
- @simonw خاطرنشان کرد که Gemini، OpenAI، Perplexity و Qwen همگی ویژگیهایی به نام «Deep Research» دارند، در حالی که Grok با نامیدن ویژگی خود به عنوان «DeepSearch» از این روند پیروی نکرد.
- @huggingface از رونویسی 8 برابر سریعتر Whisper بر روی یک GPU L4 واحد، با پشتیبانی از vllm_project خبر داد.
- @_catwu از ویژگیهای جدید Claude Code از جمله multipaste برای تکههای بزرگ متن یا تصاویر، هدایت بیدرنگ برای تنظیم رویکرد در طول کار و پشتیبانی از OpenTelemetry برای ردیابی معیارها خبر داد.
- @ycombinator، OpenMemory MCP را راهاندازی کرد، یک حافظه خصوصی برای مشتریان سازگار با MCP که یک لایه حافظه دائمی و قابل حمل برای ابزارهای هوش مصنوعی که 100٪ به صورت محلی اجرا میشوند، فراهم میکند.
- @windsurf_ai قابلیت ویرایش پیشنهادات ترمینال Cascade's را قبل از اجرای آنها اضافه کرد.
- @TechCrunch گزارش داد که TikTok، TikTok AI Alive را راهاندازی کرده است، یک ابزار جدید تبدیل تصویر به ویدیو.
تحلیل صنعت
- @NVIDIAAI برنامههایی را برای ساخت کارخانههای هوش مصنوعی با HUMAIN (یک شرکت تابعه هوش مصنوعی از صندوق سرمایهگذاری عمومی عربستان سعودی) اعلام کرد که عربستان سعودی را به یک رهبر جهانی هوش مصنوعی تبدیل میکند و تا 500 مگاوات نیرو با استفاده از چند صد هزار GPU NVIDIA مستقر میکند.
- @AndrewCurran_ گزارش داد که NVIDIA توافقی را تأیید کرده است که شامل صدها هزار «پیشرفتهترین GPUهای NVIDIA در پنج سال آینده» برای عربستان سعودی است.
- @AndrewCurran_ به اشتراک گذاشت که اپل در حال کار بر روی Brain-Computer Interface (BCI) خود با شرکتی به نام Synchron است و دستگاهی به نام Stentrode را توسعه میدهد که در یک رگ در بالای قشر حرکتی مغز کاشته میشود.
- @_amankhan نموداری را به اشتراک گذاشت که رشد AI Product Management را به عنوان یک مسیر شغلی نشان میدهد.
- @GergelyOrosz خاطرنشان کرد که دادهها نشان میدهند AI Product Managers که میدانند چگونه محصولات هوش مصنوعی بسازند، مورد تقاضا هستند، برخلاف ادعاهایی مبنی بر اینکه فناوری و مهندسی نرمافزار به دلیل هوش مصنوعی در حال کاهش است.
- @garrytan مشاهده کرد که کسبوکارهایی که به دنبال مشتریان جدید هستند، باید جستجوی مبتنی بر عامل هوش مصنوعی را دوباره یاد بگیرند و برای آن بهینهسازی کنند، مشابه نحوه بهینهسازی قبلی برای موتورهای جستجو.
- @Deedy گزارش داد که مایکروسافت 3٪ از نیروی کار خود (تقریباً 7000 کارمند) را اخراج کرده است و خاطرنشان کرد که تعداد کارکنان مایکروسافت از سال 2022، همزمان با راهاندازی ChatGPT، به مدت 3 سال ثابت مانده است.
- @scottbelsky تأکید کرد که تغییرات پلتفرمی مانند هوش مصنوعی فرصتهای آربیتراژ دانش را ایجاد میکند و به تازهواردان بومی هوش مصنوعی به نیروی کار مزیتی مشابه پذیرندگان اولیه رسانههای اجتماعی میدهد.
- @ylecun از متن آشتی تجاری مجلس نمایندگان که شامل تعلیق 10 ساله مقررات هوش مصنوعی در سطح ایالتی است، حمایت کرد، که او آن را به عنوان محافظت از نوآوری آمریکایی در هوش مصنوعی میداند.
اخلاق و جامعه
- @medialab مقالهای از Nature را به اشتراک گذاشت که در مورد چگونگی تأثیر چتباتها و همراهان دیجیتال بر افراد و جامعه بحث میکند و شامل بینشهایی از محقق Media Lab، @patpat_mit است.
- @StanfordAILab، minions secure chat را منتشر کرد، یک پروتکل متنباز برای چت LLM رمزگذاریشده سرتاسر با کمتر از 1٪ سربار تأخیر، که تضمین میکند ارائهدهندگان ابر نمیتوانند به پیامها دسترسی داشته باشند زیرا فقط در داخل یک محفظه GPU امن رمزگشایی میشوند.
- @stanfordnlp تأکید کرد که متن آشتی انرژی و تجارت مجلس نمایندگان شامل زبانی است که تمام مقررات هوش مصنوعی ایالتی را برای یک دوره 10 ساله مقدم میشمارد و نشاندهنده یک فشار مقرراتزدایی قابل توجه است.
- @simonw نگرانیهایی را در مورد قابلیت استفاده و مستندات ویژگی حافظه ChatGPT، بهویژه در مورد چگونگی داشتن مکالمات بدون در نظر گرفتن آنها به عنوان بخشی از حافظه آینده، مطرح کرد.