اخبار هوش مصنوعی در 2025-05-28

مدل‌های جدید هوش مصنوعی

مدل DeepSeek R1-v2 در هاگینگ فیس منتشر شد که طبق گزارش‌ها، عملکردی تقریباً هم‌تراز با o3 (بالا) در LiveCodeBench دارد. @AndrewCurran_ @huggingface
گوگل عامل کدنویسی هوش مصنوعی Jules را با استفاده از Gemini 2.5 Pro منتشر کرد که به‌صورت موازی با توسعه‌دهندگان کار می‌کند و با گیت‌هاب یکپارچه می‌شود. @GoogleAI
گوگل آزمایش Stitch را راه‌اندازی کرد که با استفاده از زبان طبیعی و پرامپت‌های تصویری، طرح‌های رابط کاربری و کد فرانت‌اند برای دسکتاپ و موبایل تولید می‌کند. @GoogleAI
Veo 3 در بیش از 70 کشور در حال عرضه است و برای کاربران حرفه‌ای جهت تولید ویدئو در دسترس قرار گرفته است. @GeminiApp
میسترال ای‌آی Codestral Embed را معرفی کرد، مدل جدید و پیشرفته‌ی امبدینگ برای کد. @MistralAI
آنتروپیک حالت صوتی را به‌صورت بتا در موبایل برای Claude به زبان انگلیسی عرضه کرد که در چند هفته‌ی آینده برای همه‌ی طرح‌ها در دسترس خواهد بود. @AnthropicAI
Grok به تلگرام می‌آید و xAI مبلغ 300 میلیون دلار پول نقد و سهام به اضافه‌ی 50 درصد از درآمد اشتراک‌های xAI فروخته‌شده از طریق تلگرام را دریافت می‌کند. @AndrewCurran_

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که استنتاج دسته‌ای Llama 1B می‌تواند در یک هسته‌ی CUDA اجرا شود و مرزهای همگام‌سازی را برای بهینه‌سازی محاسبات و هماهنگی حافظه حذف کند. @karpathy
مطالعه نشان می‌دهد که LLMها را می‌توان با آموزش آن‌ها بر روی «سیگنال‌های خلاقیت» انسانی (تازگی، تنوع، غافلگیری، کیفیت) خلاق‌تر کرد، حتی مدل‌های کوچک‌تر نیز به‌طور هم‌زمان در هر 4 بعد خلاقیت امتیاز بالاتری کسب می‌کنند. @emollick
پژوهش جدیدی در مورد آموزش خودپاداش‌دهنده (SRT) که در آن مدل‌های زبانی پاداش خود را برای آموزش RL در صورت عدم دسترسی به پاسخ‌های واقعی ارائه می‌دهند. @rsalakhu
پژوهش استنفورد به بررسی نمایش‌های داخلی دانش واقعی در مدل‌های زبان بزرگ و تنوع رمزگذاری حقیقت در LLMها می‌پردازد. @stanfordnlp
مقاله‌ی جدیدی به بررسی این موضوع می‌پردازد که چرا مدل‌های فضای حالت (SSM) در یادآوری محتوای خود نسبت به ترنسفورمرها بدتر عمل می‌کنند، با استفاده از ارزیابی‌های مکانیکی. @stanfordnlp
پژوهش در مورد Chatterbox توسط Resemble AI، شبیه‌سازی صدای بدون نیاز به آموزش را تنها از 5 ثانیه صدا نشان می‌دهد که در ارزیابی‌های کور به‌طور مداوم به ElevenLabs ترجیح داده شده است. @huggingface

کاربردها

ابزار خط فرمان LLM اکنون از فراخوانی ابزار با توابع یا پلاگین‌های پایتون پشتیبانی می‌کند و با مدل‌های OpenAI، Anthropic، Gemini و Ollama کار می‌کند. @simonw
Perplexity قابلیت اخبار روزانه را در واتس‌اپ در ساعت 9 صبح به وقت محلی با دستور /news به‌عنوان آزمایشی برای پیام‌رسانی فعال راه‌اندازی کرد. @AravSrinivas
Goodfire اولین برنامه‌ی قابل استفاده‌ی عمومی را برای هدایت وزن‌های مدل تولید تصویر منتشر کرد که امکان ویرایش مبتنی بر مفهوم را مانند MS Paint اما با مفاهیم به‌جای رنگ‌ها فراهم می‌کند. @Deedy
Odyssey ML ویدئوی تعاملی را معرفی کرد که می‌توان آن را تماشا و با آن تعامل کرد، که توسط هوش مصنوعی در زمان واقعی تصور شده است. @eladgil @garrytan
Visual Electric ارتقای تصویر را تا 6 برابر با سرعت‌های بیشتر، پنج حالت حرفه‌ای و بهبود خودکار چهره راه‌اندازی کرد. @soleio
Retool Agents با استفاده از APIهای موجود، کوئری‌های SQL و گردش کارها به‌عنوان ابزارهای LLM، 50 هزار شغل را خودکار می‌کند و 6 میلیارد دلار در کارهای دستی در بخش‌های مختلف صرفه‌جویی می‌کند. @ycombinator
BOND AI Chief of Staff داده‌ها را از Slack، Jira، Notion متمرکز می‌کند و مدیران را در مورد موانع و موفقیت‌ها در زمان واقعی مطلع می‌کند. @ycombinator
Chunkr از جدیدترین LLMها از طریق API برای تجزیه‌ی اسناد با انتخاب مدل، بازگشت به عقب و پرامپت‌های سفارشی برای جداول، فرمول‌ها و نمودارها پشتیبانی می‌کند. @ycombinator

تحلیل صنعت

داریو آمودی پیش‌بینی می‌کند که هوش مصنوعی می‌تواند نیمی از مشاغل یقه سفید سطح ابتدایی را از بین ببرد و بیکاری را در یک تا پنج سال آینده به 10 تا 20 درصد برساند. @AndrewCurran_
توسعه‌دهندگان گزارش می‌دهند که از زمان عرضه‌ی Claude 4، کارهای عقب‌افتاده را پاک کرده و ماه‌ها کار را در چند روز انجام داده‌اند، و این سرعت به یک هنجار پیش‌فرض تبدیل شده است. @eugeneyan
ابزارهای کدنویسی هوش مصنوعی در پایگاه‌های کد بزرگ موجود در محل کار، در مقایسه با پروژه‌های جدید یا پروژه‌های جانبی، کاربرد بسیار کمتری از خود نشان می‌دهند. @GergelyOrosz
یک شرکت بزرگ فناوری دریافت که تقریباً نیمی از توسعه‌دهندگان پس از چند ماه استفاده از Cursor به دلیل کاربرد محدود در داخل شرکت، استفاده از آن را متوقف کردند. @GergelyOrosz
نقل قول مشتری سازمانی پس از استفاده از Replit: «در آینده هیچ‌کس از اکسل استفاده نخواهد کرد» - که پتانسیل بازار فراتر از جایگزینی کدنویسان سنتی را برجسته می‌کند. @amasad
Cohere استدلال می‌کند که دوران «بزرگ‌تر بهتر است» در هوش مصنوعی به پایان رسیده است، و موج بعدی با مدل‌های هوشمندتر و کارآمدتر تعریف می‌شود که به‌طور ایمن مقیاس‌پذیر هستند و هزینه‌ها را کاهش می‌دهند. @cohere
a16z بهینه‌سازی موتورهای مولد (GEO) را به‌عنوان فرصتی بیش از 80 میلیارد دلار شناسایی می‌کند که جایگزین SEO می‌شود زیرا برندها به‌جای رتبه‌بندی جستجو، برای ارجاعات LLM بهینه‌سازی می‌کنند. @a16z

اخلاق و جامعه

عوامل هوش مصنوعی باید به‌گونه‌ای طراحی شوند که کاربران را به سمت نتایج بلندمدت اجتماعی مثبت سوق دهند و به بررسی واقعیت کمک کنند، نه اینکه هر هوس را برآورده سازند. @jasonyuandesign
ماشین‌ها باید از رفتار توهین‌آمیز خودداری کنند زیرا این امر بر نحوه‌ی رفتار انسان‌ها با یکدیگر و با خودشان تأثیرات بعدی دارد. @jasonyuandesign
مدل‌های هوش مصنوعی خوب وقتی چیزی را نمی‌دانند، اعتراف می‌کنند، اما مدل‌های عالی برای فهمیدن آن کمک می‌خواهند تا اعتماد کاربر را جلب کنند. @mustafasuleyman
شخصی‌سازی در رابط‌های مکالمه باید فراتر از توصیه‌های محتوایی به نحوه‌ی ارائه‌ی اطلاعات بر اساس سبک‌های یادگیری و ترجیحات فردی باشد. @joulee
گفتمان سیاست هوش مصنوعی باید بر چالش‌های عملی پیاده‌سازی مانند زیرساخت و انتشار تمرکز کند، نه فقط بر نوآوری. @random_walker