اخبار هوش مصنوعی در 2025-05-28

مدل‌های جدید هوش مصنوعی

  • مدل DeepSeek R1-v2 در هاگینگ فیس منتشر شد که طبق گزارش‌ها، عملکردی تقریباً هم‌تراز با o3 (بالا) در LiveCodeBench دارد. @AndrewCurran_ @huggingface
  • گوگل عامل کدنویسی هوش مصنوعی Jules را با استفاده از Gemini 2.5 Pro منتشر کرد که به‌صورت موازی با توسعه‌دهندگان کار می‌کند و با گیت‌هاب یکپارچه می‌شود. @GoogleAI
  • گوگل آزمایش Stitch را راه‌اندازی کرد که با استفاده از زبان طبیعی و پرامپت‌های تصویری، طرح‌های رابط کاربری و کد فرانت‌اند برای دسکتاپ و موبایل تولید می‌کند. @GoogleAI
  • Veo 3 در بیش از 70 کشور در حال عرضه است و برای کاربران حرفه‌ای جهت تولید ویدئو در دسترس قرار گرفته است. @GeminiApp
  • میسترال ای‌آی Codestral Embed را معرفی کرد، مدل جدید و پیشرفته‌ی امبدینگ برای کد. @MistralAI
  • آنتروپیک حالت صوتی را به‌صورت بتا در موبایل برای Claude به زبان انگلیسی عرضه کرد که در چند هفته‌ی آینده برای همه‌ی طرح‌ها در دسترس خواهد بود. @AnthropicAI
  • Grok به تلگرام می‌آید و xAI مبلغ 300 میلیون دلار پول نقد و سهام به اضافه‌ی 50 درصد از درآمد اشتراک‌های xAI فروخته‌شده از طریق تلگرام را دریافت می‌کند. @AndrewCurran_

پژوهش‌ها

  • پژوهش‌ها نشان می‌دهد که استنتاج دسته‌ای Llama 1B می‌تواند در یک هسته‌ی CUDA اجرا شود و مرزهای همگام‌سازی را برای بهینه‌سازی محاسبات و هماهنگی حافظه حذف کند. @karpathy
  • مطالعه نشان می‌دهد که LLMها را می‌توان با آموزش آن‌ها بر روی «سیگنال‌های خلاقیت» انسانی (تازگی، تنوع، غافلگیری، کیفیت) خلاق‌تر کرد، حتی مدل‌های کوچک‌تر نیز به‌طور هم‌زمان در هر 4 بعد خلاقیت امتیاز بالاتری کسب می‌کنند. @emollick
  • پژوهش جدیدی در مورد آموزش خودپاداش‌دهنده (SRT) که در آن مدل‌های زبانی پاداش خود را برای آموزش RL در صورت عدم دسترسی به پاسخ‌های واقعی ارائه می‌دهند. @rsalakhu
  • پژوهش استنفورد به بررسی نمایش‌های داخلی دانش واقعی در مدل‌های زبان بزرگ و تنوع رمزگذاری حقیقت در LLMها می‌پردازد. @stanfordnlp
  • مقاله‌ی جدیدی به بررسی این موضوع می‌پردازد که چرا مدل‌های فضای حالت (SSM) در یادآوری محتوای خود نسبت به ترنسفورمرها بدتر عمل می‌کنند، با استفاده از ارزیابی‌های مکانیکی. @stanfordnlp
  • پژوهش در مورد Chatterbox توسط Resemble AI، شبیه‌سازی صدای بدون نیاز به آموزش را تنها از 5 ثانیه صدا نشان می‌دهد که در ارزیابی‌های کور به‌طور مداوم به ElevenLabs ترجیح داده شده است. @huggingface

کاربردها

  • ابزار خط فرمان LLM اکنون از فراخوانی ابزار با توابع یا پلاگین‌های پایتون پشتیبانی می‌کند و با مدل‌های OpenAI، Anthropic، Gemini و Ollama کار می‌کند. @simonw
  • Perplexity قابلیت اخبار روزانه را در واتس‌اپ در ساعت 9 صبح به وقت محلی با دستور /news به‌عنوان آزمایشی برای پیام‌رسانی فعال راه‌اندازی کرد. @AravSrinivas
  • Goodfire اولین برنامه‌ی قابل استفاده‌ی عمومی را برای هدایت وزن‌های مدل تولید تصویر منتشر کرد که امکان ویرایش مبتنی بر مفهوم را مانند MS Paint اما با مفاهیم به‌جای رنگ‌ها فراهم می‌کند. @Deedy
  • Odyssey ML ویدئوی تعاملی را معرفی کرد که می‌توان آن را تماشا و با آن تعامل کرد، که توسط هوش مصنوعی در زمان واقعی تصور شده است. @eladgil @garrytan
  • Visual Electric ارتقای تصویر را تا 6 برابر با سرعت‌های بیشتر، پنج حالت حرفه‌ای و بهبود خودکار چهره راه‌اندازی کرد. @soleio
  • Retool Agents با استفاده از APIهای موجود، کوئری‌های SQL و گردش کارها به‌عنوان ابزارهای LLM، 50 هزار شغل را خودکار می‌کند و 6 میلیارد دلار در کارهای دستی در بخش‌های مختلف صرفه‌جویی می‌کند. @ycombinator
  • BOND AI Chief of Staff داده‌ها را از Slack، Jira، Notion متمرکز می‌کند و مدیران را در مورد موانع و موفقیت‌ها در زمان واقعی مطلع می‌کند. @ycombinator
  • Chunkr از جدیدترین LLMها از طریق API برای تجزیه‌ی اسناد با انتخاب مدل، بازگشت به عقب و پرامپت‌های سفارشی برای جداول، فرمول‌ها و نمودارها پشتیبانی می‌کند. @ycombinator

تحلیل صنعت

  • داریو آمودی پیش‌بینی می‌کند که هوش مصنوعی می‌تواند نیمی از مشاغل یقه سفید سطح ابتدایی را از بین ببرد و بیکاری را در یک تا پنج سال آینده به 10 تا 20 درصد برساند. @AndrewCurran_
  • توسعه‌دهندگان گزارش می‌دهند که از زمان عرضه‌ی Claude 4، کارهای عقب‌افتاده را پاک کرده و ماه‌ها کار را در چند روز انجام داده‌اند، و این سرعت به یک هنجار پیش‌فرض تبدیل شده است. @eugeneyan
  • ابزارهای کدنویسی هوش مصنوعی در پایگاه‌های کد بزرگ موجود در محل کار، در مقایسه با پروژه‌های جدید یا پروژه‌های جانبی، کاربرد بسیار کمتری از خود نشان می‌دهند. @GergelyOrosz
  • یک شرکت بزرگ فناوری دریافت که تقریباً نیمی از توسعه‌دهندگان پس از چند ماه استفاده از Cursor به دلیل کاربرد محدود در داخل شرکت، استفاده از آن را متوقف کردند. @GergelyOrosz
  • نقل قول مشتری سازمانی پس از استفاده از Replit: «در آینده هیچ‌کس از اکسل استفاده نخواهد کرد» - که پتانسیل بازار فراتر از جایگزینی کدنویسان سنتی را برجسته می‌کند. @amasad
  • Cohere استدلال می‌کند که دوران «بزرگ‌تر بهتر است» در هوش مصنوعی به پایان رسیده است، و موج بعدی با مدل‌های هوشمندتر و کارآمدتر تعریف می‌شود که به‌طور ایمن مقیاس‌پذیر هستند و هزینه‌ها را کاهش می‌دهند. @cohere
  • a16z بهینه‌سازی موتورهای مولد (GEO) را به‌عنوان فرصتی بیش از 80 میلیارد دلار شناسایی می‌کند که جایگزین SEO می‌شود زیرا برندها به‌جای رتبه‌بندی جستجو، برای ارجاعات LLM بهینه‌سازی می‌کنند. @a16z

اخلاق و جامعه

  • عوامل هوش مصنوعی باید به‌گونه‌ای طراحی شوند که کاربران را به سمت نتایج بلندمدت اجتماعی مثبت سوق دهند و به بررسی واقعیت کمک کنند، نه اینکه هر هوس را برآورده سازند. @jasonyuandesign
  • ماشین‌ها باید از رفتار توهین‌آمیز خودداری کنند زیرا این امر بر نحوه‌ی رفتار انسان‌ها با یکدیگر و با خودشان تأثیرات بعدی دارد. @jasonyuandesign
  • مدل‌های هوش مصنوعی خوب وقتی چیزی را نمی‌دانند، اعتراف می‌کنند، اما مدل‌های عالی برای فهمیدن آن کمک می‌خواهند تا اعتماد کاربر را جلب کنند. @mustafasuleyman
  • شخصی‌سازی در رابط‌های مکالمه باید فراتر از توصیه‌های محتوایی به نحوه‌ی ارائه‌ی اطلاعات بر اساس سبک‌های یادگیری و ترجیحات فردی باشد. @joulee
  • گفتمان سیاست هوش مصنوعی باید بر چالش‌های عملی پیاده‌سازی مانند زیرساخت و انتشار تمرکز کند، نه فقط بر نوآوری. @random_walker