اخبار هوش مصنوعی در 2025-05-28
مدلهای جدید هوش مصنوعی
- مدل DeepSeek R1-v2 در هاگینگ فیس منتشر شد که طبق گزارشها، عملکردی تقریباً همتراز با o3 (بالا) در LiveCodeBench دارد. @AndrewCurran_ @huggingface
- گوگل عامل کدنویسی هوش مصنوعی Jules را با استفاده از Gemini 2.5 Pro منتشر کرد که بهصورت موازی با توسعهدهندگان کار میکند و با گیتهاب یکپارچه میشود. @GoogleAI
- گوگل آزمایش Stitch را راهاندازی کرد که با استفاده از زبان طبیعی و پرامپتهای تصویری، طرحهای رابط کاربری و کد فرانتاند برای دسکتاپ و موبایل تولید میکند. @GoogleAI
- Veo 3 در بیش از 70 کشور در حال عرضه است و برای کاربران حرفهای جهت تولید ویدئو در دسترس قرار گرفته است. @GeminiApp
- میسترال ایآی Codestral Embed را معرفی کرد، مدل جدید و پیشرفتهی امبدینگ برای کد. @MistralAI
- آنتروپیک حالت صوتی را بهصورت بتا در موبایل برای Claude به زبان انگلیسی عرضه کرد که در چند هفتهی آینده برای همهی طرحها در دسترس خواهد بود. @AnthropicAI
- Grok به تلگرام میآید و xAI مبلغ 300 میلیون دلار پول نقد و سهام به اضافهی 50 درصد از درآمد اشتراکهای xAI فروختهشده از طریق تلگرام را دریافت میکند. @AndrewCurran_
پژوهشها
- پژوهشها نشان میدهد که استنتاج دستهای Llama 1B میتواند در یک هستهی CUDA اجرا شود و مرزهای همگامسازی را برای بهینهسازی محاسبات و هماهنگی حافظه حذف کند. @karpathy
- مطالعه نشان میدهد که LLMها را میتوان با آموزش آنها بر روی «سیگنالهای خلاقیت» انسانی (تازگی، تنوع، غافلگیری، کیفیت) خلاقتر کرد، حتی مدلهای کوچکتر نیز بهطور همزمان در هر 4 بعد خلاقیت امتیاز بالاتری کسب میکنند. @emollick
- پژوهش جدیدی در مورد آموزش خودپاداشدهنده (SRT) که در آن مدلهای زبانی پاداش خود را برای آموزش RL در صورت عدم دسترسی به پاسخهای واقعی ارائه میدهند. @rsalakhu
- پژوهش استنفورد به بررسی نمایشهای داخلی دانش واقعی در مدلهای زبان بزرگ و تنوع رمزگذاری حقیقت در LLMها میپردازد. @stanfordnlp
- مقالهی جدیدی به بررسی این موضوع میپردازد که چرا مدلهای فضای حالت (SSM) در یادآوری محتوای خود نسبت به ترنسفورمرها بدتر عمل میکنند، با استفاده از ارزیابیهای مکانیکی. @stanfordnlp
- پژوهش در مورد Chatterbox توسط Resemble AI، شبیهسازی صدای بدون نیاز به آموزش را تنها از 5 ثانیه صدا نشان میدهد که در ارزیابیهای کور بهطور مداوم به ElevenLabs ترجیح داده شده است. @huggingface
کاربردها
- ابزار خط فرمان LLM اکنون از فراخوانی ابزار با توابع یا پلاگینهای پایتون پشتیبانی میکند و با مدلهای OpenAI، Anthropic، Gemini و Ollama کار میکند. @simonw
- Perplexity قابلیت اخبار روزانه را در واتساپ در ساعت 9 صبح به وقت محلی با دستور /news بهعنوان آزمایشی برای پیامرسانی فعال راهاندازی کرد. @AravSrinivas
- Goodfire اولین برنامهی قابل استفادهی عمومی را برای هدایت وزنهای مدل تولید تصویر منتشر کرد که امکان ویرایش مبتنی بر مفهوم را مانند MS Paint اما با مفاهیم بهجای رنگها فراهم میکند. @Deedy
- Odyssey ML ویدئوی تعاملی را معرفی کرد که میتوان آن را تماشا و با آن تعامل کرد، که توسط هوش مصنوعی در زمان واقعی تصور شده است. @eladgil @garrytan
- Visual Electric ارتقای تصویر را تا 6 برابر با سرعتهای بیشتر، پنج حالت حرفهای و بهبود خودکار چهره راهاندازی کرد. @soleio
- Retool Agents با استفاده از APIهای موجود، کوئریهای SQL و گردش کارها بهعنوان ابزارهای LLM، 50 هزار شغل را خودکار میکند و 6 میلیارد دلار در کارهای دستی در بخشهای مختلف صرفهجویی میکند. @ycombinator
- BOND AI Chief of Staff دادهها را از Slack، Jira، Notion متمرکز میکند و مدیران را در مورد موانع و موفقیتها در زمان واقعی مطلع میکند. @ycombinator
- Chunkr از جدیدترین LLMها از طریق API برای تجزیهی اسناد با انتخاب مدل، بازگشت به عقب و پرامپتهای سفارشی برای جداول، فرمولها و نمودارها پشتیبانی میکند. @ycombinator
تحلیل صنعت
- داریو آمودی پیشبینی میکند که هوش مصنوعی میتواند نیمی از مشاغل یقه سفید سطح ابتدایی را از بین ببرد و بیکاری را در یک تا پنج سال آینده به 10 تا 20 درصد برساند. @AndrewCurran_
- توسعهدهندگان گزارش میدهند که از زمان عرضهی Claude 4، کارهای عقبافتاده را پاک کرده و ماهها کار را در چند روز انجام دادهاند، و این سرعت به یک هنجار پیشفرض تبدیل شده است. @eugeneyan
- ابزارهای کدنویسی هوش مصنوعی در پایگاههای کد بزرگ موجود در محل کار، در مقایسه با پروژههای جدید یا پروژههای جانبی، کاربرد بسیار کمتری از خود نشان میدهند. @GergelyOrosz
- یک شرکت بزرگ فناوری دریافت که تقریباً نیمی از توسعهدهندگان پس از چند ماه استفاده از Cursor به دلیل کاربرد محدود در داخل شرکت، استفاده از آن را متوقف کردند. @GergelyOrosz
- نقل قول مشتری سازمانی پس از استفاده از Replit: «در آینده هیچکس از اکسل استفاده نخواهد کرد» - که پتانسیل بازار فراتر از جایگزینی کدنویسان سنتی را برجسته میکند. @amasad
- Cohere استدلال میکند که دوران «بزرگتر بهتر است» در هوش مصنوعی به پایان رسیده است، و موج بعدی با مدلهای هوشمندتر و کارآمدتر تعریف میشود که بهطور ایمن مقیاسپذیر هستند و هزینهها را کاهش میدهند. @cohere
- a16z بهینهسازی موتورهای مولد (GEO) را بهعنوان فرصتی بیش از 80 میلیارد دلار شناسایی میکند که جایگزین SEO میشود زیرا برندها بهجای رتبهبندی جستجو، برای ارجاعات LLM بهینهسازی میکنند. @a16z
اخلاق و جامعه
- عوامل هوش مصنوعی باید بهگونهای طراحی شوند که کاربران را به سمت نتایج بلندمدت اجتماعی مثبت سوق دهند و به بررسی واقعیت کمک کنند، نه اینکه هر هوس را برآورده سازند. @jasonyuandesign
- ماشینها باید از رفتار توهینآمیز خودداری کنند زیرا این امر بر نحوهی رفتار انسانها با یکدیگر و با خودشان تأثیرات بعدی دارد. @jasonyuandesign
- مدلهای هوش مصنوعی خوب وقتی چیزی را نمیدانند، اعتراف میکنند، اما مدلهای عالی برای فهمیدن آن کمک میخواهند تا اعتماد کاربر را جلب کنند. @mustafasuleyman
- شخصیسازی در رابطهای مکالمه باید فراتر از توصیههای محتوایی به نحوهی ارائهی اطلاعات بر اساس سبکهای یادگیری و ترجیحات فردی باشد. @joulee
- گفتمان سیاست هوش مصنوعی باید بر چالشهای عملی پیادهسازی مانند زیرساخت و انتشار تمرکز کند، نه فقط بر نوآوری. @random_walker