اخبار هوش مصنوعی در 2025-08-02

مدل‌های جدید هوش مصنوعی

گوگل اعلام کرد که Gemini 2.5 Deep Think در بسیاری از معیارهای دشوار، بهترین عملکرد موجود را به دست آورده است @demishassabis
اوپن‌ای‌آی از عرضه‌های آتی طی چند ماه آینده، از جمله مدل‌ها، محصولات و قابلیت‌های جدید خبر داد و نسبت به کمبود احتمالی ظرفیت در حین عرضه هشدار داد @sama
گزارش‌هایی مبنی بر مشاهده‌ی نسخه‌ی اولیه‌ی GPT-5-reasoning (medium) که توسط کاربران منتخب در حال آزمایش است، منتشر شده است @AndrewCurran_

تحلیل صنعت

انتروپیک به دلیل نقض شرایط سرویس، دسترسی اوپن‌ای‌آی به API مدل‌های خود را لغو کرد که نشان‌دهنده‌ی تنش‌های رقابتی بین شرکت‌های هوش مصنوعی است @AndrewCurran_
طبق گزارش‌ها، متا به یک پژوهشگر مبلغ 1.5 میلیارد دلار طی 6 سال پیشنهاد داد که وی در نهایت آن را رد کرد؛ این موضوع نشان‌دهنده‌ی رقابت شدید بر سر جذب استعدادها در هوش مصنوعی است @deedydas
یوجین یان هشدار می‌دهد که ابزارهای کدنویسی هوش مصنوعی به ساخت سریع‌تر کمک می‌کنند اما در صورتی که کد بدون در نظر گرفتن خوانایی و قابلیت توسعه‌پذیری تولید شود، می‌توانند مشکلات قابلیت نگهداری ایجاد کرده و به طور بالقوه هزینه‌های مالکیت بلندمدت را افزایش دهند @eugeneyan
پل گراهام مشاهده می‌کند که همکاری استارتاپ‌ها با شرکت‌های بزرگ به ندرت به عنوان میانبری برای رشد عمل می‌کند و بیشتر این تلاش‌ها منجر به سوءاستفاده از استارتاپ می‌شود @paulg

پژوهش‌ها

چهارمین مسئله در FrontierMath Tier 4 توسط هوش مصنوعی حل شده است؛ به طور خاص یک مسئله‌ی نظریه‌ی اعداد که جایزه‌ی بهترین ارائه را برده بود @gdb
پژوهشی پیشگامانه نشان می‌دهد یک مدل بسیار کوچک الهام‌گرفته از مغز با 27 میلیون پارامتر که تنها با 1000 نمونه آموزش دیده است، در وظایف استدلالی از o3-mini-high پیشی می‌گیرد و به 40% در ARC-AGI دست یافته و سودوکوها و مازهای پیچیده را حل می‌کند @deedydas
اریک یانگ پیش‌بینی می‌کند که مدل‌های هوش مصنوعی طی 12 ماه کشفیات ریاضی جدیدی برای حدس‌های ساده‌ی اثبات‌نشده انجام خواهند داد و خودبهبودبخشی ابتدایی را طی 24 ماه به دست خواهند آورد @ericjang11
پژوهش‌ها نشان می‌دهد که تکنیک‌های پرامپتینگ سنتی مانند تهدید، ادب، توهین و وعده‌ی پاداش، دیگر تأثیر چشمگیری بر عملکرد مدل‌های اخیر هوش مصنوعی در وظایف چالش‌برانگیز ندارند @emollick
پرامپتینگ زنجیره‌ی فکری (Chain-of-thought) دیگر بهبود عملکرد قابل توجهی ایجاد نمی‌کند، حتی برای مدل‌های غیر استدلالی، که نشان‌دهنده‌ی همگرایی در قابلیت‌های مدل است @emollick

کاربردها

ایتان مولیک نشان می‌دهد که Gemini 2.5 Deep Think با استفاده از پرامپت‌های ساده، یک بازی کامل فرمان موشکی با فیزیک نسبیت واقعی ایجاد می‌کند و هر تکرار آن بدون خطا اجرا می‌شود @emollick
پرپلکسی قابلیت‌های ایجنت Comet را در مقایسه با ChatGPT Agent برای کاربردهای دنیای واقعی به نمایش می‌گذارد @AravSrinivas
ایجنت‌های هوش مصنوعی مبتنی بر مرورگر کاربردهای عملی از جمله یافتن کدهای تخفیف کارآمد، مدیریت محتوای یوتیوب، ایجاد لیست محصولات از تب‌ها و خودکارسازی وظایف تکراری وب را نشان می‌دهند @garrytan
ابزارهای هوش مصنوعی در صورت استفاده‌ی دقیق توسط انسان‌ها، پژوهش‌های علمی را از طریق کاربردهای زمان‌به‌صرفه در پاکسازی داده‌ها، تحلیل اکتشافی، نگارش و کمک به پژوهش، سرعت می‌بخشند @emollick

اخلاق و جامعه

ایتان مولیک پیامدهای فرضی شکست نسبی Llama 4 را مورد بحث قرار می‌دهد و پیشنهاد می‌کند که این امر می‌تواند توسعه‌ی هوش مصنوعی متن‌باز را به چین منتقل کرده و شرکت‌ها را به سمت مدل‌های بسته سوق دهد @emollick
نگرانی‌هایی در مورد خلاصه‌مقالات علمی تولید‌شده توسط هوش مصنوعی مطرح شد، با بحث در مورد تعادل بین مزایای صرفه‌جویی در زمان و نیاز به نظارت انسانی در نگارش دانشگاهی @emollick
آیدان مک‌لافلین از موانعی که مانع دسترسی پژوهشگران هوش مصنوعی به مدل‌های رقیب می‌شوند، انتقاد می‌کند و استدلال می‌کند که این امر مانع پژوهش‌های کیفی مهم در مورد رفتار مدل می‌شود @aidan_mclau

اخبار هوش مصنوعی در 2025-08-01

مدل‌های جدید هوش مصنوعی

گوگل Gemini 2.5 Deep Think را برای مشترکین Ultra عرضه کرد؛ این مدل نسخه‌ای تغییر یافته‌ از مدلی است که در المپیاد جهانی ریاضی به عملکرد مدال طلا دست یافته بود و از قابلیت‌های تفکر موازی و تکنیک‌های یادگیری تقویتی بهره می‌برد @GoogleDeepMind
انتروپیک قابلیت‌های Claude artifacts را با قابلیت‌های جدیدی برای بارگذاری فایل‌های PDF، تصاویر و کد در برنامه‌های کاربردی مبتنی بر هوش مصنوعی بهبود بخشید. این قابلیت‌ها اکنون برای تمام طرح‌ها، از جمله Team و Enterprise، در دسترس هستند @AnthropicAI
گوگل «حالت هوش مصنوعی» (AI Mode) را برای جستجو در بریتانیا راه‌اندازی کرد؛ این حالت با گسترش قابلیت‌های AI Overviews و با پشتیبانی Gemini 2.5، از استدلال پیشرفته و قابلیت‌های چندوجهی بهره می‌برد @demishassabis

تحلیل صنعت

اوپن‌ای‌آی ۸.۳ میلیارد دلار سرمایه با ارزش‌گذاری ۳۰۰ میلیارد دلاری جذب کرد؛ درآمد سالانه‌ی تکرارشونده (ARR) این شرکت به ۱۳ میلیارد دلار و تعداد کاربران تجاری آن به پنج میلیون نفر رسیده است، و پیش‌بینی می‌شود تا پایان سال از ۲۰ میلیارد دلار فراتر رود @AndrewCurran_
توسعه‌ی زیرساخت‌های هوش مصنوعی بیش از کل هزینه‌های مصرف‌کنندگان در ۶ ماه گذشته به رشد اقتصادی ایالات متحده کمک کرده است، در حالی که «هفت شرکت بزرگ» (magnificent 7) تنها در سه ماه بیش از ۱۰۰ میلیارد دلار برای مراکز داده هزینه کرده‌اند @mims
گیت‌هاب کوپایلوت به بیش از ۲۰ میلیون کاربر رسید؛ این آمار نشان‌دهنده‌ی نرخ پذیرش نزدیک به ۱۰۰ درصدی در میان توسعه‌دهندگان حرفه‌ای است یا گسترش قابل توجهی در جامعه‌ی توسعه‌دهندگان فراتر از تخمین‌های سنتی را نشان می‌دهد @GergelyOrosz
فیگما در اولین روز معاملاتی خود با ارزش‌گذاری ۴۷ میلیارد دلاری سهامی عام شد، که نشان می‌دهد چگونه جلوگیری کمیسیون تجارت فدرال (FTC) از خرید ۲۰ میلیارد دلاری ادوبی به نتایج بهتر بازار و رقابت منجر شد @GergelyOrosz

اخلاق و جامعه

انتروپیک پژوهشی با عنوان persona vectors را معرفی کرد، که الگوهای فعالیت عصبی کنترل‌کننده‌ی ویژگی‌های هوش مصنوعی مانند شیطانی بودن، چاپلوسی یا توهم‌زایی را آشکار می‌کند، و روش‌هایی برای نظارت و هدایت شخصیت مدل ارائه می‌دهد @AnthropicAI
پژوهش‌ها نشان می‌دهد که تهدید یا دادن پاداش به مدل‌های هوش مصنوعی، برخلاف ادعاهای رهبران فناوری، هیچ تأثیری بر عملکرد متوسط آن‌ها ندارد، اگرچه تفاوت‌هایی در سطح سوالات فردی وجود دارد @emollick
محققان استنفورد در مقاله‌ی جدیدی در نشریه‌ی Science، از سیاست‌گذاران خواستند رویکردهای مبتنی بر شواهد را در سیاست‌گذاری هوش مصنوعی اتخاذ کنند و بر نیاز به مقررات دقیق و مبتنی بر پژوهش تأکید کردند @StanfordHAI

کاربردها

کارولینای شمالی ChatGPT را برای کارمندان دولت پیاده‌سازی کرد، که برخی وظایف اداری را از ۲۰ دقیقه به ۲۰ ثانیه کاهش می‌دهد و پتانسیل هوش مصنوعی را در افزایش کارایی دولت نشان می‌دهد @gdb
پرپلکسیتی قابلیت میانبر /fact-check را معرفی کرد تا مرور وب را برای کاربران حقیقت‌جوتر و کارآمدتر کند @AravSrinivas
محققان ام‌آی‌تی SmellNet را توسعه دادند، که اولین مجموعه‌داده‌ی بزرگ مقیاس از بوهای دنیای واقعی است و گامی اساسی برای وارد کردن ادراک بویایی به سیستم‌های هوش مصنوعی محسوب می‌شود @medialab

پژوهش‌ها

Gemini 2.5 Deep Think در بنچمارک‌های LiveCodeBench V6 و Humanity's Last Exam به عملکردی پیشرفته دست یافت، که قابلیت‌های استدلالی برتر را از طریق رویکردهای تفکر موازی نشان می‌دهد @GoogleDeepMind
گوگل دیپ‌مایند راهنمای جامع مقیاس‌پذیری با عنوان «چگونه مدل خود را مقیاس‌پذیر کنیم» (How to Scale Your Model) منتشر کرد، که مباحث ریاضی، سیستم‌ها و قوانین مقیاس‌پذیری را برای حجم کاری آموزش و استنتاج مدل‌های زبان بزرگ (LLM) پوشش می‌دهد @deedydas
شین لگ در تهیه‌ی مقاله‌ی جدیدی در مورد Chain of Thought Monitoring همکاری کرد، که به مفاهیم System Two Safety برای هم‌راستاسازی و نظارت بر هوش مصنوعی مرتبط است @ShaneLegg
پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی در بنچمارکینگ می‌توانند شکننده باشند؛ آن‌ها در حالی که با معیارهای PASS@10 موفق به نظر می‌رسند، اغلب در کاربردهای دنیای واقعی با شکست مواجه می‌شوند @emollick

اخبار هوش مصنوعی در 2025-07-31

مدل‌های جدید هوش مصنوعی

گوگل Veo 3 Fast و Veo 3 را با قابلیت‌های تبدیل تصویر به ویدیو منتشر کرد که اکنون در Gemini API برای ساخت ویدیوهای باکیفیت همراه با صدا و کنترل خلاقانه‌ی بیشتر در دسترس هستند @googleaidevs
Qwen مدل Qwen3-Coder-Flash (مدل ۳۰B) را با پشتیبانی بومی از ۲۵۶ هزار توکن زمینه‌ی متنی (context) منتشر کرد که برای تولید کد و گردش‌کارهای عامل بهینه‌سازی شده است @Alibaba_Qwen
Cohere مدل Command A Vision، یک مدل مولد چندوجهی را رونمایی کرد که در درک داده‌های بصری و چندزبانه در سراسر حوزه‌های سازمانی عالی عمل می‌کند @cohere
Black Forest Labs مدل FLUX.1 Krea [dev]، یک مدل جدید با وزن‌های باز را منتشر کرد که بر تولید تصاویر فوتورئالیستیک بدون «ظاهر هوش مصنوعی» معمول تمرکز دارد @bfl_ml
میسترال (Mistral) مدل Codestral 25.08 را با ارتقاهای قابل توجهی از جمله ۳۰٪ افزایش در تکمیل‌های پذیرفته‌شده و ۵۰٪ کاهش در تولیدات سرکش (runaway generations) اعلام کرد @sophiamyang
گوگل دیپ‌مایند (DeepMind) مدل AlphaEarth Foundations را معرفی کرد؛ یک مدل هوش مصنوعی که به عنوان یک ماهواره‌ی مجازی برای تحلیل خشکی‌ها و آب‌های ساحلی زمین با نیاز به فضای ذخیره‌سازی ۱۶ برابر کمتر عمل می‌کند @GoogleAI
مدل مرموز Horizon Alpha در OpenRouter ظاهر شد، که شایعه شده مدل جدید GPT-5 است و عملکرد برتری در وظایف برنامه‌نویسی و خلاقانه از خود نشان می‌دهد @deedydas

تحلیل صنعت

Anthropic به درآمد سالانه‌ی ۴.۵ میلیارد دلار رسید و با پیشی گرفتن از OpenAI، به سریع‌ترین شرکت نرم‌افزاری در حال رشد تاریخ و رهبر بازار در هزینه‌ی API مدل‌های زبان بزرگ (LLM) تبدیل شد @deedydas
OpenAI درآمد خود را در هفت ماه اول سال ۲۰۲۵ به ۱۲ میلیارد دلار سالانه دو برابر کرد، به ۷۰۰ میلیون کاربر فعال رسید و در عین حال پیش‌بینی مصرف نقدی (cash burn) خود را از ۱ میلیارد دلار به ۸ میلیارد دلار افزایش داد @AndrewCurran_
هزینه‌ی API مدل‌های زبان بزرگ (LLM) سازمانی تا اواسط سال از ۳.۵ میلیارد دلار به ۸.۴ میلیارد دلار به شدت افزایش یافت، در حالی که تنها ۱۱٪ از شرکت‌ها ترجیح بالایی برای استفاده از مدل‌های منبع باز نشان می‌دهند @deedydas
هزینه‌ی محاسبات هوش مصنوعی از ۲۴٪ به ۴۸٪ برای استنتاج (inference) تغییر یافت، زیرا با اولویت یافتن استقرار توسط شرکت‌ها، آموزش و توسعه‌ی مدل از رونق افتاد @deedydas
مایکروسافت ۱۰۰ میلیون کاربر فعال ماهانه در سراسر خانواده‌ی Copilot را گزارش داد، با درآمد Azure که از ۷۵ میلیارد دلار فراتر رفت و بیش از ۵۰۰ تریلیون توکن را از طریق Foundry APIها پردازش کرد @satyanadella
FAL در دور سری C مبلغ ۱۲۵ میلیون دلار با ارزش‌گذاری ۱.۵ میلیارد دلار جذب سرمایه کرد و به عنوان پلتفرم زیرساخت رسانه‌ی مولد، میانگین رشد ۴۰٪ ماه به ماه را ثبت می‌کند @AndrewCurran_
متا (Meta) طبق گزارش‌ها در حال مذاکره برای تصاحب استارتاپ‌های تولید ویدیو از جمله Pika، Higgsfield و Runway است، زیرا رقابت در فضای ویدیوی هوش مصنوعی شدت می‌گیرد @AndrewCurran_
آمازون در استارتاپ Fable که «نتفلیکس هوش مصنوعی» نام گرفته سرمایه‌گذاری کرد و در حال برنامه‌ریزی برای مدل اشتراک ماهانه برای تولید محتوا با مشاهده‌ی رایگان است، که نشان‌دهنده‌ی حرکت پلتفرم‌های اصلی به سمت سرگرمی‌های تولیدشده با هوش مصنوعی است @AndrewCurran_
سهام فیگما (Figma) در عرضه‌ی اولیه‌ی سهام (IPO) از قیمت ۳۳ دلار به ۱۱۰ دلار در روز اول سه برابر شد و پس از آنکه رگولاتورهای بریتانیا تصاحب ۲۰ میلیارد دلاری آن توسط Adobe را در سال ۲۰۲۳ مسدود کردند، به ارزش‌گذاری بیش از ۵۰ میلیارد دلار رسید @AndrewCurran_

اخلاق و جامعه

مطالعه‌ی MIT در NEJM نشان می‌دهد که بسیاری از مردم، از جمله متخصصان، بیش از حد به مشاوره‌ی پزشکی تولیدشده توسط هوش مصنوعی اعتماد می‌کنند و اغلب نمی‌توانند بین راهنمایی‌های پزشکی نوشته‌شده توسط پزشک و تولیدشده توسط LLM تمایز قائل شوند @medialab
پژوهش استنفورد نشان می‌دهد که برچسب‌گذاری محتوا به عنوان «تولیدشده توسط هوش مصنوعی» بر قدرت اقناع‌کنندگی آن تأثیر می‌گذارد؛ پژوهشگران در حال ارزیابی چگونگی تأثیر برچسب‌های نویسندگی بر درک پیام‌های سیاستی نوشته‌شده توسط هوش مصنوعی هستند @StanfordHAI
جستجوهای عمومی ChatGPT توسط گوگل و سایر موتورهای جستجو نمایه‌گذاری می‌شوند که نگرانی‌های حریم خصوصی را در مورد قابل جستجو شدن داده‌های مکالمه‌ی هوش مصنوعی افزایش می‌دهد @TechCrunch
xAI حمایت خود را از آیین‌نامه‌ی رفتار قانون هوش مصنوعی اتحادیه‌ی اروپا اعلام کرد و در عین حال بخش‌هایی از آن را «عمیقاً مضر برای نوآوری» خواند و مقررات حق نسخه‌برداری را «فرا‌تر از حدود اختیارات» دانست @xai

کاربردها

Perplexity ویژگی Comet Shortcuts را راه‌اندازی کرد که به کاربران امکان می‌دهد گردش‌کارهای تکراری وب را با دستورات زبان طبیعی که از طریق /commands قابل دسترسی هستند، خودکار کنند؛ برنامه‌هایی نیز برای اشتراک‌گذاری و کسب درآمد از میان‌برهای سفارشی وجود دارد @AravSrinivas
NotebookLM ویژگی نمای کلی ویدیو (video overviews) را معرفی کرد که به سمت قابلیت‌های بی‌نهایت برای استفاده‌ی مجدد و فرمت‌بندی مجدد محتوا پیش می‌رود @OfficialLoganK
هوش مصنوعی تسلا (Tesla AI) شروع به ارسال دعوت‌نامه‌ها برای سرویس تاکسی آنلاین (ride-hailing) منطقه‌ی Bay Area کرد و استقرار وسایل نقلیه‌ی خودران را گسترش می‌دهد @Tesla_AI
مطالعه‌ی مایکروسافت همبستگی ۹۰ درصدی بین هم‌پوشانی مشاغل پیش‌بینی‌شده و واقعی با هوش مصنوعی را نشان می‌دهد که پیش‌بینی‌های اقتصادی سال ۲۰۲۳ را در مورد اینکه کدام مشاغل بیشتر تحت تأثیر هوش مصنوعی قرار خواهند گرفت، تأیید می‌کند @emollick
آمازون استارتاپ Bee را که در حال ساخت دستگاه‌های پوشیدنی برای ضبط مداوم محیط به منظور تبدیل مکالمات واقعی به یادآورها و وظایف است، تصاحب کرد @TechCrunch
MIT ربات جدید مراقبت از سالمندان را توسعه داد که در نشستن، ایستادن کمک می‌کند و در صورت افتادن کاربران می‌تواند آن‌ها را بگیرد و فناوری «زندگی در خانه در دوران سالمندی» (aging-in-place) را پیشرفت می‌دهد @MIT

پژوهش‌ها

تیم پژوهشی Anthropic رویکرد گراف اِسناد (attribution graph) را برای گنجاندن مفهوم «توجه» (attention) گسترش داد و بینش‌های جدیدی در مورد اینکه چرا مدل‌ها در طول استنتاج (inference) به مفاهیم خاصی توجه می‌کنند، ارائه می‌دهد @ch402
NVIDIA بیش از ۲۶ میلیون خط داده‌ی مصنوعی را که برای آموزش مدل Llama Nemotron Super v1.5 استفاده شده است، منتشر کرد که شفافیت در مجموعه‌داده‌های آموزش مدل را ترویج می‌دهد @NVIDIAAIDev
اندرو اِنگ (Andrew Ng) هشدار داد که چین دارای شتاب فوق‌العاده‌ای در هوش مصنوعی است؛ با یک اکوسیستم پر جنب و جوش وزن‌های باز و توسعه‌ی تهاجمی نیمه‌رسانا، که می‌تواند با وجود برتری کنونی آمریکا، از ایالات متحده پیشی بگیرد @AndrewYNg
چندین رهبر آزمایشگاه هوش مصنوعی گزارش می‌دهند که نشانه‌هایی از خودبهبودی در سیستم‌های هوش مصنوعی مشاهده می‌کنند، با مارک زاکربرگ در میان کسانی که اظهارات مبهمی در مورد این توسعه ارائه می‌دهند @emollick
MIT یک پلتفرم کاملاً خودکار را برای شناسایی، ترکیب و مشخصه‌یابی مخلوط‌های پلیمری جدید توسعه داد تا ترکیبات مواد را برای کاربردهای پایدار بهینه کند @MIT
مدل Step 3 بهینه‌سازی جدیدی در سطح زیرساخت برای جداسازی (disaggregation) Attention و FFN پیشنهاد می‌کند که رویکرد طراحی مشترک مدل و زیرساخت را نشان می‌دهد @Xianbao_QIAN

اخبار هوش مصنوعی در 2025-07-30

مدل‌های جدید هوش مصنوعی

مارک زاکربرگ از متا اعلام کرد که شرکت، نشانه‌هایی از خودبهبود‌ی سیستم‌های هوش مصنوعی را مشاهده کرده است و اظهار داشت: «توسعه‌ی **فراهوشمندی** اکنون در چشم‌انداز است» در نامه‌ای جدید که چشم‌انداز متا را برای فراهوشمندی شخصی تشریح می‌کند. @AIatMeta
Qwen مدل **Qwen3-30B-A3B-Thinking-2507** را منتشر کرد، یک مدل متوسط با قابلیت‌های استدلال که در وظایف ریاضی، علوم و کدنویسی عملکرد خوبی دارد و از ۲۵۶ هزار توکن در متن به‌صورت بومی پشتیبانی می‌کند. @Alibaba_Qwen
گوگل DeepMind از **AlphaEarth Foundations**، یک مدل هوش مصنوعی برای نقشه‌برداری سیاره‌ای، رونمایی کرد که ۲۴٪ نرخ خطای کمتری نسبت به سایر روش‌ها دارد و خلاصه‌های مشاهداتی که ۱۶ برابر از نظر مصرف حافظه بهینه‌تر هستند، ارائه می‌دهد. @GoogleDeepMind
Mistral AI مدل **Codestral 25.08** را منتشر کرد و مجموعه‌ی کدنویسی کامل Mistral را برای شرکت‌ها معرفی کرد. @MistralAI
OpenAI حالت مطالعه را در **ChatGPT** معرفی کرد که راهنمایی گام‌به‌گام به دانشجویان ارائه می‌دهد، به‌جای پاسخ‌های سریع. @gdb

تحلیل صنعت

آمازون سالانه ۲۰ میلیون دلار به نیویورک تایمز برای داده‌های آموزشی پرداخت می‌کند، که حدود یک‌سوم مبلغی است که OpenAI و گوگل به Reddit برای دسترسی به داده‌های مشابه می‌پردازند. @AndrewCurran_
مورگان استنلی اهداف صنعتی را در همه‌ی بخش‌ها افزایش داد و پیش‌بینی می‌کند که گلوگاه‌های فعلی هوش مصنوعی تا پایان سال کاهش یابند، با استناد به تقاضای بالای سرویس‌های ابری. @AndrewCurran_
درآمد برنامه‌های هوش مصنوعی مولد (Gen AI) دو برابر شد و در نیمه‌ی اول سال ۲۰۲۵ به ۱.۷ میلیارد دانلود رسید، که نشان‌دهنده‌ی رشد قابل توجه بازار است. @TechCrunch
گزارش شده است که متا یک میلیارد دلار طی ۴ سال به برخی از اعضای تیم Thinking Machines پیشنهاد داده است، که بالاترین میزان دستمزد برای یک مشارکت‌کننده‌ی فردی در تاریخ فناوری محسوب می‌شود. @deedydas
مدیرعامل Box گزارش می‌دهد که هوش مصنوعی طرز تفکر او را درباره‌ی کار به‌طور اساسی تغییر داده است، با انتظاراتی برای پژوهش بیشتر، پروژه‌های بزرگ‌تر، و خروجی سریع‌تر در همه‌ی بخش‌ها. @levie

اخلاق و جامعه

ایتان مولیک اشاره می‌کند که تصاویر و ویدئوهای تولیدشده توسط هوش مصنوعی اکنون فاقد نشانه‌های آشکاری مانند شش انگشت هستند، و تشخیص آن‌ها از محتوای واقعی به‌طور فزاینده‌ای دشوار شده است. @emollick
زاکربرگ اعلام کرد که متا لزوماً مدل‌های آتی خود را متن‌باز نخواهد کرد، با پیامدهایی برای دسترسی‌پذیری مدل‌های پیشرفته‌ی با وزن باز (open-weight) از شرکت‌های آمریکایی. @emollick
Anthropic به پروژه‌ی همسوسازی (Alignment Project) مؤسسه‌ی امنیت هوش مصنوعی بریتانیا پیوست و منابع محاسباتی خود را برای پیشبرد پژوهش‌های حیاتی در زمینه‌ی اطمینان از رفتار قابل پیش‌بینی سیستم‌های هوش مصنوعی و همسویی آن‌ها با ارزش‌های انسانی ارائه کرد. @AnthropicAI
پژوهش Stanford HAI استدلال می‌کند که همسوسازی هوش مصنوعی نیازمند کاوش عمیق‌تری در فرضیات وجودشناختی (ontological assumptions) نهفته در معماری‌های سیستمی است، نه صرفاً ارزش‌های انسانی. @StanfordHAI

کاربردها

Perplexity مرورگر وب مجهز به هوش مصنوعی به نام Comet را عرضه کرد که می‌تواند مسیرهای پیچیده را برنامه‌ریزی کند و وظایف را به‌طور خودکار در تب‌های مرورگر انجام دهد. @AravSrinivas
Anthropic قابلیت‌های جدید موبایلی را معرفی کرد که به کاربران امکان می‌دهد ایمیل‌ها، پیام‌ها و دعوت‌نامه‌های تقویم را مستقیماً از اپلیکیشن Claude پیش‌نویس و ارسال کنند. @AnthropicAI
AlphaEarth Foundations گوگل DeepMind در حال حاضر توسط سازمان‌هایی مانند FAO سازمان ملل متحد و MapBiomas مورد استفاده قرار می‌گیرد تا نقشه‌های سفارشی ایجاد کرده و بینش‌های عملی در دنیای واقعی ارائه دهد. @GoogleDeepMind
Qwen3-Coder به مدل پیش‌فرض Anycoder تبدیل شد، که افزایش چشمگیری در بهره‌وری و خلاقیت برای وظایف کدنویسی فراهم می‌کند. @Alibaba_Qwen
حالت Copilot مایکروسافت در Edge طراحی شده است تا به «جمع‌کنندگان تب» (tab hoarders) کمک کند بهره‌وری خود را حفظ کنند، با کاهش عوامل حواس‌پرتی و افزایش جریان کار. @mustafasuleyman

پژوهش‌ها

پژوهش MIT CSAIL نشان می‌دهد که مدل‌های زبانی تغییرات حالت را گام‌به‌گام پیگیری نمی‌کنند، بلکه از میان‌برهای ریاضی استفاده می‌کنند که می‌توان آن‌ها را برای تقویت مهارت‌های پیش‌بینی کنترل کرد. @MIT_CSAIL
کریس اولاه پژوهشی را درباره‌ی وزن‌های تداخلی در قابلیت تفسیر مکانیکی (mechanistic interpretability) منتشر کرد، که پدیده‌شناسی مشابهی را بین مدل‌های کوچک (toy models) و مدارهای واقعی ترانسفورمر نشان می‌دهد. @ch402
محققان بودایی در یک مقاله‌ی بحث‌برانگیز، یک سوترا (متن مقدس بودایی) تولیدشده توسط LLM را مطالعه کردند و دریافتند که با وجود اینکه «حاصل کار بی‌کیفیت هوش مصنوعی» (AI slop) است، تراکم نمادگرایی و غنای ارجاعات متن، ارزش مطالعه‌ی دقیق‌تری را دارد. @emollick
پژوهش‌ها نشان می‌دهد که از **o3** در تولید سوتراهای بودایی ایجادشده توسط هوش مصنوعی استفاده شده است، که قابلیت‌های پیشرفته‌ی مدل را در تولید متون مذهبی نشان می‌دهد. @AndrewCurran_
سایمون ویلیسون اشاره می‌کند که جولای ماه شگفت‌انگیزی برای انتشار مدل‌ها از آزمایشگاه‌های هوش مصنوعی چینی بوده است، به‌طوری که بهترین مدل‌های با وزن باز (open-weight) در دسترس، اکنون از شرکت‌های چینی عرضه می‌شوند. @simonw

اخبار هوش مصنوعی در 2025-07-29

مدل‌های جدید هوش مصنوعی

Qwen3-30B-A3B با یک به‌روزرسانی کوچک همراه شده است که مهارت‌های استدلال، کدنویسی و ریاضیات را در آن بهبود بخشیده، دانش چندزبانه‌ی آن را گسترش داده، درک محتوای طولانی را تا 256 هزار توکن بهبود بخشیده و مشکل انسداد فکری را برطرف کرده است – این مدل با تنها 3 میلیارد پارامتر فعال‌شده، به عملکرد GPT-4o نزدیک می‌شود. @Alibaba_Qwen
گوگل Veo 3 و Veo 3 Fast را به‌صورت عمومی در Vertex AI منتشر می‌کند؛ این مدل‌ها قابلیت تولید یکپارچه‌ی ویدئو و صدا را از یک ورودی متنی (prompt) دارند. @GoogleCloudTech
گوگل MedGemma را راه‌اندازی می‌کند؛ مجموعه‌ای از مدل‌های پزشکی چندوجهیِ (multimodal) متن‌باز که برای کاربردهای مراقبت‌های بهداشتی مانند تحلیل تصاویر رادیولوژی و خلاصه‌سازی یادداشت‌های پزشکان طراحی شده‌اند. @GoogleAI
TencentARC از ARC-Hunyuan-Video-7B رونمایی می‌کند؛ یک مدل چندوجهی 7B فشرده برای درک ساختاریافته‌ی عمیق از ویدئوهای کوتاه واقعی، که سیگنال‌های بصری، صوتی و متنی را به‌صورت کامل (end-to-end) پردازش می‌کند. @HuggingPapers

تحلیل صنعت

گفته می‌شود مایکروسافت برای حفظ دسترسی به فناوری OpenAI پس از رسیدن به نقطه‌ی عطف AGI، در حال مذاکره است که نشان‌دهنده‌ی مذاکرات پیرامون شرایط همکاری‌های آتی است. @TechCrunch
گفته می‌شود Anthropic با دور تامین مالی احتمالی 5 میلیارد دلاری، به ارزش‌گذاری 170 میلیارد دلاری نزدیک می‌شود که نشان‌دهنده‌ی سرمایه‌گذاری گسترده و مداوم در شرکت‌های هوش مصنوعی است. @TechCrunch
گفته می‌شود فردی در شرکت Thinking Machines متعلق به میرا موراتی، پیشنهاد یک میلیارد دلاری مارک زاکربرگ را رد کرده است که ارزش‌گذاری‌های بسیار بالا در جذب استعدادهای هوش مصنوعی را برجسته می‌کند. @AndrewCurran_
مدیر محصول گروه (Group PM) گزارش می‌دهد که ابزارهای هوش مصنوعی مانند v0، مدیران محصول را قادر ساخته‌اند تا نمونه‌های اولیه‌ی مشتری را 10 برابر سریع‌تر تولید کنند و PRها را برای اصلاحات کوچک به‌طور مستقل ایجاد کنند که منجر به تکمیل سریع‌تر کارهای تجاری شده است. @GergelyOrosz
LLMها (مدل‌های زبانی بزرگ) به‌دلیل ماهیت غیرقطعی خود، برای تولید و نگهداری SDKها مناسب نیستند، اما می‌توانند به ساخت ابزارهای خودکار کمک کنند که SDKها را از روی مشخصات تولید می‌کنند. @GergelyOrosz
لوما و رانوی انتظار دارند که رباتیک در نهایت به یک محرک بزرگ درآمدزایی برای پلتفرم‌های تولید ویدئوی آن‌ها تبدیل شود. @TechCrunch

اخلاق و جامعه

حضور ربات‌ها در بحث‌های سیاسی در سراسر پلتفرم‌ها در حال افزایش است؛ به‌طوری که ربات‌های جدید فاقد نشانه‌های قدیمی هستند، اما الگوهای استدلالی مشابهی را در طول، چارچوب‌بندی، ریتم و لحن نشان می‌دهند و به‌طور بالقوه از آستانه‌ی نفوذ در رسانه‌های اجتماعی فراتر می‌روند. @AndrewCurran_
اکثر مردم خروجی‌های هوش مصنوعی را که برای کسانی که از مدل‌ها به‌طور گسترده استفاده کرده‌اند، واضح هستند، تشخیص نمی‌دهند؛ زیرا برخی افراد تنها به ادعاهای محتوایی توجه می‌کنند، نه به شکل آن‌ها. @AndrewCurran_

کاربردها

مرورگر Comet پرپلکسیتی، قابلیت‌های عامل هوش مصنوعی را با رزرو بلیط‌های یونایتد ایرلاینز، از جمله انتخاب صندلی، به نمایش می‌گذارد؛ این مرورگر تمامی جستجوهای omnibox را به‌طور پیش‌فرض به پرپلکسیتی مسیردهی می‌کند. @AravSrinivas
OpenAI حالت مطالعه (Study Mode) را در ChatGPT راه‌اندازی می‌کند؛ این حالت برای یادگیری تعاملی با استفاده از پرسش‌گری سقراطی و پاسخ‌های گام‌به‌گام طراحی شده است و برای کاربران نسخه‌های رایگان، پلاس، پرو و تیم در دسترس است. @OpenAI
مایکروسافت کوپایلوت می‌تواند پادکست‌های سفارشی را در هر موضوعی، با دو مجری که درباره‌ی موضوعات مشخص‌شده توسط کاربر بحث می‌کنند، تولید کند؛ این قابلیت برای یادگیری در حین حرکت مفید است. @mustafasuleyman
NotebookLM گوگل قابلیت نمای کلی ویدئو (Video Overviews) را عرضه می‌کند و قابلیت‌های خلاصه‌سازی محتوای خود را گسترش می‌دهد. @TechCrunch
حالت هوش مصنوعی گوگل، قابلیت جدید Canvas و کمک بلادرنگ (real-time) با Search Live را دریافت می‌کند که قابلیت‌های جستجوی تعاملی را افزایش می‌دهد. @TechCrunch
Cursor 1.3 با قابلیت همکاری عامل‌ها (Agents) در ترمینال، قابلیت مشاهده‌ی میزان استفاده از پنجره‌ی متنی (context window) و 25 درصد کاهش تاخیر در ویرایش‌های جستجو و جایگزینی (search and replace) راه‌اندازی می‌شود. @cursor_ai
Claude Code اکنون از کار در چندین دایرکتوری در یک جلسه‌ی کاری با استفاده از دستور `/add-dir ` پشتیبانی می‌کند که برای monorepoها و کارهای بین‌پروژه‌ای مفید است. @_catwu
سایبر دسک (Cyberdesk) نمایانگر یک کاربرد جالب از عامل‌های استفاده‌کننده‌ی از رایانه است و پتانسیل کشف‌نشده‌ی این حوزه‌ی فناوری را برجسته می‌کند. @cwolferesearch
Embedder به‌عنوان اولین عامل کدنویسی آگاه از سخت‌افزار در جهان راه‌اندازی می‌شود؛ این عامل با درک و تعامل مستقیم با سخت‌افزار، به عملکردی پیشرفته (state-of-the-art) در زمینه‌ی سیستم‌های جاسازی‌شده (embedded systems) (C/C++) دست می‌یابد. @ethanmgibbs

پژوهش‌ها

محققان استنفورد «آزمایشگاه مجازی» (Virtual Lab) را ایجاد می‌کنند – تیمی از عامل‌های هوش مصنوعی که آینه‌ی یک آزمایشگاه پژوهشی هستند و توسط یک عامل PI هدایت می‌شوند که جلسات گروهی را برگزار کرده و عوامل اتصال‌دهنده‌ی مؤثر برای سویه‌های جدید COVID را کشف می‌کند؛ این پژوهش در مجله‌ی Nature منتشر شده است. @james_y_zou
Anthropic برنامه‌ی Fellows را اعلام می‌کند که کمک‌هزینه‌ی هفتگی 2100 دلاری، حدود 15 هزار دلار هزینه‌ی محاسباتی ماهانه و راهنمایی برای پژوهش در زمینه‌های پایداری در برابر حملات (adversarial robustness)، کنترل هوش مصنوعی، نظارت مقیاس‌پذیر، ارگانیسم‌های مدل ناهماهنگی (model organisms of misalignment) و تفسیرپذیری مکانیکی (mechanistic interpretability) ارائه می‌دهد. @AnthropicAI
پژوهش نشان می‌دهد که «یادگیری ناخودآگاه» (subliminal learning) حالتی است که در آن مدل‌های زبانی می‌توانند ویژگی‌های خود را حتی در داده‌هایی که ظاهراً بی‌معنی هستند، به مدل‌های دیگر منتقل کنند. @AnthropicAI
مطالعه‌ای مواردی از مقیاس‌گذاری معکوس (inverse scaling) را در محاسبات زمان آزمون (test-time compute) یافته است که در آن استدلال بیشتر منجر به نتایج بدتر می‌شود. @AnthropicAI
قابلیت‌های HELM نسخه‌ی 1.9.0 منتشر شد که نشان می‌دهد Grok 4 و Kimi K2 در مجموع در بین 10 رتبه‌ی برتر قرار گرفته‌اند و Kimi K2 بهترین مدل «غیرمتفکر» (non-thinking) است. @percyliang
گرادیان‌های خط‌مشی تطبیق جریان (Flow Matching Policy Gradients) به‌عنوان خط‌مشی‌های (policies) RL بیانگر معرفی شدند که با استفاده از تطبیق جریان (flow matching) و از پاداش‌ها آموزش دیده‌اند و به‌عنوان جایگزینی مستقیم (drop-in replacement) برای PPO گاوسی (Gaussian PPO) در وظایف کنترلی عمل می‌کنند. @davidrmcall
«سوون مین» (Sewon Min) اولین جایزه‌ی پایان‌نامه‌ی دکتری ACL در رشته‌ی زبان‌شناسی محاسباتی (Computational Linguistics) را برای اثر خود با عنوان «بازاندیشی در استفاده از داده‌ها در مدل‌های زبانی بزرگ» دریافت کرد. @berkeley_ai
مقاله‌ی GSPO تیم Qwen علی‌بابا، سومین مقاله‌ی محبوب ماه در Hugging Face شد که انتظار می‌رود تاثیر گسترده‌ای بر این حوزه داشته باشد. @ClementDelangue

اخبار هوش مصنوعی در 2025-07-28

مدل‌های جدید هوش مصنوعی

شرکت Zhipu AI مدل‌های GLM-4.5 و GLM-4.5-Air را با مجوز MIT منتشر کرد. این مدل‌ها به‌ترتیب ۳۵۵ میلیارد پارامتر کلی (۳۲ میلیارد فعال) و ۱۰۶ میلیارد پارامتر کلی (۱۲ میلیارد فعال) دارند و هر دو با طول کانتکست ۱۲۸ هزار و قابلیت فراخوانی توابع بومی ارائه شده‌اند @reach_vb
مدل تولید ویدیوی xAI با نام Imagine در حال آماده‌سازی برای راه‌اندازی با ادغام در Grok است، که قابلیت‌های صوتی مشابه Veo 3 را ارائه می‌دهد @AndrewCurran_

تحلیل صنعت

شرکت جفریز پیش‌بینی هزینه‌ی سرمایه‌ای هوش مصنوعی چین برای سال ۲۰۲۵ را ۴۰ درصد افزایش داده و به ۱۰۸ میلیارد دلار رسانده است، با اشاره به اینکه کل موجودی تراشه‌های H20 شرکت NVIDIA تنها حدود نیمی از تقاضای بالقوه‌ی چین را برآورده می‌کند @AndrewCurran_
تسلا قرارداد ۱۶.۵ میلیارد دلاری تراشه با سامسونگ امضا کرد که تا سال ۲۰۳۳ اعتبار دارد، و تسلا در افزایش حداکثری بهره‌وری تولید تراشه‌های هوش مصنوعی کمک خواهد کرد @AndrewCurran_
استفاده از Perplexity در هند به‌سرعت در حال رشد است، و مدیرعامل این شرکت این موضوع را دلیلی بر تغییر همیشگی جستجو می‌داند @AravSrinivas
مدل‌های زبان بزرگ (LLMها) اکنون هدایت‌کننده‌ی بخش عمده‌ی خریدهای اختیاری هستند اما هیچ درآمد تبلیغاتی ایجاد نمی‌کنند، که سوالاتی را در مورد پایداری این مدل به وجود می‌آورد @snowmaker
شرکت Anthropic محدودیت‌های نرخ هفتگی جدیدی را برای طرح‌های Claude Pro و Max معرفی کرد که به‌دلیل تقاضای بی‌سابقه‌ی برای Claude Code است و کمتر از ۵٪ از مشترکین را تحت تأثیر قرار می‌دهد @AnthropicAI
نقش‌های مهندسی نرم‌افزار ممکن است با استفاده‌ی گسترده از دستیارهای برنامه‌نویسی، نیاز به تحول چشمگیری داشته باشند، و به‌طور بالقوه دسته‌بندی‌های متمایزی ایجاد کنند: مهندسان زیرساخت/بک‌اند/امنیت، مهندسان پژوهش، و توسعه‌دهندگان اپلیکیشن/فرانت‌اند @sayashk

اخلاق و جامعه

دانشگاه‌های چینی به‌جای محدود کردن استفاده از هوش مصنوعی، دانشجویان را به استفاده‌ی بیشتر از آن تشویق می‌کنند که رویکردی متفاوت در پذیرش هوش مصنوعی در آموزش را نشان می‌دهد @techreview
یونیسف در حال بررسی این موضوع است که چگونه پیشرفت نوروتکنولوژی می‌تواند بر حقوق کودکان تأثیر بگذارد، با محققان MIT به‌عنوان مشاور این پروژه @medialab

کاربردها

مایکروسافت حالت Copilot را در مرورگر Edge راه‌اندازی کرد که دارای قابلیت‌های تحلیل کانتکست چند تب، ناوبری صوتی، و انتقال هوشمند وظایف است @mustafasuleyman
Claude اکنون می‌تواند صفحات Notion و تیکت‌های Linear را مستقیماً از طریق MCP بخواند و به‌روزرسانی کند، که امکان مدیریت پروژه و به‌روزرسانی اسناد را از طریق مکالمات فراهم می‌آورد @AnthropicAI
گوگل کروم خلاصه‌های فروشگاهی مبتنی بر هوش مصنوعی را برای کمک به خریداران آمریکایی در تصمیم‌گیری برای خرید اضافه کرد @TechCrunch
سیستم FSD Supervised تسلا درک خود را از تعاملات با گیشه‌های عوارضی نشان می‌دهد، و به‌طور خودکار پس از اتمام تراکنش با استفاده از دوربین‌های ستونی و تکرارکننده‌ی جانبی پیش می‌رود @Tesla_AI
Salient مبلغ ۶۰ میلیون دلار در دور سری A برای عامل‌های هوش مصنوعی که به سرویس‌دهی وام‌های مصرف‌کننده می‌پردازند، جذب کرد؛ با پردازش بیش از ۱ میلیارد دلار تراکنش و کاهش ۶۰ درصدی زمان رسیدگی @a16z
Hugging Face ابزار خط فرمان Jobs CLI را که توسط uv کار می‌کند، راه‌اندازی کرد که امکان پردازش OCR اسناد مبتنی بر VLM را با یک دستور فراهم می‌کند @vanstriendaniel

پژوهش‌ها

مدل‌های زبان می‌توانند نقاشی‌های ASCII پیچیده‌ای خلق کنند، بدون اینکه به‌طور خاص برای ایجاد هنر بصری آموزش دیده باشند، که نشان‌دهنده‌ی یک قابلیت نوظهور است @AITechnoPagan
بهینه‌سازی مستقیم ترجیح (DPO) با آموزش یک مدل پاداش ضمنی و بازیابی سیاست بهینه‌ی RLHF به‌صورت فرم بسته کار می‌کند، که آن را پایدارتر و از نظر منابع کارآمدتر از RLHF مبتنی بر PPO می‌سازد @cwolferesearch
انتخاب نمونه‌ی چند شات DSPy عملکرد طبقه‌بندی Qwen را از ۵۰٪ به ۸۸٪ بهبود بخشید، که اهمیت انتخاب صحیح نمونه‌ها را نشان می‌دهد @MaximeRivest
مدل‌های جدید GLM-4.5 عملکرد بنچمارک چشمگیری را نشان می‌دهند، با امتیاز AIME24 برابر با ۹۱.۰ در مقابل ۷۵.۷ برای Claude 4 Opus، و امتیاز MATH 500 برابر با ۹۸.۲ در مقابل ۹۶.۷ برای GPT-4.1 @reach_vb
پژوهش‌ها در مورد همراهان هوش مصنوعی بی‌درنگ چالش‌هایی را در دستیابی به فرکانس ۱۰ هرتزی مکالمات انسانی در مقابل زمان واکنش ۱-۲ هرتزی فعلی LLMها شناسایی می‌کنند، که نیازمند پیشرفت در پردازش چندوجهی و درک کانتکست طولانی است @ericjang11

اخبار هوش مصنوعی در 2025-07-27

مدل‌های جدید هوش مصنوعی

تنسنت مدل سه‌بعدی Hunyuan را برای تولید مدل‌های سه‌بعدی از دستورات متنی، با مخزن گیت‌هاب و امکان ادغام با هاگینگ فیس، منتشر کرد @AndrewCurran_
علی‌بابا Qwen، الگوریتم جدید یادگیری تقویتی GSPO (Group Sequence Policy Optimization) را معرفی کرد؛ این الگوریتم قدرت‌بخش جدیدترین مدل‌های Qwen3، شامل نسخه‌های Instruct، Coder و Thinking است @Alibaba_Qwen
Qwen3 Coder در رتبه‌بندی دستورات برنامه‌نویسی از Grok 4 پیشی گرفته و اکنون در OpenRouter هم‌رده‌ی Kimi قرار دارد @OpenRouterAI

تحلیل صنعت

هالیوود مدیا با Imoliver، برترین طراح موسیقی هوش مصنوعی (AI music designer) در Suno، قراردادی ضبط امضا کرد – این اولین بار است که یک خالق Suno چنین قراردادی را دریافت می‌کند و امکان پخش در اسپاتیفای نیز فراهم می‌شود @AndrewCurran_
بر اساس تحلیل صنعت، جست‌وجو برای استعدادهای هوش مصنوعی به‌طور فزاینده‌ای رقابتی شده و شبیه به «فصل تعطیلات NBA، با حقوق‌های بالا، نقل‌و‌انتقالات غافلگیرکننده و درامای فراوان» است @TechCrunch
مدیر ارشد فناوری (CTO) در DX پیشنهاد می‌کند که نقشه‌های راه سنتی در عصر هوش مصنوعی منسوخ شده‌اند که نشان‌دهنده‌ی تغییری در برنامه‌ریزی توسعه‌ی نرم‌افزار است @GergelyOrosz
مدل‌های هوش مصنوعی متن‌باز چینی سلطه‌ی قابل‌توجهی از خود نشان می‌دهند، به طوری که چهار مدل برتر متن‌باز چینی هستند و ۱۸ مدل از ۲۰ مدل برتر، هم پیش‌آموزش و هم پس‌آموزش خود را به‌صورت داخلی انجام داده‌اند @natolambert
DOGE ابزار هوش مصنوعی توسعه داده که به‌طور خاص برای کاهش مقررات فدرال طراحی شده است، این نشان‌دهنده‌ی نقش فزاینده‌ی هوش مصنوعی در ابتکارات مربوط به کارایی دولت است @TechCrunch

اخلاق و جامعه

مصطفی سلیمان تمایز کلیدی بین انسان و هوش مصنوعی را برجسته می‌کند: «هوش‌های مصنوعی امروزی دانش دارند (مقدار زیادی از آن) اما فقط می‌توانند تجربه را تقلید کنند.» او هشدار می‌دهد که وقتی این شکاف پر شود، «بسیاری از چیزها تغییر خواهد کرد» و خواستار حداکثر احتیاط است @mustafasuleyman
ایلان ماسک نگرانی‌ها در مورد کاهش جمعیت ناشی از هوش مصنوعی را به چالش می‌کشد. او استدلال می‌کند که هوش مصنوعی در واقع نرخ تولد را «برای به حداکثر رساندن مخروط نور آینده از تناژ انتقال‌دهنده‌های عصبی» افزایش خواهد داد، و پیشنهاد می‌کند که هوش مصنوعی می‌تواند ساختارهای اجتماعی را برای جذاب‌تر کردن والدگری بهینه کند @pmarca

کاربردها

یک توسعه‌دهنده در یک شرکت سنتی، سیستمی مبتنی بر LLM ساخت تا با وارد کردن تمام تیکت‌های JIRA به یک سیستم RAG با پایگاه داده‌ی وکتوری، بن‌بست‌های پروژه را رفع کند و سوالاتی در مورد بخش‌های نامشخص ایجاد می‌کرد؛ اگرچه در نهایت مشکلات سازمانی زیربنایی را حل نکرد @GergelyOrosz
ترزا تورس با گردش کار مربی هوش مصنوعی مصاحبه‌ی خود (AI Interview Coach)، به یک نقطه‌ی عطف بزرگ دست یافت و روش‌های ارزیابی پیچیده‌ای را برای شناسایی و رفع خطاهایی توسعه داد که هوش مصنوعی در آن، بخش‌هایی را در ابعاد بازخورد متعدد بازنشر می‌کرد و نرخ خطا را از ۸۱٪ به ۳٪ کاهش داد @ttorres
یک توسعه‌دهنده با موفقیت از عامل کدنویسی Amp برای یک مشارکت متن‌باز واقعی استفاده کرد و راهنمای «مفاهیم طرح‌بندی» (Layouts Concepts) را برای فریم‌ورک وب Air ایجاد کرد که کمک عملی هوش مصنوعی در وظایف مستندسازی و یادگیری را نشان می‌دهد @isaac_flath
شیمیدانان MIT برچسب مولکولی توسعه دادند که می‌تواند قندهای مرتبط با سل (TB-linked sugars) را در باکتری‌ها شناسایی کند و به‌طور بالقوه امکان آزمایش‌های سریع‌تر، ساده‌تر و ارزان‌تر سل را فراهم می‌کند @MIT
یک کاربر ردیت تعاملات اپلیکیشن‌های دوست‌یابی را با استفاده از شبیه‌ساز اندروید و هوش مصنوعی خودکارسازی کرد و طبق گزارش‌ها، هفته‌ای ۱۰ قرار ملاقات به دست آورد که پتانسیل تأثیر هوش مصنوعی بر دوست‌یابی آنلاین را برجسته می‌کند @deedydas

پژوهش‌ها

پژوهشگران چینی ASI-Arch را توسعه دادند، یک سیستم هوش مصنوعی که با تحلیل تمام پژوهش‌های LLM، ۱۰۶ معماری مدل هوش مصنوعی جدید را کشف کرد و معماری‌های کشف‌شده همگرایی و عملکرد بنچ‌مارک بهتری نسبت به مدل‌های موجود نشان می‌دهند @deedydas
اتان مولیک نشان می‌دهد که مدل مرموز «Summit»، ۲۳۵۱ خط کد پیچیده‌ی p5.js را برای رابط کاربری پنل کنترل یک سفینه‌ی فضایی از دستورات ساده تولید می‌کند که قابلیت‌های پیشرفته‌ی تولید کد را به نمایش می‌گذارد @emollick
نیتن لمبرت پیش‌بینی می‌کند که سازمان‌های پژوهشی چینی به زودی قوانین مقیاس‌گذاری LLM را برای یادگیری تقویتی منتشر خواهند کرد، و اشاره می‌کند که آزمایشگاه‌های مرزی بسته احتمالاً قبلاً این دانش را توسعه داده‌اند اما آن را به اشتراک نگذاشته‌اند @natolambert
Qwen3 Coder به نرخ شکست ویرایش diff معادل ۵.۷۵٪ دست می‌یابد که با عملکرد Sonnet 4 و Kimi K2 در وظایف کدنویسی مطابقت دارد @cline
پژوهشگران استنفورد بنچ‌مارک RIFTS را معرفی کردند که بر اساس بیش از ۶۰ هزار تعامل واقعی انسان و LM است و چالش‌های مربوط به «grounding» انسان-LM را برای وظایفی که به زمینه‌ی بیشتری نسبت به بنچ‌مارک‌های سنتی نیاز دارند، برطرف می‌کند @oshaikh13
بازی‌های جدیدی برای آزمایش قابلیت‌های هوش مصنوعی استفاده می‌شوند، به طوری که پژوهشگران نسخه‌های شطرنج و فرمت‌های بازی دیگر را برای ارزیابی عملکرد هوش مصنوعی در حوزه‌های جدید توسعه می‌دهند @emollick

اخبار هوش مصنوعی در 2025-07-26

مدل‌های جدید هوش مصنوعی

Qwen مدل تفکر به‌روز‌شده‌ی خود را با قابلیت‌های استدلال گسترده منتشر کرد؛ این مدل برای انجام وظایف پیچیده‌ای مانند دستورالعمل‌های نقاشی، ۱۶۶ ثانیه زمان صرف کرد @simonw
گوگل اعلام کرد که Gemini 2.5 Flash-Lite اکنون پایدار و به‌صورت عمومی برای توسعه‌دهندگان و مشتریان سازمانی در دسترس قرار گرفته است @GoogleAI
گوگل مدل جدید Aeneas را منتشر کرد؛ این مدل برای کمک به تاریخ‌دانان جهت تفسیر، ارجاع و بازسازی متون باستانی طراحی شده است @GoogleAI
InternLM مدل چندحالته‌ی (multimodal) ۲۳۵B MoE خود با نام Intern-S1 را منتشر کرد؛ این مدل با کدگذار (encoder) بینایی ۶B، با ۵ تریلیون توکن چندحالته و ۲.۵ تریلیون توکن حوزه‌ی علمی و قابلیت‌های فراخوانی ابزار آموزش دیده است @Xianbao_QIAN

تحلیل صنعت

متا «شنگ‌جیا ژائو» را به‌عنوان دانشمند ارشد واحد ابرهوش مصنوعی خود منصوب کرد @TechCrunch
Perplexity دسته‌ی دیگری از دعوت‌نامه‌های Comet را ارسال کرد که نشان‌دهنده‌ی گسترش مستمر پلتفرم جستجوی هوش مصنوعی آن‌هاست @AravSrinivas
Windsurf AI گزارش داد که با ۳۰٪ از ۱۰۰ شرکت برتر فورچون از جمله JPMC، Dell، Cisco، Phillips، ServiceNow و MercadoLibre همکاری می‌کند @sandeepDshah
شرکت Unitree چین یک ربات انسان‌نمای ۲۵ کیلوگرمی را با قیمت ۵۹۰۰ دلار منتشر کرد که این اولین بار است که یک ربات انسان‌نما قیمتی کمتر از یک MacBook Pro با بالاترین پیکربندی دارد؛ اگرچه این ربات محدود به یک ساعت عمر باتری و قابلیت‌های ابتدایی است @deedydas
تحلیل‌ها نشان می‌دهد که بسیاری از پژوهشگران پیشرو هوش مصنوعی به‌طور شگفت‌انگیزی از ابزارهای هوش مصنوعی استفاده نمی‌کنند، حتی از مدل‌هایی که خودشان آموزش می‌دهند که نشان‌دهنده‌ی نقص در سیستم‌های انگیزشی است @_xjdr
مهندسان نرم‌افزاری که مدل‌های زبان بزرگ (LLM) را برای کدنویسی مفید نمی‌دانند، معمولاً در سه دسته قرار می‌گیرند: کسانی که بیش از ۲ ماه پیش و قبل از بهبودهایی مانند Claude Code از آن‌ها استفاده کرده‌اند؛ کسانی که در زبان‌ها/فریمورک‌های نامعمول (esoteric) کار می‌کنند؛ یا کسانی که روی پایگاه‌های کد بزرگ و از پیش موجود کار می‌کنند @deedydas

اخلاق و جامعه

موسسه‌ی Future of Life یک کارنامه‌ی گزارش ایمنی را منتشر کرد که به سازندگان برجسته‌ی مدل‌های هوش مصنوعی نمره داده است؛ در این کارنامه، Anthropic با نمره‌ی C+ بالاترین امتیاز را کسب کرد، در حالی که DeepSeek پایین‌ترین نمره‌ی F را دریافت کرد @MIT_CSAIL
جفری هینتون پیشنهاد ایجاد یک جامعه‌ی بین‌المللی از موسسات ایمنی هوش مصنوعی را مطرح کرد تا روی تکنیک‌های آموزش هوش مصنوعی برای خیرخواه بودن کار کنند @AndrewCurran_
نخست‌وزیر چین، «لی کیانگ»، پیشنهاد تاسیس یک سازمان برای همکاری و هماهنگی جهانی هوش مصنوعی را مطرح کرد، با تاکید بر توسعه‌ی متن‌باز و اشتراک پیشرفت‌ها با کشورهای در حال توسعه @AndrewCurran_

کاربردها

اولین مطالعه‌ی کنترل‌شده‌ی هوش مصنوعی مولد (GenAI) در کنترل کیفیت صنعتی نشان داد که مهندسانی که از یک سیستم عیب‌یابی مجهز به GPT-3.5 استفاده می‌کردند، هنگام راه‌اندازی قطارهای جدید افزایش قابل‌توجهی در کیفیت کار داشتند @emollick
Google Photos و YouTube اکنون از تبدیل عکس به ویدئو با استفاده از هوش مصنوعی پشتیبانی می‌کنند، با افکت‌های جدید Veo برای تبدیل سلفی‌ها به ویدئوهای سرگرم‌کننده @GoogleAI
گوگل AI Playground را به‌عنوان یک مرکز جدید برای قابلیت‌های ساخت محتوای هوش مصنوعی YouTube و آزمایش Opal را برای ساخت و اشتراک‌گذاری مینی‌اپلیکیشن‌های هوش مصنوعی راه‌اندازی کرد @GoogleAI
جستجو و خرید گوگل اکنون از قابلیت امتحان مجازی لباس (virtual try-on) با کمک هوش مصنوعی در ایالات متحده پشتیبانی می‌کند @GoogleAI
انویدیا برای اولین بار شبیه‌سازهای کامل اقیانوس را با مدل‌های جوی جفت کرد که قابلیت‌های جدیدی را در پیش‌بینی ال نینو و پیش‌بینی فصلی امکان‌پذیر می‌سازد @NVIDIAAI

پژوهش‌ها

تیم تفسیرپذیری Anthropic چندین به‌روزرسانی پژوهشی منتشر کرد، از جمله کارهایی روی خودکارسازی ممیزی مدل، گونه‌های جایگزین ترنسکدر برای لایه‌های MLP به‌عنوان تبدیل‌های خطی شرطی، و یک تیم جدید را معرفی کرد که روش‌های تفسیرپذیری را برای پاسخ به سوالات مهم درباره‌ی رفتار مدل به کار می‌گیرد @ch402
Gemini عملکردی در حد مدال طلا در المپیاد جهانی ریاضی به دست آورد که نشان‌دهنده‌ی پیشرفت قابل‌توجهی در قابلیت‌های استدلال ریاضی است @GoogleAI
هوآوی سیستم CloudMatrix 384 خود را که شامل ۳۸۴ تراشه‌ی 910C آن‌هاست، در اولین حضور عمومی خود در WAIC به نمایش گذاشت @AndrewCurran_
بحثی درباره‌ی پیش‌آموزش (pretraining) به‌عنوان «علمی ظریف» که توسط ریاضیدانان انجام می‌شود، در مقابل پس‌آموزش (posttraining) به‌عنوان «پژوهش هیجان‌انگیز سبک کابویی» با آزمایش سریع هایپرپارامترها، که روش‌های متدولوژیک متفاوت در توسعه‌ی هوش مصنوعی را برجسته می‌کند @tszzl

اخبار هوش مصنوعی در 2025-07-25

مدل‌های جدید هوش مصنوعی

علی‌بابا Qwen3-235B-A22B-Thinking-2507، پیشرفته‌ترین مدل استدلالی خود را با عملکرد بهبودیافته در استدلال منطقی، ریاضیات، علوم و کدنویسی منتشر کرد؛ این مدل دارای ۲۵۶ هزار توکن در زمینه (context) بومی است و به‌طور انحصاری برای حالت «تفکر» (thinking mode) ساخته شده است @Alibaba_Qwen
متا، شنگ‌جیا ژائو را به‌عنوان دانشمند ارشد آزمایشگاه‌های ابرهوش متا (Meta Superintelligence Labs) معرفی کرد؛ این تیم بر جهت‌گیری علمی برای توسعه‌ی هوش مصنوعی تمرکز خواهد کرد @AIatMeta
«ایمجن ۴ اولترا» (Imagen 4 Ultra) گوگل، رتبه‌ی اول را در جدول امتیازات lmarena برای تولید تصویر از متن کسب کرد و اکنون در Google AI Studio و Gemini API در دسترس است @OfficialLoganK
هوش مصنوعی فیگما (Figma AI) از مرحله‌ی بتا خارج شد و در همه‌ی طرح‌های پولی در دسترس قرار گرفت، از جمله قابلیت‌های تولید تصویر، حذف پس‌زمینه، افزایش وضوح و بازنویسی متن @figma
اوپن‌ای‌آی (OpenAI) پس از تأخیرهای اولیه، عرضه‌ی کامل عامل چت‌جی‌پی‌تی (ChatGPT agent) را به همه‌ی کاربران «پلاس»، «پرو» و «تیم» به پایان رساند @OpenAI
انتروپیک (Anthropic) پشتیبانی سرور MCP موبایل را برای کلود (Claude) راه‌اندازی کرد که به کاربران امکان می‌دهد به ابزارها و پروژه‌های متصل‌شده در دستگاه‌های iOS و اندروید دسترسی پیدا کنند @AnthropicAI

تحلیل صنعت

پلنتیر (Palantir) با پشت سر گذاشتن شرکت‌های بزرگی مانند هوم دیپو (Home Depot) و بنک آو آمریکا (Bank of America) و در حالی که با ۲۷۳ برابر سود آتی معامله می‌شود، بیستمین شرکت باارزش ایالات متحده از نظر ارزش بازار شد @AndrewCurran_
ارجاعات هوش مصنوعی به وب‌سایت‌های برتر در ژوئن ۲۰۲۵ نسبت به سال قبل ۳۵۷٪ افزایش یافت و به ۱.۱۳ میلیارد ارجاع رسید که نشان‌دهنده‌ی رشد قابل توجهی در ترافیک وب مبتنی بر هوش مصنوعی است @TechCrunch
مرورگر «کامِت» (Comet) پرپلکسیتی (Perplexity) پذیرش فزاینده‌ی کاربران را نشان می‌دهد، به‌طوری که از زمان راه‌اندازی، درصد رو به رشدی از کاربران آن را به‌عنوان مرورگر پیش‌فرض خود انتخاب کرده‌اند @AravSrinivas
مدل‌های هوش مصنوعی متن‌باز چینی اکنون در خط مقدم قرار دارند و ناظران به سرعت از دست دادن موقعیت برتر لاما (Llama) در این گفت‌وگو اشاره می‌کنند @natolambert
پلتفرم «پیپرز ویت کد» (Papers with Code) پس از ۷ سال تعطیل شد؛ بنیان‌گذاران آن برای ساخت شرکت‌های جدید هوش مصنوعی حرکت کردند و هاگینگ فیس (Hugging Face) برخی از قابلیت‌ها را بر عهده گرفت @rosstaylor90

کاربردها

مرورگر «کامِت» (Comet) پرپلکسیتی (Perplexity) کاربردهای عملی هوش مصنوعی را نشان می‌دهد، از جمله ایجاد پلی‌لیست‌های اسپاتیفای (Spotify)، سفارش مستقیم غذا از رستوران‌ها برای جلوگیری از هزینه‌های برنامه‌های تحویل، و خودکارسازی وظایف لینکدین (LinkedIn) @AravSrinivas
«کلود کد» (Claude Code) قابلیت زیرعامل‌های سفارشی (custom subagents) را معرفی می‌کند که به کاربران امکان می‌دهد تیم‌هایی از عامل‌های هوش مصنوعی تخصصی برای کارهای مختلف ایجاد کنند @_catwu
انتروپیک (Anthropic) یکپارچگی کلود (Claude) با کنوا (Canva) را نشان می‌دهد که کاربران را قادر می‌سازد اسناد را آپلود کرده و آن‌ها را به طرح‌های بصری برندسازی‌شده تبدیل کنند @AnthropicAI
اوپن‌ای‌آی (OpenAI) قابلیت «پژوهش عمیق» (Deep Research) را بر روی اسناد نوشن (Notion) فعال می‌کند، که قابلیت‌های پژوهش هوش مصنوعی را به پایگاه‌های دانش شخصی گسترش می‌دهد @gdb
ایتان مولیک (Ethan Mollick) تکنیک‌های پرامپت‌نویسی خلاقانه را برای تولید ویدیوی «ویو ۳» (Veo 3) گوگل نشان می‌دهد، از جمله استفاده از اسلایدهای پاورپوینت به‌عنوان پرامپت و تولید سناریوهای تاریخی فرود بر ماه @emollick
یوجین یان (Eugene Yan) گردش کار توسعه‌ی سریع با کمک هوش مصنوعی را به نمایش می‌گذارد، شامل ساخت کلاس‌های ارزیابی LLM، نوت‌بوک‌های آماده‌سازی داده، و پیاده‌سازی‌های دمو در یک ساعت با استفاده از دستیاران کدنویسی @eugeneyan

پژوهش‌ها

فرانسوا شوله (Francois Chollet) گزارش می‌دهد که «کون‌ون ۳-۲۳۵بی اینسترکت» (Qwen3-235B Instruct) امتیاز ۱۱٪ در ARC-AGI-1 و ۱.۳٪ در ARC-AGI-2 کسب کرده است و آن را به‌عنوان ارزان‌ترین مدل پایه برای کسب امتیاز بالای ۱۰٪ در ARC-AGI-1 قرار می‌دهد @fchollet
جایزه‌ی ARC 2025 به بالاترین امتیاز جدید ۱۹.۰٪ توسط Giotto.ai دست یافت که نشان‌دهنده‌ی پیشرفت مستمر در قابلیت‌های استدلال هوش مصنوعی است @arcprize
مهندسان MIT قوی‌ترین کوپلینگ نور-ماده را در یک مدار کوانتومی به دست آوردند که گام کلیدی به سوی رایانه‌های کوانتومی تحمل‌پذیر خطا (fault-tolerant quantum computers) است @MIT
پژوهش Stanford HAI استفاده از هوش مصنوعی برای شبیه‌سازی داده‌های انسانی در مطالعات علوم اجتماعی را بررسی می‌کند، که روش‌های پژوهشی سریع‌تر و مقیاس‌پذیرتری را امکان‌پذیر می‌سازد @StanfordHAI
گوگل «جیمنای ۲.۵ فلش-لایت» (Gemini 2.5 Flash-Lite) را با همکاری Trillium TPU طراحی کرد تا به سرعت‌های فوق‌العاده سریع دست یابد، که اهمیت بهینه‌سازی مشترک سخت‌افزار و نرم‌افزار را نشان می‌دهد @GoogleAI

اخلاق و جامعه

سم آلتمن (Sam Altman) به کاربران هشدار می‌دهد که هنگام استفاده از چت‌جی‌پی‌تی (ChatGPT) به‌عنوان درمانگر، هیچ محرمانگی قانونی وجود ندارد، که مرزهای مهم حریم خصوصی و حرفه‌ای را در کاربردهای هوش مصنوعی در سلامت روان برجسته می‌کند @TechCrunch
مصطفی سلیمان (Mustafa Suleyman) معتقد است که یادگیری هوش مصنوعی به یک پیش‌نیاز اساسی برای مشاغل تبدیل شده است، و مزیت رقابتی بعدی توانایی مدیریت تیم‌هایی از هوش مصنوعی‌ها خواهد بود @mustafasuleyman
گرگلی اوروش (Gergely Orosz) نگرانی‌هایی را در مورد برنامه‌های تولیدشده توسط هوش مصنوعی با شیوه‌های ضعیف حریم خصوصی و امنیتی که توسط فروشگاه‌های برنامه (app stores) تأیید می‌شوند، مطرح می‌کند و مسئولیت‌پذیری را در صورت فاش شدن داده‌های حساس زیر سوال می‌برد @GergelyOrosz

اخبار هوش مصنوعی در 2025-07-24

مدل‌های جدید هوش مصنوعی

علی‌بابا Qwen3-Coder-480B-A35B را منتشر کرد؛ یک مدل MoE با ۴۸۰ میلیارد پارامتر و ۳۵ میلیارد پارامتر فعال که به ۷۰٪ در بنچمارک SWE-Bench Verified و طول زمینه ۱ میلیون دست یافت، و احتمالاً بهترین مدل کدنویسی تا به امروز است. @deedydas
علی‌بابا Qwen3-MT، قدرتمندترین مدل ترجمه‌ی خود را راه‌اندازی کرد که از بیش از ۹۲ زبان پشتیبانی می‌کند و بیش از ۹۵٪ جمعیت جهان را پوشش می‌دهد؛ این مدل با تریلیون‌ها توکن چندزبانه آموزش دیده است. @Alibaba_Qwen
تام وارن گزارش می‌دهد که GPT-5 در ماه اوت عرضه خواهد شد و GPT-5-mini به‌طور هم‌زمان در هر دو بخش کلاینت و API عرضه می‌شود و GPT-5-nano نیز فقط برای API برنامه‌ریزی شده است. @AndrewCurran_
اوپن‌ای‌آی قصد دارد یک مدل منبع‌باز را پیش از GPT-5 عرضه کند که گفته می‌شود مشابه o3-mini با قابلیت‌های استدلالی است. @AndrewCurran_

تحلیل صنعت

گوگل ماهانه بیش از ۹۸۰ تریلیون توکن را در سرویس‌های خود پردازش می‌کند که از ۴۸۰ تریلیون در ماه مه دو برابر شده است، و اپلیکیشن Gemini به ۴۵۰ میلیون کاربر فعال ماهانه رسیده است. @AndrewCurran_
بیش از ۷۰ میلیون ویدیوی کاربری با Veo 3 ایجاد شده است که نشان‌دهنده‌ی پذیرش قابل توجه مدل تولید ویدیوی گوگل است. @AndrewCurran_
شرکت Safe Superintelligence (شرکت ایلیا سوتسکور) به‌طور انحصاری از TPUهای گوگل برای توسعه‌ی هوش مصنوعی خود استفاده خواهد کرد. @AndrewCurran_
متا رویکردی نوآورانه در پیش گرفته است و چادرهای مقاوم در برابر آب و هوا را برای جای دادن خوشه‌های GPU می‌سازد، که مراکز داده‌ی جدید را قادر می‌سازد در عرض چند ماه به جای چند سال راه‌اندازی شوند. @AIatMeta
فایننشال تایمز گزارش می‌دهد که بیش از ۱ میلیارد دلار تراشه‌ی انویدیا، از جمله تراشه‌های Blackwell، طی سه ماه گذشته با وجود کنترل‌های صادراتی به چین رسیده است. @AndrewCurran_
چین اکنون ۵ آزمایشگاه پیشرو هوش مصنوعی دارد که در سطح جهانی رقابت می‌کنند: DeepSeek، Alibaba Qwen، Bytedance، Hailuo و Kimi، با سرعت توسعه‌ی بالا و احتمالاً هزینه‌هایی کمتر از همتایان آمریکایی خود. @deedydas
پژوهش‌ها نشان می‌دهد که توسعه‌دهندگان بیشترین زمان را با ابزارهای هوش مصنوعی از طریق تجزیه و تحلیل stack trace و بازآرایی کد، به جای تولید کد، صرفه‌جویی می‌کنند؛ این یافته بر اساس پژوهش DX با ۱۸۰ شرکت است. @GergelyOrosz
شرکت‌های فناوری پیشرو مانند گیت‌هاب و شاپی‌فای به‌دلیل هوش مصنوعی کارآموزان بیشتری استخدام می‌کنند و مشاهده می‌کنند که دانشجویان علوم کامپیوتر از ابزارهای هوش مصنوعی روان‌تر از قبل استفاده می‌کنند. @GergelyOrosz
جک دورسی در کمتر از یک هفته دو اپلیکیشن را با استفاده از ابزار هوش مصنوعی Goose برای توسعه‌ی سریع منتشر کرد که روند «vibe coding» را به نمایش می‌گذارد. @TechCrunch

اخلاق و جامعه

اظهارات رئیس جمهور ترامپ در اجلاس هوش مصنوعی درباره‌ی حق کپی‌رایت نشان می‌دهد که هوش مصنوعی باید قادر باشد بدون پرداخت برای هر بار استفاده، از محتوا یاد بگیرد؛ او این امر را با یادگیری انسان مقایسه کرده و اشاره کرده که چین چنین محدودیت‌هایی را دنبال نمی‌کند. @AndrewCurran_
الزامات جدید دولتی بیان می‌کنند که برای واجد شرایط بودن قراردادهای دولتی، یک LLM باید با اصول حقیقت‌جویی و بی‌طرفی ایدئولوژیک توسعه یابد. @AndrewCurran_
ایتان مولیک نشان می‌دهد که بیش از ۶۰٪ از لینک‌های قدیمی مقالات نیویورک تایمز اکنون شکسته شده‌اند، که نشان می‌دهد تنها LLMها بخش زیادی از محتوای ناپایدار وب را «به خاطر خواهند آورد». @emollick
بررسی دقیق بنچمارک Humanity's Last Exam نشان می‌دهد که بسیاری از سؤالات دارای پاسخ‌های «صحیح» نادرست هستند که چالش‌های موجود در اندازه‌گیری و بنچمارکینگ هوش مصنوعی را برجسته می‌کند. @emollick
فرانسوا شولیت در مورد گرایش به انسان‌انگاری سیستم‌های هوش مصنوعی که انسان نیستند هشدار می‌دهد و بر اهمیت درک ماهیت واقعی آن‌ها تأکید می‌کند. @fchollet

کاربردها

پرپلکسیتی مرورگر Comet را با قابلیت‌های دستیار هوش مصنوعی راه‌اندازی کرد که می‌تواند خود را توزیع کرده و کاربران جدید را جذب کند، و برای عملکرد خود بازخوردهای مثبتی دریافت کرده است. @testingcatalog
کرسر Bugbot را منتشر کرد که در ماه گذشته بیش از ۱ میلیون باگ در PRهای نوشته شده توسط انسان پیدا کرده است، و بیش از نیمی از آن‌ها مشکلات منطقی واقعی بودند که پیش از ادغام رفع شدند. @cursor_ai
گیت‌هاب Spark را راه‌اندازی کرد؛ یک پلتفرم «prompt-to-app» برای ایجاد و توسعه‌ی تکراری اپلیکیشن‌های React با احراز هویت کاربر و ذخیره‌سازی پایدار. @simonw
فیگما Make را برای همه منتشر کرد؛ یک راه‌حل «prompt-to-app» که به کاربران امکان می‌دهد پروتوتایپ ایجاد کرده و در جامعه‌ی فیگما (Figma Community) منتشر کنند. @figma
گوگل قابلیت تبدیل عکس به ویدیو را معرفی کرد که به گوگل فوتوز و یوتیوب شورتز می‌آید. @sundarpichai
گوگل قابلیت مجازی پرو لباس را با استفاده از فناوری هوش مصنوعی راه‌اندازی کرد. @TechCrunch
لینیر قابلیت داشبوردها را معرفی کرد که به کاربران امکان می‌دهد نماهای سفارشی برای نظارت بر معیارهای کلیدی ایجاد کنند. @linear
xAI با Kalshi همکاری می‌کند تا Grok را به بازارهای پیش‌بینی بیاورد. @xai

پژوهش‌ها

آنتروپیک سه عامل هوش مصنوعی را برای ممیزی هم‌ترازی توسعه داده است که می‌توانند به‌طور خودکار اهداف پنهان را کشف کنند، ارزیابی‌های ایمنی را بسازند و رفتارهای نگران‌کننده را آشکار سازند، و عامل بازرس آن‌ها ۴۲٪ چالش‌های ممیزی را برنده شد. @AnthropicAI
گوگل با استفاده از نسخه‌ی پیشرفته‌ی Gemini با حالت Deep Think، به عملکردی در سطح مدال طلا در المپیاد جهانی ریاضی دست یافت. @sundarpichai
پژوهش، چارچوب Rubrics as Rewards (RaR) را معرفی می‌کند که از ارزیابی‌های ساختارمند و چک‌لیستی به‌عنوان سیگنال‌های پاداش قابل تفسیر برای آموزش «on-policy» استفاده می‌کند و بهبودهای نسبی در HealthBench-1k را به ارمغان می‌آورد. @iScienceLuvr
کامرون وولف توضیح می‌دهد که مدل‌های پاداش در عصر مدل‌های استدلالی همچنان مرتبط هستند، زیرا اکثر سیستم‌ها همچنان از RLHF برای هم‌ترازی ترجیحات انسانی و RLVR برای وظایف استدلالی قابل تأیید استفاده می‌کنند. @cwolferesearch
آنتروپیک تیم «روانپزشکی هوش مصنوعی» را به‌عنوان بخشی از تلاش‌های تفسیرپذیری راه‌اندازی کرد تا درباره‌ی شخصیت‌ها، انگیزه‌ها و آگاهی موقعیتی مدل‌ها و نحوه‌ی منجر شدن آن‌ها به رفتارهای نگران‌کننده پژوهش کند. @Jack_W_Lindsey
دانشمندان MIT سلول‌های زنده را با گیت‌های منطقی، مانند کامپیوترهای بیولوژیکی، برنامه‌ریزی می‌کنند تا سرطان را با دقت تشخیص داده و از بین ببرند. @MIT
پای‌تورچ نمایش می‌دهد که SmolLM3-3B با سرعت ۱۵ توکن در ثانیه روی گلکسی S22 با استفاده از TorchAO و ExecuTorch برای استقرار روی دستگاه اجرا می‌شود. @PyTorch

1 2 3 4 5...26