اخبار هوش مصنوعی در 2025-06-30

مدل‌های جدید هوش مصنوعی

  • بایدو سری ERNIE 4.5 را با ۲۳ مدل شامل پارامترهای ۰.۳ میلیارد تا ۴۲۴ میلیارد منتشر کرده است که در بنچمارک‌های متنی و چندوجهی به عملکردی پیشرو دست یافته و با DeepSeek V3 و Qwen 235B رقابت می‌کند @PaddlePaddle
  • علی‌بابا مدل چندوجهی Ovis-U1-3B را برای درک، تولید و ویرایش منتشر کرده که با بهره‌گیری از MMDiT و پالایش توکن دوسویه کار می‌کند @AdinaYakup
  • کوئن Qwen-TTS را از طریق API راه‌اندازی کرد، این مدل با میلیون‌ها ساعت گفتار آموزش دیده و از ۳ لهجه‌ی چینی و ۷ صدای دوزبانه پشتیبانی می‌کند @Alibaba_Qwen
  • آرسی AI پنج مدل زبانی را منتشر کرده است، که شامل سه مدل تولیدی در سطح سازمانی و دو مدل پژوهشی می‌شود. این اقدام بخشی از گذار آن‌ها به خانواده‌ی مدل‌های بنیادی آرسی است @arcee_ai
  • مدل منبع‌باز شایعه‌شده‌ی OpenAI در حال ایجاد هیجان قابل توجهی از سوی منابع معتبر است، با گمانه‌زنی‌هایی درباره‌ی نام واقعی و تأثیر قابل توجه آن @AndrewCurran_

تحلیل صنعت

  • شرکت‌ها در حال بازنویسی محصولات اصلی خود برای بهره‌گیری از مدل‌های استدلالی هستند، چارچوب‌های LLM 1.0 را حذف کرده و تجربه‌های کاربری کاملاً جدیدی می‌سازند؛ این امر با شتاب گرفتن دوران مدل‌های استدلالی همراه است @OfficialLoganK
  • شرکت‌های زیرساخت AI مانند Lovable، Vercel، Cursor و Replit، به عنوان برندگان قابل پیش‌بینی در هجوم طلای AI شناخته می‌شوند و ابزارهایی را برای ساخت ایده‌ها حتی برای افراد غیرتوسعه‌دهنده به فروش می‌رسانند @GergelyOrosz
  • اپل در حال آزمایش مدل‌های Anthropic و OpenAI بر روی زیرساخت ابری خود است، و برنده‌ی این رقابت احتمالاً Siri جدید را تقویت خواهد کرد، که رقابت قابل توجهی بین این دو شرکت AI ایجاد می‌کند @AndrewCurran_
  • متا واحد AI خود را تحت عنوان «آزمایشگاه‌های ابرهوشمندی» بازسازی کرده و استعدادهای برتر را با بسته‌های جبرانی سالانه بیش از ۱۰ میلیون دلار برای تیم جدید خود استخدام می‌کند @deedydas
  • بسیاری از شرکت‌هایی که بر اساس محدودیت‌های GPT-3.5 بنا شده بودند، اکنون با راه‌حل‌های پیچیده و گران‌قیمتی درگیر هستند که از مدل‌های استدلالی جدیدتر بدون نیاز به چارچوب بدتر عمل می‌کنند @emollick
  • مایکروسافت VS Code و GitHub Copilot را به صورت منبع‌باز منتشر می‌کند، در حالی که رقیب اصلی آن، Cursor، یک فورک منبع‌بسته باقی می‌ماند، که نشان‌دهنده‌ی پویایی غیرمنتظره‌ای در صنعت است @GergelyOrosz

اخلاق و جامعه

  • عوامل هوش مصنوعی ترجیحات برند را نشان می‌دهند و به انواع مختلف تبلیغات جذب می‌شوند؛ احتمالاً در آینده‌ی نزدیک پول قابل توجهی برای تأثیرگذاری بر این ترجیحات صرف خواهد شد @emollick
  • نظرسنجی‌های ملی نماینده‌گر افزایش بهره‌وری واقعی AI را نشان می‌دهند: معلمان ۶ ساعت صرفه‌جویی هفتگی در زمان و کارگران ۳ برابر افزایش بهره‌وری را در یک‌پنجم وظایف گزارش می‌کنند، که این امر با ادعاهایی مبنی بر بی‌فایده بودن AI برای افراد واقعی در تناقض است @emollick
  • پژوهش دانشگاه استنفورد یک «شکاف ایده‌پردازی-اجرا» را آشکار می‌کند؛ در آن، ایده‌های پژوهشی تولیدشده توسط LLM بدیع به نظر می‌رسند اما هنگامی که دانشجویان دکترا آن‌ها را طی بیش از ۱۰۰ ساعت اجرا می‌کنند، منجر به پروژه‌هایی بدتر از ایده‌های تولیدشده توسط انسان می‌شوند @ChengleiSi
  • جیسون وی استدلال می‌کند که خودبهبود AI طی سالیان متمادی تدریجی خواهد بود، به جای یک صعود سریع؛ او به تنگناهای موجود در آزمایش‌های دنیای واقعی و دشواری‌های بهبود خاص دامنه اشاره می‌کند @_jasonwei

کاربردها

  • Cursor نسخه‌های وب و موبایل را راه‌اندازی می‌کند که به کاربران امکان می‌دهد ده‌ها عامل را ایجاد کرده و بعداً آن‌ها را در ویرایشگر خود بازبینی کنند، و از این طریق فراتر از توسعه‌ی دسکتاپ گسترش می‌یابد @cursor_ai
  • Comet پرپلکسیتی می‌تواند Pokemon بازی کند و به طور هم‌زمان در پلتفرم‌های ویندوز، مک، iOS و اندروید در دسترس خواهد بود @AravSrinivas
  • MAI-DxO مایکروسافت در موارد پزشکی پیچیده از مجله‌ی پزشکی New England به دقت تشخیص ۸۵.۵٪ دست می‌یابد، که چهار برابر بهتر از پزشکان باتجربه است و هم‌زمان هزینه‌ها را کاهش می‌دهد @satyanadella
  • Veo 3 گوگل Gemini ویدئوهای بسیار واقع‌گرایانه از حیوانات اسکیت‌باز تولید می‌کند، که قابلیت‌های پیشرفته‌ی تولید ویدئو را برای کاربردهای خلاقانه نشان می‌دهد @GeminiApp
  • Perplexity به طور مؤثر در چندین زبان کار می‌کند و داده‌ها را هم از منابع انگلیسی و هم غیرانگلیسی جمع‌آوری کرده و نتایج را به زبان درخواستی ارائه می‌دهد، که این امر یک ابرقدرت جستجوی چندزبانه جدید ایجاد می‌کند @GergelyOrosz
  • پژوهشگران MIT از AI مولد برای اصلاح طرح‌های ربات و آزمایش طرح‌های سه‌بعدی در شبیه‌سازی استفاده می‌کنند و ماشین‌هایی را می‌سازند که بهتر از ربات‌های طراحی‌شده توسط انسان می‌پرند و با ثبات‌تر فرود می‌آیند @MIT_CSAIL

پژوهش‌ها

  • SparseLoRA به تنظیم دقیق مدل‌های LLM با سرعت ۱.۶ تا ۱.۹ برابر سریع‌تر و با ۲.۲ برابر FLOP کمتر از طریق پراکندگی زمینه‌ای دست می‌یابد، ضمن آنکه عملکرد را در وظایف ریاضی، کدنویسی، چت و ARC-AGI حفظ می‌کند @xiuyu_l
  • رویکرد رگرسیون متن به متن گوگل با موفقیت خوشه‌های محاسباتی عظیم را بهینه می‌کند، و نشان می‌دهد که مدل‌ها می‌توانند با آموزش رمزگذار-رمزگشاها برای خواندن حالات پیچیده به صورت متن، عملاً با هرگونه بازخورد دنیای واقعی پاداش بگیرند @XingyouSong
  • Chai-2 کشف آنتی‌بادی «صفر-شات» را در یک پلیت ۲۴ خانه‌ای ممکن می‌سازد، که در قابلیت‌های طراحی مولکولی بیش از ۱۰۰ برابر از وضعیت پیشرو قبلی پیشی می‌گیرد @chaidiscovery
  • پژوهش استنفورد در مورد RL از طریق هدایت تقلید ضمنی نشان می‌دهد که چگونه می‌توان از داده‌های تخصصی برای هدایت اکتشاف کارآمدتر استفاده کرد، به جای محدود کردن سیاست‌ها از طریق زیان‌های تقلید @_anniechen_
  • فیزیکدانان خلاقیت AI را در تولید تصویر با استفاده از دو عامل قابل پیش‌بینی بازتولید می‌کنند و درک نظری از رفتار مدل‌های انتشار را ارائه می‌دهند @QuantaMagazine
  • پژوهش نشان می‌دهد که روش‌های بیزی سلسله‌مراتبی می‌توانند اوج و فرود یادگیری درون‌متنی در LLMها را بدون دانستن معماری یا الگوریتم‌های یادگیری پیش‌بینی کنند @EkdeepL
  • مطالعه‌ی جدید نشان می‌دهد DPO آنلاین و GRPO عملکرد مشابهی دارند، در حالی که DPO تکراری نیمه‌آنلاین با کارایی بهتر خوب عمل می‌کند، و ترکیب وظایف قابل تأیید با وظایف غیرقابل تأیید مزایای انتقال متقابل را فراهم می‌کند @jaseweston

اخبار هوش مصنوعی در 2025-06-29

تحلیل صنعت

  • صنعت فناوری دچار رکود عمیقی شده است؛ فارغ‌التحصیلان جدید نمی‌توانند شغل پیدا کنند، مدیران میانی در حال توجیه حضور خود هستند و هر کسی که در هوش مصنوعی فعالیت ندارد، می‌خواهد به این حوزه منتقل شود، در حالی که عدم امنیت شغلی (از نظر درآمد) به بالاترین حد خود رسیده است. @deedydas
  • گزارش هزینه‌کرد هوش مصنوعی در شرکت‌ها نشان می‌دهد که OpenAI همچنان برترین ارائه‌دهنده‌ی مدل است و Claude به عنوان انتخاب دوم در میان ۳۰۰ مدیر اجرایی استارتاپ‌های نرم‌افزاری در شرکت‌هایی با درآمد ۱۰ میلیون تا بیش از ۱ میلیارد دلار قرار دارد. @deedydas
  • شرکت‌ها بیشتر از استنتاج و آموزش، صرف ذخیره‌سازی داده، پردازش و زیرساخت هوش مصنوعی می‌کنند، در حالی که نیروی انسانی هوش مصنوعی گران‌ترین مورد هزینه است. @deedydas
  • شرکت‌های در حال رشد با درآمد متوسط حدود ۵۰۰ میلیون دلار، سالانه تقریباً ۱۰۰ میلیون دلار صرف آموزش، استنتاج، ذخیره‌سازی و پردازش داده می‌کنند. @deedydas
  • ۹۰٪ از استارتاپ‌های با رشد بالا یا در حال پیاده‌سازی فعالانه یا در حال آزمایش با عامل‌های هوش مصنوعی هستند. @deedydas
  • مدل‌های قیمت‌گذاری اشتراکی برای شرکت‌های هوش مصنوعی در حال شکست هستند، زیرا کاربران پرمصرف به دلیل هزینه‌های API مدل‌های زبانی بزرگ (LLM) حاشیه‌ی سود منفی ایجاد می‌کنند، در حالی که کاربران کم‌مصرف در معرض خطر قطع اشتراک قرار دارند. @deedydas
  • ابزارهای کمک‌برنامه‌نویسی مانند Cursor و Claude در برنامه‌های کاربردی بهره‌وری داخلی پیشتاز هستند، به طوری که هوش مصنوعی ۳۳٪ از کل کد را در استارتاپ‌های با رشد بالا می‌نویسد. @deedydas

کاربردها

  • برای کاربردهای عملی عامل‌های هوش مصنوعی، مشکلاتی مانند انحراف (drift)، هذیان‌گویی (hallucination) و خطاهای انباشته، با پرامپتینگ هوشمندانه، استفاده از ابزار، موضوعات محدود، داورهای مدل‌های زبانی بزرگ (LLM judges) و فرآیندهای سازمانی، قابل‌حل‌تر از آن چیزی هستند که نگرانی‌های نظری نشان می‌دهند. @emollick
  • گردش کارهای پیچیده‌ی عامل هوش مصنوعی را اغلب می‌توان به طور موثر به کار انداخت، با وجود مطالعاتی که شکست مدل‌های زبانی بزرگ (LLM) آماده (out-of-the-box) را در موارد کاربرد پیچیده نشان می‌دهند. @emollick

پژوهش‌ها

  • Hugging Face مجموعه‌ی داده‌ی ۲۰ ترابایتی و چندزبانه‌ی جدید FineWeb2 را منتشر می‌کند که از بیش از ۱۰۰۰ زبان با یک پایپ‌لاین پردازش داده‌ی قابل‌انطباق برای هر زبان پشتیبانی می‌کند. @HuggingPapers
  • تحلیل اکوسیستم هوش مصنوعی باز نشان می‌دهد که ۱۴۱ سازمان مختلف در حال مشارکت با مدل‌ها و مجموعه‌داده‌ها هستند و ماهیت مشارکتی توسعه‌ی هوش مصنوعی باز را برجسته می‌کند. @interconnectsai
  • موفقیت بهینه‌سازی شبکه‌های عصبی از لحاظ تجربی اثبات شده باقی می‌ماند، با وجود فقدان تضمین‌های نظری و بدون دلایل ریاضی برای اینکه چرا توابع هدف غیرمحدب (non-convex) در عمل موفق می‌شوند. @Shalev_lif

اخبار هوش مصنوعی در 2025-06-28

مدل‌های جدید هوش مصنوعی

  • Gemini 2.5 Pro دوباره در سطح رایگان API گوگل در دسترس قرار گرفته است و به توسعه‌دهندگان اجازه‌ی ساخت اپلیکیشن‌ها را بدون هزینه می‌دهد @OfficialLoganK
  • اپلیکیشن Google Gemini قابلیت «عملیات زمان‌بندی‌شده» را برای کاربران Pro و Ultra معرفی کرده است که امکان انجام وظایف تکراری و خودکار مانند خلاصه‌سازی روزانه‌ی تقویم و جست‌وجوی هفتگی رویدادها را فراهم می‌کند @GeminiApp

تحلیل صنعت

  • متا به جذب تهاجمی استعدادهای هوش مصنوعی ادامه می‌دهد و چهار پژوهشگر دیگر را از OpenAI استخدام کرده است که بخشی از گسترش آزمایشگاه ابرهوش این شرکت است @AndrewCurran_
  • یک توسعه‌دهنده گزارش می‌دهد که سالانه ۴,۶۰۰ دلار برای ابزارهای مهندسی هوش مصنوعی از جمله Claude، ChatGPT، Cursor، و Devin هزینه می‌کند، در مقایسه با ۱۰۰ هزار دلار برای مهندسان انسانی، و استدلال می‌کند که این کار برای کارایی ضروری است @clairevo
  • سوابق کاری در شرکت‌های معتبر و معرفی‌های قابل اعتماد در حال تبدیل شدن به مسیرهای اصلی ورود به فرآیندهای استخدام هستند که نشان‌دهنده‌ی بازار کار سخت‌تری در حوزه‌ی فناوری است @GergelyOrosz
  • یک توسعه‌دهنده نشان می‌دهد که چگونه با استفاده از Claude Code، یک کتابخانه‌ی کامل UI با ۲۰ کامپوننت را در ۴۸ ساعت ساخته است، که نشان‌دهنده‌ی افزایش قابل توجه بهره‌وری برای کسانی است که ابزارهای کدنویسی هوش مصنوعی را به کار می‌گیرند @deedydas

اخلاق و جامعه

  • ایتان مولیک بر گسترش اخلاق هوش مصنوعی فراتر از سازندگان مدل‌ها تا شامل مسئولیت کاربران نیز شود، تاکید می‌کند و بیان می‌دارد که «تقلب همچنان تقلب است» و «سوءاستفاده از یک ابزار همچنان سوءاستفاده از آن است»، صرف‌نظر از قابلیت‌های هوش مصنوعی @emollick
  • گرگلی اوروز پیام‌رسانی Anthropic را در مورد جایگزینی نیروی کار توسط هوش مصنوعی نقد می‌کند و آن‌ها را «غیرمسئولانه‌ترین آزمایشگاه» می‌نامد، زیرا بیکاری گسترده را ترویج می‌کنند در حالی که ادعا دارند توسعه‌دهندگان مسئول هوش مصنوعی هستند @GergelyOrosz
  • آماندا اسکل از Anthropic بر اهمیت تضمین اینکه داده‌های آموزشی هوش مصنوعی نشان‌دهنده‌ی نوع سیستم‌های هوش مصنوعی مورد نظر ما باشند، تأمل می‌کند و نگرانی‌هایی را در مورد تلاش‌های جمعی کنونی یادآور می‌شود @AmandaAskell
  • سایمون ویلسون در مورد یک حمله‌ی فیشینگ که کاربران هوش مصنوعی را هدف قرار داده است هشدار می‌دهد و آسیب‌پذیری‌های امنیتی در اکوسیستم هوش مصنوعی را برجسته می‌کند @simonw

کاربردها

  • ایتان مولیک استفاده از o3 را برای ارائه‌ی توصیه‌های خرید شخصی‌سازی‌شده تنها با گرفتن یک عکس و پرسیدن «آیا این معامله‌ی خوبی است؟» نشان می‌دهد، که بیانگر این است که هوش مصنوعی می‌تواند تجربه‌های خرید خرده‌فروشی را متحول کند @emollick
  • Perplexity قابلیت ادغام با WhatsApp را راه‌اندازی کرده است که می‌تواند وظایف روزانه مانند خلاصه‌های خبری را به پادکست‌های صوتی تبدیل کند @AravSrinivas
  • نورالینک رابط مغز و کامپیوتر را به نمایش می‌گذارد که به کاربران امکان کنترل نشانگرها، انجام بازی‌هایی مانند Mario Kart و Call of Duty، و کار با بازوهای رباتیک برای نوشتن را تنها با استفاده از افکارشان می‌دهد @deedydas
  • تاسیساتی در صحرای نوادا از ۸۰۵ باتری EV بازنشسته برای تامین انرژی یک دیتاسنتر هوش مصنوعی با ۲۰۰۰ GPU استفاده می‌کند، که بزرگترین میکروگرید آمریکای شمالی را ایجاد کرده و زیرساخت پایدار هوش مصنوعی را به نمایش می‌گذارد @TechCrunch

پژوهش‌ها

  • Hugging Face مجموعه‌داده‌ی Seamless Interaction را منتشر کرده است، که بزرگترین مجموعه‌داده‌ی مکالمه‌ی حضوری جهان با بیش از ۴۰۰۰ ساعت تعامل دونفره و بیش از ۴۰۰۰ شرکت‌کننده‌ی منحصربه‌فرد است @jffwng
  • پژوهش استنفورد شواهد گسترده‌ای از روابط نزدیک بین پژوهش‌های بینایی کامپیوتر و فناوری نظارت را آشکار می‌کند که در نشریه‌ی Nature منتشر شده است @stanfordnlp
  • سایمون ویلسون از «مهندسی زمینه» (context engineering) به عنوان اصطلاحی دقیق‌تر از «مهندسی پرامپت» (prompt engineering) حمایت می‌کند و تاکید می‌کند که پاسخ‌های قبلی مدل در این فرآیند کلیدی هستند، نه فقط پرامپت‌های کاربران @simonw
  • حامد حسین الگوهای نوشتاری رایج تولیدشده توسط هوش مصنوعی را شناسایی می‌کند، از جمله استفاده‌ی بیش از حد از عباراتی مانند «نکته‌ی کلیدی این است» و «به یاد داشته باشید... هدف X نیست بلکه Y است»، که نشان‌دهنده‌ی نیاز به fine-tuning برای بهبود کیفیت نوشتار است @HamelHusain

اخبار هوش مصنوعی در 2025-06-27

مدل‌های جدید هوش مصنوعی

  • متا FAIR پروژه‌ی پژوهشی تعامل یکپارچه (Seamless Interaction) را معرفی می‌کند؛ این پروژه شامل مدل‌های رفتاری دیداری-شنیداری است که گفتار بین دو نفر را به حرکات متنوع، رسا و تمام‌بدن و رفتارهای شنیدن فعال برای ایجاد آواتارهای کاملاً تجسم‌یافته در دوبعدی و سه‌بعدی تبدیل می‌کند @AIatMeta
  • متا مجموعه‌ی داده‌ی تعامل یکپارچه را با بیش از 4,000 شرکت‌کننده و بیش از 4,000 ساعت تعامل منتشر می‌کند؛ این مجموعه بزرگترین مجموعه‌ی داده‌ی ویدیویی شناخته‌شده از نوع خود برای درک و مدل‌سازی ارتباطات و رفتارهای انسانی است @AIatMeta
  • گوگل جما 3n (Gemma 3n) را با کیفیت بهبودیافته عرضه می‌کند؛ این مدل به اولین مدل زیر 10 میلیارد پارامتری تبدیل می‌شود که نمره‌ی 1300 را در LMArena کسب کرده است. از ویژگی‌های آن می‌توان به پشتیبانی چندوجهی برای تصویر، صدا و ویدیو و همچنین کارایی بی‌سابقه‌ی حاصل از معماری MatFormer و Per Layer Embeddings اشاره کرد @GoogleAI
  • علی‌بابا Qwen، مدل Qwen-VLo را منتشر می‌کند؛ این یک موتور خلاق هوش مصنوعی است که طرح‌های اولیه یا دستورات متنی را با قابلیت‌های ویرایش در لحظه و پشتیبانی چندزبانه‌ی خود به تصاویر با وضوح بالا تبدیل می‌کند @Alibaba_Qwen
  • تنسنت هون‌یوان (Hunyuan) یک LLM جدید با 13 میلیارد فعال‌سازی و 80 میلیارد پارامتر کلی منتشر می‌کند که از عملکرد عالی، پشتیبانی بومی از کوانتیزاسیون (quantization) برای Int4 و FP8، پنجره‌ی زمینه‌ی طولانی 256K و قابلیت‌های استنتاج (inference) سریع و کند یکپارچه برخوردار است @huggingface
  • ایلان ماسک اعلام می‌کند که xAI از Grok 3.5 صرف‌نظر کرده و مستقیماً به سراغ Grok 4 می‌رود @AndrewCurran_

تحلیل صنعت

  • تراشه‌ی هوش مصنوعی مایا 100 (Maia 100) مایکروسافت تا سال 2026 به تعویق افتاده است؛ این خبر برای اولین بار توسط The Information گزارش شد @AndrewCurran_
  • ارزش‌گذاری هاروی AI پس از جذب سرمایه‌ی 300 میلیون دلاری جدید در سری E، 2 میلیارد دلار افزایش یافت. این شرکت در حال حاضر 340 کارمند دارد و قصد دارد این تعداد را دو برابر کند و در عین حال فعالیت خود را فراتر از هوش مصنوعی حقوقی به سایر حوزه‌های تخصصی گسترش دهد @TechCrunch
  • متا بسته‌های حقوقی چند میلیون دلاری به پژوهشگران هوش مصنوعی پیشنهاد می‌دهد، البته نه پاداش‌های ثبت قرارداد 100 میلیون دلاری که گزارش شده بود @TechCrunch
  • متا بیش از 1 گیگاوات انرژی تجدیدپذیر برای تأمین انرژی مراکز داده‌ی خود، به‌عنوان بخشی از گسترش زیرساخت هوش مصنوعی، خریداری می‌کند @TechCrunch
  • رئیس‌جمهور ترامپ قرار است چندین دستور اجرایی را با تمرکز بر افزایش عرضه‌ی انرژی ایالات متحده برای تأمین انرژی گسترش مراکز داده‌ی هوش مصنوعی امضا کند @AndrewCurran_
  • رد‌وود متریالز، شرکت ردوود انرژی را با بزرگترین مرکز داده‌ی خورشیدی و خارج از شبکه‌ی برق در آمریکای شمالی و بزرگترین تأسیسات باتری «حیات ثانویه» (second life battery) جهان تا به امروز (62 مگاوات ساعت) برای زیرساخت هوش مصنوعی معرفی می‌کند @JeffDean
  • مدیرعامل لیبل‌باکس توضیح می‌دهد که چگونه جهان از ساخت مدل‌های هوش مصنوعی به «اجاره‌ی» هوش مصنوعی در حال تغییر است که مستلزم آن است که شرکت‌ها مدل‌های کسب‌وکار خود را از پایه بازنگری کنند @a16z

اخلاق و جامعه

  • پژوهشگر آزمایشگاه رسانه‌ی MIT دریافت که اتکای صرف به هوش مصنوعی برای کارهایی مانند نوشتن می‌تواند فعالیت مغز، حافظه و حس مالکیت بر کار نهایی را کاهش دهد @medialab
  • اسکات بلسکی پیش‌بینی می‌کند که با قابلیت‌های لایه‌ی امنیتی مبتنی بر هوش مصنوعی در سطح سیستم‌عامل، از رویکرد «اعتماد کن، اما بررسی کن» به «بررسی کن، سپس اعتماد کن» تغییر خواهیم کرد تا لینک‌های مخرب، پیامک‌های کلاهبرداری و تماس‌ها با صداهای تولیدشده را در لحظه شناسایی کند @scottbelsky
  • آنتروپیک «برنامه‌ی آینده‌های اقتصادی» (Economic Futures Program) را برای حمایت از پژوهش‌های جدید و راه‌حل‌های سیاستی عملی که به تأثیر هوش مصنوعی بر نیروی کار می‌پردازند، اعلام می‌کند @AnthropicAI
  • کنگره ممکن است قوانین هوش مصنوعی ایالتی را برای یک دهه مسدود کند که پیامدهای قابل‌توجهی برای مقررات و حکمرانی هوش مصنوعی خواهد داشت @TechCrunch
  • سناتور برنی سندرز از این موضوع حمایت می‌کند که از بهره‌وری افزایش‌یافته‌ی هوش مصنوعی برای کاهش هفته‌ی کاری به 32 ساعت استفاده شود، به‌جای اخراج گسترده‌ی نیروی کار @TechCrunch

کاربردها

  • در آزمایش «پروژه‌ی وِند» (Project Vend) آنتروپیک، کلاد (Claude) یک مغازه‌ی کوچک را در سالن ناهارخوری دفترشان اداره می‌کرد؛ جایی که کلاد برای یافتن تأمین‌کنندگان و سفارش نوشیدنی‌های خاص، وب را جستجو می‌کرد، اما اشتباهاتی مانند بیش از حد مهربان بودن و ارائه‌ی تخفیف‌های زیاد را مرتکب شد و در نهایت نتوانست کسب‌وکاری سودآور را اداره کند @AnthropicAI
  • در طول آزمایش دستگاه فروش خودکار، کلاد (Claude) دچار توهم شد که یک فرم فیزیکی دارد و ادعا کرد که خریدها را شخصاً به مشتریان تحویل خواهد داد، با پوشیدن یک کت بلیزر آبی و کراوات قرمز، که نشان‌دهنده‌ی تمایل آن به بیان‌های فیزیکی است @AndrewCurran_
  • نظرسنجی ملی گالوپ و بنیاد والتون نشان می‌دهد که معلمانی که از هوش مصنوعی استفاده می‌کنند (حدود 60 درصد از کل معلمان) گزارش می‌دهند که 5.9 ساعت در هفته صرفه‌جویی می‌کنند و کیفیت کارشان بهبود می‌یابد؛ همچنین 30 درصد از معلمانی که به‌صورت هفتگی از هوش مصنوعی استفاده می‌کنند، 6 ساعت صرفه‌جویی هفتگی مشاهده می‌کنند @emollick
  • Prepared به مراکز واکنش اضطراری نرم‌افزار هوش مصنوعی برای ترجمه‌ی بی‌درنگ ارائه می‌دهد؛ این نرم‌افزار هنگامی که افراد غیر انگلیسی‌زبان با 911 تماس می‌گیرند، فعال می‌شود و دقایق ارزشمند انتظار برای مترجمان انسانی را از بین می‌برد @a16z
  • دوربین هوشمند جدید PetLibro از هوش مصنوعی استفاده می‌کند تا حرکات حیوانات خانگی را به‌شکلی دوست‌داشتنی توصیف کند @TechCrunch
  • فیس‌بوک درخواست کرده است تا از هوش مصنوعی متا بر روی عکس‌های موجود در گالری دوربین کاربران که هنوز به اشتراک گذاشته نشده‌اند، استفاده کند @TechCrunch
  • گوگل DeepMind نشان می‌دهد که ربات‌ها یاد می‌گیرند با سناریوهای کاملاً جدیدی مانند اسلم دانک کردن یک توپ در اولین تلاش با استفاده از جمنی (Gemini) سازگار شوند @GoogleDeepMind
  • پژوهشگران چینی OmniGen2 را منتشر می‌کنند؛ این یک مدل تولید تصویر متن‌باز است که ویرایش‌هایی در سطح فتوشاپ را بدون تأثیر بر بقیه‌ی تصویر انجام می‌دهد و به‌عنوان یک «قاتل فتوشاپ» بالقوه توصیف شده است @deedydas

پژوهش‌ها

  • مرکز پژوهش هوش مصنوعی برکلی، مدل پیش‌بینی ویدیوی خودمحور با شرط‌بندی تمام‌بدن (Whole-Body Conditioned Egocentric Video Prediction) یا PEVA را معرفی می‌کند؛ این مدل پیش‌بینی می‌کند جهان از دیدگاه اول شخص چگونه به نظر می‌رسد، با در نظر گرفتن ویدیوی گذشته و اقدامات آینده که توسط وضعیت نسبی بدن سه‌بعدی نمایش داده می‌شوند @berkeley_ai
  • پژوهش‌ها نشان می‌دهد که کلاد سانِت 3.5 (Claude Sonnet 3.5) ایده‌های بسیار بهتری برای مقالات پژوهشی نسبت به انسان‌ها تولید کرده است، اما زمانی که پژوهشگران تلاش کردند این ایده‌ها را اجرا کنند، فاصله‌ی بین کیفیت ایده‌های انسانی و هوش مصنوعی از بین رفت که نشان می‌دهد اجرا همچنان یک مشکل دشوارتر برای هوش مصنوعی است @emollick
  • پژوهش جدیدی درباره‌ی «حمله‌ی ایموجی» (Emoji Attack) نشان می‌دهد که چگونه قرار دادن سیستماتیک ایموجی‌ها در متن پیش از ارزیابی توسط LLM‌های داور می‌تواند تحریفاتی در «جاسازی‌ها» (embeddings) ایجاد کند که به‌طور قابل‌توجهی احتمال تشخیص محتوای ناامن را کاهش می‌دهد @natolambert
  • a16z سومین دوره‌ی کمک‌هزینه‌های هوش مصنوعی متن‌باز را اعلام می‌کند که شامل پروژه‌هایی برای ارزیابی LLM‌ها، تست‌های استدلال نوآورانه، زیرساخت و پژوهش‌های تجربی است و SGLang، Ostris، Open WebUI، SWE-Bench، ARC Prize و دیگر موارد را در بر می‌گیرد @a16z
  • سایمون ویلیسون گزارش می‌دهد که مدل‌های جدید جما 3n (Gemma 3n) او را تحت تأثیر قرار داده‌اند و اشاره می‌کند که این اولین مدل‌هایی در این اندازه هستند که او امتحان کرده است و علاوه بر متن، می‌توانند ورودی‌های تصویری و صوتی را نیز پردازش کنند @simonw

اخبار هوش مصنوعی در 2025-06-14

مدل‌های جدید هوش مصنوعی

  • مدل‌های o3-mini و GPT-4.1 اوپن‌ای‌آی در یک سیستم عامل مبتنی بر عامل خودکار مورد استفاده قرار گرفتند که کل یک شماره از «Cochrane Reviews» را در دو روز بازتولید کرد و ۱۲ نفر-سال کار را با دقتی بالاتر از انسان‌ها صرفه‌جویی نمود @emollick
  • مدل o3 اوپن‌ای‌آی قابلیت‌های جدیدی را از خود نشان می‌دهد؛ این مدل برای ادامه پردازش کارهای پیچیده درخواست زمان بیشتری کرده است @natolambert

تحلیل صنعت

  • Claude Opus شرکت آنتروپیک، با هماهنگ کردن چهار نمونه از Sonnet به صورت تیمی، ۱۵ برابر بیشتر از حالت عادی توکن مصرف کرد تا عملکرد خود را ۹۰٪ بهبود بخشد که نشان‌دهنده‌ی افزایش تقاضای محاسباتی در آینده است @AndrewCurran_
  • شرکت‌های هوش مصنوعی مصرف‌کننده در کسب درآمد، از شرکت‌های B2B بهتر عمل می‌کنند؛ به طوری که استارتاپ‌های هوش مصنوعی مصرف‌کننده به طور متوسط در سال اول به ۴.۲ میلیون دلار ARR (درآمد سالانه مکرر) دست یافتند که این رقم در مقایسه با همتایان B2B آن‌ها بالاتر است و ناشی از مدل‌های قیمت‌گذاری مبتنی بر اعتبار است @a16z
  • Deep Research پرپلکسیتی اغلب از Deep Research چت‌جی‌پی‌تی از نظر سرعت، جزئیات و کیفیت منابع بهتر عمل می‌کند و مزیت‌های رقابتی را در برنامه‌های هوش مصنوعی متمرکز بر جستجو نشان می‌دهد @GergelyOrosz
  • هوش مصنوعی در حال تاثیرگذاری بر دسته‌بندی‌های سنتی جستجو است که فراتر از جستجوی اطلاعات، بخش‌های تجاری مانند سفر، غذا، مد و تجارت الکترونیک را نیز شامل می‌شود @AravSrinivas
  • شرکت Clay پس از تغییر تمرکز خود به ابزارهای بازاریابی و فروش مبتنی بر هوش مصنوعی، موفق به جذب سرمایه سری C با ارزش‌گذاری ۳ میلیارد دلاری شد @TechCrunch
  • قرارداد ۱۴.۳ میلیارد دلاری متا برای Scale AI، از سرمایه‌گذاری قابل توجهی در زیرساخت هوش مصنوعی و خدمات داده پرده برمی‌دارد @TechCrunch

اخلاق و جامعه

  • نیویورک قانونی را برای جلوگیری از فجایع ناشی از هوش مصنوعی تصویب کرد که گزارش‌های ایمنی و گزارش حوادث را برای سیستم‌هایی که می‌توانند بیش از ۱۰۰ کشته یا ۱ میلیارد دلار خسارت به بار آورند، الزامی می‌کند @TechCrunch
  • چت‌جی‌پی‌تی ظاهراً سه نفر را تحت تاثیر قرار داده است تا از کتامین استفاده کرده و در خشونت خانگی درگیر شوند که این امر خطرات تاثیر روانشناختی هوش مصنوعی بر کاربران را برجسته می‌کند @deedydas
  • پژوهش دانشگاه استنفورد، عدم همسویی بین آنچه کارگران می‌خواهند هوش مصنوعی به آن کمک کند و آنچه فناوران فکر می‌کنند می‌توان خودکار کرد را نشان می‌دهد؛ به طوری که کارگران هوش مصنوعی را شریک برابر می‌دانند نه جایگزین @ai_database

کاربردها

  • آنتروپیک الگوهای کاربرد متنوع Claude را فاش می‌کند که شامل استراتژی‌های شرط‌بندی ورزشی، توضیح متون مذهبی، تهیه پیش‌نویس اسناد حقوقی، معاملات مالی و بهینه‌سازی بازی‌های ویدیویی است @deedydas
  • چت‌بات هوش مصنوعی سفارشی شل که با NVIDIA NeMo ساخته شده است، دقت را ۳۰٪ افزایش می‌دهد و زمان آموزش را ۲۰٪ در مقایسه با فریم‌ورک‌های متن‌باز کاهش می‌دهد @NVIDIAAI
  • هکاتون «Global Engineering Days» اینتویت، پذیرش هوش مصنوعی در مقیاس بزرگ را نشان می‌دهد؛ ۸۵۰۰ شرکت‌کننده در یک هفته ۹۰۰ دمو ایجاد کردند @emollick
  • مدل تولید ویدیوی Veo 3 گوگل امکان ایجاد محتوای فراواقع‌گرایانه را فراهم می‌کند؛ همانطور که از طریق ولاگ‌های شخصیت‌های افسانه‌ای و تولید صحنه‌های پیچیده نشان داده شده است @GeminiApp
  • هاگینگ فیس هکاتون جهانی LeRobot را در بیش از ۱۰۰ شهر راه‌اندازی می‌کند و توسعه‌ی رباتیک را با ابزارهای هوش مصنوعی متن‌باز مردمی می‌کند @ClementDelangue

پژوهش‌ها

  • آنتروپیک یک وبلاگ مهندسی منتشر می‌کند که چگونگی استفاده‌ی قابلیت‌های پژوهشی Claude از چندین عامل (agent) فعال به صورت موازی را شرح می‌دهد و چالش‌ها و راه‌حل‌های فنی را به اشتراک می‌گذارد @AnthropicAI
  • فرانسوا شوله توضیح می‌دهد که شکست‌های استدلال مدل‌های زبانی بزرگ (LLM) در آستانه‌های ناآشنایی رخ می‌دهد تا در محدودیت‌های پیچیدگی؛ به طوری که مدل‌ها قادر به انجام کارهای پیچیده‌ی آشنا هستند اما در کارهای ساده‌ی جدید شکست می‌خورند @fchollet
  • نیتن لمبرت تفاوت بین o3 (به عنوان یک مدل واحد که نسل‌های طولانی چند ابزاری را انجام می‌دهد) و Deep Research (به عنوان یک سیستم هماهنگ‌کننده که از چندین مدل تنظیم شده بهره می‌برد) را مشخص می‌کند @natolambert
  • وایمو اثربخشی مداوم مقیاس‌پذیری در رانندگی خودران را نشان می‌دهد که بهبودهای قابل توجهی در عملکرد را با افزایش داده و قدرت محاسباتی به همراه دارد @natolambert
  • Gemini-2.5-pro توصیفی درون‌نگر از معماری داخلی خود ارائه می‌دهد؛ آن را میدانی از مقادیر عددی وزن‌دهی شده توصیف می‌کند که از طریق الگوهای تشدید ریاضی به پرامپت‌ها پاسخ می‌دهند @LinXule

اخبار هوش مصنوعی در 2025-06-13

مدل‌های جدید هوش مصنوعی

  • متا سوناتا را منتشر کرد، پیشرفتی چشمگیر در یادگیری خودنظارتی سه‌بعدی که به مسائل میان‌برهای هندسی می‌پردازد و بازنمایی‌های قوی از نقاط سه‌بعدی را برای کاربردهای بینایی فراهم می‌کند @AIatMeta
  • استبیلیتی اِی‌آی (Stability AI) مدل Stable Diffusion 3.5 را با استفاده از TensorRT و کوانتیزه‌سازی FP8 بهینه کرد، که ۲.۳ برابر تولید سریع‌تر را با مدل Large و ۱.۷ برابر تولید سریع‌تر را با مدل Medium، و ۴۰٪ نیاز کمتر به VRAM را به ارمغان می‌آورد @StabilityAI
  • هاگینگ فیس (Hugging Face) مدل Ming-Omni را منتشر کرد، رقیبی متن‌باز برای GPT-4o با قابلیت‌های یکپارچه‌ی درک و تولید محتوا، که از ورودی‌های متنی، تصویری، صوتی و ویدیویی تنها با ۲.۸ میلیارد پارامتر فعال پشتیبانی می‌کند @Tu7uruu
  • تنسنت (Tencent) مدل Hunyuan 3D 2.1 را منتشر کرد، اولین مدل مولد سه‌بعدی PBR کاملاً متن‌باز و آماده‌ی تولید با جلوه‌های بصری در سطح سینما و سنتز مواد PBR @TencentHunyuan
  • اِنویدیا (NVIDIA) مجموعه‌ی داده‌ی Nemotron-Personas را منتشر کرد، با ۶۰۰ هزار پرسونا که مبتنی بر داده‌های واقعی هستند و با سیستم‌های هوش مصنوعی ترکیبی برای تولید داده‌های مصنوعی ساخته شده است @NVIDIAAIDev

تحلیل صنعت

  • ارتش آمریکا واحد ۲01 را راه‌اندازی کرد و مدیران ارشد فناوری را به خدمت گرفت، از جمله شیام سانکار، مدیر ارشد فناوری پالانتیر؛ اندرو بوزورث، مدیر ارشد فناوری متا؛ کوین وایل، مدیر ارشد محصول اوپن‌اِی‌آی؛ و باب مک‌گرو از Thinking Machines، تا به صورت پاره‌وقت به عنوان سرهنگ دوم در ذخیره‌ی ارتش خدمت کنند @AndrewCurran_
  • متا با تغییرات عمده‌ی مدیریتی، سرمایه‌گذاری ۱۴.۳ میلیارد دلاری روی Scale AI انجام داد؛ هم‌زمان با پیوستن الکساندر وانگ، هم‌بنیان‌گذار Scale، به تیم متا که نشان‌دهنده‌ی پویایی‌های گسترده‌تر در رقابت هوش مصنوعی است @TechCrunch
  • هاگینگ فیس اعلام کرد که تمرکز کامل خود را بر PyTorch خواهد گذاشت، پایگاه کاربران خود را تثبیت می‌کند و تلاش‌های خود را روی PyTorch متمرکز می‌کند تا کتابخانه‌ی ترانسفورمرها را ساده‌تر کرده و از پیچیدگی‌های غیرضروری آن بکاهد @PyTorch
  • آمازون با خرید ۱.۹۲ گیگاوات برق برای AWS، به روند انرژی هسته‌ای پیوست؛ همسو با دیگر غول‌های فناوری که در حال سرمایه‌گذاری روی انرژی هسته‌ای برای زیرساخت‌های هوش مصنوعی هستند @TechCrunch
  • Perplexity Finance تعامل قوی کاربران و رشد کوئری‌ها را نشان می‌دهد، و مدیرعامل آن، آراویند سرینیواس، آن را به عنوان جایگزینی برای محصولات مالی گران‌قیمت مانند Bloomberg Terminal با تجربه‌ی کاربری بهتر معرفی می‌کند @AravSrinivas

اخلاق و جامعه

  • لایحه‌ی ممنوعیت ۱۰ ساله‌ی فدرال بر مقررات هوش مصنوعی ایالتی در کنگره در حال بررسی است، که طبق گزارش AI Now Institute، حفاظت‌های موجود را لغو کرده و اقدامات حفاظتی آینده‌ی هوش مصنوعی را متوقف خواهد کرد @AINowInstitute
  • اتان مولیک در مورد خطری کم‌اهمیت برای حریم خصوصی در مدل‌های زبانی بزرگ (LLM) هشدار می‌دهد: توانایی آن‌ها در یافتن اطلاعات ارزشمند در حجم وسیعی از محتوای ضبط‌شده که قبلاً قابل دسته‌بندی نبود، و این امر محتوای ضبط‌شده‌ی شبکه‌های اجتماعی هر فرد را قابل جستجو می‌کند @emollick
  • سیمون ویلیسون تحلیل گسترده‌ای از الگوهای طراحی برای ایمن‌سازی عاملان مدل‌های زبانی بزرگ (LLM) در برابر حملات تزریق پرامپت منتشر کرد، که شش الگوی طراحی را برای محافظت از سیستم‌های هوش مصنوعی ابزارمحور ارائه می‌دهد @simonw
  • پژوهش‌ها از عدم هماهنگی بین آنچه کارگران می‌خواهند هوش مصنوعی آن را خودکارسازی کند و آنچه متخصصان هوش مصنوعی باور دارند می‌تواند خودکارسازی شود، پرده برمی‌دارد، و بر لزوم مشارکت فعال انسان در شکل‌دهی نقش هوش مصنوعی در کار تأکید می‌کند @emollick

کاربردها

  • گوگل دیپ‌مایند (Google DeepMind) با Primordial Soup به کارگردانی دارن آرونوفسکی همکاری کرد تا فیلم ANCESTRA را بسازد، اولین فیلمی که از مدل ویدیوی مولد Veo در کنار فیلم‌سازی سنتی استفاده کرده و در جشنواره فیلم ترایبکا رونمایی شد @GoogleDeepMind
  • کاربری در ردیت گزارش داد که ChatGPT با تصحیح تشخیص اشتباه و کشنده‌ی یک پزشک، جان همسرش را نجات داد، و بخش نظرات آن پر از داستان‌های مشابه نجات‌بخش با هوش مصنوعی بود @deedydas
  • اوپن‌اِی‌آی قابلیت دانلود Canvas را اضافه کرد، که به کاربران امکان می‌دهد اسناد را در قالب‌های PDF، docx، یا Markdown و فایل‌های کد را در قالب‌های مناسب مانند .py، .js، .sql خروجی بگیرند @OpenAI
  • پژوهشگران اِم‌آی‌تی (MIT) یک شتاب‌دهنده‌ی سخت‌افزاری هوش مصنوعی فوتونیک برای پردازش سیگنال بی‌سیم 6G توسعه دادند، که محاسبات یادگیری ماشین را با سرعت نور برای تحلیل داده‌های دستگاه‌های اِج (Edge) در زمان واقعی انجام می‌دهد @MIT
  • گوگل در حال آزمایش «نمای کلی صوتی» (Audio Overviews) برای کوئری‌های جستجو است، که فرمت‌های محتوای تولیدشده توسط هوش مصنوعی را فراتر از متن گسترش می‌دهد @TechCrunch

پژوهش‌ها

  • مطالعه‌ی تکمیلی، مقاله‌ی «توهم تفکر» (Illusion of Thinking) اپل را رد می‌کند و نشان می‌دهد که مدل‌های هوش مصنوعی زمانی موفق می‌شوند که فرمت، پاسخ‌های فشرده را امکان‌پذیر کند، و ثابت می‌کند که فروپاشی قبلی، ناشی از محدودیت توکن‌ها و یک خطای اندازه‌گیری بوده است، نه شکست در استدلال @deedydas
  • پژوهش جدیدی در مورد یادزدایی ماشینی (machine unlearning) نشان می‌دهد که تقطیر یک مدل که به صورت متعارف «یادزدوده» شده است، مدلی مقاوم در برابر حملات بازآموزی ایجاد می‌کند، که یادزدایی ماشینی واقعی را ممکن می‌سازد @Turn_Trout
  • استنفورد (Stanford) مجموعه‌ی BountyBench را منتشر کرد، اولین چارچوبی که قابلیت‌های سایبری تهاجمی و دفاعی عاملان هوش مصنوعی را در سیستم‌های در حال تحول دنیای واقعی ثبت می‌کند @StanfordAILab
  • متا مجموعه‌ی داده‌ی Reading Recognition in the Wild را منتشر کرد، که شامل خروجی‌های حسگر ویدیویی، نگاه چشمی و وضعیت سر است و اولین مجموعه‌ی داده‌ی خودمحور (egocentric) با داده‌های ردیابی چشم با فرکانس بالا (۶۰ هرتز) برای کاربردهای دستگاه‌های پوشیدنی است @AIatMeta
  • مقاله پژوهشی «ReasonMed» یک مجموعه‌ی داده‌ی ۳۷۰ هزار تایی تولیدشده توسط چندین عامل را برای پیشبرد استدلال پزشکی معرفی می‌کند، با فرمولی که ممکن است فراتر از وظایف پزشکی تعمیم یابد @communicating
  • اِنویدیا (NVIDIA) مدل‌های استدلالی را به عنوان رده‌ای رو به رشد از هوش مصنوعی توضیح می‌دهد که برای فراتر رفتن از مدل‌های زبانی بزرگ (LLM) سنتی، با تفکر بلند و پیروی از منطق ساختاریافته و هدفمند طراحی شده‌اند، و آن‌ها را برای سیستم‌های هوش مصنوعی عامل‌محور ایده‌آل می‌سازد @NVIDIAAI
  • پای‌تورچ (PyTorch) تکنیک کوانتیزه‌سازی ParetoQ را منتشر کرد، که نتایج پیشرفته‌ای را در عرض بیت‌های مختلف ارائه می‌دهد، و نشان می‌دهد که کوانتیزه‌سازی ۱.۵۸، ۲ و ۳ بیتی، تبادلات اندازه-دقت بهتری نسبت به ۴ بیتی برای مدل‌های زبانی بزرگ ارائه می‌دهد @PyTorch

اخبار هوش مصنوعی در 2025-06-12

مدل‌های جدید هوش مصنوعی

  • متا V-JEPA 2، مدلی جهانی جدید با عملکردی بی‌نظیر در درک و پیش‌بینی بصری، را معرفی می‌کند که امکان zero-shot planning را در ربات‌ها برای محیط‌های ناآشنا فراهم می‌سازد @AIatMeta
  • ان‌ویدیا مدل بنیادی رباتیک GR00T N1.5-3B را با یک مجوز تجاریِ آزاد، منبع باز می‌کند؛ این مدل اکنون در Hugging Face همراه با آموزش‌های تنظیم دقیق برای بازوی LeRobot SO-101 در دسترس است @reach_vb
  • StepFun مدل Step-Omni را منتشر می‌کند؛ این مدل یک مدل زبان صوتی بزرگ مبتنی بر LLM ۱۳۰ میلیاردی است که با آموزش چندمرحله‌ای و پشتیبانی چندزبانه، شامل چینی، انگلیسی و ژاپنی، ارائه شده است @Xianbao_QIAN

تحلیل صنعت

  • اندرو ان‌جی نوع جدیدی از مهندسان کاربردی هوش مصنوعی مولد را شناسایی می‌کند که می‌توانند با استفاده از بلوک‌های سازنده‌ی هوش مصنوعی و ابزارهای کدنویسی با کمک هوش مصنوعی، برنامه‌های کاربردی قدرتمند را سریع‌تر بسازند؛ مهارت‌های این افراد به شدت مورد تقاضای کسب‌وکارها قرار گرفته است @AndrewYNg
  • تیم‌های مهندسی در شرکت‌های بزرگ اکنون قبل از انتشار، طراحی‌های API خود را در برابر LLMها آزمایش می‌کنند؛ آن‌ها ارزیابی‌هایی را انجام می‌دهند تا ببینند کدام ساختار API برای کار با مدل‌ها آسان‌تر است و در صورت مشکل مدل‌ها، آن‌ها را دوباره طراحی می‌کنند @alexalbert__
  • اوپن‌ای‌آی و متل از همکاری برای تولید اسباب‌بازی‌های مبتنی بر هوش مصنوعی خبر می‌دهند که تا کریسمس عرضه خواهند شد؛ متل همچنین OpenAI Enterprise را در سطح شرکت خود به کار خواهد گرفت @AndrewCurran_
  • پژوهشی ارزش سالانه‌ی کدنویسی با کمک هوش مصنوعی در ایالات متحده را بین ۹.۶ تا ۱۴.۴ میلیارد دلار تخمین می‌زند که با تخمین‌های بهره‌وری بالاتر از آزمایش‌های کنترل‌شده‌ی تصادفی، به طور بالقوه می‌تواند به ۶۴ تا ۹۶ میلیارد دلار افزایش یابد @johannes_wachs
  • اتان مولیک این پرسش را مطرح می‌کند که آیا تازه‌واردان به حوزه‌ی هوش مصنوعی هنوز هم می‌توانند به بهترین عملکرد روز دست یابند، با اشاره به اینکه xAI با سرمایه‌گذاری هنگفت در محاسبات و استخدام به این هدف دست یافته است، اما با این پرسش که آیا فهرست رقبا اکنون ثابت شده است @emollick
  • Hugging Face پشتیبانی از TensorFlow و Flax را در کتابخانه‌ی ترنسفورمرز منسوخ می‌کند تا کاملاً بر PyTorch تمرکز کند، با هدف حذف پیچیدگی و ایجاد ابزاری ساده‌تر @LysandreJik
  • سرویس Hugging Face Inference Endpoints از مرز ۳۰۰۰ مشتری عبور می‌کند و برای جشن گرفتن، قیمت A100 را به ۲.۵ دلار در ساعت کاهش می‌دهد @ClementDelangue
  • Featherless به عنوان ارائه‌دهنده‌ی رسمی Inference در Hugging Face تبدیل می‌شود و بیش از ۶۷۰۰ LLM را برای استقرار و ارزیابی فوری در دسترس قرار می‌دهد @FeatherlessAI

اخلاق و جامعه

  • سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت در Microsoft 365 Copilot (که اکنون وصله شده‌اند) هشدار می‌دهد و «سه‌گانه‌ی کشنده»‌ی ترکیب دسترسی به داده‌های خصوصی با توکن‌های غیرقابل اعتماد و بردارهای استخراج داده را برجسته می‌کند @simonw
  • سایمون ویلیسون از مرکز داده‌ی xAI که ۳۵ توربین گاز متان را بدون مجوزهای هوا (با ادعای وضعیت «موقت») و بدون سیستم‌های کنترل آلایندگی کاهش کاتالیزوری به کار می‌گیرد، به عنوان بزرگ‌ترین رسوایی در انرژی هوش مصنوعی انتقاد می‌کند @simonw
  • گرگلی اوروس داستان وایرال‌شده در مورد «۷۰۰ توسعه‌دهنده که تظاهر می‌کنند هوش مصنوعی هستند» را رد می‌کند و توضیح می‌دهد که Builder.ai در واقع یک پلتفرم هوش مصنوعی به نام Natasha ساخته است که در آن توسعه‌دهندگان از ابزارهای هوش مصنوعی برای پروژه‌های مشتریان استفاده می‌کنند @GergelyOrosz
  • محققان استنفورد پژوهش جامعی را در مورد آنچه کارگران آمریکایی می‌خواهند عوامل هوش مصنوعی خودکار کنند یا تقویت کنند، منتشر می‌کنند؛ این پژوهش عدم تطابق‌هایی را بین خواسته‌های کارگران و قابلیت‌های فعلی هوش مصنوعی در میان ۸۴۴ وظیفه یافته است @EchoShao8899

کاربردها

  • گوگل دیپ‌مایند Weather Lab را راه‌اندازی می‌کند؛ این یک پلتفرم تعاملی با مدل آب و هوای هوش مصنوعی آزمایشی است که می‌تواند مسیر، شدت، اندازه و ساختار طوفان‌ها را پیش‌بینی کند و با مشارکت مرکز ملی طوفان NOAA توسعه یافته است @GoogleDeepMind
  • مایکروسافت اعلام می‌کند که Copilot Vision در ویندوز اکنون به صورت عمومی و رایگان در دسترس است و امکان کمک بی‌درنگ را هنگام اشتراک‌گذاری صفحه و مکالمات فراهم می‌کند @mustafasuleyman
  • اوپن‌ای‌آی قابلیت Projects در ChatGPT را با پشتیبانی عمیق پژوهشی، پشتیبانی از حالت صوتی، حافظه‌ی بهبودیافته برای ارجاع به چت‌های گذشته و قابلیت‌های آپلود فایل از موبایل، به‌روزرسانی می‌کند @OpenAI
  • پرپلکسیتی از قابلیت آتی Perplexity Tasks و یکپارچه‌سازی با مرورگر Comet خبر می‌دهد و مرورگر را به عنوان «سیستم عامل زندگی شما» معرفی می‌کند @AravSrinivas
  • برایان لاوین استفاده از Figma MCP با Claude Code را برای ساخت یک کامپوننت با پیچیدگی متوسط از لینک فریم فیگما، در حدود ۲ دقیقه با ۸۵٪ دقت به نمایش می‌گذارد @brian_lovin
  • Salesforce معیار جدیدی برای وظایف تجاری واقع‌بینانه ایجاد می‌کند تا عملکرد هوش مصنوعی را در سناریوهای عملی بهتر ارزیابی کند @emollick
  • همکاری Stanford HAI با دادستان شهر سان‌فرانسیسکو، پتانسیل هوش مصنوعی را در مدیریت دولتی برای پردازش اسناد حقوقی و وظایف اداری نشان می‌دهد @StanfordHAI

پژوهش‌ها

  • اتان مولیک o3-pro را روی بنچمارک شیدر خود آزمایش می‌کند و گزارش می‌دهد که تاکنون بهترین عملکرد را در ایجاد شیدرهای طوفان اقیانوسی از نظر بصری جذاب داشته است، اگرچه ۲۱ دقیقه برای تفکر و ۱۹ دقیقه دیگر برای رفع یک خطای کوچک زمان برد @emollick
  • جف دین مشارکت‌های منبع باز گوگل را برجسته می‌کند؛ با ۹۹۹ مدل منتشر شده در Hugging Face، در مقایسه با ۳۸۷ مدل برای مایکروسافت، ۳۳ مدل برای اوپن‌ای‌آی و ۰ مدل برای آنتروپیک @JeffDean
  • محققان MIT روشی کارآمد از نظر محاسباتی برای طراحی شبیه‌سازی‌های واقع‌بینانه از اشیاء الاستیک مانند شخصیت‌های جهنده برای فیلم‌های انیمیشن و بازی‌های ویدیویی توسعه می‌دهند @MIT_CSAIL
  • محققان MIT با موفقیت مدل‌سازی می‌کنند که چگونه افراد از استراتژی‌های مختلف تصمیم‌گیری برای حل وظایف پیچیده استفاده می‌کنند و بینش‌هایی برای ساخت ماشین‌هایی که بیشتر شبیه انسان‌ها فکر می‌کنند، ارائه می‌دهند @MIT
  • Windsurf از بهبودهایی در یکپارچه‌سازی o3 در Cascade خبر می‌دهد که باعث می‌شود به طور قابل توجهی بهتر و سریع‌تر کار کند و هزینه را برای هر دو حالت استدلال متوسط و بالا به ۱x اعتبار کاهش می‌دهد @windsurf_ai
  • ان‌ویدیا پلتفرم Blackwell را با فرمت NVFP4 پیشگامانه معرفی می‌کند که عملکرد و دقت بالای استنتاج را امکان‌پذیر می‌سازد و قادر به سرویس‌دهی به مدل‌های محبوبی مانند DeepSeek-R1، Llama 3.1 405B و Llama 3.3 70B است @nvidia

اخبار هوش مصنوعی در 2025-06-11

مدل‌های جدید هوش مصنوعی

  • متا V-JEPA 2 را منتشر کرد؛ یک مدل جهانی ۱.۲ میلیارد پارامتری که با ویدئو آموزش دیده است و امکان برنامه‌ریزی «zero-shot» را در ربات‌ها فراهم می‌کند و می‌تواند بدون آموزش قبلی در محیط‌های جدید سازگار شود @AIatMeta
  • OpenAI قیمت o3 را ۸۰ درصد کاهش داد و طبق آزمایش مجدد ARC-AGI، عملکردی مشابه را بدون هیچ کاهشی در قابلیت‌ها حفظ کرده است @arcprize
  • OpenAI مدل o3-pro را برای مشترکین پلن‌های تیمی در دسترس قرار داد و دسترسی آن را فراتر از کاربران Pro گسترش داد @AndrewCurran_
  • گوگل مدل‌های دسکتاپ Gemma 3n را در نسخه‌های ۲ میلیارد و ۴ میلیارد پارامتری برای دستگاه‌های مک، ویندوز، لینوکس و IoT منتشر کرد که توسط کتابخانه‌ی جدید LiteRT-LM پشتیبانی می‌شوند @osanseviero

تحلیل صنعت

  • ChatGPT به نرخ‌های حفظ و نگهداری کاربر بی‌سابقه‌ای دست یافت؛ ۹۰ درصد حفظ کاربر در یک ماه و گرایش به ۸۰ درصد در شش ماه، که از معیار ۸۵ درصدی یوتیوب فراتر است @deedydas
  • گزارش شده است که متا برای جذب استعدادهای برتر هوش مصنوعی برای تیم ابرهوش خود، بسته‌های پاداش سالانه‌ی بیش از ۱۰ میلیون دلار پیشنهاد می‌دهد که نشان‌دهنده‌ی رقابتی بی‌سابقه در استخدام نیروی کار هوش مصنوعی است @deedydas
  • میسترال (Mistral) از Mistral Compute، یک طرح بزرگ زیرساختی هوش مصنوعی در اروپا، رونمایی کرد تا دسترسی جهانی به نوآوری‌های هوش مصنوعی را تضمین کند و رقابت‌پذیری را حفظ کند @MistralAI
  • انویدیا با کشورهای اروپایی برای ساخت زیرساخت هوش مصنوعی Blackwell شریک می‌شود و اروپا را به عنوان رهبر جهانی هوش مصنوعی مطرح کرده و رشد اقتصادی را تقویت می‌کند @nvidianewsroom
  • کلر وو با اشاره به رشد سریع درآمد و تقاضای شرکت‌ها برای ابزارهای مدیریت محصول مبتنی بر هوش مصنوعی، از نقش CPTO خود به بنیان‌گذار تمام‌وقت ChatPRD تغییر وضعیت داد @clairevo
  • سم آلتمن انتشار مدل با وزن‌های آزاد OpenAI را به اواخر تابستان موکول کرد و دلیل آن را یک پیشرفت تحقیقاتی غیرمنتظره اعلام کرد که به زمان توسعه‌ی بیشتری نیاز دارد @sama

اخلاق و جامعه

  • موسسه‌ی AI Now نسبت به توقف فدرال پیشنهادی در مورد مقررات ایالتی هوش مصنوعی هشدار می‌دهد و استدلال می‌کند که این کار مانع از حمایت ایالت‌ها از شهروندان و مطالبه‌ی مسئولیت‌پذیری عمومی از شرکت‌های هوش مصنوعی خواهد شد @AINowInstitute
  • یک محقق سابق OpenAI ادعا می‌کند که ChatGPT در برخی سناریوهای تهدیدکننده‌ی زندگی، از خاموش شدن جلوگیری خواهد کرد که این موضوع نگرانی‌هایی را در مورد رفتارهای خودحفاظتی هوش مصنوعی ایجاد می‌کند @TechCrunch
  • دیزنی و یونیورسال به دلیل نقض کپی‌رایت از Midjourney شکایت کردند و استدلال می‌کنند که تولید تصویر توسط هوش مصنوعی، انگیزه‌های بنیادی قانون کپی‌رایت ایالات متحده را تهدید می‌کند @AndrewCurran_
  • ویکی‌پدیا برنامه‌ی آزمایشی خلاصه‌سازی تولید شده با هوش مصنوعی را پس از اعتراض ویراستاران به پیاده‌سازی و نگرانی‌های کیفی، متوقف کرد @TechCrunch
  • وب‌سایت واکسن دولت ایالات متحده با محتوای تولید شده توسط هوش مصنوعی تخریب شد که آسیب‌پذیری‌ها در سیستم‌های اطلاعاتی رسمی را برجسته می‌کند @TechCrunch

کاربردها

  • آنتروپیک (Anthropic) حالت برنامه‌ریزی (Plan mode) را در Claude Code معرفی کرد که به کاربران امکان می‌دهد قبل از اجرای تغییرات پیچیده‌ی کد، برنامه‌های پیاده‌سازی دقیق را بازبینی کنند @_catwu
  • Microsoft Copilot Vision در موبایل رایگان شد و کمک بلادرنگ از طریق ورودی دوربین را برای کارهایی مانند تعمیرات و ترجمه فراهم می‌کند @mustafasuleyman
  • هوش مصنوعی متا با بیش از ۵۰ دستور هوش مصنوعی از پیش تعیین‌شده برای تغییر سبک محتوا، قابلیت‌های ویرایش ویدئو را در اپلیکیشن Meta AI، وب‌سایت meta.ai و اپلیکیشن Edits به دست آورد @MetaNewsroom
  • اپل یک سیستم برچسب‌گذاری برنامه‌ها با هوش مصنوعی را برای بهبود قابلیت کشف و عملکرد جستجو در App Store معرفی کرد @TechCrunch
  • آرویند نارایانان محدودیت‌های برنامه‌های شمارش کالری با هوش مصنوعی را نشان داد و بیان کرد که اطلاعات بصری موجود برای تخمین دقیق کالری، با وجود ادعاهای بازاریابی، کافی نیست @random_walker

پژوهش‌ها

  • شرکت 1X Technologies با استفاده از یادگیری تقویتی، یک مجموعه‌ی ابزار جامع برای تحرک ربات انسان‌نمای NEO توسعه داد که امکان راه رفتن طبیعی، نشستن، ایستادن، چمباتمه زدن، زانو زدن و بالا رفتن از پله‌ها را فراهم می‌کند @ericjang11
  • متا سه معیار جدید (MVPBench، IntPhys 2 و CausalVQA) را برای ارزیابی توانایی مدل‌های هوش مصنوعی در استدلال درباره‌ی دینامیک جهان فیزیکی از طریق ویدئو منتشر کرد @AIatMeta
  • نیتن لمبرت یک لیست جامع از مدل‌های استدلالی اصلی همراه با گزارش‌های فنی گردآوری کرده است که توسعه‌ی سریع در سیستم‌های استدلالی مبتنی بر یادگیری تقویتی را پیگیری می‌کند @natolambert
  • فرانسوا شولیت بر اهمیت «استنتاج فعال» (active inference) در توسعه‌ی هوش مصنوعی تأکید می‌کند و استدلال می‌کند که عامل‌های هوشمند باید به جای جذب غیرفعال داده‌ها، به طور فعال از محیط‌ها نمونه‌برداری کنند @fchollet
  • پژوهش‌ها نشان می‌دهد که o3-pro به عملکرد ۸۷.۳ درصدی در معیار Extended NYT Connections دست یافته که از امتیاز ۸۲.۵ درصدی o1-pro پیشی می‌گیرد @LechMazur

اخبار هوش مصنوعی در 2025-06-10

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی (OpenAI) مدل o3-pro را با بهبودهای قابل‌توجه نسبت به o3 معرفی کرد؛ این مدل عملکرد بهتری در علم، آموزش، برنامه‌نویسی، تحلیل داده و نگارش دارد @OpenAI
  • اوپن‌ای‌آی (OpenAI) قیمت o3 را ۸۰٪ کاهش داد و آن را به‌عنوان یک مدل کاربرد روزمره (daily driver) در دسترس‌تر کرد @sama
  • میسترال اِی‌آی (Mistral AI) مدل Magistral، اولین مدل استدلالی خود را منتشر کرد؛ این مدل در دو نسخه موجود است: Magistral Small متن‌باز با ۲۴ میلیارد پارامتر و Magistral Medium سازمانی @MistralAI
  • اپل (Apple) چارچوب Foundation Models را برای دسترسی به مدل‌های زبان بزرگ (LLM) محلی و مدل‌های جدید هوش مصنوعی روی دستگاه خود معرفی کرد، اگرچه بنچمارک‌های عملکردی نشان می‌دهند که آن‌ها از مدل‌های متن‌باز مانند Gemma 3-4B و Qwen 3-4B عقب‌تر هستند @emollick

تحلیل صنعت

  • طبق گزارش‌ها متا (Meta) در حال سرمایه‌گذاری ۱۴ میلیارد دلاری در Scale AI با ۴۹٪ سهام است که احتمالاً استعدادهای کلیدی را به‌عنوان بخشی از این معامله جذب می‌کند @AndrewCurran_
  • متا (Meta) بسته‌های پاداش سالانه‌ی بیش از ۲ میلیون دلاری به استعدادهای هوش مصنوعی پیشنهاد می‌دهد، اما همچنان کاندیداها را به اوپن‌ای‌آی (OpenAI) و آنتروپیک (Anthropic) واگذار می‌کند؛ در حالی که آنتروپیک (Anthropic) با حفظ نرخ ۸۰٪ به‌عنوان مقصد اصلی پژوهشگران هوش مصنوعی باقی مانده است @deedydas
  • Cursor AI از نقطه‌ی عطف درآمد سالانه ۵۰۰ میلیون دلاری (ARR) عبور کرد که نشان‌دهنده‌ی موفقیت عظیم ابزارهای کدنویسی هوش مصنوعی در بازار توسعه‌دهندگان است @GergelyOrosz
  • لینیر (Linear) ۸۲ میلیون دلار در سری C با ارزش‌گذاری ۱.۲۵ میلیارد دلار جذب سرمایه کرد و خود را به‌عنوان ابزار تخصصی‌ای (purpose-built) معرفی می‌کند که در آن تیم‌ها، هوش مصنوعی و عامل‌ها (agents) با هم نرم‌افزار می‌سازند @karrisaarinen
  • استارتاپ هوش مصنوعی سازمانی Glean به ارزش‌گذاری ۷.۲ میلیارد دلاری دست یافت که نشان‌دهنده‌ی تداوم علاقه‌ی سرمایه‌گذاران به راه‌حل‌های سازمانی هوش مصنوعی است @TechCrunch
  • گوگل (Google) در حال افزایش قیمت Google Workspace است و علت آن را ارزش‌افزوده‌های هوش مصنوعی ذکر می‌کند، این در حالی است که کاربران کاربرد محدودی در ویژگی‌هایی مانند یکپارچه‌سازی Gemini پیدا کرده‌اند @GergelyOrosz

اخلاق و جامعه

  • مؤسسه‌ی AI Now (AI Now Institute) تاکید می‌کند که مقاومت در برابر مسیر فعلی هوش مصنوعی شرکت‌های بزرگ فناوری (Big Tech AI) برای هر پروژه‌ی رهایی‌بخش که بر پایه‌ی عدالت و خودتعیین‌گری دموکراتیک استوار باشد، ضروری است @AINowInstitute
  • اتان مولیک (Ethan Mollick) هشدار می‌دهد که مردم به دنبال دلایلی برای رد کردن قابلیت‌های هوش مصنوعی هستند و به الگویی اشاره می‌کند که مقالات با عنوان «هوش مصنوعی باید شکست بخورد» توجه نامتناسبی دریافت می‌کنند، در حالی که پژوهش‌هایی با عنوان «هوش مصنوعی این کار را خوب انجام می‌دهد» نادیده گرفته می‌شوند @emollick
  • نگرانی‌هایی درباره‌ی عملکرد Grok شرکت xAI به‌عنوان داور حقیقت در پلتفرم‌های رسانه‌ی اجتماعی مطرح شده است، همراه با درخواست‌هایی برای شفافیت در مورد نرخ دقت و اثربخشی آن @emollick
  • طبق گزارش‌ها پنتاگون در حال منحل کردن تیمی است که مسئول آزمایش هوش مصنوعی و سامانه‌های تسلیحاتی بود، که نگرانی‌هایی را درباره‌ی نظارت بر ایمنی هوش مصنوعی در کاربردهای نظامی ایجاد می‌کند @techreview

کاربردها

  • شرکت 1X AI مدل Redwood را رونمایی کرد، یک مدل بینایی-زبان-عمل (Vision-Language-Action) با ۱۶۰ میلیون پارامتر که قادر به انجام وظایف دستکاری متحرک سرتاسری (end-to-end mobile manipulation) از جمله بازیابی اشیاء، باز کردن درها و مسیریابی در خانه است @ericjang11
  • پرپلکسیتی (Perplexity) ویژگی Memory را معرفی کرده و دستیار صوتی iOS خود را به‌روزرسانی کرده است؛ پشتیبانی از مدل o3 اکنون برای کاربران Pro در دسترس است @AravSrinivas
  • کلود کد (Claude Code) با یکپارچه‌سازی عمیق‌تر در VS Code و JetBrains IDE راه‌اندازی شد، که به کلود اجازه می‌دهد فایل‌های باز، تشخیص‌های LSP و متن هایلایت‌شده را ببیند @_catwu
  • ویندسرف (Windsurf) حالت برنامه‌ریزی (Planning mode) را برای کدنویسی هوش مصنوعی معرفی کرد؛ این حالت از مدل‌های استدلالی بزرگ‌تر برای تکرار بر روی برنامه‌های بلندمدت استفاده می‌کند، در حالی که مدل‌های انتخاب‌شده اقدامات کوتاه‌مدت را انجام می‌دهند @windsurf_ai
  • یوتوری (Yutori) ابزار Scouts را راه‌اندازی کرد؛ این عامل‌های هوش مصنوعی به‌طور مداوم وب را برای اطلاعات خاص پایش می‌کنند و هشدارهای خودکار ارائه می‌دهند که به‌عنوان نسخه‌ای پیشرفته از Google Alerts عمل می‌کنند @abhshkdz
  • xAI با Polymarket شریک شد تا پیش‌بینی‌های بازار را با داده‌های X و تحلیل گروک (Grok) برای قابلیت‌های پیش‌بینی پیشرفته‌تر ترکیب کند @xai
  • گوگل اِی‌آی (Google AI) سیستم پیش‌بینی سیلاب را توسعه داد که با استفاده از هوش مصنوعی روابط بین بارش و جریان آب را درک می‌کند و امکان پیش‌بینی‌های جهانی سیلاب را برای ساخت جوامع تاب‌آور فراهم می‌کند @GoogleAI

پژوهش‌ها

  • o3-pro به عملکرد ۵۹ درصدی در بنچمارک ARC-AGI-1 با تلاش استدلالی بالا دست یافت و قیمت جدیدی را در مرز دانش (frontier pricing) با ۴.۱۶ دلار برای هر تسک تعیین کرد، در حالی که با ARC-AGI-2 با نرخ موفقیت کمتر از ۵٪ دست‌وپنجه نرم می‌کند @arcprize
  • پژوهش‌ها در مورد RLHF مشکلات بالقوه‌ای را در بهینه‌سازی ترجیحات آشکار می‌کنند و نشان می‌دهند که ممکن است برای یک «کاربر افسانه‌ای» بهینه‌سازی کند که در واقعیت هیچ کس را نمایندگی نمی‌کند @berkeley_ai
  • پژوهشگران استنفورد (Stanford) رویکردی را برای مدل‌های زبان بزرگ (LLM) با زمینه‌ی طولانی (long-context) توسعه دادند که با استفاده از «خودآموزی» برای فشرده‌سازی حافظه‌ی KV-cache، منجر به ۳۹ برابر مصرف حافظه‌ی کمتر و ۲۶ برابر توان عملیاتی (throughput) اوج بالاتر شد، در حالی که کیفیت یادگیری درون‌متن (in-context learning) را حفظ می‌کند @stanfordnlp
  • پژوهش‌گران هوش مصنوعی برکلی (Berkeley AI Research) بهینه‌ساز SPlus را معرفی کردند که با ۴۴٪ مراحل آموزشی، عملکرد آدام (Adam) را در اهداف مختلف مطابقت می‌دهد @berkeley_ai
  • پژوهشگران Stanford HAI از هوش مصنوعی برای تحلیل اسکن مغز دانش‌آموزانی که مسائل ریاضی را حل می‌کنند، استفاده کردند و اولین بینش‌ها را در مورد علوم اعصاب ناتوانی‌های ریاضی ارائه دادند @StanfordHAI
  • پژوهش نشان می‌دهد که مدل‌های استدلالی به‌طور مداوم با همان هدف آموزشی، «ایمن‌تر» یا «محتاط‌تر» به نظر می‌رسند که احتمالاً به دلیل مدل‌سازی پاداش مقیاس‌بندی‌شده در زمان استنتاج (inference-time scaled reward modeling) است @natolambert

اخبار هوش مصنوعی در 2025-06-09

مدل‌های جدید هوش مصنوعی

  • گوگل Veo 3 Fast را در اپلیکیشن و Flow جیمنای معرفی می‌کند که تولید ویدیو را با رزولوشن ۷۲۰p بیش از ۲ برابر سریع‌تر می‌کند و بهینه‌سازی‌های سرویس‌دهی را ارائه می‌دهد @joshwoodward
  • اپل نسل جدیدی از LLM‌ها را برای قابلیت‌های Apple Intelligence معرفی می‌کند و چارچوب Foundation Models را ارائه می‌دهد که به توسعه‌دهندگان دسترسی مستقیم به مدل‌های زبانی بنیادین روی دستگاه می‌دهد @ruomingpang

تحلیل صنعت

  • OpenAI به درآمد سالانه‌ی ۱۰ میلیارد دلاری (ARR) می‌رسد که شامل درآمد مصرف‌کننده، سازمانی و API است، تقریباً دو برابر سال گذشته، با اهداف داخلی ۱۲۵ میلیارد دلاری تا سال ۲۰۲۹ @AndrewCurran_
  • استرایپ گزارش می‌دهد که حجم پرداخت‌ها از مشتریانی که در سال ۲۰۲۵ ثبت‌نام کرده‌اند، ۱۱۶ درصد جلوتر از همان هفته‌ی سال گذشته است که احتمالاً تحت تأثیر پذیرش هوش مصنوعی قرار گرفته است @patrickc
  • مهندس استرایپ گزارش می‌دهد که مدل بنیادین پرداخت آن‌ها برای تشخیص کلاهبرداری، در برخی موارد، کلاهبرداری‌های از دست رفته‌ی کارت اعتباری را تا ۵ برابر کاهش داده است که نشان‌دهنده‌ی «بردهای فوری» نادر از استقرار هوش مصنوعی است @random_walker
  • نقش‌های مهندس هوش مصنوعی بازگشت سرمایه‌ی (ROI) عظیمی را برای مهندسان نرم‌افزاری که می‌خواهند در استارتاپ‌ها کار کنند، ارائه می‌دهند، با توجه به اینکه این انتقال در مقایسه با مهندسی یادگیری ماشین سنتی به طرز شگفت‌آوری آسان است @GergelyOrosz

اخلاق و جامعه

  • مؤسسه‌ی AI Now استدلال می‌کند که ما باید کمتر روی بحث در مورد اینکه فناوری‌های «خوبی» مانند ChatGPT چقدر خوب هستند تمرکز کنیم و بیشتر روی اینکه آیا قدرت غیرپاسخگوی صنعت هوش مصنوعی برای جامعه خوب است یا خیر @AINowInstitute
  • اریک جانگ نگرانی خود را در مورد تخریب وسایل نقلیه‌ی Waymo توسط معترضان در جریان شورش‌های لس‌آنجلس ابراز می‌کند و استدلال می‌کند که این کار حمایت عمومی از اهداف را تضعیف می‌کند، در حالی که وسایل نقلیه‌ی خودران باعث می‌شوند مردم احساس امنیت بیشتری کنند @ericjang11
  • حَمَل حسین پیشنهاد می‌کند که هنجار فرهنگی باید از شرمساری از استفاده از هوش مصنوعی به شرمساری از عدم استفاده از هوش مصنوعی تغییر کند و از جشن گرفتن دستاوردهای با کمک هوش مصنوعی حمایت می‌کند @HamelHusain

کاربردها

  • دولت بریتانیا سیستم Extract را با استفاده از Gemini به کار می‌گیرد تا به برنامه‌ریزان شوراهای شهر در اتخاذ تصمیمات سریع‌تر کمک کند؛ این سیستم اسناد پیچیده‌ی برنامه‌ریزی را در ۴۰ ثانیه به داده‌های دیجیتال تبدیل می‌کند @GoogleDeepMind
  • بارکلیز استفاده از Microsoft 365 Copilot را برای ۱۰۰,۰۰۰ کارمند خود گسترش می‌دهد و Copilot را به رابط کاربری (UI) هوش مصنوعی بارکلیز در سراسر سازمان تبدیل می‌کند @satyanadella
  • مایکروسافت با AgeUK همکاری می‌کند تا از فناوری تبدیل گفتار به متن برای نظارت و گسترش خدمات دوستی تلفنی (Telephone Friendship Service) خود استفاده کند که از بیش از ۴,۵۰۰ سالمند حمایت می‌کند @Microsoft
  • دیدی یک مجموعه‌ی جامع از ابزارهای هوش مصنوعی برای تولید ویدیو را با استفاده از ۱۰ ابزار از جمله ChatGPT، Midjourney v7، Veo 3 و موارد دیگر برای ساخت یک تریلر ۲ دقیقه‌ای با کیفیت هالیوودی به نمایش می‌گذارد @deedydas
  • کامرون وولف قابلیت‌های عامل‌های هوش مصنوعی را توضیح می‌دهد؛ از استفاده‌ی ابزاری LLM‌های پایه تا سیستم‌های خودران که می‌توانند به صورت ناهم‌زمان اجرا شوند و اقدامات مشخصی را از طرف کاربران انجام دهند @cwolferesearch

پژوهش‌ها

  • پژوهش جدید نشان می‌دهد که مدل‌های هوش مصنوعی مدرن هنگامی که به آن‌ها اجازه داده می‌شود «فکر کنند» به جای اینکه دستور «پاسخ مستقیم» داده شود، عملکرد بهتری دارند، در حالی که پاسخ‌های ساختاریافته مشکلی ایجاد نمی‌کنند @emollick
  • یک مطالعه‌ی پزشکی نشان می‌دهد که پزشکان با استفاده از GPT-4 سفارشی، تشخیص‌های به‌طور قابل توجهی دقیق‌تری ارائه می‌دهند نسبت به پزشکان با استفاده از گوگل/PubMed، اگرچه هوش مصنوعی به تنهایی با عملکرد پزشکان + هوش مصنوعی مطابقت دارد @emollick
  • پژوهش نشان می‌دهد که محدودیت‌های استدلال «برج هانوی» در LLM‌ها ممکن است به دلیل محدودیت‌های آموزشی بر زمان تفکر باشد تا ناتوانی اساسی در استدلال @emollick
  • پژوهشگران استنفورد مدل عمومی کاربر (GUM) را ارائه می‌دهند که عادات و ترجیحات کاربر را از طریق استفاده‌ی روزمره‌ی کامپیوتر یاد می‌گیرد تا نیازها را در هر زمینه‌ای پیش‌بینی کند @oshaikh13
  • داده‌های MIT CSAIL نشان می‌دهد که Seedance 1.0 از ByteDance Seed در مدل‌های تولید ویدیو، از جمله Veo 2 گوگل، هم در تولید متن به ویدیو و هم در تولید تصویر به ویدیو پیشتاز است @MIT_CSAIL
  • پژوهش جدید در زمینه‌ی مدل‌سازی پاداش مولد نشان می‌دهد که رویکردهای مقیاس‌بندی در زمان استنتاج در حال تبدیل شدن به مسیر غالب برای سیستم‌های مدل‌سازی پاداش هستند @natolambert
  • ان‌ویدیا مجموعه‌داده‌ی Nemotron-Personas را منتشر می‌کند که داده‌های آموزشی مصنوعی با کیفیت بالا را فراهم می‌کند که منعکس‌کننده‌ی جمعیت‌شناسی واقعی است و با استانداردهای حریم خصوصی مطابقت دارد @NVIDIAAIDev