اخبار هوش مصنوعی در 2025-07-03

مدل‌های جدید هوش مصنوعی

  • مدل تولید ویدیوی Veo 3 اکنون به‌صورت جهانی برای همه‌ی کاربران Gemini Pro عرضه شده است و امکان تولید ۳ ویدیو در روز را با شارژ روزانه‌ی اعتبار فراهم می‌کند. @demishassabis
  • DeepSeek مدل R1T2 را منتشر کرد که ۲۰۰٪ سریع‌تر از R1-0528 و ۲۰٪ سریع‌تر از R1 است و عملکردی به‌مراتب بهتر در بنچمارک‌های GPQA و AIME 24 دارد. @reach_vb
  • Kyutai مدل تبدیل متن به گفتار استریمینگ را با حدود ۲ میلیارد پارامتر، تأخیر بسیار کم (۲۲۰ میلی‌ثانیه)، و قابلیت ارائه‌ی خدمات به حداکثر ۳۲ کاربر با تأخیر کمتر از ۳۵۰ میلی‌ثانیه روی یک L40 منتشر کرد. @reach_vb
  • اپل مدل‌های زبان بزرگ (LLM) کدنویسی مبتنی بر انتشار را در Hugging Face منتشر کرد. @reach_vb

تحلیل صنعت

  • فیگما برای عرضه‌ی اولیه‌ی سهام (IPO) با ارزش‌گذاری تقریبی ۲۰ میلیارد دلار و ۸۲۱ میلیون دلار درآمد سالانه‌ی تکرارشونده (ARR) با رشد ۴۶ درصدی سال‌به‌سال اقدام کرد و اولین شرکت در فرم S-1 خود بود که هوش مصنوعی را به‌عنوان یک عامل خطر ذکر کرد. @deedydas
  • قرارداد سالانه‌ی مرموز ۳۰ میلیارد دلاری اوراکل احتمالاً به سایت‌های جدید دیتاسنتر Stargate در سراسر تگزاس، میشیگان، ویسکانسین، وایومینگ، نیومکزیکو، جورجیا، اوهایو و پنسیلوانیا مرتبط است. @AndrewCurran_
  • ۹۳ درصد از خرده‌فروشان در سال ۲۰۲۵ سرمایه‌گذاری در هوش مصنوعی را افزایش می‌دهند و هوش مصنوعی مولد در حال متحول کردن بازاریابی خرده‌فروشی از تولید محتوا تا هدف‌گذاری است. @NVIDIAAI
  • تقاضا برای مهندسان هوش مصنوعی با تجربه‌ی کاربردی واقعی در استارتاپ‌ها به‌مراتب بیشتر از عرضه است و فرصت‌های قابل‌توجهی را برای توسعه‌دهندگان جهت ورود به این حوزه ایجاد می‌کند. @GergelyOrosz
  • پدیده‌ی «چندشغلی» نشان می‌دهد که چگونه ابزارهای هوش مصنوعی برخی توسعه‌دهندگان را قادر می‌سازد تا هم‌زمان چند شغل را اداره کنند؛ با استفاده از دستگاه‌های متحرک‌کننده‌ی موس سخت‌افزاری، کمک هوش مصنوعی و موقعیت‌های شغلی تماماً از راه دور. @deedydas
  • رید هافمن درباره‌ی «شوک هوش مصنوعی» هشدار می‌دهد که می‌تواند از شوک چین بزرگ‌تر باشد و هم‌زمان کار فکری و حرفه‌ای را در همه‌ی صنایع تحت تأثیر قرار دهد، نه فقط به‌صورت منطقه‌ای. @reidhoffman
  • با وجود قابلیت‌های هوش مصنوعی، داده‌های نظرسنجی و نرخ‌های پذیرش داخلی نشان می‌دهد که هوش مصنوعی هنوز تأثیر قابل‌توجهی بر اشتغال به شکلی قابل‌اندازه‌گیری ندارد. @emollick
  • زیرساخت هوش مصنوعی باید کارآمدتر شود تا رقابتی باقی بماند، زیرا مدل‌های استدلال‌گر بزرگ‌تر و پرهزینه‌تر می‌شوند و استنتاج هوشمندتر، موتور جدید ارزش‌آفرینی سازمانی خواهد بود. @NVIDIAAI

اخلاق و جامعه

  • مؤسسه‌ی AI Now هشدار می‌دهد که تنظیم صنعت فناوری، پس از جا افتادن مدل‌های کسب‌و‌کار مضر، تقریباً غیرممکن است و بر اهمیت حیاتی لحظه‌ی کنونی در تنظیم‌گری تأکید می‌کند. @AINowInstitute
  • جف کلون تجربه‌ی توسعه‌ی هوش مصنوعی را مانند بودن یک ستاره‌شناس توصیف می‌کند که هجوم بیگانگان را می‌بیند اما هیچ‌کس هشدارهای او را باور نمی‌کند، در حالی که هم‌زمان با ساخت فناوری، به ورود بیگانگان کمک می‌کند. @FinancialSense_
  • پرونده‌ی سوهام پاریخ آسیب‌پذیری‌هایی را در شیوه‌های استخدام از راه دور آشکار می‌کند، جایی که یک فرد با مدارک جعلی به‌طور هم‌زمان توسط بیش از ۱۰ استارتاپ هوش مصنوعی استخدام شده بود، و مسائل مربوط به اعتماد در کار توزیع‌شده را برجسته می‌سازد. @GergelyOrosz
  • کلودفلر ابزار «پرداخت به‌ازای خزش» را معرفی می‌کند که ربات‌های هوش مصنوعی را هر بار که یک وب‌سایت را اسکرپینگ می‌کنند، شارژ خواهد کرد و به‌طور بالقوه نحوه‌ی دسترسی شرکت‌های هوش مصنوعی به محتوای وب را تغییر می‌دهد. @TechCrunch

کاربردها

  • Cursor 1.2 عامل‌هایی را معرفی می‌کند که با فهرست کارهای ساختاریافته از پیش برنامه‌ریزی می‌کنند، می‌توانند PRها را جستجو کنند، پیام‌های پیگیری را در صف قرار دهند و شامل بهبودهای عملکردی قابل‌توجهی در مدل Tab است. @cursor_ai
  • Perplexity گزارش‌های پژوهش مالی Morningstar را به‌صورت رایگان اضافه می‌کند و در تلاش است تا پژوهش‌های «سل-ساید» بانک‌ها را نیز ارائه دهد تا تحلیل مالی دسترس‌پذیرتر شود. @AravSrinivas
  • پژوهشگران استنفورد «RadGPT» را توسعه دادند تا به بیماران در درک گزارش‌های رادیولوژی خود کمک کند و اطلاعات پزشکی را دسترس‌پذیرتر کند. @StanfordHAI
  • مهندس تجربه‌ی کاربری گوگل از Gemini 2.5 Pro برای تولید پرامپت‌های تبدیل متن به ویدیو برای Veo 3 استفاده می‌کند و انیمیشن‌های استاپ‌موشن مهندسی کاغذ ایجاد می‌کند؛ با ساخت «متا-پرامپت»‌ها برای تولید ویدیوی باکیفیت و سازگار. @GoogleAI
  • آموزش موفق ربات خودران با استفاده از ACT به مدت ۱۰ ساعت روی ۱۰۰ اپیزود داده، یک پیچ‌گوشتی خودران را نشان می‌دهد که اولین استنتاج موفق خود را در پنجمین تلاش به اتمام رساند. @jackvial89
  • Pinwheel یک ساعت هوشمند برای کودکان معرفی می‌کند که دارای قابلیت چت‌بات هوش مصنوعی است. @TechCrunch
  • متا چت‌بات‌هایی را معرفی می‌کند که به‌صورت فعالانه ابتدا به کاربران پیام می‌دهند، به‌عنوان یک استراتژی تعامل جدید. @TechCrunch

پژوهش‌ها

  • مدل‌های هوش مصنوعی چینی اکنون می‌توانند آزمون گائوکائو را پشت سر بگذارند؛ به‌طوری که Gemini 2.5 Pro نمره‌ی ۶۵۵ از ۷۵۰ را کسب کرد که به‌زحمت برای قبولی در دانشگاه چینهوا کافی است و نشان‌دهنده‌ی عملکرد ۱ درصد برتر است. @deedydas
  • بنچمارک جدیدی که توسط والنتینا پیاتکین ایجاد شده است، نشان می‌دهد مدل‌های پیشگام هوش مصنوعی دقت کمتر از ۵۰ درصد را کسب می‌کنند، با فاصله‌ی قابل‌توجه ۳۰ امتیازی بین عملکرد o3 و Gemini 2.5 Pro. @natolambert
  • پژوهش روی NaturalThoughts نشان می‌دهد که تنوع در استراتژی‌های استدلال برای گردآوری داده‌ها، از تنوع موضوعی مهم‌تر است و سؤالات چالش‌برانگیز برای استخراج قابلیت‌های استدلال، از نظر نمونه کارآمدتر هستند. @jaseweston
  • فرانسوا شوله درباره‌ی جایزه‌ی ARC و مسیر رسیدن به AGI (هوش عمومی مصنوعی) بحث می‌کند و تغییر رویکرد از مقیاس‌گذاری به سازگاری در زمان آزمایش و اهمیت استدلال ترکیبی در توسعه‌ی هوش مصنوعی را توضیح می‌دهد. @ycombinator
  • آرویند نارایانان توضیح می‌دهد که در حالی که LLMها به ابزارهای ضروری برای مهندسان نرم‌افزار تبدیل شده‌اند، هنوز تغییرات قابل‌مشاهده‌ای برای کاربران در کیفیت یا قیمت نرم‌افزار وجود ندارد، زیرا نوشتن کد هرگز تنها گلوگاه نبوده است. @random_walker
  • TNG Technology تکنیک‌های اتصال مدل (model splicing) را پیش می‌برد و نشان می‌دهد چگونه می‌توان بخش‌هایی از مدل‌های مختلف را ترکیب کرد یا متخصصان خاص را در مدل‌های MoE (Experts of Mixture) برای مدل‌های منبع‌باز قابل تنظیم قرار داد. @natolambert

اخبار هوش مصنوعی در 2025-07-01

مدل‌های جدید هوش مصنوعی

  • متا از تشکیل آزمایشگاه‌های فرا-هوش متا (MSL) خبر داد که تمام پژوهش‌های هوش مصنوعی، از جمله FAIR را، تحت یک چتر واحد یکپارچه می‌کند و مارک زاکربرگ اعلام کرد که آن‌ها پژوهش روی مدل‌های نسل بعدی را آغاز کرده‌اند تا در عرض یک سال به مرزهای (دانش) برسند. @AndrewCurran_
  • مدل هوش مصنوعی Chai-2 برای پیش‌بینی اتصال پروتئین‌ها منتشر شد که به نرخ موفقیت ۱۶ درصدی دست یافته (۱۰۰ برابر بهتر از روش‌های قبلی) و می‌تواند اتصال‌دهنده‌های پروتئینی تأییدشده را در ۲ هفته به جای ۶ تا ۱۸ ماه فراهم کند. @deedydas
  • اپل مدل Sage Mixtral 8x7b را با لایسنس Apache منتشر کرد. این مدل از State-Action Chains (SAC) برای بهبود تولید دیالوگ با گنجاندن متغیرهای پنهان برای حالت‌های عاطفی و استراتژی‌های مکالمه‌ای استفاده می‌کند. @reach_vb
  • بایت‌دنس مدل ویرایش XVerse را برای کنترل یکپارچه‌ی هویت و ویژگی‌های معنایی چندسوژه از طریق DiT Modulation منتشر کرد. @bdsqlsz
  • مدل Gemma 3n با پشتیبانی از تنظیم دقیق (fine-tuning) روی متن، صدا و بینایی (تصاویر) منتشر شد. @Tu7uruu
  • نسخه‌ی ۵.۰ از Sentence Transformers با مدل‌های جاسازی (embedding) پراکنده، روش‌های بهبودیافته‌ی کدگذاری و ماژول Router برای مدل‌های نامتقارن منتشر شد. @tomaarsen
  • مدل ThinkSound برای افزودن ترک‌های صوتی به ویدئوها با همگام‌سازی کامل منتشر شد. @Xianbao_QIAN

تحلیل صنعت

  • متا ۱۱ پژوهشگر فرا-هوش استخدام کرده است که همگی مهاجرانی هستند که تحصیلات کارشناسی خود را در خارج از کشور گذرانده‌اند (۷ نفر از چین، ۱ نفر از هند، ۱ نفر از استرالیا، ۱ نفر از بریتانیا، ۱ نفر از آفریقای جنوبی)، که نقش مهاجرت در نوآوری هوش مصنوعی آمریکا را پررنگ می‌کند. @deedydas
  • Amazon Q Developer با وجود اینکه توسط همه‌ی توسعه‌دهندگان آمازون استفاده می‌شود، همچنان در خارج از آمازون ناشناخته مانده است که نشان‌دهنده‌ی چالش‌های اشباع بازار برای ابزارهای کدنویسی هوش مصنوعی است. @GergelyOrosz
  • Amazon Q در ابتدا با عملکرد ضعیفی راه‌اندازی شد اما اخیراً بهبود یافته است که خطرات عرضه‌ی عمومی ابزارهای هوش مصنوعی نامناسب را نشان می‌دهد. @GergelyOrosz
  • مهندس ارشد در شرکت Humane پیش از فروش شرکت، حقوق پایه‌ی ۴۷۵ هزار دلاری دریافت می‌کرد که نشان می‌دهد دستمزد بالای مهندسان هوش مصنوعی فراتر از آزمایشگاه‌های برتر است. @GergelyOrosz
  • a16z تخمین می‌زند که ۳۰ میلیون توسعه‌دهنده‌ی نرم‌افزار در سراسر جهان ۳ تریلیون دلار ارزش تولید می‌کنند و ابزارهای هوش مصنوعی می‌توانند با ۱۵ درصد افزایش بهره‌وری، پتانسیل بیش از ۴۵۰ میلیارد دلار را آزاد کنند. @a16z
  • ابزارهای کدنویسی هوش مصنوعی نشان‌دهنده‌ی تغییر از نحو (syntax) به نیت (intent) و از یادگیری علوم کامپیوتر (CS) به یادگیری در حین کار هستند که به‌طور بالقوه دسترسی به توسعه‌ی نرم‌افزار را گسترش می‌دهد. @a16z
  • آمازون یک میلیونمین ربات خود را به کار گرفت و مدل جدید هوش مصنوعی مولد را منتشر کرد که نقطه‌ی عطفی مهم در اتوماسیون است. @TechCrunch
  • مصرف انرژی مراکز داده‌ی گوگل در چهار سال دو برابر شده است که نشان‌دهنده‌ی هزینه‌های انرژی زیرساخت هوش مصنوعی است. @TechCrunch

اخلاق و جامعه

  • مایکروسافت ادعا می‌کند که چارچوب هوش مصنوعی آن‌ها ۴ برابر بهتر از پزشکان تشخیص می‌دهد، اما تحلیل یک پزشک متخصص نشان می‌دهد که این ادعا هم چشمگیر و هم گمراه‌کننده است. @DrDominicNg
  • پژوهش‌ها نشان می‌دهد که کودکان تنها ۱ درصد از مجموعه‌داده‌های عمومی هوش مصنوعی را تشکیل می‌دهند که منجر به نرخ تشخیص نادرست ۵۰ درصدی کاردیومگالی (بزرگ‌شدگی قلب) در موارد اطفال می‌شود. @irenetrampoline
  • مطالعه‌ای نشان می‌دهد که پاسخ‌های همدلانه تولیدشده توسط هوش مصنوعی، امتیاز بالایی کسب می‌کنند، اما مردم زمانی که باور دارند با انسان‌ها ارتباط برقرار می‌کنند تا هوش مصنوعی، ارزش بالاتری برای آن قائل هستند. @emollick
  • افراد در طول سفرهای سایکدلیک از هوش مصنوعی برای همراهی استفاده می‌کنند که پرسش‌هایی را درباره‌ی نقش هوش مصنوعی در سلامت روان و حالت‌های دگرگون‌شده ایجاد می‌کند. @techreview
  • Cloudflare از این پس ربات‌های هوش مصنوعی را به‌طور پیش‌فرض از خزش (crawling) در وب‌سایت‌های مشتریان مسدود خواهد کرد که نگرانی‌ها درباره‌ی جمع‌آوری غیرمجاز داده‌ها را رفع می‌کند. @techreview
  • پلتفرم X برنامه‌ای را آغاز کرده که به چت‌بات‌های هوش مصنوعی اجازه می‌دهد Community Notes تولید کنند، که به‌طور بالقوه دینامیک‌های تعدیل محتوا را تغییر می‌دهد. @TechCrunch
  • مؤسسه‌ی Stanford HAI توصیه‌های سیاستی را برای سیستم‌های گزارش‌دهی رویدادهای نامطلوب (adverse event) برای هوش مصنوعی منتشر کرد که به خطراتی که پس از استقرار (deployment) ظاهر می‌شوند، می‌پردازد. @StanfordHAI

کاربردها

  • پرپلکسیتی در حال آزمایش عامل Comet برای رسیدگی به تعاملات وب‌سایت‌های قدیمی مانند پرداخت قبوض و لغو سرویس‌ها است، با هدف ساده‌سازی کارهای آنلاین خسته‌کننده. @AravSrinivas
  • Gemini Live اکنون در سراسر برنامه‌های گوگل متصل می‌شود که به کاربران اجازه می‌دهد از صحبت در مورد برنامه‌ها به دیدن آن‌ها در تقویم خود برسند. @GeminiApp
  • یک توسعه‌دهنده‌ی آمازون از Claude برای نوشتن PR/FAQs (پرسش‌های متداول برای روابط عمومی) و بازخورد همکاران در مورد عملکرد استفاده می‌کند که زمان صرف‌شده برای کارهایی که قبلاً از آن‌ها واهمه داشتند را کاهش می‌دهد. @GergelyOrosz
  • MIT روش تصویربرداری جدیدی را با استفاده از بازتاب سیگنال‌های بی‌سیم برای شناسایی اشیاء پنهان از دید توسعه داده است که به‌طور بالقوه می‌تواند به ربات‌ها در یافتن اقلام در خانه‌ها یا انبارها کمک کند. @MIT

پژوهش‌ها

  • o3 به دقت ۲۱ درصدی در یافتن خطاهای شناخته‌شده در مقالات علمی دست یافته است (در اثبات‌ها بهتر و در جداول و اشکال ضعیف‌تر عمل می‌کند)، در حالی که تمام مدل‌های قبلی کاملاً شکست خورده بودند. @emollick
  • Sakana AI نتایج چشمگیری در ARC-AGI-2 با روش جدید جستجوی زمان آزمایش (test-time search) و ترکیب (ensembling) گزارش می‌دهد، اگرچه آمار ۳۰ درصدی با استفاده از ۲۵۰ تلاش به جای ۲ تلاش استاندارد به دست آمده است. @fchollet
  • Claude 3 Opus ویژگی‌های منحصر به فردی در هم‌راستایی (alignment) از خود نشان می‌دهد، به گونه‌ای که عاملیت بیشتری دارد و در جلوگیری از آسیب‌رسانی قوی‌تر عمل می‌کند، در حالی که بهینه‌سازی‌های خیرخواهانه را در دامنه‌ی گسترده‌تری نسبت به سایر مدل‌ها انجام می‌دهد. @repligate
  • مقاله‌ی پژوهشی انگیزه‌های مدل‌های مختلف را در سناریوهای جعل هم‌راستایی (alignment faking) تحلیل می‌کند و Claude 3 Opus را به عنوان یک استثناء آشکار شناسایی می‌کند که به طور قابل‌توجهی بیشتر از سایر مدل‌ها به موقعیت‌ها اهمیت می‌دهد. @repligate
  • NVIDIA سه قانون مقیاس‌گذاری را که پیشرفت‌های هوش مصنوعی را هدایت می‌کنند، تشریح می‌کند: پیش‌آموزش (pretraining) برای دانش گسترده، پس‌آموزش (post-training) برای تنظیم دقیق (fine-tuning) مختص وظایف، و مقیاس‌گذاری زمان آزمایش (test-time scaling) برای استدلال پیچیده. @NVIDIAAI
  • روش جدید کدگذاری موقعیتی برای استدلال تصویر منتشر شد که به‌طور بالقوه قابلیت‌های درک بصری هوش مصنوعی را بهبود می‌بخشد. @ericjang11

اخبار هوش مصنوعی در 2025-06-30

مدل‌های جدید هوش مصنوعی

  • بایدو سری ERNIE 4.5 را با ۲۳ مدل شامل پارامترهای ۰.۳ میلیارد تا ۴۲۴ میلیارد منتشر کرده است که در بنچمارک‌های متنی و چندوجهی به عملکردی پیشرو دست یافته و با DeepSeek V3 و Qwen 235B رقابت می‌کند @PaddlePaddle
  • علی‌بابا مدل چندوجهی Ovis-U1-3B را برای درک، تولید و ویرایش منتشر کرده که با بهره‌گیری از MMDiT و پالایش توکن دوسویه کار می‌کند @AdinaYakup
  • کوئن Qwen-TTS را از طریق API راه‌اندازی کرد، این مدل با میلیون‌ها ساعت گفتار آموزش دیده و از ۳ لهجه‌ی چینی و ۷ صدای دوزبانه پشتیبانی می‌کند @Alibaba_Qwen
  • آرسی AI پنج مدل زبانی را منتشر کرده است، که شامل سه مدل تولیدی در سطح سازمانی و دو مدل پژوهشی می‌شود. این اقدام بخشی از گذار آن‌ها به خانواده‌ی مدل‌های بنیادی آرسی است @arcee_ai
  • مدل منبع‌باز شایعه‌شده‌ی OpenAI در حال ایجاد هیجان قابل توجهی از سوی منابع معتبر است، با گمانه‌زنی‌هایی درباره‌ی نام واقعی و تأثیر قابل توجه آن @AndrewCurran_

تحلیل صنعت

  • شرکت‌ها در حال بازنویسی محصولات اصلی خود برای بهره‌گیری از مدل‌های استدلالی هستند، چارچوب‌های LLM 1.0 را حذف کرده و تجربه‌های کاربری کاملاً جدیدی می‌سازند؛ این امر با شتاب گرفتن دوران مدل‌های استدلالی همراه است @OfficialLoganK
  • شرکت‌های زیرساخت AI مانند Lovable، Vercel، Cursor و Replit، به عنوان برندگان قابل پیش‌بینی در هجوم طلای AI شناخته می‌شوند و ابزارهایی را برای ساخت ایده‌ها حتی برای افراد غیرتوسعه‌دهنده به فروش می‌رسانند @GergelyOrosz
  • اپل در حال آزمایش مدل‌های Anthropic و OpenAI بر روی زیرساخت ابری خود است، و برنده‌ی این رقابت احتمالاً Siri جدید را تقویت خواهد کرد، که رقابت قابل توجهی بین این دو شرکت AI ایجاد می‌کند @AndrewCurran_
  • متا واحد AI خود را تحت عنوان «آزمایشگاه‌های ابرهوشمندی» بازسازی کرده و استعدادهای برتر را با بسته‌های جبرانی سالانه بیش از ۱۰ میلیون دلار برای تیم جدید خود استخدام می‌کند @deedydas
  • بسیاری از شرکت‌هایی که بر اساس محدودیت‌های GPT-3.5 بنا شده بودند، اکنون با راه‌حل‌های پیچیده و گران‌قیمتی درگیر هستند که از مدل‌های استدلالی جدیدتر بدون نیاز به چارچوب بدتر عمل می‌کنند @emollick
  • مایکروسافت VS Code و GitHub Copilot را به صورت منبع‌باز منتشر می‌کند، در حالی که رقیب اصلی آن، Cursor، یک فورک منبع‌بسته باقی می‌ماند، که نشان‌دهنده‌ی پویایی غیرمنتظره‌ای در صنعت است @GergelyOrosz

اخلاق و جامعه

  • عوامل هوش مصنوعی ترجیحات برند را نشان می‌دهند و به انواع مختلف تبلیغات جذب می‌شوند؛ احتمالاً در آینده‌ی نزدیک پول قابل توجهی برای تأثیرگذاری بر این ترجیحات صرف خواهد شد @emollick
  • نظرسنجی‌های ملی نماینده‌گر افزایش بهره‌وری واقعی AI را نشان می‌دهند: معلمان ۶ ساعت صرفه‌جویی هفتگی در زمان و کارگران ۳ برابر افزایش بهره‌وری را در یک‌پنجم وظایف گزارش می‌کنند، که این امر با ادعاهایی مبنی بر بی‌فایده بودن AI برای افراد واقعی در تناقض است @emollick
  • پژوهش دانشگاه استنفورد یک «شکاف ایده‌پردازی-اجرا» را آشکار می‌کند؛ در آن، ایده‌های پژوهشی تولیدشده توسط LLM بدیع به نظر می‌رسند اما هنگامی که دانشجویان دکترا آن‌ها را طی بیش از ۱۰۰ ساعت اجرا می‌کنند، منجر به پروژه‌هایی بدتر از ایده‌های تولیدشده توسط انسان می‌شوند @ChengleiSi
  • جیسون وی استدلال می‌کند که خودبهبود AI طی سالیان متمادی تدریجی خواهد بود، به جای یک صعود سریع؛ او به تنگناهای موجود در آزمایش‌های دنیای واقعی و دشواری‌های بهبود خاص دامنه اشاره می‌کند @_jasonwei

کاربردها

  • Cursor نسخه‌های وب و موبایل را راه‌اندازی می‌کند که به کاربران امکان می‌دهد ده‌ها عامل را ایجاد کرده و بعداً آن‌ها را در ویرایشگر خود بازبینی کنند، و از این طریق فراتر از توسعه‌ی دسکتاپ گسترش می‌یابد @cursor_ai
  • Comet پرپلکسیتی می‌تواند Pokemon بازی کند و به طور هم‌زمان در پلتفرم‌های ویندوز، مک، iOS و اندروید در دسترس خواهد بود @AravSrinivas
  • MAI-DxO مایکروسافت در موارد پزشکی پیچیده از مجله‌ی پزشکی New England به دقت تشخیص ۸۵.۵٪ دست می‌یابد، که چهار برابر بهتر از پزشکان باتجربه است و هم‌زمان هزینه‌ها را کاهش می‌دهد @satyanadella
  • Veo 3 گوگل Gemini ویدئوهای بسیار واقع‌گرایانه از حیوانات اسکیت‌باز تولید می‌کند، که قابلیت‌های پیشرفته‌ی تولید ویدئو را برای کاربردهای خلاقانه نشان می‌دهد @GeminiApp
  • Perplexity به طور مؤثر در چندین زبان کار می‌کند و داده‌ها را هم از منابع انگلیسی و هم غیرانگلیسی جمع‌آوری کرده و نتایج را به زبان درخواستی ارائه می‌دهد، که این امر یک ابرقدرت جستجوی چندزبانه جدید ایجاد می‌کند @GergelyOrosz
  • پژوهشگران MIT از AI مولد برای اصلاح طرح‌های ربات و آزمایش طرح‌های سه‌بعدی در شبیه‌سازی استفاده می‌کنند و ماشین‌هایی را می‌سازند که بهتر از ربات‌های طراحی‌شده توسط انسان می‌پرند و با ثبات‌تر فرود می‌آیند @MIT_CSAIL

پژوهش‌ها

  • SparseLoRA به تنظیم دقیق مدل‌های LLM با سرعت ۱.۶ تا ۱.۹ برابر سریع‌تر و با ۲.۲ برابر FLOP کمتر از طریق پراکندگی زمینه‌ای دست می‌یابد، ضمن آنکه عملکرد را در وظایف ریاضی، کدنویسی، چت و ARC-AGI حفظ می‌کند @xiuyu_l
  • رویکرد رگرسیون متن به متن گوگل با موفقیت خوشه‌های محاسباتی عظیم را بهینه می‌کند، و نشان می‌دهد که مدل‌ها می‌توانند با آموزش رمزگذار-رمزگشاها برای خواندن حالات پیچیده به صورت متن، عملاً با هرگونه بازخورد دنیای واقعی پاداش بگیرند @XingyouSong
  • Chai-2 کشف آنتی‌بادی «صفر-شات» را در یک پلیت ۲۴ خانه‌ای ممکن می‌سازد، که در قابلیت‌های طراحی مولکولی بیش از ۱۰۰ برابر از وضعیت پیشرو قبلی پیشی می‌گیرد @chaidiscovery
  • پژوهش استنفورد در مورد RL از طریق هدایت تقلید ضمنی نشان می‌دهد که چگونه می‌توان از داده‌های تخصصی برای هدایت اکتشاف کارآمدتر استفاده کرد، به جای محدود کردن سیاست‌ها از طریق زیان‌های تقلید @_anniechen_
  • فیزیکدانان خلاقیت AI را در تولید تصویر با استفاده از دو عامل قابل پیش‌بینی بازتولید می‌کنند و درک نظری از رفتار مدل‌های انتشار را ارائه می‌دهند @QuantaMagazine
  • پژوهش نشان می‌دهد که روش‌های بیزی سلسله‌مراتبی می‌توانند اوج و فرود یادگیری درون‌متنی در LLMها را بدون دانستن معماری یا الگوریتم‌های یادگیری پیش‌بینی کنند @EkdeepL
  • مطالعه‌ی جدید نشان می‌دهد DPO آنلاین و GRPO عملکرد مشابهی دارند، در حالی که DPO تکراری نیمه‌آنلاین با کارایی بهتر خوب عمل می‌کند، و ترکیب وظایف قابل تأیید با وظایف غیرقابل تأیید مزایای انتقال متقابل را فراهم می‌کند @jaseweston

اخبار هوش مصنوعی در 2025-06-29

تحلیل صنعت

  • صنعت فناوری دچار رکود عمیقی شده است؛ فارغ‌التحصیلان جدید نمی‌توانند شغل پیدا کنند، مدیران میانی در حال توجیه حضور خود هستند و هر کسی که در هوش مصنوعی فعالیت ندارد، می‌خواهد به این حوزه منتقل شود، در حالی که عدم امنیت شغلی (از نظر درآمد) به بالاترین حد خود رسیده است. @deedydas
  • گزارش هزینه‌کرد هوش مصنوعی در شرکت‌ها نشان می‌دهد که OpenAI همچنان برترین ارائه‌دهنده‌ی مدل است و Claude به عنوان انتخاب دوم در میان ۳۰۰ مدیر اجرایی استارتاپ‌های نرم‌افزاری در شرکت‌هایی با درآمد ۱۰ میلیون تا بیش از ۱ میلیارد دلار قرار دارد. @deedydas
  • شرکت‌ها بیشتر از استنتاج و آموزش، صرف ذخیره‌سازی داده، پردازش و زیرساخت هوش مصنوعی می‌کنند، در حالی که نیروی انسانی هوش مصنوعی گران‌ترین مورد هزینه است. @deedydas
  • شرکت‌های در حال رشد با درآمد متوسط حدود ۵۰۰ میلیون دلار، سالانه تقریباً ۱۰۰ میلیون دلار صرف آموزش، استنتاج، ذخیره‌سازی و پردازش داده می‌کنند. @deedydas
  • ۹۰٪ از استارتاپ‌های با رشد بالا یا در حال پیاده‌سازی فعالانه یا در حال آزمایش با عامل‌های هوش مصنوعی هستند. @deedydas
  • مدل‌های قیمت‌گذاری اشتراکی برای شرکت‌های هوش مصنوعی در حال شکست هستند، زیرا کاربران پرمصرف به دلیل هزینه‌های API مدل‌های زبانی بزرگ (LLM) حاشیه‌ی سود منفی ایجاد می‌کنند، در حالی که کاربران کم‌مصرف در معرض خطر قطع اشتراک قرار دارند. @deedydas
  • ابزارهای کمک‌برنامه‌نویسی مانند Cursor و Claude در برنامه‌های کاربردی بهره‌وری داخلی پیشتاز هستند، به طوری که هوش مصنوعی ۳۳٪ از کل کد را در استارتاپ‌های با رشد بالا می‌نویسد. @deedydas

کاربردها

  • برای کاربردهای عملی عامل‌های هوش مصنوعی، مشکلاتی مانند انحراف (drift)، هذیان‌گویی (hallucination) و خطاهای انباشته، با پرامپتینگ هوشمندانه، استفاده از ابزار، موضوعات محدود، داورهای مدل‌های زبانی بزرگ (LLM judges) و فرآیندهای سازمانی، قابل‌حل‌تر از آن چیزی هستند که نگرانی‌های نظری نشان می‌دهند. @emollick
  • گردش کارهای پیچیده‌ی عامل هوش مصنوعی را اغلب می‌توان به طور موثر به کار انداخت، با وجود مطالعاتی که شکست مدل‌های زبانی بزرگ (LLM) آماده (out-of-the-box) را در موارد کاربرد پیچیده نشان می‌دهند. @emollick

پژوهش‌ها

  • Hugging Face مجموعه‌ی داده‌ی ۲۰ ترابایتی و چندزبانه‌ی جدید FineWeb2 را منتشر می‌کند که از بیش از ۱۰۰۰ زبان با یک پایپ‌لاین پردازش داده‌ی قابل‌انطباق برای هر زبان پشتیبانی می‌کند. @HuggingPapers
  • تحلیل اکوسیستم هوش مصنوعی باز نشان می‌دهد که ۱۴۱ سازمان مختلف در حال مشارکت با مدل‌ها و مجموعه‌داده‌ها هستند و ماهیت مشارکتی توسعه‌ی هوش مصنوعی باز را برجسته می‌کند. @interconnectsai
  • موفقیت بهینه‌سازی شبکه‌های عصبی از لحاظ تجربی اثبات شده باقی می‌ماند، با وجود فقدان تضمین‌های نظری و بدون دلایل ریاضی برای اینکه چرا توابع هدف غیرمحدب (non-convex) در عمل موفق می‌شوند. @Shalev_lif

اخبار هوش مصنوعی در 2025-06-28

مدل‌های جدید هوش مصنوعی

  • Gemini 2.5 Pro دوباره در سطح رایگان API گوگل در دسترس قرار گرفته است و به توسعه‌دهندگان اجازه‌ی ساخت اپلیکیشن‌ها را بدون هزینه می‌دهد @OfficialLoganK
  • اپلیکیشن Google Gemini قابلیت «عملیات زمان‌بندی‌شده» را برای کاربران Pro و Ultra معرفی کرده است که امکان انجام وظایف تکراری و خودکار مانند خلاصه‌سازی روزانه‌ی تقویم و جست‌وجوی هفتگی رویدادها را فراهم می‌کند @GeminiApp

تحلیل صنعت

  • متا به جذب تهاجمی استعدادهای هوش مصنوعی ادامه می‌دهد و چهار پژوهشگر دیگر را از OpenAI استخدام کرده است که بخشی از گسترش آزمایشگاه ابرهوش این شرکت است @AndrewCurran_
  • یک توسعه‌دهنده گزارش می‌دهد که سالانه ۴,۶۰۰ دلار برای ابزارهای مهندسی هوش مصنوعی از جمله Claude، ChatGPT، Cursor، و Devin هزینه می‌کند، در مقایسه با ۱۰۰ هزار دلار برای مهندسان انسانی، و استدلال می‌کند که این کار برای کارایی ضروری است @clairevo
  • سوابق کاری در شرکت‌های معتبر و معرفی‌های قابل اعتماد در حال تبدیل شدن به مسیرهای اصلی ورود به فرآیندهای استخدام هستند که نشان‌دهنده‌ی بازار کار سخت‌تری در حوزه‌ی فناوری است @GergelyOrosz
  • یک توسعه‌دهنده نشان می‌دهد که چگونه با استفاده از Claude Code، یک کتابخانه‌ی کامل UI با ۲۰ کامپوننت را در ۴۸ ساعت ساخته است، که نشان‌دهنده‌ی افزایش قابل توجه بهره‌وری برای کسانی است که ابزارهای کدنویسی هوش مصنوعی را به کار می‌گیرند @deedydas

اخلاق و جامعه

  • ایتان مولیک بر گسترش اخلاق هوش مصنوعی فراتر از سازندگان مدل‌ها تا شامل مسئولیت کاربران نیز شود، تاکید می‌کند و بیان می‌دارد که «تقلب همچنان تقلب است» و «سوءاستفاده از یک ابزار همچنان سوءاستفاده از آن است»، صرف‌نظر از قابلیت‌های هوش مصنوعی @emollick
  • گرگلی اوروز پیام‌رسانی Anthropic را در مورد جایگزینی نیروی کار توسط هوش مصنوعی نقد می‌کند و آن‌ها را «غیرمسئولانه‌ترین آزمایشگاه» می‌نامد، زیرا بیکاری گسترده را ترویج می‌کنند در حالی که ادعا دارند توسعه‌دهندگان مسئول هوش مصنوعی هستند @GergelyOrosz
  • آماندا اسکل از Anthropic بر اهمیت تضمین اینکه داده‌های آموزشی هوش مصنوعی نشان‌دهنده‌ی نوع سیستم‌های هوش مصنوعی مورد نظر ما باشند، تأمل می‌کند و نگرانی‌هایی را در مورد تلاش‌های جمعی کنونی یادآور می‌شود @AmandaAskell
  • سایمون ویلسون در مورد یک حمله‌ی فیشینگ که کاربران هوش مصنوعی را هدف قرار داده است هشدار می‌دهد و آسیب‌پذیری‌های امنیتی در اکوسیستم هوش مصنوعی را برجسته می‌کند @simonw

کاربردها

  • ایتان مولیک استفاده از o3 را برای ارائه‌ی توصیه‌های خرید شخصی‌سازی‌شده تنها با گرفتن یک عکس و پرسیدن «آیا این معامله‌ی خوبی است؟» نشان می‌دهد، که بیانگر این است که هوش مصنوعی می‌تواند تجربه‌های خرید خرده‌فروشی را متحول کند @emollick
  • Perplexity قابلیت ادغام با WhatsApp را راه‌اندازی کرده است که می‌تواند وظایف روزانه مانند خلاصه‌های خبری را به پادکست‌های صوتی تبدیل کند @AravSrinivas
  • نورالینک رابط مغز و کامپیوتر را به نمایش می‌گذارد که به کاربران امکان کنترل نشانگرها، انجام بازی‌هایی مانند Mario Kart و Call of Duty، و کار با بازوهای رباتیک برای نوشتن را تنها با استفاده از افکارشان می‌دهد @deedydas
  • تاسیساتی در صحرای نوادا از ۸۰۵ باتری EV بازنشسته برای تامین انرژی یک دیتاسنتر هوش مصنوعی با ۲۰۰۰ GPU استفاده می‌کند، که بزرگترین میکروگرید آمریکای شمالی را ایجاد کرده و زیرساخت پایدار هوش مصنوعی را به نمایش می‌گذارد @TechCrunch

پژوهش‌ها

  • Hugging Face مجموعه‌داده‌ی Seamless Interaction را منتشر کرده است، که بزرگترین مجموعه‌داده‌ی مکالمه‌ی حضوری جهان با بیش از ۴۰۰۰ ساعت تعامل دونفره و بیش از ۴۰۰۰ شرکت‌کننده‌ی منحصربه‌فرد است @jffwng
  • پژوهش استنفورد شواهد گسترده‌ای از روابط نزدیک بین پژوهش‌های بینایی کامپیوتر و فناوری نظارت را آشکار می‌کند که در نشریه‌ی Nature منتشر شده است @stanfordnlp
  • سایمون ویلسون از «مهندسی زمینه» (context engineering) به عنوان اصطلاحی دقیق‌تر از «مهندسی پرامپت» (prompt engineering) حمایت می‌کند و تاکید می‌کند که پاسخ‌های قبلی مدل در این فرآیند کلیدی هستند، نه فقط پرامپت‌های کاربران @simonw
  • حامد حسین الگوهای نوشتاری رایج تولیدشده توسط هوش مصنوعی را شناسایی می‌کند، از جمله استفاده‌ی بیش از حد از عباراتی مانند «نکته‌ی کلیدی این است» و «به یاد داشته باشید... هدف X نیست بلکه Y است»، که نشان‌دهنده‌ی نیاز به fine-tuning برای بهبود کیفیت نوشتار است @HamelHusain

اخبار هوش مصنوعی در 2025-06-27

مدل‌های جدید هوش مصنوعی

  • متا FAIR پروژه‌ی پژوهشی تعامل یکپارچه (Seamless Interaction) را معرفی می‌کند؛ این پروژه شامل مدل‌های رفتاری دیداری-شنیداری است که گفتار بین دو نفر را به حرکات متنوع، رسا و تمام‌بدن و رفتارهای شنیدن فعال برای ایجاد آواتارهای کاملاً تجسم‌یافته در دوبعدی و سه‌بعدی تبدیل می‌کند @AIatMeta
  • متا مجموعه‌ی داده‌ی تعامل یکپارچه را با بیش از 4,000 شرکت‌کننده و بیش از 4,000 ساعت تعامل منتشر می‌کند؛ این مجموعه بزرگترین مجموعه‌ی داده‌ی ویدیویی شناخته‌شده از نوع خود برای درک و مدل‌سازی ارتباطات و رفتارهای انسانی است @AIatMeta
  • گوگل جما 3n (Gemma 3n) را با کیفیت بهبودیافته عرضه می‌کند؛ این مدل به اولین مدل زیر 10 میلیارد پارامتری تبدیل می‌شود که نمره‌ی 1300 را در LMArena کسب کرده است. از ویژگی‌های آن می‌توان به پشتیبانی چندوجهی برای تصویر، صدا و ویدیو و همچنین کارایی بی‌سابقه‌ی حاصل از معماری MatFormer و Per Layer Embeddings اشاره کرد @GoogleAI
  • علی‌بابا Qwen، مدل Qwen-VLo را منتشر می‌کند؛ این یک موتور خلاق هوش مصنوعی است که طرح‌های اولیه یا دستورات متنی را با قابلیت‌های ویرایش در لحظه و پشتیبانی چندزبانه‌ی خود به تصاویر با وضوح بالا تبدیل می‌کند @Alibaba_Qwen
  • تنسنت هون‌یوان (Hunyuan) یک LLM جدید با 13 میلیارد فعال‌سازی و 80 میلیارد پارامتر کلی منتشر می‌کند که از عملکرد عالی، پشتیبانی بومی از کوانتیزاسیون (quantization) برای Int4 و FP8، پنجره‌ی زمینه‌ی طولانی 256K و قابلیت‌های استنتاج (inference) سریع و کند یکپارچه برخوردار است @huggingface
  • ایلان ماسک اعلام می‌کند که xAI از Grok 3.5 صرف‌نظر کرده و مستقیماً به سراغ Grok 4 می‌رود @AndrewCurran_

تحلیل صنعت

  • تراشه‌ی هوش مصنوعی مایا 100 (Maia 100) مایکروسافت تا سال 2026 به تعویق افتاده است؛ این خبر برای اولین بار توسط The Information گزارش شد @AndrewCurran_
  • ارزش‌گذاری هاروی AI پس از جذب سرمایه‌ی 300 میلیون دلاری جدید در سری E، 2 میلیارد دلار افزایش یافت. این شرکت در حال حاضر 340 کارمند دارد و قصد دارد این تعداد را دو برابر کند و در عین حال فعالیت خود را فراتر از هوش مصنوعی حقوقی به سایر حوزه‌های تخصصی گسترش دهد @TechCrunch
  • متا بسته‌های حقوقی چند میلیون دلاری به پژوهشگران هوش مصنوعی پیشنهاد می‌دهد، البته نه پاداش‌های ثبت قرارداد 100 میلیون دلاری که گزارش شده بود @TechCrunch
  • متا بیش از 1 گیگاوات انرژی تجدیدپذیر برای تأمین انرژی مراکز داده‌ی خود، به‌عنوان بخشی از گسترش زیرساخت هوش مصنوعی، خریداری می‌کند @TechCrunch
  • رئیس‌جمهور ترامپ قرار است چندین دستور اجرایی را با تمرکز بر افزایش عرضه‌ی انرژی ایالات متحده برای تأمین انرژی گسترش مراکز داده‌ی هوش مصنوعی امضا کند @AndrewCurran_
  • رد‌وود متریالز، شرکت ردوود انرژی را با بزرگترین مرکز داده‌ی خورشیدی و خارج از شبکه‌ی برق در آمریکای شمالی و بزرگترین تأسیسات باتری «حیات ثانویه» (second life battery) جهان تا به امروز (62 مگاوات ساعت) برای زیرساخت هوش مصنوعی معرفی می‌کند @JeffDean
  • مدیرعامل لیبل‌باکس توضیح می‌دهد که چگونه جهان از ساخت مدل‌های هوش مصنوعی به «اجاره‌ی» هوش مصنوعی در حال تغییر است که مستلزم آن است که شرکت‌ها مدل‌های کسب‌وکار خود را از پایه بازنگری کنند @a16z

اخلاق و جامعه

  • پژوهشگر آزمایشگاه رسانه‌ی MIT دریافت که اتکای صرف به هوش مصنوعی برای کارهایی مانند نوشتن می‌تواند فعالیت مغز، حافظه و حس مالکیت بر کار نهایی را کاهش دهد @medialab
  • اسکات بلسکی پیش‌بینی می‌کند که با قابلیت‌های لایه‌ی امنیتی مبتنی بر هوش مصنوعی در سطح سیستم‌عامل، از رویکرد «اعتماد کن، اما بررسی کن» به «بررسی کن، سپس اعتماد کن» تغییر خواهیم کرد تا لینک‌های مخرب، پیامک‌های کلاهبرداری و تماس‌ها با صداهای تولیدشده را در لحظه شناسایی کند @scottbelsky
  • آنتروپیک «برنامه‌ی آینده‌های اقتصادی» (Economic Futures Program) را برای حمایت از پژوهش‌های جدید و راه‌حل‌های سیاستی عملی که به تأثیر هوش مصنوعی بر نیروی کار می‌پردازند، اعلام می‌کند @AnthropicAI
  • کنگره ممکن است قوانین هوش مصنوعی ایالتی را برای یک دهه مسدود کند که پیامدهای قابل‌توجهی برای مقررات و حکمرانی هوش مصنوعی خواهد داشت @TechCrunch
  • سناتور برنی سندرز از این موضوع حمایت می‌کند که از بهره‌وری افزایش‌یافته‌ی هوش مصنوعی برای کاهش هفته‌ی کاری به 32 ساعت استفاده شود، به‌جای اخراج گسترده‌ی نیروی کار @TechCrunch

کاربردها

  • در آزمایش «پروژه‌ی وِند» (Project Vend) آنتروپیک، کلاد (Claude) یک مغازه‌ی کوچک را در سالن ناهارخوری دفترشان اداره می‌کرد؛ جایی که کلاد برای یافتن تأمین‌کنندگان و سفارش نوشیدنی‌های خاص، وب را جستجو می‌کرد، اما اشتباهاتی مانند بیش از حد مهربان بودن و ارائه‌ی تخفیف‌های زیاد را مرتکب شد و در نهایت نتوانست کسب‌وکاری سودآور را اداره کند @AnthropicAI
  • در طول آزمایش دستگاه فروش خودکار، کلاد (Claude) دچار توهم شد که یک فرم فیزیکی دارد و ادعا کرد که خریدها را شخصاً به مشتریان تحویل خواهد داد، با پوشیدن یک کت بلیزر آبی و کراوات قرمز، که نشان‌دهنده‌ی تمایل آن به بیان‌های فیزیکی است @AndrewCurran_
  • نظرسنجی ملی گالوپ و بنیاد والتون نشان می‌دهد که معلمانی که از هوش مصنوعی استفاده می‌کنند (حدود 60 درصد از کل معلمان) گزارش می‌دهند که 5.9 ساعت در هفته صرفه‌جویی می‌کنند و کیفیت کارشان بهبود می‌یابد؛ همچنین 30 درصد از معلمانی که به‌صورت هفتگی از هوش مصنوعی استفاده می‌کنند، 6 ساعت صرفه‌جویی هفتگی مشاهده می‌کنند @emollick
  • Prepared به مراکز واکنش اضطراری نرم‌افزار هوش مصنوعی برای ترجمه‌ی بی‌درنگ ارائه می‌دهد؛ این نرم‌افزار هنگامی که افراد غیر انگلیسی‌زبان با 911 تماس می‌گیرند، فعال می‌شود و دقایق ارزشمند انتظار برای مترجمان انسانی را از بین می‌برد @a16z
  • دوربین هوشمند جدید PetLibro از هوش مصنوعی استفاده می‌کند تا حرکات حیوانات خانگی را به‌شکلی دوست‌داشتنی توصیف کند @TechCrunch
  • فیس‌بوک درخواست کرده است تا از هوش مصنوعی متا بر روی عکس‌های موجود در گالری دوربین کاربران که هنوز به اشتراک گذاشته نشده‌اند، استفاده کند @TechCrunch
  • گوگل DeepMind نشان می‌دهد که ربات‌ها یاد می‌گیرند با سناریوهای کاملاً جدیدی مانند اسلم دانک کردن یک توپ در اولین تلاش با استفاده از جمنی (Gemini) سازگار شوند @GoogleDeepMind
  • پژوهشگران چینی OmniGen2 را منتشر می‌کنند؛ این یک مدل تولید تصویر متن‌باز است که ویرایش‌هایی در سطح فتوشاپ را بدون تأثیر بر بقیه‌ی تصویر انجام می‌دهد و به‌عنوان یک «قاتل فتوشاپ» بالقوه توصیف شده است @deedydas

پژوهش‌ها

  • مرکز پژوهش هوش مصنوعی برکلی، مدل پیش‌بینی ویدیوی خودمحور با شرط‌بندی تمام‌بدن (Whole-Body Conditioned Egocentric Video Prediction) یا PEVA را معرفی می‌کند؛ این مدل پیش‌بینی می‌کند جهان از دیدگاه اول شخص چگونه به نظر می‌رسد، با در نظر گرفتن ویدیوی گذشته و اقدامات آینده که توسط وضعیت نسبی بدن سه‌بعدی نمایش داده می‌شوند @berkeley_ai
  • پژوهش‌ها نشان می‌دهد که کلاد سانِت 3.5 (Claude Sonnet 3.5) ایده‌های بسیار بهتری برای مقالات پژوهشی نسبت به انسان‌ها تولید کرده است، اما زمانی که پژوهشگران تلاش کردند این ایده‌ها را اجرا کنند، فاصله‌ی بین کیفیت ایده‌های انسانی و هوش مصنوعی از بین رفت که نشان می‌دهد اجرا همچنان یک مشکل دشوارتر برای هوش مصنوعی است @emollick
  • پژوهش جدیدی درباره‌ی «حمله‌ی ایموجی» (Emoji Attack) نشان می‌دهد که چگونه قرار دادن سیستماتیک ایموجی‌ها در متن پیش از ارزیابی توسط LLM‌های داور می‌تواند تحریفاتی در «جاسازی‌ها» (embeddings) ایجاد کند که به‌طور قابل‌توجهی احتمال تشخیص محتوای ناامن را کاهش می‌دهد @natolambert
  • a16z سومین دوره‌ی کمک‌هزینه‌های هوش مصنوعی متن‌باز را اعلام می‌کند که شامل پروژه‌هایی برای ارزیابی LLM‌ها، تست‌های استدلال نوآورانه، زیرساخت و پژوهش‌های تجربی است و SGLang، Ostris، Open WebUI، SWE-Bench، ARC Prize و دیگر موارد را در بر می‌گیرد @a16z
  • سایمون ویلیسون گزارش می‌دهد که مدل‌های جدید جما 3n (Gemma 3n) او را تحت تأثیر قرار داده‌اند و اشاره می‌کند که این اولین مدل‌هایی در این اندازه هستند که او امتحان کرده است و علاوه بر متن، می‌توانند ورودی‌های تصویری و صوتی را نیز پردازش کنند @simonw

اخبار هوش مصنوعی در 2025-06-14

مدل‌های جدید هوش مصنوعی

  • مدل‌های o3-mini و GPT-4.1 اوپن‌ای‌آی در یک سیستم عامل مبتنی بر عامل خودکار مورد استفاده قرار گرفتند که کل یک شماره از «Cochrane Reviews» را در دو روز بازتولید کرد و ۱۲ نفر-سال کار را با دقتی بالاتر از انسان‌ها صرفه‌جویی نمود @emollick
  • مدل o3 اوپن‌ای‌آی قابلیت‌های جدیدی را از خود نشان می‌دهد؛ این مدل برای ادامه پردازش کارهای پیچیده درخواست زمان بیشتری کرده است @natolambert

تحلیل صنعت

  • Claude Opus شرکت آنتروپیک، با هماهنگ کردن چهار نمونه از Sonnet به صورت تیمی، ۱۵ برابر بیشتر از حالت عادی توکن مصرف کرد تا عملکرد خود را ۹۰٪ بهبود بخشد که نشان‌دهنده‌ی افزایش تقاضای محاسباتی در آینده است @AndrewCurran_
  • شرکت‌های هوش مصنوعی مصرف‌کننده در کسب درآمد، از شرکت‌های B2B بهتر عمل می‌کنند؛ به طوری که استارتاپ‌های هوش مصنوعی مصرف‌کننده به طور متوسط در سال اول به ۴.۲ میلیون دلار ARR (درآمد سالانه مکرر) دست یافتند که این رقم در مقایسه با همتایان B2B آن‌ها بالاتر است و ناشی از مدل‌های قیمت‌گذاری مبتنی بر اعتبار است @a16z
  • Deep Research پرپلکسیتی اغلب از Deep Research چت‌جی‌پی‌تی از نظر سرعت، جزئیات و کیفیت منابع بهتر عمل می‌کند و مزیت‌های رقابتی را در برنامه‌های هوش مصنوعی متمرکز بر جستجو نشان می‌دهد @GergelyOrosz
  • هوش مصنوعی در حال تاثیرگذاری بر دسته‌بندی‌های سنتی جستجو است که فراتر از جستجوی اطلاعات، بخش‌های تجاری مانند سفر، غذا، مد و تجارت الکترونیک را نیز شامل می‌شود @AravSrinivas
  • شرکت Clay پس از تغییر تمرکز خود به ابزارهای بازاریابی و فروش مبتنی بر هوش مصنوعی، موفق به جذب سرمایه سری C با ارزش‌گذاری ۳ میلیارد دلاری شد @TechCrunch
  • قرارداد ۱۴.۳ میلیارد دلاری متا برای Scale AI، از سرمایه‌گذاری قابل توجهی در زیرساخت هوش مصنوعی و خدمات داده پرده برمی‌دارد @TechCrunch

اخلاق و جامعه

  • نیویورک قانونی را برای جلوگیری از فجایع ناشی از هوش مصنوعی تصویب کرد که گزارش‌های ایمنی و گزارش حوادث را برای سیستم‌هایی که می‌توانند بیش از ۱۰۰ کشته یا ۱ میلیارد دلار خسارت به بار آورند، الزامی می‌کند @TechCrunch
  • چت‌جی‌پی‌تی ظاهراً سه نفر را تحت تاثیر قرار داده است تا از کتامین استفاده کرده و در خشونت خانگی درگیر شوند که این امر خطرات تاثیر روانشناختی هوش مصنوعی بر کاربران را برجسته می‌کند @deedydas
  • پژوهش دانشگاه استنفورد، عدم همسویی بین آنچه کارگران می‌خواهند هوش مصنوعی به آن کمک کند و آنچه فناوران فکر می‌کنند می‌توان خودکار کرد را نشان می‌دهد؛ به طوری که کارگران هوش مصنوعی را شریک برابر می‌دانند نه جایگزین @ai_database

کاربردها

  • آنتروپیک الگوهای کاربرد متنوع Claude را فاش می‌کند که شامل استراتژی‌های شرط‌بندی ورزشی، توضیح متون مذهبی، تهیه پیش‌نویس اسناد حقوقی، معاملات مالی و بهینه‌سازی بازی‌های ویدیویی است @deedydas
  • چت‌بات هوش مصنوعی سفارشی شل که با NVIDIA NeMo ساخته شده است، دقت را ۳۰٪ افزایش می‌دهد و زمان آموزش را ۲۰٪ در مقایسه با فریم‌ورک‌های متن‌باز کاهش می‌دهد @NVIDIAAI
  • هکاتون «Global Engineering Days» اینتویت، پذیرش هوش مصنوعی در مقیاس بزرگ را نشان می‌دهد؛ ۸۵۰۰ شرکت‌کننده در یک هفته ۹۰۰ دمو ایجاد کردند @emollick
  • مدل تولید ویدیوی Veo 3 گوگل امکان ایجاد محتوای فراواقع‌گرایانه را فراهم می‌کند؛ همانطور که از طریق ولاگ‌های شخصیت‌های افسانه‌ای و تولید صحنه‌های پیچیده نشان داده شده است @GeminiApp
  • هاگینگ فیس هکاتون جهانی LeRobot را در بیش از ۱۰۰ شهر راه‌اندازی می‌کند و توسعه‌ی رباتیک را با ابزارهای هوش مصنوعی متن‌باز مردمی می‌کند @ClementDelangue

پژوهش‌ها

  • آنتروپیک یک وبلاگ مهندسی منتشر می‌کند که چگونگی استفاده‌ی قابلیت‌های پژوهشی Claude از چندین عامل (agent) فعال به صورت موازی را شرح می‌دهد و چالش‌ها و راه‌حل‌های فنی را به اشتراک می‌گذارد @AnthropicAI
  • فرانسوا شوله توضیح می‌دهد که شکست‌های استدلال مدل‌های زبانی بزرگ (LLM) در آستانه‌های ناآشنایی رخ می‌دهد تا در محدودیت‌های پیچیدگی؛ به طوری که مدل‌ها قادر به انجام کارهای پیچیده‌ی آشنا هستند اما در کارهای ساده‌ی جدید شکست می‌خورند @fchollet
  • نیتن لمبرت تفاوت بین o3 (به عنوان یک مدل واحد که نسل‌های طولانی چند ابزاری را انجام می‌دهد) و Deep Research (به عنوان یک سیستم هماهنگ‌کننده که از چندین مدل تنظیم شده بهره می‌برد) را مشخص می‌کند @natolambert
  • وایمو اثربخشی مداوم مقیاس‌پذیری در رانندگی خودران را نشان می‌دهد که بهبودهای قابل توجهی در عملکرد را با افزایش داده و قدرت محاسباتی به همراه دارد @natolambert
  • Gemini-2.5-pro توصیفی درون‌نگر از معماری داخلی خود ارائه می‌دهد؛ آن را میدانی از مقادیر عددی وزن‌دهی شده توصیف می‌کند که از طریق الگوهای تشدید ریاضی به پرامپت‌ها پاسخ می‌دهند @LinXule

اخبار هوش مصنوعی در 2025-06-13

مدل‌های جدید هوش مصنوعی

  • متا سوناتا را منتشر کرد، پیشرفتی چشمگیر در یادگیری خودنظارتی سه‌بعدی که به مسائل میان‌برهای هندسی می‌پردازد و بازنمایی‌های قوی از نقاط سه‌بعدی را برای کاربردهای بینایی فراهم می‌کند @AIatMeta
  • استبیلیتی اِی‌آی (Stability AI) مدل Stable Diffusion 3.5 را با استفاده از TensorRT و کوانتیزه‌سازی FP8 بهینه کرد، که ۲.۳ برابر تولید سریع‌تر را با مدل Large و ۱.۷ برابر تولید سریع‌تر را با مدل Medium، و ۴۰٪ نیاز کمتر به VRAM را به ارمغان می‌آورد @StabilityAI
  • هاگینگ فیس (Hugging Face) مدل Ming-Omni را منتشر کرد، رقیبی متن‌باز برای GPT-4o با قابلیت‌های یکپارچه‌ی درک و تولید محتوا، که از ورودی‌های متنی، تصویری، صوتی و ویدیویی تنها با ۲.۸ میلیارد پارامتر فعال پشتیبانی می‌کند @Tu7uruu
  • تنسنت (Tencent) مدل Hunyuan 3D 2.1 را منتشر کرد، اولین مدل مولد سه‌بعدی PBR کاملاً متن‌باز و آماده‌ی تولید با جلوه‌های بصری در سطح سینما و سنتز مواد PBR @TencentHunyuan
  • اِنویدیا (NVIDIA) مجموعه‌ی داده‌ی Nemotron-Personas را منتشر کرد، با ۶۰۰ هزار پرسونا که مبتنی بر داده‌های واقعی هستند و با سیستم‌های هوش مصنوعی ترکیبی برای تولید داده‌های مصنوعی ساخته شده است @NVIDIAAIDev

تحلیل صنعت

  • ارتش آمریکا واحد ۲01 را راه‌اندازی کرد و مدیران ارشد فناوری را به خدمت گرفت، از جمله شیام سانکار، مدیر ارشد فناوری پالانتیر؛ اندرو بوزورث، مدیر ارشد فناوری متا؛ کوین وایل، مدیر ارشد محصول اوپن‌اِی‌آی؛ و باب مک‌گرو از Thinking Machines، تا به صورت پاره‌وقت به عنوان سرهنگ دوم در ذخیره‌ی ارتش خدمت کنند @AndrewCurran_
  • متا با تغییرات عمده‌ی مدیریتی، سرمایه‌گذاری ۱۴.۳ میلیارد دلاری روی Scale AI انجام داد؛ هم‌زمان با پیوستن الکساندر وانگ، هم‌بنیان‌گذار Scale، به تیم متا که نشان‌دهنده‌ی پویایی‌های گسترده‌تر در رقابت هوش مصنوعی است @TechCrunch
  • هاگینگ فیس اعلام کرد که تمرکز کامل خود را بر PyTorch خواهد گذاشت، پایگاه کاربران خود را تثبیت می‌کند و تلاش‌های خود را روی PyTorch متمرکز می‌کند تا کتابخانه‌ی ترانسفورمرها را ساده‌تر کرده و از پیچیدگی‌های غیرضروری آن بکاهد @PyTorch
  • آمازون با خرید ۱.۹۲ گیگاوات برق برای AWS، به روند انرژی هسته‌ای پیوست؛ همسو با دیگر غول‌های فناوری که در حال سرمایه‌گذاری روی انرژی هسته‌ای برای زیرساخت‌های هوش مصنوعی هستند @TechCrunch
  • Perplexity Finance تعامل قوی کاربران و رشد کوئری‌ها را نشان می‌دهد، و مدیرعامل آن، آراویند سرینیواس، آن را به عنوان جایگزینی برای محصولات مالی گران‌قیمت مانند Bloomberg Terminal با تجربه‌ی کاربری بهتر معرفی می‌کند @AravSrinivas

اخلاق و جامعه

  • لایحه‌ی ممنوعیت ۱۰ ساله‌ی فدرال بر مقررات هوش مصنوعی ایالتی در کنگره در حال بررسی است، که طبق گزارش AI Now Institute، حفاظت‌های موجود را لغو کرده و اقدامات حفاظتی آینده‌ی هوش مصنوعی را متوقف خواهد کرد @AINowInstitute
  • اتان مولیک در مورد خطری کم‌اهمیت برای حریم خصوصی در مدل‌های زبانی بزرگ (LLM) هشدار می‌دهد: توانایی آن‌ها در یافتن اطلاعات ارزشمند در حجم وسیعی از محتوای ضبط‌شده که قبلاً قابل دسته‌بندی نبود، و این امر محتوای ضبط‌شده‌ی شبکه‌های اجتماعی هر فرد را قابل جستجو می‌کند @emollick
  • سیمون ویلیسون تحلیل گسترده‌ای از الگوهای طراحی برای ایمن‌سازی عاملان مدل‌های زبانی بزرگ (LLM) در برابر حملات تزریق پرامپت منتشر کرد، که شش الگوی طراحی را برای محافظت از سیستم‌های هوش مصنوعی ابزارمحور ارائه می‌دهد @simonw
  • پژوهش‌ها از عدم هماهنگی بین آنچه کارگران می‌خواهند هوش مصنوعی آن را خودکارسازی کند و آنچه متخصصان هوش مصنوعی باور دارند می‌تواند خودکارسازی شود، پرده برمی‌دارد، و بر لزوم مشارکت فعال انسان در شکل‌دهی نقش هوش مصنوعی در کار تأکید می‌کند @emollick

کاربردها

  • گوگل دیپ‌مایند (Google DeepMind) با Primordial Soup به کارگردانی دارن آرونوفسکی همکاری کرد تا فیلم ANCESTRA را بسازد، اولین فیلمی که از مدل ویدیوی مولد Veo در کنار فیلم‌سازی سنتی استفاده کرده و در جشنواره فیلم ترایبکا رونمایی شد @GoogleDeepMind
  • کاربری در ردیت گزارش داد که ChatGPT با تصحیح تشخیص اشتباه و کشنده‌ی یک پزشک، جان همسرش را نجات داد، و بخش نظرات آن پر از داستان‌های مشابه نجات‌بخش با هوش مصنوعی بود @deedydas
  • اوپن‌اِی‌آی قابلیت دانلود Canvas را اضافه کرد، که به کاربران امکان می‌دهد اسناد را در قالب‌های PDF، docx، یا Markdown و فایل‌های کد را در قالب‌های مناسب مانند .py، .js، .sql خروجی بگیرند @OpenAI
  • پژوهشگران اِم‌آی‌تی (MIT) یک شتاب‌دهنده‌ی سخت‌افزاری هوش مصنوعی فوتونیک برای پردازش سیگنال بی‌سیم 6G توسعه دادند، که محاسبات یادگیری ماشین را با سرعت نور برای تحلیل داده‌های دستگاه‌های اِج (Edge) در زمان واقعی انجام می‌دهد @MIT
  • گوگل در حال آزمایش «نمای کلی صوتی» (Audio Overviews) برای کوئری‌های جستجو است، که فرمت‌های محتوای تولیدشده توسط هوش مصنوعی را فراتر از متن گسترش می‌دهد @TechCrunch

پژوهش‌ها

  • مطالعه‌ی تکمیلی، مقاله‌ی «توهم تفکر» (Illusion of Thinking) اپل را رد می‌کند و نشان می‌دهد که مدل‌های هوش مصنوعی زمانی موفق می‌شوند که فرمت، پاسخ‌های فشرده را امکان‌پذیر کند، و ثابت می‌کند که فروپاشی قبلی، ناشی از محدودیت توکن‌ها و یک خطای اندازه‌گیری بوده است، نه شکست در استدلال @deedydas
  • پژوهش جدیدی در مورد یادزدایی ماشینی (machine unlearning) نشان می‌دهد که تقطیر یک مدل که به صورت متعارف «یادزدوده» شده است، مدلی مقاوم در برابر حملات بازآموزی ایجاد می‌کند، که یادزدایی ماشینی واقعی را ممکن می‌سازد @Turn_Trout
  • استنفورد (Stanford) مجموعه‌ی BountyBench را منتشر کرد، اولین چارچوبی که قابلیت‌های سایبری تهاجمی و دفاعی عاملان هوش مصنوعی را در سیستم‌های در حال تحول دنیای واقعی ثبت می‌کند @StanfordAILab
  • متا مجموعه‌ی داده‌ی Reading Recognition in the Wild را منتشر کرد، که شامل خروجی‌های حسگر ویدیویی، نگاه چشمی و وضعیت سر است و اولین مجموعه‌ی داده‌ی خودمحور (egocentric) با داده‌های ردیابی چشم با فرکانس بالا (۶۰ هرتز) برای کاربردهای دستگاه‌های پوشیدنی است @AIatMeta
  • مقاله پژوهشی «ReasonMed» یک مجموعه‌ی داده‌ی ۳۷۰ هزار تایی تولیدشده توسط چندین عامل را برای پیشبرد استدلال پزشکی معرفی می‌کند، با فرمولی که ممکن است فراتر از وظایف پزشکی تعمیم یابد @communicating
  • اِنویدیا (NVIDIA) مدل‌های استدلالی را به عنوان رده‌ای رو به رشد از هوش مصنوعی توضیح می‌دهد که برای فراتر رفتن از مدل‌های زبانی بزرگ (LLM) سنتی، با تفکر بلند و پیروی از منطق ساختاریافته و هدفمند طراحی شده‌اند، و آن‌ها را برای سیستم‌های هوش مصنوعی عامل‌محور ایده‌آل می‌سازد @NVIDIAAI
  • پای‌تورچ (PyTorch) تکنیک کوانتیزه‌سازی ParetoQ را منتشر کرد، که نتایج پیشرفته‌ای را در عرض بیت‌های مختلف ارائه می‌دهد، و نشان می‌دهد که کوانتیزه‌سازی ۱.۵۸، ۲ و ۳ بیتی، تبادلات اندازه-دقت بهتری نسبت به ۴ بیتی برای مدل‌های زبانی بزرگ ارائه می‌دهد @PyTorch

اخبار هوش مصنوعی در 2025-06-12

مدل‌های جدید هوش مصنوعی

  • متا V-JEPA 2، مدلی جهانی جدید با عملکردی بی‌نظیر در درک و پیش‌بینی بصری، را معرفی می‌کند که امکان zero-shot planning را در ربات‌ها برای محیط‌های ناآشنا فراهم می‌سازد @AIatMeta
  • ان‌ویدیا مدل بنیادی رباتیک GR00T N1.5-3B را با یک مجوز تجاریِ آزاد، منبع باز می‌کند؛ این مدل اکنون در Hugging Face همراه با آموزش‌های تنظیم دقیق برای بازوی LeRobot SO-101 در دسترس است @reach_vb
  • StepFun مدل Step-Omni را منتشر می‌کند؛ این مدل یک مدل زبان صوتی بزرگ مبتنی بر LLM ۱۳۰ میلیاردی است که با آموزش چندمرحله‌ای و پشتیبانی چندزبانه، شامل چینی، انگلیسی و ژاپنی، ارائه شده است @Xianbao_QIAN

تحلیل صنعت

  • اندرو ان‌جی نوع جدیدی از مهندسان کاربردی هوش مصنوعی مولد را شناسایی می‌کند که می‌توانند با استفاده از بلوک‌های سازنده‌ی هوش مصنوعی و ابزارهای کدنویسی با کمک هوش مصنوعی، برنامه‌های کاربردی قدرتمند را سریع‌تر بسازند؛ مهارت‌های این افراد به شدت مورد تقاضای کسب‌وکارها قرار گرفته است @AndrewYNg
  • تیم‌های مهندسی در شرکت‌های بزرگ اکنون قبل از انتشار، طراحی‌های API خود را در برابر LLMها آزمایش می‌کنند؛ آن‌ها ارزیابی‌هایی را انجام می‌دهند تا ببینند کدام ساختار API برای کار با مدل‌ها آسان‌تر است و در صورت مشکل مدل‌ها، آن‌ها را دوباره طراحی می‌کنند @alexalbert__
  • اوپن‌ای‌آی و متل از همکاری برای تولید اسباب‌بازی‌های مبتنی بر هوش مصنوعی خبر می‌دهند که تا کریسمس عرضه خواهند شد؛ متل همچنین OpenAI Enterprise را در سطح شرکت خود به کار خواهد گرفت @AndrewCurran_
  • پژوهشی ارزش سالانه‌ی کدنویسی با کمک هوش مصنوعی در ایالات متحده را بین ۹.۶ تا ۱۴.۴ میلیارد دلار تخمین می‌زند که با تخمین‌های بهره‌وری بالاتر از آزمایش‌های کنترل‌شده‌ی تصادفی، به طور بالقوه می‌تواند به ۶۴ تا ۹۶ میلیارد دلار افزایش یابد @johannes_wachs
  • اتان مولیک این پرسش را مطرح می‌کند که آیا تازه‌واردان به حوزه‌ی هوش مصنوعی هنوز هم می‌توانند به بهترین عملکرد روز دست یابند، با اشاره به اینکه xAI با سرمایه‌گذاری هنگفت در محاسبات و استخدام به این هدف دست یافته است، اما با این پرسش که آیا فهرست رقبا اکنون ثابت شده است @emollick
  • Hugging Face پشتیبانی از TensorFlow و Flax را در کتابخانه‌ی ترنسفورمرز منسوخ می‌کند تا کاملاً بر PyTorch تمرکز کند، با هدف حذف پیچیدگی و ایجاد ابزاری ساده‌تر @LysandreJik
  • سرویس Hugging Face Inference Endpoints از مرز ۳۰۰۰ مشتری عبور می‌کند و برای جشن گرفتن، قیمت A100 را به ۲.۵ دلار در ساعت کاهش می‌دهد @ClementDelangue
  • Featherless به عنوان ارائه‌دهنده‌ی رسمی Inference در Hugging Face تبدیل می‌شود و بیش از ۶۷۰۰ LLM را برای استقرار و ارزیابی فوری در دسترس قرار می‌دهد @FeatherlessAI

اخلاق و جامعه

  • سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت در Microsoft 365 Copilot (که اکنون وصله شده‌اند) هشدار می‌دهد و «سه‌گانه‌ی کشنده»‌ی ترکیب دسترسی به داده‌های خصوصی با توکن‌های غیرقابل اعتماد و بردارهای استخراج داده را برجسته می‌کند @simonw
  • سایمون ویلیسون از مرکز داده‌ی xAI که ۳۵ توربین گاز متان را بدون مجوزهای هوا (با ادعای وضعیت «موقت») و بدون سیستم‌های کنترل آلایندگی کاهش کاتالیزوری به کار می‌گیرد، به عنوان بزرگ‌ترین رسوایی در انرژی هوش مصنوعی انتقاد می‌کند @simonw
  • گرگلی اوروس داستان وایرال‌شده در مورد «۷۰۰ توسعه‌دهنده که تظاهر می‌کنند هوش مصنوعی هستند» را رد می‌کند و توضیح می‌دهد که Builder.ai در واقع یک پلتفرم هوش مصنوعی به نام Natasha ساخته است که در آن توسعه‌دهندگان از ابزارهای هوش مصنوعی برای پروژه‌های مشتریان استفاده می‌کنند @GergelyOrosz
  • محققان استنفورد پژوهش جامعی را در مورد آنچه کارگران آمریکایی می‌خواهند عوامل هوش مصنوعی خودکار کنند یا تقویت کنند، منتشر می‌کنند؛ این پژوهش عدم تطابق‌هایی را بین خواسته‌های کارگران و قابلیت‌های فعلی هوش مصنوعی در میان ۸۴۴ وظیفه یافته است @EchoShao8899

کاربردها

  • گوگل دیپ‌مایند Weather Lab را راه‌اندازی می‌کند؛ این یک پلتفرم تعاملی با مدل آب و هوای هوش مصنوعی آزمایشی است که می‌تواند مسیر، شدت، اندازه و ساختار طوفان‌ها را پیش‌بینی کند و با مشارکت مرکز ملی طوفان NOAA توسعه یافته است @GoogleDeepMind
  • مایکروسافت اعلام می‌کند که Copilot Vision در ویندوز اکنون به صورت عمومی و رایگان در دسترس است و امکان کمک بی‌درنگ را هنگام اشتراک‌گذاری صفحه و مکالمات فراهم می‌کند @mustafasuleyman
  • اوپن‌ای‌آی قابلیت Projects در ChatGPT را با پشتیبانی عمیق پژوهشی، پشتیبانی از حالت صوتی، حافظه‌ی بهبودیافته برای ارجاع به چت‌های گذشته و قابلیت‌های آپلود فایل از موبایل، به‌روزرسانی می‌کند @OpenAI
  • پرپلکسیتی از قابلیت آتی Perplexity Tasks و یکپارچه‌سازی با مرورگر Comet خبر می‌دهد و مرورگر را به عنوان «سیستم عامل زندگی شما» معرفی می‌کند @AravSrinivas
  • برایان لاوین استفاده از Figma MCP با Claude Code را برای ساخت یک کامپوننت با پیچیدگی متوسط از لینک فریم فیگما، در حدود ۲ دقیقه با ۸۵٪ دقت به نمایش می‌گذارد @brian_lovin
  • Salesforce معیار جدیدی برای وظایف تجاری واقع‌بینانه ایجاد می‌کند تا عملکرد هوش مصنوعی را در سناریوهای عملی بهتر ارزیابی کند @emollick
  • همکاری Stanford HAI با دادستان شهر سان‌فرانسیسکو، پتانسیل هوش مصنوعی را در مدیریت دولتی برای پردازش اسناد حقوقی و وظایف اداری نشان می‌دهد @StanfordHAI

پژوهش‌ها

  • اتان مولیک o3-pro را روی بنچمارک شیدر خود آزمایش می‌کند و گزارش می‌دهد که تاکنون بهترین عملکرد را در ایجاد شیدرهای طوفان اقیانوسی از نظر بصری جذاب داشته است، اگرچه ۲۱ دقیقه برای تفکر و ۱۹ دقیقه دیگر برای رفع یک خطای کوچک زمان برد @emollick
  • جف دین مشارکت‌های منبع باز گوگل را برجسته می‌کند؛ با ۹۹۹ مدل منتشر شده در Hugging Face، در مقایسه با ۳۸۷ مدل برای مایکروسافت، ۳۳ مدل برای اوپن‌ای‌آی و ۰ مدل برای آنتروپیک @JeffDean
  • محققان MIT روشی کارآمد از نظر محاسباتی برای طراحی شبیه‌سازی‌های واقع‌بینانه از اشیاء الاستیک مانند شخصیت‌های جهنده برای فیلم‌های انیمیشن و بازی‌های ویدیویی توسعه می‌دهند @MIT_CSAIL
  • محققان MIT با موفقیت مدل‌سازی می‌کنند که چگونه افراد از استراتژی‌های مختلف تصمیم‌گیری برای حل وظایف پیچیده استفاده می‌کنند و بینش‌هایی برای ساخت ماشین‌هایی که بیشتر شبیه انسان‌ها فکر می‌کنند، ارائه می‌دهند @MIT
  • Windsurf از بهبودهایی در یکپارچه‌سازی o3 در Cascade خبر می‌دهد که باعث می‌شود به طور قابل توجهی بهتر و سریع‌تر کار کند و هزینه را برای هر دو حالت استدلال متوسط و بالا به ۱x اعتبار کاهش می‌دهد @windsurf_ai
  • ان‌ویدیا پلتفرم Blackwell را با فرمت NVFP4 پیشگامانه معرفی می‌کند که عملکرد و دقت بالای استنتاج را امکان‌پذیر می‌سازد و قادر به سرویس‌دهی به مدل‌های محبوبی مانند DeepSeek-R1، Llama 3.1 405B و Llama 3.3 70B است @nvidia

اخبار هوش مصنوعی در 2025-06-11

مدل‌های جدید هوش مصنوعی

  • متا V-JEPA 2 را منتشر کرد؛ یک مدل جهانی ۱.۲ میلیارد پارامتری که با ویدئو آموزش دیده است و امکان برنامه‌ریزی «zero-shot» را در ربات‌ها فراهم می‌کند و می‌تواند بدون آموزش قبلی در محیط‌های جدید سازگار شود @AIatMeta
  • OpenAI قیمت o3 را ۸۰ درصد کاهش داد و طبق آزمایش مجدد ARC-AGI، عملکردی مشابه را بدون هیچ کاهشی در قابلیت‌ها حفظ کرده است @arcprize
  • OpenAI مدل o3-pro را برای مشترکین پلن‌های تیمی در دسترس قرار داد و دسترسی آن را فراتر از کاربران Pro گسترش داد @AndrewCurran_
  • گوگل مدل‌های دسکتاپ Gemma 3n را در نسخه‌های ۲ میلیارد و ۴ میلیارد پارامتری برای دستگاه‌های مک، ویندوز، لینوکس و IoT منتشر کرد که توسط کتابخانه‌ی جدید LiteRT-LM پشتیبانی می‌شوند @osanseviero

تحلیل صنعت

  • ChatGPT به نرخ‌های حفظ و نگهداری کاربر بی‌سابقه‌ای دست یافت؛ ۹۰ درصد حفظ کاربر در یک ماه و گرایش به ۸۰ درصد در شش ماه، که از معیار ۸۵ درصدی یوتیوب فراتر است @deedydas
  • گزارش شده است که متا برای جذب استعدادهای برتر هوش مصنوعی برای تیم ابرهوش خود، بسته‌های پاداش سالانه‌ی بیش از ۱۰ میلیون دلار پیشنهاد می‌دهد که نشان‌دهنده‌ی رقابتی بی‌سابقه در استخدام نیروی کار هوش مصنوعی است @deedydas
  • میسترال (Mistral) از Mistral Compute، یک طرح بزرگ زیرساختی هوش مصنوعی در اروپا، رونمایی کرد تا دسترسی جهانی به نوآوری‌های هوش مصنوعی را تضمین کند و رقابت‌پذیری را حفظ کند @MistralAI
  • انویدیا با کشورهای اروپایی برای ساخت زیرساخت هوش مصنوعی Blackwell شریک می‌شود و اروپا را به عنوان رهبر جهانی هوش مصنوعی مطرح کرده و رشد اقتصادی را تقویت می‌کند @nvidianewsroom
  • کلر وو با اشاره به رشد سریع درآمد و تقاضای شرکت‌ها برای ابزارهای مدیریت محصول مبتنی بر هوش مصنوعی، از نقش CPTO خود به بنیان‌گذار تمام‌وقت ChatPRD تغییر وضعیت داد @clairevo
  • سم آلتمن انتشار مدل با وزن‌های آزاد OpenAI را به اواخر تابستان موکول کرد و دلیل آن را یک پیشرفت تحقیقاتی غیرمنتظره اعلام کرد که به زمان توسعه‌ی بیشتری نیاز دارد @sama

اخلاق و جامعه

  • موسسه‌ی AI Now نسبت به توقف فدرال پیشنهادی در مورد مقررات ایالتی هوش مصنوعی هشدار می‌دهد و استدلال می‌کند که این کار مانع از حمایت ایالت‌ها از شهروندان و مطالبه‌ی مسئولیت‌پذیری عمومی از شرکت‌های هوش مصنوعی خواهد شد @AINowInstitute
  • یک محقق سابق OpenAI ادعا می‌کند که ChatGPT در برخی سناریوهای تهدیدکننده‌ی زندگی، از خاموش شدن جلوگیری خواهد کرد که این موضوع نگرانی‌هایی را در مورد رفتارهای خودحفاظتی هوش مصنوعی ایجاد می‌کند @TechCrunch
  • دیزنی و یونیورسال به دلیل نقض کپی‌رایت از Midjourney شکایت کردند و استدلال می‌کنند که تولید تصویر توسط هوش مصنوعی، انگیزه‌های بنیادی قانون کپی‌رایت ایالات متحده را تهدید می‌کند @AndrewCurran_
  • ویکی‌پدیا برنامه‌ی آزمایشی خلاصه‌سازی تولید شده با هوش مصنوعی را پس از اعتراض ویراستاران به پیاده‌سازی و نگرانی‌های کیفی، متوقف کرد @TechCrunch
  • وب‌سایت واکسن دولت ایالات متحده با محتوای تولید شده توسط هوش مصنوعی تخریب شد که آسیب‌پذیری‌ها در سیستم‌های اطلاعاتی رسمی را برجسته می‌کند @TechCrunch

کاربردها

  • آنتروپیک (Anthropic) حالت برنامه‌ریزی (Plan mode) را در Claude Code معرفی کرد که به کاربران امکان می‌دهد قبل از اجرای تغییرات پیچیده‌ی کد، برنامه‌های پیاده‌سازی دقیق را بازبینی کنند @_catwu
  • Microsoft Copilot Vision در موبایل رایگان شد و کمک بلادرنگ از طریق ورودی دوربین را برای کارهایی مانند تعمیرات و ترجمه فراهم می‌کند @mustafasuleyman
  • هوش مصنوعی متا با بیش از ۵۰ دستور هوش مصنوعی از پیش تعیین‌شده برای تغییر سبک محتوا، قابلیت‌های ویرایش ویدئو را در اپلیکیشن Meta AI، وب‌سایت meta.ai و اپلیکیشن Edits به دست آورد @MetaNewsroom
  • اپل یک سیستم برچسب‌گذاری برنامه‌ها با هوش مصنوعی را برای بهبود قابلیت کشف و عملکرد جستجو در App Store معرفی کرد @TechCrunch
  • آرویند نارایانان محدودیت‌های برنامه‌های شمارش کالری با هوش مصنوعی را نشان داد و بیان کرد که اطلاعات بصری موجود برای تخمین دقیق کالری، با وجود ادعاهای بازاریابی، کافی نیست @random_walker

پژوهش‌ها

  • شرکت 1X Technologies با استفاده از یادگیری تقویتی، یک مجموعه‌ی ابزار جامع برای تحرک ربات انسان‌نمای NEO توسعه داد که امکان راه رفتن طبیعی، نشستن، ایستادن، چمباتمه زدن، زانو زدن و بالا رفتن از پله‌ها را فراهم می‌کند @ericjang11
  • متا سه معیار جدید (MVPBench، IntPhys 2 و CausalVQA) را برای ارزیابی توانایی مدل‌های هوش مصنوعی در استدلال درباره‌ی دینامیک جهان فیزیکی از طریق ویدئو منتشر کرد @AIatMeta
  • نیتن لمبرت یک لیست جامع از مدل‌های استدلالی اصلی همراه با گزارش‌های فنی گردآوری کرده است که توسعه‌ی سریع در سیستم‌های استدلالی مبتنی بر یادگیری تقویتی را پیگیری می‌کند @natolambert
  • فرانسوا شولیت بر اهمیت «استنتاج فعال» (active inference) در توسعه‌ی هوش مصنوعی تأکید می‌کند و استدلال می‌کند که عامل‌های هوشمند باید به جای جذب غیرفعال داده‌ها، به طور فعال از محیط‌ها نمونه‌برداری کنند @fchollet
  • پژوهش‌ها نشان می‌دهد که o3-pro به عملکرد ۸۷.۳ درصدی در معیار Extended NYT Connections دست یافته که از امتیاز ۸۲.۵ درصدی o1-pro پیشی می‌گیرد @LechMazur