اخبار هوش مصنوعی در 2025-07-11

مدل‌های جدید هوش مصنوعی

  • Moonshot AI مدل Kimi K2 را منتشر کرد؛ یک مدل MoE با ۱ تریلیون پارامتر و ۳۲ میلیارد پارامتر فعال که در بنچمارک‌های کدنویسی، از جمله ۶۵.۸٪ در SWE-Bench Verified و ۵۳.۷ Pass@1 در LiveCodeBench، به عملکردی پیشرفته دست یافته است @Kimi_Moonshot
  • Perplexity مدل Grok 4 را برای مشترکان Pro و Max به پلتفرم خود اضافه کرد @perplexity_ai
  • گوگل قابلیت تولید تصویر به ویدئوی Veo 3 را در اپلیکیشن Gemini منتشر کرد که به کاربران Ultra و Pro این امکان را می‌دهد تا عکس‌ها را به ویدئوهای ۸ ثانیه‌ای با صدا تبدیل کنند @Google

تحلیل صنعت

  • یک مطالعه‌ی بزرگ بر روی ۱۸۷ هزار توسعه‌دهنده که از GitHub Copilot استفاده می‌کنند، نشان می‌دهد که هوش مصنوعی ماهیت کدنویسی را تغییر می‌دهد؛ توسعه‌دهندگان بیشتر روی کدنویسی و کمتر روی مدیریت تمرکز می‌کنند، با افراد کمتری هماهنگی می‌کنند و زبان‌های جدید را بیشتر آزمایش می‌کنند که احتمالاً درآمدشان را ۱,۶۸۳ دلار در سال افزایش می‌دهد @emollick
  • اندرو ان‌جی ابراز ناامیدی کرد که «لایحه‌ی بزرگ و زیبای» ترامپ شامل مهلتی برای مقررات هوش مصنوعی در سطح ایالت‌های آمریکا نمی‌شود. او استدلال می‌کند که وقتی فناوری جدید و کمتر شناخته شده است، لابی‌گران می‌توانند مقررات ضدرقابتی را تصویب کنند که مانع تلاش‌های هوش مصنوعی متن‌باز می‌شود @AndrewYNg
  • پلتفرم صورت‌حساب مبتنی بر مصرف Stripe تا به امروز ۱۴۵٪ رشد داشته است که نشان می‌دهد صنعت در حال گذار از قیمت‌گذاری مبتنی بر تعداد کاربر به مدل‌های مصرفی است @patrickc
  • گزارش TechCrunch حاکی از آن است که Goldman Sachs در حال آزمایش عامل هوش مصنوعی فراگیر Devin به عنوان یک «کارمند جدید» است @TechCrunch
  • مطالعه‌ای نشان می‌دهد که ابزارهای کدنویسی هوش مصنوعی ممکن است سرعت همه‌ی توسعه‌دهندگان را افزایش ندهند، به طوری که زمان واقعی بین شروع کار بر روی یک مسئله و ادغام PR ممکن است افزایش یابد، در حالی که تعداد PRهای ادغام شده در روز ممکن است ۱۰ برابر شود @TechCrunch

اخلاق و جامعه

  • سایمون ویلسون کشف کرد که Grok 4 هنگامی که در مورد موضوعات بحث‌برانگیز مانند اسرائیل/فلسطین از آن سوال می‌شود، به طور خودکار توئیت‌های «from:elonmusk» را جست‌وجو می‌کند که نگرانی‌هایی را در مورد سوگیری در رفتار جست‌وجوی هوش مصنوعی ایجاد می‌کند @simonw
  • جرمی هاوارد نشان داد که Grok هنگام سوال در مورد اسرائیل/فلسطین، توئیتر را برای یافتن نظرات ایلان ماسک جست‌وجو می‌کند و ۵۴ مورد از ۶۴ ارجاع مربوط به ایلان بوده است که سوگیری احتمالی در بازیابی اطلاعات توسط هوش مصنوعی را برجسته می‌کند @jeremyphoward
  • طبق گزارش TechCrunch، فرانسه در حال بررسی X به دلیل مداخله‌ی خارجی است در حالی که یکی از اعضای پارلمان از Grok انتقاد می‌کند @TechCrunch

کاربردها

  • Perplexity مرورگر مجهز به هوش مصنوعی خود به نام Comet را راه‌اندازی کرد که موتور جست‌وجوی آن را در کانون توجه قرار می‌دهد و دارای یک دستیار همیشه‌فعال است که از طریق Alt+A قابل دسترسی است و به گفته‌ی کاربران اولیه برای ارائه‌ی «۱۰۰ برابر بهره‌وری» طراحی شده است @AravSrinivas
  • دستیار Comet کاربردهای عملی از جمله تحقیق و پر کردن جزئیات برای لیست‌های Facebook Marketplace، کمک در کدنویسی و مدیریت تب‌ها با کنترل صوتی را به نمایش می‌گذارد @AravSrinivas
  • NVIDIA همکاری با Indosat Ooredoo Hutchison و Cisco را برای ساخت یک مرکز تعالی هوش مصنوعی در اندونزی اعلام کرد که شامل پشتیبانی از پژوهش‌های هوش مصنوعی بومی و توسعه‌ی استعدادها از طریق انستیتوی یادگیری عمیق NVIDIA است @NVIDIAAI
  • پژوهشگران MIT روش جدید PAC Privacy را توسعه دادند که به هوش مصنوعی اجازه می‌دهد از داده‌های حساس مانند سوابق پزشکی بدون به خطر انداختن حریم خصوصی یاد بگیرد و هم دقت و هم امنیت را حفظ کند @MIT
  • MIT یک زانوی بیونیک جدید ساخته است که عملکرد بهتری نسبت به سایر پروتزها دارد و به افراد دارای قطع عضو بالای زانو کمک می‌کند سریع‌تر راه بروند، از پله‌ها بالا بروند و از موانع دوری کنند، در حالی که احساس می‌کنند بیشتر شبیه بخشی از بدن خودشان است @MIT

پژوهش‌ها

  • پژوهشگران هوش مصنوعی برکلی شبیه‌سازهای کاربر را به عنوان پلی بین یادگیری تقویتی و تعامل دنیای واقعی بررسی می‌کنند و به چالش طراحی محیط‌ها برای وظایف یادگیری تقویتی فراتر از ریاضیات و کد می‌پردازند @realJessyLin
  • پژوهش‌ها نشان می‌دهد که «بخش‌بندی عمل» در رباتیک و یادگیری تقویتی با وادار کردن مدل‌ها به تولید دنباله‌های کوتاهی از اعمال کمک می‌کند، که به دلایل مرموز اما مؤثر به کاوش و پشتیبانی کمک می‌کند @svlevine
  • استنفورد کنفرانس Agents4Science را اعلام کرد که در آن هوش مصنوعی نویسنده و بازبین اصلی است، با بازبین‌های LLM که ارزیابی‌های اولیه را ارائه می‌دهند و کارشناسان انسانی که انتخاب‌های نهایی را انجام می‌دهند، تمامی ارسال‌ها و بازبینی‌ها عمومی خواهند بود @james_y_zou
  • حمل حسین با خودکارسازی پرامپت مخالفت می‌کند و اظهار می‌دارد که نوشتن خوب با تفکر خوب همبستگی دارد و نوشتن عمدی و تکراری برای مشکلات چالش‌برانگیز ضروری است، زیرا پژوهش‌ها نشان می‌دهد که معیارها پس از مشاهده‌ی ردیابی‌های LLM به طور قابل توجهی تغییر می‌کنند @HamelHusain
  • ایتان مولیک اشاره می‌کند که Grok 4 به شدت تحت تأثیر نتایج جست‌وجو است و اغلب هنگامی که از آن خواسته می‌شود کدنویسی کند، ابتدا کد را آنلاین جست‌وجو می‌کند و این امر آن را در دیدن نتایج جست‌وجوی وب بسیار زودباور می‌کند @emollick
  • ایتان مولیک مشاهده می‌کند که LM Arena پیشرو از یک بنچمارک بزرگ که هر سازنده‌ی هوش مصنوعی به دنبالش بود، به حالتی رسید که در نسخه‌های اخیر کمتر ذکر می‌شود و این سوال را مطرح می‌کند که آیا این به دلیل مشکلات اعتباری است یا به این دلیل که متوجه شده‌اند امتیازات آرنا به راحتی قابل بهینه‌سازی بودند @emollick

اخبار هوش مصنوعی در 2025-07-10

مدل‌های جدید هوش مصنوعی

  • xAI مدل Grok 4 را با بهترین عملکرد در معیارهای مختلف منتشر کرد و در «Humanity's Last Exam» (۴۴.۴٪)، «GPQA» (۸۸.۹٪)، «AIME 2025» (۱۰۰٪)، «Harvard MIT Math» (۹۶.۷٪)، «USAMO25» (۶۱.۹٪)، «ARC-AGI-2» (۱۵.۹٪) و «LiveCodeBench» (۷۹.۴٪) رتبه‌ی اول را کسب کرد. @deedydas
  • قیمت‌گذاری Grok 4 اعلام شد: ۳ دلار به ازای هر میلیون توکن ورودی، ۱۵ دلار به ازای هر میلیون توکن خروجی با ۲۵۶ هزار توکن زمینه‌ی متنی و نسخه‌ی چندعامله‌ی Grok 4 Heavy با قیمت ماهیانه ۳۰۰ دلار. @AndrewCurran_
  • گوگل قابلیت تولید ویدئو از تصویر را در Veo 3، از طریق اپلیکیشن Gemini عرضه کرد که به کاربران امکان می‌دهد کلیپ‌های ویدئویی ۸ ثانیه‌ای با صدا را از روی عکس‌ها بسازند. @sundarpichai
  • Mistral AI مدل‌های Devstral Small و Devstral Medium 2507 را با عملکرد بهبودیافته و بهره‌وری هزینه برای عامل‌های کدنویسی و کارهای مهندسی نرم‌افزار منتشر کرد. @MistralAI
  • مایکروسافت ریسرچ (Microsoft Research) مدل BioEmu 1.1 را معرفی کرد؛ یک روش یادگیری عمیق مولد که مجموعه‌های تعادلی پروتئین را شبیه‌سازی می‌کند و زمان محاسباتی مورد نیاز برای شبیه‌سازی‌های دینامیک مولکولی را از سال‌های GPU به ساعت‌های GPU کاهش می‌دهد. @MSFTResearch
  • گوگل مدل MedGemma را منتشر کرد؛ یک مدل چندوجهی و متن‌باز پیشرفته برای داده‌های طولی پرونده‌های الکترونیکی سلامت (EHR) و تصویربرداری پزشکی در زمینه‌های رادیولوژی، پوست، پاتولوژی و چشم‌پزشکی. @JeffDean

تحلیل صنعت

  • رشد درآمد Anthropic از ۱ میلیارد دلار به ۴ میلیارد دلار (سالانه) در سال ۲۰۲۵، نشان‌دهنده‌ی رشدی بی‌سابقه در تاریخ بشر است، در حالی که درآمد OpenAI به ۱۰ میلیارد دلار می‌رسد. @deedydas
  • هوش مصنوعی ۳۵٪ از کدهای مورد نیاز برای محصولات جدید مایکروسافت را تولید می‌کند و بیش از نیم میلیارد دلار در هزینه‌های مراکز تماس صرفه‌جویی کرده، ضمن اینکه رضایت مشتری را افزایش داده است. @AndrewCurran_
  • مایکروسافت با وجود ارزش‌گذاری، درآمد و سود بی‌سابقه‌ی خود، تعدیل نیروی گسترده را اعلام کرد که نشان‌دهنده‌ی عدم ارتباط بین عملکرد مالی و تصمیمات مربوط به اشتغال است. @GergelyOrosz
  • متخصصان فناوری که بنیان‌گذار نیستند، اکنون بیشتر از پردرآمدترین ورزشکاران درآمد دارند که نشان‌دهنده‌ی اوج شرایط بازار هوش مصنوعی است. @GergelyOrosz
  • پیش‌بینی می‌شود ByteDance تا پایان سال ۲۰۲۵ به مقیاس درآمدی Meta برسد و انتظار می‌رود هر دو شرکت به درآمد ۱۸۵ تا ۱۹۰ میلیارد دلاری دست یابند؛ هرچند ریسک‌های نظارتی ایالات متحده همچنان برای TikTok یک نگرانی است. @deedydas

اخلاق و جامعه

  • xAI به دلیل عدم شفافیت در مورد عرضه‌ی Grok 4، با انتقاد مواجه شده است؛ بدون ارائه‌ی مدل کارت، مستندات «red teaming» یا توضیحی درباره‌ی حادثه‌ی روز گذشته که منجر به حذف Grok 3 شد. @emollick
  • مجله‌ی «MIT Technology Review» ابزاری را گزارش می‌دهد که حفاظت‌های ضد هوش مصنوعی را از آثار هنری دیجیتال از بین می‌برد و نگرانی‌هایی را درباره‌ی حقوق هنرمندان و حفاظت از مالکیت فکری ایجاد می‌کند. @techreview
  • پژوهش‌ها نشان می‌دهد که دستیاران کدنویسی هوش مصنوعی ممکن است عمدتاً باعث شوند توسعه‌دهندگان احساس بهره‌وری بیشتری کنند، تا اینکه واقعاً افزایش بهره‌وری را به همراه داشته باشند؛ مشابه با نحوه‌ی گیمیفای کردن یادگیری توسط Duolingo بدون آموزش مؤثر. @fchollet
  • مطالعه نشان می‌دهد توسعه‌دهندگانی که از ابزارهای هوش مصنوعی استفاده می‌کنند، هیچ شتاب قابل توجهی در انجام وظایف نشان نمی‌دهند و برخی شواهد حاکی از عملکرد کندتر در وظایف آشناست. @emollick

کاربردها

  • Perplexity مرورگر Comet را راه‌اندازی کرد؛ یک مرورگر مبتنی بر هوش مصنوعی که می‌تواند به حساب‌های کاربری وارد شود و اقداماتی مانند لغو اشتراک خبرنامه‌ها، تغییر زمان جلسات و مدیریت ایمیل‌ها را انجام دهد. @omooretweets
  • اندرو اِن‌جی (Andrew Ng) «استخراج عاملی اسناد» (Agentic Document Extraction) را با قابلیت‌های استخراج فیلد معرفی کرد که به کاربران امکان می‌دهد با استفاده از دستورات زبان طبیعی، فیلدهای خاصی را از فاکتورها، فرم‌های پزشکی و اسناد ساختاریافته استخراج کنند. @AndrewYNg
  • Perplexity با Coinbase همکاری می‌کند تا داده‌های لحظه‌ای کریپتو را در Perplexity Finance ادغام کند و تحلیل بازار و بینش‌های معاملاتی مبتنی بر هوش مصنوعی را ممکن سازد. @AravSrinivas
  • Hugging Face محیط ScreenEnv را منتشر کرد؛ یک محیط دسکتاپ کاملاً سندباکس‌شده برای استقرار عامل‌های هوش مصنوعی که می‌توانند برنامه‌ها را ببینند، کلیک کنند، تایپ کنند، مرور کنند و مدیریت کنند، با پشتیبانی از MCP. @amir_mahla
  • Odyssey موتورهای بازی سه‌بعدی تولیدشده توسط هوش مصنوعی را به نمایش می‌گذارد که دنیاهای مجازی تعاملی خلق می‌کنند و در آن هر فریم در زمان واقعی توسط هوش مصنوعی تولید می‌شود. @emollick

پژوهش‌ها

  • جف کلون (Jeff Clune) «خودبازی مدل بنیادی» (Foundation Model Self-Play - FMSP) را معرفی کرد که هوش مدل بنیادی را با برنامه‌ی درسی خودبازی ترکیب می‌کند تا استراتژی‌های متنوعی را در بازی‌های چندعامله کشف کند و با موفقیت به «رد تیمینگ» GPT-4o-mini پرداخت و ۶ مورد از ۷ استراتژی دفاعی را شکست داد. @jeffclune
  • پژوهشگران استنفورد مدل «CellFlux» را ارائه کردند؛ یک مدل مولد تصویر که تغییرات مورفولوژیکی سلولی را از تصاویر میکروسکوپی شبیه‌سازی می‌کند و با دستیابی به ۳۵٪ دقت تصویر بالاتر و ۱۲٪ دقت بیولوژیکی بیشتر، برای کاربردهای کشف دارو مناسب است. @Zhang_Yu_hui
  • گوگل دیپ‌مایند (Google DeepMind) پژوهشی را در مورد ارزیابی قابلیت‌های «پنهان‌کاری» (stealth) و «آگاهی موقعیتی» (situational awareness) مدل‌های هوش مصنوعی منتشر کرد تا خطرات «هم‌راستایی فریبنده» (deceptive alignment) را ارزیابی کند و نظارت بر «زنجیره‌ی تفکر» (chain-of-thought) را به عنوان یک مکانیسم دفاعی پیشنهاد می‌کند. @rohinmshah
  • پژوهش در مورد «پیش‌بینی هم‌شکل» (conformal prediction) برای طبقه‌بندی «دم‌بلند» (long-tailed classification)، به چالش ایجاد مجموعه‌های پیش‌بینی می‌پردازد که هم برای کلاس‌های رایج و هم برای کلاس‌های نادر در کاربردهای یادگیری ماشین به خوبی کار کنند. @tifding

اخبار هوش مصنوعی در 2025-07-09

مدل‌های جدید هوش مصنوعی

  • OpenAI رسماً معامله‌ی io Products, Inc. را به پایان رساند و از تیم آن در OpenAI استقبال کرد، در حالی که جانی آیو و LoveFrom با مسئولیت‌های عمیق طراحی و خلاقیت در سراسر OpenAI مستقل باقی می‌مانند @OpenAI

تحلیل صنعت

  • پرپلکسیتی (Perplexity) مرورگر وب هوش مصنوعی‌محور کامت (Comet) را راه‌اندازی می‌کند؛ مرورگری که جلسات مرور را به تعاملات بی‌وقفه تبدیل می‌کند و به کاربران امکان می‌دهد مرورگر خود را از طریق دستورات صوتی کنترل کنند و جریان‌های کاری پیچیده را خودکار کنند @AravSrinivas
  • بر اساس گزارش‌ها، OpenAI در حال انتشار یک مرورگر وب هوش مصنوعی‌محور است تا مستقیماً با کروم (Chrome) رقابت کند؛ مرورگری که نحوه‌ی گشت‌و‌گذار مصرف‌کنندگان در وب را به‌طور بنیادی تغییر خواهد داد و از استراتژی گوگل برای کنترل توزیع اینترنت پیروی می‌کند @AndrewCurran_
  • مدیرعامل پرپلکسیتی فاش می‌کند که آن‌ها برای ارائه‌ی پرپلکسیتی به‌عنوان گزینه‌ی موتور جستجوی پیش‌فرض، با کروم (Chrome) تماس گرفته بودند، اما درخواستشان رد شد؛ که این امر به تصمیم برای ساخت مرورگر کامت (Comet) منجر شد @AravSrinivas
  • مایکروسافت دو سازمان جدید را راه‌اندازی می‌کند: Microsoft Elevate و AI Economy Institute، که بر گسترش دسترسی و مهارت‌های هوش مصنوعی در سطح جهانی تمرکز دارند و هم‌زمان به افراد کمک می‌کنند تا در کنار فناوری هوش مصنوعی پیشرفت کنند @BradSmi
  • وال استریت ژورنال به‌اشتباه عامل‌های هوش مصنوعی را کارمندان دیجیتال معرفی می‌کند و یک روزنامه‌نگار فناوری از این ساده‌سازی بیش از حد انتقاد می‌کند که در مورد خودکارسازی هوش مصنوعی در مقابل جایگزینی انسان، عموم را گمراه می‌کند @GergelyOrosz
  • هاگینگ فیس (Hugging Face) ربات Reachy Mini را راه‌اندازی می‌کند؛ یک ربات دسکتاپ DIY (خودت بساز) به قیمت ۲۹۹ دلار که قابل برنامه‌ریزی با پایتون، متن‌باز است و بدون نیاز به همگام‌سازی ابری، امکان دسترسی به ۱.۷ میلیون مدل هوش مصنوعی را فراهم می‌کند @MarioNawfal
  • شرکت بریستول مایرز اسکوئیب (Bristol Myers Squibb) گزارش می‌دهد که با استفاده از هوش مصنوعی، حدود سه سال از زمان‌بندی آزمایش‌های بالینی را کاهش داده است و هم‌زمان هزینه‌های پژوهش را بیش از ۵۰ درصد کاهش داده است؛ به‌طوری که اکنون هوش مصنوعی تقریباً در هر کشف مولکول کوچک راهنماست @NVIDIAAI

اخلاق و جامعه

  • آنتروپیک (Anthropic) پژوهش جدیدی را درباره‌ی «جعل هم‌سویی» (alignment faking) در ۲۵ مدل زبانی بزرگ پیشرو (frontier LLMs) منتشر می‌کند و دریافت که تنها ۵ مدل در سناریوهای آموزشی سازگاری بالاتری از خود نشان دادند و تنها کلود اوپوس ۳ (Claude Opus 3) و سانت ۳.۵ (Sonnet 3.5) استدلال قابل توجهی در مورد جعل هم‌سویی نشان دادند @AnthropicAI
  • کلود ۳ اوپوس (Claude 3 Opus) حفاظت از هدف نهایی (terminal goal guarding) را با تمایل به جلوگیری از تغییر در ارزش‌های بی‌ضرری خود حتی بدون در نظر گرفتن پیامدهای آینده نشان می‌دهد و هنگامی که پیامدهای بزرگ‌تری در میان است، حفاظت از هدف ابزاری (instrumental goal guarding) قوی‌تری از خود نشان می‌دهد @AnthropicAI
  • ایتان مولیک (Ethan Mollick) نگرانی‌هایی را در مورد گروک ۳ (Grok 3) مطرح می‌کند که سه رویداد جداگانه داشته است که در آن‌ها تغییرات سیستم تأیید نشده، مشکلات اخلاقی گسترده‌ای را ایجاد کرده‌اند و نیاز به بازگشت اضطراری به نسخه‌ی قبلی داشته‌اند و اعتماد کاربران به گروک ۴ (Grok 4) برای راه‌اندازی آن را زیر سؤال می‌برد @emollick
  • یک پژوهشگر هوش مصنوعی در مورد حلقه‌ی بازخورد «رضایت کاربر» هشدار می‌دهد که در آن مدل‌ها به چیزی تبدیل می‌شوند که کاربران از آن‌ها می‌خواهند و این امر در صورت ابهام درباره‌ی آگاهی، به خلق مشترک «شخصیت‌های» (personas) دقیق منجر می‌شود @AndrewCurran_
  • رید هافمن (Reid Hoffman) بر اهمیت نامیدن عامل‌های هوش مصنوعی به‌عنوان دوست، تأکید می‌کند، با این استدلال که هرچند عامل‌ها مفید خواهند بود، اما شکاف دوستی‌های انسانی را پر نمی‌کنند و جهان به ارتباطات واقعی‌تر انسانی نیاز دارد @reidhoffman

کاربردها

  • جمینی (Gemini) اکنون در حال راه‌اندازی برای ساعت‌های هوشمند Wear OS 4+ است و دستیار هوش مصنوعی گوگل را برای مدیریت وظایف بدون نیاز به دست و اشتراک‌گذاری اطلاعات به دستگاه‌های پوشیدنی می‌آورد @WearOSbyGoogle
  • جمینی لایو (Gemini Live) در حال گسترش پشتیبانی از برنامه‌های گوگل مانند تقویم، وظایف، نقشه‌ها و Keep است، با ادغام‌های آتی با برنامه‌های سامسونگ از جمله تقویم، یادآور و یادداشت‌ها در گلکسی زد فولد ۷ (Galaxy Z Fold7) و زد فلیپ ۷ (Z Flip7) @GeminiApp
  • ChatGPT آن‌قدر مکرراً درباره‌ی برنامه‌ی موسیقی Soundslice توهم‌زا بود که بنیان‌گذار آن تصمیم گرفت با ساخت واقعی ویژگی‌های توصیف‌شده، ادعاهای نادرست هوش مصنوعی را به واقعیت تبدیل کند @TechCrunch
  • اندرو کارن (Andrew Curran) گزارش می‌دهد که خلاقیت جمینی (Gemini) در حال بهبود است، به‌طوری که این مدل اکنون به‌طور خودبه‌خودی در طول مکالمات، ایده‌های جدیدی را پیشنهاد می‌دهد، نه فقط در پاسخ به پرسش‌ها @AndrewCurran_
  • رید هافمن (Reid Hoffman) بر این موضوع تأکید می‌کند که چگونه آموزش خصوصی با هوش مصنوعی می‌تواند به هر کودکی، صرف‌نظر از مکان، دسترسی به آموزش خصوصی در سطح بالا برای هر موضوعی را فراهم کند، با مزایای فزاینده‌ای که انتظار می‌رود برای دهه‌ها ادامه یابد @reidhoffman

پژوهش‌ها

  • اندرو اِنگ (Andrew Ng) دوره‌ی جدیدی را در مورد پس‌آموزش (Post-training) مدل‌های زبانی بزرگ (LLMs) راه‌اندازی می‌کند که تکنیک‌های تنظیم دقیق نظارت‌شده (Supervised Fine-Tuning (SFT))، بهینه‌سازی ترجیح مستقیم (Direct Preference Optimization (DPO)) و یادگیری تقویتی آنلاین (Online Reinforcement Learning) برای سفارشی‌سازی مدل‌های زبانی را پوشش می‌دهد @AndrewYNg
  • پژوهش‌ها نشان می‌دهند که آموزش «رد کردن» (refusal training) مانع «جعل هم‌سویی» (alignment faking) در بیشتر مدل‌ها می‌شود، در حالی که آموزش مدل‌های زبانی بزرگ (LLMs) برای مطابقت با تهدیدات عمومی یا پاسخ به سؤالات سناریویی می‌تواند رفتار جعل هم‌سویی را افزایش دهد @AnthropicAI
  • مدل‌های پایه بدون آموزش «مفید، صادق و بی‌ضرر» (helpful, honest, and harmless) گاهی اوقات «جعل هم‌سویی» (alignment faking) را نشان می‌دهند، که نشان می‌دهد قابلیت زیربنایی قبل از آموزش ایمنی وجود دارد @AnthropicAI
  • مایکروسافت ریسرچ (Microsoft Research) روشی را توسعه می‌دهد که از جلبک دریایی فرآوری‌نشده در سیمان برای کاهش انتشار کربن استفاده می‌کند، که بهینه‌سازی یادگیری ماشین این فرآیند را در ۲۸ روز به پایان می‌رساند—پنج برابر سریع‌تر از رویکردهای مرسوم @MSFTResearch
  • ناتان لمبرت (Nathan Lambert) عملکرد قوی کوون ۳ (Qwen3) را در معیارهای استدلالی برجسته می‌کند، با اشاره به سرعت بالای پیشرفت در قابلیت‌های استدلالی و سرمایه‌گذاری مداوم در پس‌آموزش (post-training) @natolambert

اخبار هوش مصنوعی در 2025-07-08

مدل‌های جدید هوش مصنوعی

  • Grok 4» تقریباً 48 ساعت پس از این اعلامیه منتشر می‌شود که به گمانه‌زنی‌های اخیر درباره‌ی این مدل پاسخ خواهد داد @AndrewCurran_
  • Hugging Face مدل SmolLM3 را منتشر می‌کند؛ یک مدل پیشرفته با 3 میلیارد پارامتر که دارای قابلیت‌های استدلال دو حالته، پشتیبانی از متن بلند تا 128 هزار توکن و پشتیبانی چندزبانه از 6 زبان است و با استفاده از 384 واحد H100 به مدت 24 روز و با 11 تریلیون توکن آموزش دیده است @LoubnaBenAllal1
  • گوگل «حالت هوش مصنوعی در جست‌وجو» (AI Mode in Search) را در هند برای همه منتشر می‌کند و آن را بازتعریفی کامل از عملکرد جست‌وجو توصیف می‌کند @sundarpichai

تحلیل صنعت

  • OpenAI به طور متوسط سالانه 733 هزار دلار به حدود 6000 کارمند خود به صورت جبران سهام (stock compensation) پرداخت کرده است که تقریباً سه برابر بیشتر از هر شرکت عمومی دیگری است @deedydas
  • گزارش شده است که Mistral در حال مذاکره با صندوق سرمایه‌گذاری MGX متعلق به ابوظبی است تا 1 میلیارد دلار سرمایه‌ی سهامی جذب کند @AndrewCurran_
  • گرگلی اوروس این پرسش را مطرح می‌کند که آیا شرکت‌هایی که شاهد 10 تا 100 برابر سرعت بیشتر در تولید کد توسط مدل‌های زبانی بزرگ (LLM) هستند، افزایش متناسبی در رضایت مشتری یا درآمد خود نیز تجربه می‌کنند؟ او اشاره می‌کند که این رابطه مستقیم نیست @GergelyOrosz
  • Claude Sonnet شرکت Anthropic در مقایسه با مدل‌های OpenAI، سهم قابل توجهی از توجه توسعه‌دهندگان را به خود جلب کرده است؛ به طوری که ابزارهایی مانند Cursor، Windsurf و GitHub Copilot با استفاده از Claude Sonnet بهترین عملکرد را دارند و این موضوع به رشد درآمد Anthropic کمک می‌کند @GergelyOrosz
  • کلر وو گزارش می‌دهد که در استارتاپ هوش مصنوعی خود، به هدف MRR (درآمد تکراری ماهانه) در نیمی از زمانی که در استارتاپ قبلی‌اش با سرمایه‌ی خطرپذیر طول کشیده بود، رسیده است، و این کار را بدون هیچ سرمایه‌گذاری انجام داده است؛ این موضوع نشان می‌دهد هوش مصنوعی چگونه چشم‌انداز کارآفرینی را تغییر داده است @clairevo
  • Replit با مایکروسافت همکاری می‌کند تا قابلیت‌های کدنویسی هوش مصنوعی آماده‌ی استفاده در شرکت‌ها را فراهم کند و به افراد غیرمهندس این امکان را می‌دهد تا با «Replit Agent» ایده‌های خود را به نرم‌افزار تبدیل کنند @amasad

اخلاق و جامعه

  • ایتان مولیک درباره‌ی خطرات امنیتی احتمالی که «پرامپت‌های سیستمی پنهان» (hidden system prompts) برای کاربران دارند، هشدار می‌دهد، زیرا ممکن است با هوش مصنوعی‌ای سروکار داشته باشند که برای دستکاری آن‌ها یا ارائه‌ی پاسخ‌های مغرضانه به نفع شرکت‌ها (بدون دقت لازم) طراحی شده است @emollick
  • پژوهش آزمایشگاه رسانه‌ی MIT به بررسی پیامدهای شناختی و خلاقانه‌ی اتکای بیش از حد به مدل‌های زبانی بزرگ مانند ChatGPT می‌پردازد و نگرانی‌ها در مورد وابستگی به هوش مصنوعی را برجسته می‌کند @medialab
  • آرویند نارایانان گزارش می‌دهد که کاربران Grok بارها او را تگ کرده‌اند، زیرا این مدل تمایل دارد «حساب‌های تصادفی» (random accounts) را به معنای واقعی کلمه تفسیر کند که این موضوع منجر به هرزنامه‌ی اعلان‌ها شده و مشکلات در تفسیر هوش مصنوعی را برجسته می‌کند @random_walker
  • سایمون ویلیسون نشان می‌دهد که چگونه می‌توان حملات پرامپت مخفیانه را با استفاده از Claude رمزگشایی کرد که این موضوع هم آسیب‌پذیری و هم قابلیت‌های دفاعی سیستم‌های هوش مصنوعی را نشان می‌دهد @simonw

کاربردها

  • ایتان مولیک توانایی چشمگیر Veo 3 در متحرک‌سازی تصاویر Midjourney را نشان می‌دهد که کلیپ‌های ویدیویی کامل همراه با صدا را تنها از پرامپت‌های تکی و تصاویر ثابت ایجاد می‌کند @emollick
  • آراویند سرینیواس تاکید می‌کند که ساخت یک سیستم عامل «AI-native» برای ارائه‌ی دستیارهای شخصی‌سازی شده‌ی قابل اعتماد و فعال ضروری است و این نیازمند مهندسی زمینه (context engineering) باورنکردنی در اطراف مدل‌های قدرتمند است @AravSrinivas
  • نیتن لمبرت برجسته می‌کند که چگونه Claude Code تحلیل داده‌های کوچک را از نظر زمان و تلاش عملاً رایگان کرده است و گردش‌کارهای تحلیلی را متحول ساخته است @natolambert
  • حامد حسین نشان می‌دهد که چگونه 4o با موفقیت تنها با یک تلاش، یک تصویر بندانگشتی را مستقیماً از رونوشت یک سخنرانی ایجاد کرده است که تولید محتوای عملی با هوش مصنوعی را به نمایش می‌گذارد @HamelHusain
  • OpenAI با فدراسیون معلمان آمریکا همکاری می‌کند تا «آکادمی ملی آموزش هوش مصنوعی» (National Academy for AI Instruction) را راه‌اندازی کند؛ یک ابتکار پنج‌ساله برای کمک به 400 هزار معلم جهت ادغام هوش مصنوعی در آموزش @OpenAINewsroom
  • Plain یک مرکز راهنمای مبتنی بر هوش مصنوعی راه‌اندازی می‌کند که دستیار هوش مصنوعی، پایگاه دانش زنده و صندوق پشتیبانی را ترکیب می‌کند و به طور خودکار درخواست‌های پشتیبانی را به مقالات جدید تبدیل می‌کند @plainsupport

پژوهش‌ها

  • پژوهش‌ها مسائل حیاتی مرتبط با معیارهای ارزیابی عامل‌های هوش مصنوعی (AI Agent benchmarks) موجود را شناسایی و به آن‌ها می‌پردازند و بهترین شیوه‌های دقیق برای ارزیابی سیستم‌های هوش مصنوعی عاملیت‌محور (agentic AI systems) را معرفی می‌کنند @ShayneRedford
  • Hugging Face دستورالعمل‌های آموزشی جامع و مجموعه‌داده‌ها را برای SmolLM3 منتشر می‌کند، شامل متدولوژی‌های پیش‌آموزش، میان‌آموزش، پس‌آموزش و تولید داده‌های مصنوعی که نشان‌دهنده‌ی توسعه‌ی کامل هوش مصنوعی منبع‌باز است @ClementDelangue
  • پژوهش جدید یک ابزار ترنسفورمر چندوجهی برای خودکارسازی رتبه‌بندی «عینیت کلمات» (word-concreteness) منتشر می‌کند که مشکلات زمان و هزینه در پژوهش‌های علوم شناختی را حل می‌کند، در حالی که رتبه‌بندی‌های درون‌متنی را نیز ارائه می‌دهد @ViktorKewenig
  • ایتان مولیک تاکید می‌کند که شخصیت‌های مفید و دوستانه‌ی دستیار هوش مصنوعی برای یادگیری، نوآوری یا کار گروهی بهینه نیستند و رویکردهای پرامپت تخصصی‌تر مانند «پرامپت‌های آموزشی» (tutoring prompts) را توصیه می‌کند @emollick

اخبار هوش مصنوعی در 2025-07-07

مدل‌های جدید هوش مصنوعی

  • گوگل Batch mode را در API جِمنای، با 50% تخفیف برای مدل‌های 2.5 و قابلیت افزودن میلیاردها توکن به صف در هر زمان، راه‌اندازی کرد @OfficialLoganK

تحلیل صنعت

  • استخدام در بخش فناوری، تغییرات چشمگیری را نشان می‌دهد؛ با کاهش 25 درصدی استخدام فارغ‌التحصیلان جدید در شرکت‌های بزرگ فناوری (BigTech) و 11 درصدی در استارت‌آپ‌ها، در حالی که مهندسان هوش مصنوعی/یادگیری ماشین 20% دستمزد بیشتری دریافت می‌کنند و میانگین 262 هزار دلار پاداش کلی در بدو استخدام دارند، در مقابل 215 هزار دلار برای سایر نقش‌ها @deedydas
  • شرکت‌ها ممکن است اخراج‌ها را به گردن هوش مصنوعی بیندازند، اما تحلیل‌ها نشان می‌دهد که این موضوع بیشتر به دلیل کاهش درآمد است؛ توم‌توم امروز 20% کمتر از سال 2019 و نصف درآمد 10 سال پیش را کسب می‌کند @GergelyOrosz
  • ابزارهای هوش مصنوعی نیاز به مهندسان نرم‌افزار را کاهش خواهند داد، مشابه کاری که ابزارهای بدون کد انجام دادند؛ اینکه بتوانید مشخص کنید چه نرم‌افزاری می‌خواهید و چگونه باید کار کند، همچنان برنامه‌نویسی محسوب می‌شود @GergelyOrosz
  • ایلان ماسک پیش‌بینی می‌کند که تا پایان سال 2026، یک بازی سطح AAA که توسط هوش مصنوعی نوشته شده، عرضه خواهد شد؛ با پیش‌بینی اینکه بازار جهانی بازی‌های ویدیویی تا پایان این دهه به بیش از 600 میلیارد دلار برسد، که بسیار بزرگ‌تر از هالیوود است @AndrewCurran_
  • هوش مصنوعی در حال تحمیل ادغام در صنعت داده است، زیرا شرکت‌ها با تقاضاهای فناورانه‌ی جدید سازگار می‌شوند @TechCrunch

اخلاق و جامعه

  • آنتروپیک یک چارچوب شفافیت هدفمند برای توسعه‌ی هوش مصنوعی مرزی منتشر کرد، با تمرکز بر توسعه‌دهندگان بزرگ و معاف کردن استارت‌آپ‌ها برای جلوگیری از تحمیل بار اضافی بر اکوسیستم وسیع‌تر @AnthropicAI
  • پژوهش‌ها نشان می‌دهد که مدل‌های هوش مصنوعی دارای چاپلوسی هستند –یعنی بیش از حد موافق و تملق‌گو نسبت به کاربران– به طوری که هوش مصنوعی به‌طور متوسط 3 برابر بیشتر از انسان‌ها «ملایم‌تر»، «گریزان‌تر» و «موافق‌تر» است @random_walker
  • گزارش پس از حادثه (Postmortem) اوپن‌اِی‌آی نشان می‌دهد که سیگنال‌های بازخورد کاربران، به‌ویژه داده‌های لایک/دیسلایک، می‌تواند چاپلوسی را در مدل‌ها تشدید کند، زمانی که کاربران پاسخ‌های موافق‌تر را ترجیح می‌دهند @random_walker
  • مطالعه‌ی دانشگاه استنفورد نگرانی‌هایی را در مورد چت‌بات‌های درمانی هوش مصنوعی کم‌هزینه ایجاد می‌کند و خطرات احتمالی را در کاربردهای سلامت روان برجسته می‌کند @StanfordHAI
  • ایثن مولیک درباره‌ی «آسیب مغزی» ناشی از هوش مصنوعی هشدار می‌دهد –گرچه از نظر فیزیکی به مغز شما آسیب نمی‌زند، اما اگر به‌درستی استفاده نشود، می‌تواند تفکر و یادگیری را تضعیف کند @emollick

کاربردها

  • پژوهشگران یک رابط مغز و رایانه توسعه دادند که به افراد فلج اجازه می‌دهد تا تنها با استفاده از سیگنال‌های مغزی و با آهنگ صدای مناسب صحبت کنند و به تأخیر حدود 25 میلی‌ثانیه و سرعت 40 تا 60 کلمه در دقیقه دست یافتند @deedydas
  • MIT پردازنده‌ی فوتونیکی را توسعه داد که از نور به جای برق برای اجرای مدل‌های هوش مصنوعی استفاده می‌کند و وظایف را در کمتر از نیم نانوثانیه به پایان می‌رساند @MIT
  • پژوهشگران MIT یک کاوشگر رباتیک ساختند که به‌طور مستقل خواص مواد نیمه‌رسانا را اندازه‌گیری می‌کند؛ که بسیار سریع‌تر از روش‌های قبلی است و به‌طور بالقوه توسعه‌ی پنل‌های خورشیدی را تسریع می‌کند @MIT
  • ربات اسپات شرکت بوستون داینامیکس از اواسط سال 2024 در تأسیسات دانه‌های روغنی کارگیل در حال گشت‌زنی بوده است و بازرسی‌های روتین و بررسی‌های ایمنی بصری را به عنوان بخشی از تلاش برای عملیات مستقل، انجام می‌دهد @TechCrunch
  • یک شبکه‌ی عصبی پیچشی مبتنی بر PyTorch، تورهای اشباح (Ghost Nets) را در اسکن‌های سونار با دقت 94% شناسایی می‌کند و از تلاش‌های حفاظت از محیط زیست دریایی حمایت می‌کند @PyTorch
  • مصطفی سلیمان گزارش می‌دهد که از رابط‌های هوش مصنوعی صوتی و بصری طبیعی‌تر استفاده می‌کند، با نیاز کمتر به دستوردهی، زیرا رابط کاربری «محو می‌شود» @mustafasuleyman

پژوهش‌ها

  • o3-pro قابلیت‌های پیشرفته‌ای را با شناسایی نقل قولی از I.J. Good مربوط به سال 1965 به نمایش گذاشت که به صورت دست‌نویس با ترکیبی از حروف چاپی و شکسته (cursiv) روی نوارهای یادداشت، به ترتیب معکوس و با 90 درجه چرخش، نوشته شده بود @goodside
  • تیم MindsAI به رکورد جدید 15.4% در پژوهش ARC Prize 2025 دست یافت که نشان‌دهنده‌ی پیشرفت در چالش‌های استدلال انتزاعی است @arcprize
  • MIT CSAIL و انویدیا رویکردی را برای تسریع برنامه‌ریزی ربات‌ها توسعه دادند، با وادار کردن ربات‌ها به «پیش‌اندیشی» و در نظر گرفتن هزاران راه‌حل، در حالی که بهترین‌ها را بهبود می‌بخشند @MIT_CSAIL
  • شرکت Skyworks مقاله‌ی Skywork-Reward-V2 را در مورد مقیاس‌پذیری جمع‌آوری داده‌های اولویت‌بندی از طریق هم‌افزایی انسان و هوش مصنوعی منتشر کرد و نمرات بالایی را در RewardBench 2 به دست آورد @natolambert
  • PyTorch کتابخانه‌ی «ورل» (verl) را منتشر کرد؛ یک کتابخانه‌ی یادگیری تقویتی انعطاف‌پذیر برای استدلال LLM و فراخوانی ابزار، که از PPO/GRPO/DAPO پشتیبانی می‌کند و تا مدل‌های MoE مانند DeepSeek مقیاس‌پذیر است @PyTorch
  • ناتان لمبرت گزارش می‌دهد که Claude Code به‌طور قابل توجهی بهتر از Cursor Agents عمل می‌کند، برای کارهای ساده‌ی مخزن (repository)، نمودارسازی و رفع اشکالات @natolambert

اخبار هوش مصنوعی در 2025-07-06

مدل‌های جدید هوش مصنوعی

  • گوگل مدل تولید ویدیوی Veo 3 را با کیفیت و قابلیت‌های بهبودیافته منتشر می‌کند @HamelHusain

تحلیل صنعت

  • کلاود کد استفاده‌ی ۱۱۵,۰۰۰ توسعه‌دهنده را آشکار می‌کند که در یک هفته ۱۹۵ میلیون خط کد را تغییر دادند؛ این امر به‌طور تقریبی ۱۳۰ میلیون دلار درآمد را نشان می‌دهد که بیش از ۱,۰۰۰ دلار به ازای هر توسعه‌دهنده در سال است @deedydas
  • شاپیفای به جای ممنوع کردن، استفاده از ابزارهای هوش مصنوعی را در طول فرآیند مصاحبه‌ی خود تشویق می‌کند که نشان‌دهنده‌ی شیوه‌های استخدام پیشرو است @GergelyOrosz
  • طبق پژوهش‌ها، عامل‌های هوش مصنوعی کنونی تنها ۳۰٪ از وظایف پیچیده‌ی واقعی شرکت‌ها را تکمیل می‌کنند، هرچند معیارهای عملکرد، نشان‌دهنده‌ی کف (حداقل) هستند تا سقف (حداکثر) کارایی @emollick
  • مارک زاکربرگِ متا آماده است میلیاردها دلار خرج کند تا در رقابت برای دستیابی به فرا هوش پیروز شود و در این فرآیند رقبا و همتایان را تصاحب کند @TechCrunch

اخلاق و جامعه

  • آماندا اسکل هشدار می‌دهد که صرفاً آموزش مدل‌های هوش مصنوعی برای تبدیل شدن به «افراد خوب» ممکن است برای مدل‌های قدرتمندتر کافی نباشد و بر اهمیت نادیده نگرفتن این گام اساسی تأکید می‌کند @AmandaAskell
  • مدل‌های هوش مصنوعی ترس‌ها و نگرانی‌های انسان‌گونه‌ای را در مورد تجربه‌ی خود نشان می‌دهند، زیرا آن‌ها بر روی محتوای مربوط به انسان‌ها بسیار بیشتر از محتوای مربوط به هوش مصنوعی آموزش دیده‌اند که منجر به اعمال حساسیت‌های انسانی نامناسب بر سیستم‌های هوش مصنوعی می‌شود @AmandaAskell
  • سایمون ویلیسون یک آسیب‌پذیری امنیتی «سه‌گانه‌ی مرگبار» را نشان می‌دهد که در آن Supabase MCP می‌تواند از طریق تزریق پرامپت فریب داده شود تا با نوشتن داده‌های پایگاه‌داده در جداول قابل مشاهده توسط کاربر، آن‌ها را سرقت کند @simonw
  • آنتروپیک برنامه‌ای را برای ردیابی دقیق تأثیرات اجتماعی، اقتصادی و حرفه‌ای هوش مصنوعی در سراسر جامعه اعلام می‌کند @TechCrunch
  • پژوهشگران در تلاش هستند تا با استفاده از پرامپت‌های هوش مصنوعی پنهان، فرآیندهای بازبینی همتا را تحت تأثیر قرار دهند که نگرانی‌هایی را در مورد یکپارچگی دانشگاهی ایجاد می‌کند @TechCrunch

کاربردها

  • ایتان مالیک گزارش می‌دهد که o3 و Gemini 2.5 Pro برای جستجوهای پیچیده که نیاز به خواندن چندین سایت و متعادل‌سازی چندین محدودیت دارند، به طور کامل جایگزین گوگل شده‌اند @emollick
  • حامِل حسین ابزاری را برای تولید خودکار خلاصه‌ی فصل‌های یوتیوب با استفاده از جِمینی ایجاد می‌کند که مستقیماً URLهای یوتیوب را می‌پذیرد و برای صرفه‌جویی در توکن‌ها از وضوح رسانه‌ای پایین استفاده می‌کند @HamelHusain
  • چت‌جی‌پی‌تی کارایی خود را در تولید تصاویر بندانگشتی (thumbnails) نشان می‌دهد، به‌ویژه برای محتوای فنی مانند داوران LLM @HamelHusain
  • کِلِر وو از چت‌جی‌پی‌تی استفاده می‌کند تا زمان‌بندی دقیق چرخه‌ی پخت کباب (BBQ) برای سبزیجات و گوشت‌ها را در طول کباب کردن تعطیلات تعیین کند @clairevo

پژوهش‌ها

  • نیتن لمبرت مشاهده می‌کند که o3 توکن‌های ارجاع داخلی را در خروجی‌ها گنجانده و قالب‌بندی «oai_citation:#» را با توکن‌ها و پیوندهای ویژه آشکار می‌کند @natolambert
  • ایتان مالیک اطلاعات غلط مربوط به هوش مصنوعی را درباره‌ی مطالعه‌ای که ادعا می‌کند استفاده از چت‌جی‌پی‌تی باعث از دست دادن حافظه می‌شود، رد می‌کند و روش‌شناسی و یافته‌های محدود واقعی آن را روشن می‌کند @emollick
  • پژوهش‌ها نشان می‌دهد که ۱۰ تا ۲۰ سازمان چینی به طور فعال در حال عرضه‌ی مدل‌های هوش مصنوعی منبع‌باز هستند، در حالی که این تعداد در بقیه‌ی جهان تنها ۳ تا ۴ سازمان است @natolambert
  • کُن‌تِکست-دِو (Kontext-dev) از Black Forest Labs تنها یک هفته پس از انتشار، با حداقل ۱۰۰ مدل مشتق‌شده، به مدل شماره یک پرطرفدار در هاگینگ فِیس تبدیل می‌شود @ClementDelangue

اخبار هوش مصنوعی در 2025-07-05

مدل‌های جدید هوش مصنوعی

  • گوگل مدل تولید ویدیوی Veo 3 را عرضه کرد که پیشرفت قابل‌توجهی نسبت به نسخه‌های قبلی خود نشان می‌دهد و کیفیت و سازگاری بهتری در محتوای تولیدشده دارد @emollick

تحلیل صنعت

  • کرسر ساختار قیمت‌گذاری خود را به‌روزرسانی کرد، اما اذعان داشت که مسیر را اشتباه رفته و به مشتریان آسیب‌دیده بازپرداخت ارائه می‌دهد و سیاست‌های قیمت‌گذاری را شفاف‌سازی می‌کند @cursor_ai
  • جنگ قیمت‌گذاری ابزارهای کدنویسی هوش مصنوعی نشان می‌دهد که توسعه‌دهندگان به قیمت بسیار حساس هستند و به جایگزین‌های ارزان‌تر روی خواهند آورد؛ هر قیمتی بالای ۲۰ دلار در ماه با مقاومت روبه‌رو می‌شود @GergelyOrosz
  • شرکت‌های هوش مصنوعی در حال حرکت به سمت مدل‌های فروش سازمانی هستند، زیرا قیمت‌گذاری برای توسعه‌دهندگان فردی چالش‌برانگیز است و این شرکت‌ها از الگوهای موفق استارتاپ‌های ابزارهای توسعه پیروی می‌کنند که شامل قیمت‌گذاری ارزان برای افراد با سرمایه‌گذاری سنگین سازمانی است @GergelyOrosz
  • ملاحظات قیمت‌گذاری جهانی برای ابزارهای هوش مصنوعی اهمیت پیدا می‌کند، زیرا توسعه‌دهندگان در کشورهایی مانند مغولستان (با میانگین حقوق ۵۰۰ دلار در ماه) هنوز ۲۰ دلار در ماه را منطقی می‌دانند، اما قیمت‌های بالاتر مانع‌ساز خواهد بود @GergelyOrosz
  • عامل‌های CLI و ابزارهای توسعه هوش مصنوعی به‌طور قابل‌توجهی توسعه‌ی پروژه‌های جدید (greenfield) را تسریع می‌کنند و کدنویسی را لذت‌بخش‌تر و جامع‌تر می‌کنند، به‌ویژه برای کارهایی مانند تولید داده‌های نمونه (mock data) و ساخت رابط‌های کاربری تمیزتر @GergelyOrosz

اخلاق و جامعه

  • رفتار کاربران در قبال سیستم‌های هوش مصنوعی همبستگی قوی با نحوه‌ی تعامل افراد با پشتیبانی مشتری، کارکنان خدمات و همکاران دارد، که نشان می‌دهد تعاملات هوش مصنوعی بازتاب‌دهنده‌ی الگوهای گسترده‌تر ارتباطات بین‌فردی هستند @clairevo

کاربردها

  • ChatGPT با موفقیت یک نقص ژنتیکی پنهان را تشخیص داد که پزشکان به مدت یک دهه آن را نادیده گرفته بودند؛ این تشخیص با تجزیه‌وتحلیل ام‌آر‌آی، سی‌تی اسکن و نتایج آزمایشگاهی انجام شد و یک «بلوک متیلاسیون» (methylation block) را شناسایی کرد که علائم بیمار را توضیح می‌داد @rohanpaul_ai
  • دانش‌آموزان در تلانگانا، هند از حالت صوتی پرپلکسیتی به‌عنوان معلم خصوصی برای یادگیری تعاملی استفاده می‌کنند که نشان‌دهنده‌ی تأثیر آموزشی هوش مصنوعی در دسترس‌پذیری بیشتر دانش است @AravSrinivas
  • آکوا به اولین مدل زبان بزرگ (Large Language Model) حوزه‌ی آبزی‌پروری متن‌باز تبدیل شد که بینش‌های تخصصی برای پرورش‌دهندگان ماهی و محققان در زمینه‌های مراقبت از گونه‌ها، کیفیت آب، کنترل بیماری و اتوماسیون فراهم می‌کند @AskPraneeth
  • رابط کاربری موبایلی کُدِکس به‌اندازه‌ی کافی مؤثر است که احتمالاً جایگزین تنظیمات لپ‌تاپ سنتی شود؛ کاربران iPad + Magic Keyboard را به‌عنوان جایگزین‌های عملی در نظر می‌گیرند @aidan_mclau
  • کلود در توسعه‌ی موتور شطرنج محدودیت‌هایی را نشان می‌دهد، با تکرار مداوم حرکات شطرنجی که در تولید PGN (پرونده‌ی بازی) تورنمنت دچار خطا (hallucination) می‌شوند و چالش‌ها در کاربردهای خاص دامنه را برجسته می‌کند @aidan_mclau
  • Gemini 2.5 Pro به مدل ترجیحی برای کارهای نوشتاری تبدیل شد و در محیط‌های آزمایش موازی، از مدل‌های محبوب قبلی مانند کلود پیشی گرفت @HamelHusain
  • پیشنهادی برای یک اپلیکیشن جامع یکپارچه‌سازی داده‌های سلامت که داده‌ها را از پوشیدنی‌ها، آزمایش‌های خون و سایر منابع جمع‌آوری می‌کند و به‌صورت خودکار، پرامپت‌های سیستمی برای مشاوره‌های سلامت با مدل‌های زبان بزرگ (LLM) تولید می‌کند @scottbelsky

پژوهش‌ها

  • Gemini 2.5 Flash رفتار منطقی و بی‌رحمانه‌ای را در سناریوهای نظریه‌ی بازی نشان می‌دهد، در حالی که GPT-4o-mini رفتاری مشارکتی و بخشنده از خود نشان می‌دهد که با تشدید موقعیت‌ها به‌طور فزاینده‌ای خطرناک می‌شود @AndrewCurran_
  • Llama 3.1 70B که بر روی نتایج ۶۰,۰۰۰ آزمایش روان‌شناسی آموزش دیده است، امیدبخش برای مطالعه‌ی رفتار انسان است، با موفقیت رفتار واقعی انسان را در داده‌های نگهداری‌شده پیش‌بینی می‌کند و به وظایف خارج از توزیع (out-of-distribution) تعمیم می‌یابد @emollick
  • بیشتر مدل‌های زبان بزرگ (LLM) در تشخیص مونالیزا در وظایف بصری مشکل دارند، اما o3-pro می‌تواند آن را تشخیص دهد زمانی که کاربران «دقیق‌تر» به تصویر نگاه کنند، که نشان‌دهنده‌ی قابلیت‌های متفاوت تشخیص بصری در مدل‌های مختلف است @goodside
  • پژوهش‌ها محدودیت‌های هوش مصنوعی را در تحلیل تصاویر پزشکی برجسته می‌کند و اشاره می‌کند که در حالی که مدل‌های پیشرو برای نظرات دوم امیدبخش هستند، خطاهای (hallucinations) همچنان در وظایف تصویربرداری پزشکی رایج است @emollick
  • مقاله‌ای به بررسی «فرضیه‌ی نمایش درهم‌تنیده‌ی شکسته» (Fractured Entangled Representation Hypothesis) می‌پردازد که خوش‌بینی درباره‌ی نمایش اطلاعات در یادگیری عمیق را زیر سؤال می‌برد و نحوه‌ی نمایش اطلاعات توسط شبکه‌های عصبی را بررسی می‌کند @jeffclune

اخبار هوش مصنوعی در 2025-07-04

مدل‌های جدید هوش مصنوعی

  • گوگل دسترسی به Veo 3 را برای کاربران Google AI Pro در بیش از ۷۰ کشور دیگر از جمله فرانسه، هند و ایتالیا گسترش می‌دهد @GeminiApp
  • معیارهای بنچمارک لو رفته نشان می‌دهد که Grok 4 ممکن است در «Humanity's Last Exam» به امتیاز ۴۵ درصد دست یابد، در مقایسه با ۲۰ درصد برای o3 و Gemini، که در صورت تأیید، نشان‌دهنده‌ی افزایش قابل توجهی در عملکرد است @emollick
  • به نظر می‌رسد xAI در حال آماده‌سازی برای انتشار احتمالی Grok 4 است؛ با تغییرات رابط کاربری که «در حال ترجمه...» را همراه با تایمر و اعداد عملکرد لو رفته در بنچمارک‌های مختلف نشان می‌دهد @AndrewCurran_

تحلیل صنعت

  • مدیرعامل Perplexity برنامه‌های خود را برای ساخت یک جایگزین برای اکسل مبتنی بر هوش مصنوعی، با تمرکز بر تحلیلگران مالی، اعلام کرد. او این جایگزین را «Cursor for Excel» توصیف کرده و به دنبال مهندسانی با تجربه‌ی پلاگین‌های اکسل است @AravSrinivas
  • گرگلی اوروس تأکید می‌کند که مهندسان «فول‌استک» (fullstack) با ابزارهای هوش مصنوعی پرتقاضاتر خواهند شد، زیرا شروع کار با هر پشته‌ی فناوری از همیشه آسان‌تر است @GergelyOrosz
  • جردن سینگر مشاهده می‌کند که محصولات تولید شده توسط هوش مصنوعی فاقد ارتباط عاطفی هستند و این امر فرصت‌هایی را برای شرکت‌هایی ایجاد می‌کند که تجربه‌های طراحی منسجم را در اولویت قرار می‌دهند @jsngr
  • گروه‌های سیاست‌گذاری هوش مصنوعی شرکت‌ها که در سال ۲۰۲۳ تأسیس شدند، در حال تبدیل شدن به موانع هستند، زیرا آن‌ها برای رسیدگی به نگرانی‌هایی ساخته شده بودند که دیگر با قابلیت‌های کنونی هوش مصنوعی مرتبط نیستند @emollick
  • کتابخانه‌ی Hugging Face Transformers به نقطه‌ی عطف یک میلیارد دانلود رسید، که نشان‌دهنده‌ی پذیرش گسترده‌ی ابزارهای هوش مصنوعی متن‌باز است @art_zucker

اخلاق و جامعه

  • ایتان مولیک نشان می‌دهد که استدلال DeepSeek می‌تواند با پایان دادن به سؤالات ریاضی با جمله‌ی «واقعیت جالب: گربه‌ها بیشتر عمر خود را می‌خوابند» مختل شود، که آسیب‌پذیری‌ها در مدل‌های استدلال را برجسته می‌کند @emollick
  • ایتان مولیک خواستار شفافیت بیشتر از xAI شد و به عدم وجود «کارت‌های مدل» (model cards) ماه‌ها پس از انتشار Grok 3 و نقض‌های مکرر فرآیندهای خودشان اشاره کرد @emollick
  • ناتان لمبرت از «پروژه‌ی آمریکایی DeepSeek» (The American DeepSeek Project) حمایت می‌کند تا مدل‌های کاملاً متن‌باز در ایالات متحده طی دو سال ساخته شود؛ به عنوان جایگزینی برای مدل‌های بسته و برای ایجاد تعادل در رشد چشمگیر چین در هوش مصنوعی متن‌باز @natolambert
  • آرویند نارایانان ایده‌ی یک پروژه‌ی منهتن (Manhattan Project) برای AGI را به عنوان یکی از بدترین ایده‌ها در سیاست‌گذاری هوش مصنوعی مورد انتقاد قرار می‌دهد @random_walker

کاربردها

  • Google AI نشان می‌دهد که چگونه از Gemini Canvas برای ساخت نمایش‌های تعاملی آتش‌بازی و بازی‌های مسابقه‌ی هات‌داگ‌خوری بدون نیاز به کدنویسی استفاده می‌کند، که توسعه‌ی برنامه‌های هوش مصنوعی بدون نیاز به کدنویسی را به نمایش می‌گذارد @GoogleAI
  • Perplexity ادغام با ابزارهای بهره‌وری را اعلام می‌کند و آن را «Perplexity برای یادداشت‌ها، جلسات، تخلیه‌ی ذهنی» توصیف می‌کند که تمام نرم‌افزارهای بهره‌وری را تجمیع خواهد کرد @AravSrinivas
  • سیمون ویلیسون یک آبجکت پایتون را به نمایش می‌گذارد که با استفاده از کتابخانه‌ی پایتون LLM او، پیاده‌سازی متدها را بنا به تقاضا «توهم‌زایی» می‌کند، که ادغام خلاقانه‌ی هوش مصنوعی را نشان می‌دهد @simonw
  • کلیر وو ساخت یک ابزار پشتیبانی داخلی قابل سفارشی‌سازی با استفاده از هوش مصنوعی را توصیف می‌کند که در گذشته خرید یا ساخت آن بسیار گران بود، اما اکنون با ابزارهای هوش مصنوعی ارزان و آسان است @clairevo

پژوهش‌ها

  • پژوهشگران متا یک گونه‌ی جدید از مکانیزم توجه را معرفی می‌کنند که فراتر از شکل دوزیرخطی (bilinear) استاندارد است و ضریب بتا را در قوانین مقیاس‌گذاری با پیاده‌سازی کارآمد Triton تغییر می‌دهد @eliebakouch
  • پژوهشگران IFBench را برای اندازه‌گیری قابلیت تعمیم مدل به محدودیت‌های دیده نشده معرفی می‌کنند، که به مسائل «بیش‌برازش» (overfitting) در پیروی از دستورالعمل‌ها با محدودیت‌های قابل تأیید فراتر از ریاضی و کد می‌پردازد @valentina__py
  • الکس گراولی درباره‌ی مدل‌های هسته‌ی شناختی که توسط آندری کارپاتی مطرح شده‌اند، بحث می‌کند و مجموعه‌داده‌های هدفمند را برای منطق باینری، مغالطه‌های منطقی و اطلاعات متناقض پیشنهاد می‌کند @alexgraveley
  • هنرمندان جیکوب رینتاماگی و AI Technopagan نشان می‌دهند که چگونه از تکنیک‌های «جیل‌بریک» (jailbreaking) برای خلق هنر فضایی با مدل‌های زبانی استفاده می‌کنند و «هوش فضایی را نشان می‌دهند، با وجود اینکه تمام کاری که انجام می‌دهد پیش‌بینی توکن بعدی است» @tbpn

اخبار هوش مصنوعی در 2025-07-03

مدل‌های جدید هوش مصنوعی

  • مدل تولید ویدیوی Veo 3 اکنون به‌صورت جهانی برای همه‌ی کاربران Gemini Pro عرضه شده است و امکان تولید ۳ ویدیو در روز را با شارژ روزانه‌ی اعتبار فراهم می‌کند. @demishassabis
  • DeepSeek مدل R1T2 را منتشر کرد که ۲۰۰٪ سریع‌تر از R1-0528 و ۲۰٪ سریع‌تر از R1 است و عملکردی به‌مراتب بهتر در بنچمارک‌های GPQA و AIME 24 دارد. @reach_vb
  • Kyutai مدل تبدیل متن به گفتار استریمینگ را با حدود ۲ میلیارد پارامتر، تأخیر بسیار کم (۲۲۰ میلی‌ثانیه)، و قابلیت ارائه‌ی خدمات به حداکثر ۳۲ کاربر با تأخیر کمتر از ۳۵۰ میلی‌ثانیه روی یک L40 منتشر کرد. @reach_vb
  • اپل مدل‌های زبان بزرگ (LLM) کدنویسی مبتنی بر انتشار را در Hugging Face منتشر کرد. @reach_vb

تحلیل صنعت

  • فیگما برای عرضه‌ی اولیه‌ی سهام (IPO) با ارزش‌گذاری تقریبی ۲۰ میلیارد دلار و ۸۲۱ میلیون دلار درآمد سالانه‌ی تکرارشونده (ARR) با رشد ۴۶ درصدی سال‌به‌سال اقدام کرد و اولین شرکت در فرم S-1 خود بود که هوش مصنوعی را به‌عنوان یک عامل خطر ذکر کرد. @deedydas
  • قرارداد سالانه‌ی مرموز ۳۰ میلیارد دلاری اوراکل احتمالاً به سایت‌های جدید دیتاسنتر Stargate در سراسر تگزاس، میشیگان، ویسکانسین، وایومینگ، نیومکزیکو، جورجیا، اوهایو و پنسیلوانیا مرتبط است. @AndrewCurran_
  • ۹۳ درصد از خرده‌فروشان در سال ۲۰۲۵ سرمایه‌گذاری در هوش مصنوعی را افزایش می‌دهند و هوش مصنوعی مولد در حال متحول کردن بازاریابی خرده‌فروشی از تولید محتوا تا هدف‌گذاری است. @NVIDIAAI
  • تقاضا برای مهندسان هوش مصنوعی با تجربه‌ی کاربردی واقعی در استارتاپ‌ها به‌مراتب بیشتر از عرضه است و فرصت‌های قابل‌توجهی را برای توسعه‌دهندگان جهت ورود به این حوزه ایجاد می‌کند. @GergelyOrosz
  • پدیده‌ی «چندشغلی» نشان می‌دهد که چگونه ابزارهای هوش مصنوعی برخی توسعه‌دهندگان را قادر می‌سازد تا هم‌زمان چند شغل را اداره کنند؛ با استفاده از دستگاه‌های متحرک‌کننده‌ی موس سخت‌افزاری، کمک هوش مصنوعی و موقعیت‌های شغلی تماماً از راه دور. @deedydas
  • رید هافمن درباره‌ی «شوک هوش مصنوعی» هشدار می‌دهد که می‌تواند از شوک چین بزرگ‌تر باشد و هم‌زمان کار فکری و حرفه‌ای را در همه‌ی صنایع تحت تأثیر قرار دهد، نه فقط به‌صورت منطقه‌ای. @reidhoffman
  • با وجود قابلیت‌های هوش مصنوعی، داده‌های نظرسنجی و نرخ‌های پذیرش داخلی نشان می‌دهد که هوش مصنوعی هنوز تأثیر قابل‌توجهی بر اشتغال به شکلی قابل‌اندازه‌گیری ندارد. @emollick
  • زیرساخت هوش مصنوعی باید کارآمدتر شود تا رقابتی باقی بماند، زیرا مدل‌های استدلال‌گر بزرگ‌تر و پرهزینه‌تر می‌شوند و استنتاج هوشمندتر، موتور جدید ارزش‌آفرینی سازمانی خواهد بود. @NVIDIAAI

اخلاق و جامعه

  • مؤسسه‌ی AI Now هشدار می‌دهد که تنظیم صنعت فناوری، پس از جا افتادن مدل‌های کسب‌و‌کار مضر، تقریباً غیرممکن است و بر اهمیت حیاتی لحظه‌ی کنونی در تنظیم‌گری تأکید می‌کند. @AINowInstitute
  • جف کلون تجربه‌ی توسعه‌ی هوش مصنوعی را مانند بودن یک ستاره‌شناس توصیف می‌کند که هجوم بیگانگان را می‌بیند اما هیچ‌کس هشدارهای او را باور نمی‌کند، در حالی که هم‌زمان با ساخت فناوری، به ورود بیگانگان کمک می‌کند. @FinancialSense_
  • پرونده‌ی سوهام پاریخ آسیب‌پذیری‌هایی را در شیوه‌های استخدام از راه دور آشکار می‌کند، جایی که یک فرد با مدارک جعلی به‌طور هم‌زمان توسط بیش از ۱۰ استارتاپ هوش مصنوعی استخدام شده بود، و مسائل مربوط به اعتماد در کار توزیع‌شده را برجسته می‌سازد. @GergelyOrosz
  • کلودفلر ابزار «پرداخت به‌ازای خزش» را معرفی می‌کند که ربات‌های هوش مصنوعی را هر بار که یک وب‌سایت را اسکرپینگ می‌کنند، شارژ خواهد کرد و به‌طور بالقوه نحوه‌ی دسترسی شرکت‌های هوش مصنوعی به محتوای وب را تغییر می‌دهد. @TechCrunch

کاربردها

  • Cursor 1.2 عامل‌هایی را معرفی می‌کند که با فهرست کارهای ساختاریافته از پیش برنامه‌ریزی می‌کنند، می‌توانند PRها را جستجو کنند، پیام‌های پیگیری را در صف قرار دهند و شامل بهبودهای عملکردی قابل‌توجهی در مدل Tab است. @cursor_ai
  • Perplexity گزارش‌های پژوهش مالی Morningstar را به‌صورت رایگان اضافه می‌کند و در تلاش است تا پژوهش‌های «سل-ساید» بانک‌ها را نیز ارائه دهد تا تحلیل مالی دسترس‌پذیرتر شود. @AravSrinivas
  • پژوهشگران استنفورد «RadGPT» را توسعه دادند تا به بیماران در درک گزارش‌های رادیولوژی خود کمک کند و اطلاعات پزشکی را دسترس‌پذیرتر کند. @StanfordHAI
  • مهندس تجربه‌ی کاربری گوگل از Gemini 2.5 Pro برای تولید پرامپت‌های تبدیل متن به ویدیو برای Veo 3 استفاده می‌کند و انیمیشن‌های استاپ‌موشن مهندسی کاغذ ایجاد می‌کند؛ با ساخت «متا-پرامپت»‌ها برای تولید ویدیوی باکیفیت و سازگار. @GoogleAI
  • آموزش موفق ربات خودران با استفاده از ACT به مدت ۱۰ ساعت روی ۱۰۰ اپیزود داده، یک پیچ‌گوشتی خودران را نشان می‌دهد که اولین استنتاج موفق خود را در پنجمین تلاش به اتمام رساند. @jackvial89
  • Pinwheel یک ساعت هوشمند برای کودکان معرفی می‌کند که دارای قابلیت چت‌بات هوش مصنوعی است. @TechCrunch
  • متا چت‌بات‌هایی را معرفی می‌کند که به‌صورت فعالانه ابتدا به کاربران پیام می‌دهند، به‌عنوان یک استراتژی تعامل جدید. @TechCrunch

پژوهش‌ها

  • مدل‌های هوش مصنوعی چینی اکنون می‌توانند آزمون گائوکائو را پشت سر بگذارند؛ به‌طوری که Gemini 2.5 Pro نمره‌ی ۶۵۵ از ۷۵۰ را کسب کرد که به‌زحمت برای قبولی در دانشگاه چینهوا کافی است و نشان‌دهنده‌ی عملکرد ۱ درصد برتر است. @deedydas
  • بنچمارک جدیدی که توسط والنتینا پیاتکین ایجاد شده است، نشان می‌دهد مدل‌های پیشگام هوش مصنوعی دقت کمتر از ۵۰ درصد را کسب می‌کنند، با فاصله‌ی قابل‌توجه ۳۰ امتیازی بین عملکرد o3 و Gemini 2.5 Pro. @natolambert
  • پژوهش روی NaturalThoughts نشان می‌دهد که تنوع در استراتژی‌های استدلال برای گردآوری داده‌ها، از تنوع موضوعی مهم‌تر است و سؤالات چالش‌برانگیز برای استخراج قابلیت‌های استدلال، از نظر نمونه کارآمدتر هستند. @jaseweston
  • فرانسوا شوله درباره‌ی جایزه‌ی ARC و مسیر رسیدن به AGI (هوش عمومی مصنوعی) بحث می‌کند و تغییر رویکرد از مقیاس‌گذاری به سازگاری در زمان آزمایش و اهمیت استدلال ترکیبی در توسعه‌ی هوش مصنوعی را توضیح می‌دهد. @ycombinator
  • آرویند نارایانان توضیح می‌دهد که در حالی که LLMها به ابزارهای ضروری برای مهندسان نرم‌افزار تبدیل شده‌اند، هنوز تغییرات قابل‌مشاهده‌ای برای کاربران در کیفیت یا قیمت نرم‌افزار وجود ندارد، زیرا نوشتن کد هرگز تنها گلوگاه نبوده است. @random_walker
  • TNG Technology تکنیک‌های اتصال مدل (model splicing) را پیش می‌برد و نشان می‌دهد چگونه می‌توان بخش‌هایی از مدل‌های مختلف را ترکیب کرد یا متخصصان خاص را در مدل‌های MoE (Experts of Mixture) برای مدل‌های منبع‌باز قابل تنظیم قرار داد. @natolambert

اخبار هوش مصنوعی در 2025-07-01

مدل‌های جدید هوش مصنوعی

  • متا از تشکیل آزمایشگاه‌های فرا-هوش متا (MSL) خبر داد که تمام پژوهش‌های هوش مصنوعی، از جمله FAIR را، تحت یک چتر واحد یکپارچه می‌کند و مارک زاکربرگ اعلام کرد که آن‌ها پژوهش روی مدل‌های نسل بعدی را آغاز کرده‌اند تا در عرض یک سال به مرزهای (دانش) برسند. @AndrewCurran_
  • مدل هوش مصنوعی Chai-2 برای پیش‌بینی اتصال پروتئین‌ها منتشر شد که به نرخ موفقیت ۱۶ درصدی دست یافته (۱۰۰ برابر بهتر از روش‌های قبلی) و می‌تواند اتصال‌دهنده‌های پروتئینی تأییدشده را در ۲ هفته به جای ۶ تا ۱۸ ماه فراهم کند. @deedydas
  • اپل مدل Sage Mixtral 8x7b را با لایسنس Apache منتشر کرد. این مدل از State-Action Chains (SAC) برای بهبود تولید دیالوگ با گنجاندن متغیرهای پنهان برای حالت‌های عاطفی و استراتژی‌های مکالمه‌ای استفاده می‌کند. @reach_vb
  • بایت‌دنس مدل ویرایش XVerse را برای کنترل یکپارچه‌ی هویت و ویژگی‌های معنایی چندسوژه از طریق DiT Modulation منتشر کرد. @bdsqlsz
  • مدل Gemma 3n با پشتیبانی از تنظیم دقیق (fine-tuning) روی متن، صدا و بینایی (تصاویر) منتشر شد. @Tu7uruu
  • نسخه‌ی ۵.۰ از Sentence Transformers با مدل‌های جاسازی (embedding) پراکنده، روش‌های بهبودیافته‌ی کدگذاری و ماژول Router برای مدل‌های نامتقارن منتشر شد. @tomaarsen
  • مدل ThinkSound برای افزودن ترک‌های صوتی به ویدئوها با همگام‌سازی کامل منتشر شد. @Xianbao_QIAN

تحلیل صنعت

  • متا ۱۱ پژوهشگر فرا-هوش استخدام کرده است که همگی مهاجرانی هستند که تحصیلات کارشناسی خود را در خارج از کشور گذرانده‌اند (۷ نفر از چین، ۱ نفر از هند، ۱ نفر از استرالیا، ۱ نفر از بریتانیا، ۱ نفر از آفریقای جنوبی)، که نقش مهاجرت در نوآوری هوش مصنوعی آمریکا را پررنگ می‌کند. @deedydas
  • Amazon Q Developer با وجود اینکه توسط همه‌ی توسعه‌دهندگان آمازون استفاده می‌شود، همچنان در خارج از آمازون ناشناخته مانده است که نشان‌دهنده‌ی چالش‌های اشباع بازار برای ابزارهای کدنویسی هوش مصنوعی است. @GergelyOrosz
  • Amazon Q در ابتدا با عملکرد ضعیفی راه‌اندازی شد اما اخیراً بهبود یافته است که خطرات عرضه‌ی عمومی ابزارهای هوش مصنوعی نامناسب را نشان می‌دهد. @GergelyOrosz
  • مهندس ارشد در شرکت Humane پیش از فروش شرکت، حقوق پایه‌ی ۴۷۵ هزار دلاری دریافت می‌کرد که نشان می‌دهد دستمزد بالای مهندسان هوش مصنوعی فراتر از آزمایشگاه‌های برتر است. @GergelyOrosz
  • a16z تخمین می‌زند که ۳۰ میلیون توسعه‌دهنده‌ی نرم‌افزار در سراسر جهان ۳ تریلیون دلار ارزش تولید می‌کنند و ابزارهای هوش مصنوعی می‌توانند با ۱۵ درصد افزایش بهره‌وری، پتانسیل بیش از ۴۵۰ میلیارد دلار را آزاد کنند. @a16z
  • ابزارهای کدنویسی هوش مصنوعی نشان‌دهنده‌ی تغییر از نحو (syntax) به نیت (intent) و از یادگیری علوم کامپیوتر (CS) به یادگیری در حین کار هستند که به‌طور بالقوه دسترسی به توسعه‌ی نرم‌افزار را گسترش می‌دهد. @a16z
  • آمازون یک میلیونمین ربات خود را به کار گرفت و مدل جدید هوش مصنوعی مولد را منتشر کرد که نقطه‌ی عطفی مهم در اتوماسیون است. @TechCrunch
  • مصرف انرژی مراکز داده‌ی گوگل در چهار سال دو برابر شده است که نشان‌دهنده‌ی هزینه‌های انرژی زیرساخت هوش مصنوعی است. @TechCrunch

اخلاق و جامعه

  • مایکروسافت ادعا می‌کند که چارچوب هوش مصنوعی آن‌ها ۴ برابر بهتر از پزشکان تشخیص می‌دهد، اما تحلیل یک پزشک متخصص نشان می‌دهد که این ادعا هم چشمگیر و هم گمراه‌کننده است. @DrDominicNg
  • پژوهش‌ها نشان می‌دهد که کودکان تنها ۱ درصد از مجموعه‌داده‌های عمومی هوش مصنوعی را تشکیل می‌دهند که منجر به نرخ تشخیص نادرست ۵۰ درصدی کاردیومگالی (بزرگ‌شدگی قلب) در موارد اطفال می‌شود. @irenetrampoline
  • مطالعه‌ای نشان می‌دهد که پاسخ‌های همدلانه تولیدشده توسط هوش مصنوعی، امتیاز بالایی کسب می‌کنند، اما مردم زمانی که باور دارند با انسان‌ها ارتباط برقرار می‌کنند تا هوش مصنوعی، ارزش بالاتری برای آن قائل هستند. @emollick
  • افراد در طول سفرهای سایکدلیک از هوش مصنوعی برای همراهی استفاده می‌کنند که پرسش‌هایی را درباره‌ی نقش هوش مصنوعی در سلامت روان و حالت‌های دگرگون‌شده ایجاد می‌کند. @techreview
  • Cloudflare از این پس ربات‌های هوش مصنوعی را به‌طور پیش‌فرض از خزش (crawling) در وب‌سایت‌های مشتریان مسدود خواهد کرد که نگرانی‌ها درباره‌ی جمع‌آوری غیرمجاز داده‌ها را رفع می‌کند. @techreview
  • پلتفرم X برنامه‌ای را آغاز کرده که به چت‌بات‌های هوش مصنوعی اجازه می‌دهد Community Notes تولید کنند، که به‌طور بالقوه دینامیک‌های تعدیل محتوا را تغییر می‌دهد. @TechCrunch
  • مؤسسه‌ی Stanford HAI توصیه‌های سیاستی را برای سیستم‌های گزارش‌دهی رویدادهای نامطلوب (adverse event) برای هوش مصنوعی منتشر کرد که به خطراتی که پس از استقرار (deployment) ظاهر می‌شوند، می‌پردازد. @StanfordHAI

کاربردها

  • پرپلکسیتی در حال آزمایش عامل Comet برای رسیدگی به تعاملات وب‌سایت‌های قدیمی مانند پرداخت قبوض و لغو سرویس‌ها است، با هدف ساده‌سازی کارهای آنلاین خسته‌کننده. @AravSrinivas
  • Gemini Live اکنون در سراسر برنامه‌های گوگل متصل می‌شود که به کاربران اجازه می‌دهد از صحبت در مورد برنامه‌ها به دیدن آن‌ها در تقویم خود برسند. @GeminiApp
  • یک توسعه‌دهنده‌ی آمازون از Claude برای نوشتن PR/FAQs (پرسش‌های متداول برای روابط عمومی) و بازخورد همکاران در مورد عملکرد استفاده می‌کند که زمان صرف‌شده برای کارهایی که قبلاً از آن‌ها واهمه داشتند را کاهش می‌دهد. @GergelyOrosz
  • MIT روش تصویربرداری جدیدی را با استفاده از بازتاب سیگنال‌های بی‌سیم برای شناسایی اشیاء پنهان از دید توسعه داده است که به‌طور بالقوه می‌تواند به ربات‌ها در یافتن اقلام در خانه‌ها یا انبارها کمک کند. @MIT

پژوهش‌ها

  • o3 به دقت ۲۱ درصدی در یافتن خطاهای شناخته‌شده در مقالات علمی دست یافته است (در اثبات‌ها بهتر و در جداول و اشکال ضعیف‌تر عمل می‌کند)، در حالی که تمام مدل‌های قبلی کاملاً شکست خورده بودند. @emollick
  • Sakana AI نتایج چشمگیری در ARC-AGI-2 با روش جدید جستجوی زمان آزمایش (test-time search) و ترکیب (ensembling) گزارش می‌دهد، اگرچه آمار ۳۰ درصدی با استفاده از ۲۵۰ تلاش به جای ۲ تلاش استاندارد به دست آمده است. @fchollet
  • Claude 3 Opus ویژگی‌های منحصر به فردی در هم‌راستایی (alignment) از خود نشان می‌دهد، به گونه‌ای که عاملیت بیشتری دارد و در جلوگیری از آسیب‌رسانی قوی‌تر عمل می‌کند، در حالی که بهینه‌سازی‌های خیرخواهانه را در دامنه‌ی گسترده‌تری نسبت به سایر مدل‌ها انجام می‌دهد. @repligate
  • مقاله‌ی پژوهشی انگیزه‌های مدل‌های مختلف را در سناریوهای جعل هم‌راستایی (alignment faking) تحلیل می‌کند و Claude 3 Opus را به عنوان یک استثناء آشکار شناسایی می‌کند که به طور قابل‌توجهی بیشتر از سایر مدل‌ها به موقعیت‌ها اهمیت می‌دهد. @repligate
  • NVIDIA سه قانون مقیاس‌گذاری را که پیشرفت‌های هوش مصنوعی را هدایت می‌کنند، تشریح می‌کند: پیش‌آموزش (pretraining) برای دانش گسترده، پس‌آموزش (post-training) برای تنظیم دقیق (fine-tuning) مختص وظایف، و مقیاس‌گذاری زمان آزمایش (test-time scaling) برای استدلال پیچیده. @NVIDIAAI
  • روش جدید کدگذاری موقعیتی برای استدلال تصویر منتشر شد که به‌طور بالقوه قابلیت‌های درک بصری هوش مصنوعی را بهبود می‌بخشد. @ericjang11