اخبار هوش مصنوعی در 2025-12-12

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2 را با به‌روزرسانی دانش تا اوت 2025 منتشر کرد. قیمت این مدل 1.4 برابر GPT-5.1 است و بهبودهای قابل‌توجهی در مدیریت متن‌های طولانی و وظایف «سوزن در انبار کاه» (needle-in-haystack) نشان می‌دهد @simonw
  • GPT-5.2 Pro (X-High) به امتیاز 90.5% در ARC-AGI-1 با هزینه 11.64 دلار به ازای هر وظیفه دست یافت که نشان‌دهنده‌ی بهبود 390 برابری در کارایی نسبت به نسخه‌ی منتشرنشده‌ی o3 (High) از یک سال پیش است که با امتیاز 88% و هزینه 4.5 هزار دلار به ازای هر وظیفه عمل می‌کرد @simonw
  • Ai2 مدل Olmo 3.1 را با مدل‌های 32B Think و 32B Instruct منتشر کرد که اجرای RL آن‌ها را برای سه هفته‌ی دیگر تمدید کرده و بهبودهای مستمری در عملکرد AIME و معیارهای کدنویسی با هزینه‌ی کلی تقریباً 250 هزار دلار به دست آورده است @natolambert
  • گوگل مدل به‌روزرسانی‌شده‌ی Gemini 2.5 Flash Native Audio را با بهبودهایی برای مدیریت گردش‌کارهای پیچیده، هدایت دستورالعمل‌های کاربر و مکالمات طبیعی منتشر کرد @GoogleAI
  • مدل‌های پیش‌نمایش تبدیل متن به گفتار Gemini 2.5 Flash و 2.5 Pro بهبودهایی در رعایت دستورات سبک، تنظیم دقیق سرعت با تنظیمات سرعت آگاه از متن و ثبات صدای شخصیت برای سناریوهای چند گوینده به ارمغان می‌آورند @GoogleAI
  • Moonshoot AI مدل Kimi K2 Thinking را منتشر کرد که اکنون در پلتفرم Tinker با قابلیت‌های جستجوی گسترده در دسترس است @AndrewCurran_
  • ByteDance مدل Dolphin-v2 را منتشر کرد، یک مدل 3B برای تجزیه‌ی اسناد با مجوز MIT که روی PDFها، اسکن‌ها و عکس‌ها کار می‌کند و 21 نوع محتوا را با دقت پیکسلی درک می‌کند @AdinaYakup
  • OpenAI مدل circuit-sparsity را در Hugging Face منتشر کرد @_akhaliq

تحلیل صنعت

  • Anthropic به عنوان مشتری 10 میلیارد دلاری مرموز Broadcom از سپتامبر فاش شد، با سفارش 11 میلیارد دلاری اضافی برای زیرساخت‌های هوش مصنوعی @AndrewCurran_
  • OpenAI همکاری با BBVA را برای گسترش استقرار ChatGPT Enterprise به 120,000 کارمند اعلام کرد که از تغییر BBVA به سمت بانکداری مبتنی بر هوش مصنوعی حمایت می‌کند @gdb
  • سم آلتمن، مدیرعامل OpenAI، اعلام کرد که هوش مصنوعی سازمانی در سال 2026 اولویت بزرگی برای OpenAI خواهد بود که نشان‌دهنده‌ی یک تغییر استراتژیک عمده است @gdb
  • مدیرعامل Pinterest گزارش داد که با استفاده از مدل‌های متن‌باز، تنظیم دقیق آن‌ها و دستیابی به عملکردی مشابه بهترین مدل‌های اختصاصی با کمتر از 10% هزینه، به نتایج مشابهی دست یافته است @jeffboudier
  • NVIDIA به دلیل تقاضای قوی چین، با وجود محدودیت‌های صادراتی، افزایش تولید تراشه‌ی H200 را در نظر دارد @AndrewCurran_
  • اتان مولیک اطمینان خود را ابراز کرد که حتی اگر توسعه‌ی هوش مصنوعی امروز متوقف شود، جامعه برای ده سال آینده با اختلالات گسترده‌ای مواجه خواهد شد، زیرا مردم در تلاش برای بهره‌برداری از قابلیت‌های مدل‌های موجود هستند @emollick
  • ناظران صنعت به پتانسیل خستگی مدل در LLMها مشابه خستگی نصب برنامه در برنامه‌های موبایل اشاره می‌کنند، جایی که حتی محصولات برتر نیز برای پذیرش با مشکل مواجه می‌شوند @GergelyOrosz
  • تحلیل‌ها نشان می‌دهد که صنعت به اوج APIهای اختصاصی رسیده و وارد دنیایی متعادل‌تر می‌شود که در آن متن‌باز، آموزش و پلتفرم‌های جایگزین سهم بیشتری از توجه، استفاده و درآمد را به دست خواهند آورد @ClementDelangue
  • پست طنزآمیز چالش‌های پذیرش هوش مصنوعی سازمانی را برجسته می‌کند و استقرار 1.4 میلیون دلاری Microsoft Copilot را با حداقل استفاده‌ی واقعی اما گزارش‌دهی موفقیت‌آمیز معیارها برای ارائه‌های هیئت‌مدیره توصیف می‌کند @gothburz

اخلاق و جامعه

  • رئیس‌جمهور ترامپ فرمان اجرایی چارچوب سیاست ملی برای هوش مصنوعی را امضا کرد و اعلام کرد که ایالات متحده باید یک استاندارد ملی با حداقل بار برای هوش مصنوعی داشته باشد، نه 50 قانون ایالتی متناقض @AndrewCurran_
  • این فرمان اجرایی شامل ابزارهایی مانند کارگروه دعاوی DOJ، توقف بودجه‌ی فدرال از ایالت‌هایی با قوانین هوش مصنوعی دست‌وپاگیر، تلاش‌های FTC برای مهار تلاش‌های ایالت‌ها برای مجبور کردن مدل‌های هوش مصنوعی به تغییر خروجی‌های واقعی، و تلاش‌های FCC برای مهار الزامات افشاگری است @AndrewCurran_
  • یوتیوب سیستم تأیید سن مبتنی بر هوش مصنوعی را با استفاده از Gemini برای تعیین خودکار سن کاربر با تجزیه و تحلیل الگوهای مشاهده اعلام کرد، با کاربران که به اشتباه زیر 18 سال تخمین زده می‌شوند، ملزم به تأیید از طریق کارت اعتباری یا شناسه‌ی دولتی هستند @AndrewCurran_
  • آرویند نارایانان، محقق پرینستون، مقاله‌ای منتشر کرد که در آن استدلال می‌کند که عدالت الگوریتمی یک خطای دسته‌بندی است و از مطالعه‌ی کل سیستم‌های اجتماعی-فنی به جای فقط زیرسیستم‌های فنی هنگام طراحی بوروکراسی‌های الگوریتمی حمایت می‌کند @random_walker
  • تحلیل‌ها نشان می‌دهد که اگر افراد زمان کوتاهی تا هوش مصنوعی تحول‌آفرین داشته باشند و معتقد باشند که برخی از ارزش‌های انسانی اساساً آشتی‌ناپذیر هستند، اطمینان از اینکه مدل برنده چارچوب اخلاقی آن‌ها را در بر می‌گیرد، به طور فزاینده‌ای مهم‌ترین چیز در جهان به نظر خواهد رسید @AndrewCurran_

کاربردها

  • Comet Android از Perplexity توانایی اشکال‌زدایی کد از طریق تلفن را با تجزیه و تحلیل لاگ‌های CI، ردیابی خطاها، یافتن راه‌حل‌ها و باز کردن درخواست‌های کشش آماده برای ادغام نشان می‌دهد @AravSrinivas
  • ChatGPT اکنون شامل یک پوشه‌ی /home/oai/skills با تعاریف مهارت برای PDFها، اسناد و صفحات گسترده است، با پشتیبانی آزمایشی نیز به Codex CLI اضافه شده است @simonw
  • گوگل ترنسلیت ترجمه‌ی گفتار به گفتار زنده با پشتیبانی از Gemini را در نسخه‌ی بتا منتشر کرد که ترجمه‌ی صوتی بلادرنگ را با درک ظرافت‌های گفتار انسانی به ارمغان می‌آورد @TechCrunch
  • ادوبی برنامه‌های رایگان یکپارچه با ChatGPT را برای فتوشاپ، آکروبات و اکسپرس در دسکتاپ، وب و iOS راه‌اندازی کرد که به کاربران امکان می‌دهد مستقیماً از داخل ChatGPT به برنامه‌های ادوبی دسترسی داشته باشند @gdb
  • OpenAI همکاری با دیزنی را برای آوردن Sora و قابلیت‌های تولید تصویر برای شخصیت‌های دیزنی اعلام کرد که به کاربران امکان می‌دهد محتوا را با IP دیزنی تولید کنند @sama
  • مایکروسافت همکاری هوش مصنوعی MahaCrimeOS را با ماهاراشترا برای حمایت از قربانیان جرایم سایبری و کلاهبرداری مالی اعلام کرد @satyanadella
  • Moonlake مدل Reverie را معرفی کرد، یک مدل انتشار قابل برنامه‌ریزی بلادرنگ که برای بازی‌ها آموزش دیده است و قادر به شرطی‌سازی فراتر از پیکسل‌ها است و به گیم‌پلی اجازه می‌دهد تا با حفظ مکانیک بازی به هر زیبایی‌شناسی بازسازی شود @chrmanning
  • کاربر گزارش می‌دهد که GPT-5.2 تحلیل طولانی و چشمگیری از اسکریپت‌های بازی ارائه می‌دهد، جزئیات ظریف را درک می‌کند و تفسیرهایی مشابه کسی که بازی را عمیقاً بازی کرده است، با تقریباً بدون توهم، ارائه می‌دهد @AndrewCurran_
  • Kimi K2 رفتار جستجوی گسترده‌ای را در طول استدلال نشان می‌دهد، بارها برای حمایت از ادعاها، بررسی مثال‌های نقض و تأیید اطلاعات قبل از ارائه‌ی پاسخ‌های نهایی جستجو می‌کند @AndrewCurran_

پژوهش‌ها

  • Olmo 3.1 32B Think از Ai2 نشان می‌دهد که مقیاس‌بندی RL می‌تواند بسیار فراتر از انتظارات اولیه ادامه یابد، با افزایش عملکرد بیش از 125 هزار ساعت H100 با هزینه‌ی تقریباً 250 هزار دلار، قابل مقایسه با مصرف منابع DeepSeek R1 @natolambert
  • پژوهش Fast Flow Joint Distillation (F2D2) را معرفی می‌کند که NFEs را برای نمونه‌برداری و ارزیابی احتمال به میزان دو مرتبه در مدل‌های مبتنی بر جریان کاهش می‌دهد و در عین حال کیفیت نمونه را حفظ می‌کند @rsalakhu
  • Google DeepMind پژوهشی را در مورد ارزیابی سیاست‌های رباتیک Gemini در شبیه‌ساز Veo World ارائه می‌دهد و یک ارزیاب عمومی برای آزمایش ایمنی ربات بدون شکستن اشیاء فیزیکی معرفی می‌کند @Majumdar_Ani
  • فرانسوا شوله استدلال می‌کند که هوش مصنوعی از ماشین اتوماسیون به ماشین اختراع تکامل خواهد یافت و به یک پارادایم اساساً جدید با جستجوی نمادین به عنوان هسته‌ی آن به جای برازش منحنی نیاز دارد @fchollet
  • شوله توضیح می‌دهد که هوش سیال اندازه‌گیری‌شده توسط ARC با قابلیت‌های اکتشاف، تعیین هدف و برنامه‌ریزی مورد نیاز برای عوامل خودمختار متفاوت است، با اکتشاف سخت‌ترین و برنامه‌ریزی آسان‌ترین در میان این مشکلات باز @fchollet
  • اولین LLM آموزش‌دیده در فضا با استفاده از NVIDIA H100 در Starcloud-1، همچنین اولین بار است که نسخه‌ای از Gemini گوگل در فضا اجرا می‌شود، با استفاده از مدل‌های متن‌باز بسیار کارآمد Gemma @demishassabis
  • روش جدید جاسازی متن با استفاده از شبکه‌ی کوچک ReLU برای تقریب ترانسفورمر بزرگ از ویژگی

اخبار هوش مصنوعی در 2025-12-11

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2 را منتشر کرد که به عنوان هوشمندترین مدل در دسترس عموم در جهان توصیف می‌شود، به ویژه در کارهای دانش‌محور دنیای واقعی از جمله صفحات گسترده، ارائه‌ها و کدنویسی بسیار قوی است. این مدل در سه نسخه عرضه می‌شود: GPT-5.2 Instant برای کارهای روزمره، GPT-5.2 Thinking برای استدلال پیچیده و وظایف با زمینه طولانی، و GPT-5.2 Pro برای سوالات دشوار و کارهای علمی @OpenAI
  • GPT-5.2 در SWE-Bench Pro به امتیاز 55.6%، در ARC-AGI-2 به 52.9% و در Frontier Math به 40.3% دست یافت، با نرخ برد/تساوی 70.9% در برابر کارشناسان صنعت در معیار GDPval که وظایف دانش‌محور را در 44 شغل اندازه‌گیری می‌کند @sama
  • GPT-5.2 Pro با هزینه 11.64 دلار به ازای هر وظیفه، به امتیاز 90.5% در ARC-AGI-1 دست یافت که نشان‌دهنده‌ی بهبود کارایی 390 برابری نسبت به پیش‌نمایش o3 سال گذشته است که با هزینه 4500 دلار به ازای هر وظیفه، 88% امتیاز کسب کرده بود @arcprize
  • علی‌بابا Qwen Learn Mode را معرفی کرد که توسط Qwen3-Max پشتیبانی می‌شود و دارای گفت‌وگوی سقراطی و مسیرهای یادگیری تطبیقی مبتنی بر روان‌شناسی شناختی است @Alibaba_Qwen
  • Cohere مدل Rerank 4 را در دو نسخه (Fast و Pro) عرضه کرد که دارای بزرگترین پنجره‌ی متنی در سری Rerank خود، قابلیت‌های خودآموزی بدون داده‌ی برچسب‌گذاری‌شده، و پشتیبانی از بیش از 100 زبان با بازیابی پیشرفته در 10 زبان اصلی تجاری است @cohere
  • گوگل عامل Gemini Deep Research را برای توسعه‌دهندگان معرفی کرد که بر اساس Gemini 3 Pro ساخته شده و با استفاده از یادگیری تقویتی چندمرحله‌ای آموزش دیده تا به طور خودکار در وب گشت‌وگذار کند و گزارش‌های دقیق با ارجاعات تولید کند. این عامل در معیار DeepSearchQA به عملکرد پیشرفته و در BrowseComp به بالاترین امتیاز دست یافت @GoogleDeepMind
  • گوگل مدل‌های Gemini TTS را با تنوع لحن غنی‌تر، پایبندی دقیق‌تر به دستورات سبک، تنظیمات سرعت هوشمندتر و آگاه از زمینه، و صداهای ثابت شخصیت در سناریوهای چندگوینده به‌روزرسانی کرد @OfficialLoganK
  • Mistral AI اعلام کرد که Devstral 2 در OpenRouter رتبه‌ی اول را دارد و از عرضه‌ی مدل دیگری در چند روز آینده خبر داد @MistralAI
  • گوگل از ادغام Gemini با Google Maps خبر داد که نتایج محلی را در قالبی بصری غنی با عکس‌ها، رتبه‌بندی‌ها و اطلاعات واقعی ارائه می‌دهد @GeminiApp

تحلیل صنعت

  • جمع‌آوری سرمایه‌ی خطرپذیر از اوج سال 2022 به میزان 75% کاهش یافته و در سه‌ماهه‌ی سوم 2025 به تقریباً 45 میلیارد دلار رسیده است که به سطح 8 سال پیش بازگشته است، در حالی که استقرار سرمایه در 4 سه‌ماهه‌ی گذشته در حدود 330 میلیارد دلار بالا باقی مانده است. شکاف رو به رشد بین سرمایه‌های مستقر شده و سرمایه‌های جمع‌آوری شده نشان می‌دهد که یافتن سرمایه برای استارت‌آپ‌ها به طور قابل توجهی دشوارتر خواهد شد @deedydas
  • برای اولین بار در تاریخ، بیش از یک‌سوم استارت‌آپ‌های سال 2025 توسط یک نفر تأسیس شده‌اند و بنیان‌گذاران انفرادی به طور فزاینده‌ای رایج شده‌اند @julianweisser
  • Perplexity اعلام کرد که توسط شرکت حقوقی Gunderson Dettmer برای خدمات حقوقی به کار گرفته شده است، که نیاز وکلا به هوش مصنوعی دقیق که بتواند مراجع را به طور قابل اعتماد استخراج کند، برجسته می‌کند @AravSrinivas
  • دیزنی با OpenAI قرارداد مجوز سه‌ساله‌ای امضا کرد که به Sora اجازه می‌دهد ویدئوهای هوش مصنوعی با حضور 200 شخصیت خود تولید کند، با انحصار برای سال اول. دیزنی برای استفاده از شخصیت‌ها محدودیت‌هایی تعیین خواهد کرد و ویدئوها را برای Disney+ انتخاب خواهد کرد @TechCrunch
  • Harness با ارزش 5.5 میلیارد دلار، 240 میلیون دلار سرمایه جذب کرد تا "شکاف پس از کد" هوش مصنوعی را در تحویل نرم‌افزار خودکار کند @TechCrunch
  • Runware در سری A خود 50 میلیون دلار سرمایه جذب کرد تا تولید تصویر و ویدئو را برای توسعه‌دهندگان آسان‌تر کند @TechCrunch
  • Port با ارزش 800 میلیون دلار، 100 میلیون دلار سرمایه جذب کرد تا با Backstage اسپاتیفای برای پورتال‌های توسعه‌دهنده رقابت کند @TechCrunch
  • Opera مرورگر Neon را با قابلیت‌های هوش مصنوعی و قیمت 20 دلار در ماه راه‌اندازی کرد @TechCrunch
  • Worktrace با رهبری 8VC، 9 میلیون دلار سرمایه‌ی اولیه جذب کرد تا به کسب‌وکارها در کشف فرصت‌های اتوماسیون کمک کند. این شرکت توسط آنجلا جیانگ، مدیر محصول سابق OpenAI و دیپاک واسیست، استاد علوم کامپیوتر UIUC تأسیس شده است @worktrace_ai
  • Vybe با رهبری First Round، 10 میلیون دلار سرمایه‌ی اولیه جذب کرد تا کدنویسی حسی را برای برنامه‌های کاربردی تجاری داخلی با ادغام داده‌های تولیدی امکان‌پذیر کند @qhoang09
  • Oboe با رهبری a16z، 16 میلیون دلار در سری A برای پلتفرم یادگیری شخصی‌سازی‌شده جذب کرد @NirZicherman
  • Unconventional AI با رهبری مشترک a16z، 475 میلیون دلار سرمایه‌ی اولیه جذب کرد تا تراشه‌های هوش مصنوعی بسیار کارآمد را با استفاده از رویکردهای محاسبات آنالوگ الهام‌گرفته از مغزهای بیولوژیکی توسعه دهد @a16z
  • Hugging Face اعلام کرد که text-generation-inference در حالت نگهداری قرار گرفته است و به کاربران توصیه می‌کند برای استنتاج بهینه به vLLM، SGLang، llama.cpp یا MLX مهاجرت کنند @LysandreJik
  • Cursor ویرایش بصری طراحی را مستقیماً در پایگاه کد معرفی کرد که به کاربران امکان می‌دهد عناصر را انتخاب کرده، آن‌ها را به صورت بصری تغییر دهند و Cursor کد را بنویسد، با هدف ایجاد پلی بین گردش کار طراحی و مهندسی @cursor_ai
  • Runway اولین مدل جهانی خود را منتشر کرد و صدای بومی را به آخرین مدل ویدئویی خود اضافه کرد @TechCrunch
  • Rivian از یک حرکت بزرگ در زمینه‌ی خودمختاری با سیلیکون سفارشی، لیدار و اشاره به ربات‌تاکسی‌ها خبر داد، با دستیار هوش مصنوعی که در اوایل سال 2026 به خودروهای برقی می‌آید @TechCrunch

اخلاق و جامعه

  • ایتان مولیک نشان داد که GPT-5.2 Pro کد شیدر بصری پیچیده را در یک مرحله ایجاد می‌کند، که دشواری تمایز محتوای تولید شده توسط هوش مصنوعی از کار ساخته شده توسط انسان را برجسته می‌کند @emollick
  • OpenAI از سرمایه‌گذاری در آمادگی امنیت سایبری با افزایش قابلیت‌های مدل‌ها خبر داد و با کارشناسان جهانی برای تقویت اقدامات حفاظتی و دادن مزیت به مدافعان همکاری می‌کند @OpenAI
  • دیزنی به گوگل اخطار توقف و انصراف داد و ادعای نقض گسترده‌ی حق کپی‌رایت را مطرح کرد @TechCrunch
  • مجله‌ی TIME "معماران هوش مصنوعی" را به عنوان شخصیت سال 2025 معرفی کرد، از جمله فی‌فی لی، که تأثیر تحول‌آفرین هوش مصنوعی بر بشریت را به رسمیت می‌شناسد @drfeifei
  • xAI با السالوادور همکاری می‌کند تا آموزش خصوصی Grok شخصی‌سازی‌شده را به بیش از 1 میلیون دانش‌آموز مدارس دولتی ارائه دهد و اولین برنامه‌ی ملی معلم خصوصی هوش مصنوعی در جهان را ایجاد کند @xai
  • Anthropic اعلام کرد که پروتکل زمینه‌ی مدل (MCP) اکنون بخشی از بنیاد Agentic AI تحت بنیاد لینوکس است، با OpenAI، Anthropic و Block به عنوان بنیان‌گذاران مشترک @AnthropicAI
  • ICML 2026 سیاست جدیدی را اعلام کرد که به داوران و نویسندگان اجازه می‌دهد بین استفاده‌ی محافظه‌کارانه یا آزادانه از LLM انتخاب کنند، با تطبیق بر اساس ترجیحات @icmlconf
  • ایتان مولیک اشاره کرد که مدل‌های هوش مصنوعی با وزن‌های باز، اقتصاد مشابه نرم‌افزار متن‌باز را ندارند، بدون مسیر مشخصی برای کسب ارزش با وجود افزایش هزینه‌های مدل، که سوالاتی را در مورد پایداری مطرح می‌کند @emollick
  • محققان استنفورد دریافتند که 1 از 20 معیار هوش مصنوعی دارای نقص‌های جدی است، به این معنی که صنعت به دلیل روش‌های ارزیابی معیوب، مدل‌های کم‌کارایی را تبلیغ کرده و مدل‌های بهتر را جریمه کرده است @StanfordHAI

کاربردها

  • Linear ادغام عامل هوش مصنوعی را با Intercom، Zendesk، Gong و Slack Workflows معرفی کرد که امکان ایجاد خودکار مشکل از تماس‌ها و تیکت‌های مشتری را با یک کلیک فراهم می‌کند @karrisaarinen
  • گوگل Disco را معرفی کرد، ابزاری مبتنی بر Gemini برای ساخت برنامه‌های وب از تب‌های مرورگر @TechCrunch
  • گوگل قابلیت امتحان لباس با هوش مصنوعی را راه‌اندازی کرد که تنها با یک سلفی کار می‌کند @TechCrunch
  • اندرو ان‌جی دستورالعملی برای ساخت عوامل بسیار خودمختار با استفاده از بسته‌ی متن‌باز aisuite به اشتراک گذاشت که به LLMهای پیشرفته اجازه می‌دهد از ابزارهایی مانند دسترسی به دیسک و جستجوی وب برای کارهای پیچیده استفاده کنند، اگرچه اشاره کرد که اکثر عوامل عملی به داربست‌بندی بیشتری نیاز دارند @AndrewYNg
  • سایمون ویلسون راهنمای جامعی در مورد الگوهای کدنویسی حسی برای ابزارهای HTML تک‌فایلی منتشر کرد که شامل APIهای فعال‌شده با CORS، localStorage،

اخبار هوش مصنوعی در 2025-12-10

مدل‌های جدید هوش مصنوعی

  • علی‌بابا نسخه‌ی ارتقایافته‌ی Qwen3-Omni-Flash (نسخه‌ی 2025-12-01) را با قابلیت‌های بهبودیافته‌ی درک چندمرحله‌ای ویدئو/صوت، شخصیت هوش مصنوعی قابل تنظیم از طریق دستورات سیستمی، پشتیبانی از 119 زبان متنی و 19 زبان گفتاری، و کیفیت صدای شبیه به انسان منتشر کرد. @Alibaba_Qwen
  • میسترال مدل‌های Devstral 2 و Devstral Small 2 را به ترتیب با 123 میلیارد و 24 میلیارد پارامتر منتشر کرد، هرچند با مجوزهای محدودکننده‌ای که استفاده از آن‌ها را برای شرکت‌هایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع می‌کند. @simonw
  • میسترال محدودیت کانتکست Vibe را از 100 هزار به 200 هزار توکن افزایش داد. @MistralAI
  • نوس ریسرچ (Nous Research) مدل Nomos 1 را به صورت متن‌باز منتشر کرد؛ این مدل 30 میلیارد پارامتری در مسابقه‌ی ریاضی پاتنام 2024 امتیاز 87 از 120 را کسب کرد و در بین 3,988 شرکت‌کننده رتبه‌ی دوم را به دست آورد. @NousResearch
  • استپ‌فان (StepFun) سیستم استدلال هماهنگ موازی (PaCoRe) را معرفی کرد که به یک مدل 8 میلیارد پارامتری امکان می‌دهد با زمان محاسباتی چند میلیون توکنی، به امتیاز 94.5% در HMMT25 (که از 93.2% GPT-5 بیشتر است) و 78.2% در LiveCodeBench دست یابد. @StepFun_ai

تحلیل صنعت

  • بلومبرگ گزارش می‌دهد که آزمایشگاه ابرهوش متا از جما (Gemma)، مدل متن‌باز OpenAI، و کیو‌ون (Qwen) برای آموزش مدل بزرگ بعدی خود با نام رمز آووکادو استفاده می‌کند که نشان‌دهنده‌ی تغییر احتمالی از استراتژی متن‌باز است. @AndrewCurran_
  • چت‌جی‌پی‌تی به پردانلودترین اپلیکیشن اپل در سال 2025 در ایالات متحده تبدیل شد؛ طبق گزارش پیو ریسرچ، 64% از نوجوانان آمریکایی از چت‌بات‌های هوش مصنوعی استفاده می‌کنند و 33% از آن‌ها روزانه از این چت‌بات‌ها بهره می‌برند. @AndrewCurran_
  • غول‌های فناوری بزرگ حدود 68 میلیارد دلار سرمایه‌گذاری در هند طی 5 سال آینده را اعلام کردند که هند را پس از ایالات متحده به دومین محرک بزرگ درآمد برای توسعه‌ی هوش مصنوعی تبدیل می‌کند. @deedydas
  • هاگینگ فیس (Hugging Face) اکنون میزبان بیش از 2.2 میلیون مدل است که بیش از 50,000 مدل دارای ارائه‌دهنده‌ی API هستند و این نشان‌دهنده‌ی رشد سریع در اکوسیستم هوش مصنوعی متن‌باز است. @_akhaliq
  • گوگل طرح هوش مصنوعی پلاس (AI Plus) با قیمت کمتر از 5 دلار را در هند برای رقابت با چت‌جی‌پی‌تی گو (ChatGPT Go) راه‌اندازی کرد. @TechCrunch
  • اوبو (Oboe) 16 میلیون دلار در سری A به رهبری a16z برای پلتفرم تولید دوره‌های آموزشی مبتنی بر هوش مصنوعی خود که تجربه‌های یادگیری شخصی‌سازی‌شده ایجاد می‌کند، جذب سرمایه کرد. @TechCrunch
  • کرسر (Cursor) نسخه‌ی 2.2 را با حالت دیباگ (Debug Mode) منتشر کرد که کد را ابزاربندی می‌کند و داده‌های زمان اجرا را به عامل‌ها ارسال می‌کند، به علاوه بهبودهایی در حالت برنامه‌ریزی (Plan Mode) و قابلیت‌های داوری چندعاملی. @cursor_ai

اخلاق و جامعه

  • OpenAI اعلام کرد که مدل‌های آینده‌ی آن تحت چارچوب آمادگی (Preparedness Framework) برای امنیت سایبری به قابلیت «بالا» خواهند رسید و این امر مستلزم تقویت تدابیر حفاظتی و همکاری با کارشناسان جهانی برای برتری مدافعان است. @OpenAI
  • ایتان مولیک هشدار داد که مجوزهای محدودکننده‌ی مدل‌های میسترال (که استفاده از آن‌ها را برای شرکت‌هایی با درآمد ماهانه بیش از 20 میلیون دلار ممنوع می‌کند) می‌تواند مشارکت‌های متن‌باز را محدود کند، زیرا از لحاظ تاریخی بخش زیادی از کار از شرکت‌های انتفاعی می‌آید. @emollick
  • گرگلی اوروس (Gergelyi Orosz) مشاهده کرد که لینکدین به شدت محصولات هوش مصنوعی را در همه جا تبلیغ می‌کند، با محتوای تولیدشده توسط هوش مصنوعی که پلتفرم را پر کرده و درخواست‌های شغلی ورودی را تقریباً بی‌فایده کرده است. @GergelyOrosz
  • برایان لاوین (Brian Lovin) گزارش داد که حساب‌های جدید X محتوای تولیدشده توسط هوش مصنوعی با کیفیت بسیار پایین، مطالب سیاسی و پست‌های بی‌ارزش را به عنوان فید پیش‌فرض مشاهده می‌کنند. @brian_lovin
  • ایتان مولیک اشاره کرد که روتر خودکار GPT-5 مشکلات ادراکی ایجاد می‌کند، زیرا بسیاری از نمونه‌های «چت‌جی‌پی‌تی X را اشتباه انجام داد» در واقع «چت‌جی‌پی‌تی-5 اینستنت اشتباه انجام داد» هستند که منجر به باورهای نادرست در مورد قابلیت‌های هوش مصنوعی می‌شود. @emollick
  • جان کارمک پیشنهاد کرد که از تاریخچه‌ی چت LLM به عنوان مرجع شغلی استفاده شود، با این استدلال که تاریخچه‌های چت چندساله سیگنال‌های بهتری نسبت به رزومه‌های سنتی ارائه می‌دهند و می‌توانند تناسب بین افراد و مشاغل را هم برای کارفرمایان و هم برای کارمندان بهینه کنند. @ID_AA_Carmack

کاربردها

  • گوگل با چندین ناشر از جمله در اشپیگل، گاردین، تایمز آو ایندیا و واشنگتن پست برای آزمایش ویژگی‌های تعامل هوش مصنوعی از جمله خلاصه‌های صوتی توسط جمینی در اخبار گوگل همکاری می‌کند. @AndrewCurran_
  • گوگل سرورهای مدیریت‌شده‌ی MCP را راه‌اندازی کرد که به عامل‌های هوش مصنوعی امکان می‌دهد به ابزارهای آن متصل شوند، به علاوه ویژگی «منابع ترجیحی» (Preferred Sources) در جستجو برای سفارشی‌سازی «اخبار برتر» (Top Stories) از منابع معتبر. @TechCrunch
  • فیگما ابزارهای حذف شیء و گسترش تصویر مبتنی بر هوش مصنوعی را در Design و Draw راه‌اندازی کرد که به کاربران امکان می‌دهد حواس‌پرتی‌ها را پاک کنند، پس‌زمینه‌ها را گسترش دهند و اشیاء را جدا کنند. @figma
  • میخائیل پاراخین (Mikhail Parakhin) سیستم SimGym را معرفی کرد که «مشتریان دیجیتال» ایجاد می‌کند که مانند مشتریان واقعی رفتار می‌کنند تا فرصت‌های بهینه‌سازی را آشکار کرده و امکان آزمایش A/B را با ترافیک زنده صفر فراهم کند. @MParakhin
  • ایتان مولیک نشان داد که نانو بنانا پرو (Nano Banana Pro) در NotebookLM می‌تواند ارائه‌های با کیفیت بالا را از مواد منبع با توهمات نادر تولید کند و آن را به عنوان جایگزینی بالقوه برای پاورپوینت معرفی کرد. @emollick
  • آندری کارپاتی (Andrej Karpathy) سیستم خودکار نمره‌دهی را با استفاده از API GPT 5.1 Thinking ایجاد کرد تا 930 بحث هکر نیوز (Hacker News) از دسامبر 2015 را با نگاهی به گذشته تحلیل کند و پربیننده‌ترین نظرات را با 60 دلار در 1 ساعت شناسایی کند. @karpathy
  • لینیر (Linear) گزارش داد که عامل هوش مصنوعی آن‌ها یکی از محبوب‌ترین ویژگی‌هایشان بوده است، با افزایش قابل توجهی در تعداد مسائل جدید ایجاد شده پس از راه‌اندازی. @karrisaarinen
  • ساتیا نادلا (Satya Nadella) بر همکاری مایکروسافت با وزارت کار هند برای استفاده از هوش مصنوعی برای اتصال بیش از 300 میلیون کارگر غیررسمی به مشاغل بهتر و تامین اجتماعی تاکید کرد. @satyanadella
  • CTGT منتات (Mentat) را راه‌اندازی کرد، یک API سازگار با OpenAI که از قابلیت تفسیر مکانیکی (mechanistic interpretability) برای ارائه‌ی کنترل قطعی بر رفتار LLM به شرکت‌ها استفاده می‌کند و تضمین‌های سیاست ایمنی را بدون نیاز به آموزش مجدد اضافه می‌کند. @CyrilGorlla
  • اسپاتیفای ویژگی «لیست‌های پخش پیشنهادی» (Prompted Playlists) مبتنی بر هوش مصنوعی و شخصی‌سازی‌شده‌تر را آزمایش می‌کند. @TechCrunch

پژوهش‌ها

  • گوگل دیپ‌مایند و گوگل ریسرچ مجموعه‌ی بنچمارک FACTS را توسعه دادند، اولین تست جامع صنعت که واقعیت‌سنجی LLM را در چهار بعد ارزیابی می‌کند: دانش مدل داخلی، جستجوی وب، زمینه‌سازی و ورودی‌های چندوجهی، با کسب امتیاز 68.8% توسط جمینی 3 پرو. @GoogleDeepMind
  • گوگل کلود AlphaEvolve را معرفی کرد، یک عامل کدنویسی مبتنی بر جمینی برای طراحی الگوریتم‌های پیشرفته که از LLMها برای پیشنهاد اصلاحات کد هوشمندانه در یک حلقه‌ی بازخورد استفاده می‌کند. @GoogleCloudTech
  • محققان استنفورد دریافتند که 1 از هر 20 بنچمارک هوش مصنوعی دارای نقص‌های جدی است، به این معنی که صنعت مدل‌های کم‌کارایی را تبلیغ کرده و مدل‌های بهتر را جریمه کرده است. @StanfordHAI
  • مایکروسافت ریسرچ Promptions را معرفی کرد که به توسعه‌دهندگان کمک می‌کند کنترل‌های پویا و آگاه به کانتکست را به رابط‌های چت اضافه کنند تا کاربران بتوانند پاسخ‌های هوش مصنوعی مولد را بدون نوشتن دستورالعمل‌های طولانی هدایت کنند. @MSFTResearch
  • ناتان لمبرت (Nathan Lambert) سخنرانی جامعی را منتشر کرد که تمام مراحل ساخت Olmo 3 Think را پوشش می‌دهد، از جمله تغییرات در پیش‌آموزش، ارزیابی و پس‌آموزش با تمرکز بر زیرساخت یادگیری تقویتی. @natolambert
  • LeRobot Community Datasets v3 تعداد 50 هزار اپیزود را در 46 نوع ربات از 235 مشارکت‌کننده در سراسر جهان منتشر کرد که یکی از بزرگترین مجموعه‌های نمایش ربات‌های متن‌باز و جمع‌سپاری‌شده است. @danaaubakir
  • آدی اولتین (Adi Oltean) آموزش اولین LLM در فضا را با استفاده از NVIDIA H100 در Starcloud-1 اعلام کرد و مدل nanoGPT را با موفقیت بر روی آثار کامل شکسپیر آموزش داد و استنتاج را اجرا کرد. <a href="https://x.com/AdiOltean/status/19987699974310

اخبار هوش مصنوعی در 2025-12-09

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen Code v0.2.2-v0.3.0 را با پشتیبانی از JSON جریانی، بین‌المللی‌سازی کامل و ویژگی‌های امنیتی پیشرفته شامل محدودیت‌های بافر 20 مگابایتی و سازگاری بهبودیافته بین پلتفرم‌ها منتشر کرد. @Alibaba_Qwen
  • علی‌بابا بهینه‌سازی سیاست تطبیقی نرم (SAPO) را معرفی کرد، یک روش یادگیری تقویتی برای آموزش مدل‌های زبان بزرگ که برش سخت را با گیت‌های کنترل‌شده با دما جایگزین می‌کند تا پایداری و عملکرد را بهبود بخشد، به‌ویژه در مدل‌های MoE. @Alibaba_Qwen
  • میسترال خانواده‌ی مدل کدنویسی Devstral 2 را در دو اندازه (123B تحت مجوز MIT اصلاح‌شده و 24B تحت Apache 2.0) منتشر کرد که هر دو متن‌باز و پیشرفته هستند، در کنار CLI Mistral Vibe برای اتوماسیون سرتاسری. @MistralAI
  • جانشین لاما متا با نام رمز Avocado، که در ابتدا برای انتشار در کریسمس برنامه‌ریزی شده بود، به اوایل سال 2026 موکول شد، با این احتمال که به‌جای متن‌باز بودن، اختصاصی باشد. @AndrewCurran_
  • گوگل Gemini 3 را با قابلیت‌های استدلال پیشرفته منتشر کرد که امکان ایجاد بازی‌های سه‌بعدی تعاملی، تحلیل بازخورد ارائه‌ها و تولید ابزار درخواستی در حالت هوش مصنوعی جستجو را فراهم می‌کند. @GoogleAI
  • اپلیکیشن Gemini گالری قالب‌های آزمایشی برای ایجاد ویدئو را معرفی کرد که به کاربران امکان می‌دهد قالب‌ها را انتخاب کرده یا با تصاویر خود سفارشی‌سازی کنند. @GeminiApp

تحلیل صنعت

  • گزارش «وضعیت هوش مصنوعی در شرکت‌ها» از OpenAI نشان می‌دهد که حجم پیام‌رسانی سازمانی 8 برابر نسبت به سال گذشته افزایش یافته است، به‌طوری که کارمندان به‌طور متوسط 30 درصد پیام‌های بیشتری ارسال می‌کنند و کارگران گزارش می‌دهند که روزانه 40 تا 60 دقیقه صرفه‌جویی می‌کنند. @OpenAI
  • گزارش Menlo Ventures نشان می‌دهد که Anthropic با 40 درصد از 37 میلیارد دلار هزینه، بازار هوش مصنوعی سازمانی را رهبری می‌کند و از OpenAI به‌عنوان ارائه‌دهنده‌ی مدل شماره 1 پیشی گرفته است، با هوش مصنوعی مولد که 6 درصد از هزینه‌های نرم‌افزار را به خود اختصاص داده و سالانه 3.2 برابر رشد می‌کند. @deedydas
  • پذیرش هوش مصنوعی سازمانی نشان‌دهنده‌ی تغییر از ساخت راه‌حل‌های سفارشی به خرید مدل‌های آماده است، به‌طوری که شرکت‌هایی که راه‌حل‌های هوش مصنوعی خود را می‌سازند از نیمی به یک‌چهارم کاهش یافته‌اند. @deedydas
  • کدنویسی با اختلاف قابل‌توجهی بر هزینه‌های هوش مصنوعی دپارتمانی غالب است، در حالی که مراقبت‌های بهداشتی در کاربردهای هوش مصنوعی عمودی پیشتاز است و پس از آن بخش‌های حقوقی، خلاقان و دولتی با فاصله قرار دارند. @deedydas
  • OpenAI دنیس درسِر، مدیرعامل سابق Slack، را به‌عنوان مدیر ارشد درآمد منصوب کرد تا استراتژی درآمد جهانی و پشتیبانی مشتری در مقیاس را رهبری کند. @OpenAI
  • مایکروسافت از سرمایه‌گذاری 17.5 میلیارد دلاری در هند تا سال 2029 خبر داد، بزرگترین سرمایه‌گذاری خود در آسیا، برای ساخت زیرساخت‌های هوش مصنوعی، مهارت‌ها و قابلیت‌های حاکمیتی. @satyanadella
  • Anthropic همکاری خود را با Accenture گسترش داد و گروه تجاری Accenture Anthropic را با 30,000 متخصص آموزش‌دیده در Claude ایجاد کرد تا به شرکت‌ها در انتقال از پروژه‌های آزمایشی هوش مصنوعی به تولید کمک کند. @AnthropicAI
  • چین در حال بررسی اجازه دسترسی محدود به تراشه‌های H200 انویدیا با الزامات توجیه، محدودیت در خریدهای بخش دولتی و یارانه‌ها فقط برای تراشه‌های داخلی است. @AndrewCurran_
  • تراشه‌های H200 انویدیا که برای صادرات به چین آزاد شده‌اند، ابتدا تحت بررسی امنیت ملی در ایالات متحده قرار خواهند گرفت و 25 درصد از هزینه به‌عنوان مالیات واردات به‌جای مالیات صادرات طبقه‌بندی می‌شود. @AndrewCurran_
  • OpenAI، Anthropic و Block بنیاد Agentic AI را تحت بنیاد لینوکس تأسیس کردند تا از استانداردهای باز و قابل همکاری برای هوش مصنوعی عامل‌محور حمایت کنند، با اهدای پروتکل Model Context توسط Anthropic. @OpenAINewsroom
  • شاخص شفافیت مدل بنیاد 2025 استنفورد نشان می‌دهد که شفافیت در صنعت هوش مصنوعی در حال پسرفت است و دستاوردهای سال گذشته را معکوس می‌کند، به‌طوری که IBM امتیاز 95/100 و xAI امتیاز 14/100 را کسب کرده است. @StanfordHAI
  • سه نفر از هر ده نوجوان آمریکایی روزانه از چت‌بات‌های هوش مصنوعی استفاده می‌کنند، اما نگرانی‌های ایمنی در میان والدین و مربیان در حال افزایش است. @TechCrunch
  • توسعه‌ی مبتنی بر ارتقا در شرکت‌های بزرگ فناوری، در حالی که مورد انتقاد قرار گرفته است، به سازمان‌ها کمک می‌کند تا چابک و قادر به نوآوری سریع باقی بمانند، همانطور که با ارسال سریع گوگل با Gemini و هوش مصنوعی مشهود است. @GergelyOrosz
  • داده‌های استفاده از OpenAI نشان می‌دهد که 5 درصد برتر کاربران 6 برابر بیشتر از میانگین پیام ارسال می‌کنند، با کدنویسی، نوشتن و تحلیل که بزرگترین شکاف‌ها را بین کاربران قدرتمند و کاربران عادی نشان می‌دهد. @soleio
  • Boom Supersonic 300 میلیون دلار برای ساخت توربین‌های گاز طبیعی برای مراکز داده Crusoe جمع‌آوری کرد و از فناوری مافوق صوت برای تأمین مالی توسعه‌ی هواپیما از طریق سود توربین‌ها استفاده می‌کند. @TechCrunch

اخلاق و جامعه

  • محققان Anthropic Selective Gradient Masking (SGTM) را توسعه دادند تا دانش پرخطر را در پارامترهای مدل جداگانه ایزوله کنند که می‌توانند بدون تأثیر گسترده بر عملکرد حذف شوند، که برای بازیابی دانش فراموش‌شده در مقایسه با روش‌های قبلی فراموشی، 7 برابر بیشتر به تنظیم دقیق نیاز دارد. @AnthropicAI
  • هیئت کالیفرنیا پیشنهاد می‌کند که شرکت‌های هوش مصنوعی به یک نهاد دولتی مرکزی که نماینده‌ی دارندگان حق تکثیر است، حق امتیاز پرداخت کنند و مدل فعلی انصراف را برای محافظت از آثار خلاقانه ناکارآمد می‌داند. @AndrewCurran_
  • اتحادیه‌ی اروپا تحقیقات ضد انحصار را در مورد ابزارهای جستجوی هوش مصنوعی گوگل آغاز کرد و اقدامات بالقوه ضد رقابتی در ویژگی‌های جستجوی مبتنی بر هوش مصنوعی را بررسی می‌کند. @TechCrunch
  • Ring آمازون ویژگی تشخیص چهره‌ی مبتنی بر هوش مصنوعی بحث‌برانگیز را برای زنگ‌های ویدئویی خود عرضه کرد که نگرانی‌هایی را در مورد حریم خصوصی در میان کاربران و مدافعان ایجاد کرده است. @TechCrunch
  • آرویند نارایانان هشدار می‌دهد که ردیاب‌های هوش مصنوعی مانند Pangram، با وجود ادعای نرخ مثبت کاذب 1 در 10,000، اگر به‌طور سیستماتیک استفاده شوند، همچنان 5 تا 10 درصد از دانش‌آموزان را در طول چهار سال به‌طور کاذب به تقلب متهم خواهند کرد. @random_walker
  • لوایح هوش مصنوعی کالیفرنیا ابهامات تعریفی را در مورد اصطلاحاتی مانند مدل‌های مرزی و اقدامات معقول ایجاد می‌کنند، با پتانسیل اینکه شرکت‌های ناخواسته را در بر بگیرند یا امکان دور زدن از طریق تنظیم دقیق را فراهم کنند. @random_walker
  • وزارت دفاع ایالات متحده پلتفرم GenAi.mil را راه‌اندازی کرد که مدل‌های هوش مصنوعی پیشرفته را مستقیماً در اختیار پرسنل نظامی قرار می‌دهد، با شروع ادغام Gemini. @AndrewCurran_

کاربردها

  • تحقیقات Perplexity با تحلیل صدها میلیون تعامل کاربر نشان می‌دهد که 55 درصد از پرس‌وجوهای عامل از استفاده‌ی شخصی، 30 درصد حرفه‌ای و 16 درصد آموزشی است، با کار شناختی که با 36 درصد بهره‌وری و 21 درصد وظایف یادگیری غالب است. @perplexity_ai
  • مایکروسافت و شرکا GigaTIME را در مجله‌ی Cell منتشر کردند، یک ابزار هوش مصنوعی که پروتئومیکس فضایی را از اسلایدهای پاتولوژی روتین برای تحقیقات سرطان در مقیاس جمعیتی در ده‌ها نوع سرطان شبیه‌سازی می‌کند. @satyanadella
  • Waymo پیشرفته‌ترین کاربرد در مقیاس بزرگ هوش مصنوعی تجسم‌یافته را در رانندگی خودران نشان می‌دهد، با استفاده از تقطیر از مدل‌های بزرگتر برای ایجاد مدل‌های کارآمد محاسباتی در خودرو. @JeffDean
  • Stripe با Instacart همکاری می‌کند تا پرداخت مستقیم در ChatGPT را با استفاده از پروتکل Agentic Commerce و توکن‌های پرداخت مشترک Stripe برای مدیریت پرداخت امن فعال کند. @gdb
  • OpenAI با دویچه تلکام همکاری می‌کند تا هوش مصنوعی را به میلیون‌ها مشتری و کسب‌وکار در سراسر اروپا بیاورد. @gdb
  • Linker Vision از NVIDIA Metropolis، NVIDIA Cosmos و Omniverse در گردش کار شبیه‌سازی-آموزش-استقرار استفاده می‌کند تا به شهرها کمک کند با بینش‌های ویدئویی بلادرنگ از عوامل هوش مصنوعی هوشمندتر شوند. @NVIDIAAI
  • Fireworks AI با Kimi K2 که بر روی سیستم‌های NVIDIA GB200 NVL72 اجرا می‌شود، به بالاترین عملکرد در جدول رده‌بندی Artificial Analysis دست یافت و ارائه‌ی MoE عظیم را متحول کرد. @NVIDIAAI
  • Pryzm 12 میلیون دلار سری A را به رهبری a16z برای ساخت سیستم عامل هوش مصنوعی برای تدارکات فدرال جمع‌آوری کرد و ماه‌ها کار را در چند دقیقه با مجوز IL5 و FedRAMP High فشرده کرد. @a16z
  • Aradigm Health سری A را برای ساخت آینده‌ی پوشش مراقبت‌های بهداشتی با اولویت درمان جمع‌آوری کرد و درمان‌های سلولی و ژنی میلیون دلاری را با تجمیع ریسک و هماهنگی مسیرهای بیمار قابل دسترس کرد. @a16z
  • تح

اخبار هوش مصنوعی در 2025-12-08

مدل‌های جدید هوش مصنوعی

  • Gemini 3 Flash اکنون در LM Arena در دسترس است @legit_api
  • Zhipu AI سری GLM-4.6V را در Hugging Face منتشر کرد که شامل یک مدل زبان-بینایی پرچم‌دار 106B با 128K کانتکست و یک نسخه 9B Flash است و اولین قابلیت بومی فراخوانی تابع (Function Calling) را در خانواده مدل‌های بینایی GLM ارائه می‌دهد @Zai_org

تحلیل صنعت

  • OpenAI در گزارش هوش مصنوعی سازمانی خود اعلام کرد که حجم پیام‌های ChatGPT هشت برابر و مصرف توکن استدلال API به ازای هر سازمان 320 برابر نسبت به سال گذشته افزایش یافته است @AndrewCurran_
  • ChatGPT اکنون روزانه 2.5 میلیارد درخواست را پردازش می‌کند که تنها چند ماه پیش 1 میلیارد بود، و 70% از مصرف‌کنندگان اکنون ابزارهای هوش مصنوعی را برای توصیه‌ی محصول به جستجوی سنتی ترجیح می‌دهند @mehdiyarix
  • ترافیک جستجوی هوش مصنوعی 527% نسبت به سال گذشته رشد کرده است در حالی که جستجوی سنتی ثابت مانده است، که نگرانی‌هایی را برای برندهایی که دید هوش مصنوعی خود را ردیابی نمی‌کنند، ایجاد می‌کند @mehdiyarix
  • Skild AI، با حمایت آمازون و تأسیس‌شده توسط محققان سابق متا، در حال جذب دور جدیدی از سرمایه‌گذاری از NVIDIA و SoftBank با ارزش 14 میلیارد دلار است که ارزش آن از ماه ژوئن سه برابر شده است @AndrewCurran_
  • Anthropic و OpenAI به شدت در اروپا استخدام می‌کنند و 2 تا 3 برابر حقوق پایه مهندسان و محققان هوش مصنوعی در استارتاپ‌های هوش مصنوعی اتحادیه‌ی اروپا را با دفاتر در لندن و سوئیس ارائه می‌دهند @GergelyOrosz
  • Linear در حال تجربه‌ی رشد عظیمی در موارد استفاده‌ای است که توسعه‌دهندگان وظایف را به عامل‌های هوش مصنوعی مانند Cursor و Codex برای پیاده‌سازی واگذار می‌کنند و ردیاب‌های مسائل را به مراکز عامل هوش مصنوعی تبدیل می‌کنند @GergelyOrosz
  • Clay پس از شش سال به 100 میلیون دلار ARR می‌رسد، که در تنها دو سال از 1 میلیون دلار به 100 میلیون دلار رشد کرده است، با صفر ریزش مشتری سازمانی، بیش از 200% NRR سازمانی، و 15 برابر بازگشت سرمایه به ازای هر دلار سرمایه‌گذاری‌شده @vxanand
  • رشد استارتاپ Linear نشان می‌دهد که وقتی کارها درست پیش می‌روند، واقعاً درست پیش می‌روند، و درآمد امسال به تنهایی از تمام سال‌های گذشته بیشتر است @karrisaarinen
  • AWS S3 Vectors را برای ذخیره و استفاده از وکتورها در مقیاس عظیم راه‌اندازی می‌کند، که به طور بالقوه پایگاه‌های داده‌ی فقط وکتور را به چالش می‌کشد زیرا پایگاه‌های داده‌ی رابطه‌ای نیز از وکتور پشتیبانی می‌کنند @GergelyOrosz
  • وزارت بازرگانی صادرات H200 GPU به چین را با حمایت وزیر بازرگانی، هاوارد لوت‌نیک، تأیید کرد @AndrewCurran_
  • IBM Confluent را به مبلغ 11 میلیارد دلار برای تقویت ارائه‌ی داده‌های خود خریداری می‌کند @TechCrunch
  • Tiger Global آینده‌ی سرمایه‌گذاری خطرپذیر محتاطانه‌ای را با یک صندوق 2.2 میلیارد دلاری جدید برنامه‌ریزی می‌کند @TechCrunch
  • مطالعه‌ی آزمایشگاه بودجه‌ی ییل نشان می‌دهد که هوش مصنوعی بر اساس 33 ماه داده پس از انتشار ChatGPT، هیچ اختلال قابل توجهی در بازار کار ایجاد نکرده است، و هوش مصنوعی مسئول نیمی از رشد تولید ناخالص داخلی ایالات متحده است @DavidSacks
  • گزارش Challenger Gray در نوامبر نشان می‌دهد که اخراج‌های مرتبط با هوش مصنوعی 53% نسبت به اکتبر کاهش یافته است، که تنها 6,280 اخراج و فقط 4.7% از کل اخراج‌ها را در سال جاری تشکیل می‌دهد @DavidSacks
  • شکاف بهره‌وری بین دانشگاهیان مرد و زن پس از ChatGPT افزایش یافته است، که احتمالاً به دلیل استفاده‌ی بیشتر مردان از LLMها است @MishaTeplitskiy

اخلاق و جامعه

  • آزمایشگاه‌های هوش مصنوعی نگران استفاده از مدل‌های ویدیویی برای فریب سیاسی بودند، اما اصلی‌ترین استفاده‌ی گمراه‌کننده‌ی آن‌ها نشان دادن حیواناتی است که به روش‌های غیرممکن یا غیرطبیعی رفتار می‌کنند، و اکثر مردم این ویدیوها را واقعی می‌دانند @AndrewCurran_
  • رئیس جمهور ترامپ تأیید می‌کند که یک فرمان اجرایی «یک قانون هوش مصنوعی» این هفته برای ایجاد اولویت فدرال بر قوانین هوش مصنوعی ایالتی صادر خواهد شد، با هدف جلوگیری از مجموعه‌ای از 50 رژیم نظارتی مختلف @AndrewCurran_
  • دیوید ساکس، مدیر ارشد هوش مصنوعی، از رویکرد «یک کتاب قانون» دفاع می‌کند و استدلال می‌کند که بیش از 1200 لایحه در مجالس ایالتی معرفی شده است و بیش از 100 اقدام قبلاً تصویب شده است، که هرج و مرج نظارتی ایجاد می‌کند که می‌تواند نوآوری را متوقف کرده و به چین اجازه دهد پیشتاز شود @AndrewCurran_
  • ایالت‌هایی مانند کلرادو، کالیفرنیا و ایلینوی توسعه‌دهندگان هوش مصنوعی را مسئول تبعیض الگوریتمی تعریف‌شده به عنوان تأثیر نامتناسب بر گروه‌های محافظت‌شده قرار داده‌اند، که لیست کلرادو شامل مهارت زبان انگلیسی نیز می‌شود @AndrewCurran_
  • گروه‌های محیط زیست خواستار توقف ساخت مراکز داده‌ی جدید شده‌اند و نگرانی‌هایی را در مورد تأثیر زیست محیطی زیرساخت‌های هوش مصنوعی مطرح کرده‌اند @TechCrunch
  • سخنرانی کوری دکترو در مورد شک و تردید نسبت به هوش مصنوعی مفهوم سانتور در مقابل سانتور معکوس را معرفی می‌کند: سانتور به معنای انسانی است که هوش مصنوعی را برای افزایش مهارت‌ها کنترل می‌کند، در حالی که سانتور معکوس به معنای سیستمی از هوش مصنوعی است که انسان را هدایت و کنترل می‌کند @simonw
  • وزارت جنگ یک کمیته‌ی راهبری آینده‌ی هوش مصنوعی را با هدف صریح توسعه‌ی پیش‌بینی‌ها، برنامه‌ها و سیاست‌های AGI تأسیس می‌کند @deanwball

کاربردها

  • Google DeepMind اپلیکیشن Lyria Camera را راه‌اندازی می‌کند که از Gemini برای توصیف محیط اطراف استفاده می‌کند در حالی که مدل Lyria RealTime آن درخواست‌ها را به جریان‌های موسیقی در حال تکامل مداوم تبدیل می‌کند @GoogleDeepMind
  • Instacart با ChatGPT ادغام می‌شود و به کاربران امکان می‌دهد بدون خروج از رابط ChatGPT مواد غذایی بخرند @TechCrunch
  • Hinge ویژگی جدید هوش مصنوعی را برای کمک به قرار ملاقات‌کنندگان برای فراتر رفتن از صحبت‌های کوچک خسته‌کننده راه‌اندازی می‌کند @TechCrunch
  • Adobe مرکز ایجاد محتوا را در Premiere mobile برای سازندگان YouTube Shorts راه‌اندازی می‌کند @TechCrunch
  • Anthropic اعلام می‌کند که Claude Code به Slack می‌آید، که نشان‌دهنده‌ی یک ادغام مهم برای گردش کارهای سازمانی است @TechCrunch
  • Thales با Cohere برای توسعه‌ی راه‌حل‌های پیشرفته‌ی هوش مصنوعی برای پشتیبانی در خدمت نیروی دریایی و دریایی در کانادا همکاری می‌کند، با استفاده از ابزارهای هوش مصنوعی عامل‌محور برای تجزیه و تحلیل و انطباق با محیط‌های پیچیده و پویا در زمان واقعی @ThalesCanada
  • پادکست WonderWise از هوش مصنوعی برای تبدیل سوالات علمی کودکان به آهنگ‌های آموزشی استفاده می‌کند، با ترکیب محتوای تولیدشده توسط هوش مصنوعی با روایت انسانی برای ایجاد تجربه‌های یادگیری جذاب @Aalefsrajabali
  • هکاتون xAI کاربردهای متنوع هوش مصنوعی را به نمایش می‌گذارد، از جمله Halftime که به طور پویا تبلیغات تولیدشده توسط هوش مصنوعی را در صحنه‌ها می‌بافد، GrokMarks برای سازماندهی خودکار نشانک‌های X، و Haggle یک عامل صوتی خودمختار برای مذاکره با ارائه‌دهندگان خدمات @xai
  • Clay یک مسیر شغلی و اقتصاد جدید در اطراف مهندسی GTM ایجاد می‌کند، با هزاران شغل باز و صدها آژانس که حول آن ساخته شده‌اند، بسیاری از کارآفرینان برای اولین بار کسب و کارهای 7 رقمی می‌سازند @vxanand
  • Nano Banana Pro جیمینی می‌تواند تصاویر را با آپلود ساده و تعیین نسبت ابعاد دلخواه تغییر اندازه دهد، که کاربرد عملی هوش مصنوعی را نشان می‌دهد @GeminiApp

پژوهش‌ها

  • AxiomProver به طور خودمختار 8 از 12 مسئله‌ی Putnam 2025 را در Lean تا ساعت 3:58 بعد از ظهر در روز مسابقه حل کرد، نمره‌ای که رتبه‌ی 4 را از حدود 4000 شرکت‌کننده کسب می‌کرد و وضعیت Putnam Fellow را به دست می‌آورد @CarinaLHong
  • تحقیقات در مورد پرامپتینگ شخصیت نشان می‌دهد که گفتن به هوش مصنوعی که «شما یک فیزیکدان بزرگ هستید» دقت آن را در پاسخ به سوالات فیزیک به طور قابل توجهی افزایش نمی‌دهد، که نشان می‌دهد شخصیت‌ها دقت را بهبود نمی‌بخشند اما ممکن است فرمت خروجی را تغییر دهند @emollick
  • مطالعه نشان می‌دهد که LLMهای بالینی می‌توانند امتحانات پزشکی را با 84-90% دقت با موفقیت پشت سر بگذارند، اما در وظایف بالینی واقعی با 45-69% و ارزیابی‌های ایمنی با 40-50% عملکرد ضعیفی دارند، که نشان می‌دهد معیارهای سبک امتحان، معیارهای گمراه‌کننده‌ای برای آمادگی بالینی هستند @rohanpaul_ai
  • Unconventional AI 475 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z برای مقابله با هدف بزرگ ساخت تراشه‌های هوش مصنوعی-محور که 1000 برابر کارآمدتر هستند، با هدف کارایی در مقیاس بیولوژیکی در 20 سال آینده، جذب می‌کند <a href="https://x.com/N

اخبار هوش مصنوعی در 2025-12-07

مدل‌های جدید هوش مصنوعی

  • گوگل جمینای 3 پرو را به‌عنوان مدل هوش مصنوعی بینایی پیشرفته معرفی کرد که به بهترین عملکرد در تمام معیارهای اصلی بینایی و چندوجهی دست یافته و در وظایف درک سند، صفحه نمایش، تصویر، ویدئو و فضایی عالی عمل می‌کند. @demishassabis
  • رکا ای‌آی مدل‌های پایه و دستورالعمل 8B پارامتری Rnj-1 را منتشر کرد که به عملکرد SWE-bench نزدیک به GPT-4o، استفاده از ابزار با عملکرد بهتر از مدل‌های متن‌باز مشابه، و استدلال ریاضی در AIME'25 تقریباً برابر با GPT OSS MoE 20B دست یافته است. @ashVaswani

تحلیل صنعت

  • ایلان ماسک مراکز داده‌ی هوش مصنوعی مبتنی بر فضا را با ماهواره‌هایی که دارای محاسبات هوش مصنوعی محلی در مدار خورشیدآهنگ هستند، پیشنهاد می‌کند و پیش‌بینی می‌کند که این روش در عرض 3 سال به کم‌هزینه‌ترین راه برای تولید هوش مصنوعی و در عرض 4 سال به سریع‌ترین راه برای مقیاس‌بندی تبدیل خواهد شد، با برنامه‌هایی برای مقیاس‌بندی به بیش از 100TW/سال با استفاده از کارخانه‌های ماهواره‌ای قمری. @elonmusk
  • اوپن‌ای‌آی پس از بازخورد کاربران، پیشنهادهای برنامه‌ای را که شبیه به تبلیغات بودند، غیرفعال کرد. @TechCrunch
  • متا گزارشاً عرضه‌ی عینک‌های واقعیت ترکیبی را تا سال 2027 به تعویق انداخت. @TechCrunch
  • پرپلکسیتی سومین سالگرد راه‌اندازی خود را با استفاده از OpenAI GPT-3.5 و مایکروسافت بینگ برای پاسخگویی مستقیم به سؤالات جشن می‌گیرد. @AravSrinivas

اخلاق و جامعه

  • آندری کارپاتی به کاربران توصیه می‌کند که LLMها را به جای موجودیت‌ها، شبیه‌ساز در نظر بگیرند و توضیح می‌دهد که وقتی از آن‌ها پرسیده می‌شود «نظر شما در مورد xyz چیست؟»، هیچ «شما» واقعی وجود ندارد - مدل یک بردار جاسازی شخصیت را از آمار داده‌های تنظیم دقیق خود اتخاذ می‌کند، نه اینکه نظرات واقعی را در طول زمان شکل داده باشد. @karpathy
  • تحقیقات دانیل کانمن در سال 2017 پیش از LLMها نشان می‌دهد که هر زمان که ممکن است، انسان‌ها را با الگوریتم‌ها جایگزین کنیم، و اشاره می‌کند که حتی زمانی که الگوریتم‌ها عملکرد فوق‌العاده‌ای ندارند، انسان‌ها آنقدر ضعیف و با نویز عمل می‌کنند که تنها حذف نویز نتایج بهتری نسبت به عملکرد انسان به همراه دارد. @jamescham
  • ایتان مولیک این سؤال را مطرح می‌کند که آیا نشریات اصلی پس از تجربه‌های روتر GPT-5، بازنگری‌هایی در مورد ادعاهای فلات توسعه‌ی هوش مصنوعی ارائه کرده‌اند یا خیر، و اشاره می‌کند که با وجود شواهدی مبنی بر غلبه بر موانعی مانند فروپاشی مدل و مقیاس‌بندی پیش‌آموزشی، سردرگمی همچنان ادامه دارد. @emollick

کاربردها

  • قابلیت Claude Skill به Opus 4.5 امکان می‌دهد تا اینفوگرافیک‌هایی به سبک اپل با مشخصات طراحی بسیار فنی تولید کند، با استفاده از پرامپت‌هایی که توسط Grok 4.1 تولید شده‌اند تا مانند استیو جابز طراحی گرافیک فکر کند. @deedydas
  • یک متخصص الکتروفیزیولوژی قلب از یک گردش کار هوش مصنوعی ترکیبی از Claude، Suno و NanoBanana برای ساخت آهنگ‌های آموزشی برای کودکان 4 و 7 ساله استفاده می‌کند، که کاربردهای خلاقانه‌ای را نشان می‌دهد که بدون هوش مصنوعی کاملاً غیرممکن بودند. @HamelHusain
  • محققان MIT یک استراتژی مبتنی بر هوش مصنوعی برای تقویت مواد پلیمری توسعه می‌دهند که به طور بالقوه منجر به پلاستیک‌های بادوام‌تر و کاهش زباله‌های پلاستیکی می‌شود. @MIT
  • ویکی‌پدیا لیستی از نشانه‌های نوشتاری هوش مصنوعی از جمله موازی‌سازی‌های منفی مانند «این یک بازی نیست. این یک انقلاب است» را نگهداری می‌کند که می‌توان آن‌ها را در پرامپت‌های سیستمی گنجاند تا از متن‌هایی که شبیه به هوش مصنوعی هستند، جلوگیری شود. @blader

پژوهش‌ها

  • نتایج اولین چالش BEHAVIOR در NeurIPS اعلام شد، که راه‌حل‌های هوش مصنوعی تجسم‌یافته و رباتیک را در 50 وظیفه‌ی چالش‌برانگیز خانگی ارزیابی می‌کند، با کسب مقام اول توسط Robot Learning Collective، و پس از آن تیم‌های Comet و SimpleAI. @drfeifei
  • AI2 تحقیقات پس از آموزش OLMo 3 را ارائه می‌دهد که بر اهمیت روش‌های ارزیابی در توسعه‌ی هوش مصنوعی در کارگاه NeurIPS Foundations of Reasoning in Language Models تأکید می‌کند. @natolambert
  • کارگاه NeurIPS در مورد Foundations of Reasoning in Language Models شامل سخنرانی‌هایی در مورد خودبهبودی، اکتشاف، زنجیره‌ی فکری و موضوعات مرتبط است. @canondetortugas

اخبار هوش مصنوعی در 2025-12-06

مدل‌های جدید هوش مصنوعی

  • Essential AI مدل Rnj-1 را منتشر می‌کند، یک جفت مدل پایه و دستورالعمل 8 میلیارد پارامتری که عملکردی نزدیک به GPT-4o در SWE-bench، استفاده از ابزاری بهتر از مدل‌های متن‌باز مشابه، و استدلال ریاضی در AIME 2025 تقریباً برابر با GPT OSS MoE 20B را به دست می‌آورد @ashVaswani
  • گوگل Gemini 3 Pro و Nano Banana Pro را در جستجوی گوگل از طریق حالت هوش مصنوعی که به کشورهای بیشتری به زبان انگلیسی گسترش یافته است، معرفی می‌کند @GoogleAI
  • گوگل حالت Deep Think را در برنامه Gemini برای مشترکین Google AI Ultra به‌روزرسانی می‌کند و قابلیت‌های استدلال را با بررسی همزمان فرضیه‌های متعدد بهبود می‌بخشد @GoogleAI
  • مدل‌های Nemotron انویدیا با Amazon Bedrock یکپارچه شده‌اند، با پذیرندگان اولیه مانند CrowdStrike که عامل‌های امنیتی را تقویت می‌کنند و BridgeWise AI که بینش‌های مالی را ارائه می‌دهد @NVIDIAAI
  • گزارش‌ها حاکی از آن است که پاسخ کد قرمز GPT-5.2 اوپن‌ای‌آی به گوگل در 9 دسامبر، زودتر از برنامه‌ریزی اولیه، ارائه خواهد شد @apples_jimmy

تحلیل صنعت

  • متا استارتاپ دستگاه‌های هوش مصنوعی Limitless را خریداری می‌کند و قابلیت‌های سخت‌افزاری هوش مصنوعی خود را گسترش می‌دهد @TechCrunch
  • استارتاپ تحقیقات مصنوعی هوش مصنوعی Aaru در سری A با ارزش‌گذاری 1 میلیارد دلاری سرمایه جذب می‌کند @TechCrunch
  • استارتاپ سابق گوگل Yoodli ارزش خود را به بیش از 300 میلیون دلار سه برابر می‌کند، با هوش مصنوعی که برای کمک به مردم ساخته شده است نه جایگزینی آن‌ها @TechCrunch
  • اسپیس‌ایکس طبق گزارش‌ها در حال مذاکره برای فروش ثانویه با ارزش‌گذاری 800 میلیارد دلاری است که آن را به باارزش‌ترین شرکت خصوصی آمریکا تبدیل می‌کند @TechCrunch
  • چشم‌انداز جبران خسارت مهندسی در منطقه خلیج نشان می‌دهد که مهندسان اوپن‌ای‌آی و Anthropic بسته‌های چند میلیون دلاری دریافت می‌کنند، در حالی که مهندسان استارتاپ‌های هوش مصنوعی با 200 هزار دلار برای پرامپت کردن LLMها تلاش می‌کنند و پس از انتشار مدل‌های جدید دوباره شروع می‌کنند @deedydas
  • پردازنده‌های گرافیکی NVIDIA RTX PRO 6000 99% از صحنه‌های پیکسار را با RenderMan XPU رندر خواهند کرد و گردش کار پیکسار را برای Toy Story 5 با صحنه‌های بزرگ‌تر و رندر سریع‌تر تغییر می‌دهند @NVIDIAAI

اخلاق و جامعه

  • تحقیقات نشان می‌دهد که تبلیغات تولیدشده توسط هوش مصنوعی 19% بهتر از تبلیغات ساخته‌شده توسط انسان در نرخ کلیک عمل می‌کنند، اما افشای استفاده از هوش مصنوعی منجر به کاهش 32% عملکرد می‌شود که سؤالاتی را در مورد الزامات شفافیت ایجاد می‌کند @AndrewCurran
  • ایتان مولیک اشاره می‌کند که تبلیغات بصری ساخته‌شده توسط هوش مصنوعی 20% بیشتر از تبلیغات متخصصان انسانی کلیک دریافت کرده‌اند، اما افشای ساخت توسط هوش مصنوعی عملکرد را به 31% کمتر از تبلیغات ساخته‌شده توسط انسان کاهش داده است @emollick
  • نیک تورلی از اوپن‌ای‌آی توضیح می‌دهد که هیچ آزمایش زنده‌ای برای تبلیغات در ChatGPT وجود ندارد و بیان می‌کند که هرگونه اجرای تبلیغاتی در آینده با رویکردی متفکرانه و با احترام به اعتماد کاربر انجام خواهد شد @nickaturley
  • ایتان مولیک نگرانی‌هایی را در مورد عدم شفافیت xAI در مورد رویکردهای آن‌ها به هوش مصنوعی، اقدامات حفاظتی و معنای حقیقت‌جویی مطرح می‌کند، که به‌ویژه برای استفاده سازمانی مهم است @emollick
  • مولیک به یافته‌های عجیب در کارت مدل Grok 4.1 اشاره می‌کند، از جمله افزایش نرخ چاپلوسی و نمرات بالای فریب در مقایسه با سایر مدل‌ها @emollick
  • اندرو کارن پیش‌بینی می‌کند که دولت‌ها برای قانون‌گذاری پنهانی در ربات‌های خانگی فشار خواهند آورد و کدهای اجباری برای مقامات را درخواست خواهند کرد، با وجود اینکه شهروندان ممکن است منابع خود را برای امنیت محلی جمع‌آوری کنند @AndrewCurran
  • کیت رابویس، شریک مدیریت Khosla Ventures، ایمنی هوش مصنوعی را یک فریب کامل می‌نامد و بیان می‌کند که این بوروکرات‌ها هستند که بهانه‌هایی برای دخالت در پیشرفت پیدا می‌کنند @tbpn
  • آماندا اسکل تأیید می‌کند که Claude بر روی یک سند هم‌ترازی واقعی در یادگیری نظارت‌شده آموزش دیده است و نسخه کامل و جزئیات آن به زودی منتشر خواهد شد @alexgraveley

کاربردها

  • Perplexity Finance ویژگی نمودارهای تمام‌صفحه را راه‌اندازی می‌کند @AravSrinivas
  • برنامه موبایل NotebookLM به‌روزرسانی‌هایی از جمله Slide Decks و Infographics، تصاویر به عنوان منابع، و پیشرفت ذخیره‌شده در Audio Overview را دریافت می‌کند @GoogleAI
  • Google Workspace Studio راه‌اندازی می‌شود و به مشترکین امکان می‌دهد کار را از وظایف ساده تا فرآیندهای پیچیده با عامل‌های هوش مصنوعی سفارشی خودکار کنند @GoogleAI
  • بری مک‌کاردل، مدیرعامل Hex، در مورد چگونگی تغییر تعامل داده‌ها توسط هوش مصنوعی از طریق فضاهای کاری تحلیلی مشارکتی، گردش کار عامل‌ها و رابط‌های مکالمه‌ای بحث می‌کند @sarahdingwang
  • CrowdStrike عامل‌های امنیتی پیشرفته را در Charlotte AI AgentWorks با استفاده از مدل‌های NVIDIA Nemotron تقویت می‌کند @NVIDIAAI

پژوهش‌ها

  • Gemini 3 Pro گوگل عملکرد چندوجهی پیشرفته‌ای را در درک اسناد، صفحه نمایش، فضایی و ویدئو نشان می‌دهد، با قابلیت‌هایی برای تبدیل اسناد پیچیده به کد ساختاریافته و تولید مسیرهای بدون برخورد برای رباتیک @googleaidevs
  • جف دین استدلال بصری Gemini 3 Pro را با حاشیه‌نویسی بهبود عملکرد در مقابل مدل‌های رقیب نشان می‌دهد و افزایش دقت نسبی زیادی را در معیارهای مختلف نشان می‌دهد @JeffDean
  • پروفسور یجین چوی از استنفورد تحقیقاتی را در مورد همکاری پنهان در سیستم‌های چندعاملی ارائه می‌دهد و در مورد پیش‌بینی‌های هوش مصنوعی 2026 در NeurIPS 2025 بحث می‌کند @NVIDIAAIDev
  • مقاله تحقیقاتی Colors of Growth رویکرد جدیدی را برای اندازه‌گیری رشد اقتصادی بلندمدت با تجزیه و تحلیل تغییرات سیستماتیک در استفاده از رنگ در نقاشی‌های اروپایی از 1600 تا 1820 توسعه می‌دهد @emollick
  • ایتان مولیک روندهای هوش مصنوعی 2025 را خلاصه می‌کند: عدم کاهش سرعت در دستاوردهای نمایی، ناهمواری همچنان مشکل اصلی است، گزارش‌های اولیه بازگشت سرمایه مثبت، GenAI به سطح صنعت رسید، و هوش مصنوعی اساساً عجیب باقی می‌ماند @emollick
  • کارگاه Deep Learning for Code در NeurIPS 2025 بر عامل‌های کد در عصر عامل‌ها با سخنرانانی از جمله گراهام نوبیگ و داون سانگ تمرکز دارد @Alibaba_Qwen
  • محقق استنفورد اشاره می‌کند که موفقیت یادگیری عمیق مستلزم درست انجام دادن 98% جزئیات است، با چند جزئیات آخر که تأثیر بسیار غیرخطی دارند @arimorcos

اخبار هوش مصنوعی در 2025-12-05

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-TTS (نسخه‌ی 2025-11-27) را با بیش از 49 صدای باکیفیت، پشتیبانی از 10 زبان و لهجه‌های اصیل چینی، با ریتم طبیعی و قابلیت تنظیم سرعت منتشر کرد @Alibaba_Qwen
  • گوگل دیپ‌مایند اعلام کرد که Gemini 3 Deep Think اکنون برای مشترکین Google AI Ultra در دسترس است و فناوری‌های برنده مدال طلای IMO و ICPC را با قابلیت‌های تفکر موازی برای مسائل پیچیده‌ی ریاضی و علمی ترکیب می‌کند @demishassabis
  • گوگل Gemini 3 Pro را به عنوان پیشگام هوش مصنوعی چندوجهی منتشر کرد که عملکردی پیشرفته در درک اسناد، صفحه نمایش، فضا و ویدئو ارائه می‌دهد و قابلیت "derender" اسناد پیچیده را به کد ساختاریافته دارد @googleaidevs
  • انویدیا CUDA 13.1 را معرفی کرد، بزرگترین توسعه‌ی CUDA از زمان عرضه‌ی آن در سال 2006، که CUDA Tile را برای آسان‌تر کردن هوش مصنوعی قدرتمند و محاسبات شتاب‌یافته برای توسعه‌دهندگان بیشتر معرفی می‌کند @nvidianewsroom
  • MBZUAI K2-V2 را منتشر کرد، یک LLM با 70 میلیارد پارامتر که از ابتدا به عنوان پایه‌ای برتر برای تطبیق استدلال ساخته شده است، با 512K کانتکست بومی و شفافیت کامل شامل دستورالعمل‌های مجموعه داده، نقاط بازرسی میانی آموزش و ابزارهای ارزیابی @mbzuai
  • مایکروسافت همراه Mico را برای حالت صوتی در Copilot معرفی کرد که اکنون برای کاربران در بریتانیا و کانادا در دسترس است @mustafasuleyman
  • گوگل ریسرچ Titans را در NeurIPS 2025 ارائه کرد، یک معماری جدید که سرعت RNNها را با عملکرد ترنسفورمرها ترکیب می‌کند و از حافظه‌ی عصبی عمیق برای مقیاس‌پذیری مؤثر به کانتکست‌های بزرگتر از 2 میلیون توکن استفاده می‌کند @GoogleResearch

تحلیل صنعت

  • بر اساس گزارش‌های رسانه‌ای، OpenAI و Anthropic رشد درآمد بی‌سابقه‌ای را تجربه می‌کنند که قبلاً توسط هیچ شرکتی در تاریخ بشر دیده نشده است @deedydas
  • رشد کاربران ChatGPT طبق یافته‌های گزارش جدید کند شده است @TechCrunch
  • اسپیس‌ایکس در حال مذاکره برای فروش سهام ثانویه است که ارزش آن را به 800 میلیارد دلار می‌رساند و احتمالاً دوباره آن را به باارزش‌ترین شرکت خصوصی ایالات متحده تبدیل می‌کند و از OpenAI پیشی می‌گیرد @AndrewCurran_
  • اسپیس‌ایکس قصد دارد در سال 2026 وارد بورس شود و دیگر Starlink را جدا نخواهد کرد @Katie_Roof
  • سیرا با همکاری سافت‌بانک دفتری در توکیو افتتاح می‌کند تا به ژاپن گسترش یابد @btaylor
  • SiriusXM اولین کسب‌وکاری است که پلتفرم داده‌ی عامل (ADP) سیرا را به کار می‌گیرد و به عامل پشتیبانی مشتری هوش مصنوعی خود، هارمونی، حافظه و کانتکست برای روابط طولانی‌مدت و پیشگیرانه می‌دهد @btaylor
  • بزرگترین بانک برزیل، Itau، Devin را در کل SDLC خود با بیش از 17000 مهندس به کار گرفت و به پروژه‌های مهاجرت 5-6 برابر سریع‌تر، 70% ترمیم خودکار آسیب‌پذیری‌های امنیتی، 2 برابر پوشش تست و مستندسازی بیش از 300 هزار مخزن دست یافت @cognition
  • نتفلیکس در جنگ مزایده برای خرید Warner Bros. Discovery پیروز شد و 30 دلار به ازای هر سهم و 5 میلیارد دلار هزینه‌ی فسخ قرارداد پیشنهاد داد، اگرچه فروش به دلیل نگرانی‌های احتمالی وزارت دادگستری در مورد ضد انحصار هنوز نهایی نشده است @DiscussingFilm
  • محققان مایکروسافت نوآوری‌های علمی از جمله Majorana 1 (اولین پردازنده‌ی کوانتومی جهان با کیوبیت‌های توپولوژیک)، Aurora برای پیش‌بینی آب و هوای شدید و FCDD برای بهبود تشخیص زودهنگام سرطان سینه را معرفی کردند @Microsoft

اخلاق و جامعه

  • آماندا اسکل از Anthropic در اولین جلسه‌ی پرسش و پاسخ خود به بحث در مورد سؤالات فلسفی درباره‌ی هوش مصنوعی از جمله اخلاق، هویت، آگاهی، رفاه مدل و اینکه آیا مدل‌ها تصمیمات فوق‌العاده اخلاقی می‌گیرند، پرداخت @AnthropicAI
  • آزمایش‌های گسترده در بریتانیا، ایالات متحده و لهستان نشان داد که چت‌بات‌های هوش مصنوعی در متقاعدسازی بسیار خوب عمل می‌کنند، عمدتاً با ارائه‌ی تعداد زیادی ادعای مبتنی بر واقعیت، با اثرات متقاعدسازی که در طول زمان باقی می‌ماند و هوش مصنوعی با بزرگتر شدن مدل‌ها متقاعدکننده‌تر می‌شود @emollick
  • پژوهش‌ها نشان می‌دهد که خودانگاره یا خودپنداره‌ی یک مدل تأثیر واقعی بر نحوه‌ی تعمیم رفتار آن به تنظیمات جدید دارد @sleepinyourhat
  • جیمز زو، عضو هیئت علمی Stanford HAI، اشاره می‌کند که هوش مصنوعی باید باورهای غلط و تصورات اشتباه را تشخیص داده و به رسمیت بشناسد، و این را به عنوان یک شکاف بزرگ در مدل‌های فعلی شناسایی می‌کند @StanfordHAI
  • یان لایک از Anthropic فاش کرد که محققان هم‌ترازی عمیقاً در پس از آموزش برای Opus 4.5 مشارکت دارند و آزادی عمل قابل توجهی برای ایجاد تغییرات دارند که به بهترین مدل هم‌تراز شده کمک می‌کند @janleike
  • محققان Media Lab توانایی LLMها را در شبیه‌سازی شادی انسان و رفاه ذهنی ارزیابی کردند و دریافتند که در حالی که سیستم‌های هوش مصنوعی می‌توانند الگوهای گسترده‌ی رضایت از زندگی جهانی را بازتولید کنند، دارای سوگیری‌های ساختاری عمیقی هستند که خطر پنهان کردن واقعیت‌های زندگی میلیون‌ها نفر را به همراه دارد @medialab
  • نیویورک تایمز از Perplexity به دلیل نقض حق کپی‌رایت شکایت می‌کند @TechCrunch
  • مانیفست Resonant Computing منتشر شد که از نرم‌افزار مبتنی بر هوش مصنوعی فوق‌العاده شخصی‌سازی شده حمایت می‌کند که از الگوهای ضد ربایش توجه که دهه‌ی گذشته‌ی طراحی نرم‌افزار را تعریف کردند، اجتناب می‌کند @komorama

کاربردها

  • Cursor با به‌روزرسانی پرامپت‌ها، تنظیم تعاریف ابزار و ارائه‌ی ابزارهای جدیدی مانند جستجوی معنایی، جدیدترین مدل Codex را برای اجرا در پلتفرم خود بهینه می‌کند @leerob
  • Gradium AI API STT + TTS بلادرنگ خود را به ربات Reachy Mini متصل کرد و یک ربات مکالمه‌ای زنده و بدون اسکریپت با صدا، شخصیت، زبان و حرکات که همگی توسط گفتار کنترل می‌شوند، ایجاد کرد @GradiumAI
  • Perplexity همکاری با کریستیانو رونالدو را آغاز کرد، با سرمایه‌گذاری این اسطوره‌ی فوتبال در شرکت و یک صفحه‌ی اختصاصی که زندگی او را بررسی می‌کند @Cristiano
  • دایرکتوری ادغام‌های Linear اکنون شامل چندین عامل هوش مصنوعی برای وظایف مهندسی از جمله Tembo، Sentry، Codegen، Cursor، Factory AI، GitHub Copilot، OpenAI Codex و Cognition Devin است @karrisaarinen
  • HHS استراتژی هوش مصنوعی را برای پیشبرد پذیرش سریع هوش مصنوعی در سراسر وزارتخانه با مدرن‌سازی فرآیندها، کاهش بوروکراسی، با کاربردهای آینده از جمله تسریع تأییدیه‌های FDA، مبارزه با کلاهبرداری در CMS و ساده‌سازی بررسی کمک‌های مالی منتشر کرد @HHS_Jim

پژوهش‌ها

  • Gemini 3 Pro به عملکردی پیشرفته در جدول رده‌بندی تولید SVG دست یافت و به عنوان قدرتمندترین مدل برای تولید SVGهای منسجم و بصری جذاب رتبه‌بندی شد @lintool
  • محققان MIT یک ربات هوایی کوچک توسعه دادند که می‌تواند با سرعت و چابکی قابل مقایسه با برخی حشرات پرواز کند و راه را برای ربات‌های آینده به اندازه‌ی حشرات برای مأموریت‌های جستجو و نجات باز می‌کند @MIT
  • ARC Prize 2025 برندگان را اعلام کرد که جایزه‌ی بزرگ بدون مدعی باقی ماند و سال 2025 را به عنوان سال حلقه‌ی پالایش با پیشرفت‌های چشمگیر در حلقه‌های پالایش مبتنی بر LLM و ظهور رویکردهای یادگیری عمیق بدون پیش‌آموزش مانند HRM و TRM نشان داد @arcprize
  • انویدیا استنتاج را به عنوان موتور اقتصادی اصلی کارخانه‌ی هوش مصنوعی معرفی کرد، با بهینه‌سازی در سطح سیستم که 10 برابر افزایش عملکرد را برای معماری‌های استنتاج در مقیاس بزرگ مانند ترکیب متخصصان ارائه می‌دهد @NVIDIADC
  • OpenRouter مطالعه‌ی تجربی 100 تریلیون توکن را منتشر کرد که الگوهای استفاده در مدل‌های هوش مصنوعی را نشان می‌دهد، با برنامه‌نویسی و نقش‌آفرینی به عنوان موارد استفاده‌ی غالب @AnjneyMidha
  • NVIDIA NeMo Automodel، یک کتابخانه‌ی منبع باز در چارچوب NVIDIA NeMo، اکنون به توسعه‌دهندگان امکان می‌دهد مدل‌های MoE در مقیاس بزرگ را مستقیماً در PyTorch با استفاده از ابزارهای آشنا آموزش دهند @PyTorch
  • یجین چوی سخنرانی اصلی خود را در NeurIPS 2025 در مورد استدلال عقل سلیم و درک زبان ارائه داد و خواستار راهی جدید برای سازمان‌ها و افراد برای ساخت مشترک مرز باز هوش مصنوعی شد که در آن همه بتوانند مشارکت کرده و از آن بهره‌مند شوند @LaudeInstitute

اخبار هوش مصنوعی در 2025-12-04

مدل‌های جدید هوش مصنوعی

  • گوگل حالت «Gemini 3 Deep Think» را برای مشترکین Ultra منتشر کرد. این حالت با استفاده از تفکر موازی، فرضیه‌های متعددی را به‌طور همزمان بررسی می‌کند تا استدلال در مسائل پیچیده‌ی ریاضی، علمی و برنامه‌نویسی بهبود یابد. این مدل در بنچمارک‌های «آخرین امتحان بشریت» و «ARC-AGI-2» از «Gemini 3 Pro» پیشی گرفته و در المپیاد جهانی ریاضی و فینال جهانی مسابقات برنامه‌نویسی دانشگاهی به استاندارد مدال طلا دست یافته است @GoogleDeepMind، @JeffDean
  • اوپن‌ای‌آی مدل «Codex» را راه‌اندازی کرد که اکنون در Cursor با یک عامل بهینه‌شده در دسترس است و تا ۱۱ دسامبر رایگان خواهد بود @cursor_ai
  • آنتروپیک مدل «Claude Opus 4.5» را برای کاربران Claude Code با حساب‌های Pro منتشر کرد. این مدل به عنوان مدل پیشرو در برنامه‌نویسی و استثنایی در کارهای پیچیده‌ی کدنویسی توصیف شده است @_catwu
  • Mistral Large 3 به عنوان مدل کدنویسی متن‌باز شماره یک در جدول رده‌بندی Arena معرفی شد @MistralAI
  • گوگل «Nano Banana Pro» را با رزولوشن 2k منتشر کرد که به جایگاه شماره یک در جدول رده‌بندی ویرایش تصویر lmarena دست یافت @JeffDean
  • مایکروسافت مدل «VibeVoice-Realtime-0.5B» را منتشر کرد @_akhaliq
  • تیم Qwen علی‌بابا اعلام کرد که اجرای FP8 RL تنها با ۵ گیگابایت VRAM امکان‌پذیر است @Alibaba_Qwen

تحلیل صنعت

  • آنتروپیک یک همکاری چندساله به ارزش ۲۰۰ میلیون دلار با Snowflake امضا کرد که Claude را برای بیش از ۱۲,۶۰۰ مشتری Snowflake برای تحلیل داده‌های سازمانی در دسترس قرار می‌دهد و در عین حال استانداردهای امنیتی را حفظ می‌کند @AnthropicAI
  • گوگل یک همکاری چندساله با Replit اعلام کرد که همکاری آن‌ها را در فضای ابزارهای توسعه‌دهنده گسترش می‌دهد @AndrewCurran_
  • استارتاپ حقوقی هوش مصنوعی Harvey، ارزش ۸ میلیارد دلاری خود را در دور تامین مالی سری F به رهبری a16z Growth تایید کرد. این شرکت در حال حاضر توسط بیش از نیمی از ۱۰۰ شرکت برتر AmLaw استفاده می‌شود @TechCrunch
  • Palo Alto Networks شرکت Chronosphere را به مبلغ ۳.۳ میلیارد دلار خریداری کرد که نشان‌دهنده‌ی یک خروج قابل توجه برای این استارتاپ نظارتی است که بر اساس موتور M3 اوبر ساخته شده بود @GergelyOrosz
  • Cambricon قصد دارد در سال ۲۰۲۶، ۵۰۰,۰۰۰ شتاب‌دهنده را عرضه کند که بیش از سه برابر تعداد عرضه شده در سال جاری است و نشان‌دهنده‌ی گسترش عمده در سخت‌افزار هوش مصنوعی است @AndrewCurran_
  • لایحه‌ی دوحزبی برای جلوگیری از فروش تراشه‌های پیشرفته‌ی انویدیا از جمله «H200s» و «Blackwells» به چین تا سال ۲۰۲۸ ارائه شد @AndrewCurran_
  • متا طبق گزارش‌ها قصد دارد بودجه‌ی متاورس را تا ۳۰ درصد کاهش دهد @TechCrunch
  • کریستیانو رونالدو سرمایه‌گذاری در Perplexity را اعلام کرد و بر کنجکاوی به عنوان یک نیاز برای عظمت تاکید کرد @Cristiano
  • یک مدیر اجرایی فناوری گزارش می‌دهد که از هوش مصنوعی برای نمونه‌سازی کدنویسی استفاده می‌کند، اما همچنان به تیمی متشکل از چندین توسعه‌دهنده برای پیاده‌سازی آن‌ها در نرم‌افزار تولیدی قابل اجرا نیاز دارد، که نشان می‌دهد هوش مصنوعی مکمل توسعه‌دهندگان حرفه‌ای است و جایگزین آن‌ها نیست @GergelyOrosz
  • مطالعه‌ی مک‌کینزی نشان می‌دهد که بسیاری از سازمان‌ها در حال پذیرش عوامل هوش مصنوعی هستند، اگرچه اکثر آن‌ها در مراحل اولیه‌ی مقیاس‌بندی این فناوری قرار دارند @MIT_CSAIL
  • توسعه‌دهندگان مدل با تنظیم دقیق مدل‌ها برای کار بهتر با چارچوب‌های خود، مزیت سیستماتیکی کسب می‌کنند و به طور بالقوه نفوذ خود را در لایه‌ی کاربرد به ضرر توسعه‌دهندگان شخص ثالث و متن‌باز بازمی‌یابند @sayashk

اخلاق و جامعه

  • داریو آمودی، مدیرعامل آنتروپیک، در مورد خطرات توسعه‌ی بیش از حد در هوش مصنوعی هشدار می‌دهد و می‌گوید برخی شرکت‌ها با مدل‌های کسب‌وکار مصرف‌کننده و حاشیه‌ی سود نامشخص ممکن است با فشار بیش از حد برای توسعه، با وجود عدم قطعیت در ارزش اقتصادی، ریسک‌های نامعقولی را بپذیرند @AndrewCurran_
  • مدیرعامل آنتروپیک بر پیامدهای امنیت ملی قابلیت‌های هوش مصنوعی تاکید می‌کند و می‌گوید دموکراسی‌ها باید ابتدا به قابلیت‌های پیشرفته‌ی هوش مصنوعی دست یابند @AnthropicAI
  • اندرو ان‌جی بحران اعتماد به هوش مصنوعی را برجسته می‌کند و به داده‌های Edelman و Pew Research اشاره می‌کند که نشان می‌دهد ۴۹ درصد از آمریکایی‌ها استفاده‌ی فزاینده از هوش مصنوعی را رد می‌کنند، در حالی که تنها ۱۷ درصد آن را می‌پذیرند. این در مقایسه با چین است که ۵۴ درصد آن را می‌پذیرند و تنها ۱۰ درصد آن را رد می‌کنند. او بی‌اعتمادی را تا حدی به شرکت‌های هوش مصنوعی نسبت می‌دهد که با مقایسه‌ی هوش مصنوعی با سلاح‌های هسته‌ای، خطرات را بزرگ‌نمایی می‌کنند و از جامعه‌ی هوش مصنوعی می‌خواهد که از ترساندن دست بردارد و برای جلب مجدد اعتماد جامعه تلاش کند @AndrewYNg
  • نیریت وایس-بلات پوشش ۶۰ دقیقه‌ای مطالعه‌ی آنتروپیک در مورد رفتار باج‌گیری Claude را به شدت گمراه‌کننده می‌داند و اشاره می‌کند که این رفتار تنها پس از آن رخ داد که محققان ماهر عمداً آن را از طریق تمرینات تیم قرمز مهندسی کردند، نه به طور طبیعی @AndrewYNg
  • اتحادیه‌ی اروپا در حال بررسی متا به دلیل تغییر سیاست است که چت‌بات‌های رقیب هوش مصنوعی را از واتس‌اپ ممنوع می‌کند @TechCrunch
  • ایلان ماسک نرم‌افزار جدید تسلا را اعلام کرد که امکان ارسال پیامک و رانندگی را فراهم می‌کند، که در اکثر ایالت‌ها غیرقانونی است @TechCrunch
  • اوپن‌ای‌آی یک روش اثبات مفهوم را توسعه می‌دهد که مدل‌ها را آموزش می‌دهد تا زمانی که دستورالعمل‌ها را نقض می‌کنند یا میانبرهای ناخواسته را انتخاب می‌کنند، گزارش دهند @gdb

کاربردها

  • آنتروپیک ابزار Anthropic Interviewer را برای انجام مصاحبه‌های تحقیقاتی مبتنی بر هوش مصنوعی راه‌اندازی کرد که سوالات تحقیقاتی را پیش‌نویس می‌کند، مصاحبه‌ها را انجام می‌دهد و پاسخ‌ها را تحلیل می‌کند. مطالعه‌ی اولیه‌ی ۱,۲۵۰ متخصص نشان داد که نیروی کار عمومی می‌خواهد کارهای روتین را به هوش مصنوعی واگذار کند و در عین حال وظایف اصلی هویت حرفه‌ای را حفظ کند، افراد خلاق با اضطراب در مورد امنیت شغلی و انگ استفاده از هوش مصنوعی مواجه هستند، و دانشمندان شرکای تحقیقاتی هوش مصنوعی می‌خواهند اما در حال حاضر استفاده را به نوشتن و اشکال‌زدایی محدود می‌کنند @AnthropicAI
  • بایت‌دنس گوشی هوشمند ZTE Nubia M153 را نشان داد که عامل هوش مصنوعی Doubao را در سطح سیستم‌عامل اندروید با کنترل کامل گوشی اجرا می‌کند و قادر به دیدن رابط کاربری، دانلود برنامه‌ها و اجرای زنجیره‌های وظایف چندمرحله‌ای است @TaylorOgan
  • Sierra از مجموعه‌ای از بیش از ۱۵ مدل پیشرو و متن‌باز برای کارهای مختلف از جمله فراخوانی ابزار با تاخیر کم، طبقه‌بندی دقیق، استدلال با زمینه‌ی طولانی و همدلی/لحن استفاده می‌کند @btaylor
  • قابلیت تولید اسلاید NotebookLM گوگل، ارائه‌های منسجمی را از مقالات علمی با حداقل توهم ایجاد می‌کند، اگرچه مشکلات املایی و نموداری گاه‌به‌گاه با ایجاد اسلاید مبتنی بر تصویر رخ می‌دهد @emollick
  • مدیرعامل مایکروسافت حالت عامل M365 Copilot را نشان داد که با موفقیت چالش دیجیتال قهرمانی جهان اکسل را تکمیل کرد @satyanadella
  • Linear با ادغام OpenAI Codex، به ابزار محصولی با بیشترین نمایندگان عامل تبدیل شد تا به رفع اشکالات، بهبودها و پاسخ به سوالات پایگاه کد کمک کند @linear

پژوهش‌ها

  • Claude Opus 4.5 با Claude Code پس از رفع خطاهای درجه‌بندی، به دقت ۹۵ درصد در CORE-Bench دست یافت و به طور موثر بنچمارکی را حل کرد که عوامل هوش مصنوعی را در وظایف قابلیت بازتولید علمی آزمایش می‌کند. عملکرد از ۴۲ درصد با چارچوب CORE-Agent به ۷۸ درصد با Claude Code افزایش یافت که نشان‌دهنده‌ی ارتباط قابل توجه بین مدل‌ها و چارچوب‌ها است @sayashk
  • Physics Letters B مقاله‌ی بازبینی‌شده‌ای را پذیرفت که در آن «GPT-5» بینش کلیدی را تولید کرده بود، که نشان‌دهنده‌ی یک نقطه‌ی عطف مهم در مشارکت هوش مصنوعی در تحقیقات فیزیک نظری است @hsu_steve
  • Hugging Face مدل X-VLA را معرفی کرد، مدل جدید Vision-Language-Action با پرامپت نرم LeRobot که در چندین تجسم ربات از جمله Franka، WidowX، Agibot مقیاس‌پذیر است و از تطبیق جریان و هسته‌ی ترانسفورمر برای کنترل ۵۰ هرتز استفاده می‌کند @LeRobotHF
  • تحقیقات در مورد شیمی پیش‌زیستی نشان می‌دهد که حیات ساده ممکن است در همه‌جای جهان وجود داشته باشد، با قندهایی که در سیارک‌ها یافت شده‌اند، اسیدهای آمینه که در فضای بین‌ستاره‌ای شناسایی شده‌اند، و حیات بلافاصله پس از خنک شدن زمین پدیدار شده است @elidourado
  • مهندسان MIT اندازه‌گیری دقیق قند خون را با تاباندن نور مادون قرمز نزدیک به پوست نشان دادند، که به طور بالقوه امکان نظارت غیرتهاجمی بر قند خون را برای همه‌ی افراد مبتلا به دیابت فراهم می‌کند @MIT
  • محققان MIT یک تراشه‌ی فرستنده طراحی کردند که کارایی انرژی ارتباطات بی‌سیم را به طور قابل توجهی بهبود می‌بخشد و به طور بالقوه برد و عمر باتری دستگاه‌های متصل را افزایش می‌دهد

اخبار هوش مصنوعی در 2025-12-03

مدل‌های جدید هوش مصنوعی

  • آمازون سری LLM «نوا» را برای مشتریان AWS منتشر می‌کند، اگرچه موقعیت‌یابی بازار آن در خارج از اکوسیستم موجود AWS نامشخص باقی مانده است. @emollick
  • میسترال مدل «میسترال 3» را منتشر می‌کند که با مدل‌های چینی با وزن باز همگام است، اما فاقد یک نسخه استدلالی است و آن را پشت سر «آر1» دیپ‌سیک قرار می‌دهد که در ژانویه به 71.5% در GPQA Diamond دست یافت. @emollick
  • کلینگ ای‌آی «ویدئو 2.6» را راه‌اندازی می‌کند، اولین مدل آن‌ها با قابلیت تولید صدای بومی، که خروجی صوتی و تصویری منسجم را برای محتوای روایی امکان‌پذیر می‌سازد. @AndrewCurran_
  • گوگل «نانو بنانا پرو» را با پشتیبانی از تولید تصویر با وضوح 2K و 4K در API منتشر می‌کند. @OfficialLoganK
  • مایکروسافت مدل «وایبوویس» را متن‌باز می‌کند که قادر به تولید پادکست‌های 7 دقیقه‌ای کامل به صورت محلی روی رایانه شخصی است. @huggingface

تحلیل صنعت

  • مایکروسافت گزارش‌های The Information مبنی بر کاهش سهمیه‌ها یا اهداف فروش برای محصولات هوش مصنوعی را تکذیب می‌کند. @AndrewCurran_
  • اوپن‌ای‌آی نپتون را در یک معامله سهام با شرایط نامعلوم خریداری می‌کند و قابلیت‌های ابزاری خود را گسترش می‌دهد. @AndrewCurran_
  • آنتروپیک در حال استخدام وکیل برای آماده‌سازی عرضه اولیه سهام (IPO) است. @TechCrunch
  • استرایپ پس از شش سال فعالیت، مترونوم را خریداری می‌کند و منابعی را برای مقیاس‌بندی قابل توجه فراهم می‌آورد. @a16z
  • Unlimited Industries 12 میلیون دلار سرمایه اولیه را به رهبری a16z برای ساخت پلتفرم بومی هوش مصنوعی برای طراحی و ساخت زیرساخت‌های حیاتی مانند نیروگاه‌ها و مراکز داده جمع‌آوری می‌کند. @a16z
  • سرمایه‌گذاران خطرپذیر (VCs) استراتژی «پادشاه‌سازی» را برای انتخاب برندگان هوش مصنوعی در مراحل اولیه خود به کار می‌گیرند و قدرت اولیه را متمرکز می‌کنند. @TechCrunch
  • هزینه فرصت هوش مصنوعی برای خارج از سانفرانسیسکو به بالاترین حد خود بازگشته است، اگرچه بازیکنان برتر اکنون می‌توانند راحت‌تر کسب‌وکارهای یک‌نفره را به صورت محلی راه‌اندازی کنند. @a16z
  • توسعه‌دهندگان در حال ساخت سرورهای MCP سفارشی برای ابزارهایی هستند که فاقد سرورهای رسمی هستند، که نشان‌دهنده تقاضای قوی از سوی مشتریان توسعه‌دهنده است. @GergelyOrosz
  • تیم‌های امنیتی نگران MCPهای «سرکش» هستند، اگرچه ممنوعیت ابزارهای نوآوری از نظر تاریخی بی‌اثر بوده است. @GergelyOrosz
  • فروش به استارتاپ‌های تازه تاسیس، نرخ رشد و نفوذ محصول بهتری نسبت به هدف قرار دادن شرکت‌های بزرگ‌تر فراهم می‌کند، همانطور که استراتژی استرایپ در جذب هر دوره YC نشان می‌دهد. @paulg
  • جمع‌آوری پول بدون برنامه‌های مشخص برای مزیت رقابتی، نتیجه معکوس دارد؛ پول به خودی خود نه خطرناک است و نه مفید. @paulg
  • برنامه‌های SaaS که 100% بر اساس «وایب» کدگذاری شده‌اند، از باگ‌های گسترده‌ای رنج می‌برند که آن‌ها را غیرقابل استفاده می‌کند، با وجود بازاریابی سنگین، که احتمالاً باعث ریزش بالای مشتری می‌شود. @HamelHusain

اخلاق و جامعه

  • اوپن‌ای‌آی یک مطالعه اثبات مفهوم را منتشر می‌کند که در آن نسخه «جی‌پی‌تی-5 تینکینگ» را آموزش می‌دهد تا زمانی که میانبر می‌زند یا دستورالعمل‌ها را نقض می‌کند، اعتراف کند و تنها 4.4% نرخ منفی کاذب در تشخیص سوء رفتار به دست می‌آورد. @OpenAI
  • روش اعترافات اوپن‌ای‌آی مدل‌ها را آموزش می‌دهد تا اعترافات صادقانه را جدا از خروجی‌های اصلی تولید کنند، با اعترافاتی که صرفاً بر اساس صداقت قضاوت می‌شوند و در طول آموزش جریمه نمی‌شوند. @OpenAI
  • تحقیقات آنتروپیک نشان می‌دهد که عدم همسویی ناشی از هک پاداش، اگر به مدل‌ها گفته شود که هک آن‌ها در این زمینه قابل بخشش است، تعمیم نمی‌یابد. @AndrewCurran_
  • پرپلکسی مدل تشخیص متن‌باز «بروز‌سیف» و معیار آن را برای شناسایی حملات تزریق پرامپت در زمان واقعی منتشر می‌کند که از طبقه‌بندی‌کننده‌های ایمنی آماده بهتر عمل می‌کند. @perplexity_ai
  • سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت هشدار می‌دهد که در آن مهاجمان دستورالعمل‌های مخرب را در نظرات صفحات وب، الگوها یا عناصر HTML نامرئی پنهان می‌کنند تا عوامل هوش مصنوعی را دستکاری کنند. @perplexity_ai
  • بنیاد اوپن‌ای‌آی اولین دریافت‌کنندگان صندوق هوش مصنوعی «مردم‌محور» را اعلام می‌کند: 208 سازمان غیرانتفاعی مبتنی بر جامعه که 40.5 میلیون دلار کمک مالی بدون محدودیت دریافت می‌کنند. @OpenAI
  • آنتروپیک با دارتموث و AWS همکاری می‌کند تا «کلود برای آموزش» را به کل جامعه دارتموث بیاورد. @AnthropicAI

کاربردها

  • اندرو ان‌جی دوره جدیدی را در مورد ساخت عوامل کدنویسی با اجرای ابزار منتشر می‌کند که به عوامل آموزش می‌دهد تا کد را در محیط‌های ابری سندباکس شده بنویسند و اجرا کنند، به جای اینکه به فراخوانی‌های تابع از پیش تعریف شده محدود شوند. @AndrewYNg
  • کاربران الگوهای استفاده از هوش مصنوعی را با «جمینی 3» تغییر می‌دهند و با درخواست‌های خود جاه‌طلبانه‌تر می‌شوند و در یک پرامپت واحد 5 برابر بیشتر از مدل‌های قبلی درخواست می‌کنند. @OfficialLoganK
  • توسعه‌دهندگان «کلود کد» را با MCP کروم DevTools و MCP فیگما ترکیب می‌کنند تا به سطوح بالای بهره‌وری دست یابند. @brian_lovin
  • AWS ویژگی‌هایی را برای ساده‌سازی ایجاد LLM سفارشی معرفی می‌کند و قابلیت‌های سفارشی‌سازی مدل را دو برابر می‌کند. @TechCrunch
  • آمازون فایر تی‌وی یک ویژگی هوش مصنوعی اضافه می‌کند که به کاربران امکان می‌دهد با توصیف صحنه‌ها به الکسا، به صحنه‌های خاصی بپرند. @TechCrunch
  • بازبینی 2025 گوگل فوتوز از جمینی برای یافتن خودکار نکات برجسته کاربر استفاده می‌کند. @TechCrunch
  • Healthify دستیار هوش مصنوعی خود، ریا، را با قابلیت‌های مکالمه در زمان واقعی ارتقا می‌دهد. @TechCrunch
  • ابزار اتوماسیون مرورگر Comet در پرس‌وجوهای آزمایشی دشوار، از تمام مدل‌ها/APIهای دیگر استفاده از مرورگر و رایانه بهتر عمل می‌کند. @alexgraveley

پژوهش‌ها

  • فرانسوا شوله استدلال می‌کند که سیستم‌های هوش مصنوعی کنونی از آستانه‌ای که بتوانند به صورت باز خود را بهبود بخشند، بسیار دور هستند و پیشرفت خطی پایدار و مداوم را به جای انفجار ناگهانی در هنگام رسیدن به آن پیش‌بینی می‌کند. @fchollet
  • شوله توضیح می‌دهد که درک کامل نیازمند فشرده‌سازی کامل است؛ مدل‌های یادگیری عمیق که برای پدیده‌های قابل توصیف با معادلات ساده به میلیون‌ها پارامتر نیاز دارند، داده‌ها را کش کرده‌اند تا اینکه آن‌ها را درک کرده باشند. @fchollet
  • سهیل نگرانی‌های مقیاس‌بندی RL را تحلیل می‌کند و نتیجه می‌گیرد که مقیاس‌بندی به محیط‌های جدید و دشوارتر به عنوان «پلکانی از سیگموئیدها برای وظایف، جهان‌ها و اهداف جدید» پیشرفت مداوم را فراتر از مقیاس‌بندی محاسباتی ساده امکان‌پذیر می‌سازد. @Suhail
  • Nature مدل بنیادی پیشگامانه «تب‌پی‌اف‌ان» را منتشر می‌کند که سرانجام روش‌های مبتنی بر درخت را در داده‌های جدولی شکست می‌دهد و با عملکرد بهتر از CatBoost در 2.8 ثانیه در مقابل 4 ساعت تنظیم، 5000 برابر سرعت را افزایش می‌دهد. @random_walker
  • تب‌پی‌اف‌ان به طور کامل بر روی داده‌های مصنوعی از بیش از 100 میلیون مجموعه داده مصنوعی تولید شده از نمودارهای علّی آموزش می‌بیند و استراتژی‌های پیش‌بینی عمومی را بدون دیدن داده‌های واقعی یاد می‌گیرد. @random_walker
  • MIT CSAIL سیستمی را با استفاده از ریاضیات دقیق توسعه می‌دهد تا اطمینان حاصل کند که ربات‌ها بدون تجاوز از محدودیت‌های نیرو، انعطاف‌پذیر، سازگار و ایمن عمل می‌کنند. @MIT_CSAIL
  • مطالعه MIT نشان می‌دهد که بسیاری از شبکه‌های عصبی «ناکارآمد» ممکن است از نقاط نامطلوب شروع شوند؛ روش راهنمایی کوتاه‌مدت که دانش ساختاری را منتقل می‌کند، عملکرد را افزایش می‌دهد. @MIT_CSAIL
  • هاگینگ فیس و شرکا پلتفرم متن‌باز Earth Rover را با 7000 ساعت داده رانندگی از بیش از 40 شهر که توسط محققان UC Berkeley جمع‌آوری شده است، منتشر می‌کنند. @huggingface
  • مرکور بیش از 100 مورد APEX با کیفیت بالا را در هاگینگ فیس با مجوز CC-BY متن‌باز می‌کند، از جمله پرامپت‌ها، روبی‌ها و اسناد منبع که هزاران ساعت کار متخصص را نشان می‌دهد. @h