اخبار هوش مصنوعی در 2025-12-14

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2 Pro را با قابلیت‌های تفکر گسترده‌تر منتشر کرد که پیشرفت‌های قابل‌توجهی نسبت به 5.1 Pro نشان می‌دهد، مشابه جهش از o1 Pro به o3 Pro @MParakhin
  • گوگل از ترجمه‌ی هم‌زمان گفتار به گفتار با پشتیبانی Gemini خبر داد که اکنون در Google Translate در دسترس است و اوایل سال آینده برای توسعه‌دهندگان عرضه خواهد شد @OfficialLoganK
  • Gemini 2.5 و Gemini 3 Pro عملکرد بهبودیافته‌ای را در وظایف مختلف استدلال نشان می‌دهند، به‌طوری که Gemini 3 Pro بالاترین امتیاز 9.1% را در معیار استدلال فیزیک CritPt کسب کرده است @mark_k

تحلیل صنعت

  • هوش مصنوعی این امکان را برای بنیان‌گذاران فراهم کرده است که ارائه‌های بی‌نقصی را در مقیاس بزرگ ایجاد کنند، که باعث شده سرمایه‌گذاران خطرپذیر نتوانند تنها به ایمیل‌های سرد ورودی تکیه کنند و این امر نحوه‌ی نفوذ استارتاپ‌ها به سرمایه‌گذاران را به‌طور اساسی تغییر داده است @TechCrunch
  • ابزارهای بازبینی کد فعلی برای کدهای تولیدشده توسط هوش مصنوعی ناکافی هستند و توسعه‌دهندگان نیاز دارند که پرامپت اصلی، اصلاحات انسانی انجام‌شده و علامت‌گذاری واضح بخش‌های بدون تغییر تولیدشده توسط هوش مصنوعی را بدانند @GergelyOrosz
  • تیمی از مهندسان نرم‌افزار قوی که به کیفیت و قابلیت نگهداری کد اهمیت می‌دهند، از تیم‌هایی که از عوامل کدنویسی هوش مصنوعی قدرتمند به‌طور بی‌فکرانه استفاده می‌کنند، بهتر عمل می‌کنند، زیرا ابزارهای هوش مصنوعی توسعه‌دهندگان را وسوسه می‌کنند تا کدهای پرحرف و با قابلیت نگهداری کمتر را ارائه دهند @GergelyOrosz
  • مهندسان ارشد گزارش می‌دهند که هوش مصنوعی به آن‌ها امکان می‌دهد بدون ترس از قضاوت، آزادانه‌تر سؤال بپرسند، که منجر به یادگیری سریع‌تر در مقایسه با پویایی‌های سنتی تیم می‌شود که در آن عناوین ارشد مانع از پرسیدن سؤالات اساسی می‌شوند @GergelyOrosz
  • سیستم‌های هوش مصنوعی آینده در 10-15 سال آینده 4-5 مرتبه از نظر انرژی کارآمدتر از هوش مصنوعی فعلی خواهند بود و سخت‌افزار به جای برق، به گلوگاه اصلی استقرار تبدیل خواهد شد @fchollet
  • مراکز داده در فضا از نظر اقتصادی مقرون‌به‌صرفه نیستند و با در نظر گرفتن هزینه‌های پرتاب، پیچیدگی نگهداری و ارتباطات با پهنای باند بالا، 50-100 برابر گران‌تر از مراکز داده زمینی با انرژی هسته‌ای یا تجدیدپذیر هستند @fchollet

اخلاق و جامعه

  • اطلاعات نادرست تولیدشده توسط هوش مصنوعی در حال حاضر برای انتشار روایت‌های دروغین استفاده می‌شود، با ایجاد داستان‌های ساختگی و نام‌ها برای افراد واقعی درگیر در رویدادهای خبری، که تهدید فوری برای یکپارچگی اطلاعات را نشان می‌دهد @Nrg8000
  • سرگئی برین اعتراف می‌کند که گوگل در معماری ترانسفورمر که خود اختراع کرده بود، کمتر سرمایه‌گذاری کرد زیرا شرکت بیش از حد می‌ترسید چت‌بات‌هایی را منتشر کند که حرف‌های احمقانه می‌زنند، و این امر به OpenAI اجازه داد تا محاسبات را مقیاس‌بندی کرده و با این فناوری پیش برود @slow_developer
  • گرفتن پاسخ‌های دقیق از هوش مصنوعی فعلی با فریب دادن یک دروغگوی حرفه‌ای برای گفتن حقیقت مقایسه می‌شود، که از کاربران می‌خواهد سیستم را به گوشه‌ی درست هدایت کنند یا پرامپت‌های صحیح را ارائه دهند @paulg

کاربردها

  • JustHTML، یک کتابخانه‌ی جدید پایتون بدون وابستگی، عمدتاً توسط عوامل کدنویسی در طی چند ماه ساخته شد، که شامل 3000 خط کد است که HTML را مطابق با مشخصات HTML5 تجزیه می‌کند و 9200 تست html5lib را با موفقیت پشت سر می‌گذارد @simonw
  • یک راهنمای 17 مرحله‌ای نحوه‌ی استفاده از حالت عامل VS Code با Claude 3.7 Sonnet، Gemini Pro 3 و Claude Opus را برای ساخت کد با کیفیت تولیدی نشان می‌دهد، که مهندسی جدی را به جای کدنویسی حسی به نمایش می‌گذارد @simonw
  • تیم Codex پشتیبانی آزمایشی از مهارت‌ها را اضافه می‌کند که با GPT-5.2 به‌خوبی ترکیب می‌شود و امکان تنظیم دقیق Qwen3-0.6B را برای دستیابی به بهبود +6 در معیار HumanEval فراهم می‌کند @thsottiaux
  • Comet Assistant در حال انتقال محاسبات به سمت مدل‌های سریع و سبک‌وزن است که می‌توانند به‌صورت محلی اجرا شوند و امکان تحلیل عمیق‌تر هر مقاله، ویدئو یا وب‌سایتی را بدون تغییر زمینه فراهم می‌کنند @AravSrinivas

پژوهش‌ها

  • GPT-5.2 Pro در CritPt، یک معیار استدلال فیزیک در سطح پژوهش که برای آزمایش استدلال فیزیک نظری در سطح متخصص طراحی شده است، امتیاز 0% را کسب می‌کند، در حالی که Gemini 3 Pro بالاترین امتیاز 9.1% را به دست می‌آورد @mark_k
  • همه‌ی مدل‌های هوش مصنوعی اخیر اکنون معمای جراح را در اولین تلاش به‌درستی حل می‌کنند، که پیشرفت در مدیریت سوگیری جنسیتی در وظایف استدلال را نشان می‌دهد @emollick
  • بررسی سالانه‌ی مدل‌های باز، DeepSeek R1، خانواده‌ی Qwen 3 و خانواده‌ی Kimi K2 را به‌عنوان بهترین عملکردها شناسایی می‌کند، با پیش‌بینی‌هایی مبنی بر اینکه مقیاس‌بندی ادامه خواهد یافت و شکاف مرز باز-بسته در معیارهای عمومی در سال 2026 تقریباً یکسان باقی خواهد ماند @natolambert
  • شاخص شفافیت مدل بنیاد استنفورد نشان می‌دهد که شفافیت صنعت از 58 به 40.69 کاهش یافته است، به‌طوری که تنها IBM و Writer شفافیت را حفظ کرده‌اند در حالی که دیگران افشاگری را کاهش داده‌اند @JesseDLandry