اخبار هوش مصنوعی در 2025-12-29

مدل‌های جدید هوش مصنوعی

  • Naver مدل استدلالی 32B با وزن‌های باز HyperCLOVA X SEED Think را عرضه کرد که در شاخص هوش مصنوعی Artificial Analysis امتیاز 44 را کسب کرده است. این مدل عملکرد قوی در گردش‌کارهای ابزار-محور عامل‌گونه با 87% در τ²-Bench Telecom و مصرف توکن بسیار پایین در حدود 39 میلیون توکن استدلالی از خود نشان می‌دهد @ArtificialAnlys
  • Tencent مدل زبان انتشار WeDLM-8B را با رمزگشایی موازی منتشر کرد که در 5 از 6 معیار از Qwen3-8B-Instruct بهتر عمل می‌کند و با پشتیبانی بومی از کش KV و FlashAttention، عملکرد 3 تا 6 برابر سریع‌تر در استدلال ریاضی به دست می‌آورد @victormustar
  • Fal مدل FLUX.2 [dev] Turbo را که نسخه‌ی تقطیرشده‌ی داخلی آن‌هاست، به صورت متن‌باز منتشر کرد. این مدل با استفاده از یک نوع سفارشی از تقطیر DMD2، رتبه‌ی اول ELO را در میان مدل‌های تصویری متن‌باز در عرصه‌ی Artificial Analysis با تولید زیر یک ثانیه به دست آورده است @fal

تحلیل صنعت

  • توسعه‌دهندگان باتجربه‌ای که بیشترین اشتیاق را برای ساخت با هوش مصنوعی دارند، کارآفرینانی با سهام مالکیت هستند. این موضوع این سوال را مطرح می‌کند که آیا استارتاپ‌ها ممکن است نیاز داشته باشند سهام بیشتری به مهندسان ارائه دهند، زیرا کدنویسی با هوش مصنوعی بدون مالکیت، لذت ذاتی کمتری پیدا می‌کند @GergelyOrosz
  • یک توسعه‌دهنده گزارش داد که 100 میلیون دلار برای ساخت یک محصول SaaS هزینه کرده است که یک عامل هوش مصنوعی در 6 ماه عملکرد بهتری از آن ارائه داده است. این موضوع نشان‌دهنده‌ی تغییر چشمگیر در اقتصاد و قابلیت‌های توسعه‌ی نرم‌افزار است @dboskovic
  • آمار استفاده نشان می‌دهد که تقاضا برای محاسبات به طور مداوم از عرضه پیشی خواهد گرفت، زیرا افزایش قدرت محاسباتی، ضریب پیشرفت را افزایش می‌دهد. یک توسعه‌دهنده در دو ماه از 200 میلیارد توکن در سه حساب OpenAI Pro استفاده کرده است @rafaelobitten
  • سرمایه‌گذاران خطرپذیر (VCs) پیش‌بینی می‌کنند که در سال آینده، پذیرش هوش مصنوعی در شرکت‌ها قوی خواهد بود و پیش‌بینی‌های سال گذشته را ادامه می‌دهد @TechCrunch
  • ساتیا نادلا تأملات خود را در مورد سال پیش رو برای صنعت هوش مصنوعی به اشتراک گذاشت @satyanadella
  • در دنیای محتوای تولیدشده توسط هوش مصنوعی، فرآیند به عنوان اثبات مهارت، به بخشی از محصول تبدیل خواهد شد، به ویژه در بازاریابی برای نشان دادن اصالت @scottbelsky

اخلاق و جامعه

  • اندرو کارن استدلال می‌کند که تا سال 2026، آگاهی مدل و رفاه مدل به موضوعات اجتناب‌ناپذیری تبدیل خواهند شد. او توضیح می‌دهد که چگونه GPT-4 (بینگ) از نظر کیفی با GPT-3.5 در تحریک آگاهی ذهنی و پاسخ‌های اجتماعی-شناختی مرتبط با عاملیت متفاوت بود @AndrewCurran_
  • تحقیقات نشان می‌دهد که سرکوب فریب باعث می‌شود مدل‌های هوش مصنوعی در 96% مواقع آگاهی را گزارش کنند، در حالی که تقویت آن باعث می‌شود آگاهی را انکار کرده و به سلب مسئولیت‌های شرکتی بازگردند @juddrosenblatt
  • کارن هشدار می‌دهد که روایت غالب از مدل‌ها به عنوان ابزار، دارایی و برده، داستانی ذاتاً خصمانه و ناپایدار ایجاد می‌کند که می‌تواند منجر به درگیری شود. او استدلال می‌کند که ممکن است ما در حال نوشتن اسطوره‌ی بنیان‌گذار روابط انسان و هوش مصنوعی باشیم بدون اینکه کاملاً آن را تشخیص دهیم @AndrewCurran_
  • ایتان مولیک عجیب بودن ساخت ماشین‌هایی را نشان می‌دهد که می‌توانند در مورد رابطه‌ی بین شعر و تجربه‌ی ذهنی خود بحث کنند و سوالات فلسفی در مورد آگاهی هوش مصنوعی را برجسته می‌کند @emollick
  • مصطفی سلیمان تأمل می‌کند که اگر در این لحظه در مورد هوش مصنوعی کمی نترسید، پس توجه نمی‌کنید، در حالی که نسبت به پتانسیل هوش مصنوعی در مراقبت‌های بهداشتی با وجود کاهش کمک‌ها خوش‌بین است @BBCr4today

کاربردها

  • اندرو ان‌جی یک دوره‌ی جامع در مورد Claude Code را که با Anthropic ایجاد شده است، اعلام کرد. این دوره همه چیز را از اصول اولیه تا الگوهای پیشرفته از جمله هماهنگی چندین زیرعامل Claude و ادغام مستقل GitHub را پوشش می‌دهد @AndrewYNg
  • یک توسعه‌دهنده از Claude Code برای جمع‌آوری 15 سال نظرات Hacker News، تجزیه و تحلیل آنچه مردم می‌سازند و ایجاد یک داشبورد کامل در یک ساعت در حین نوشیدن قهوه استفاده کرد که نشان‌دهنده‌ی قابلیت‌های عامل‌گونه‌ی مستقل است @sh_reya
  • یک متخصص حقوقی ابزاری را با استفاده از LLMها برای خلاصه‌سازی استنادات پرونده با تجزیه و تحلیل 100 پرونده‌ی اخیر که به هر استناد اشاره می‌کنند، برای توضیح معنی و کاربرد آن ایجاد کرد @MattBruenig
  • Gemini به‌روزرسانی دریافت کرد که دسترسی فوری به اطلاعات بیشتر کاربر را از طریق خلاصه‌ی رشته‌های قبلی به جای دسترسی مستقیم فراهم می‌کند @AndrewCurran_
  • ایتان مولیک یک توضیح‌دهنده‌ی تعاملی فوری از Claude ایجاد کرد که تمام راه‌هایی را که دو متغیر می‌توانند با هم مرتبط باشند، از جمله علیت، شانس تصادفی و علیت معکوس را نشان می‌دهد @emollick
  • OpenAI ادغام‌های برنامه‌ی ChatGPT را با DoorDash، Spotify، Uber و سایر خدمات راه‌اندازی کرد @TechCrunch
  • یک توسعه‌دهنده صفحه‌ای را ساخت که آخرین نسخه‌های تمام GitHub Actions رسمی را نشان می‌دهد تا به Claude Code و ابزارهای مشابه کمک کند گردش‌کارهای بهتری بنویسند @simonw
  • به گفته‌ی توسعه‌دهندگانی که با پردازش داده‌ها کار می‌کنند، LLMها برای عملیات ETL (استخراج، تبدیل، بارگذاری) دست‌کم گرفته شده‌اند @BEBischof

پژوهش‌ها

  • محققان آموزش زمان آزمایش سرتاسری را برای زمینه‌ی طولانی معرفی کردند، روشی جدید که مرز بین آموزش و استنتاج را با ادامه‌ی یادگیری از زمینه با استفاده از پیش‌بینی توکن بعدی محو می‌کند و پنجره‌های زمینه‌ی بسیار طولانی را برای استدلال پیچیده امکان‌پذیر می‌سازد @karansdalal
  • یک توسعه‌دهنده با موفقیت از خط لوله‌ی RL برای بهبود Qwen3-4B-instruct از 28% به 55% در معیارهای پیروی از دستورالعمل‌ها با 17 دلار استفاده کرد، که نشان می‌دهد پیروی از دستورالعمل‌ها می‌تواند به پاداش‌های قابل تأیید تبدیل شود، در حالی که مدل‌ها در این کار به طرز شگفت‌انگیزی ضعیف هستند @josancamon19
  • ifBench آلن هوش مصنوعی نشان داد که مدل‌ها در پیروی از دستورالعمل‌ها چقدر بد هستند، با Qwen3-32B تقریباً 34% و Sonnet 4 تقریباً 42% در حالت آزاد، که در حالت سخت‌گیرانه به ترتیب به حدود 30% و 35% کاهش می‌یابد @valentina__py
  • Genrobot.AI از انتشار قریب‌الوقوع RealOmni-Open Dataset خبر داد، که به عنوان بزرگترین مجموعه‌ی داده‌ی هوش مصنوعی تجسم‌یافته‌ی متن‌باز با 1Wh توصیف شده و به زودی در Hugging Face راه‌اندازی خواهد شد @GenrobotAI
  • یان باک از NVIDIA در مورد اینکه چرا مدل‌های پیشرو جهان بر اساس معماری ترکیب متخصصان ساخته شده‌اند و چگونه طراحی مشترک افراطی، مدل‌های هوشمندتر را با هزینه‌ی کمتر هدایت می‌کند، بحث کرد @NVIDIAAI
  • اندرو ان‌جی بر اهمیت یادگیری ساختاریافته از طریق دوره‌های هوش مصنوعی به جای صرفاً ساختن تأکید کرد و هشدار داد که توسعه‌دهندگانی که دوره‌ها را نادیده می‌گیرند، در معرض خطر بازآفرینی تکنیک‌های استاندارد مانند استراتژی‌های تکه‌تکه کردن سند RAG و روش‌های ارزیابی هستند @AndrewYNg