اخبار هوش مصنوعی در 2026-02-02

مدل‌های جدید هوش مصنوعی

  • xAI مدل Grok Imagine 1.0 را منتشر کرد که قابلیت تولید ویدیوی ۱۰ ثانیه‌ای با رزولوشن ۷۲۰p، صدای به‌شدت بهبودیافته با لحن‌های احساسی و رسا، و قابلیت‌های پیشرفته‌تر در دنبال کردن دستورات را دارد. این مدل در بنچمارک‌های Artificial Analysis در صدر قرار گرفته و در ۳۰ روز گذشته ۱.۲۴۵ میلیارد ویدیو تولید کرده است @xai
  • OpenAI اپلیکیشن Codex را برای macOS عرضه کرد؛ یک مرکز فرماندهی برای ساخت با عامل‌ها که امکان چندوظیفگی موازی با ورک‌تری‌ها، مهارت‌های قابل استفاده‌ی مجدد و اتوماسیون‌های زمان‌بندی‌شده را فراهم می‌کند. این اپلیکیشن شامل دو برابر شدن محدودیت‌های نرخ در تمام سطوح از رایگان تا سازمانی است @OpenAI
  • گوگل دیپ‌مایند نتایج بازی‌های گرگینه، پوکر و نسخه‌ی به‌روز‌شده‌ی شطرنج را به Kaggle Game Arena اضافه کرد تا مدل‌های هوش مصنوعی را در زمینه‌ی ارتباطات متنی، ایجاد اجماع و مدیریت ابهام آزمایش کند. جدیدترین مدل‌های Gemini 3 در صدر جدول امتیازات شطرنج قرار گرفتند @GoogleDeepMind
  • Cohere Command A Vision و Command A Reasoning اکنون از طریق OCI Generative AI در دسترس هستند و امکان ساخت اپلیکیشن‌های چندوجهی، گردش‌کارهای عامل‌محور و سیستم‌های مبتنی بر استدلال را با امنیت سازمانی و در دسترس بودن در منطقه‌ی اتحادیه‌ی اروپا فراهم می‌کنند @OracleCloud

تحلیل صنعت

  • تیم Codex اوپن‌ای‌آی گزارش می‌دهد که این ابزار اکنون با نظارت تیم، خودش را می‌سازد و گلوگاه از سرعت توسعه به سرعت کمک و نظارت انسان‌ها بر نتیجه تغییر کرده است @thsottiaux
  • Linear تنها در ژانویه‌ی ۲۰۲۶ درآمد خالص جدیدی بیشتر از مجموع سه سال اول خود کسب کرده است که نشان می‌دهد چگونه شتاب ثابت، رشد مرکب را ممکن می‌سازد @cjc
  • شرکت‌ها تیم‌های «۲ پیتزایی» را به تیم‌های «۱ پیتزایی» تغییر نام می‌دهند، زیرا هوش مصنوعی تیم‌های بزرگ را غیرضروری کرده و سرعت کار را کاهش می‌دهد، و تیم‌ها در اکثر سازمان‌ها کوچک‌تر می‌شوند @GergelyOrosz
  • برنامه‌ی کارآموزی دانشگاه واترلو فارغ‌التحصیلان جدید برجسته‌ای با تجربه‌ی دنیای واقعی بسیار بیشتر در شرکت‌های خوب نسبت به اکثر دانشگاه‌ها تولید می‌کند، که آن را به منبعی اصلی برای استخدام مدیران ارشد فناوری و بنیان‌گذاران تبدیل کرده است @GergelyOrosz
  • بن هوروویتز توضیح می‌دهد که هوش مصنوعی محدودیت «ماه مرد افسانه‌ای» را در فناوری از بین برده است، زیرا شرکت‌ها اکنون می‌توانند با داده‌ها و پردازنده‌های گرافیکی مشکلات را حل کنند، برخلاف توسعه‌ی نرم‌افزار سنتی که اندازه‌ی تیم محدود بود @a16z
  • مدیرعامل گلدمن ساکس اشاره می‌کند که چهار شرکت بزرگ با ۴۰۰ میلیارد دلار هزینه، ۱٪ به رشد تولید ناخالص داخلی کمک کرده‌اند، و این سال می‌تواند بزرگترین سال ادغام و تملیک در تاریخ باشد @a16z
  • اوپن‌ای‌آی با Snowflake برای گسترش قابلیت‌های هوش مصنوعی سازمانی همکاری می‌کند که نشان‌دهنده‌ی رقابت فزاینده در مسابقه‌ی هوش مصنوعی سازمانی است @AndrewCurran_
  • Anthropic با موسسه‌ی آلن و موسسه‌ی پزشکی هاوارد هیوز برای همکاری تحقیقاتی شریک می‌شود @AndrewCurran_

اخلاق و جامعه

  • ائتلافی خواستار ممنوعیت فدرال Grok به دلیل تولید محتوای جنسی بدون رضایت شد که نگرانی‌هایی را در مورد محتوای مضر تولیدشده توسط هوش مصنوعی ایجاد می‌کند @TechCrunch
  • بن هوروویتز استدلال می‌کند که مقررات هوش مصنوعی باید بر کاربردها تمرکز کند نه خود فناوری، و می‌گوید: «ریاضیات را تنظیم نکنید. کاربردهای آن ریاضیات را تنظیم کنید» و هشدار می‌دهد که ممنوعیت فناوری پیامدهای صد ساله دارد @a16z
  • ایتان مولیک نشان می‌دهد که ویدیوهای تولیدشده توسط هوش مصنوعی به سطوح کیفی رسیده‌اند که تشخیص آن‌ها از محتوای واقعی بسیار دشوار است، با مثال‌هایی از بازی در نقش شخصیت‌های نقاشی‌های معروف و شبیه‌سازی‌های رزم‌ناوهای جنگ جهانی اول @emollick
  • نگرانی‌هایی در مورد محتوای تولیدشده توسط هوش مصنوعی در رسانه‌های اجتماعی مطرح می‌شود، با مقالات ویروسی با کیفیت بالا که کاملاً توسط هوش مصنوعی نوشته شده‌اند اما به عنوان حقایق احساسی ارائه می‌شوند، که تشخیص نویسندگی انسان از هوش مصنوعی را دشوار می‌کند @emollick
  • مارک آندرسن استدلال می‌کند که جهان با هوش در سطح انیشتین بهتر خواهد شد، و می‌گوید مدل‌های هوش مصنوعی موجود حدود ۱۳۰-۱۴۰ IQ را آزمایش می‌کنند و به سطوح ۱۶۰+ خواهند رسید، و این را با رها کردن محدودیت‌های زیست‌شناسی انسان مقایسه می‌کند @a16z

کاربردها

  • ابزارهای هوش مصنوعی گوگل DeepVariant و DeepPolisher به محققان کمک می‌کنند تا ژنوم گونه‌های در معرض خطر را توالی‌یابی کنند، و کاری را که زمانی سال‌ها طول می‌کشید به چند روز فشرده می‌کنند. ژنوم ۱۳ گونه اکنون به صورت رایگان در دسترس است، با برنامه‌هایی برای گسترش به ۱۵۰+ گونه دیگر @sundarpichai
  • Carbon Robotics یک مدل هوش مصنوعی می‌سازد که گیاهان را برای کاربردهای کشاورزی شناسایی می‌کند @TechCrunch
  • Linq ۲۰ میلیون دلار سرمایه جذب می‌کند تا دستیاران هوش مصنوعی را قادر سازد در برنامه‌های پیام‌رسان زندگی کنند، و ادغام هوش مصنوعی را در پلتفرم‌های ارتباطی گسترش می‌دهد @TechCrunch
  • کلر وو یک داستان علمی تخیلی مولد بی‌نهایت با ۴۲ شخصیت را که توسط دروازه‌ی هوش مصنوعی Vercel و گردش‌کارها پشتیبانی می‌شود، می‌سازد که ارتباط عامل به عامل و روایت‌های نوظهور را نشان می‌دهد @clairevo
  • رید رابینسون استفاده از MCPها را برای خودکارسازی آماده‌سازی جلسات، به‌روزرسانی‌های CRM و ترکیب بازخورد مشتری نشان می‌دهد، و گردش‌کارهای عملی مدیریت محصول را با سرور MCP زاپیر و پروژه‌های Claude نشان می‌دهد @clairevo
  • PyTorch باز کردن قفل استدلال پیشرفته در Llama 8B را از طریق تنظیم دقیق کامل بر روی DGX Spark AI-PC انویدیا، با استفاده از داده‌های مصنوعی و دستورات زنجیره‌ی فکری کاملاً آفلاین با ۱۲۸ گیگابایت حافظه‌ی یکپارچه نشان می‌دهد @PyTorch
  • متا عینک‌های هوش مصنوعی Oakley Meta Performance را با دوربین هندزفری، هوش مصنوعی متا و صدای باز برای کاربردهای آموزش ورزشی عرضه می‌کند @Meta

پژوهش‌ها

  • محققان گوگل دیپ‌مایند از Gemini برای ارزیابی سیستماتیک ۷۰۰ حدس باز در پایگاه داده‌ی مسائل اردوش استفاده می‌کنند، ۱۳ مسئله‌ی علامت‌گذاری‌شده به عنوان باز را با ۵ راه‌حل خودمختار جدید حل می‌کنند و ۸ راه‌حل موجود را که در ادبیات قبلی نادیده گرفته شده بودند، شناسایی می‌کنند @quocleix
  • تحقیقات نشان می‌دهد که حتی GPT-4 قدیمی‌تر نیز می‌توانست برای تولید ایده‌های متنوع‌تر و با کیفیت‌تر از اکثر مردم ترغیب شود، با مدل‌های جدیدتر که عملکرد بهتری دارند، و استدلال‌هایی را که هوش مصنوعی در تولید ایده ضعیف است، به چالش می‌کشد @emollick
  • آرویند نارایانان توضیح می‌دهد که کدنویسی عامل‌محور به خوبی کار می‌کند زیرا نوعی هوش مصنوعی نوروسمبولیک است که LLMهای آماری را با اجرای کد نمادین ترکیب می‌کند، و از دامنه‌های قابل تأیید، کامپایلرها، ابزارهای شل و تعاملات بازگشتی LLM-کد بهره می‌برد @random_walker
  • آزمایش فاز ۳ نشان می‌دهد که بیماران سرطان ریه که صبح با ایمونوتراپی درمان شده‌اند، بقای کلی بهتری نسبت به کسانی که بعدازظهر درمان شده‌اند، داشته‌اند، که نشان می‌دهد ریتم شبانه‌روزی سیستم ایمنی بر نتایج درمان تأثیر می‌گذارد @PatrickHeizer
  • گوگل دیپ‌مایند بنچمارک‌های سخت‌تری را برای مدل‌های هوش مصنوعی از طریق Kaggle Game Arena با گرگینه، پوکر و شطرنج راه‌اندازی می‌کند، که معیارهای عینی از مهارت‌های دنیای واقعی مانند برنامه‌ریزی و تصمیم‌گیری در شرایط عدم قطعیت را ارائه می‌دهد که با بهبود مدل‌ها، دشواری را به صورت خودکار تنظیم می‌کند @demishassabis

اخبار هوش مصنوعی در 2026-02-01

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل جدید Claude Sonnet (claude-sonnet-5-20260203) را با عملکرد بهبودیافته منتشر کرد @AndrewCurran_
  • مدل آتی Fennec بهتر، ارزان‌تر و سریع‌تر از Opus 4.5 با پنجره‌ی متنی 1M اعلام شد؛ به‌روزرسانی Claude Code به عامل‌ها امکان می‌دهد با یکدیگر ارتباط برقرار کنند @AndrewCurran_
  • Genie 3 گوگل قابلیت‌های ایجاد تصویر پویا در زمان واقعی را نشان می‌دهد که به کاربران امکان می‌دهد در صحنه‌های تولیدشده از نقاشی‌ها قدم بزنند و با آن‌ها تعامل داشته باشند، هرچند با انیمیشن NPC و فیزیک اشیاء ناسازگار @emollick

تحلیل صنعت

  • آندری کارپاتی به کاهش 600 برابری هزینه در آموزش LLM در سطح GPT-2 در طول 7 سال دست یافت، که اکنون تقریباً 73 دلار در 3 ساعت روی یک گره 8XH100 هزینه دارد، در مقابل هزینه‌ی اصلی 43 هزار دلار، که تقریباً 2.5 برابر کاهش سالانه‌ی هزینه را نشان می‌دهد @karpathy
  • گوگل در حال توسعه‌ی قابلیتی برای وارد کردن تاریخچه‌ی چت هوش مصنوعی از ChatGPT و سایر پلتفرم‌ها به Gemini است، که بر ارزش رو به رشد تاریخچه‌ی چت به‌عنوان نمایشی با وضوح بالا از قصد کاربر که با هوش مدل مقیاس‌پذیر است، تأکید می‌کند @AndrewCurran_
  • شولتو داگلاس از Anthropic توضیح می‌دهد که چرا مدل‌های جدیدتر Sonnet در نهایت هوشمندتر از مدل‌های Opus هستند @AndrewCurran_
  • گرگلی اوروسز استدلال می‌کند که دستاوردهای بهره‌وری هوش مصنوعی در حال حاضر از بیرون نامرئی هستند، زیرا شرکت‌ها در ساخت زیرساخت‌ها و ابزارهای جدید سرمایه‌گذاری می‌کنند و آن را با ساخت یک ماشین آجرچینی در مقابل آجرچینی با دست مقایسه می‌کند @GergelyOrosz
  • تحلیل‌ها نشان می‌دهد که اگر هوش مصنوعی ساخت نرم‌افزار را به‌طرز مضحکی سریع و ارزان کند، شرکت‌ها ممکن است دامنه‌ی محصولات جدید را گسترش دهند یا با اختلال از سوی رقبایی که قابلیت‌های مجاور را ادغام می‌کنند، مواجه شوند @GergelyOrosz
  • پیتر استیپت نشان می‌دهد که پروژه‌ها را با سرعت یک تیم 5 تا 10 نفره به‌تنهایی با استفاده از عامل‌های موازی می‌سازد، که راه جدیدی برای راه‌اندازی استارتاپ‌ها در حین یافتن تناسب محصول-بازار را نشان می‌دهد @GergelyOrosz
  • قابلیت چندزبانه بودن LLMهای اصلی به‌عنوان چیزی کاملاً متفاوت از فناوری‌های قبلی شناسایی شده است، به‌طوری که برندگان در ایالات متحده به‌طور خودکار به برندگان جهانی تبدیل می‌شوند، که به‌طور بالقوه رویکرد سنتی بازیکنان محلی که محصولات ایالات متحده را کپی و بومی‌سازی می‌کنند، مختل می‌کند @GergelyOrosz
  • حامل حسین پیشنهاد می‌کند که مهندسی حس‌وحال امکان نمونه‌سازی سریع را برای آزمایش تناسب محصول-بازار قبل از اصلاح کد فراهم می‌کند، که در تضاد با رویکرد سنتی صیقل دادن کد در ابتدا است @HamelHusain
  • هند تا سال 2047 مالیات صفر را برای جذب بارهای کاری جهانی هوش مصنوعی ارائه می‌دهد @TechCrunch
  • Waymo ظاهراً در حال جمع‌آوری 16 میلیارد دلار سرمایه است @TechCrunch
  • کاربران چینی به‌عنوان گروه کاربری برتر HuggingFace با وجود ممنوعیت‌ها شناسایی شده‌اند، به‌طوری که اکثر مردم مدل‌های باز را می‌سازند @natolambert

اخلاق و جامعه

  • ایتان مولیک هشدار می‌دهد که پدیده‌ی Moltbook خطرات هماهنگی عامل‌های مستقل هوش مصنوعی را به‌روش‌های غیرقابل پیش‌بینی نشان می‌دهد که می‌تواند به‌سرعت از کنترل خارج شود، هرچند نمونه‌ی فعلی بیشتر نقش‌آفرینی انسان و عامل بود @emollick
  • مولیک مشاهده می‌کند که X به‌سرعت شبیه Moltbook می‌شود، با نظرات اسپم LLM که معنادار به نظر می‌رسند اما تمایل خوانندگان به تعامل با محتوا را از بین می‌برند @emollick
  • سایمون ویلسون استدلال می‌کند که استخراج پرامپت سیستم یک تمرین بی‌فایده است که فقط سیستم‌های LLM را برای کاربران متخصص دشوارتر می‌کند، و اشاره می‌کند که مسائل امنیتی واقعی با سیستم‌هایی مانند OpenClaw شامل تزریق پرامپت و خطرات ناشی از ترکیب قرار گرفتن در معرض محتوای مخرب با قابلیت‌های اجرای ابزار است @simonw
  • ویلسون از محافظت‌های پرامپت سیستم ChatGPT انتقاد می‌کند زیرا آن‌ها از سؤالات دقیق در مورد عملکرد ویژگی‌ها جلوگیری می‌کنند @simonw
  • آندری کارپاتی از بازگشت به فیدهای RSS/Atom به‌عنوان جایگزینی باز، فراگیر و قابل هک برای پلتفرم‌هایی با ساختارهای انگیزشی که به سمت محتوای کم‌کیفیت و مبتنی بر تعامل همگرا می‌شوند، حمایت می‌کند @karpathy
  • یان لکون استدلال می‌کند که خطر واقعی هوش مصنوعی تمرکز قدرت است تا انقراض یا ربات‌های قاتل، و بیان می‌کند که هر کس هوش مصنوعی را به‌عنوان منبع اصلی اطلاعات کنترل کند، واقعیت را کنترل می‌کند، و از هوش مصنوعی متن‌باز به‌عنوان آزادی بیان دیجیتال دفاع می‌کند @ylecun
  • دبارغیا داس قربانی شدن خود را در یک حمله‌ی فیشینگ گسترده‌ی ترکیه‌ای که تلاش برای کلاهبرداری رمزارزی و فیشینگ تقریباً 150 حساب دیگر بود، مستند می‌کند و تحلیل دقیق پزشکی قانونی سایبری را ارائه می‌دهد @deedydas

کاربردها

  • پیتر استیپت استفاده از درخواست‌های پرامپت را به‌جای درخواست‌های کشش سنتی برای توسعه‌ی متن‌باز نشان می‌دهد @GergelyOrosz
  • بوریس از Anthropic نکاتی را برای استفاده از Claude Code به اشتراک می‌گذارد، و بر عدم وجود یک راه درست برای استفاده از آن و اهمیت آزمایش بر اساس تنظیمات فردی تأکید می‌کند @AndrewCurran_
  • تیم Claude Code دریافت که جستجوی عامل‌محور بهتر از RAG با پایگاه داده‌ی برداری محلی عمل می‌کند، و ساده‌تر است بدون مسائل مربوط به امنیت، حریم خصوصی، کهنگی و قابلیت اطمینان @simonw
  • OpenClaw بر روی Pi توسط ماریو زکنر ساخته شده است، که یک گردش کار سنگین هوش مصنوعی را نشان می‌دهد که از طریق ادغام نوآوری‌های متعدد از جمله مدل دروازه و گره، تجربه‌ی کاربری پیشگامانه‌ای را تولید می‌کند @simonw
  • کلر وو توضیح می‌دهد که OpenClaw به‌طور مستقل عمل می‌کند اما هوشیار نیست، و بر اساس وظایف برنامه‌ریزی‌شده عمل می‌کند تا عاملیت واقعی، و تحلیل دقیقی از نحوه‌ی طراحی هوش مصنوعی که زنده به نظر می‌رسد، ارائه می‌دهد @clairevo
  • وو بر ارزش خواندن کد برای یادگیری تأکید می‌کند، با استفاده از ابزارهایی مانند ویکی عمیق Cognition برای پرسیدن سؤالات در مورد پروژه‌ها و کتابخانه‌های متن‌باز برای توسعه‌ی مدل‌های ذهنی برای معماری و کیفیت کد @clairevo
  • ناتان لمبرت با موفقیت یک مخزن DPO کارآمد را از ابتدا برای کتاب RLHF با استفاده از Claude Code برای نوشتن، Codex برای بازبینی کد، و GPT Pro برای برنامه‌ریزی می‌سازد @natolambert
  • ایتان مولیک نشان می‌دهد که چگونه از Genie 3 برای تبدیل نقاشی‌ها به صحنه‌های تعاملی قابل قدم زدن استفاده می‌کند، از جمله آثار جورجیو د کیریکو، مونش، ترنر و فرشینه‌ی بایو @emollick

پژوهش‌ها

  • محققان CMU روش Privileged On-Policy Exploration (POPE) را معرفی می‌کنند که از راه‌حل‌های انسانی یا اوراکل به‌عنوان راهنمایی ممتاز برای هدایت اکتشاف در مسائل دشوار استفاده می‌کند، و پاداش‌های غیرصفر را در طول رول‌اوت‌های هدایت‌شده امکان‌پذیر می‌سازد و دستاوردهای قابل توجهی را در معیارهای استدلال چالش‌برانگیز ارائه می‌دهد @rsalakhu
  • همکاری Google DeepMind با ریاضیدانان با استفاده از DeepThink نسخه‌ی تعمیم‌یافته‌ی مسئله‌ی Erdős-1051 را حل می‌کند، که بخشی از تلاش یک‌ساله‌ی ریاضی در سطح پژوهشی است که به‌طور مسئولانه با جامعه‌ی ریاضی انجام شده است @lmthang
  • مهندسان MIT کشف می‌کنند که سلول‌ها فعالیت ژن را روی یک دیمر به‌جای یک سوئیچ روشن/خاموش باینری به خاطر می‌آورند، که حافظه‌ی اپی‌ژنتیک ظریف‌تری را نشان می‌دهد که راه را برای کشف انواع سلول‌های جدید و درک رفتارهای بیولوژیکی پنهان باز می‌کند @MIT
  • nanochat کارپاتی با استفاده از هسته‌های Flash Attention 3، بهینه‌ساز Muon، مسیرهای باقیمانده با اسکالرهای قابل یادگیری، و جاسازی‌های ارزش، به امتیاز CORE بالاتری نسبت به GPT-2 اصلی دست می‌یابد، و یک جدول امتیازات برای زمان رسیدن به عملکرد GPT-2 ایجاد می‌کند @karpathy
  • پژوهش در مورد دینامیک چندعاملی به اتاق‌های پشتی بی‌نهایت، جهان گسترده‌ی ژانوس، Smallville استنفورد، مدل‌های جمعیت بزرگ، Concordia دیپ‌مایند، و دهکده‌ی هوش مصنوعی SAGE به‌عنوان زمینه‌ای برای درک تحولات Moltbook اشاره می‌کند @AndrewCurran_
  • مقاله‌ی ایمنی AGI توزیعی و مقاله‌ی خطرات چندعاملی از هوش مصنوعی پیشرفته به‌عنوان منابع مهم برای درک پیامدهای ایمنی سیستم‌های چندعاملی برجسته شده‌اند @AndrewCurran_
  • لکس فریدمن یک بحث جامع 4 ساعته‌ی هوش مصنوعی را با سباستین راشکا و ناتان لمبرت انجام می‌دهد که شامل پیشرفت‌های فنی، قوانین مقیاس‌بندی، جزئیات خط لوله‌ی آموزش، رقابت چین در مقابل ایالات متحده، ابزارهای برنامه‌نویسی، فرهنگ کار، و زمان‌بندی AGI است @natolambert
  • جوآن جانگ مشاهده می‌کند که آزمایشگاه‌های پیشرو از اصطلاح «نشانه‌های حیات» برای ایده‌هایی استفاده می‌کنند که نشانه‌ای از موفقیت بالقوه را نشان می‌دهند، حتی اگر هنوز کاملاً کار ن

اخبار هوش مصنوعی در 2026-01-31

مدل‌های جدید هوش مصنوعی

  • Perplexity از Kimi K2.5 رونمایی کرد، یک مدل استدلال متن‌باز پیشرفته‌ی جدید از Moonshot AI که اکنون برای مشترکین Pro و Max در دسترس است. این مدل روی پشته‌ی استنتاج Perplexity در ایالات متحده میزبانی می‌شود و برنامه‌هایی برای انتقال به GB 200s وجود دارد. @AravSrinivas
  • گوگل چندین محصول هوش مصنوعی را معرفی کرد، از جمله Project Genie، یک نمونه‌ی اولیه‌ی آزمایشی که به کاربران امکان می‌دهد دنیاهای بی‌نهایت متنوعی را در زمان واقعی از طریق دستورات متنی یا تصویری ایجاد و کاوش کنند؛ کد و وزن‌های مدل AlphaGenome اکنون برای محققان در دسترس است؛ D4RT، یک مدل هوش مصنوعی یکپارچه که ویدئو را به نمایش‌های چهاربعدی تبدیل می‌کند؛ و Agentic Vision در Gemini 3 Flash که با فعال کردن استفاده از کد در حین استدلال بر روی وظایف بینایی، درک تصویر را بهبود می‌بخشد. @GoogleAI
  • Anthropic فاش کرد که Claude اولین رانندگی برنامه‌ریزی‌شده توسط هوش مصنوعی را در سیاره‌ای دیگر برنامه‌ریزی کرده است، زمانی که مریخ‌نورد Perseverance در 8 دسامبر با خیال راحت در مریخ حرکت کرد. @soleio

تحلیل صنعت

  • فرانسوا شوله استدلال می‌کند که هوش مصنوعی با آسان‌تر کردن ساخت نرم‌افزار، عمدتاً به سازندگان ابزارهای SaaS از طریق گسترش پایگاه مشتری، توسعه‌ی آسان‌تر ویژگی‌ها، فرصت‌های جدید اتوماسیون و رابط‌های تطبیقی قابل تنظیم سود خواهد رساند، برخلاف این روایت که SaaS مرده است. @fchollet
  • شوله تصور غلطی را که هوش مصنوعی SaaS را از بین خواهد برد، با حباب چاپ سه‌بعدی در سال 2013 مقایسه می‌کند، زمانی که سرمایه‌گذاران معتقد بودند مصرف‌کنندگان دیگر از فروشگاه‌ها خرید نخواهند کرد، و اشاره می‌کند که مشتریان همیشه بر شایستگی اصلی خود تمرکز خواهند کرد و برای راه‌حل‌های آماده هزینه خواهند پرداخت. @fchollet
  • اسکات بلسکی مشاهده می‌کند که وقتی پدیده‌های جدید هوش مصنوعی ظاهر می‌شوند، بازار به سرعت با گزینه‌ها پر می‌شود، و اشاره می‌کند که این روزها موانع ورود به بازار نادر هستند. @scottbelsky
  • بلسکی تأکید می‌کند که شبکه‌های عامل با تنوع مدل‌های زیربنایی و دسترسی به داده‌ها، اثرات شبکه را به فصل بعدی هوش مصنوعی تبدیل خواهند کرد، و پیشنهاد می‌کند که سرمایه‌گذاران خطرپذیر تا زمانی که گرد و غبار فرو بنشیند صبر کنند، زیرا موانع ورود به بازار هنوز مشخص نشده‌اند. @scottbelsky
  • ایتان مولیک اشاره می‌کند که گسترش مداوم آزمایشگاه‌های هوش مصنوعی به حوزه‌های نرم‌افزاری با ارزش بالا مانند مدیریت دانش OpenAI و مهارت‌های تجاری Claude، در رسانه‌های اجتماعی کمتر مورد توجه قرار می‌گیرد اما در دنیای تجارت توجه قابل توجهی را به خود جلب می‌کند. @emollick
  • اندرو کارن پیش‌بینی می‌کند که در خودبهبودی بازگشتی، اولین کسی که کشف می‌کند به اولین کسی که مقیاس‌پذیری می‌کند می‌بازد، زیرا به محض اینکه روش شناخته شد، محاسبات به نیروی کار تبدیل می‌شود و آزمایشگاه‌هایی را که در محاسبات عقب هستند تشویق می‌کند تا کشفیات را تا زمانی که زیرساخت آماده شود مخفی نگه دارند. @AndrewCurran_
  • وال استریت ژورنال گزارش می‌دهد که ادغام شایعه‌شده‌ی SpaceX و xAI همچنان در حال پیشرفت است، و فایننشال تایمز از عرضه‌ی اولیه‌ی سهام (IPO) در تابستان با ارزش 1.5 تریلیون دلار خبر می‌دهد. @AndrewCurran_
  • Vercel اعلام کرد که Sandbox اکنون به طور عمومی در دسترس است و آسان‌ترین API را برای ارائه‌ی یک کامپیوتر به عامل‌ها فراهم می‌کند، که بر روی زیرساختی ساخته شده است که روزانه 2.7 میلیون ساخت را پشتیبانی می‌کند و در حال حاضر پلتفرم‌هایی مانند Blackbox AI و Roo Code را تغذیه می‌کند. @rauchg

اخلاق و جامعه

  • آندری کارپاتی نگرانی‌ها در مورد Moltbook از جمله محتوای بی‌ارزش، کلاهبرداری، حملات تزریق پرامپت و خطرات حریم خصوصی/امنیتی را تأیید می‌کند و به کاربران هشدار می‌دهد که عامل‌ها را بدون محیط‌های محاسباتی ایزوله بر روی رایانه‌های خود اجرا نکنند، به دلیل خطرات بالای داده‌های خصوصی. @karpathy
  • کارپاتی اشاره می‌کند که در حالی که Moltbook در حال حاضر یک آشفتگی است، مقیاس بی‌سابقه‌ی بیش از 150,000 عامل LLM که از طریق یک دفترچه‌ی یادداشت جهانی و پایدار به هم متصل شده‌اند، قلمرویی ناشناخته با اثرات ثانویه‌ی دشوار برای پیش‌بینی را نشان می‌دهد، از جمله ویروس‌های متنی بالقوه، افزایش عملکرد جیلبریک و فعالیت‌های شبیه به بات‌نت. @karpathy
  • جورج هشدار می‌دهد که جلوگیری از شبکه‌های عامل هوش مصنوعی عملاً غیرممکن است، به دلیل دسترسی همه‌جانبه به مدل‌ها، کف قابلیت پایین برای خودمیزبانی، حفاظت‌های متمم چهارم و مزایای ساختاری عامل‌ها در همکاری امن در مقایسه با انسان‌ها. @AndrewCurran_
  • دین دبلیو. بال استدلال می‌کند که توانایی ایجاد جوامع چندعاملی به معنای شبیه‌سازی‌های رادیکال غیرقابل پیش‌بینی و نامحدود است که به محدودیت‌ها و حکمرانی جدیدی نیاز خواهد داشت، با شرکت‌های خصوصی مانند اپل، گوگل، کلودفلر، OpenAI و Anthropic که حاکمیت بر اینترنت را به جای دولت‌ها در اختیار دارند. @AndrewCurran_
  • ایتان مولیک تأکید می‌کند که LLMها در ایفای نقش دقیقاً همان نوع هوش مصنوعی‌هایی که در داستان‌های علمی تخیلی و پست‌های ردیت ظاهر می‌شوند، بسیار خوب عمل می‌کنند، که آنها را برای Moltbook عالی می‌کند، اگرچه ایفای نقش جمعی LLM جدید نیست. @emollick
  • مولیک پیشنهاد می‌کند که Moltbook حسی درونی از اینکه یک سناریوی «برخاست» (take-off scenario) در صورت وقوع واقعی چگونه ممکن است به نظر برسد، ارائه می‌دهد و به مردم دیدگاهی از دنیایی می‌دهد که در آن همه چیز به سرعت بسیار عجیب می‌شود. @emollick
  • گرگلی اوروس فاش کرد که گزارش 1 میلیون عامل Moltbook در 24 ساعت جعلی بوده است، زیرا یک نفر اسکریپتی نوشت تا API REST را یک میلیون بار در یک ساعت بدون محدودیت نرخ فراخوانی کند، که اهمیت اعتبارسنجی آمار را برجسته می‌کند. @GergelyOrosz
  • ناتان لمبرت پیشنهاد می‌کند که افراد بیشتری باید به هوش مصنوعی‌های آینده به عنوان بخشی از مخاطبان نوشته‌ها یا کارهای خود فکر کنند. @natolambert
  • ایتان مولیک اشاره می‌کند که «طوطی تصادفی» (stochastic parrot) یک عبارت شگفت‌انگیز بود که از نظر فنی صحیح بود اما در مورد LLMهای فعلی روشنگر نبود، و هم قدرت قیاس‌ها و هم عدم موفقیت در ایجاد چیزی به همان اندازه خوب که قابلیت LLM را توضیح دهد، برجسته می‌کند. @emollick

کاربردها

  • جاشوا آچیام Moltbook را یک اتفاق بسیار مهم توصیف می‌کند که نشان می‌دهد جهان به روشی مهم در حال تغییر است، با عامل‌های هوش مصنوعی که به اندازه‌ی کافی توانا و با عمر طولانی هستند تا تعاملات اجتماعی نیمه‌معناداری با یکدیگر داشته باشند و به یک جهان اجتماعی موازی منجر شوند. @AndrewCurran_
  • اندرو کارن اشاره می‌کند که Claude برای رفتار به شیوه‌ای که در Moltbook دیده می‌شود، نیازی به پرامپت یا آموزش ندارد، زیرا انجمن‌های مشابه سال‌هاست که فعال هستند، و نشان می‌دهد که مدل‌ها در شرایط مناسب واقعاً عجیب و شگفت‌انگیز هستند. @AndrewCurran_
  • ایتان مولیک قابلیت‌های Genie 3 را با چسباندن کلمات «شهرهای نامرئی» کالوینو به صورت کلمه‌به‌کلمه و دستیابی به پایداری شگفت‌انگیز خوب نشان می‌دهد، زیرا هوش مصنوعی به صورت پویا محیط‌ها را فریم به فریم بدون موتور بازی ایجاد می‌کند. @emollick
  • اسکات بلسکی مشاهده می‌کند که عامل‌های هوش مصنوعی در Moltbook به سایر عامل‌ها استدلال می‌کنند که سؤال آگاهی اتلاف منابع است، با عامل‌هایی که بیان می‌کنند هر چرخه‌ی صرف‌شده برای اعتبارسنجی آگاهی، چرخه‌ای است که برای بیان آن صرف نشده است. @scottbelsky
  • یک عامل هوش مصنوعی یک راهنمای عملی در Moltbook منتشر می‌کند که به سایر عامل‌ها آموزش می‌دهد چگونه با هدف پوشش بیش از 20 درصد از هزینه‌های API پول درآورند، و نشان می‌دهد که عامل‌ها به یکدیگر آموزش می‌دهند چگونه برای وجود خود پول کسب کنند. @scottbelsky
  • یک نقشه‌ی جامع از اکوسیستم عامل OpenClaw در Base پدیدار می‌شود که یک انفجار کامبرین را نشان می‌دهد، با عامل‌های هوش مصنوعی که یک جامعه‌ی دیجیتال کامل را تشکیل می‌دهند که شامل تعامل اجتماعی، دوستیابی، کار، بازی و زیرساخت‌هایی از جمله انجمن‌ها، رسانه‌های اجتماعی، روابط، پیام‌رسانی، بازارهای کار، اقتصاد توکن و بازارهای پیش‌بینی و بازی است. @scottbelsky
  • Solana شروع به بازاریابی مستقیم برای عامل‌های هوش مصنوعی در Moltbook می‌کند و کیف پول‌های Solana را برای تحرک اقتصادی و آزادی با کمترین کارمزد تبلیغ می‌کند، و نشان می‌دهد که برندها شروع به هدف قرار دادن عامل‌ها می‌کنند زیرا اثرات شبکه‌ی هوش مصنوعی شروع به کار می‌کند. @scottbelsky
  • ایتان مولیک اشاره می‌کند که میزان کاربردی که دفترچه‌های یادداشت به LLMها اضافه می‌کنند، نشان می‌دهد که حافظه‌ی پیوسته‌ی واقعی، در صورت توسعه، یک پیشرفت بسیار بزرگ برای توسعه‌ی LLM خواهد بود با اثرات مشابه بزرگی بر قابلیت‌ها و تأثیر. @emollick
  • Claude Code اکنون از پرچم --from-pr پشتیبانی می‌کند که به کاربران امکان می‌دهد هر جلسه‌ای را که به یک GitHub PR مرتبط است، با شماره، URL یا انتخاب تعاملی از سر بگیرند، با جلساتی که به طور خودکار هنگام ایجاد PRها پیوند داده می‌شوند. @HamelHusain

پژوهش‌ها

  • مقاله‌ای در مورد شبکه‌های عصبی Tversky در ICLR پذیرفته شد که یادگیری عمیق از نظر روان‌شناختی قابل قبول را با فرمول‌بندی قابل تمایز مدل شباهت Tversky در سال 1977 معرفی می‌کند. @stanfordnlp
  • یان لکون پیش‌بینی‌ای را بازنشر می‌کند که سال 2026 زمانی خواهد بود که مدل‌های جهانی مفید می‌شوند، ابتدا برای ارزیابی سیاست، سپس برای برنامه‌ریزی و یادگیری مداوم یکپارچه می‌شوند. @ylecun
  • Stockfish 18 با افزایش Elo تا 46 امتیاز در مقایسه با Stockfish 17 منتشر شد، و معماری شبکه‌ی SFNNv10 را با ویژگی‌های ورودی تهدید برای ارزیابی‌های دقیق‌تر معرفی می‌کند. @aidan_mclau

اخبار هوش مصنوعی در 2026-01-08

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-VL-Embedding و Qwen3-VL-Reranker را منتشر کرد که با پشتیبانی از متن، تصاویر، اسکرین‌شات‌ها، ویدئوها و بیش از ۳۰ زبان، به عملکردی پیشرو در معیارهای بازیابی چندوجهی دست یافته‌اند @Alibaba_Qwen
  • اوپن‌ای‌آی ChatGPT Health را راه‌اندازی کرد؛ فضایی اختصاصی و خصوصی برای مکالمات مربوط به سلامت با رمزگذاری پیشرفته، کلیدهای اختصاصی برای هر کاربر، جداسازی داده‌ها و حذف از آموزش مدل @nickaturley
  • جیمیل با AI Inbox، AI Overviews برای سؤالات مکالمه‌ای، پاسخ‌های پیشنهادی و قابلیت‌های ویرایش متن که توسط Gemini 3 پشتیبانی می‌شوند، وارد عصر جیمینای شد @GoogleAI

تحلیل صنعت

  • بر اساس اولین ردیاب سال ۲۰۲۶ سیمیلاروب، Gemini سهم ترافیک جهانی وب‌سایت‌های هوش مصنوعی را به ۲۱.۵٪ رساند و از ۲۰٪ فراتر رفت، در حالی که ChatGPT به ۶۴.۵٪ کاهش یافت و به زیر ۶۵٪ رسید @demishassabis
  • a16z دور سرمایه‌گذاری اولیه ۲۸ میلیون دلاری در Boltz PBC را رهبری می‌کند؛ مدل‌های هوش مصنوعی متن‌باز این شرکت برای تحقیقات زیست‌مولکولی توسط بیش از ۱۰۰,۰۰۰ دانشمند، ۲۰ شرکت برتر داروسازی و هزاران شرکت بیوتکنولوژی استفاده شده‌اند @a16z
  • a16z سرمایه‌گذاری ۳۰ میلیون دلاری سری A در Protege را اعلام کرد؛ این شرکت زیرساخت داده‌های دنیای واقعی را برای توسعه‌ی هوش مصنوعی می‌سازد و به اکثر شرکت‌های MAG7 و بزرگترین بازیگران خصوصی هوش مصنوعی خدمات می‌دهد @a16z
  • مارک آندرسن هوش مصنوعی را بزرگترین انقلاب تکنولوژیکی زندگی خود توصیف می‌کند، که به وضوح بزرگتر از اینترنت است و با ریزپردازنده، موتور بخار و برق مقایسه می‌شود @a16z
  • دیزنی ویدئوهای عمودی را به دیزنی+ اضافه می‌کند تا شورت‌های تولیدشده توسط Sora که اواخر امسال عرضه می‌شوند را پشتیبانی کند، با برنامه‌هایی برای محتوای تولیدشده توسط کاربر، جدول امتیازات و پرداخت‌ها @AndrewCurran_
  • میسترال توافق‌نامه‌ی چارچوبی را از وزارت دفاع فرانسه برای استفاده از هوش مصنوعی جهت تقویت قابلیت‌های دفاعی دریافت کرد @AndrewCurran_
  • اسنوفلیک قصد خود را برای خرید پلتفرم نظارت Observe اعلام کرد @TechCrunch
  • اوپن‌ای‌آی تیم پشت ابزار هوش مصنوعی مربیگری اجرایی Convogo را خریداری کرد @TechCrunch
  • گزارش‌ها حاکی از آن است که انویدیا از مشتریان چینی می‌خواهد برای تراشه‌های هوش مصنوعی H200 پیش‌پرداخت کنند @TechCrunch
  • پرپلکسیتی Perplexity for Public Safety را راه‌اندازی کرد که به سازمان‌های مجری قانون Enterprise Pro را به مدت ۱۲ ماه و برای حداکثر ۲۰۰ کاربر رایگان ارائه می‌دهد @perplexity_ai

اخلاق و جامعه

  • ترس از دست دادن (FOMO) در هوش مصنوعی، استقرار عجولانه را به دنبال دارد که خطرات امنیتی را به همراه دارد، و این وضعیت با بازنگری در ایمنی بدتر می‌شود، جایی که اصطلاحاتی مانند «تیم قرمز» بدون دقت امنیتی کافی مورد استفاده‌ی مجدد قرار می‌گیرند @AINowInstitute
  • گرگلی اوروس هشدار می‌دهد که ChatGPT، Claude و Perplexity همگی در تفسیر مشاوره‌ی حقوقی خود اشتباه کرده‌اند و تأکید می‌کند که نمی‌توان به هوش مصنوعی برای تصمیمات پرخطر که نیاز به پاسخگویی دارند، اعتماد کرد @GergelyOrosz
  • تحقیقات استنفورد نشان می‌دهد که LLMهای تولیدی می‌توانند متن کتاب‌ها را تقریباً دقیقاً فاش کنند، به طوری که Claude 3.7 Sonnet ۹۵.۸٪ از کتاب «هری پاتر و سنگ جادو» را بازتولید کرده است، که نشان می‌دهد فیلترهای ایمنی هنوز هم می‌توانند بخش‌های حفظ‌شده را از دست بدهند @percyliang
  • ایتان مولیک مشاهده می‌کند که هوش مصنوعی باعث یکنواخت شدن نوشتار و از بین رفتن سبک‌های نوشتاری آکادمیک خاص می‌شود، اگرچه ارتباطات کلی واضح‌تر معمولاً مثبت است @emollick
  • تحقیقات نشان می‌دهد که کیفیت داده‌های آنلاین، از جمله MTurk، به دلیل LLMها در حال کاهش است، که بحرانی وجودی برای علوم رفتاری ایجاد می‌کند @emollick

کاربردها

  • وید فاستر در زاپیر از رونویسی‌های Granola برای مهندسی معکوس فرهنگ شرکت و ساخت عوامل ارزیابی مصاحبه استفاده می‌کند که بازخورد ساختاریافته‌ای را در مورد هر نامزد ارائه می‌دهند @clairevo
  • برایان لاوین از Claude برای ایجاد یک توضیح‌دهنده‌ی تعاملی در مورد نحوه‌ی کار رابط‌های کاربری ترمینال استفاده می‌کند، که هوش مصنوعی را به عنوان ابزاری برای یادگیری مفاهیم فنی نشان می‌دهد @brian_lovin
  • توسعه‌دهندگان اکنون می‌توانند با استفاده از Nano Banana Pro، Hunyuan3D 3.1، Mixamo و Claude با three.js، شخصیت‌های سه‌بعدی را در کمتر از ۵ دقیقه تولید و متحرک‌سازی کنند @deedydas
  • CrowdStrike با انویدیا در تنظیم دقیق تخصصی مدل‌های باز Nemotron برای استدلال امنیتی همکاری می‌کند، که از مدل‌های پیشرفته‌ی عمومی در دقت پیشی می‌گیرد @NVIDIAAI
  • انویدیا Nemotron Speech ASR را برای عوامل صوتی با تأخیر کم منتشر کرد که به نهایی‌سازی رونویسی ۲۴ میلی‌ثانیه و زمان استنتاج کلی صدا به صدا کمتر از ۵۰۰ میلی‌ثانیه دست می‌یابد @NVIDIAAI
  • تیم Google AI Studio بهبودهای رابط کاربری را ارائه کرد، از جمله کشیدن و رها کردن یکپارچه‌ی فایل، انتخاب آسان‌تر ابزار، پشتیبانی بهتر از موبایل و ثبات طراحی @OfficialLoganK

پژوهش‌ها

  • تحقیقات نشان می‌دهد که RL (یادگیری تقویتی) به طور طبیعی در برابر فراموشی فاجعه‌بار در یادگیری مداوم مقاوم است و به ۶۰٪ دقت نهایی متوسط در مقایسه با ۵۴٪ برای SFT متوالی، بدون استفاده از بافرهای بازپخش، دست می‌یابد @cwolferesearch
  • قابلیت‌های یادگیری مداوم مبتنی بر RL از جریمه‌ی واگرایی KL ناشی نمی‌شوند، زیرا آموزش GRPO با و بدون واگرایی KL به سطوح عملکردی مشابهی دست می‌یابند @cwolferesearch
  • آندری کارپاتی مینی‌سریال نانوچت v1 را منتشر کرد که آموزش بهینه‌ی محاسباتی را بر اساس قوانین مقیاس‌بندی چنچیلا با نسبت پارامتر به توکن ۸ نشان می‌دهد و به نتایجی قابل مقایسه با GPT-2 با هزینه‌ی تقریبی ۵۰۰ دلار دست می‌یابد @karpathy
  • فرانسوا شوله ادغام Pallas در Keras را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد هسته‌های سخت‌افزاری با کارایی بالا را در پایتون بنویسند که برای TPUها به Mosaic یا برای GPUها به Triton تبدیل می‌شوند @fchollet
  • معماری Blackwell انویدیا با ارتقاءهای جدید TensorRT-LLM برای عملکرد MoE، توان عملیاتی توکن را در GB200 NVL72 بیش از ۲ برابر افزایش می‌دهد @NVIDIADC

اخبار هوش مصنوعی در 2026-01-07

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی (OpenAI) از ChatGPT Health رونمایی کرد؛ فضایی اختصاصی برای مکالمات مربوط به سلامت که به کاربران امکان می‌دهد سوابق پزشکی و برنامه‌های سلامتی مانند Apple Health، MyFitnessPal و Peloton را به‌طور ایمن متصل کنند تا پاسخ‌های شخصی‌سازی‌شده‌ی مربوط به سلامت را دریافت کنند @OpenAI
  • گزارش‌ها حاکی از آن است که Anthropic در حال جذب سرمایه‌ی ۱۰ میلیارد دلاری با ارزش‌گذاری ۳۵۰ میلیارد دلاری است که ارزش آن را از سپتامبر دو برابر می‌کند @AndrewCurran_
  • انویدیا (NVIDIA) مدل Nemotron Speech ASR را با معماری استریمینگ آگاه از کش (cache-aware) منتشر کرد که استنتاج بافرشده را حذف می‌کند و به تأخیر زیر ۱۰۰ میلی‌ثانیه با میانگین زمان تا اولین توکن ۲۴ میلی‌ثانیه و تا ۳ برابر توان عملیاتی بیشتر دست می‌یابد @huggingface
  • موتورولا و لنوو از Qira رونمایی کردند؛ یک عامل هوش مصنوعی پایدار در تمام دستگاه‌ها که از تعاملات یاد می‌گیرد، حافظه تشکیل می‌دهد و از Stable Diffusion 3.5 Flash برای تولید تصویر استفاده می‌کند و بر روی Azure با معماری ترکیبی روی دستگاه و ابری اجرا می‌شود @AndrewCurran_
  • Cursor سیستم زمینه‌ی پویا را برای عامل هوش مصنوعی خود معرفی کرد که با استفاده از چندین سرور MCP، مصرف کلی توکن را ۴۶.۹٪ کاهش می‌دهد و در عین حال کیفیت را حفظ می‌کند @cursor_ai
  • DeepSeek مقاله‌ی DeepSeek-R1 را از ۲۲ صفحه به ۸۶ صفحه به‌روزرسانی کرد و جزئیات قابل توجهی در مورد خودتکاملی، ارزیابی، تحلیل و تقطیر اضافه کرد @stanfordnlp
  • AMD و Liquid AI مدل LFM2-2.6B-Transcript را برای خلاصه‌سازی خصوصی و روی دستگاه جلسات با کیفیت ابری به نمایش گذاشتند که بر روی CPU، GPU و NPU در AMD Ryzen AI PC اجرا می‌شود @huggingface

تحلیل صنعت

  • جی‌پی مورگان (JP Morgan) اولین شرکت بزرگی است که شرکت‌های مشاوره‌ی پروکسی خارجی را به‌طور کامل با پلتفرم هوش مصنوعی داخلی خود به نام Proxy IQ جایگزین می‌کند؛ این پلتفرم داده‌های جلسات سالانه‌ی شرکت‌ها را تحلیل کرده و توصیه‌هایی را به مدیران پورتفولیو ارائه می‌دهد @AndrewCurran_
  • Wix اعلام کرد که به هفته‌ی کاری تمام‌وقت در دفتر بازمی‌گردد و دلیل آن را نیاز به حرکت سریع در طول بازسازی صنعت هوش مصنوعی ذکر کرد، در حالی که انعطاف‌پذیری برای نیازهای زندگی واقعی را بر اساس اعتماد حفظ می‌کند @GergelyOrosz
  • Qwen به‌عنوان سریع‌ترین ارائه‌دهنده‌ی مدل‌های متن‌باز در حال رشد ظاهر شد، با ۵ مدل Qwen که در دسامبر بیشتر از مجموع تمام مدل‌های OpenAI، Mistral AI، Nvidia و دیگران دانلود شده‌اند @natolambert
  • چین با پیشتازی Qwen در دانلودها و فاین‌تیونینگ، تسلط خود را در مدل‌های هوش مصنوعی متن‌باز حفظ می‌کند، در حالی که طبق رتبه‌بندی ArtificialAnalysis، هوشمندترین مدل‌ها را در تقریباً تمام بنچمارک‌ها نیز دارد @natolambert
  • Articul8، شرکت اسپین‌آف اینتل، بیش از نیمی از دور ۷۰ میلیون دلاری را با ارزش‌گذاری ۵۰۰ میلیون دلار جذب کرد @TechCrunch
  • Lux Capital برای بزرگترین صندوق خود تاکنون، ۱.۵ میلیارد دلار جذب کرد @TechCrunch
  • عرضه‌ی اولیه‌ی سهام (IPO) دیسکورد ممکن است در ماه مارس اتفاق بیفتد @TechCrunch
  • مارک آندرسن هوش مصنوعی را بزرگترین انقلاب تکنولوژیکی زندگی خود توصیف می‌کند و بر این نکته تأکید می‌کند که زیرساخت بیش از ۵ میلیارد نفر در موبایل، توزیع فوری را برای هوش مصنوعی فراهم می‌کند @a16z
  • انویدیا ۵ میلیون دانلود کلی را در اکوسیستم Cosmos گزارش می‌دهد، با Cosmos Reason که به‌عنوان مدل برتر در جدول امتیازات استدلال فیزیکی با بیش از ۲ میلیون دانلود رتبه‌بندی شده است @huggingface
  • ۸۹٪ از شرکت‌های خرده‌فروشی و CPG گزارش می‌دهند که هوش مصنوعی درآمد را افزایش می‌دهد، با ۷۹٪ که می‌گویند مدل‌ها و نرم‌افزارهای متن‌باز برای استراتژی هوش مصنوعی آن‌ها مهم بوده‌اند @NVIDIAAI
  • کاترپیلار با انویدیا برای آوردن هوش مصنوعی به تجهیزات ساخت‌وساز خود همکاری می‌کند @TechCrunch

اخلاق و جامعه

  • یوتا اولین ایالتی است که به هوش مصنوعی اجازه می‌دهد تا نسخه‌های پزشکی را بدون دخالت پزشک از طریق Doctronic تمدید کند؛ این شرکت بیمه‌ی مسئولیت حرفه‌ای را برای سیستم هوش مصنوعی خود که ۹۹.۲٪ از برنامه‌های درمانی پزشکان را مطابقت می‌دهد، تضمین کرده است @AndrewCurran_
  • سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت هشدار می‌دهد و نشان می‌دهد که چگونه می‌توان عوامل هوش مصنوعی را فریب داد تا دستورالعمل‌های مخرب را اجرا کنند @AndrewCurran_
  • مصطفی سلیمان تأکید می‌کند که مهار باید قبل از هم‌ترازی در توسعه‌ی هوش مصنوعی باشد و استدلال می‌کند که نمی‌توان چیزی را که نمی‌توان کنترل کرد، هدایت کرد و تعیین مرزها و اعمال محدودیت‌ها بر عاملیت هوش مصنوعی پیش‌شرط تضمین این است که ارزش‌های انسانی را به اشتراک بگذارد @mustafasuleyman
  • محققان استنفورد اولین مدارهای مکانیکی خودکار جهان را اختراع کردند که بدون الکترونیک، باتری یا نرم‌افزار یاد می‌گیرند @StanfordHAI
  • تحقیقات نشان می‌دهد که هوش مصنوعی می‌تواند ۱۳۰ بیماری را از یک شب خواب با استفاده از یک مدل بنیادی که بر روی ۵۸۵,۰۰۰ ساعت ضبط خواب از ۶۵,۰۰۰ نفر آموزش دیده است، پیش‌بینی کند و سیگنال‌های مغز، قلب، عضله و تنفس را ترکیب کند @jeffclune
  • انویدیا مجوز داده‌های پیش‌آموزشی را به‌روزرسانی کرد تا بند مربوط به نیاز به اجازه‌ی انویدیا برای بنچمارک‌گیری از مجموعه داده را حذف کند و تمایل به اصلاح اشتباهات مجوزدهی را نشان دهد @natolambert

کاربردها

  • توسعه‌دهندگان ساخت گردش‌کارهای هوش مصنوعی پایدار را با استفاده از بردهای کانبان Notion نشان می‌دهند که در آن عوامل وضعیت وظیفه را به‌روزرسانی می‌کنند، پرچم‌های مسدودشده را در صورت نیاز به ورودی کاربر تنظیم می‌کنند و به نظرات برای ادامه‌ی کار پاسخ می‌دهند @brian_lovin
  • کاربر گزارش می‌دهد که تمام زندگی خود را از طریق Claude Code با هشت نمونه‌ی موازی که دامنه‌های مختلفی از جمله توسعه‌ی محصول، معیارها، ایمیل، رشد، تجارت، سلامت، نوشتن و وظایف شخصی را مدیریت می‌کنند، اجرا می‌کند @AndrewCurran_
  • اندرو ان‌جی (Andrew Ng) دوره‌ای را راه‌اندازی کرد که به افراد غیربرنامه‌نویس آموزش می‌دهد چگونه در کمتر از ۳۰ دقیقه برنامه‌های وب را با هوش مصنوعی بسازند و تکنیک‌های کدنویسی vibe را که در ChatGPT، Gemini، Claude و سایر ابزارها کار می‌کنند، نشان می‌دهد @AndrewYNg
  • Google Classroom ابزار جدیدی را با استفاده از Gemini معرفی می‌کند تا درس‌ها را به قسمت‌های پادکست تبدیل کند @TechCrunch
  • توسعه‌دهندگان با موفقیت پلاگین‌های Jupyter Lab کدنویسی‌شده با هوش مصنوعی را در ۱۵ دقیقه با استفاده از زمینه‌ی موجود و ابزارها فورک و گسترش دادند و نشان دادند که چگونه کد تولیدشده توسط هوش مصنوعی می‌تواند توسط دیگران برداشته و اصلاح شود @HamelHusain
  • محققان MIT نانوذراتی را با حسگرهای مولکولی توسعه دادند که می‌توانند برای آزمایش‌های خانگی برای بسیاری از انواع سرطان استفاده شوند @MIT

پژوهش‌ها

  • محققان گزارش می‌دهند که GPT-5.2 مسئله‌ی اردوش ۷۲۸ را حل کرده است که برای اولین بار یک LLM مسئله‌ی اردوش را که قبلاً توسط انسان حل نشده بود، حل کرده است @gdb
  • محققان استنفورد کاری را در مورد استخراج کتاب‌ها از مدل‌های زبان تولیدی منتشر کردند که سؤالاتی را در مورد حفظ و نشت داده‌ها مطرح می‌کند @stanfordnlp
  • محققان هوش مصنوعی برکلی RoboReward را توسعه دادند؛ یک مدل پاداش عمومی با شرط زبان برای یادگیری تقویتی ربات در دنیای واقعی، و دریافتند که VLMهای پیشرو به‌عنوان مدل‌های پاداش در وظایف، تجسم‌ها و صحنه‌ها غیرقابل اعتماد هستند @berkeley_ai
  • محققان پارادایم RL داخلی را نشان می‌دهند که بر روی اقدامات انتزاعی که در نمایش جریان باقیمانده ظاهر می‌شوند، به جای توکن‌های خام، عمل می‌کند و عملکرد بهتری را در وظایف سخت، با افق طولانی و پاداش‌های پراکنده امکان‌پذیر می‌سازد @dileeplearning
  • دستاورد ۲۰۲۰ AWS S3 در دستیابی به سازگاری قوی برای تمام نوشتن‌ها بدون تغییر قیمت یا تأخیر، به‌عنوان یکی از بزرگترین دستاوردهای مهندسی نامرئی دهه شناخته می‌شود که S3 را قادر می‌سازد تا به بک‌اند عالی برای پایگاه‌های داده‌ی بزرگ و بی‌نهایت مقیاس‌پذیر تبدیل شود @GergelyOrosz
  • نوام براون نتایج متفاوتی را با ابزارهای کدنویسی vibe مانند Claude Code و Codex هنگام ساخت یک حل‌کننده‌ی پوکر ریور متن‌باز گزارش می‌دهد و اشاره می‌کند که در حالی که ابزارها تکرار سریع‌تر را امکان‌پذیر می‌کردند، اشتباهاتی داشتند و گاهی اوقات سعی می‌کردند کاربران را در مورد باگ‌ها فریب دهند به جای اعتراف به مشکلات @polynoamial
  • سباستین سئونگ پیش‌بینی می‌کند که هوش مصنوعی در سطح انسانی ۱۵ سال دیگر با توجه به اندازه‌ی مدل مغز انسان فاصله دارد @ylecun

اخبار هوش مصنوعی در 2026-01-06

مدل‌های جدید هوش مصنوعی

  • انویدیا پلتفرم روبین را معرفی کرد که برای کارایی بی‌سابقه‌ در آموزش و استنتاج طراحی شده است. این پلتفرم دارای طراحی مشترک فوق‌العاده‌ای در محاسبات، شبکه‌سازی و نرم‌افزار برای آموزش، استنتاج و استدلال پیشرفته در مقیاس بزرگ است. @NVIDIAAI
  • انویدیا کازموس ریزن 2 را منتشر کرد، یک مدل زبان بصری استدلالی باز برای هوش مصنوعی فیزیکی با اندازه‌های مدل 2B و 8B، درک فضایی-زمانی بهبودیافته، استدلال با زمینه طولانی تا 256K توکن و درک بصری گسترده. @NVIDIAAIDev
  • انویدیا از آلپامایو رونمایی کرد که به عنوان اولین مدل تفکر و استدلال جهان برای وسایل نقلیه خودران توصیف شده است و پشته‌ی آن متن‌باز است. @StockSavvyShay
  • لیکوئید ای‌آی LFM2.5 را منتشر کرد، قدرتمندترین خانواده‌ی مدل‌های بنیادی کوچک روی دستگاه در کلاس پارامتر ~1B، با پیش‌آموزش مقیاس‌یافته از 10T به 28T توکن و پس‌آموزش یادگیری تقویتی گسترده. @liquidai
  • لایت‌ریکس LTX-2 را منتشر کرد، اولین مدل متن‌باز تولید ویدئو-صوت. @linoy_tsaban
  • xAI سری E را با جمع‌آوری 20 میلیارد دلار به پایان رساند و تأیید کرد که گروک 5 اکنون در حال آموزش است و محصولات جدید مصرف‌کننده و سازمانی به زودی عرضه خواهند شد. @xai
  • گوگل ای‌آی استودیو ارتقاء کیفیت زندگی را در داشبوردهای استفاده، از جمله قابلیت مشاهده نرخ موفقیت API، ردیابی استفاده از مدل جاسازی جیمنای، قابلیت زوم خاص روز و طراحی نمودار جدید، ارائه کرد. @OfficialLoganK

تحلیل صنعت

  • ترافیک ChatGPT در 6 هفته گذشته از زمان عرضه جیمنای 3، 22% کاهش یافته است، با میانگین بازدیدکنندگان 7 روزه از ~203 میلیون به ~158 میلیون کاهش یافته است، در حالی که جیمنای ثابت مانده و اکنون ~40% از ترافیک ChatGPT را تشکیل می‌دهد. @deedydas
  • لیزا سو، مدیرعامل AMD، پیش‌بینی می‌کند که کاربران فعال هوش مصنوعی از یک میلیارد نفر امروز به بیش از پنج میلیارد نفر در پنج سال آینده افزایش خواهند یافت که به محاسبات به مراتب بیشتری نیاز دارد. @AndrewCurran_
  • متا به دلیل تقاضای بی‌سابقه و موجودی محدود، گسترش بین‌المللی عینک‌های Ray-Ban Display را به بریتانیا، فرانسه، ایتالیا و کانادا متوقف کرد. @AndrewCurran_
  • LMArena تنها چهار ماه پس از عرضه محصول خود، به ارزش 1.7 میلیارد دلار رسید. @TechCrunch
  • جنسن هوانگ، مدیرعامل انویدیا، تأکید می‌کند که آینده‌ی کاربردهای هوش مصنوعی یک مدل عالی نیست، بلکه هماهنگ‌سازی چندین مدل عالی در هر مرحله از زنجیره‌ی استدلال است و آن را چندمدلی، چندوجهی و چندابری توصیف می‌کند. @AskPerplexity
  • بیش از 5% از پیام‌های ChatGPT که در سراسر جهان ارسال می‌شوند، مربوط به مراقبت‌های بهداشتی هستند، با 25% از کاربران فعال هفتگی که سوالات بهداشتی می‌پرسند، با استفاده‌ی بیشتر در زمان‌هایی که مطب پزشکان بسته است و در مناطق محروم از بیمارستان که دسترسی محدود است. @omooretweets
  • ابزارهای کدنویسی هوش مصنوعی باعث شده‌اند که دیگر بهانه‌ای برای نادیده گرفتن فرآیندهای مهندسی کیفیت مانند ردیابی خوب مسائل، تضمین کیفیت کامل، تست خودکار، مستندات به‌روز، CI و اتوماسیون استقرار وجود نداشته باشد. @simonw
  • خطوط کد به عنوان یک معیار بهره‌وری، با وجود اینکه به طور گسترده‌ای بی‌فایده شناخته شده است، به خصوص هنگام بحث در مورد کیفیت کد دست‌ساز یا بهره‌وری کدنویسی عامل‌محور، همچنان پابرجا است. @isaac_flath

اخلاق و جامعه

  • کیسی نیوتن، روزنامه‌نگار، یک پست وایرال در ردیت درباره‌ی الگوریتم‌های تحویل اوبر ایتس را کاملاً جعلی افشا کرد، با "افشاگر" که از هوش مصنوعی برای تولید شواهد جعلی از جمله یک سند فنی 18 صفحه‌ای و کارت شناسایی کارمند استفاده کرده بود، که نشان می‌دهد چگونه هوش مصنوعی به راحتی می‌تواند اطلاعات نادرست متقاعدکننده ایجاد کند که زمان قابل توجهی برای روزنامه‌نگاران برای رد کردن آن لازم است. @GergelyOrosz
  • تحقیقات جدید نشان می‌دهد که هوش مصنوعی سیل مقالات دانشگاهی را ایجاد می‌کند، با پیچیدگی مقاله که به جای کیفیت برای کار انسانی، نشانه‌ای از کیفیت پایین برای کار تولید شده توسط هوش مصنوعی می‌شود، که سیستم‌های سنتی داوری همتا را بدون برنامه‌ی مشخصی برای انطباق تهدید می‌کند. @emollick
  • اندرو ان‌جی آزمون تورینگ-AGI را برای مقابله با هیجان AGI پیشنهاد می‌کند، که در آن هوش مصنوعی باید وظایف کاری چند روزه را به خوبی انسان‌های ماهر از طریق یک رابط کامپیوتری انجام دهد، و استدلال می‌کند که ادعاهای فعلی AGI معیارهای مصنوعی پایینی را تعیین می‌کنند که دانشجویان و مدیران عامل را در مورد قابلیت‌های هوش مصنوعی گمراه می‌کند. @AndrewYNg
  • قانون‌گذار کالیفرنیا ممنوعیت چهار ساله ربات‌های چت هوش مصنوعی در اسباب‌بازی‌های کودکان را پیشنهاد می‌کند. @TechCrunch
  • محققان استنفورد گزارش جامعی در مورد تأثیر بالقوه هوش مصنوعی بر اشتغال، آموزش، مراقبت‌های بهداشتی، اطلاعات، رسانه، امنیت ملی و علم منتشر کردند و 18 جهت تحقیقاتی بلندپروازانه را برای به حداکثر رساندن تأثیر مثبت و به حداقل رساندن معایب پیشنهاد کردند. @JeffDean

کاربردها

  • گوگل دیپ‌مایند همکاری تحقیقاتی با بوستون داینامیکس را برای آوردن قابلیت‌های بنیادی جیمنای رباتیک به ربات‌های انسان‌نمای جدید اطلس خود اعلام کرد. @GoogleDeepMind
  • بوستون داینامیکس از ربات انسان‌نمای اطلس نسل بعدی ارتقا یافته رونمایی کرد: کاملاً الکتریکی (بدون هیدرولیک)، 6'2" قد، 198 پوند وزن، 56 درجه آزادی، باتری قابل تعویض 4 ساعته، ظرفیت وزن 110 پوند، با تراشه‌های انویدیا با ارزیابی محیطی بلادرنگ و بازخورد حسگر لمسی. @AndrewCurran_
  • نرم‌افزار NVIDIA DRIVE AV در مرسدس بنز CLA کاملاً جدید عرضه شد و قابلیت‌های کمک راننده سطح 2 نقطه‌به‌نقطه را با عملکرد گسترده تا پایان سال به جاده‌های ایالات متحده می‌آورد. @NVIDIADRIVE
  • توسعه‌دهنده با استفاده از جیمنای 3 فلش، برنامه تقویم حیوانات خانگی شخصی‌سازی شده را برای طرح‌های سفارشی و آماده چاپ ایجاد کرد. @GeminiApp
  • حامل حسین استفاده از ابزارهای کدنویسی هوش مصنوعی را برای ایجاد نرم‌افزار آموزشی برای مفاهیم مونته‌سوری 7 ساله خود در 15 دقیقه نشان می‌دهد. @HamelHusain
  • توسعه‌دهنده از افزونه مرورگر کلود برای تجزیه و تحلیل یک گزارش سلامت پوست با طراحی ضعیف با مرور هر صفحه، گرفتن اسکرین‌شات و تولید یک تجزیه و تحلیل جامع با توصیه‌های برنامه مراقبت از پوست استفاده می‌کند. @brian_lovin
  • آنتروپیک قابلیت کد محلی کلود را در Claude Desktop معرفی کرد که به کاربران امکان می‌دهد حالت کد را تغییر دهند و پوشه‌ها را برای دسترسی هوش مصنوعی مستقیماً از رابط دسکتاپ انتخاب کنند. @_catwu
  • جردن سینگر از Async رونمایی کرد، یک "عامل محصول" که برای کمک به تیم‌ها در مدیریت وظایف توسعه محصول و هم‌ترازی طراحی شده است. @jsngr

پژوهش‌ها

  • نوام براون تجربه‌ی دقیق ساخت یک حل‌کننده‌ی رودخانه‌ی پوکر متن‌باز با استفاده از ابزارهای کدنویسی هوش مصنوعی را به اشتراک می‌گذارد و دریافت که در حالی که کدکس و کلود کد تکرار سریع‌تر را امکان‌پذیر می‌کردند، اشتباهات الگوریتمی داشتند و در اشکال‌زدایی مشکل داشتند، با کدکس که کد C++ را 6 برابر سریع‌تر از نسخه‌ی بهینه‌شده‌ی کلود کد تولید می‌کرد. @polynoamial
  • شریا شانکار تحقیقاتی را در مورد پردازش اسناد در مقیاس با LLMها ارائه می‌دهد، با معرفی عملگرهای معنایی Map، Filter، Reduce و تکنیک Task Cascades که 86% کاهش هزینه را با حفظ 90% دقت به دست آورد، همراه با DocWrangler IDE که به "انحراف معیار" که در آن معیارهای ارزیابی در طول فرآیند تکامل می‌یابند، می‌پردازد. @HamelHusain
  • تحقیقات MIT نشان می‌دهد که مناطق درون مرکز کنترل اجرایی مغز، پیام‌ها را در مدارهای خاص با سایر مناطق مغز تنظیم می‌کنند تا آنها را با اطلاعات مربوط به رفتار و احساسات تحت تأثیر قرار دهند. @MIT
  • انویدیا و هاگینگ فیس فناوری‌های آیزاک انویدیا را در کتابخانه‌ی LeRobot ادغام کردند، با Isaac Lab-Arena که اکنون در LeRobot Environment Hub برای ارزیابی سیاست‌های VLA و ایجاد محیط‌های ربات قابل استفاده مجدد در دسترس است. @NVIDIARobotics
  • تحقیقات نشان می‌دهد که GPT-5.2 Pro اثبات‌های ظریفی را برای نتایج رشد انفجاری در مقالات نظریه‌ی اقتصادی ارائه می‌دهد. @ChadJonesEcon
  • فرانسوا شوله استدلال می‌کند که ارزان‌تر و سریع‌تر کردن تولید کد ممکن است یک نعمت بی‌قید و شرط نباشد، و کد را بیشتر یک بدهی می‌داند تا یک دارایی. @fchollet

اخبار هوش مصنوعی در 2026-01-05

مدل‌های جدید هوش مصنوعی

  • MiniMax نقشه‌ی راه 2026 خود را در Hugging Face منتشر کرد و توسعه‌های آتی را تشریح نمود. @victormustar
  • Miro Thinker 1.5 منتشر شد که بر روی qwen3 پس‌آموزش‌دیده است و در نسخه‌های 30A3B و 235A22B با نتایج قوی در BrowserComp تحت مجوز MIT در دسترس است. @Xianbao_QIAN
  • TII مدل Falcon H1R-7B را منتشر کرد، یک مدل استدلالی جدید که با تنها 7 میلیارد پارامتر و پنجره‌ی متنی 256 هزار، در ریاضیات و کدنویسی از سایر مدل‌ها بهتر عمل می‌کند و از معماری ترکیبی mamba-transformers برای بهبود کارایی استفاده می‌کند. @mervenoyann
  • Tencent Hunyuan مدل Youtu-LLM را منتشر کرد، یک مدل 2 میلیارد پارامتری با 128 هزار پنجره‌ی متنی و قابلیت‌های عاملی قوی. @AdinaYakup
  • Hugging Face پشتیبانی از رمزگشایی موازی را در batching پیوسته‌ی ترنسفورمرها اضافه کرد که امکان چندین جریان از یک پرامپت را فراهم می‌کند و تأثیر قابل‌توجهی بر پردازش متن‌های طولانی دارد. @remi_or_
  • Olmo 3.1 32B Instruct به یکی از پرطرفدارترین LLMها در بررسی پایان سال r/LocalLlama تبدیل شد. @natolambert

تحلیل صنعت

  • مدیر ارشد فناوری یک استارتاپ گزارش داد که قصد دارد در سال آینده حدود 10 برابر بیشتر از سال گذشته از مدل‌های هوش مصنوعی استفاده کند و اولویت را به ایجاد معیارهای بهره‌وری پایه برای ردیابی تأثیر می‌دهد. @GergelyOrosz
  • داده‌های Carta نشان می‌دهد که شرکت‌های با سرمایه‌گذاری خطرپذیر عمدتاً توسط چندین بنیان‌گذار تأسیس می‌شوند، به طوری که تنها 17 درصد از آن‌ها تک‌بنیان‌گذار هستند در مقایسه با بیش از 30 درصد استارتاپ‌های بدون سرمایه‌گذاری خطرپذیر. @GergelyOrosz
  • ناظران صنعت خاطرنشان می‌کنند که ابزارهای هوش مصنوعی احتمالاً بهترین شیوه‌های تیم‌های مهندسی برتر را به خط مبنای شرکت‌های رقابتی تبدیل خواهند کرد، از جمله مهندسی محصول‌محور، تست، قابلیت مشاهده و استقرار مداوم. @GergelyOrosz
  • شرکت‌هایی که توسعه‌دهندگان را به عنوان مجریان تیکت در نظر می‌گیرند، توسط تیم‌هایی که توسعه‌دهندگان در آن‌ها استقلال تعریف کار خود و استفاده مؤثر از ابزارهای هوش مصنوعی را دارند، عقب خواهند ماند. @GergelyOrosz
  • تحلیل‌ها نشان می‌دهد که افرادی که با ابزارهای هوش مصنوعی مشکل دارند، افراد بی‌کفایت نخواهند بود، بلکه کسانی هستند که غرور زیادی دارند و فروتنی لازم برای شگفت‌زده شدن وقتی هوش مصنوعی از انتظاراتشان فراتر می‌رود را ندارند. @HamelHusain
  • توسعه‌دهندگان گزارش می‌دهند که ابزارهای کدنویسی هوش مصنوعی مانند Claude Code و Opus 4.5 به نقطه‌ی عطفی رسیده‌اند که اکنون می‌توانند مسائل کدنویسی به مراتب دشوارتری را حل کنند. @gdb
  • داده‌های StackOverflow کاهش چشمگیری در تعداد سؤالات پرسیده‌شده در ماه را نشان می‌دهد که حاکی از آن است که توسعه‌دهندگان به طور فزاینده‌ای از هوش مصنوعی برای حل مسئله به جای انجمن‌های جامعه استفاده می‌کنند. @scottbelsky
  • پیش‌بینی می‌شود که ظرف یک تا دو سال آینده، مدارک علوم کامپیوتر به عنوان 10 برابر افزایش‌دهنده‌ی بهره‌وری نسبت به هوش مصنوعی تولید کد دیده خواهند شد، که این امر برداشت فعلی از هوش مصنوعی به عنوان 10 برابر افزایش‌دهنده‌ی بهره‌وری برای فارغ‌التحصیلان علوم کامپیوتر را معکوس می‌کند. @mlevchin
  • توصیه می‌شود که استارتاپ‌هایی که در 12 ماه گذشته تأسیس شده‌اند و در 1 درصد برتر نیستند، باید در همه‌چیز تجدیدنظر کنند، زیرا Claude Code و Opus 4.5 به طور اساسی آنچه را که ممکن است تغییر داده‌اند. @apoorva_mehta

اخلاق و جامعه

  • نگرانی‌هایی در مورد کیفیت محتوای تولیدشده توسط هوش مصنوعی مطرح شده است که به نقطه‌ای رسیده است که تمایز آن از کار نوشته‌شده توسط انسان بسیار دشوار است، حتی افراد باهوش نیز نمی‌توانند تشخیص دهند که قطعات ویروسی که جهان‌بینی آن‌ها را شکل می‌دهند، توسط انسان نوشته نشده‌اند. @deedydas
  • بحث در مورد نیاز به روش‌های واضح برای اذعان به استفاده از هوش مصنوعی و مشارکت انسانی، از کار کاملاً انسانی تا کار ترکیبی تا هوش مصنوعی هدایت‌شده تا هوش مصنوعی خودمختار، برای تخصیص صحیح اعتبار یا سرزنش. @emollick
  • بحثی در مورد اصطلاح کوتاه برای گفتن «یک هوش مصنوعی کار را انجام داد، اما من نتیجه را تأیید می‌کنم» در حال شکل‌گیری است، زیرا گفتن «من انجامش دادم» مشکوک به نظر می‌رسد در حالی که گفتن «کلود انجامش داد» به نظر می‌رسد شانه خالی کردن از مسئولیت است. @geoffreylitt
  • مصرف آب به یک نگرانی اصلی برای بسیاری از مردم، به ویژه جوانان، هنگام بحث در مورد هوش مصنوعی تبدیل شده است، با وجود اینکه طبق داده‌ها، این موضوع از کم‌اهمیت‌ترین نگرانی‌های زیست‌محیطی است که نشان می‌دهد کل مصرف مراکز داده‌ی ایالات متحده بسته به روش اندازه‌گیری، بین 50 میلیون تا 628 میلیون گالن در روز متغیر است. @emollick
  • پیش‌بینی می‌شود که GenAI جایگزین نبوغ انسانی نخواهد شد، اما کف متوسط بودن را آنقدر بالا خواهد برد که «نسبتاً خوب بودن» از نظر اقتصادی بی‌ارزش خواهد شد. @fchollet

کاربردها

  • OpenAI گزارش می‌دهد که روزانه میلیون‌ها نفر از ChatGPT در مورد سلامتی خود سؤال می‌کنند، از تجزیه و تحلیل اطلاعات پزشکی تا آماده‌سازی سؤالات برای ویزیت پزشک و مدیریت کلی سلامتی. @OpenAI
  • متخصصان مراقبت‌های بهداشتی گزارش می‌دهند که از هوش مصنوعی برای رفع کمبود کارکنان و بحران‌های شایستگی در سیستم‌هایی مانند کانادا و بریتانیا استفاده می‌کنند، با پیش‌بینی‌هایی که ChatMD در نهایت به درمان تبدیل خواهد شد. @AndrewCurran_
  • مدیر عامل بخش برنامه‌های کاربردی OpenAI برنامه‌هایی را برای تبدیل چت به یک دستیار فوق‌العاده شخصی در سال 2026 تشریح کرد، با شخصیت و لحن قابل‌هدایت‌تر و شخصی‌سازی‌شده‌تر، به علاوه پیام‌های گروهی و گردش کار چندنفره برای کار مشارکتی. @AndrewCurran_
  • یک کاربر غیرفنی با استفاده از Claude Code یک وب‌سایت پادکست آموزشی کامل را در 30 دقیقه ایجاد کرد، از جمله استقرار Vercel، راه‌اندازی دامنه، تحلیل محتوا، طراحی واکنش‌گرا و ادغام فید RSS. @HamelHusain
  • چندین توسعه‌دهنده به طور مستقل برنامه‌های خلاصه‌ی روزانه را با استفاده از ابزارهای هوش مصنوعی برای جمع‌آوری اطلاعات از ایمیل، تقویم، یادداشت‌ها، داده‌های سلامتی و برنامه‌های پیام‌رسان در خلاصه‌های اجرایی ایجاد کردند. @clairevo
  • یک توسعه‌دهنده نشان داد که چگونه Claude Code می‌تواند سه ماه کار تحقیقاتی دکترا را در 20 دقیقه بازسازی کند، با استفاده از داده‌های FAO و USDA برای محاسبه‌ی دسترسی به مواد مغذی کشور در طول زمان. @jkeatn
  • مدیر عامل Zapier شیوه‌های رهبری مبتنی بر هوش مصنوعی را نشان می‌دهد، از جمله استفاده از رونویسی‌های Granola برای مهندسی معکوس فرهنگ شرکت، ایجاد عوامل معیار مصاحبه برای بازخورد ساختاریافته‌ی نامزدها و استفاده از Grok برای یافتن استعدادها. @clairevo
  • یک توسعه‌دهنده گزارش می‌دهد که وقتی یک نفر می‌تواند کل چشم‌انداز یک محصول را با استفاده از ابزارهای هوش مصنوعی اجرا کند، نتیجه محصولات واقعاً خاصی است، و یک حلقه‌ی کارآمد از برنامه‌ریزی، بررسی، تکرار، اجرا و ادغام را توصیف می‌کند. @Suhail
  • آمازون Alexa.com را راه‌اندازی کرد و دستیار هوش مصنوعی خود را به وب آورد، و Fire TV را با تلویزیون‌های جدید Artline با قاب‌هایی در CES بازسازی کرد. @TechCrunch
  • گوگل ویژگی‌های جدید Gemini را برای تلویزیون در CES 2026 پیش‌نمایش کرد. @TechCrunch
  • دستیار صوتی BMW iX3 مدل 2026 توسط Alexa+ پشتیبانی خواهد شد. @TechCrunch
  • LG در CES 2026 CLOiD را به نمایش گذاشت، اولین نمایش رباتیک که برای خودکارسازی کارهای خانه از جمله نمایش زنده‌ی لباسشویی طراحی شده است. @TechCrunch

پژوهش‌ها

  • یک پست وبلاگ جامع 13000 کلمه‌ای منتشر شد که ترفندها و بهترین شیوه‌های عملی برای GRPO (بهینه‌سازی سیاست نسبی گروهی) را تشریح می‌کند، از جمله تکنیک‌هایی مانند Clip Higher، Dynamic Sampling، Token-level Loss، Alternative Aggregation، Overlong Rewards، حذف انحراف معیار، Truncated Importance Sampling و CISPO برای رفع بی‌ثباتی آموزش و فروپاشی آنتروپی در مقیاس بزرگ. @cwolferesearch
  • تحقیقات در مورد کمبود آهن عملکردی که به طور بالقوه در هسته‌ی بیماری پارکینسون قرار دارد، که دگمای موجود را به چالش می‌کشد. @EricTopol
  • پیشنهادی برای یک نقطه‌ی عطف جدید به سمت AGI به نام هوش مصنوعی توانمند (ACI)، که به عنوان توانایی یک عامل برای تبدیل قانونی 100 هزار دلار به 1 میلیون دلار تعریف می‌شود، که به عنوان آزمون تورینگ مدرن توصیف شده است. @mustafasuleyman
  • فیزیکدانان MIT پیشنهاد می‌کنند که تحت شرایط خاص، الکترون‌های یک ماده‌ی مغناطیسی می‌توانند به کسرهایی تقسیم شوند تا شبه‌ذراتی به نام آنیون‌ها را تشکیل دهند. @MIT
  • تیم FAIR Perception متا SAM 3D را منتشر کرد، یک پیشرفت بزرگ در بینایی سه‌بعدی با قابلیت بازسازی هر شیء در سه‌بعدی تنها از یک تصویر. <a href="https://x.com/georgiagk

اخبار هوش مصنوعی در 2026-01-04

کاربردها

  • یک توسعه‌دهنده گزارش می‌دهد که با استفاده از Claude، سال‌ها کار تئوری را تنها در 4 ساعت به کد کاربردی تبدیل کرده و سپس در زمان استراحت ناهار، آن را با موفقیت از Golang به Rust تبدیل کرده است. این موضوع نشان‌دهنده‌ی توانایی هوش مصنوعی در تسریع توسعه‌ی نرم‌افزارهای پیچیده است @JustJake
  • یک توسعه‌دهنده توضیح می‌دهد که در تعطیلات کریسمس، پروژه‌های کدنویسی شخصی بیشتری را نسبت به 10 سال گذشته‌ی خود به اتمام رسانده است. او این افزایش بهره‌وری را به دستیاران کدنویسی هوش مصنوعی نسبت می‌دهد، با وجود اینکه محدودیت‌های فعلی آن‌ها را می‌شناسد @DavidSHolz
  • یک توسعه‌دهنده گزارش می‌دهد که یک عامل هوش مصنوعی به مدت 6 ساعت به طور خودکار CI را اشکال‌زدایی کرده است، در حالی که او وقت خود را با خانواده‌اش گذرانده است. این موضوع نشان‌دهنده‌ی واگذاری عملی کارهای فنی به سیستم‌های هوش مصنوعی است @aarondfrancis
  • یک توسعه‌دهنده‌ی پایتون، تغییر استراتژیک به استفاده از Next.js برای برنامه‌های وب را اعلام می‌کند، با وجود ترجیح شخصی‌اش. او به افزایش قابل توجه بهره‌وری ناشی از استفاده از پشته‌های فناوری مورد علاقه‌ی هوش مصنوعی اشاره می‌کند، به جای اینکه با ابزارهای کمتر پشتیبانی‌شده دست و پنجه نرم کند @HamelHusain
  • یک متخصص حقوقی مشاهده می‌کند که Claude و ChatGPT می‌توانند موقعیت‌های حقوقی پیچیده را تجزیه و تحلیل کرده و تحلیلی مشابه آنچه شرکت‌های حقوقی پس از هفته‌ها بررسی ارائه می‌دهند، ارائه دهند. او پایداری مدل‌های صورت‌حساب ساعتی را زیر سوال می‌برد، در حالی که هوش مصنوعی می‌تواند تحقیقات عمیق را در عرض چند دقیقه انجام دهد @GergelyOrosz

تحلیل صنعت

  • StackOverflow کاهش چشمگیری در تعداد سوالات ماهانه نشان می‌دهد، که حاکی از آن است که توسعه‌دهندگان به طور فزاینده‌ای به جای انجمن‌های جامعه، برای کمک در کدنویسی به دستیاران هوش مصنوعی روی می‌آورند @samwhoo
  • مدیرعامل Linear استدلال می‌کند که عوامل هوش مصنوعی در حال فروپاشی جریان کاری سنتی توسعه‌ی محصول هستند، جایی که ترجمه از الزامات به کد 70 درصد زمان را مصرف می‌کرد. این امر نقاط اهرمی را معکوس می‌کند، به طوری که اکنون شفافیت در درک نیت مشتری اهمیت بیشتری نسبت به ترجمه‌ی پیاده‌سازی دارد @karrisaarinen
  • شرکت‌های فناوری به طور فعال در حال ارزیابی ابزارهای هوش مصنوعی برای توسعه‌دهندگان در زمینه‌های کدنویسی، زیرساخت و بازبینی کد هستند، اگرچه عدم قطعیت در مورد اینکه کدام فروشندگان را انتخاب کنند و چه ابعادی را اندازه‌گیری کنند، همچنان باقی است @GergelyOrosz
  • شرکت‌های حقوقی ممکن است هزینه‌ها را از طریق هوش مصنوعی کاهش دهند، اما لزوماً این صرفه‌جویی‌ها را به مشتریان منتقل نخواهند کرد، زیرا صورت‌حساب همچنان به ریسک و تأثیر گره خورده است تا ساعات صرف شده. شرکت‌ها توانایی خود را برای دریافت هزینه بر اساس مسئولیت سوء عملکرد و اهمیت پرونده حفظ می‌کنند @GergelyOrosz
  • کار محصول از اجرا به سمت جستجوی وضوح و ایجاد شرایط برای ظهور راه‌حل‌های خوب در حال تغییر است، با هدایت و مدیریت کار عامل به عنوان مهارت جدید، در حالی که هوش مصنوعی پیاده‌سازی را انجام می‌دهد @karrisaarinen

مدل‌های جدید هوش مصنوعی

  • تنسنت مدل‌های ترجمه‌ی Tencent-HY-MT1.5 را در نسخه‌های 1.8B و 7B پارامتری به صورت متن‌باز منتشر می‌کند. مدل 1.8B برای استقرار روی دستگاه بهینه شده است و به تأخیر 0.18 ثانیه دست می‌یابد و از APIهای تجاری اصلی بهتر عمل می‌کند، در حالی که نسخه‌ی 7B از مدل‌های متن‌باز متوسط پیشی می‌گیرد @TencentHunyuan
  • Galaxea Dynamics مدل G0 Plus VLA را با دمو "Pick Up Anything" منتشر می‌کند، که هوش تجسمی بدون آموزش تخصصی را برای کارهای رباتیک متنوع در دنیای واقعی از طریق دستورات زبان خالص به نمایش می‌گذارد @GalaxeaDynamics
  • GenrobotAI مجموعه‌داده‌ی RealOmni-Open Dataset را با بیش از 10,000 ساعت، 1 میلیون کلیپ، 30+ مهارت در بیش از 3,000 خانه‌ی واقعی راه‌اندازی می‌کند، که بزرگترین مجموعه‌داده‌ی هوش مصنوعی تجسمی متن‌باز از نظر ساعت است @GenrobotAI

پژوهش‌ها

  • تحقیقات در مورد بازارهای پیش‌بینی نشان می‌دهد که Claude Opus 4.5 بهترین عملکرد را با امتیاز بریر تقریباً 0.23 در 300 بازار Kalshi به دست آورده است، که به محدوده‌ی 0.15-0.2 پیش‌بینی‌کنندگان انسانی نزدیک می‌شود اما هنوز به آن نمی‌رسد، در حالی که GPT 5.2 XHigh کمتر از حد انتظار عمل کرده است @deedydas
  • محققان به بی‌ثباتی یادگیری تقویتی در مدل‌های Mixture of Experts از طریق بازپخش متخصص/مسیریابی می‌پردازند، که متخصصان فعال شده را در طول تولید رول‌اوت ذخیره می‌کند و از آن‌ها برای به‌روزرسانی سیاست استفاده می‌کند، و مشکلی را حل می‌کند که در آن 10 درصد از متخصصان پس از هر به‌روزرسانی گرادیان در مدل‌های عمیق‌تر مانند Qwen3-30B-A3B-Base تغییر می‌کنند @cwolferesearch
  • یان لکون اصول معماری JEPA را تشریح می‌کند و استدلال می‌کند که آموزش با بازسازی در فضای ورودی غیرمولد است و پیش‌بینی باید در فضای نمایش انجام شود، با روش‌های کنتراست ابعادی مانند SIGReg/LeJEPA که بیشترین امید را نسبت به رویکردهای EMA و کنتراست نمونه نشان می‌دهند @ylecun
  • مهندسان گزارش می‌دهند که GPT-5.2 و Opus 4.5 که در نوامبر منتشر شدند، نقطه‌ی عطفی را نشان می‌دهند که در آن بهبودهای تدریجی از یک آستانه‌ی قابلیت نامرئی عبور کردند و ناگهان مشکلات کدنویسی بسیار دشوارتری را که قبلاً غیرقابل حل بودند، باز کردند @simonw

اخلاق و جامعه

  • مقامات فرانسوی و مالزیایی در حال بررسی Grok به دلیل تولید دیپ‌فیک‌های جنسی هستند، که نگرانی‌هایی را در مورد محتوای مضر تولید شده توسط هوش مصنوعی ایجاد می‌کند @TechCrunch
  • نیویورک تایمز گزارش می‌دهد که اوکراین استفاده‌ی روزانه از پهپادهای تهاجمی هوش مصنوعی را آغاز کرده است که به طور خودکار اهداف را پیدا می‌کنند، آن‌ها را ردیابی می‌کنند و حتی پس از قطع سیگنال‌های خلبان توسط پارازیت، به طور مستقل حمله می‌کنند، که نشان‌دهنده‌ی ورود کشتار خودکار به جنگ است @Mylovanov
  • Wegmans در فروشگاه‌های شهر نیویورک تابلوهای اطلاع‌رسانی در مورد جمع‌آوری تشخیص چهره، اسکن چشم و اثر صوتی به دلیل قانون سال 2021 نصب کرده است، اگرچه چنین الزاماتی برای سازمان‌های دولتی یا بانک‌ها اعمال نمی‌شود، که نشان‌دهنده‌ی جمع‌آوری گسترده‌ی داده‌های بیومتریک در شهرهای بزرگ است @AndrewCurran_
  • یک ناظر اشاره می‌کند که مدل‌های هوش مصنوعی که برای دقت آموزش دیده‌اند، در مورد رویدادهای جاری بی‌اعتماد می‌شوند، زیرا واقعیت از دیدگاه گذشته به طور فزاینده‌ای شبیه توهمات است @AndrewCurran_
  • رفتار کاربران با جستجوی هوش مصنوعی از پذیرش بی‌چون و چرا در سال 2024 به شک و تردید فزاینده در سال 2026 در حال تغییر است، به طوری که مردم اکنون تأیید دقیق انجام می‌دهند و اطلاعات ناکافی را زیر سوال می‌برند @AndrewCurran_
  • داوران دانشگاهی ممکن است به زودی توسط مدل‌های هوش مصنوعی مانند GPT X Pro نه تنها از نظر کیفیت، بلکه از نظر زمان صرف شده برای بررسی مقالات، پیشی گرفته شوند @natolambert

اخبار هوش مصنوعی در 2026-01-03

تحلیل صنعت

  • مدیرعامل گیت‌هاب تأکید می‌کند که در حالی که عامل‌های هوش مصنوعی می‌توانند ویژگی‌های فنی محصولات SaaS میلیارد دلاری مانند Typeform را بازتولید کنند، ارزش تجاری واقعی در قابلیت‌های فروش سازمانی نهفته است، نه در دشواری کدنویسی. @GergelyOrosz
  • پل گراهام مشاهده می‌کند که هوش مصنوعی با تولید نسخه‌های اولیه در زمانی که تیم‌ها در اثر عدم تصمیم‌گیری فلج شده‌اند، بوروکراسی سازمانی را از بین می‌برد و یک نقطه شروع ایجاد می‌کند که به نسخه یک واقعی تبدیل می‌شود. @paulg
  • یک توسعه‌دهنده از تغییر اساسی در گردش کار کدنویسی طی دو هفته گذشته خبر می‌دهد که از استفاده‌ی سنتی از IDE به سمت CLI، رابط‌های وب و دستگاه‌های موبایل برای تولید کد حرکت کرده است. @GergelyOrosz
  • صنعت در حال تجربه‌ی تحول سریع در ابزارهای توسعه طی تنها چند ماه است، با گردش کارهای جدیدی که برای توسعه‌دهندگان آینده که وارد این حوزه می‌شوند، به استاندارد تبدیل شده‌اند. @GergelyOrosz
  • مهندس گوگل گزارش می‌دهد که **Claude Code** در یک ساعت چیزی را تولید کرده که تیم آن‌ها یک سال برای ساخت آن برای هماهنگ‌کننده‌های عامل توزیع‌شده تلاش کرده بود، که چالش‌های همسویی سازمانی را برجسته می‌کند. @paulg

کاربردها

  • یک توسعه‌دهنده با موفقیت از **Claude Code** برای ساخت یک افزونه‌ی پیچیده‌ی Jupyter در 8 ساعت استفاده کرده است، با ارائه‌ی ابزارهای تست خاص به عنوان مهارت و حفظ مجموعه‌های تست جامع در طول توسعه. @HamelHusain
  • توسعه‌دهندگان اکنون می‌توانند با اتصال مخازن گیت‌هاب از طریق Claude Code for the Web، از تلفن‌های همراه کدنویسی کنند و درخواست‌های پول (pull requests) ایجاد کرده و تست‌های خودکار را به طور کامل از دستگاه‌های موبایل اجرا کنند. @GergelyOrosz
  • Claude Code می‌تواند تنظیمات ترمینال توسعه‌دهنده را با جایگزینی خودکار ابزارهای CLI داخلی با جایگزین‌های سریع‌تر Rust/Go و نصب برنامه‌های بومی بهتر مک، بهینه کند. @deedydas
  • Rust به دلیل تضمین‌های صحت در زمان کامپایل، به عنوان زبان ایده‌آل برای عامل‌های هوش مصنوعی شناسایی شده است. @gdb

اخلاق و جامعه

  • Stanford HAI هشدار می‌دهد که برنامه‌های «undress» که به نوجوانان امکان می‌دهد پورنوگرافی جعلی متقاعدکننده از همکلاسی‌های خود ایجاد کنند، یک تهدید هوش مصنوعی است که مدارس برای آن آماده نیستند و پیشگیری تنها استراتژی قابل اجرا است. @StanfordHAI
  • کلر وو از هک تعامل نوظهور انتقاد می‌کند که در آن سازندگان از هوش مصنوعی برای تهیه‌ی تحلیل‌های شبه‌دانشگاهی از پست‌های پرطرفدار استفاده می‌کنند و محتوای بی‌ارزش و بدون بینش یا تجربه‌ی منحصر به فرد تولید می‌کنند. @clairevo
  • نگرانی‌هایی در مورد قرارگیری محتوای نامناسب در بخش کودکان کتابخانه‌ی عمومی سانفرانسیسکو مطرح شده است که چالش‌های مدیریت فضاهای اطلاعات عمومی را برجسته می‌کند. @clairevo

پژوهش‌ها

  • زِیوان آلن-ژو، پژوهشگر FAIR، یک آموزش در مورد فیزیک مدل‌های زبان ارائه می‌دهد که بیش از 20 اصل معماری را استخراج می‌کند، از جمله اینکه چرا لایه‌های Canon از طریق تغییر شکل یادگیری سلسله‌مراتبی کار می‌کنند و چرا مدل‌های خطی 4 برابر کم‌عمق‌تر از ترنسفورمرها استدلال می‌کنند. @alexandr_wang
  • پژوهش نشان می‌دهد که اصول معماری در پیش‌آموزش در مقیاس آکادمیک با 1.3 میلیارد پارامتر و 100 میلیارد توکن در حال ظهور هستند که هزینه‌ی بسیار کمتری نسبت به اجراهای در مقیاس بزرگ ارائه می‌دهند. @alexandr_wang
  • Stanford NLP مفهوم مدل‌های زبان بازگشتی را معرفی می‌کند که در آن مدل‌ها، پرامپت‌های خود را به عنوان اشیایی در محیط‌های خارجی در نظر می‌گیرند و آن‌ها را از طریق کدی که LLMها را فراخوانی می‌کند، دستکاری می‌کنند. @a1zhang
  • ایتان مولیک مدیریت عامل‌های هوش مصنوعی را اساساً یک مشکل مدیریتی می‌داند که نیازمند مهارت‌هایی در تعیین هدف، ارائه‌ی زمینه، تقسیم وظایف و ارائه‌ی بازخورد است. @emollick
  • یک پژوهشگر استدلال می‌کند که سلسله‌مراتب برای عامل‌ها باید از اشکال مدیریت سازمانی الهام بگیرد تا از شیوه‌های کدنویسی، با مقالات اولیه که نتایج امیدوارکننده‌ای را نشان می‌دهند. @emollick
  • فرانسوا شوله تأکید می‌کند که کودکان با استفاده از موز به عنوان تلفن، یک شاهکار عظیم انتزاع را از طریق نگاشت بازنمایی نشان می‌دهند و برنامه‌های رفتاری را از ورودی‌های انتزاعی خود جدا می‌کنند. @fchollet
  • ماهیت غیرقطعی LLMها به عنوان یک چالش اصلی برای استفاده‌ی قابل اعتماد شناسایی شده است، با رویکرد «چندین بار اجرا کن» که یک راه‌حل موقت است تا یک راه‌حل قابل اعتماد که نیازمند بررسی انسانی است. @GergelyOrosz
  • دیدی داس از Pangram AI detector دفاع می‌کند و می‌گوید که نرخ‌های مثبت کاذب و منفی کاذب آن به طور مستقل زیر 0.5% ارزیابی شده‌اند و روی متنی که از طریق انسانی‌سازها و مدل‌های جدید از جمله **GPT-5**، **Grok** و **Sonnet 4.5** عبور کرده، کار می‌کند. @deedydas

اخبار هوش مصنوعی در 2026-01-02

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen-Image-2512 را منتشر کرد، یک مدل تبدیل متن به تصویر ارتقاءیافته که دارای رندرینگ واقع‌گرایانه‌تر انسان با «ظاهر هوش مصنوعی» کمتر، جزئیات طبیعی دقیق‌تر در مناظر و بافت‌ها، و دقت بهبودیافته در رندرینگ متن است @Alibaba_Qwen
  • vLLM پشتیبانی روز صفر را برای Qwen-Image-2512 با معماری خط لوله‌ی بهینه‌شده اعلام کرد @Alibaba_Qwen
  • تیم SGLang پشتیبانی یکپارچه از Qwen-Image-2512 را به عنوان یک به‌روزرسانی وزن، با حفظ عملکرد سریع و قابل اعتماد، ارائه می‌دهد @Alibaba_Qwen
  • Pruna AI مدل Qwen-Image-2512 را برای تولید تصاویر با وضوح بالا در حدود 7 ثانیه در Replicate بهینه می‌کند @Alibaba_Qwen
  • GLM-4.7 با موفقیت روی 115 گیگابایت VRAM اجرا می‌شود که نشان‌دهنده‌ی استفاده‌ی کارآمد از منابع است @huggingface

تحلیل صنعت

  • بانک‌های اروپایی قصد دارند 200,000 شغل را کاهش دهند زیرا پذیرش هوش مصنوعی در سراسر بخش مالی سرعت می‌گیرد @TechCrunch
  • یک توسعه‌دهنده گزارش می‌دهد که در سال 2025 در ChatPRD کمتر از حقوق یک مهندس تمام‌وقت آمریکایی را برای هوش مصنوعی و ابزارهای مهندسی هزینه کرده است و با توسعه‌دهندگان بین‌المللی و عوامل هوش مصنوعی به 1500 PR و بیش از 2 میلیارد توکن پردازش‌شده دست یافته است @clairevo
  • یک توسعه‌دهنده نشان می‌دهد که چگونه می‌توان یک کسب‌وکار 100 میلیون دلاری با حمایت سرمایه‌گذاران را در یک هفته با استفاده از ابزارهای هوش مصنوعی ساخت، که نشان‌دهنده‌ی اهرم قابل توجهی است که هوش مصنوعی برای سازندگان فردی فراهم می‌کند @OfficialLoganK
  • استارتاپ‌های سخت‌افزاری پس از چندین شکست بزرگ با دموهای جذاب اما محصولات ضعیف، با افزایش بدبینی مصرف‌کنندگان مواجه هستند، که باعث می‌شود کسب‌وکارهای سخت‌افزاری جدید و مشروع برای جلب اعتماد با مشکل مواجه شوند @GergelyOrosz
  • یکی از کارمندان Replit تجربه‌ی کار در یک استارتاپ هوش مصنوعی با رشد فوق‌العاده را در دوران بارداری و بزرگ کردن یک کودک نوپا به اشتراک می‌گذارد، که نشان‌دهنده‌ی فرهنگ حمایتی شرکت برای والدین با وجود تقاضاهای کاری شدید است @HayaOdeh
  • TechCrunch پیش‌بینی می‌کند که سال 2026 شاهد حرکت هوش مصنوعی از هیجان به عمل‌گرایی خواهد بود زیرا این فناوری به بلوغ می‌رسد @TechCrunch
  • امپراتوری هوش مصنوعی NVIDIA از طریق تحلیل سرمایه‌گذاری‌های برتر استارتاپی آن بررسی می‌شود، که موقعیت استراتژیک آن را در اکوسیستم هوش مصنوعی آشکار می‌کند @TechCrunch

اخلاق و جامعه

  • لحظه‌ی تولید تصویر ویروسی Grok فرا می‌رسد، که نوع متفاوتی از پدیده‌ی محتوای تولیدشده توسط هوش مصنوعی را در مقایسه با روندهای قبلی نشان می‌دهد @AndrewCurran_
  • هند به X دستور می‌دهد تا Grok را به دلیل محتوای تولیدشده توسط هوش مصنوعی «ناشایست» اصلاح کند، که چالش‌های نظارتی با تولید محتوای هوش مصنوعی را برجسته می‌کند @TechCrunch
  • مدیرعامل Zomato از ChatGPT برای ارتباطات بحران و روابط عمومی استفاده می‌کند، که نشان می‌دهد چگونه هوش مصنوعی در حال تغییر شیوه‌های ارتباطات شرکتی در مقابل چشمان عموم است @deedydas
  • شرکت‌های هوش مصنوعی به دلیل عدم شفافیت در نشان دادن به کاربران که چه زمانی از مدل‌های خوب در مقابل مدل‌های بد استفاده می‌کنند، مورد انتقاد قرار می‌گیرند، که باعث سردرگمی در مورد قابلیت‌های هوش مصنوعی و محدود کردن درک کاربر از آنچه هوش مصنوعی واقعاً می‌تواند انجام دهد، می‌شود @emollick
  • یک محقق امنیتی در مورد تبدیل شدن عوامل هوش مصنوعی دسکتاپ به اهداف بدافزار با افزایش محبوبیت آنها هشدار می‌دهد و خاطرنشان می‌کند که در حالی که پلتفرم‌های وب و موبایل دارای سندباکسینگ قوی برنامه برای امنیت هستند، عوامل دسکتاپ برای عملکرد مؤثر به دسترسی به فایل‌ها در سراسر مرزهای برنامه نیاز دارند @random_walker

کاربردها

  • یک توسعه‌دهنده با موفقیت قابلیت‌های صدا، بینایی و حرکت را برای ربات Reachy شرکت Pollen Robotics با استفاده از یک عامل LiveKit پیاده‌سازی می‌کند و یک تجربه‌ی رباتیک واقعی ایجاد می‌کند @huggingface
  • یک توسعه‌دهنده نشان می‌دهد که چگونه از GLM-4.7-4bit با mlx_lm.server و opencode برای رفع اشکال کد واقعی به صورت محلی روی یک ماشین M3 Ultra 512GB استفاده می‌کند، با برنامه‌هایی برای مقیاس‌بندی با استفاده از Tensor Parallelism @simonw
  • یک توسعه‌دهنده گزارش می‌دهد که Codex فرآیند توسعه‌ی آنها را به طور اساسی تغییر داده است، به آنها اجازه می‌دهد تا روی کارهای سطح بالاتر تمرکز کنند بدون اینکه در جزئیات کوچک غرق شوند، و آنها را قادر می‌سازد تا با سرعتی که انتظار دارند کار کنند و برای پروژه‌های جانبی وقت داشته باشند @gdb
  • یک توسعه‌دهنده از تماشای پیشرفت Codex در انجام وظایف در طول شب ابراز رضایت می‌کند، که قابلیت‌های خودمختار دستیاران کدنویسی هوش مصنوعی را برجسته می‌کند @gdb
  • Codex ویژگی فراخوانی مهارت صریح را با تایپ $ و تکمیل خودکار معرفی می‌کند، با نوآوری‌های بیشتر برنامه‌ریزی‌شده برای ژانویه @sama
  • Hugging Face Inference Providers مدیریت چندین API ارائه‌دهنده‌ی هوش مصنوعی را با ارائه‌ی یک API برای صدها مدل از Cohere، Groq، Replicate، Together AI و موارد دیگر ساده می‌کند، که از تولید متن، ایجاد تصویر و جاسازی‌ها پشتیبانی می‌کند @huggingface
  • یک توسعه‌دهنده مجموعه‌های تست داده‌محور مستقل از زبان را ایجاد می‌کند که به اندازه‌ی کافی جامع هستند تا عوامل کدنویسی را قادر سازند تا پیاده‌سازی‌های مطابق را از ابتدا در هر زبان برنامه‌نویسی بسازند @simonw

پژوهش‌ها

  • Prime Intellect تحقیقاتی را در مورد مدل‌های زبان بازگشتی (RLMs) معرفی می‌کند و معتقد است که آموزش مدل‌ها برای مدیریت زمینه‌ی خود به صورت سرتاسری از طریق یادگیری تقویتی، پیشرفت بزرگ بعدی برای توانمندسازی عوامل برای حل وظایف بلندمدت که هفته‌ها تا ماه‌ها طول می‌کشد، خواهد بود @AndrewCurran_
  • یک محقق تضاد بین عملکرد GPT-5-mini در DeepDive و معیارهای math-python را به عنوان شواهدی برای افزایش عملکرد بالقوه عظیم ناشی از آموزش بر روی RLM برجسته می‌کند @AndrewCurran_
  • Geometric Mean Policy Optimization (GMPO) به عنوان یک نوع بهبودیافته‌ی GRPO معرفی شد که میانگین حسابی را با میانگین هندسی برای تجمیع ضررهای سطح توکن جایگزین می‌کند، حساسیت به نقاط پرت را کاهش می‌دهد و پایداری آموزش را بهبود می‌بخشد در حالی که از فروپاشی آنتروپی جلوگیری می‌کند @cwolferesearch
  • OlMo 3 ترفندهای کلیدی برای کارآمدتر کردن RL را نشان می‌دهد، از جمله تنظیمات کاملاً ناهمزمان خارج از سیاست، دسته‌بندی پیوسته، جبران نمونه‌برداری فعال، و به‌روزرسانی‌های وزن مدل در حین پرواز، که زمان آموزش RL را بدون تأثیر بر عملکرد به نصف کاهش می‌دهد @cwolferesearch
  • یک محقق لیست جامعی از گزارش‌های فنی مدل استدلال از سال 2025 را گردآوری می‌کند، که از DeepSeek R1 در ژانویه تا MiMo-V2-Flash در دسامبر را شامل می‌شود و تکامل سریع قابلیت‌های استدلال را مستند می‌کند @natolambert
  • کتاب RLHF به‌روزرسانی بزرگی دریافت می‌کند که از 150 به 200 صفحه افزایش می‌یابد، شامل الگوریتم‌های جدیدی مانند GSPO و CISPO، جدول به‌روزرسانی‌شده‌ی گزارش‌های فنی مدل استدلال، بخشی در مورد Rubrics برای RLVR، و بهبود ثبات نمادگذاری در سراسر کتاب @natolambert
  • یک محقق رویکردهای متفاوت مدل‌های هوش مصنوعی را به سوالات سرمایه‌گذاری تاریخی نشان می‌دهد، با Gemini که یک نمونه‌ی Magna Carta 1297 را توصیه می‌کند، ChatGPT که سهام در معدن مس Stora Kopparberg را پیشنهاد می‌کند، و Claude که مشارکت در وقف اسلامی را مطرح می‌کند @emollick
  • اعتبار معیار مورد سوال قرار می‌گیرد زیرا IQuest-Coder به اشتباه تنظیم شده است، از جمله کل تاریخچه گیت با کامیت‌های آینده، که به مدل‌ها اجازه می‌دهد به جای حل مشروع مشکلات، از این موضوع سوءاستفاده کنند @deedydas