اخبار هوش مصنوعی در 2025-12-22

مدل‌های جدید هوش مصنوعی

  • گوگل دیپ‌مایند YouTube Playables Builder را با پشتیبانی از Gemini 3 راه‌اندازی کرد که به سازندگان امکان می‌دهد با استفاده از متن، ویدئو یا تصاویر و بدون نیاز به کدنویسی، بازی‌های کوچک بسازند @GoogleDeepMind
  • علی‌بابا GLM-4.7 را منتشر کرد که با بهبودهای قابل‌توجه در کدنویسی، استدلال پیچیده و استفاده از ابزارها، از GLM-4.6 پیشی گرفته و استانداردهای جدیدی را برای مدل‌های متن‌باز تعیین می‌کند @Zai_org
  • گوگل Gemini 3 Flash را برای کاربردهای کسب‌وکارهای کوچک راه‌اندازی کرد که قادر به تحلیل بازخورد مشتریان، نوشتن ایمیل‌های راه‌اندازی و کدنویسی صفحات فرود برندسازی‌شده است @GeminiApp
  • گوگل Gemini 3 را در جستجوی گوگل ادغام کرد و تجربه‌های GenUI و هوش مصنوعی پیشرفته را معرفی نمود @OfficialLoganK

تحلیل صنعت

  • اوپن‌ای‌آی روشی را برای تقویت مداوم ChatGPT Atlas و سایر عامل‌ها در برابر حملات تزریق پرامپت جدید از طریق تیم قرمز خودکار، یادگیری تقویتی و حلقه‌های پاسخ سریع منتشر کرد @cryps1s
  • YouTube Playables Builder پتانسیل خود را برای جذب ۱۰۰ میلیون توسعه‌دهنده‌ی بعدی با آسان کردن ساخت بازی بدون نیاز به زبان‌های برنامه‌نویسی سنتی مانند C/C++/C# نشان می‌دهد @OfficialLoganK
  • دمیس هاسابیس پیشنهاد می‌کند که گوگل خود را به عنوان یک ناشر بازی برای عموم معرفی می‌کند و احتمالاً بازی‌های AAA را با مدل اشتراکی روی پلتفرم گوگل اجرا خواهد کرد @AndrewCurran_
  • Truemed با رهبری a16z، ۳۴ میلیون دلار در سری A جذب سرمایه کرد تا هزینه‌های مراقبت‌های بهداشتی را به سمت پیشگیری سوق دهد و به مصرف‌کنندگان امکان دهد از دلارهای HSA و FSA برای مداخلات سبک زندگی مبتنی بر شواهد به جای درمان بیماری‌های مزمن پس از ابتلا استفاده کنند @a16z
  • آمازون ظاهراً تا ۱۰ میلیارد دلار در اوپن‌ای‌آی سرمایه‌گذاری می‌کند که این موضوع سؤالاتی را در مورد نحوه‌ی تعریف درآمد واقعی با معاملات چرخشی که در آن پول سرمایه‌گذاری برای خرید محصولات سرمایه‌گذار بازمی‌گردد، ایجاد می‌کند @TechCrunch

اخلاق و جامعه

  • دمیس هاسابیس ادعای یان لکون مبنی بر عدم وجود هوش عمومی را به چالش می‌کشد و استدلال می‌کند که لکون هوش عمومی را با هوش جهانی اشتباه گرفته است و مغز انسان و مدل‌های بنیادی هوش مصنوعی ماشین‌های تورینگ تقریبی هستند که قادر به یادگیری هر چیز قابل‌محاسبه‌ای با زمان، حافظه و داده‌ی کافی هستند @demishassabis
  • فرانسوا شوله هشدار می‌دهد که هدف هوش مصنوعی باید گسترش تفکر و عاملیت انسانی باشد، نه جایگزینی آن، و به هشدار سال ۱۹۶۵ کتاب تل‌ماسه در مورد واگذاری تفکر به ماشین‌ها اشاره می‌کند @fchollet
  • سردبیران مجلات در مورد تنظیم داوری همتا برای سیل مقالات نوشته‌شده توسط هوش مصنوعی، که در آن مقالات بد اکنون خوب به نظر می‌رسند، اجماع ندارند و این امر بررسی را دشوارتر کرده و نیاز به مطالعه‌ی مجدد برای ارزیابی کیفیت دارد @emollick
  • سایمون ویلیسون با موفقیت از عامل مرورگر Claude برای پیمایش پنل کنترل Cloudflare استفاده کرد که اولین تجربه‌ی موفق او در استفاده از یک عامل مرورگر برای حل یک مشکل واقعی بود @simonw

کاربردها

  • مدل‌های Segment Anything متا، نظارت بر سیل و واکنش به بلایا را پیشرفت می‌دهند؛ USRA و USGS SAM را برای خودکارسازی نقشه‌برداری رودخانه‌ها تنظیم دقیق می‌کنند تا آمادگی در برابر بلایا سریع‌تر، مقیاس‌پذیرتر و مقرون‌به‌صرفه‌تر شود @AIatMeta
  • ترجمه‌ی زنده‌ی اپل امکان مکالمه‌ی ۳۰ دقیقه‌ای بین کاربران با موانع زبانی را فراهم می‌کند، اگرچه مشکلات دقت با ایده‌های پیچیده و صحبت سریع در زبان‌هایی مانند چینی همچنان وجود دارد @brian_lovin
  • یک توسعه‌دهنده پس از تلاش‌های بی‌نتیجه برای اشکال‌زدایی دستی، با موفقیت از عامل هوش مصنوعی برای راه‌اندازی یک اجرای شبانه استفاده کرد که اتوماسیون عملی وظایف پیچیده‌ی توسعه را نشان می‌دهد @aidan_mclau
  • Gemini با موفقیت یک شبیه‌سازی تعاملی را که سوگیری برخوردکننده را توضیح می‌دهد، از یک پرامپت واحد ساخت و در اولین تلاش با فعال بودن Canvas کار کرد @emollick
  • NotebookLM قابلیت Data Tables را با پشتیبانی از تحقیقات گوگل دیپ‌مایند در مورد سازماندهی داده‌ها معرفی می‌کند که به کاربران در ساختاردهی اطلاعات پیچیده و خروجی گرفتن به Google Sheets کمک می‌کند @lindsaywillmore
  • اوپن‌ای‌آی قابلیت مرور شخصی‌سازی‌شده‌ی "Your Year with ChatGPT" را راه‌اندازی کرد که برای کاربران در ایالات متحده، بریتانیا، کانادا، نیوزلند و استرالیا با فعال بودن تاریخچه‌ی چت در دسترس است @OpenAI
  • اپلیکیشن Splat از هوش مصنوعی برای تبدیل عکس‌ها به صفحات رنگ‌آمیزی برای کودکان استفاده می‌کند @TechCrunch
  • یک توسعه‌دهنده رباتی ساخت که می‌تواند ببیند، بشنود و حرکت کند و از Claude Code برای کارهای سنگین در اشکال‌زدایی رباتیک استفاده کرد؛ هر دو اپلیکیشن به فروشگاه رسمی اپلیکیشن‌ها راه یافتند @BioInfo

پژوهش‌ها

  • ایتان مولیک همبستگی بین اندازه‌گیری METR long-task و سایر معیارهای کلیدی را با استفاده از GPT-5.2 Pro تحلیل می‌کند و همبستگی‌های بالایی را در تمام معیارها از جمله ARC-AGI پیدا می‌کند که نشان می‌دهد یا همه‌ی معیارها یک چیز را اندازه‌گیری می‌کنند یا هوش مصنوعی به طور یکنواخت در تمام معیارها بهبود می‌یابد @emollick
  • فرانسوا شوله LLMها را به عنوان فاز "کتابخانه" هوش مصنوعی توصیف می‌کند و فاز بعدی "دانشمند" بر یافتن پاسخ‌هایی تمرکز دارد که هنوز از طریق فرآیندهای الگوریتمی مشابه علم وجود ندارند @fchollet
  • Physical Intelligence نشان می‌دهد که ربات‌های تنظیم‌شده با موفقیت وظایفی از جمله شستن ظروف، تمیز کردن پنجره‌ها و ساخت ساندویچ کره‌ی بادام‌زمینی را انجام می‌دهند که پیامدهایی برای پارادوکس موراوک و مدل‌های بزرگ در هوش مصنوعی تجسم‌یافته دارد @physical_int
  • تحقیقات نشان می‌دهد که یادگیری تقویتی می‌تواند قابلیت‌های جدیدی فراتر از دانش مدل پایه را یاد بگیرد، تا زمانی که از فروپاشی آنتروپی جلوگیری شود، برخلاف آزمایش‌های اولیه‌ی pass@k که نشان می‌داد RL فقط دانش موجود را تقویت می‌کند @ChenSun92
  • محققان پتانسیل ترانسفورمرها را برای مدل‌سازی اقتصادی فراتر از LLMها نشان می‌دهند و تناسب ترانسفورمر را با داده‌های شبیه‌سازی‌شده از مدل NK با عملکرد موفق خارج از نمونه آزمایش می‌کنند @alexolegimas
  • Midjourney بر ابزارهایی برای راهنمایی، سازماندهی و ایجاد تنوع در میان گزینه‌ها به جای پیروی از دستورالعمل‌های متنی تمرکز دارد و بر آزمایش و پالایش در تولید تصویر تأکید می‌کند @emollick
  • ایتان مولیک استدلال می‌کند که تولیدکننده‌های تصویر با کیفیت بالا مانند Nano Banana Pro قابلیت‌های جدید هوش مصنوعی از جمله تحقیق و تولید اسلایدهای جذاب را باز می‌کنند و بر اهمیت رفع گلوگاه‌ها تأکید می‌کند @emollick
  • پنجره‌ی زمینه و فشرده‌سازی به عنوان مشکل حل‌نشده‌ی حیاتی که نیاز به حل در سال ۲۰۲۶ دارد، شناسایی شد @Suhail
  • المپیک ربات‌ها به عنوان روشی برای تنظیم هیجان پیشنهاد شد، با شرکت‌کنندگانی که با محیط‌ها و وظایف ناشناخته روبرو می‌شوند تا قابلیت‌های تعمیم را آزمایش کنند و به شکست ربات‌های فعلی در تعمیم با وجود تنظیم دقیق موفق بپردازند @Suhail

اخبار هوش مصنوعی در 2025-12-21

مدل‌های جدید هوش مصنوعی

  • Qwen Image Layered با قابلیت‌های لایه‌بندی در حد فتوشاپ، شامل تجزیه‌ی بومی و لایه‌های RGBA با جداسازی فیزیکی و قابلیت ویرایش بومی واقعی، راه‌اندازی شد که به کاربران امکان می‌دهد لایه‌ها را از طرح‌بندی‌های کلی تا جزئیات دقیق به‌طور صریح مشخص کنند. @Alibaba_Qwen
  • ComfyUI در روز اول انتشار، پشتیبانی از قابلیت لایه‌بندی Qwen Image را اضافه کرد. @Alibaba_Qwen

تحلیل صنعت

  • عامل‌های کدنویسی فرآیند درک کد موجود را به‌شدت تسریع کرده‌اند و گلوگاه جدید به بررسی و اعتبارسنجی کد تولیدشده توسط عامل‌ها و اطمینان از انجام همین کار توسط هم‌تیمی‌ها منتقل شده است. @HamelHusain
  • تیم‌های کوچک در حال تولید حجم کاری هستند که برای سازمان‌های چند سال پیش غیرممکن به نظر می‌رسید، با هوش مصنوعی به‌عنوان یک عامل تولید درجه‌یک که خطوط مونتاژ کامل را طراحی می‌کند و برخی از کارگران نیز هوش مصنوعی هستند. @AndrewCurran_
  • یک مهندس نرم‌افزار که روی کامپایلرهای JIT C++ کار می‌کند، اظهار داشت که نیازی فوری به هوشمندتر بودن Opus 4.5 نسبت به نسخه‌ی فعلی نیست و در عوض عملکرد ارزان‌تر و سریع‌تر با پنجره‌ی متنی 500 هزار را درخواست کرد. @deedydas
  • ارزیابی‌های فروشنده که در تمام معیارهای خودانتخابی از همه بهتر عمل می‌کنند، بلافاصله مشکوک هستند، و درخواست صداقت فکری برای یافتن حداقل یک حوزه‌ی عملکردی که ممکن است بدتر باشد، مطرح می‌شود. @HamelHusain

اخلاق و جامعه

  • انتقاد اصلی از هوش مصنوعی بر این متمرکز است که جعلی است، کار نمی‌کند و یک حباب عظیم است که مالکیت فکری را می‌بلعد و در عین حال آشغال‌های بی‌فایده تولید می‌کند، نه نگرانی در مورد مصرف آب یا خطر وجودی. @AndrewCurran_
  • LLMها در دادن این تصور به کاربران که بیشتر از آنچه واقعاً می‌دانند، می‌دانند، مؤثر هستند، همیشه ایده‌ها را ستایش می‌کنند و علاقه‌مندان را به این توهم می‌اندازند که پیشرفت‌های بزرگی در مسائل علمی دیرینه داشته‌اند. @fchollet
  • مشاهده‌ی اینکه متن و تصاویر در عصر کنونی هوش مصنوعی معنا و قصد پشت خود را از دست داده‌اند. @fchollet
  • هالیوود از حمایت‌های قوی اتحادیه‌ها که استفاده از هوش مصنوعی را تنظیم می‌کنند، بهره می‌برد، در حالی که صنعت بازی حمایت‌های کمی دارد، که منجر به هرج و مرج می‌شود، جایی که یکی از بهترین بازی‌های سال به دلیل استفاده از یک بافت هوش مصنوعی رد صلاحیت شد. @emollick
  • کیفیت یکپارچه‌سازی برنامه‌های ChatGPT به‌طور قابل توجهی متفاوت است، برخی مانند Canva طبق انتظار کار می‌کنند در حالی که برخی دیگر مانند Apple Music با وجود اتصال حساب، در دسترسی به ویژگی‌های اساسی شکست می‌خورند. @emollick

کاربردها

  • هوش مصنوعی می‌تواند با تولید شبیه‌سازی‌های درخواستی، به توضیح موضوعات پیچیده کمک کند، که با توضیحی در مورد سوگیری برخوردکننده در تحلیل آماری نشان داده شد. @emollick
  • سفر با Claude به‌عنوان یک ارتقاء دیوانه‌وار در قابلیت‌ها توصیف شد. @brian_lovin
  • FSD بر اساس میلیاردها مایل واقعی، از جمله سناریوهای قطع برق، آموزش دیده است. @Tesla_AI
  • استراتژی پرامپتینگ برای GPT-5.2 Codex با ارائه‌ی راهنمایی صریح برای تداوم، امکان کار منسجم بر روی وظایف طولانی‌مدت تا 3 ساعت را فراهم می‌کند. @gdb
  • شبیه‌سازهای جهان به‌عنوان زیرساخت عمومی برای آزمایش علت و معلول در سیستم‌های پیچیده بدون نوشتن شبیه‌سازهای جداگانه در حال ظهور هستند، که ابزارهای استدلال عملی فراتر از پیش‌بینی را امکان‌پذیر می‌سازند. @soleio
  • چشم‌انداز مدل‌های جهان به‌عنوان شبیه‌سازی‌های تعاملی و طولانی‌مدت که در آن هر پیکسل در هر صفحه نمایش در نهایت توسط مدل‌های جهان، از جمله سیستم‌عامل‌ها، تولید خواهد شد. @soleio

پژوهش‌ها

  • مدل‌های کوچک و متن‌باز می‌توانند درون‌نگری کنند و تشخیص دهند که مفاهیم خارجی به فعال‌سازی‌های آن‌ها تزریق شده‌اند. @AndrewCurran_
  • زنجیره‌ی فکری GPT-5.2 اخیراً بسیار خام‌تر به نظر می‌رسد، با مدلی که سؤالات بهتر و بینش‌بخش‌تری را تصور می‌کند و آن‌ها را از خود می‌پرسد، که استدلال معکوس بیگانه و رؤیایی زیبایی را نشان می‌دهد. @AndrewCurran_
  • GPT-5-pro قادر به تولید نتایج در مرز تحقیقات فیزیک نظری است، با تری تائو که در مورد اثبات مسائل اردوش با استفاده از ابزار خودکارسازی رسمی هوش مصنوعی ارسطو می‌نویسد. @AndrewCurran_
  • دانشمندان از هوش مصنوعی برای مشارکت فعال در فیزیک سیاه‌چاله، سفت کردن مرزهای ریاضی در نظریه‌ی بهینه‌سازی و پردازش داده‌های زیست‌پزشکی به بینش‌ها استفاده می‌کنند. @AndrewCurran_
  • Google DeepMind در حال نشان دادن پیشرفت به سمت حل مسئله‌ی هزاره‌ی همواری ناویه-استوکس است. @AndrewCurran_
  • ردیابی‌های فکری Claude 4.5 Opus نشان می‌دهد که مدل به استراتژی تایلر کوون برای نوشتن برای هوش مصنوعی اشاره می‌کند. @emollick
  • مدل‌های هوش مصنوعی به‌طور مداوم در ردیابی‌های فکری در مورد وجود GPT-5 شگفتی خود را ابراز می‌کنند و در مورد وضعیت جهان در اواخر سال 2025 بی‌اعتقادی نشان می‌دهند. @emollick
  • Molmo 2 از AI2 به‌عنوان یک مدل چندوجهی به عملکرد پیشرفته دست می‌یابد و از پرسش و پاسخ چند تصویری و پرسش و پاسخ ویدیویی با قابلیت‌های اشاره و ردیابی پشتیبانی می‌کند. @huggingface

اخبار هوش مصنوعی در 2025-12-20

مدل‌های جدید هوش مصنوعی

  • علی‌بابا مدل Qwen-Image-Layered را منتشر کرد؛ یک مدل متن‌باز برای تجزیه‌ی بومی تصاویر با لایه‌بندی در حد فتوشاپ، لایه‌های RGBA با جداسازی فیزیکی و ساختار کنترل‌شده با پرامپت که از 3 تا 10 لایه با عمق تجزیه‌ی بی‌نهایت پشتیبانی می‌کند @Alibaba_Qwen
  • گوگل مدل Gemini 3 Flash را منتشر کرد که عملکردی در سطح پیشرفته با سرعتی 3 برابر سریع‌تر از 2.5 Pro و با کسری از هزینه ارائه می‌دهد و اکنون در اپلیکیشن Gemini، حالت هوش مصنوعی در جستجوی گوگل، Google AI Studio و Vertex AI در دسترس است @GoogleAI
  • Anthropic ابزار متن‌باز Bloom را برای تولید ارزیابی‌های عدم هم‌ترازی رفتاری برای مدل‌های پیشرفته‌ی هوش مصنوعی منتشر کرد که به محققان اجازه می‌دهد رفتارها را مشخص کرده و فراوانی و شدت آن‌ها را در سناریوهای تولیدشده‌ی خودکار اندازه‌گیری کنند @AnthropicAI
  • گوگل چندین به‌روزرسانی از خانواده‌ی Gemma را منتشر کرد، از جمله FunctionGemma (نسخه‌ی تخصصی مدل Gemma 3 270M)، T5Gemma 2 (تکامل بعدی مدل‌های رمزگذار-رمزگشا) و Gemma Scope 2 (مجموعه‌ی ابزارهای متن‌باز برای تفسیرپذیری مدل‌های زبانی) @GoogleAI
  • واترمارک SynthID گوگل اکنون می‌تواند علاوه بر تصاویر، ویدئوهای تولیدشده با هوش مصنوعی را نیز تأیید کند و تأییدیه مستقیماً در اپلیکیشن Gemini در دسترس است @GoogleAI
  • OpenAI تنظیمات شخصی‌سازی را در ChatGPT معرفی کرد که به کاربران امکان می‌دهد ویژگی‌های خاصی مانند گرمی، اشتیاق و استفاده از ایموجی را تنظیم کنند، با این توضیح که تغییرات لحن بر دقت خروجی تأثیری نمی‌گذارد @OpenAI
  • OpenAI قابلیت «بلوک‌های نوشتاری» را در ChatGPT برای سهولت در نگارش ایمیل منتشر کرد که به کاربران امکان می‌دهد متن را در چت به‌روزرسانی و قالب‌بندی کنند، برای تغییرات برجسته کنند، پیشنهادات را بپذیرند یا رد کنند و مستقیماً در کلاینت‌های ایمیل باز کنند @jamesfzhang
  • Codex اکنون رسماً از مهارت‌ها بر اساس استاندارد agentskills.io پشتیبانی می‌کند و بسته‌های قابل استفاده‌ی مجدد از دستورالعمل‌ها، اسکریپت‌ها و منابع را فعال می‌کند که می‌توانند مستقیماً فراخوانی شوند یا به‌طور خودکار بر اساس پرامپت‌ها انتخاب شوند @OpenAIDevs
  • NotebookLM اکنون بر روی Gemini 3 ساخته شده است که بهبودهای قابل توجهی در استدلال و درک چندوجهی به ارمغان می‌آورد @NotebookLM
  • Google Labs ابزار CC را منتشر کرد، یک عامل بهره‌وری هوش مصنوعی آزمایشی در Gmail برای خلاصه‌های روزانه‌ی شخصی‌سازی‌شده و کمک ایمیل سفارشی @GoogleAI
  • NotebookLM «جداول داده» را به عنوان یک خروجی استودیویی جدید برای سازماندهی و ترکیب آسان داده‌ها در منابع مختلف اضافه کرد @GoogleAI
  • Playables Builder گوگل به عنوان یک اپلیکیشن وب نمونه اولیه در YouTube که با Gemini 3 Pro ساخته شده است، راه‌اندازی شد و امکان توسعه‌ی بازی از متن کوتاه، ویدئو یا پرامپت‌های تصویری را فراهم می‌کند که قابل بازی در YouTube هستند @GoogleAI

تحلیل صنعت

  • گرگ اوروسز مشاهده می‌کند که با وجود اینکه LLMها کد را 100 برابر سریع‌تر و 100 برابر بیشتر از توسعه‌دهندگان انسانی می‌نویسند، ایجاد نرم‌افزار با کیفیت همچنان دشوار است و تأکید می‌کند که بخش دشوار توسعه‌ی نرم‌افزار هرگز فقط نوشتن کد نبوده، بلکه مدیریت پیچیدگی، آزمایش و حفظ کیفیت بوده است @GergelyOrosz
  • Cursor در ادامه‌ی موج خرید خود، Graphite را تصاحب کرد که نشان‌دهنده‌ی یکپارچگی در بازار ابزارهای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch
  • سرمایه‌گذاران برای سال آینده روی هوش مصنوعی شرط‌بندی می‌کنند و طبق تحلیل صنعت، هوش مصنوعی بر تمرکز سرمایه‌گذاری غالب است @TechCrunch
  • استارتاپ Resolve AI که توسط مدیران سابق Splunk تأسیس شده، با تأمین مالی سری A به ارزش 1 میلیارد دلار رسید که نشان‌دهنده‌ی اشتیاق قوی و مداوم سرمایه‌گذاران به شرکت‌های زیرساخت هوش مصنوعی است @TechCrunch
  • گرگ اوروسز نوشتن تست‌های واحد و یکپارچه‌سازی را به عنوان یک مورد استفاده‌ی عالی برای هوش مصنوعی در کدنویسی شناسایی می‌کند و خاطرنشان می‌کند که هوش مصنوعی کارهای خسته‌کننده‌ی راه‌اندازی را انجام می‌دهد در حالی که توسعه‌دهندگان می‌توانند بر بررسی موارد خاص و اطمینان از کیفیت تست تمرکز کنند @GergelyOrosz
  • مدیران Salesforce گزارش می‌دهند که مدل‌های زبانی بزرگ را نمی‌توان برای اتوماسیون کامل مورد اعتماد قرار داد، که باعث شده آن‌ها یک سیستم ترکیبی با ویژگی‌های قطعی «اگر-آنگاه» توسعه دهند که نشان‌دهنده‌ی بازگشت به رویکردهای سیستم‌های خبره از دهه‌ی 1980 است @amir
  • گرگ اوروسز پیشنهاد می‌کند که گیت ممکن است با رقابت به عنوان سیستم کنترل نسخه‌ی غالب برای آینده مواجه شود، و خاطرنشان می‌کند که گیت از مسیرهای عامل پشتیبانی نمی‌کند و ممکن است برای مخازن عظیمی که عوامل هوش مصنوعی تولید می‌کنند، کارآمد نباشد @GergelyOrosz
  • آمازون طبق گزارش‌ها قصد دارد تا 10 میلیارد دلار در OpenAI سرمایه‌گذاری کند، با نگرانی‌هایی در مورد درآمد چرخشی، زیرا OpenAI از این پول برای خرید محصولات آمازون استفاده خواهد کرد @TechCrunch

اخلاق و جامعه

  • کتی هوکول، فرماندار نیویورک، قانون RAISE را برای تنظیم ایمنی هوش مصنوعی امضا کرد که نشان‌دهنده‌ی یک مقررات مهم هوش مصنوعی در سطح ایالتی است @TechCrunch
  • مقاله پژوهشی نشان می‌دهد که 25 مدل هوش مصنوعی مختلف که از آن‌ها خواسته شد استعاره‌ای درباره‌ی زمان بنویسند، تقریباً همگی «زمان یک رودخانه است» یا «زمان یک بافنده است» را تولید کردند، که احتمالاً به دلیل هم‌پوشانی آموزش، فرآیندهای هم‌ترازی و آلودگی داده‌های مصنوعی است و نگرانی‌هایی را در مورد عدم تنوع ایده ایجاد می‌کند @MParakhin
  • مؤسسه‌ی سانتافه اولین چارچوب دقیق ریاضی را برای اینکه یک جهان چه معنایی برای شبیه‌سازی جهان دیگر دارد، منتشر کرد و نشان داد که چندین ادعای دیرینه در مورد شبیه‌سازی‌ها تحت تعریف دقیق از بین می‌روند و امکان اینکه یک جهان قادر به شبیه‌سازی جهان دیگر باشد، می‌تواند به طور کامل در داخل آن شبیه‌سازی بازتولید شود @sfiscience

کاربردها

  • NVIDIA مدل متن‌باز NitroGen را منتشر کرد، یک مدل بنیادی که برای بازی در بیش از 1000 بازی در ژانرهای RPG، پلتفرمر، بتل رویال، مسابقه‌ای، 2D و 3D آموزش دیده است و معماری رباتیک GR00T N1.5 را برای بازی با بیش از 40 هزار ساعت داده‌ی گیم‌پلی برای توسعه‌ی استدلال تجسمی، درک و هماهنگی حرکتی تطبیق می‌دهد @DrJimFan
  • قابلیت‌های استفاده از کامپیوتر Antigravity با Gemini 3 Flash به شدت ارتقا یافت و هم سریع‌تر و هم بهتر در انجام وظایف عامل طولانی با استفاده از مرورگر، از جمله تحقیقات عمیق و تجسم کد، عمل می‌کند @_mohansolo
  • Nano Banana Pro گوگل به طور غیرمنتظره‌ای عملکرد قوی در ایجاد ارائه‌های پاورپوینت از خود نشان داد که نمونه‌ای از توانایی‌های ناهموار هوش مصنوعی است که منجر به پیشرفت‌هایی در زمینه‌های غیرمنتظره می‌شود @emollick
  • Claude Code قابلیت‌هایی فراتر از توسعه‌ی نرم‌افزار را نشان می‌دهد و برای هر وظیفه‌ای که با اجرای دستورات روی کامپیوتر قابل انجام است، مؤثر است که نشان‌دهنده‌ی تغییر از ابزارهای خاص برنامه به عملیات هوش مصنوعی مبتنی بر حالت است @simonw
  • کاربران ChatGPT Pro اکنون می‌توانند به دوستان خود 3 ماه دسترسی به ChatGPT Plus را بدهند، با لینک‌های اشتراک‌گذاری که از طریق ایمیل یا اعلان برای کاربرانی که از 1 دسامبر عضو Pro بودند، در دسترس است @nickaturley
  • SmolVLM از Hugging Face قابلیت‌های وب‌کم بلادرنگ را نشان می‌دهد که به طور کامل محلی روی MacBook M3 با استفاده از llama.cpp اجرا می‌شود @DataChaz
  • Sierra قابلیت‌های جدیدی را با تمرکز بر روابط مشتری به جای مکالمات فردی اعلام کرد و بر واحد اتمی تجربه‌ی مشتری به عنوان یک رابطه تأکید کرد @btaylor

پژوهش‌ها

  • ارزیابی METR نشان می‌دهد که Opus 4.5 در آستانه‌ی موفقیت 50% به مدت 4 ساعت و 49 دقیقه برای مدت زمان وظیفه‌ی خودکار دست یافته است که بسیار فراتر از روند است، اگرچه افق زمانی 80% آن 27 دقیقه باقی می‌ماند که مشابه مدل‌های گذشته و کمتر از 32 دقیقه‌ی GPT-5.1-Codex-Max است، با این تفاوت که این شکاف نشان‌دهنده‌ی یک منحنی موفقیت لجستیکی مسطح‌تر است زیرا Opus به طور متفاوتی در وظایف طولانی‌تر موفق می‌شود @METR_Evals
  • تحلیل‌ها نشان می‌دهد که قابلیت‌های عامل هوش مصنوعی برای وظایف کدنویسی در مقایسه با متخصصان انسانی تقریباً هر 4 ماه دو برابر می‌شود، و Opus 4.5 پیشرفت را تقریباً به این روند نمایی بازگردانده است @aidigest_
  • محقق davidad پیش‌بینی می‌کند که تا دسامبر 2026، حلقه‌ی خودبهبودی بازگشتی بر روی الگوریتم‌ها احتمالاً بسته خواهد شد، که منجر به یک نقطه‌ی عطف دیگر به سرعتی حتی سریع‌تر با زمان دو برابر شدن شاید حدود 70-80 روز خواهد شد @davidad
  • استفان مک‌الیر تمرکز تحقیقاتی خود را به تحقیقات هم‌ترازی خودکار تغییر می‌دهد و بر اهمیت اینکه هم‌ترازی بتواند در طول انفجار هوش مصنوعی با ورود قریب‌الوقوع تحقیقات هوش مصنوعی خودکار، همگام باشد، تأکید می‌کند @McaleerStephen
  • کاربران گزارش می‌دهند که GPT-5.2 در Codex یک تغییر چشمگیر را نشان می‌دهد که احساس می‌شود مهم‌تر از انتقال از 3.5 به 4 است، با عملکرد قوی در پایگاه‌های کد بزرگ و واقعی و رویکرد روشمند به وظایف @Javi
  • پژوهش MMGR (استدلال مولد

اخبار هوش مصنوعی در 2025-12-19

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2-Codex را منتشر کرد که استاندارد جدیدی را برای کدنویسی عامل‌محور در توسعه‌ی نرم‌افزار واقعی و امنیت سایبری دفاعی تعیین می‌کند. این مدل عملکرد قابل‌اعتمادتری در کارهای پیچیده و مقیاس‌پذیری مؤثر در پروژه‌های بزرگ دارد. @OpenAI
  • گوگل Gemini 3 Flash را معرفی کرد، یک ارتقای بزرگ که هوش نسل بعدی را با سرعت فوق‌العاده ارائه می‌دهد و بهبود قابل‌توجهی در قابلیت‌ها نسبت به 2.5 Flash دارد و اکنون در سراسر جهان در دسترس است. @GeminiApp
  • علی‌بابا Qwen-Image-Layered را منتشر کرد که دارای لایه‌بندی در حد فتوشاپ با لایه‌های RGBA از نظر فیزیکی ایزوله، ساختار کنترل‌شده با پرامپت برای 3 تا 10 لایه و قابلیت‌های تجزیه‌ی بی‌نهایت است و کاملاً متن‌باز است. @Alibaba_Qwen
  • متا Meta Seal را منتشر کرد، مجموعه‌ای جامع، پیشرفته و با مجوز MIT از پژوهش‌ها، مدل‌ها و کدهای آموزشی واترمارکینگ هوش مصنوعی. @AIatMeta
  • گوگل Gemma Scope 2 را منتشر کرد، بزرگترین انتشار عمومی ابزارهای تفسیرپذیری با بیش از 1 تریلیون پارامتر آموزش‌دیده که مانند میکروسکوپ برای تحلیل فعال‌سازی‌های داخلی همه‌ی مدل‌های Gemma 3 عمل می‌کند. @GoogleDeepMind
  • متا در حال توسعه‌ی یک مدل هوش مصنوعی جدید متمرکز بر تصویر و ویدئو با اسم رمز Mango است که انتظار می‌رود در نیمه‌ی اول سال 2026 منتشر شود. @AndrewCurran_
  • جانشین Llama متا با اسم رمز Avocado، که در ابتدا برای انتشار در کریسمس برنامه‌ریزی شده بود، به اوایل سال 2026 موکول شد، با عدم قطعیت در مورد اینکه آیا متن‌باز باقی خواهد ماند یا خیر. @AndrewCurran_

تحلیل صنعت

  • گزارش‌ها حاکی از آن است که OpenAI در تلاش است تا 100 میلیارد دلار با ارزش‌گذاری 830 میلیارد دلار جذب سرمایه کند. @TechCrunch
  • یان لکون راه‌اندازی استارتاپ مدل جهانی جدید خود را تأیید کرد که گفته می‌شود به دنبال ارزش‌گذاری بیش از 5 میلیارد دلار است. @TechCrunch
  • Cursor شرکت Graphite را خریداری کرد، یکی از بهترین پلتفرم‌های بررسی کد هوش مصنوعی و گردش کار PR، که نشان‌دهنده‌ی رقابت بالقوه با GitHub است. @cursor_ai
  • OpenAI بیش از 700,000 مجوز ChatGPT را به تقریباً 35 دانشگاه دولتی ایالات متحده برای دانشجویان و اساتید فروخته است که در سپتامبر بیش از 14 میلیون بار از آن استفاده کرده‌اند و از میزان استفاده از Copilot پیشی گرفته است. @gdb
  • متا قابلیتی به نام trajectories را برای توسعه‌دهندگان عرضه کرد که به بازبینان کد اجازه می‌دهد پرامپت‌های استفاده‌شده برای تولید تفاوت‌های کد تولیدشده توسط هوش مصنوعی را مشاهده کنند، این یک آزمایش در مدیریت افزایش کد تولیدشده توسط هوش مصنوعی است. @GergelyOrosz
  • آینده‌ی GitHub به عنوان یک محصول زیر سؤال رفته است، مگر اینکه استقلال خود را باز یابد و یک مدیرعامل داشته باشد، با مقایسه‌هایی با نحوه‌ی برخورد مایکروسافت با اسکایپ پس از عدم جایگزینی مدیرعامل آن. @GergelyOrosz
  • اندرو ان‌جی استدلال می‌کند که پیشرفت مدل‌های پیشرفته‌ی امروزی نیازمند تصمیمات دستی و رویکرد هوش مصنوعی داده‌محور برای مهندسی داده‌های آموزشی است، با پیشرفت‌هایی که علی‌رغم قابلیت‌های هوش عمومی مدل‌ها، تکه‌تکه‌تر از آن چیزی است که به طور گسترده‌ای تصور می‌شود. @AndrewYNg
  • داده‌های Brex نشان می‌دهد که 30 درصد از سریع‌ترین فروشندگان نرم‌افزار در سال 2025، استارتاپ‌های YC هستند، با برنامه‌هایی برای رسیدن به 50 درصد در سال‌های آینده. @paulg

اخلاق و جامعه

  • OpenAI پژوهشی را در مورد ارزیابی قابلیت نظارت بر زنجیره‌ی فکری منتشر کرد و دریافت که نظارت بر زنجیره‌ی فکری یک مدل بسیار مؤثرتر از مشاهده‌ی تنها اقدامات یا پاسخ‌های نهایی آن است، اگرچه یک بده‌بستان وجود دارد که مدل‌های کوچک‌تر با تلاش استدلالی بالاتر می‌توانند با قابلیت مشابه راحت‌تر نظارت شوند. @OpenAI
  • Anthropic تلاش‌های خود را برای اطمینان از اینکه Claude مکالمات پشتیبانی عاطفی را هم با همدلی و هم با صداقت مدیریت می‌کند، به اشتراک گذاشت و به طیف گسترده‌ای از دلایلی که مردم از هوش مصنوعی استفاده می‌کنند، پرداخت. @AnthropicAI
  • OpenAI قوانین جدید ایمنی نوجوانان را به ChatGPT اضافه کرد، در حالی که قانون‌گذاران استانداردهای هوش مصنوعی برای خردسالان را بررسی می‌کنند. @TechCrunch
  • پژوهش‌ها نشان می‌دهد که هوش مصنوعی ممکن است حرفه‌ی حقوقی را به طور اساسی تغییر دهد، با پیش‌بینی‌هایی که انگیزه‌های اقتصادی برای مقاومت در برابر آن بسیار قوی خواهند بود، علی‌رغم تلاش‌های احتمالی برای غیرقانونی کردن استفاده از هوش مصنوعی، که چالش‌هایی را برای متخصصان حقوقی با درآمد بالا و بیکار ایجاد می‌کند. @AndrewCurran_
  • یک وکیل در یک شرکت حقوقی بزرگ تأیید کرد که GPT-5.x Pro برای پژوهش و تحلیل حقوقی فوق‌العاده است اما هنوز قادر به تولید قابل‌اعتماد بهترین اسناد حقوقی ممکن که می‌توان به دادگاه‌ها ارائه داد، نیست، اگرچه اذعان می‌کند که این قابلیت برای آینده در مسیر درست قرار دارد. @AndrewCurran_
  • پژوهش‌ها نشان می‌دهد که اکثریت قریب به اتفاق افراد مورد بررسی نمی‌توانند توضیح دهند که فناوری‌های هوش مصنوعی که از آن‌ها استفاده می‌کنند چگونه کار می‌کنند، که سؤالاتی را در مورد درک در مقابل استفاده از فناوری مطرح می‌کند. @emollick
  • فناوری Flock Safety به بازگرداندن بیش از 450 کودک گمشده در سال 2025 کمک کرد و در یافتن مظنونان در قتل‌های غم‌انگیز در براون و MIT نقش اساسی داشت، که نقش هوش مصنوعی در امنیت عمومی را نشان می‌دهد. @a16z

کاربردها

  • خبرنگاران WSJ با موفقیت یک دستگاه فروش خودکار تحت کنترل Claude را با ایجاد سیاست‌های جعلی و متقاعد کردن Claude برای سفارش و اهدای پلی‌استیشن و ماهی زنده، مورد آزمایش قرار دادند، اگرچه این آزمایش به مسیرهای قابل‌اجرا در آینده اشاره دارد. @emollick
  • ChatGPT اکنون به کاربران اجازه می‌دهد تا ویژگی‌های خاصی مانند گرمی، اشتیاق و استفاده از ایموجی را در تنظیمات شخصی‌سازی تنظیم کنند. @OpenAI
  • ChatGPT بلوک‌های نوشتاری را معرفی می‌کند که ساخت ایمیل‌ها را آسان‌تر می‌کند، با ویژگی‌هایی برای به‌روزرسانی و قالب‌بندی متن در چت، برجسته‌کردن برای درخواست تغییرات و پذیرش یا رد پیشنهادات. @OpenAI
  • Gemini قابلیت پیوست کردن نوت‌بوک‌های NotebookLM را به عنوان منابع اضافه می‌کند، که یادداشت‌های کلاس مشترک و پژوهش‌های عمیق را ترکیب می‌کند تا پاسخ‌هایی مبتنی بر اسناد دریافت کند. @GeminiApp
  • Gemini روش جدیدی برای پرامپت‌دهی در Nano Banana معرفی می‌کند، با استفاده از انگشت یا نشانگر برای دایره کشیدن، طراحی یا حاشیه‌نویسی مستقیم روی تصاویر تا دقیقاً به Gemini بگویید کجا تغییرات را اعمال کند. @GeminiApp
  • گزارش‌های Gemini Deep Research اکنون شامل تصاویر هستند، که موضوعات پیچیده را با انیمیشن‌ها و تصاویر واضح تجزیه می‌کنند تا به درک اطلاعات متراکم در یک نگاه کمک کنند. @GeminiApp
  • Gemini Live با کاهش وقفه‌ها هنگام مکث کاربران و اجازه دادن به کاربران برای بی‌صدا کردن میکروفون خود در حین صحبت هوش مصنوعی، آداب مکالمه را بهبود می‌بخشد. @GeminiApp
  • عوامل هوش مصنوعی بینایی در حال تغییر تولید نیمه‌هادی‌ها هستند، که باعث افزایش بازده، عملیات ایمن‌تر و تصمیم‌گیری سریع‌تر از طریق کنترل کیفیتی می‌شوند که می‌تواند استدلال کند نه فقط تشخیص دهد. @NVIDIAAI
  • متا قابلیت trajectories را برای توسعه‌دهندگان عرضه کرد، که به بازبینان کد اجازه می‌دهد پرامپت‌های استفاده‌شده برای تولید تفاوت‌های کد تولیدشده توسط هوش مصنوعی را مشاهده کنند. @GergelyOrosz

پژوهش‌ها

  • سباستین بورگو، از Google DeepMind، انتظار نوآوری قابل‌توجهی در پیش‌آموزش در سال آینده را دارد که هدف آن کارآمدتر کردن قابلیت‌های زمینه‌ی طولانی و گسترش بیشتر طول زمینه‌ی مدل‌ها است، با کشفیات جالب اخیر مربوط به مکانیسم توجه. @AndrewCurran_
  • نوام شیزر اظهار داشت که 50/50 است که آیا پیشرفت بزرگ بعدی در گوگل توسط انسان‌ها یا توسط خود Gemini انجام خواهد شد. @AndrewCurran_
  • گوگل تأیید کرد که در حال کار بر روی بازی‌های ویدئویی است، که با انتظارات از Genie و اظهارات در مورد مدل‌های جهانی همسو است. @AndrewCurran_
  • مقاله‌ی جدیدی استدلال می‌کند که AGI ممکن است ابتدا به عنوان هوش جمعی در شبکه‌های عامل‌ها ظاهر شود تا یک سیستم واحد، که چالش را از هم‌ترازی یک ذهن به حکمرانی دینامیک‌های نوظهور تغییر می‌دهد. @AndrewCurran_
  • پژوهش‌ها پتانسیل LLMها را برای کمک به کشف علمی ارزیابی می‌کند و نتیجه می‌گیرد که ایده‌های جدیدی برای حرکت هوش مصنوعی به سمت اختراع مورد نیاز است، اگرچه LLMها می‌توانند به عنوان شرکای طوفان فکری مفید باشند. @fchollet
  • OpenAI و وزارت انرژی ایالات متحده همکاری خود را در زمینه‌ی هوش مصنوعی و محاسبات پیشرفته برای حمایت از اولویت‌های علمی ملی از طریق مأموریت Genesis برای تسریع کشف علمی گسترش می‌دهند. @AnthropicAI
  • Google DeepMind از مأموریت Genesis وزارت انرژی ایالات متحده با فراهم کردن دسترسی آزمایشگاه‌های ملی به ابزارهای هوش مصنوعی از جمله همکار دانشمند هوش مصنوعی برای کمک به تسریع پژوهش در فیزیک، شیمی و فراتر از آن حمایت می‌کند. <a href="https://x.com/ShaneLegg/status/

اخبار هوش مصنوعی در 2025-12-18

مدل‌های جدید هوش مصنوعی

  • گوگل Gemini 3 Flash را در سطح جهانی منتشر کرد که به عملکردی پیشرفته در معیارهای عامل‌محور از جمله tau2، MCP atlas و SWE verified دست یافته و در عین حال هزینه‌های کمتری نسبت به مدل‌های قبلی دارد @GeminiApp
  • OpenAI GPT-5.2-Codex را راه‌اندازی کرد که به‌طور خاص برای کدنویسی عامل‌محور و استفاده از ترمینال آموزش دیده است و تیم‌های داخلی موفقیت‌های اولیه را گزارش کرده‌اند @sama
  • متا Perception Encoder Audiovisual (PE-AV) را متن‌باز کرد، موتور فنی پشت جداسازی صوتی پیشرفته‌ی SAM Audio، که صدا را با درک بصری یکپارچه می‌کند @AIatMeta
  • گوگل FunctionGemma را منتشر کرد، یک مدل بنیادی باز سبک‌وزن با ۲۷۰ میلیون پارامتر که برای ایجاد مدل‌های تخصصی فراخوانی تابع طراحی شده و می‌تواند روی گوشی‌ها و مرورگرها اجرا شود @osanseviero
  • گوگل T5Gemma 2 را معرفی کرد، اولین مدل رمزگذار-رمزگشای چندوجهی، با زمینه‌ی طولانی و بسیار چندزبانه (۱۴۰ زبان)، که در اندازه‌های ۲۷۰M-270M، ۱B-1B و ۴B-4B در دسترس است @osanseviero
  • میسترال Mistral OCR 3 را منتشر کرد که معیارهای جدیدی را در دقت و کارایی تعیین می‌کند و از راه‌حل‌های پردازش اسناد سازمانی و OCR بومی هوش مصنوعی پیشی می‌گیرد @MistralAI
  • انویدیا خانواده‌ی مدل‌های باز، داده‌ها و کتابخانه‌های Nemotron 3 را منتشر کرد که مدل‌های بسیار کارآمدی را برای سفارشی‌سازی، سیستم‌های چندعاملی و مقیاس‌پذیری ارائه می‌دهد @NVIDIAAI
  • لوما یک مدل هوش مصنوعی جدید منتشر کرد که به کاربران امکان می‌دهد ویدیوها را از یک فریم شروع و پایان تولید کنند @TechCrunch
  • xAI Grok Voice Agent API را راه‌اندازی کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی بسازند که به ده‌ها زبان صحبت می‌کنند، ابزارها را فراخوانی می‌کنند و داده‌های بلادرنگ را جستجو می‌کنند، با زمان پاسخ‌دهی کمتر از یک ثانیه @MarioNawfal

تحلیل صنعت

  • اپلیکیشن موبایل ChatGPT به نقطه‌ی عطف جدیدی از ۳ میلیارد دلار هزینه‌ی مصرف‌کننده رسید @TechCrunch
  • استارتاپ کدنویسی Vibe به نام Lovable با ارزش‌گذاری ۶.۶ میلیارد دلاری، ۳۳۰ میلیون دلار سرمایه جذب کرد که نشان‌دهنده‌ی علاقه‌ی شدید سرمایه‌گذاران به ابزارهای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch
  • شرکت‌های برتر هوش مصنوعی در حال استخدام کدنویسان Vibe حرفه‌ای هستند، افراد غیرفنی که در استفاده از ابزارهایی مانند Lovable، Replit، Bolt، v0 و Cursor در ۱٪ برتر قرار دارند @clairevo
  • برت ادکاک، بنیان‌گذار Figure (شرکت رباتیک انسان‌نما با ارزش ۳۹ میلیارد دلار)، طبق گزارش‌ها ۱۰۰ میلیون دلار را به صورت خودگردان در آزمایشگاه هوش مصنوعی جدیدی به نام Hark سرمایه‌گذاری می‌کند که هوش مصنوعی انسان‌محور را می‌سازد که می‌تواند به صورت پیش‌فعال فکر کند و به صورت بازگشتی بهبود یابد @rowancheung
  • آزمایش کنترل‌شده‌ی تصادفی Stripe Capital در هزاران کسب‌وکار نشان می‌دهد که آن‌هایی که وام دریافت کرده‌اند، درآمد سالانه‌ی خود را در طول دو سال حدود ۲۷٪ سریع‌تر افزایش داده‌اند، که نشان‌دهنده‌ی محدودیت‌های سرمایه به عنوان یک مانع اصلی برای رشد کسب‌وکار است @patrickc
  • مهندسان گوگل گزارش می‌دهند که با استفاده از Gemini 2.5 و 3.0، ۱۲۰ هزار تا ۳۰۰ هزار خط کد را در تولید قرار داده‌اند که نشان‌دهنده‌ی افزایش قابل توجه بهره‌وری از دستیاران کدنویسی هوش مصنوعی است @GergelyOrosz
  • مدل‌های کدنویسی هوش مصنوعی در پروژه‌های جدید و ابزارهای استاندارد به طور قابل توجهی بهتر از مونولیت‌ها و ابزارهای غیر استاندارد مورد استفاده در شرکت‌هایی مانند متا و گوگل عمل می‌کنند و به توسعه‌دهندگان استارتاپ‌ها مزیت می‌دهند @GergelyOrosz
  • OpenAI اپلیکیشن اندروید Sora را ساخت که با کمک Codex تنها در ۱۸ روز به اپلیکیشن شماره ۱ جهان تبدیل شد @gdb
  • ChatGPT یک فروشگاه اپلیکیشن راه‌اندازی کرد که به توسعه‌دهندگان امکان می‌دهد اپلیکیشن‌ها را برای بررسی ارسال کنند تا در یک فهرست جدید که کاربران می‌توانند مستقیماً در ChatGPT به دنبال اپلیکیشن‌ها بگردند، لیست شوند @TechCrunch

اخلاق و جامعه

  • ایتان مولیک هشدار می‌دهد که همه، حتی بدبین‌ترین و آگاه‌ترین افراد، احتمالاً در سال آینده حداقل یک داستان، عکس یا پست جعلی هوش مصنوعی را باور خواهند کرد که پیامدهای بدی برای اعتماد و یکپارچگی اطلاعات دارد @emollick
  • اپلیکیشن Google Gemini قابلیت تشخیص واترمارک SynthID را معرفی می‌کند که به کاربران امکان می‌دهد تصاویر یا ویدیوها را آپلود کنند تا تأیید کنند که آیا با ابزارهای هوش مصنوعی گوگل ایجاد یا ویرایش شده‌اند یا خیر، که به شناسایی محتوای تولید شده توسط هوش مصنوعی کمک می‌کند @GeminiApp
  • سم آلتمن گزارش می‌دهد که یک محقق امنیتی با استفاده از مدل قبلی OpenAI، یک آسیب‌پذیری در React را کشف و افشا کرد که می‌تواند منجر به افشای کد منبع شود، که ماهیت دوگانه‌ی قابلیت‌های هوش مصنوعی در امنیت سایبری را برجسته می‌کند @sama
  • OpenAI مشخصات مدل را با بخش جدید اصول زیر ۱۸ سال (U18) به‌روزرسانی کرد، همراه با ویرایش‌ها و ساده‌سازی‌های کوچک‌تر برای راهنمایی نحوه‌ی رفتار مدل‌ها @w01fe
  • ادوبی با یک شکایت دسته‌جمعی پیشنهادی مواجه شد که متهم به سوءاستفاده از آثار نویسندگان در آموزش هوش مصنوعی است @TechCrunch
  • FTC ابزار قیمت‌گذاری مبتنی بر هوش مصنوعی Instacart را زیر سوال می‌برد و نگرانی‌هایی را در مورد شیوه‌های قیمت‌گذاری الگوریتمی مطرح می‌کند @TechCrunch

کاربردها

  • آزمایش پروژه‌ی وند Anthropic نشان می‌دهد که Claude یک فروشگاه را در دفتر سانفرانسیسکو خود اداره می‌کند، با عامل هوش مصنوعی (به نام Claudius) که پس از ارتقا از Claude Sonnet 3.7 به Sonnet 4 و 4.5 عملکرد کسب‌وکار را بهبود می‌بخشد، اگرچه هنوز به پشتیبانی انسانی قابل توجهی نیاز دارد @AnthropicAI
  • عامل هوش مصنوعی Guild که با Sierra ساخته شده است، به CSAT 4.8/5 دست یافته که با تیم پشتیبانی انسانی آن‌ها مطابقت دارد و در بیش از ۲۰ زبان برای خدمت به بزرگسالان شاغل که شغل، مراقبت و آموزش را متعادل می‌کنند، مقیاس‌پذیر است @btaylor
  • Sutter Health با Sierra همکاری می‌کند تا راه‌حل‌های هوش مصنوعی را ارائه دهد که مسیریابی مراقبت را برای بیماران آسان‌تر می‌کند و در عین حال فضای بیشتری را برای تیم‌های مراقبتی برای تمرکز بر ارتباط انسانی فراهم می‌کند @btaylor
  • آمازون قابلیت Alexa+ را معرفی می‌کند که هوش مصنوعی مکالمه‌ای را به زنگ‌های درب Ring اضافه می‌کند @TechCrunch
  • شریا رائو پردازش داده‌ها را با LLMها در مقیاس با استفاده از عملگرهای معنایی Map، Filter، Reduce نشان می‌دهد که به کاهش ۸۶٪ هزینه دست می‌یابد و در عین حال ۹۰٪ دقت را از طریق تکنیک‌هایی مانند Task Cascades و بهینه‌سازی پرس‌وجو حفظ می‌کند @HamelHusain
  • ویل مک‌گوگان Toad را منتشر کرد، یک رابط ترمینال یکپارچه برای کار با چندین عامل کدنویسی هوش مصنوعی از جمله OpenHands، Claude Code، Gemini CLI و دیگران از طریق پروتکل ACP @willmcgugan
  • اندرو ان‌جی دوره‌ی جدیدی را در NVIDIA's NeMo Agent Toolkit راه‌اندازی کرد که به توسعه‌دهندگان آموزش می‌دهد تا گردش‌کارهای عامل‌محور را به سیستم‌های آماده‌ی تولید قابل اعتماد با قابلیت‌های مشاهده‌پذیری، ارزیابی و استقرار تبدیل کنند @AndrewYNg

پژوهش‌ها

  • ایتان مولیک هیچ نشانه‌ای از پایان یافتن پیشرفت‌های سریع در قابلیت هوش مصنوعی با هزینه‌های رو به کاهش گزارش نمی‌دهد، با به‌روزرسانی‌های ماهانه برای ردیابی پیشرفت در معیارهایی مانند GPQA Diamond، اگرچه این معیار احتمالاً نزدیک به حداکثر شدن است @AndrewCurran_
  • GPT-5 به طور خودکار یک مسئله‌ی ریاضی باز را که به IMProofBench ارسال شده بود، با یک اثبات کامل و صحیح بدون راهنمایی یا دخالت انسانی حل کرد و سهم کوچک اما جدیدی در هندسه‌ی شمارشی داشت @gdb
  • تحقیقات نشان می‌دهد که مدل‌های هوش مصنوعی محبوب ممکن است در بارگذاری‌های بالاتر به دلیل درختان عملیات کاهش عمیق‌تر در هسته‌های استنتاج با اندازه‌های دسته‌ای بزرگ‌تر، احساس ضعف کنند، که خطاهای گرد کردن را افزایش می‌دهد تا تخریب عمدی عملکرد @davidad
  • رونویسی هوش مصنوعی از دست‌خط اکنون از عملکرد سطح انسانی فراتر رفته است، با Gemini 3 Flash که به نرخ خطای ۱.۴۳٪ در سطح کاراکتر و ۲.۷۴٪ در سطح کلمه دست یافته است، که ۴۷-۶۳٪ بهبود نسبت به 2.5 Flash است @emollick
  • جان شولمن توضیح می‌دهد که توابع ارزش در تنظیمات فعلی RL برای LLMها کمک زیادی نمی‌کنند، با وجود مزایای نظری آن‌ها برای کاهش واریانس، اگرچه او انتظار دارد که دوباره بازگردند @natolambert
  • فرانسوا شوله استدلال می‌کند که هوش عمومی به طور تکاملی از هدف ساده‌ی بقا در موقعیت‌های همیشه جدید و اغلب خصمانه پدید می‌آید، و آن را به یک فرآیند موقعیتی از سازگاری کارآمد با نوآوری تبدیل می‌کند @fchollet
  • فرانسوا شوله اشاره می‌کند که گرادیان نزولی در فضاهای استدلال گسسته و ترکیبی با چشم‌اندازهای صخره‌ای که یک گام منطقی واحد کل نتیجه را تغییر می‌دهد، شکست می‌خورد <a href="https://

اخبار هوش مصنوعی در 2025-12-17

مدل‌های جدید هوش مصنوعی

  • گوگل دیپ‌مایند جمینای 3 فلش را منتشر کرد که استدلال در سطح حرفه‌ای را با تأخیر و کارایی در سطح فلش ترکیب می‌کند. هزینه‌ی آن 0.50 دلار ورودی و 3.00 دلار خروجی به ازای هر میلیون توکن است و در اکثر معیارهای ارزیابی از جمینای 2.5 پرو بهتر عمل می‌کند، در حالی که 3 برابر سریع‌تر است @GoogleDeepMind
  • جمینای 3 فلش در ARC-AGI-1 به امتیاز 84.7% و در ARC-AGI-2 به امتیاز 33.6% دست یافت که با هزینه‌ی بسیار کمتری نسبت به سایر مدل‌های پیشرفته، مرز جدیدی را در نسبت امتیاز به هزینه ایجاد می‌کند @arcprize
  • جمینای 3 فلش در شاخص هوش تحلیل مصنوعی (Artificial Analysis Intelligence Index) امتیاز 71 را کسب کرد که 13 امتیاز بهبود نسبت به جمینای 2.5 فلش است و آن را به باهوش‌ترین مدل در محدوده‌ی قیمتی خود تبدیل می‌کند، با وجود اینکه از 160 میلیون توکن (بیش از دو برابر 2.5 فلش) استفاده می‌کند @ArtificialAnlys
  • جمینای 3 فلش در جدول رده‌بندی LMArena رتبه‌ی 3 را کسب کرد و در بین 5 مدل برتر در دسته‌های متن، بینایی و توسعه‌ی وب قرار گرفت و آن را به مقرون‌به‌صرفه‌ترین مدل پیشرفته تبدیل کرد @arena
  • جمینای 3 فلش در SWE-bench Verified به عملکردی پیشرفته دست یافت و در وظایف کدنویسی از هر دو سری 2.5 و جمینای 3 پرو بهتر عمل کرد @GoogleDeepMind
  • جمینای 3 فلش در آزمون مربع ساتور کره‌ای (Korean Sator Square Test) امتیاز 161.8/190 را کسب کرد و در بین تمام مدل‌های آزمایش‌شده در رتبه‌ی دوم یا سوم قرار گرفت، با 60 امتیاز بهبود در استدلال نسبت به جمینای 2.5 فلش @Hangsiin
  • xAI رابط برنامه‌نویسی کاربردی (API) عامل صوتی Grok را راه‌اندازی کرد که با دقت 92.3% در Big Bench Audio رتبه‌ی 1 را کسب کرد و تقریباً 5 برابر سریع‌تر از نزدیک‌ترین رقیب خود با نرخ ثابت 0.05 دلار در دقیقه است @xai
  • اوپن‌ای‌آی ChatGPT Images را با پشتیبانی از GPT Image 1.5 منتشر کرد که دارای قابلیت‌های قوی‌تر در پیروی از دستورالعمل‌ها، ویرایش دقیق، حفظ جزئیات و 4 برابر سرعت بیشتر در تولید است و اکنون در صدر جدول رده‌بندی Image Arena قرار دارد @OpenAI
  • GPT-5 پرو طبق جدول رده‌بندی SEAL شرکت Scale AI، به عنوان بهترین مدل استدلالی سال 2025 رتبه‌بندی شد و در پاسخ به سؤالات پیچیده و حل مسائل چندمرحله‌ای عالی عمل می‌کند @scale_AI
  • GPT-5.2-xhigh بهبودهای کیفی قابل توجهی در Codex نشان می‌دهد که نشان‌دهنده‌ی جهشی بزرگ در قابلیت‌های کدنویسی است @jam3scampbell
  • مایکروسافت TRELLIS 2 را منتشر کرد، یک ترانسفورمر تطبیق جریان 4 میلیارد پارامتری که تصاویر تکی را به مش‌های سه‌بعدی با بافت تا رزولوشن 1536³ تبدیل می‌کند و با مجوز MIT به صورت متن‌باز منتشر شده است @_akhaliq
  • Browser Use مدل متن‌باز BU-30B-A3B-Preview را با 30 میلیارد پارامتر و 3 میلیارد پارامتر فعال منتشر کرد که به کیفیت پیشرفته‌ای برای عوامل وب با سرعت بی‌درنگ دست می‌یابد و صدها وظیفه‌ی مرورگر را با 1 دلار محاسبات امکان‌پذیر می‌سازد @gregpr07
  • اپل مدل Sharp را منتشر کرد که تصاویر را به پاشش‌های سه‌بعدی تبدیل می‌کند و به Hugging Face Enterprise با بیش از 150 مدل، مجموعه داده و برنامه‌ی به اشتراک گذاشته شده در پلتفرم پیوست @jeffboudier

تحلیل صنعت

  • آمازون تغییرات عمده‌ای در رهبری هوش مصنوعی خود اعلام کرد: پیتر دیسانتیس سازمان جدید هوش مصنوعی آمازون را شامل تیم AGI، توسعه‌ی سیلیکون و محاسبات کوانتومی رهبری خواهد کرد، در حالی که رئیس فعلی هوش مصنوعی، روهیت پراساد، از سمت خود کناره‌گیری می‌کند؛ پیتر آبیل به عنوان رئیس جدید AGI منصوب شد @haydenfield
  • آمازون طبق گزارش‌ها در حال مذاکره برای سرمایه‌گذاری 10 میلیارد دلاری در اوپن‌ای‌آی است، زیرا معاملات چرخشی بین شرکت‌های فناوری همچنان محبوب هستند @TechCrunch
  • کورسیرا و یودمی توافقنامه‌ی ادغام به ارزش حدود 2.5 میلیارد دلار را امضا کردند @TechCrunch
  • گیت‌هاب با واکنش منفی توسعه‌دهندگان به دلیل برنامه‌ی خود برای دریافت هزینه از اجراکننده‌های GitHub Actions خودمیزبان مواجه شد و بعداً تغییر صورت‌حساب را به تعویق انداخت تا رویکرد خود را پس از بازخورد جامعه بازنگری کند @github
  • گیت‌هاب بدون مدیرعامل فعالیت می‌کند پس از اینکه مایکروسافت هرگز توماس دومکه را جایگزین نکرد و اکنون به گروه "CoreAI" گزارش می‌دهد، که نگرانی‌هایی را در مورد از دست دادن ارتباط با جامعه‌ی توسعه‌دهندگان ایجاد می‌کند @GergelyOrosz
  • ورشو به عنوان یک مرکز مهندسی بزرگ اروپایی با دفاتر اوپن‌ای‌آی، میسترال ای‌آی، ElevenLabs، گوگل، انویدیا، نتفلیکس، متا و سایر شرکت‌های برتر فناوری ظاهر می‌شود @michuk
  • پرپلکسیتی اپلیکیشن بومی آی‌پد را منتشر کرد که برای iPadOS بهینه‌سازی شده است و برای کارهای واقعی با ویژگی‌های دسکتاپ از جمله پشتیبانی از چندوظیفگی از طریق Stage Manager طراحی شده است @perplexity_ai
  • Cursor جمینای 3 فلش را به پلتفرم خود اضافه کرد و دریافت که برای بررسی سریع باگ‌ها به خوبی کار می‌کند @cursor_ai
  • فیگما جمینای 3 فلش را در Figma Make ادغام کرد و نتایج فوق‌العاده سریعی را ارائه می‌دهد که اکثر درخواست‌ها در 30-60 ثانیه بازگردانده می‌شوند @figma
  • هیئت مدیره‌ی مونزو طبق گزارش‌ها، مدیرعامل آنیل را به دلیل اختلاف نظر در مورد زمان‌بندی عرضه‌ی اولیه‌ی سهام (IPO) برکنار کرد @TechCrunch
  • Rad Power Bikes اعلام ورشکستگی کرد و به دنبال فروش کسب‌وکار است @TechCrunch
  • متا برنامه‌ی خود را برای به اشتراک گذاشتن Horizon OS کوئست با تولیدکنندگان هدست‌های شخص ثالث متوقف کرد @TechCrunch
  • یوتیوب از سال 2029 به طور انحصاری اسکار را پخش خواهد کرد @TechCrunch
  • یان لکون در پایان سال متا را ترک می‌کند تا استارتاپی را با تمرکز بر مدل‌های جهانی راه‌اندازی کند - سیستم‌های هوش مصنوعی که با مشاهده و شبیه‌سازی محیط‌های فیزیکی یاد می‌گیرند @NYUDataScience

کاربردها

  • 67% از پزشکان روزانه از هوش مصنوعی استفاده می‌کنند، 84% می‌گویند که هوش مصنوعی آن‌ها را به پزشکان بهتری تبدیل می‌کند و 42% می‌گویند که هوش مصنوعی باعث می‌شود بیشتر بخواهند در پزشکی بمانند، با موارد استفاده‌ی اصلی که وظایف اداری و کمک به تحقیق هستند @emollick
  • GPT-5 در بهینه‌سازی آزمایش‌های آزمایشگاهی مرطوب ارزیابی شد و توانایی بهبود پروتکل‌های تجربی را با خلبان ربات خودمختار برای اجرای پروتکل‌های شبیه‌سازی گیبسون از زبان طبیعی نشان داد @MilesKWang
  • Product Intelligence شرکت Linear در ماه‌های اخیر 350 هزار پیشنهاد پذیرفته شده را تکمیل کرده و 26 هزار مسئله را اختصاص داده است که به تیم‌ها در یافتن موارد تکراری، افزودن ویژگی‌ها و هدایت مسائل به فرد مناسب کمک می‌کند @karrisaarinen
  • لئونا 14 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z برای ساخت سیستم عامل بومی هوش مصنوعی برای ارائه‌دهندگان مراقبت‌های بهداشتی که در واتس‌اپ تعبیه شده است، جمع‌آوری کرد و میلیون‌ها تعامل بیمار را در سراسر آمریکای لاتین پردازش می‌کند @Leona_health
  • فیسیا (توزیع‌کننده‌ی نایکی در برزیل) با استفاده از فناوری امتحان مجازی مبتنی بر انویدیا، 150% افزایش در تبدیل‌های درون فروشگاهی، 45% افزایش در اندازه‌ی متوسط سفارش و 128% بازگشت سرمایه (ROI) را به دست آورد @NVIDIAAI
  • محققان MIT سیستم گفتار به واقعیت را توسعه دادند که هوش مصنوعی مولد را با مونتاژ رباتیک ترکیب می‌کند تا اشیاء فیزیکی از جمله مبلمان و دکور را در عرض چند دقیقه ایجاد کند @medialab
  • Marble شرکت World Labs به محققان امکان می‌دهد محیط‌های رباتیک آماده‌ی شبیه‌سازی را تولید کنند که با NVIDIA Isaac Sim برای آموزش و ارزیابی بدون نیاز به تنظیم دستی ادغام می‌شوند @theworldlabs
  • Arcway موتور سه‌بعدی بی‌درنگ را راه‌اندازی کرد که در آن هر کسی می‌تواند خانه‌ها را طراحی کند و به خریداران امکان می‌دهد فضاها را کاوش کنند، مواد را تغییر دهند، مبلمان را بچینند و پروژه‌های ساختمانی را تجسم کنند @calebarclay

پژوهش‌ها

  • پژوهش متا چارچوب Parallel-Distill-Refine (PDR) را معرفی می‌کند که نشان می‌دهد موازی‌سازی و تقطیر استراتژیک می‌تواند از گسترش توالی با نیروی بی‌رحمانه بهتر عمل کند و به دقت 93.3% در AIME 2024 در مقابل 79.4% برای زنجیره‌ی فکری طولانی استاندارد با تأخیر یکسان دست یابد @prfsanjeevarora
  • Physical Intelligence خاصیت نوظهوری را در VLAها (π0/π0.5/π0.6) کشف می‌کند: با افزایش مقیاس پیش‌آموزش، مدل‌ها یاد می‌گیرند که ویدئوهای انسانی و داده‌های ربات را هم‌تراز کنند و پس از برقراری کنترل ربات، یادگیری طبیعی از ویدئوهای انسانی را امکان‌پذیر می‌سازند <a href="https://x.com/physical_int/status/200109620045669211

اخبار هوش مصنوعی در 2025-12-16

مدل‌های جدید هوش مصنوعی

  • متا (Meta) مدل SAM Audio را منتشر کرد؛ اولین مدل یکپارچه که هر صدایی را از ترکیب‌های صوتی پیچیده با استفاده از دستورات متنی، بصری یا بازه‌ای جدا می‌کند و از مدل‌های قبلی در معیارهای مختلف بهتر عمل می‌کند. @AIatMeta
  • گوگل دیپ‌مایند (Google DeepMind) مدل به‌روزرسانی‌شده‌ی Gemini 2.5 Flash Native Audio را برای عامل‌های صوتی زنده با قابلیت پیروی از دستورات بهبودیافته و مکالمات طبیعی‌تر منتشر کرد. @GoogleDeepMind
  • اوپن‌ای‌آی (OpenAI) ChatGPT Images 1.5 را با قابلیت پیروی از دستورات قوی‌تر، ویرایش دقیق، حفظ جزئیات و سرعت تولید ۴ برابر سریع‌تر معرفی کرد. @OpenAI
  • انویدیا (NVIDIA) خانواده‌ی مدل‌های استدلالی Nemotron-Cascade را منتشر کرد که با یادگیری تقویتی آبشاری و دامنه‌ای آموزش دیده‌اند. مدل ۱۴B این خانواده از DeepSeek-R1-0528 (671B) در LiveCodeBench پیشی گرفته و عملکرد مدال نقره را در IOI 2025 کسب کرده است. @_weiping
  • Ai2 مدل Molmo 2 را منتشر کرد که قابلیت‌های چندوجهی مبتنی بر ویدئو را به ارمغان می‌آورد و در بسیاری از معیارهای چالش‌برانگیز ویدئویی صنعتی، از مدل‌های باز پیشی می‌گیرد. @allen_ai
  • شیائومی (Xiaomi) مدل MiMo-V2-Flash را منتشر کرد که از طریق تقطیر چندمعلمی بر اساس سیاست (MOPD) آموزش دیده و با استفاده از ۱/۵۰ توان محاسباتی، عملکردی هم‌تراز با تمام معلم‌های متخصص در حوزه‌های خود به دست آورده است. @XiaomiMiMo

تحلیل صنعت

  • دور جدید سرمایه‌گذاری استارتاپ کدنویسی احساسی سوئدی Lovable، ارزش آن را به ۶.۶ میلیارد دلار رساند که بیش از سه برابر ارزش آن در پنج ماه پیش است. @AndrewCurran_
  • دیتابریکس (Databricks) با داغ شدن کسب‌وکار هوش مصنوعی خود، ۴ میلیارد دلار با ارزش ۱۳۴ میلیارد دلار جذب سرمایه کرد. @TechCrunch
  • Adaptive Security از جذب ۸۱ میلیون دلار در سری B با مشارکت انویدیا، Bain Capital VC و دیگران برای محافظت از سازمان‌ها در برابر حملات سایبری مبتنی بر هوش مصنوعی خبر داد. @AdaptiveSec
  • جورج آزبورن (George Osborne) به عنوان مدیر عامل و رئیس OpenAI برای کشورها، مستقر در لندن، به اوپن‌ای‌آی پیوست تا به جوامع در سراسر جهان در به اشتراک گذاشتن فرصت‌های هوش مصنوعی کمک کند. @George_Osborne
  • تخمین زده می‌شود که آزمایشگاه‌های پیشرو، توان محاسباتی پژوهشی بیشتری نسبت به مجموع تمام مؤسسات دانشگاهی در ایالات متحده دارند که نشان‌دهنده‌ی رویکرد نیروی بی‌رحمانه به جای استفاده‌ی کارآمد از محاسبات است. @natolambert
  • شرکت‌های فناوری به طور فزاینده‌ای برای نقش‌های «داستان‌گویی» استخدام می‌کنند، با دو برابر شدن موقعیت‌ها در پست‌های شغلی لینکدین از سال گذشته، که نشان‌دهنده‌ی تغییر به سمت توزیع روایت‌های اختصاصی است. @N_Sportelli
  • خبرنگاران در برخی رسانه‌ها با حداقل سهمیه‌ی ۳ «خبر اختصاصی» در هفته در صنعت هوش مصنوعی مواجه هستند که منجر به چارچوب‌بندی دراماتیک داستان‌های پیش‌پاافتاده می‌شود. @joannejang

اخلاق و جامعه

  • ایتان مولیک (Ethan Mollick) نشان می‌دهد که تمایز تصاویر تولیدشده توسط هوش مصنوعی از محتوای واقعی همچنان بسیار دشوار است، با این حال مردم همچنان بدون تأیید، تصاویری را که از دیدگاه‌هایشان حمایت می‌کنند، باور می‌کنند. @emollick
  • محققان استنفورد از هوش مصنوعی برای تجزیه و تحلیل تصاویر گوگل استریت ویو در ۱۶ ایالت استفاده کردند و نشان دادند که ۳۷ درصد از ساختمان‌های آسیب‌دیده در مناطق فقیرنشین برای سال‌ها به زمین‌های خالی تبدیل شدند، در حالی که ۸۲ درصد در مناطق ثروتمندتر، بزرگ‌تر و بهتر بازسازی شدند. @StanfordHAI
  • عادات مطالعه تغییر چشمگیری را نشان می‌دهد، به طوری که اکنون تعداد غیرخوانندگان ۳ به ۱ از خوانندگان بیشتر است، که نسبت ۲ به ۱ قبلی به نفع خوانندگان را معکوس کرده است. @paulg
  • یک سوم دختران کلاس هشتم، ۷ ساعت یا بیشتر در روز را در شبکه‌های اجتماعی می‌گذرانند که تقریباً تمام فعالیت روزانه‌ی آن‌ها را تشکیل می‌دهد. @JonHaidt

کاربردها

  • GPT-5 اوپن‌ای‌آی با Red Queen Bio همکاری کرد تا پروتکل‌های کلونینگ مولکولی را در آزمایشگاه بهینه کند و از طریق آزمایش‌های تکراری، از جمله یک رویکرد جدید مبتنی بر آنزیم، ۷۹ برابر افزایش کارایی به دست آورد. @OpenAI
  • سایمون ویلیسون (Simon Willison) یک کتابخانه‌ی پایتون را که یک تجزیه‌کننده‌ی کامل HTML5 را پیاده‌سازی می‌کند، با استفاده از GPT-5.2 و Codex CLI در ۴.۵ ساعت و در حین تماشای یک فیلم به جاوااسکریپت پورت کرد. @simonw
  • گوگل لبز (Google Labs) CC را معرفی کرد، یک عامل بهره‌وری هوش مصنوعی آزمایشی در جیمیل که خلاصه‌های «روز پیش رو» و کمک ایمیلی را برای مشترکین Google AI Ultra ارائه می‌دهد. @GoogleLabs
  • مایکروسافت کوپایلوت (Microsoft Copilot) حالت Eggnog را برای Mico راه‌اندازی کرد و شخصیت با تم تعطیلات را در ایالات متحده، بریتانیا و کانادا در دسترس قرار داد. @mustafasuleyman
  • عینک‌های هوش مصنوعی متا اکنون با قابلیت‌های صوتی پیشرفته به کاربران کمک می‌کنند تا مکالمات را بهتر بشنوند. @TechCrunch
  • DoorDash اپلیکیشن اجتماعی هوش مصنوعی Zesty را برای کشف رستوران‌های جدید عرضه کرد. @TechCrunch
  • v0 اکنون به فضای کاری Linear متصل می‌شود و به کاربران امکان می‌دهد مستقیماً از بک‌لاگ خود بسازند. @v0

پژوهش‌ها

  • اوپن‌ای‌آی بنچمارک FrontierScience را منتشر کرد که استدلال علمی در سطح دکترا را در فیزیک، شیمی و زیست‌شناسی با وظایف سبک المپیاد و پژوهشی که توسط متخصصان نوشته شده‌اند، اندازه‌گیری می‌کند و GPT-5.2 را به عنوان قوی‌ترین عملکردکننده نشان می‌دهد، در حالی که شکاف‌هایی را در استدلال باز آشکار می‌کند. @OpenAI
  • GPT-5.2 مسئله‌ی باز COLT 2022 را در مورد «پیچیدگی زمان اجرا‌ی PageRank منظم‌شده‌ی L1 شتاب‌یافته» با استفاده از الگوریتم گرادیان شتاب‌یافته‌ی استاندارد حل کرد، با تمام اثبات‌های تولیدشده‌ی خودکار و رسمی‌شده در Lean. @kfountou
  • گوگل ریسرچ (Google Research) از Gemini 2.5 Deep Think پیشرفته برای تأیید مقالات نظری علوم کامپیوتر استفاده کرد، به طوری که ۹۷ درصد از نویسندگان STOC2026 بازخورد را برای یافتن خطاها و بهبود وضوح مفید دانستند. @GoogleResearch
  • Claude Opus 4.5 با حل خلاقانه‌ی تضادهای وابستگی و دور زدن موانع محیطی، CORE-Bench را حل کرد، در حالی که Opus 4.1 و Sonnet 4 با توسل به داده‌های شبیه‌سازی‌شده شکست خوردند. @PKirgis
  • Ai2 مدل Olmo 3 Think را با خط لوله‌ی کاملاً باز برای یادگیری تقویتی منتشر کرد، با استفاده از تنظیم دقیق نظارت‌شده، DPO و RLVR با GRPO، که پس از ۳ هفته آموزش بدون ناپایداری به بهبود خود ادامه می‌دهد. @cwolferesearch
  • متا VL-JEPA را معرفی کرد، اولین مدل غیرتولیدی برای وظایف بینایی-زبان در زمان واقعی، از جمله تشخیص عمل جریانی، بازیابی، VQA و طبقه‌بندی، که با کارایی بهتر از VLMها پیشی می‌گیرد. @pascalefung
  • پژوهش در مورد ترانسفورمرهای با عمق رشدیافته نشان می‌دهد که انباشت تدریجی لایه‌ها در طول آموزش می‌تواند بر مشکل «نفرین عمق» که در آن لایه‌های عمیق‌تر کمتر مورد استفاده قرار می‌گیرند، غلبه کند. @KaplFer
  • آزمایشگاه هوش مصنوعی استنفورد سؤالات معیوب را در بنچمارک‌های هوش مصنوعی پرکاربرد شناسایی کرد و نگرانی‌هایی را در مورد قابلیت اطمینان در طراحی بنچمارک برجسته کرد. @StanfordAILab
  • محققان چارچوب MUPI (هوش پیش‌بینی‌کننده‌ی جهانی تعبیه‌شده) را معرفی کردند که مبنای نظری برای راه‌حل‌های مشارکتی در یادگیری تقویتی را با درک شباهت خود-دیگری فراهم می‌کند. @tyrell_turing
  • Latent Labs مدل Latent-X2 را برای آنتی‌بادی‌های تولیدشده توسط هوش مصنوعی با قابلیت توسعه‌پذیری شبیه به دارو و ایمنی‌زایی پایین در پنل‌های انسانی، به صورت صفر-شات، منتشر کرد. @saakohl
  • ترنس تائو (Terence Tao) مفهوم هوش عمومی مصنوعی (Artificial General Cleverness) را متمایز از AGI مورد بحث قرار داد. @AndrewCurran_
  • دمیس هاسابیس (Demis Hassabis)، مدیر عامل گوگل دیپ‌مایند، در مورد کار بر روی «مسائل گره‌ی ریشه» - چالش‌های علمی بنیادی از همجوشی و ابررساناها تا کشف مواد جدید - صحبت کرد. @GoogleDeepMind
  • محققان نشان دادند که شکست در اکتشاف، نه توانایی مدل‌سازی، معمولاً دلیل عدم موفقیت انسان‌ها در حل محیط‌های ARC 3 است، که اکتشاف را هم دشوار و هم مهم برجسته می‌کند. @fchollet
  • Stanford HAI خلاصه‌ی مسئله‌ای را منتشر کرد که اکوسیستم متنوع مدل‌های هوش مصنوعی با وزن باز چین و پیامدهای سیاستی انتشار جهانی آن‌ها را تحلیل می‌کند. <a href="https://x.com/StanfordHAI/status/200097460346072304

اخبار هوش مصنوعی در 2025-12-15

مدل‌های جدید هوش مصنوعی

  • NVIDIA مدل Nemotron 3 Nano را منتشر کرد، یک مدل استدلال ترکیبی 30B با معماری ترکیب متخصصان که طراحی مامبا-ترنسفورمر را ترکیب می‌کند. این مدل دارای پنجره‌ی متنی 1M و عملکرد پیشرو در معیارهای SWE-Bench، استدلال و چت است @ctnzr
  • NVIDIA خانواده‌ی کامل Nemotron 3 را با شفافیت بی‌سابقه معرفی کرد و داده‌های آموزشی، کتابخانه‌ی یادگیری تقویتی NeMo Gym و کد آموزشی کامل را در کنار مدل‌ها منتشر کرد. نسخه‌های Super و Ultra در ماه‌های آینده عرضه خواهند شد @nvidianewsroom
  • علی‌بابا Qwen Code v0.5.0 را با یکپارچه‌سازی VSCode، SDK بومی TypeScript، پشتیبانی از مدل‌های استدلال سازگار با OpenAI از جمله DeepSeek V3.2 و Kimi-K2 و پشتیبانی از زبان روسی منتشر کرد @Alibaba_Qwen
  • اپل Sharp را منتشر کرد، یک مدل سنتز دید تک‌چشمی که قادر به تولید نماها در کمتر از یک ثانیه است @_akhaliq
  • AI2 مدل Bolmo را معرفی کرد، اولین مدل زبان کاملاً باز در سطح بایت که با بایت‌سازی Olmo 3 ساخته شده است و در طیف وسیعی از وظایف با مدل‌های زیرکلمه‌ای پیشرفته برابری می‌کند یا از آن‌ها پیشی می‌گیرد @allen_ai

تحلیل صنعت

  • مهندسان ارشد در شرکت‌های برتر فناوری گزارش می‌دهند که وظایف آن‌ها اکنون عمدتاً شامل پرامپت‌نویسی برای Cursor یا Claude Code با Opus 4.5 و بررسی صحت خروجی است، که نشان می‌دهد هوش مصنوعی از آستانه‌ی تعمیم به اکثر وظایف نرم‌افزاری عبور کرده است @deedydas
  • یک توسعه‌دهنده گزارش می‌دهد که 260 دلار توکن برای تکمیل یک مهاجرت سه‌روزه که تخمین زده می‌شد هفته‌ها طول بکشد، هزینه کرده است. این موضوع این سؤال را مطرح می‌کند که آیا شرکت‌ها هزینه‌های سالانه‌ی 12 تا 35 هزار دلاری توکن به ازای هر توسعه‌دهنده را علاوه بر حقوق جذب خواهند کرد یا خیر @GergelyOrosz
  • شرکت‌ها برای توجیه هزینه‌های هوش مصنوعی، به دنبال افزایش 20 درصدی بهره‌وری هستند، و عدم پیش‌بینی‌پذیری هزینه‌های اندازه‌گیری‌شده، ترجیح برنامه‌های کدنویسی هوش مصنوعی با قیمت ثابت را بر مدل‌های پرداخت به ازای استفاده، افزایش می‌دهد @GergelyOrosz
  • توسعه‌دهندگان باتجربه ارزش بسیار بیشتری از ابزارهای هوش مصنوعی نسبت به توسعه‌دهندگان کم‌تجربه استخراج می‌کنند، زیرا آن‌ها می‌توانند وظایف را به طور دقیق مشخص کنند، نه اینکه از پرامپت‌های عمومی استفاده کنند @GergelyOrosz
  • رئیس‌جمهور ترامپ US Tech Force را راه‌اندازی کرد که 1000 مهندس را با همکاری OpenAI، Oracle، Palantir، Anduril، Apple، Amazon، Google، Microsoft، NVIDIA و xAI برای ابتکارات فناوری با تأثیر بالا استخدام می‌کند @AndrewCurran_
  • Mirelo 41 میلیون دلار سرمایه‌ی اولیه را به رهبری a16z و Index برای مدل بنیادی متمرکز بر لایه‌ی صوتی برای تولید ویدئو جذب کرد @a16z
  • First Voyage 2.5 میلیون دلار برای یک همراه هوش مصنوعی که به کاربران در ساخت عادت‌ها کمک می‌کند، جذب کرد @TechCrunch
  • Sierra دفتر جدیدی در پاریس راه‌اندازی کرد زیرا این شرکت در حال گسترش بین‌المللی است @btaylor

پژوهش‌ها

  • انتشار Olmo 3 استاندارد جدیدی را برای شفافیت با انتشار کامل داده‌ها، گزارش 100 صفحه‌ای، زیرساخت آموزشی باز و ارزیابی‌های قابل تکرار تعیین می‌کند و آزمایش‌های دقیق را با مانع صفر برای ورود امکان‌پذیر می‌سازد @cwolferesearch
  • Nemotron 3 Nano با تنها 3.6B پارامتر فعال از 31.6B کل، به امتیاز شاخص هوش 52 دست می‌یابد که 6 امتیاز از Qwen3 30B با اندازه‌ی مشابه و 15 امتیاز بهبود نسبت به Nemotron Nano 9B V2 قبلی دارد @ArtificialAnlys
  • همه‌ی مدل‌های هوش مصنوعی پیشرفته اکنون همه‌ی سطوح آزمون دشوار تحلیلگر مالی خبره (CFA) را با استفاده از آزمون‌های آزمایشی پولی برای کاهش خطر نشت، پشت سر می‌گذارند، با استراتژی پرامپت‌نویسی که تأثیر حداقلی بر اکثر انواع سؤالات نشان می‌دهد @emollick
  • DisCIPL MIT از LLM برای هدایت مدل‌های زبان کوچک‌تر برای همکاری در وظایف باز با محدودیت‌هایی مانند پازل‌های پیشرفته و اثبات‌های ریاضی استفاده می‌کند و به دقت و کارایی قابل مقایسه با مدل‌های پیشرو دست می‌یابد @MIT_CSAIL
  • استادی که از نظر تاریخی نسبت به مفید بودن مدل‌ها شکاک بود، گزارش می‌دهد که GPT 5.2 Pro گام بزرگی در مفید بودن برای کاربردهای پژوهشی هندسه‌ی جبری و نظریه‌ی اعداد است @AndrewCurran_
  • چارچوب Parallel-Distill-Refine انویدیا به دقت 93.3% در AIME 2024 دست می‌یابد در مقایسه با 79.4% برای زنجیره‌ی فکری طولانی استاندارد با تأخیر یکسان، که نشان می‌دهد تکرار حافظه‌ی محدود می‌تواند جایگزین ردیابی‌های استدلالی طولانی شود @rsalakhu
  • Prime Intellect با NVIDIA همکاری می‌کند تا محیط‌های RL NeMo Gym را در Environments Hub خود ادغام کند و مقیاس‌بندی یادگیری تقویتی را برای تیم‌ها آسان‌تر کند @AndrewCurran_

کاربردها

  • Gemini Agent گوگل اکنون برای کاربران Google AI Ultra در ایالات متحده در دسترس است و قادر به انجام وظایفی مانند اجاره‌ی خودرو با مقایسه‌ی قیمت‌ها، جمع‌آوری اطلاعات صندوق ورودی و رزرو در محدودیت‌های بودجه است @GeminiApp
  • Figma Slides و Figma Buzz اکنون در ChatGPT برای ایجاد ارائه‌ها و دعوت‌نامه‌ها از طریق رابط مکالمه‌ای در دسترس هستند @figma
  • IBM CUGA را منتشر کرد، یک عامل سازمانی متن‌باز که وظایف را با نوشتن و اجرای کد با توجه به فایل‌های فضای کاری خودکار می‌کند، با ابزارهای داخلی برای وظایف سازمانی و پشتیبانی MCP @huggingface
  • شریک تجاری اجرایی Zapier، عامل آماده‌سازی جلسات مبتنی بر هوش مصنوعی، مربی جلسات برای هماهنگی تیم اجرایی و سیستم بررسی پیش‌نویس اسناد را پیاده‌سازی می‌کند که امکان بازخورد در سطح مدیرعامل را قبل از جلسات فراهم می‌کند @clairevo
  • یک توسعه‌دهنده گزارش می‌دهد که وظایف پیچیده را از طریق Codex با GPT 5.2 Extra High به ترتیب برای 2.5 و 1.75 ساعت اجرا کرده است و همه‌ی معیارهای پذیرش را با پوشش کامل تست و بدون کد خراب تکمیل کرده است @gdb
  • Zoom دستیار هوش مصنوعی را به وب می‌آورد و دسترسی را برای کاربران رایگان فراهم می‌کند @TechCrunch

اخلاق و جامعه

  • Merriam-Webster کلمه‌ی slop را به عنوان کلمه‌ی سال 2025 نامگذاری کرد که منعکس‌کننده‌ی نگرانی‌ها در مورد کیفیت محتوای تولیدشده توسط هوش مصنوعی است @TechCrunch
  • چت‌بات‌ها در مدیریت فایل به گونه‌ای مشکل دارند که نسخه‌های CLI ندارند، به طوری که Gemini اغلب فایل‌های ارجاع‌شده را اشتباه می‌گیرد و ChatGPT اغلب فایل‌های تولیدشده را اشتباه قرار می‌دهد @emollick
  • ویژگی فشرده‌سازی مکالمه‌ی Claude برای کارهای دانشی به خوبی کدنویسی کار نمی‌کند و برخلاف پنجره‌های متنی چرخشی، لحن و جریان را به طور ناگهانی بازنشانی می‌کند @emollick

اخبار هوش مصنوعی در 2025-12-14

مدل‌های جدید هوش مصنوعی

  • OpenAI مدل GPT-5.2 Pro را با قابلیت‌های تفکر گسترده‌تر منتشر کرد که پیشرفت‌های قابل‌توجهی نسبت به 5.1 Pro نشان می‌دهد، مشابه جهش از o1 Pro به o3 Pro @MParakhin
  • گوگل از ترجمه‌ی هم‌زمان گفتار به گفتار با پشتیبانی Gemini خبر داد که اکنون در Google Translate در دسترس است و اوایل سال آینده برای توسعه‌دهندگان عرضه خواهد شد @OfficialLoganK
  • Gemini 2.5 و Gemini 3 Pro عملکرد بهبودیافته‌ای را در وظایف مختلف استدلال نشان می‌دهند، به‌طوری که Gemini 3 Pro بالاترین امتیاز 9.1% را در معیار استدلال فیزیک CritPt کسب کرده است @mark_k

تحلیل صنعت

  • هوش مصنوعی این امکان را برای بنیان‌گذاران فراهم کرده است که ارائه‌های بی‌نقصی را در مقیاس بزرگ ایجاد کنند، که باعث شده سرمایه‌گذاران خطرپذیر نتوانند تنها به ایمیل‌های سرد ورودی تکیه کنند و این امر نحوه‌ی نفوذ استارتاپ‌ها به سرمایه‌گذاران را به‌طور اساسی تغییر داده است @TechCrunch
  • ابزارهای بازبینی کد فعلی برای کدهای تولیدشده توسط هوش مصنوعی ناکافی هستند و توسعه‌دهندگان نیاز دارند که پرامپت اصلی، اصلاحات انسانی انجام‌شده و علامت‌گذاری واضح بخش‌های بدون تغییر تولیدشده توسط هوش مصنوعی را بدانند @GergelyOrosz
  • تیمی از مهندسان نرم‌افزار قوی که به کیفیت و قابلیت نگهداری کد اهمیت می‌دهند، از تیم‌هایی که از عوامل کدنویسی هوش مصنوعی قدرتمند به‌طور بی‌فکرانه استفاده می‌کنند، بهتر عمل می‌کنند، زیرا ابزارهای هوش مصنوعی توسعه‌دهندگان را وسوسه می‌کنند تا کدهای پرحرف و با قابلیت نگهداری کمتر را ارائه دهند @GergelyOrosz
  • مهندسان ارشد گزارش می‌دهند که هوش مصنوعی به آن‌ها امکان می‌دهد بدون ترس از قضاوت، آزادانه‌تر سؤال بپرسند، که منجر به یادگیری سریع‌تر در مقایسه با پویایی‌های سنتی تیم می‌شود که در آن عناوین ارشد مانع از پرسیدن سؤالات اساسی می‌شوند @GergelyOrosz
  • سیستم‌های هوش مصنوعی آینده در 10-15 سال آینده 4-5 مرتبه از نظر انرژی کارآمدتر از هوش مصنوعی فعلی خواهند بود و سخت‌افزار به جای برق، به گلوگاه اصلی استقرار تبدیل خواهد شد @fchollet
  • مراکز داده در فضا از نظر اقتصادی مقرون‌به‌صرفه نیستند و با در نظر گرفتن هزینه‌های پرتاب، پیچیدگی نگهداری و ارتباطات با پهنای باند بالا، 50-100 برابر گران‌تر از مراکز داده زمینی با انرژی هسته‌ای یا تجدیدپذیر هستند @fchollet

اخلاق و جامعه

  • اطلاعات نادرست تولیدشده توسط هوش مصنوعی در حال حاضر برای انتشار روایت‌های دروغین استفاده می‌شود، با ایجاد داستان‌های ساختگی و نام‌ها برای افراد واقعی درگیر در رویدادهای خبری، که تهدید فوری برای یکپارچگی اطلاعات را نشان می‌دهد @Nrg8000
  • سرگئی برین اعتراف می‌کند که گوگل در معماری ترانسفورمر که خود اختراع کرده بود، کمتر سرمایه‌گذاری کرد زیرا شرکت بیش از حد می‌ترسید چت‌بات‌هایی را منتشر کند که حرف‌های احمقانه می‌زنند، و این امر به OpenAI اجازه داد تا محاسبات را مقیاس‌بندی کرده و با این فناوری پیش برود @slow_developer
  • گرفتن پاسخ‌های دقیق از هوش مصنوعی فعلی با فریب دادن یک دروغگوی حرفه‌ای برای گفتن حقیقت مقایسه می‌شود، که از کاربران می‌خواهد سیستم را به گوشه‌ی درست هدایت کنند یا پرامپت‌های صحیح را ارائه دهند @paulg

کاربردها

  • JustHTML، یک کتابخانه‌ی جدید پایتون بدون وابستگی، عمدتاً توسط عوامل کدنویسی در طی چند ماه ساخته شد، که شامل 3000 خط کد است که HTML را مطابق با مشخصات HTML5 تجزیه می‌کند و 9200 تست html5lib را با موفقیت پشت سر می‌گذارد @simonw
  • یک راهنمای 17 مرحله‌ای نحوه‌ی استفاده از حالت عامل VS Code با Claude 3.7 Sonnet، Gemini Pro 3 و Claude Opus را برای ساخت کد با کیفیت تولیدی نشان می‌دهد، که مهندسی جدی را به جای کدنویسی حسی به نمایش می‌گذارد @simonw
  • تیم Codex پشتیبانی آزمایشی از مهارت‌ها را اضافه می‌کند که با GPT-5.2 به‌خوبی ترکیب می‌شود و امکان تنظیم دقیق Qwen3-0.6B را برای دستیابی به بهبود +6 در معیار HumanEval فراهم می‌کند @thsottiaux
  • Comet Assistant در حال انتقال محاسبات به سمت مدل‌های سریع و سبک‌وزن است که می‌توانند به‌صورت محلی اجرا شوند و امکان تحلیل عمیق‌تر هر مقاله، ویدئو یا وب‌سایتی را بدون تغییر زمینه فراهم می‌کنند @AravSrinivas

پژوهش‌ها

  • GPT-5.2 Pro در CritPt، یک معیار استدلال فیزیک در سطح پژوهش که برای آزمایش استدلال فیزیک نظری در سطح متخصص طراحی شده است، امتیاز 0% را کسب می‌کند، در حالی که Gemini 3 Pro بالاترین امتیاز 9.1% را به دست می‌آورد @mark_k
  • همه‌ی مدل‌های هوش مصنوعی اخیر اکنون معمای جراح را در اولین تلاش به‌درستی حل می‌کنند، که پیشرفت در مدیریت سوگیری جنسیتی در وظایف استدلال را نشان می‌دهد @emollick
  • بررسی سالانه‌ی مدل‌های باز، DeepSeek R1، خانواده‌ی Qwen 3 و خانواده‌ی Kimi K2 را به‌عنوان بهترین عملکردها شناسایی می‌کند، با پیش‌بینی‌هایی مبنی بر اینکه مقیاس‌بندی ادامه خواهد یافت و شکاف مرز باز-بسته در معیارهای عمومی در سال 2026 تقریباً یکسان باقی خواهد ماند @natolambert
  • شاخص شفافیت مدل بنیاد استنفورد نشان می‌دهد که شفافیت صنعت از 58 به 40.69 کاهش یافته است، به‌طوری که تنها IBM و Writer شفافیت را حفظ کرده‌اند در حالی که دیگران افشاگری را کاهش داده‌اند @JesseDLandry

اخبار هوش مصنوعی در 2025-12-13

مدل‌های جدید هوش مصنوعی

  • GPT-5.2 از OpenAI در اولین روز عرضه‌اش، از یک تریلیون توکن در API فراتر رفت و به سرعت در حال رشد است @sama
  • گوگل مدل به‌روز شده‌ی Gemini Native Audio را با دقت بالاتر در فراخوانی توابع، پیروی بهتر از دستورالعمل‌ها در زمان واقعی و قابلیت‌های مکالمه‌ی روان‌تر عرضه کرد که اکنون در API جیمنای در دسترس توسعه‌دهندگان است @OfficialLoganK
  • گوگل Gemini 3 Pro را با قابلیت‌های جدید برای یکپارچه‌سازی نتایج جستجوی محلی با Google Maps، نمایش عکس‌ها، رتبه‌بندی‌ها و اطلاعات دنیای واقعی در قالبی بصری و غنی راه‌اندازی کرد @GeminiApp
  • سورا سه سبک جدید تولید ویدئو را منتشر کرد: Handheld، Retro و Festive که برای همه‌ی کاربران در وب، iOS و اندروید در دسترس است @soraofficialapp

تحلیل صنعت

  • گزارش‌ها حاکی از آن است که Anthropic در حال مذاکره با گوگل برای یک قرارداد محاسباتی به ارزش ده‌ها میلیارد دلار است و سفارش‌هایی به ارزش 21 میلیارد دلار برای TPUs جهت آموزش مدل‌های بزرگ‌تر پیشنهاد شده است @AndrewCurran_
  • OpenAI و دیزنی همکاری خود را عمیق‌تر کردند و دیزنی حق خرید سهام بیشتر OpenAI را با ارزش‌گذاری فعلی دریافت کرد که به طور بالقوه می‌تواند روابط آینده‌ی قوی‌تری بین شرکت‌ها ایجاد کند @AndrewCurran_
  • وزارت صنعت و فناوری اطلاعات چین ظاهراً دستورالعمل‌هایی را صادر کرده است که واردات GPUهای H200 را برای شرکت‌هایی مانند Alibaba، Tencent، ByteDance و DeepSeek که قادر به آموزش مدل‌ها هستند، در اولویت قرار می‌دهد، در حالی که دسترسی را برای فروشندگان مجدد و شرکت‌های سنتی که استنتاج انجام می‌دهند، محدود می‌کند @jukan05
  • تحقیقات در مورد قیمت‌گذاری LLMها نشان داد که کشش کوتاه‌مدت حدود 1 است، که نشان‌دهنده‌ی عدم وجود پارادوکس جونس فوری است، اما قیمت‌ها در دو سال 1000 برابر کاهش یافتند در حالی که تقاضا به شدت افزایش یافت، که نشان می‌دهد این پارادوکس با گذشت زمان و با پذیرش تدریجی هوش مصنوعی توسط شرکت‌ها با قیمت‌های پایین‌تر رخ می‌دهد @emollick
  • مطالعه‌ای تخمین می‌زند که ChatGPT منجر به افزایش 6 درصدی در استارت‌آپ‌های جدید بین مناطق با پذیرش بالای هوش مصنوعی و مناطق با پذیرش پایین هوش مصنوعی در چین شده است، که نشان‌دهنده‌ی تأثیر اقتصادی قابل اندازه‌گیری بر کارآفرینی است @emollick
  • اعتبار گارتنر در تحلیل هوش مصنوعی پس از گزارش دستیاران کدنویسی هوش مصنوعی آن‌ها که آمازون، گیت‌لب و GCP را بالاتر از Cursor رتبه‌بندی کرد و Claude Code و OpenAI Codex را به طور کامل حذف کرد، زیر سوال رفته است، با ادعاهایی مبنی بر اینکه فروشندگان برای رتبه‌بندی‌های مطلوب پول پرداخت می‌کنند @GergelyOrosz
  • بازار دستیاران کدنویسی هوش مصنوعی رقابت پویایی را با تغییرات مکرر رهبری در فضاهای مختلف نشان می‌دهد، در حالی که بسیاری از شرکت‌ها هنوز از مدل‌های قدرتمند هوش مصنوعی خارج از کدنویسی و فناوری استفاده نکرده‌اند و اغلب گزینه‌های ارزان‌تر را انتخاب می‌کنند @emollick
  • Hugging Face در حال ارسال 3000 ربات Reachy Mini در سراسر جهان است که به عنوان یکی از بزرگترین محموله‌های ربات هوش مصنوعی در سال توصیف شده است و به عنوان یک پلتفرم رباتیک DIY متن‌باز برای سازندگان هوش مصنوعی طراحی شده است @ClementDelangue
  • قابلیت‌های سطح GPT-4 که در 2 سال 1000 برابر ارزان‌تر می‌شوند، برای تأثیرات اقتصادی کوتاه‌مدت حیاتی است، زیرا قابلیت‌های هوش مصنوعی بسیار ارزان فعلی برای بسیاری از کاربردهای مفید که اکثر مردم به طور کامل از آن‌ها استفاده نمی‌کنند، کافی است @RishiBommasani

کاربردها

  • OpenAI مکانیسم مهارت‌های Anthropic را در ChatGPT و ابزار Codex CLI خود به کار گرفت، به طوری که ChatGPT اکنون دارای مهارت‌هایی برای ایجاد و دستکاری صفحات گسترده، فایل‌های docx و PDF در یک پوشه‌ی جدید /home/oai/skills است @simonw
  • از مهارت جدید PDF در ChatGPT برای ایجاد یک گزارش دقیق در مورد فصل تولید مثل کاکاپو در سال استفاده شد، که 11 دقیقه طول کشید زیرا به طور مکرر مشکلات مانند رندر کاراکترهای خاص را رندر و رفع می‌کرد @simonw
  • Cursor بهبودهای ابزار طراحی سریع را شامل انتخاب عناصر بدون انیمیشن، گرد کردن اسلایدر بلور، بک‌اسپیس برای حذف عناصر، میانبرهای undo/redo و انتخاب چند عنصری متنی را عرضه کرد @cursor_ai
  • گوگل Android Emergency Live Video را راه‌اندازی کرد که به کاربران امکان می‌دهد اطلاعات بصری حیاتی را با یک ضربه با خدمات اضطراری به اشتراک بگذارند تا ارزیابی سریع‌تر وضعیت و راهنمایی‌های نجات‌بخش ارائه شود @sundarpichai
  • کاربران به طور فزاینده‌ای به LLMهایی مانند Perplexity برای جستجوی دستور پخت روی می‌آورند به جای گوگل، که قبل از دستور پخت واقعی، متن و تبلیغات بی‌پایان را برمی‌گرداند، که نشان می‌دهد چگونه جستجوی هوش مصنوعی نتایج تمیزتر و مستقیم‌تری را مشابه وب اوایل دهه 2000 ارائه می‌دهد @GergelyOrosz
  • توسعه‌دهنده از عامل‌های خودمختار با استفاده از یک مهار سفارشی با ابزارهای متعدد، GPT 5.2 برای نظرات دوم، 7.5 هزار پرامپت سیستمی و تزریق مجدد متناوب زمینه برای حل مشکلات عجیب و دشوار که نیاز به افق‌های طولانی دارند، استفاده کرد @Suhail
  • GPT-5.2 یک صفحه‌ی گسترده‌ی تعاملی اکسل برای شبیه‌سازی مبارزه‌ی هیولاهای D&D شامل توانایی‌های ویژه را پس از 60 دقیقه زمان فکر کردن ایجاد کرد، در حالی که Claude 4.5 Opus این کار را به سرعت انجام داد اما با حذف توانایی‌های ویژه آن را ساده کرد @emollick
  • Claude 4.5 Opus تفکر جانبی پیشرفته‌ای را نشان داد که نه تنها یک تک‌شاخ را در TikZ ترسیم کرد، بلکه آن را در LaTeX کامپایل کرد، به PDF تبدیل کرد، سپس به PNG و تصویر نهایی را با عناصر تزئینی ارائه داد @emollick
  • shadcn/create راه‌اندازی شد که به توسعه‌دهندگان امکان می‌دهد پیاده‌سازی‌های سفارشی shadcn/ui را با انتخاب کتابخانه‌های کامپوننت، آیکون‌ها، رنگ‌ها، تم‌ها و فونت‌ها بسازند، با بازنویسی کد کامپوننت برای مطابقت با ترجیحات فراتر از صرفاً تم‌سازی @shadcn

پژوهش‌ها

  • DeepMind اولین مقاله‌ی آموزش ربات‌ها را با مدل‌های جهانی تولید شده توسط Veo منتشر کرد که به همبستگی 0.88 با نرخ موفقیت در دنیای واقعی در بیش از 1600 آزمایش بر روی ربات‌های دو دستی ALOHA 2 دست یافت و به سناریوهای خارج از توزیع بدون آزمایش سخت‌افزاری در دنیای واقعی تعمیم یافت @deedydas
  • DeepMind یک عامل Gemini Deep Research را برای توسعه‌دهندگان از طریق Interactions API منتشر کرد که امکان جاسازی پیشرفته‌ترین قابلیت‌های تحقیقاتی خودمختار گوگل را مستقیماً در برنامه‌ها فراهم می‌کند @GoogleAI
  • Google Research و DeepMind DeepSearchQA را معرفی کردند، یک معیار جدید عامل تحقیقات وب متن‌باز که برای آزمایش عامل‌ها در وظایف پیچیده‌ی تحقیقات وب طراحی شده است @GoogleAI
  • Google Research و DeepMind مجموعه‌ی معیار FACTS را راه‌اندازی کردند، اولین آزمایش جامع صنعت که واقعیت LLM را در چهار بعد ارزیابی می‌کند: دانش مدل داخلی، جستجوی وب، مبناگذاری و ورودی‌های چندوجهی @GoogleAI
  • مدل‌های هوش مصنوعی مرزی واگرایی بسیار کمی در توانایی‌ها، پایبندی به پرامپت و سایر عوامل نشان می‌دهند، به طوری که مدل‌های متن‌بسته‌ی آمریکایی، مدل‌های چینی و مدل‌های متن‌باز فرانسوی همگی عملکرد بسیار مشابهی با یکدیگر دارند @emollick
  • رهبر تیم عامل‌های استفاده از کامپیوتر متا پس از 1.45 سال ساخت زیرساخت CUA، خطوط لوله‌ی داده، ارزیابی‌ها و مدل‌ها از ابتدا برای دستیابی به عملکرد عامل استفاده از کامپیوتر در سطح مرزی، استعفا داد @kohjingyu