اخبار هوش مصنوعی در 2025-09-11

مدل‌های جدید هوش مصنوعی

  • علی‌بابا مدل Qwen3-Next-80B-A3B را با ۸۰ میلیارد پارامتر، اما تنها ۳ میلیارد از آن‌ها به ازای هر توکن فعال می‌شود، منتشر کرد. این مدل به ۱۰ برابر آموزش ارزان‌تر و ۱۰ برابر استنتاج (inference) سریع‌تر نسبت به Qwen3-32B منجر می‌شود، به‌خصوص در طول‌های زمینه‌ی بیش از ۳۲ هزار. @Alibaba_Qwen
  • مدل Qwen3-Next-80B-A3B-Instruct به عملکرد مدل پرچم‌دار ۲۳۵ میلیاردی علی‌بابا نزدیک می‌شود، در حالی که Qwen3-Next-80B-A3B-Thinking عملکرد بهتری نسبت به Gemini-2.5-Flash-Thinking دارد. @Alibaba_Qwen
  • گوگل پشتیبانی از جدیدترین مدل Gemini Embeddings را در Batch API، با ۵۰ درصد تخفیف نسبت به قیمت‌گذاری عادی، اعلام کرد. این مدل از طریق لایه‌ی سازگاری OpenAI در دسترس است. @OfficialLoganK

تحلیل صنعت

  • ارزش‌گذاری Perplexity در کمتر از دو ماه از ۱۸ میلیارد دلار به ۲۰ میلیارد دلار جهش کرد، که نشان‌دهنده‌ی رشد سریع در جست‌وجوی مبتنی بر هوش مصنوعی است. @TechCrunch
  • مشخص شد که افزایش استخدام در اوراکل و ارزش‌گذاری بی‌سابقه‌ی آن ناشی از تلاش این شرکت برای توسعه‌ی دیتاسنترها جهت زیرساخت هوش مصنوعی است. @GergelyOrosz
  • توسعه‌دهندگان حرفه‌ای گزارش می‌دهند که ابزارهای کدنویسی هوش مصنوعی عمدتاً برای «انتقال‌ها» (migrations) باارزش هستند تا تولید نرم‌افزار از ابتدا، که باعث صرفه‌جویی در زمان قابل توجه و بهبود رضایت توسعه‌دهندگان می‌شود. @GergelyOrosz
  • استراتژی انتشار بی‌سر و صدای Anthropic برای بهبودهای عمده‌ی قابلیت‌ها در برنامه‌هایی مانند اکسل، پاورپوینت و عملکردهای دستیار شخصی، ممکن است پیشرفت‌های عملی آن‌ها را کم‌اهمیت جلوه دهد. @emollick
  • Hugging Face ادغام با GitHub Copilot Chat را در VS Code راه‌اندازی کرد و دسترسی به LLM‌های پیشرفته‌ی متن‌باز مانند Qwen3-Coder، gpt-oss و GLM-4.5 را از طریق شرکای استنتاج در سطح جهانی فراهم می‌کند. @hanouticelina

اخلاق و جامعه

  • کمیسیون تجارت فدرال (FTC) تحقیقاتی را در مورد ایمنی چت‌بات‌های هوش مصنوعی، به‌ویژه با تمرکز بر چت‌بات‌های همراه و تأثیر آن‌ها بر کودکان، آغاز کرد و شرکت‌های بزرگی از جمله OpenAI، Alphabet، Meta و xAI را هدف قرار داده است. @AndrewCurran_
  • کالیفرنیا لایحه‌ی SB 243 را پیشنهاد می‌کند، که این ایالت را به اولین ایالتی تبدیل خواهد کرد که پروتکل‌های ایمنی برای همراهان هوش مصنوعی را الزامی می‌کند و در صورت عدم رعایت استانداردهای ایمنی توسط چت‌بات‌ها، شرکت‌ها را از نظر قانونی مسئول می‌داند. @TechCrunch
  • استنفورد HAI چارچوبی برای تخمین «بی‌طرفی سیاسی» در مدل‌های هوش مصنوعی منتشر کرد، و اذعان دارد که بی‌طرفی واقعی از نظر فنی غیرممکن است اما ۸ تکنیک برای نزدیک شدن به آن ارائه می‌دهد. @StanfordHAI

کاربردها

  • Claude قابلیت‌های پیشرفته‌ی «دستیار تلفن» را به نمایش گذاشت و با موفقیت درخواست‌های پیچیده شامل عقل سلیم و محدودیت‌های دشوار را مدیریت می‌کند، اگرچه هنوز برای عملکرد بهینه به مدل بزرگ‌تر Opus نیاز دارد. @emollick
  • Replit Agent قابلیت‌های اشکال‌زدایی (debugging) و تست سرتاسری را به نمایش می‌گذارد و قادر است در برنامه‌ها کلیک کند و ساعت‌ها تکرار (iterate) کند، ضمن ارائه‌ی بازپخش کامل فرآیند و تحلیل گزارش‌ها. @tylerangert
  • مایکروسافت ریسرچ «پروتکل زمینه‌ی مدل (MCP)» را به عنوان یک استاندارد جدید برای همکاری عامل‌ها (agents) در اکوسیستم‌های ابزاری تکه‌تکه، با پیچیده‌تر شدن سیستم‌های هوش مصنوعی عامل‌محور (agentic)، بررسی می‌کند. @MSFTResearch
  • شرکت Box ابزارهای جدید هوش مصنوعی را در کنفرانس Boxworks منتشر کرد، که دیدگاه آرون لوی، مدیرعامل این شرکت، را برای تحول گردش‌کارهای سازمانی با محوریت هوش مصنوعی پیش می‌برد. @TechCrunch

پژوهش‌ها

  • پژوهشگاه هوش مصنوعی برکلی «RecA (هم‌ترازی بازسازی)» را معرفی می‌کند، که مدل‌های چندوجهی یکپارچه را تنها با ۸ هزار تصویر و ۴ ساعت آموزش بر روی ۸ پردازنده‌ی گرافیکی (GPU) به طور قابل توجهی بهبود می‌بخشد و دستاوردهای عملکردی عمده‌ای در بنچمارک‌های GenEval، DPGBench و ImgEdit کسب می‌کند. @XDWang101
  • انویدیا چارچوبی مشابه AlphaEvolve را برای تکامل مستقل حل‌کننده‌های SAT از نوع NP-Complete توسعه می‌دهد، که نشان‌دهنده‌ی پیشرفتی در عامل‌های کدنویسی تکاملی است. @richardcsuwandi
  • پژوهش‌ها نشان می‌دهد که ارزیابی‌های هوش مصنوعی اساساً کاری در حوزه‌ی «علم داده» (data science) هستند، که نیازمند مهارت‌هایی در تحلیل داده، بصری‌سازی و طراحی معیارهاست، و ابزارهای هوش مصنوعی اکوسیستم PyData را در دسترس‌تر می‌کنند. @HamelHusain
  • مطالعه‌ی جدیدی فرضیات مربوط به کم‌اهمیت شدن RAG به دلیل پنجره‌های زمینه‌ی طولانی را به چالش می‌کشد، و آزمایش‌ها بر روی ۱۸ مدل مختلف نشان می‌دهد که RAG همچنان باارزش است. @HamelHusain
  • PyTorch و گوگل راهکار checkpointing محلی را با استفاده از DCP برای کاهش سربار آموزش و بهبود goodput در کارهای آموزشی توزیع‌شده‌ی در مقیاس بزرگ توسعه دادند. @PyTorch