اخبار هوش مصنوعی در 2025-07-24

مدل‌های جدید هوش مصنوعی

  • علی‌بابا Qwen3-Coder-480B-A35B را منتشر کرد؛ یک مدل MoE با ۴۸۰ میلیارد پارامتر و ۳۵ میلیارد پارامتر فعال که به ۷۰٪ در بنچمارک SWE-Bench Verified و طول زمینه ۱ میلیون دست یافت، و احتمالاً بهترین مدل کدنویسی تا به امروز است. @deedydas
  • علی‌بابا Qwen3-MT، قدرتمندترین مدل ترجمه‌ی خود را راه‌اندازی کرد که از بیش از ۹۲ زبان پشتیبانی می‌کند و بیش از ۹۵٪ جمعیت جهان را پوشش می‌دهد؛ این مدل با تریلیون‌ها توکن چندزبانه آموزش دیده است. @Alibaba_Qwen
  • تام وارن گزارش می‌دهد که GPT-5 در ماه اوت عرضه خواهد شد و GPT-5-mini به‌طور هم‌زمان در هر دو بخش کلاینت و API عرضه می‌شود و GPT-5-nano نیز فقط برای API برنامه‌ریزی شده است. @AndrewCurran_
  • اوپن‌ای‌آی قصد دارد یک مدل منبع‌باز را پیش از GPT-5 عرضه کند که گفته می‌شود مشابه o3-mini با قابلیت‌های استدلالی است. @AndrewCurran_

تحلیل صنعت

  • گوگل ماهانه بیش از ۹۸۰ تریلیون توکن را در سرویس‌های خود پردازش می‌کند که از ۴۸۰ تریلیون در ماه مه دو برابر شده است، و اپلیکیشن Gemini به ۴۵۰ میلیون کاربر فعال ماهانه رسیده است. @AndrewCurran_
  • بیش از ۷۰ میلیون ویدیوی کاربری با Veo 3 ایجاد شده است که نشان‌دهنده‌ی پذیرش قابل توجه مدل تولید ویدیوی گوگل است. @AndrewCurran_
  • شرکت Safe Superintelligence (شرکت ایلیا سوتسکور) به‌طور انحصاری از TPUهای گوگل برای توسعه‌ی هوش مصنوعی خود استفاده خواهد کرد. @AndrewCurran_
  • متا رویکردی نوآورانه در پیش گرفته است و چادرهای مقاوم در برابر آب و هوا را برای جای دادن خوشه‌های GPU می‌سازد، که مراکز داده‌ی جدید را قادر می‌سازد در عرض چند ماه به جای چند سال راه‌اندازی شوند. @AIatMeta
  • فایننشال تایمز گزارش می‌دهد که بیش از ۱ میلیارد دلار تراشه‌ی انویدیا، از جمله تراشه‌های Blackwell، طی سه ماه گذشته با وجود کنترل‌های صادراتی به چین رسیده است. @AndrewCurran_
  • چین اکنون ۵ آزمایشگاه پیشرو هوش مصنوعی دارد که در سطح جهانی رقابت می‌کنند: DeepSeek، Alibaba Qwen، Bytedance، Hailuo و Kimi، با سرعت توسعه‌ی بالا و احتمالاً هزینه‌هایی کمتر از همتایان آمریکایی خود. @deedydas
  • پژوهش‌ها نشان می‌دهد که توسعه‌دهندگان بیشترین زمان را با ابزارهای هوش مصنوعی از طریق تجزیه و تحلیل stack trace و بازآرایی کد، به جای تولید کد، صرفه‌جویی می‌کنند؛ این یافته بر اساس پژوهش DX با ۱۸۰ شرکت است. @GergelyOrosz
  • شرکت‌های فناوری پیشرو مانند گیت‌هاب و شاپی‌فای به‌دلیل هوش مصنوعی کارآموزان بیشتری استخدام می‌کنند و مشاهده می‌کنند که دانشجویان علوم کامپیوتر از ابزارهای هوش مصنوعی روان‌تر از قبل استفاده می‌کنند. @GergelyOrosz
  • جک دورسی در کمتر از یک هفته دو اپلیکیشن را با استفاده از ابزار هوش مصنوعی Goose برای توسعه‌ی سریع منتشر کرد که روند «vibe coding» را به نمایش می‌گذارد. @TechCrunch

اخلاق و جامعه

  • اظهارات رئیس جمهور ترامپ در اجلاس هوش مصنوعی درباره‌ی حق کپی‌رایت نشان می‌دهد که هوش مصنوعی باید قادر باشد بدون پرداخت برای هر بار استفاده، از محتوا یاد بگیرد؛ او این امر را با یادگیری انسان مقایسه کرده و اشاره کرده که چین چنین محدودیت‌هایی را دنبال نمی‌کند. @AndrewCurran_
  • الزامات جدید دولتی بیان می‌کنند که برای واجد شرایط بودن قراردادهای دولتی، یک LLM باید با اصول حقیقت‌جویی و بی‌طرفی ایدئولوژیک توسعه یابد. @AndrewCurran_
  • ایتان مولیک نشان می‌دهد که بیش از ۶۰٪ از لینک‌های قدیمی مقالات نیویورک تایمز اکنون شکسته شده‌اند، که نشان می‌دهد تنها LLMها بخش زیادی از محتوای ناپایدار وب را «به خاطر خواهند آورد». @emollick
  • بررسی دقیق بنچمارک Humanity's Last Exam نشان می‌دهد که بسیاری از سؤالات دارای پاسخ‌های «صحیح» نادرست هستند که چالش‌های موجود در اندازه‌گیری و بنچمارکینگ هوش مصنوعی را برجسته می‌کند. @emollick
  • فرانسوا شولیت در مورد گرایش به انسان‌انگاری سیستم‌های هوش مصنوعی که انسان نیستند هشدار می‌دهد و بر اهمیت درک ماهیت واقعی آن‌ها تأکید می‌کند. @fchollet

کاربردها

  • پرپلکسیتی مرورگر Comet را با قابلیت‌های دستیار هوش مصنوعی راه‌اندازی کرد که می‌تواند خود را توزیع کرده و کاربران جدید را جذب کند، و برای عملکرد خود بازخوردهای مثبتی دریافت کرده است. @testingcatalog
  • کرسر Bugbot را منتشر کرد که در ماه گذشته بیش از ۱ میلیون باگ در PRهای نوشته شده توسط انسان پیدا کرده است، و بیش از نیمی از آن‌ها مشکلات منطقی واقعی بودند که پیش از ادغام رفع شدند. @cursor_ai
  • گیت‌هاب Spark را راه‌اندازی کرد؛ یک پلتفرم «prompt-to-app» برای ایجاد و توسعه‌ی تکراری اپلیکیشن‌های React با احراز هویت کاربر و ذخیره‌سازی پایدار. @simonw
  • فیگما Make را برای همه منتشر کرد؛ یک راه‌حل «prompt-to-app» که به کاربران امکان می‌دهد پروتوتایپ ایجاد کرده و در جامعه‌ی فیگما (Figma Community) منتشر کنند. @figma
  • گوگل قابلیت تبدیل عکس به ویدیو را معرفی کرد که به گوگل فوتوز و یوتیوب شورتز می‌آید. @sundarpichai
  • گوگل قابلیت مجازی پرو لباس را با استفاده از فناوری هوش مصنوعی راه‌اندازی کرد. @TechCrunch
  • لینیر قابلیت داشبوردها را معرفی کرد که به کاربران امکان می‌دهد نماهای سفارشی برای نظارت بر معیارهای کلیدی ایجاد کنند. @linear
  • xAI با Kalshi همکاری می‌کند تا Grok را به بازارهای پیش‌بینی بیاورد. @xai

پژوهش‌ها

  • آنتروپیک سه عامل هوش مصنوعی را برای ممیزی هم‌ترازی توسعه داده است که می‌توانند به‌طور خودکار اهداف پنهان را کشف کنند، ارزیابی‌های ایمنی را بسازند و رفتارهای نگران‌کننده را آشکار سازند، و عامل بازرس آن‌ها ۴۲٪ چالش‌های ممیزی را برنده شد. @AnthropicAI
  • گوگل با استفاده از نسخه‌ی پیشرفته‌ی Gemini با حالت Deep Think، به عملکردی در سطح مدال طلا در المپیاد جهانی ریاضی دست یافت. @sundarpichai
  • پژوهش، چارچوب Rubrics as Rewards (RaR) را معرفی می‌کند که از ارزیابی‌های ساختارمند و چک‌لیستی به‌عنوان سیگنال‌های پاداش قابل تفسیر برای آموزش «on-policy» استفاده می‌کند و بهبودهای نسبی در HealthBench-1k را به ارمغان می‌آورد. @iScienceLuvr
  • کامرون وولف توضیح می‌دهد که مدل‌های پاداش در عصر مدل‌های استدلالی همچنان مرتبط هستند، زیرا اکثر سیستم‌ها همچنان از RLHF برای هم‌ترازی ترجیحات انسانی و RLVR برای وظایف استدلالی قابل تأیید استفاده می‌کنند. @cwolferesearch
  • آنتروپیک تیم «روانپزشکی هوش مصنوعی» را به‌عنوان بخشی از تلاش‌های تفسیرپذیری راه‌اندازی کرد تا درباره‌ی شخصیت‌ها، انگیزه‌ها و آگاهی موقعیتی مدل‌ها و نحوه‌ی منجر شدن آن‌ها به رفتارهای نگران‌کننده پژوهش کند. @Jack_W_Lindsey
  • دانشمندان MIT سلول‌های زنده را با گیت‌های منطقی، مانند کامپیوترهای بیولوژیکی، برنامه‌ریزی می‌کنند تا سرطان را با دقت تشخیص داده و از بین ببرند. @MIT
  • پای‌تورچ نمایش می‌دهد که SmolLM3-3B با سرعت ۱۵ توکن در ثانیه روی گلکسی S22 با استفاده از TorchAO و ExecuTorch برای استقرار روی دستگاه اجرا می‌شود. @PyTorch