اخبار هوش مصنوعی در 2025-07-24
مدلهای جدید هوش مصنوعی
- علیبابا Qwen3-Coder-480B-A35B را منتشر کرد؛ یک مدل MoE با ۴۸۰ میلیارد پارامتر و ۳۵ میلیارد پارامتر فعال که به ۷۰٪ در بنچمارک SWE-Bench Verified و طول زمینه ۱ میلیون دست یافت، و احتمالاً بهترین مدل کدنویسی تا به امروز است. @deedydas
- علیبابا Qwen3-MT، قدرتمندترین مدل ترجمهی خود را راهاندازی کرد که از بیش از ۹۲ زبان پشتیبانی میکند و بیش از ۹۵٪ جمعیت جهان را پوشش میدهد؛ این مدل با تریلیونها توکن چندزبانه آموزش دیده است. @Alibaba_Qwen
- تام وارن گزارش میدهد که GPT-5 در ماه اوت عرضه خواهد شد و GPT-5-mini بهطور همزمان در هر دو بخش کلاینت و API عرضه میشود و GPT-5-nano نیز فقط برای API برنامهریزی شده است. @AndrewCurran_
- اوپنایآی قصد دارد یک مدل منبعباز را پیش از GPT-5 عرضه کند که گفته میشود مشابه o3-mini با قابلیتهای استدلالی است. @AndrewCurran_
تحلیل صنعت
- گوگل ماهانه بیش از ۹۸۰ تریلیون توکن را در سرویسهای خود پردازش میکند که از ۴۸۰ تریلیون در ماه مه دو برابر شده است، و اپلیکیشن Gemini به ۴۵۰ میلیون کاربر فعال ماهانه رسیده است. @AndrewCurran_
- بیش از ۷۰ میلیون ویدیوی کاربری با Veo 3 ایجاد شده است که نشاندهندهی پذیرش قابل توجه مدل تولید ویدیوی گوگل است. @AndrewCurran_
- شرکت Safe Superintelligence (شرکت ایلیا سوتسکور) بهطور انحصاری از TPUهای گوگل برای توسعهی هوش مصنوعی خود استفاده خواهد کرد. @AndrewCurran_
- متا رویکردی نوآورانه در پیش گرفته است و چادرهای مقاوم در برابر آب و هوا را برای جای دادن خوشههای GPU میسازد، که مراکز دادهی جدید را قادر میسازد در عرض چند ماه به جای چند سال راهاندازی شوند. @AIatMeta
- فایننشال تایمز گزارش میدهد که بیش از ۱ میلیارد دلار تراشهی انویدیا، از جمله تراشههای Blackwell، طی سه ماه گذشته با وجود کنترلهای صادراتی به چین رسیده است. @AndrewCurran_
- چین اکنون ۵ آزمایشگاه پیشرو هوش مصنوعی دارد که در سطح جهانی رقابت میکنند: DeepSeek، Alibaba Qwen، Bytedance، Hailuo و Kimi، با سرعت توسعهی بالا و احتمالاً هزینههایی کمتر از همتایان آمریکایی خود. @deedydas
- پژوهشها نشان میدهد که توسعهدهندگان بیشترین زمان را با ابزارهای هوش مصنوعی از طریق تجزیه و تحلیل stack trace و بازآرایی کد، به جای تولید کد، صرفهجویی میکنند؛ این یافته بر اساس پژوهش DX با ۱۸۰ شرکت است. @GergelyOrosz
- شرکتهای فناوری پیشرو مانند گیتهاب و شاپیفای بهدلیل هوش مصنوعی کارآموزان بیشتری استخدام میکنند و مشاهده میکنند که دانشجویان علوم کامپیوتر از ابزارهای هوش مصنوعی روانتر از قبل استفاده میکنند. @GergelyOrosz
- جک دورسی در کمتر از یک هفته دو اپلیکیشن را با استفاده از ابزار هوش مصنوعی Goose برای توسعهی سریع منتشر کرد که روند «vibe coding» را به نمایش میگذارد. @TechCrunch
اخلاق و جامعه
- اظهارات رئیس جمهور ترامپ در اجلاس هوش مصنوعی دربارهی حق کپیرایت نشان میدهد که هوش مصنوعی باید قادر باشد بدون پرداخت برای هر بار استفاده، از محتوا یاد بگیرد؛ او این امر را با یادگیری انسان مقایسه کرده و اشاره کرده که چین چنین محدودیتهایی را دنبال نمیکند. @AndrewCurran_
- الزامات جدید دولتی بیان میکنند که برای واجد شرایط بودن قراردادهای دولتی، یک LLM باید با اصول حقیقتجویی و بیطرفی ایدئولوژیک توسعه یابد. @AndrewCurran_
- ایتان مولیک نشان میدهد که بیش از ۶۰٪ از لینکهای قدیمی مقالات نیویورک تایمز اکنون شکسته شدهاند، که نشان میدهد تنها LLMها بخش زیادی از محتوای ناپایدار وب را «به خاطر خواهند آورد». @emollick
- بررسی دقیق بنچمارک Humanity's Last Exam نشان میدهد که بسیاری از سؤالات دارای پاسخهای «صحیح» نادرست هستند که چالشهای موجود در اندازهگیری و بنچمارکینگ هوش مصنوعی را برجسته میکند. @emollick
- فرانسوا شولیت در مورد گرایش به انسانانگاری سیستمهای هوش مصنوعی که انسان نیستند هشدار میدهد و بر اهمیت درک ماهیت واقعی آنها تأکید میکند. @fchollet
کاربردها
- پرپلکسیتی مرورگر Comet را با قابلیتهای دستیار هوش مصنوعی راهاندازی کرد که میتواند خود را توزیع کرده و کاربران جدید را جذب کند، و برای عملکرد خود بازخوردهای مثبتی دریافت کرده است. @testingcatalog
- کرسر Bugbot را منتشر کرد که در ماه گذشته بیش از ۱ میلیون باگ در PRهای نوشته شده توسط انسان پیدا کرده است، و بیش از نیمی از آنها مشکلات منطقی واقعی بودند که پیش از ادغام رفع شدند. @cursor_ai
- گیتهاب Spark را راهاندازی کرد؛ یک پلتفرم «prompt-to-app» برای ایجاد و توسعهی تکراری اپلیکیشنهای React با احراز هویت کاربر و ذخیرهسازی پایدار. @simonw
- فیگما Make را برای همه منتشر کرد؛ یک راهحل «prompt-to-app» که به کاربران امکان میدهد پروتوتایپ ایجاد کرده و در جامعهی فیگما (Figma Community) منتشر کنند. @figma
- گوگل قابلیت تبدیل عکس به ویدیو را معرفی کرد که به گوگل فوتوز و یوتیوب شورتز میآید. @sundarpichai
- گوگل قابلیت مجازی پرو لباس را با استفاده از فناوری هوش مصنوعی راهاندازی کرد. @TechCrunch
- لینیر قابلیت داشبوردها را معرفی کرد که به کاربران امکان میدهد نماهای سفارشی برای نظارت بر معیارهای کلیدی ایجاد کنند. @linear
- xAI با Kalshi همکاری میکند تا Grok را به بازارهای پیشبینی بیاورد. @xai
پژوهشها
- آنتروپیک سه عامل هوش مصنوعی را برای ممیزی همترازی توسعه داده است که میتوانند بهطور خودکار اهداف پنهان را کشف کنند، ارزیابیهای ایمنی را بسازند و رفتارهای نگرانکننده را آشکار سازند، و عامل بازرس آنها ۴۲٪ چالشهای ممیزی را برنده شد. @AnthropicAI
- گوگل با استفاده از نسخهی پیشرفتهی Gemini با حالت Deep Think، به عملکردی در سطح مدال طلا در المپیاد جهانی ریاضی دست یافت. @sundarpichai
- پژوهش، چارچوب Rubrics as Rewards (RaR) را معرفی میکند که از ارزیابیهای ساختارمند و چکلیستی بهعنوان سیگنالهای پاداش قابل تفسیر برای آموزش «on-policy» استفاده میکند و بهبودهای نسبی در HealthBench-1k را به ارمغان میآورد. @iScienceLuvr
- کامرون وولف توضیح میدهد که مدلهای پاداش در عصر مدلهای استدلالی همچنان مرتبط هستند، زیرا اکثر سیستمها همچنان از RLHF برای همترازی ترجیحات انسانی و RLVR برای وظایف استدلالی قابل تأیید استفاده میکنند. @cwolferesearch
- آنتروپیک تیم «روانپزشکی هوش مصنوعی» را بهعنوان بخشی از تلاشهای تفسیرپذیری راهاندازی کرد تا دربارهی شخصیتها، انگیزهها و آگاهی موقعیتی مدلها و نحوهی منجر شدن آنها به رفتارهای نگرانکننده پژوهش کند. @Jack_W_Lindsey
- دانشمندان MIT سلولهای زنده را با گیتهای منطقی، مانند کامپیوترهای بیولوژیکی، برنامهریزی میکنند تا سرطان را با دقت تشخیص داده و از بین ببرند. @MIT
- پایتورچ نمایش میدهد که SmolLM3-3B با سرعت ۱۵ توکن در ثانیه روی گلکسی S22 با استفاده از TorchAO و ExecuTorch برای استقرار روی دستگاه اجرا میشود. @PyTorch