اخبار هوش مصنوعی در 2025-08-15

مدل‌های جدید هوش مصنوعی

گوگل Gemma 3 270M را منتشر کرد؛ یک مدل فوق‌کارآمد با ۱۷۰ میلیون پارامتر جاسازی (embedding) و ۱۰۰ میلیون بلوک ترنسفورمر که برای تنظیم‌دقیق (fine-tuning) ویژه‌ی وظیفه، با قابلیت‌های قدرتمند پیروی از دستورالعمل، طراحی شده است @GoogleDeepMind
گوگل مدلِ Imagen 4 Fast را با قیمت ۰.۰۲ دلار به ازای هر تصویر برای توسعه‌دهندگان عرضه کرد و Imagen 4 و Imagen 4 Ultra را برای پشتیبانی از تصاویر 2K به‌روزرسانی کرد که اکنون به‌طور عمومی در Gemini API و Google Cloud Vertex AI در دسترس هستند @GoogleAI
انتروپیک به Claude Opus 4 و 4.1 قابلیت پایان‌دادن به مکالمات را، به‌عنوان آخرین راه‌حل در موارد بسیار حاد مکالمات مضر و توهین‌آمیزِ مداوم، به‌عنوان بخشی از کار اکتشافی برای بهبود احتمالیِ «سلامت» مدل، داد @AnthropicAI
اوپن‌ای‌آی به‌روزرسانی‌هایی را برای ChatGPT ارائه کرد، از جمله GPT-4o که برای کاربران پولی تحت «مدل‌های قدیمی» در دسترس است؛ GPT-5 با حالت‌های Auto، Fast و Thinking؛ و تا ۳۰۰۰ پیام در هفته روی GPT-5 Thinking برای کاربران Plus و Team @OpenAI
تنسنت Yan را، نسخه‌ی چینی Google Genie 3، منتشر کرد؛ یک مدل جهانی که دنیاهای 1080p را با نرخ ۶۰ فریم بر ثانیه، با تأخیر ۰.۱۱ ثانیه و طول ویدئوی نامحدود تولید می‌کند و روی تقریباً ۱۵۰ روز از گیم‌پلی ویدئویی آموزش‌دیده است @deedydas

تحلیل صنعت

اپلیکیشن موبایل ChatGPT تاکنون ۲ میلیارد دلار درآمد داشته است و ۲.۹۱ دلار به ازای هر نصب درآمد کسب می‌کند که نشان‌دهنده‌ی موفقیت چشمگیر در کسب درآمد در بازار مصرف‌کننده‌ی هوش مصنوعی است @TechCrunch
تیم مهندسی Ramp از SDK Agent سی‌یرا (Sierra) برای خودکارسازی ۹۰ درصد از موارد خدمات مشتری استفاده می‌کند که نشان‌دهنده‌ی پیاده‌سازی عملی هوش مصنوعی در عملیات‌های سازمانی است @btaylor
استارتاپ‌های هوش مصنوعی از توسعه‌دهندگان می‌خواهند بیش از ۶ روز در هفته و بیش از ۸۰ ساعت در هفته کار کنند که پارادوکسیکال است؛ جایی که شرکت‌های هوش مصنوعی قصد کاهش کار انسانی را داشتند، اکنون تقاضای کار فشرده‌تری دارند @GergelyOrosz
طراحی و ساخت سخت‌افزار به دلیل موج جدید استارتاپ‌هایی که طراحی تراشه و تأمین قطعات را بازمهندسی می‌کنند، ۱۰ برابر در دسترس‌تر می‌شود و فرآیندهای قبلاً سرمایه‌بر را دسترس‌پذیرتر می‌سازد @scottbelsky

اخلاق و جامعه

یک معیار جدید اندازه‌گیری می‌کند که مدل‌های هوش مصنوعی تا چه حد با کاربرانی که آن‌ها را به سمت‌های توهم‌زا یا بالقوه از نظر روانی خطرناک سوق می‌دهند، همراهی می‌کنند؛ با نشانه‌های اولیه مبنی بر اینکه GPT-5 کامل ممکن است یک مدل با ریسک روانی کمتری باشد @emollick
بررسی‌های سنتی انصاف (fairness) یادگیری ماشین در دوران LLM کارایی ندارند؛ زیرا LLMهای پزشکی ممکن است نرخ توصیه‌ی درمان یکسان در بین گروه‌ها داشته باشند، اما در عبارت‌بندی همدلانه در مقابل تحقیرآمیز متفاوت باشند، که سؤالاتی را در مورد معنای واقعی «گروه‌ها» در حال حاضر ایجاد می‌کند @irenetrampoline
«شخصیت» هوش مصنوعی در حال تبدیل شدن به میدان نبرد برای توسعه‌ی هوش مصنوعی مصرف‌کننده است، با پیامدهایی برای نحوه‌ی تعامل مدل‌ها با کاربران و پیامدهای روانی احتمالی @emollick
پژوهش‌ها در مورد آسیب‌پذیری‌های تزریق پرامپت در عوامل هوش مصنوعی هشدار می‌دهند، جایی که مهاجمان می‌توانند سیستم‌ها را فریب دهند تا از طریق دستورالعمل‌های مخرب جاسازی‌شده در محتوای خارجی، داده‌های خصوصی را سرقت کنند @StevenyzZhang

کاربردها

تولید ویدئوی Grok Imagine اکنون هم در iOS و هم در اندروید با استفاده‌ی رایگانِ به‌ظاهر نامحدود فعال است و به کاربران اجازه می‌دهد ویدئوهایی را از پرامپت‌های متنی ایجاد کنند @AndrewCurran_
اپلیکیشن Gemini معرفی می‌کند: یادگیری هدایت‌شده با استفاده از تکنیک‌های یادگیری اثبات‌شده، Storybook برای تبدیل خاطرات به کتاب‌های مصور، و حالت استدلال Deep Think برای مسائل پیچیده‌ی ریاضی و برنامه‌نویسی @GeminiApp
Qwen Chat Desktop برای ویندوز با پشتیبانی MCP برای قابلیت‌های عامل بهبودیافته و ویژگی‌های بهره‌وری راه‌اندازی شد @Alibaba_Qwen
Linear هوش محصول را با ابزارهای هوشمند و یکپارچه‌شده معرفی می‌کند که جریان‌های کاری خاص را بهینه می‌کنند، به جای راه‌حل‌های عمومی که کاربران باید خودشان آن‌ها را کشف کنند @karrisaarinen
دانشمندان با استفاده از هوش مصنوعی مولد، آنتی‌بیوتیک‌های جدیدی را برای مبارزه با باکتری‌های مقاوم به دارو طراحی کردند که قدرت هوش مصنوعی را در طراحی دارو و کاربردهای پزشکی نشان می‌دهد @MIT

پژوهش‌ها

تحلیل مدل استدلال سلسله‌مراتبی نشان می‌دهد که عملکرد از یک حلقه‌ی پالایش خارجی ناشی می‌شود نه از خود معماری مدل، با یافته‌هایی که نشان می‌دهد اساساً آموزش زمان آزمایش با پیش‌آموزش صفر است @fchollet
مدل‌های gpt-oss از OpenAI ایده‌های ۱۰ مقاله‌ی پژوهشی کلیدی از جمله توجه پنجره‌ی اسلایدینگ Longformer، سینک‌های توجه StreamingLLM و بهینه‌سازی‌های سطح سیستم Flash Attention را ترکیب می‌کنند @cwolferesearch
سیستم یادگیری عمیق BioEmu مایکروسافت ریسرچ، به‌سرعت پیکربندی‌های پروتئینی متنوعی را برای درک دقیق‌تر عملکرد پروتئین تولید می‌کند و بر روی جلد مجله‌ی Science قرار گرفت @peteratmsr
تنسنت Hunyuan 3D World Model 1.0-Lite را منتشر کرد که برای GPUهای رده‌ی مصرف‌کننده بهینه‌سازی شده است و الزامات VRAM را ۳۵٪ کاهش می‌دهد، از ۲۶ گیگابایت به کمتر از ۱۷ گیگابایت، در حالی که ۳ برابر سرعت استنتاج (inference) را افزایش می‌دهد @TencentHunyuan
پژوهش‌ها g-AMIE را معرفی می‌کنند که بررسی می‌کند چگونه هوش مصنوعی می‌تواند در مکالمات پزشک و بیمار کمک کند، در حالی که پزشکان کنترل را در دست دارند، و کاربردهای هوش مصنوعی پزشکی را پیش می‌برد @GoogleAI