اخبار هوش مصنوعی در 2025-09-10
مدلهای جدید هوش مصنوعی
- Stability AI مدل Stable Audio 2.5 را عرضه کرد، اولین مدل صوتی ساختهشده برای تولید صدای در سطح سازمانی، که دارای آهنگسازی بهبودیافته با ساختار چندبخشی، قابلیتهای ترمیم صوتی، و استنتاج سریعتر است که آهنگهای سهدقیقهای را در کمتر از دو ثانیه تولید میکند @StabilityAI
- مایکروسافت مدل MAI-Voice-1 را با حالت اسکریپتشده برای تولید صدا در Copilot Labs معرفی کرد، که سه حالت را ارائه میدهد: اسکریپتشده (ورودی را کلمهبهکلمه میخواند)، احساسی (درام اضافه میکند)، و داستانی (چندین صدا/شخصیت را اجرا میکند) @mustafasuleyman
- Replit از Agent 3، مستقلترین عامل هوش مصنوعی خود، رونمایی کرد که میتواند بیش از ۲۰۰ دقیقه بهصورت خودکار در حین ساخت، آزمایش و رفع اشکال برنامهها اجرا شود و نشاندهندهی یک جهش قابل توجه در توسعهی نرمافزار خودمختار است @Replit
- ByteDance مدل ویرایش تصویر Seedream 4 را منتشر کرد که Google Nano Banana را شکست داده تا در ویرایش تصویر به رتبهی ۱ برسد، وضوح تصویر 2K را در کمتر از ۲ ثانیه، پشتیبانی 4K و تولید چند تصویر را با هزینهی ۰.۰۳ دلار برای هر تولید ارائه میدهد @deedydas
تحلیل صنعت
- طبق گزارشها، OpenAI قراردادی ۳۰۰ میلیارد دلاری را با اوراکل برای یک دورهی پنجساله امضا میکند که به پیشیگرفتن لری الیسون از ایلان ماسک بهعنوان ثروتمندترین مرد جهان کمک میکند @AndrewCurran_
- درآمد سالیانهی Replit در کمتر از یک سال از ۲.۸ میلیون دلار به ۱۵۰ میلیون دلار جهش یافت که نشاندهندهی رشد انفجاری در ابزارهای توسعهی مبتنی بر هوش مصنوعی است @TechCrunch
- شرکت هلندی تراشهسازی ASML مبلغ ۱.۳ میلیارد یورو در شرکت فرانسوی هوش مصنوعی Mistral سرمایهگذاری میکند، و کارشناسان خاطرنشان میکنند که خرید احتمالی توسط اپل برای اهداف حاکمیت فناوری اروپا «بسیار منفی» میبود @AINowInstitute
- CloudKitchens بازخورد واقعی در مورد ابزارهای کدنویسی هوش مصنوعی ارائه میدهد: GitHub Copilot بهطور گسترده مورد استفاده قرار میگیرد، Cursor در حال محبوبیت است، در حالی که Windsurf و Devin به دلیل هزینه و کندی پیشرفت کنار گذاشته شدند @GergelyOrosz
- اوراکل دورهای عمدهی تعدیل نیرو را اعلام میکند که به پیادهسازی هوش مصنوعی نسبت داده میشود و تأثیر مداوم هوش مصنوعی بر بازسازی نیروی کار را برجسته میکند @AINowInstitute
- گرگلی اوروس «بار اضافی ARR» را در فناوری مشاهده میکند، به طوری که استارتاپهای متعدد هوش مصنوعی ارقام بالای ARR را اعلام میکنند اما شفافیت کمتری در مورد معیارهای واقعی کاربران و جزئیات محصول ارائه میدهند @GergelyOrosz
اخلاق و جامعه
- سایمون ویلیسون در مورد آسیبپذیریهای تزریق پرامپت در ابزار جدید واکشی وب Claude هشدار میدهد و به خطرات حملات استخراج داده (exfiltration) اشاره میکند، با وجود کاربردی بودن این قابلیت در صورت استفاده با محدودیتهای دقیق دامنه @simonw
- یک محقق امنیتی تأکید میکند که عاملهای هوش مصنوعی «بهصورت ذاتی ناامن هستند» و در حال حرکت به سمت استفادهی گسترده هستند و احتمالاً دورهی «غرب وحشی» دیگری مشابه با اپیدمی ویروس ویندوز ۹۵ را آزاد میکنند @random_walker
- کاخ سفید در طول جلسهی استماع کمیتهی بازرگانی سنا، از اولویتبخشی فدرال بر قوانین ایالتی هوش مصنوعی حمایت میکند، و سناتور کروز چارچوبی را معرفی میکند که میتواند منجر به اولویتبخشی بر مقررات هوش مصنوعی در سطح ایالتی شود @AINowInstitute
کاربردها
- قابلیتهای جدید Claude برای فایلهای اکسل عملکرد چشمگیری را نشان میدهد، مدلهای مالی پیچیده با ۴۰۶ فرمول را از یک پرامپت واحد ایجاد میکند و طرحهای تجاری جامعی تولید میکند که معمولاً به پروژههای تیمی یکهفتهای نیاز دارند @emollick
- Claude با موفقیت تصاویر پروفایل را در فایلهای اکسل بازتولید میکند و اسناد جامعی شامل رزومههای LaTeX، مدلهای مالی، گزارشهای PDF، و اسناد طراحی فنی ایجاد میکند @deedydas
- سایمون ویلیسون از Code Interpreter Claude برای تحلیل دادههای واقعی استفاده میکند، یک فایل CSV با ۱۸۰۰ خط را آپلود کرده و تحلیل برجستهای از روندها در طول زمان همراه با تئوریهایی در مورد علل اصلی دریافت میکند @simonw
- کلر وو کاربرد عملی هوش مصنوعی را با استفاده از MCP (پروتکل زمینهی مدل) بهعنوان مدیر موفقیت مشتری برای پرسوجو از پایگاههای دادهی اصلی و تولید بررسیهای تجاری فصلی همراه با تحلیل پذیرش و بینشهایی در مورد نحوهی استفاده از ویژگیها نشان میدهد @clairevo
- تککرانچ در مورد Oboe، یک پلتفرم یادگیری جدید مبتنی بر هوش مصنوعی، گزارش میدهد که دورههای آموزشی شخصیسازیشده در هر موضوعی را از طریق پرامپتهای ساده ایجاد میکند @TechCrunch
پژوهشها
- فرانسوا شوله تأکید میکند که درک واقعی در هوش مصنوعی نیازمند قابلیت تعمیمپذیری شدید است، و خاطرنشان میکند که دانشآموزی که F=ma را واقعاً درک میکند، میتواند مسائل جدیدتری را حل کند تا یک ترنسفورمر که تمام کتابهای درسی فیزیک را حفظ کرده است @fchollet
- Kaggle معیار SimpleQA Verified را با همکاری Google DeepMind راهاندازی میکند، که شامل ۱۰۰۰ پرامپت انتخابشده برای ارزیابی قابل اعتماد واقعگرایی LLMها است، با Gemini 2.5 Pro که عملکرد جدید و پیشرفتهای را ثبت میکند @kaggle
- مایکروسافت ریسرچ RenderFormer را معرفی میکند، اولین مدل شبکهی عصبی که قادر به یادگیری یک پایپلاین کامل رندر گرافیکی تنها با استفاده از یادگیری ماشین و بدون محاسبات گرافیکی سنتی است @MSFTResearch
- Salesforce یک عامل پژوهشی عمیق و قوی با استفاده از مدل متنباز کوچک OpenAI میسازد، که فرصتهای نوآوری ارائهشده توسط مدلهای با وزنهای باز را نشان میدهد، با وجود وابستگی به چند ارائهدهندهی اصلی @emollick
- پژوهشگران ارزیابی BackendBench را معرفی میکنند که توانایی LLMها در نوشتن اپراتورهای صحیح PyTorch را میسنجد، با مدلهایی که ۵۳٪ از آزمایشهای صحت را پشت سر گذاشته و برخی هستهها تا ۱.۲ برابر سریعتر از اجرای eager عمل میکنند @soumithchintala
- دانشمندان امپریال کالج کشف میکنند که چگونه «فاژهای دزد دریایی» ویروسها را برای گسترش ویژگیهای مقاومت به آنتیبیوتیک ربوده میکنند، با پژوهشهایی که توسط مرکز فلمینگ هماهنگ شده و با استفاده از «همکار علمی» هوش مصنوعی Google DeepMind آزمایش شده است @GoogleDeepMind
- استنفورد و UC Santa Cruz یک معیار جدید برای مدلهای صوتی-زبانی راهاندازی میکنند، با Gemini 2.5 Pro گوگل که پیشرو است اما پایپلاینهای ASR-plus-LLM نیز رقابتی عمل میکنند @stanfordnlp