اخبار هوش مصنوعی در 2025-09-11

مدل‌های جدید هوش مصنوعی

علی‌بابا مدل Qwen3-Next-80B-A3B را با ۸۰ میلیارد پارامتر، اما تنها ۳ میلیارد از آن‌ها به ازای هر توکن فعال می‌شود، منتشر کرد. این مدل به ۱۰ برابر آموزش ارزان‌تر و ۱۰ برابر استنتاج (inference) سریع‌تر نسبت به Qwen3-32B منجر می‌شود، به‌خصوص در طول‌های زمینه‌ی بیش از ۳۲ هزار. @Alibaba_Qwen
مدل Qwen3-Next-80B-A3B-Instruct به عملکرد مدل پرچم‌دار ۲۳۵ میلیاردی علی‌بابا نزدیک می‌شود، در حالی که Qwen3-Next-80B-A3B-Thinking عملکرد بهتری نسبت به Gemini-2.5-Flash-Thinking دارد. @Alibaba_Qwen
گوگل پشتیبانی از جدیدترین مدل Gemini Embeddings را در Batch API، با ۵۰ درصد تخفیف نسبت به قیمت‌گذاری عادی، اعلام کرد. این مدل از طریق لایه‌ی سازگاری OpenAI در دسترس است. @OfficialLoganK

تحلیل صنعت

ارزش‌گذاری Perplexity در کمتر از دو ماه از ۱۸ میلیارد دلار به ۲۰ میلیارد دلار جهش کرد، که نشان‌دهنده‌ی رشد سریع در جست‌وجوی مبتنی بر هوش مصنوعی است. @TechCrunch
مشخص شد که افزایش استخدام در اوراکل و ارزش‌گذاری بی‌سابقه‌ی آن ناشی از تلاش این شرکت برای توسعه‌ی دیتاسنترها جهت زیرساخت هوش مصنوعی است. @GergelyOrosz
توسعه‌دهندگان حرفه‌ای گزارش می‌دهند که ابزارهای کدنویسی هوش مصنوعی عمدتاً برای «انتقال‌ها» (migrations) باارزش هستند تا تولید نرم‌افزار از ابتدا، که باعث صرفه‌جویی در زمان قابل توجه و بهبود رضایت توسعه‌دهندگان می‌شود. @GergelyOrosz
استراتژی انتشار بی‌سر و صدای Anthropic برای بهبودهای عمده‌ی قابلیت‌ها در برنامه‌هایی مانند اکسل، پاورپوینت و عملکردهای دستیار شخصی، ممکن است پیشرفت‌های عملی آن‌ها را کم‌اهمیت جلوه دهد. @emollick
Hugging Face ادغام با GitHub Copilot Chat را در VS Code راه‌اندازی کرد و دسترسی به LLM‌های پیشرفته‌ی متن‌باز مانند Qwen3-Coder، gpt-oss و GLM-4.5 را از طریق شرکای استنتاج در سطح جهانی فراهم می‌کند. @hanouticelina

اخلاق و جامعه

کمیسیون تجارت فدرال (FTC) تحقیقاتی را در مورد ایمنی چت‌بات‌های هوش مصنوعی، به‌ویژه با تمرکز بر چت‌بات‌های همراه و تأثیر آن‌ها بر کودکان، آغاز کرد و شرکت‌های بزرگی از جمله OpenAI، Alphabet، Meta و xAI را هدف قرار داده است. @AndrewCurran_
کالیفرنیا لایحه‌ی SB 243 را پیشنهاد می‌کند، که این ایالت را به اولین ایالتی تبدیل خواهد کرد که پروتکل‌های ایمنی برای همراهان هوش مصنوعی را الزامی می‌کند و در صورت عدم رعایت استانداردهای ایمنی توسط چت‌بات‌ها، شرکت‌ها را از نظر قانونی مسئول می‌داند. @TechCrunch
استنفورد HAI چارچوبی برای تخمین «بی‌طرفی سیاسی» در مدل‌های هوش مصنوعی منتشر کرد، و اذعان دارد که بی‌طرفی واقعی از نظر فنی غیرممکن است اما ۸ تکنیک برای نزدیک شدن به آن ارائه می‌دهد. @StanfordHAI

کاربردها

Claude قابلیت‌های پیشرفته‌ی «دستیار تلفن» را به نمایش گذاشت و با موفقیت درخواست‌های پیچیده شامل عقل سلیم و محدودیت‌های دشوار را مدیریت می‌کند، اگرچه هنوز برای عملکرد بهینه به مدل بزرگ‌تر Opus نیاز دارد. @emollick
Replit Agent قابلیت‌های اشکال‌زدایی (debugging) و تست سرتاسری را به نمایش می‌گذارد و قادر است در برنامه‌ها کلیک کند و ساعت‌ها تکرار (iterate) کند، ضمن ارائه‌ی بازپخش کامل فرآیند و تحلیل گزارش‌ها. @tylerangert
مایکروسافت ریسرچ «پروتکل زمینه‌ی مدل (MCP)» را به عنوان یک استاندارد جدید برای همکاری عامل‌ها (agents) در اکوسیستم‌های ابزاری تکه‌تکه، با پیچیده‌تر شدن سیستم‌های هوش مصنوعی عامل‌محور (agentic)، بررسی می‌کند. @MSFTResearch
شرکت Box ابزارهای جدید هوش مصنوعی را در کنفرانس Boxworks منتشر کرد، که دیدگاه آرون لوی، مدیرعامل این شرکت، را برای تحول گردش‌کارهای سازمانی با محوریت هوش مصنوعی پیش می‌برد. @TechCrunch

پژوهش‌ها

پژوهشگاه هوش مصنوعی برکلی «RecA (هم‌ترازی بازسازی)» را معرفی می‌کند، که مدل‌های چندوجهی یکپارچه را تنها با ۸ هزار تصویر و ۴ ساعت آموزش بر روی ۸ پردازنده‌ی گرافیکی (GPU) به طور قابل توجهی بهبود می‌بخشد و دستاوردهای عملکردی عمده‌ای در بنچمارک‌های GenEval، DPGBench و ImgEdit کسب می‌کند. @XDWang101
انویدیا چارچوبی مشابه AlphaEvolve را برای تکامل مستقل حل‌کننده‌های SAT از نوع NP-Complete توسعه می‌دهد، که نشان‌دهنده‌ی پیشرفتی در عامل‌های کدنویسی تکاملی است. @richardcsuwandi
پژوهش‌ها نشان می‌دهد که ارزیابی‌های هوش مصنوعی اساساً کاری در حوزه‌ی «علم داده» (data science) هستند، که نیازمند مهارت‌هایی در تحلیل داده، بصری‌سازی و طراحی معیارهاست، و ابزارهای هوش مصنوعی اکوسیستم PyData را در دسترس‌تر می‌کنند. @HamelHusain
مطالعه‌ی جدیدی فرضیات مربوط به کم‌اهمیت شدن RAG به دلیل پنجره‌های زمینه‌ی طولانی را به چالش می‌کشد، و آزمایش‌ها بر روی ۱۸ مدل مختلف نشان می‌دهد که RAG همچنان باارزش است. @HamelHusain
PyTorch و گوگل راهکار checkpointing محلی را با استفاده از DCP برای کاهش سربار آموزش و بهبود goodput در کارهای آموزشی توزیع‌شده‌ی در مقیاس بزرگ توسعه دادند. @PyTorch

اخبار هوش مصنوعی در 2025-09-10

مدل‌های جدید هوش مصنوعی

Stability AI مدل Stable Audio 2.5 را عرضه کرد، اولین مدل صوتی ساخته‌شده برای تولید صدای در سطح سازمانی، که دارای آهنگسازی بهبودیافته با ساختار چندبخشی، قابلیت‌های ترمیم صوتی، و استنتاج سریع‌تر است که آهنگ‌های سه‌دقیقه‌ای را در کمتر از دو ثانیه تولید می‌کند @StabilityAI
مایکروسافت مدل MAI-Voice-1 را با حالت اسکریپت‌شده برای تولید صدا در Copilot Labs معرفی کرد، که سه حالت را ارائه می‌دهد: اسکریپت‌شده (ورودی را کلمه‌به‌کلمه می‌خواند)، احساسی (درام اضافه می‌کند)، و داستانی (چندین صدا/شخصیت را اجرا می‌کند) @mustafasuleyman
Replit از Agent 3، مستقل‌ترین عامل هوش مصنوعی خود، رونمایی کرد که می‌تواند بیش از ۲۰۰ دقیقه به‌صورت خودکار در حین ساخت، آزمایش و رفع اشکال برنامه‌ها اجرا شود و نشان‌دهنده‌ی یک جهش قابل توجه در توسعه‌ی نرم‌افزار خودمختار است @Replit
ByteDance مدل ویرایش تصویر Seedream 4 را منتشر کرد که Google Nano Banana را شکست داده تا در ویرایش تصویر به رتبه‌ی ۱ برسد، وضوح تصویر 2K را در کمتر از ۲ ثانیه، پشتیبانی 4K و تولید چند تصویر را با هزینه‌ی ۰.۰۳ دلار برای هر تولید ارائه می‌دهد @deedydas

تحلیل صنعت

طبق گزارش‌ها، OpenAI قراردادی ۳۰۰ میلیارد دلاری را با اوراکل برای یک دوره‌ی پنج‌ساله امضا می‌کند که به پیشی‌گرفتن لری الیسون از ایلان ماسک به‌عنوان ثروتمندترین مرد جهان کمک می‌کند @AndrewCurran_
درآمد سالیانه‌ی Replit در کمتر از یک سال از ۲.۸ میلیون دلار به ۱۵۰ میلیون دلار جهش یافت که نشان‌دهنده‌ی رشد انفجاری در ابزارهای توسعه‌ی مبتنی بر هوش مصنوعی است @TechCrunch
شرکت هلندی تراشه‌سازی ASML مبلغ ۱.۳ میلیارد یورو در شرکت فرانسوی هوش مصنوعی Mistral سرمایه‌گذاری می‌کند، و کارشناسان خاطرنشان می‌کنند که خرید احتمالی توسط اپل برای اهداف حاکمیت فناوری اروپا «بسیار منفی» می‌بود @AINowInstitute
CloudKitchens بازخورد واقعی در مورد ابزارهای کدنویسی هوش مصنوعی ارائه می‌دهد: GitHub Copilot به‌طور گسترده مورد استفاده قرار می‌گیرد، Cursor در حال محبوبیت است، در حالی که Windsurf و Devin به دلیل هزینه و کندی پیشرفت کنار گذاشته شدند @GergelyOrosz
اوراکل دورهای عمده‌ی تعدیل نیرو را اعلام می‌کند که به پیاده‌سازی هوش مصنوعی نسبت داده می‌شود و تأثیر مداوم هوش مصنوعی بر بازسازی نیروی کار را برجسته می‌کند @AINowInstitute
گرگلی اوروس «بار اضافی ARR» را در فناوری مشاهده می‌کند، به طوری که استارتاپ‌های متعدد هوش مصنوعی ارقام بالای ARR را اعلام می‌کنند اما شفافیت کمتری در مورد معیارهای واقعی کاربران و جزئیات محصول ارائه می‌دهند @GergelyOrosz

اخلاق و جامعه

سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت در ابزار جدید واکشی وب Claude هشدار می‌دهد و به خطرات حملات استخراج داده (exfiltration) اشاره می‌کند، با وجود کاربردی بودن این قابلیت در صورت استفاده با محدودیت‌های دقیق دامنه @simonw
یک محقق امنیتی تأکید می‌کند که عامل‌های هوش مصنوعی «به‌صورت ذاتی ناامن هستند» و در حال حرکت به سمت استفاده‌ی گسترده هستند و احتمالاً دوره‌ی «غرب وحشی» دیگری مشابه با اپیدمی ویروس ویندوز ۹۵ را آزاد می‌کنند @random_walker
کاخ سفید در طول جلسه‌ی استماع کمیته‌ی بازرگانی سنا، از اولویت‌بخشی فدرال بر قوانین ایالتی هوش مصنوعی حمایت می‌کند، و سناتور کروز چارچوبی را معرفی می‌کند که می‌تواند منجر به اولویت‌بخشی بر مقررات هوش مصنوعی در سطح ایالتی شود @AINowInstitute

کاربردها

قابلیت‌های جدید Claude برای فایل‌های اکسل عملکرد چشمگیری را نشان می‌دهد، مدل‌های مالی پیچیده با ۴۰۶ فرمول را از یک پرامپت واحد ایجاد می‌کند و طرح‌های تجاری جامعی تولید می‌کند که معمولاً به پروژه‌های تیمی یک‌هفته‌ای نیاز دارند @emollick
Claude با موفقیت تصاویر پروفایل را در فایل‌های اکسل بازتولید می‌کند و اسناد جامعی شامل رزومه‌های LaTeX، مدل‌های مالی، گزارش‌های PDF، و اسناد طراحی فنی ایجاد می‌کند @deedydas
سایمون ویلیسون از Code Interpreter Claude برای تحلیل داده‌های واقعی استفاده می‌کند، یک فایل CSV با ۱۸۰۰ خط را آپلود کرده و تحلیل برجسته‌ای از روندها در طول زمان همراه با تئوری‌هایی در مورد علل اصلی دریافت می‌کند @simonw
کلر وو کاربرد عملی هوش مصنوعی را با استفاده از MCP (پروتکل زمینه‌ی مدل) به‌عنوان مدیر موفقیت مشتری برای پرس‌وجو از پایگاه‌های داده‌ی اصلی و تولید بررسی‌های تجاری فصلی همراه با تحلیل پذیرش و بینش‌هایی در مورد نحوه‌ی استفاده از ویژگی‌ها نشان می‌دهد @clairevo
تک‌کرانچ در مورد Oboe، یک پلتفرم یادگیری جدید مبتنی بر هوش مصنوعی، گزارش می‌دهد که دوره‌های آموزشی شخصی‌سازی‌شده در هر موضوعی را از طریق پرامپت‌های ساده ایجاد می‌کند @TechCrunch

پژوهش‌ها

فرانسوا شوله تأکید می‌کند که درک واقعی در هوش مصنوعی نیازمند قابلیت تعمیم‌پذیری شدید است، و خاطرنشان می‌کند که دانش‌آموزی که F=ma را واقعاً درک می‌کند، می‌تواند مسائل جدیدتری را حل کند تا یک ترنسفورمر که تمام کتاب‌های درسی فیزیک را حفظ کرده است @fchollet
Kaggle معیار SimpleQA Verified را با همکاری Google DeepMind راه‌اندازی می‌کند، که شامل ۱۰۰۰ پرامپت انتخاب‌شده برای ارزیابی قابل اعتماد واقع‌گرایی LLM‌ها است، با Gemini 2.5 Pro که عملکرد جدید و پیشرفته‌ای را ثبت می‌کند @kaggle
مایکروسافت ریسرچ RenderFormer را معرفی می‌کند، اولین مدل شبکه‌ی عصبی که قادر به یادگیری یک پایپ‌لاین کامل رندر گرافیکی تنها با استفاده از یادگیری ماشین و بدون محاسبات گرافیکی سنتی است @MSFTResearch
Salesforce یک عامل پژوهشی عمیق و قوی با استفاده از مدل متن‌باز کوچک OpenAI می‌سازد، که فرصت‌های نوآوری ارائه‌شده توسط مدل‌های با وزن‌های باز را نشان می‌دهد، با وجود وابستگی به چند ارائه‌دهنده‌ی اصلی @emollick
پژوهشگران ارزیابی BackendBench را معرفی می‌کنند که توانایی LLM‌ها در نوشتن اپراتورهای صحیح PyTorch را می‌سنجد، با مدل‌هایی که ۵۳٪ از آزمایش‌های صحت را پشت سر گذاشته و برخی هسته‌ها تا ۱.۲ برابر سریع‌تر از اجرای eager عمل می‌کنند @soumithchintala
دانشمندان امپریال کالج کشف می‌کنند که چگونه «فاژهای دزد دریایی» ویروس‌ها را برای گسترش ویژگی‌های مقاومت به آنتی‌بیوتیک ربوده می‌کنند، با پژوهش‌هایی که توسط مرکز فلمینگ هماهنگ شده و با استفاده از «همکار علمی» هوش مصنوعی Google DeepMind آزمایش شده است @GoogleDeepMind
استنفورد و UC Santa Cruz یک معیار جدید برای مدل‌های صوتی-زبانی راه‌اندازی می‌کنند، با Gemini 2.5 Pro گوگل که پیشرو است اما پایپ‌لاین‌های ASR-plus-LLM نیز رقابتی عمل می‌کنند @stanfordnlp

اخبار هوش مصنوعی در 2025-09-09

مدل‌های جدید هوش مصنوعی

گوگل اعلام کرد که مدل‌های Veo 3 و Veo 3 Fast اکنون به‌طور عمومی در API جیمینای (Gemini) در دسترس هستند. این مدل‌ها با کاهش چشمگیر قیمت (حدود 50% برای Veo 3 و 62% برای Veo 3 Fast) و همچنین پشتیبانی از خروجی‌های 1080p HD و فرمت عمودی 9:16 عرضه شده‌اند. @sundarpichai
Anthropic قابلیت‌های ساخت و ویرایش فایل را برای Claude منتشر کرد که به کاربران امکان می‌دهد صفحات گسترده، اسناد، PDFها و ارائه‌ها (اسلایدها) را مستقیماً از طریق مکالمات ایجاد و ویرایش کنند. @claudeai
گوگل Gemini Canvas را با قابلیت "Select and Ask" معرفی کرد که امکان ویرایش بصری عناصر برنامه‌های وب را از طریق توضیحات زبان طبیعی و بدون نیاز به کدنویسی فراهم می‌کند. @GeminiApp
گوگل طرح AI Plus را در اندونزی راه‌اندازی کرد که دسترسی بیشتری به Gemini 2.5 Pro و ابزارهای خلاقانه‌ی شامل Flow، Whisk و قابلیت ساخت ویدئو با Veo 3 Fast را فراهم می‌کند. @GeminiApp
LLM360 مدل K2 Think را که بر اساس Qwen 2.5 32B ساخته شده است، منتشر کرد. این مدل بهترین عملکرد را در میان مدل‌های متن‌باز در رتبه‌بندی MCPMark به دست آورده است. @natolambert
Hugging Face مدل ModernBERT چندزبانه (mmBERT) را با عملکردی پیشرفته و سرعت بهبودیافته در مقایسه با انکودرهای چندزبانه‌ی موجود معرفی کرد. @tomaarsen
NVIDIA مدل Nemotron Nano 9B v2 را روی پلتفرم OpenRouter منتشر کرد. @NVIDIAAIDev

تحلیل صنعت

Mistral AI دور سرمایه‌گذاری 2 میلیارد دلاری خود را با ارزش‌گذاری 13.7 میلیارد دلار به رهبری ASML و با بیش از 1.6 میلیارد دلار TCV به پایان رساند. این رقم، رشد چشمگیر شرکت را از ارزش‌گذاری 2 میلیارد دلاری‌اش در 20 ماه پیش نشان می‌دهد. @AnjneyMidha
مدیر عامل Cognition معتقد است که نگرانی‌های مربوط به هزینه‌ی هوش مصنوعی بی‌مورد است و بیان می‌کند که سه برابر کردن سرعت متخصصان از نظر اقتصادی مقرون‌به‌صرفه خواهد بود، صرف‌نظر از هزینه‌های ماشین‌آلات. او افزود که کسب ارزش از طریق حل موارد کاربردی خاص و ایجاد شخصی‌سازی حاصل می‌شود. @tbpn
ایتان مولیک (Ethan Mollick) در مورد فروشندگان SaaS که از مدل‌های هوش مصنوعی ارزان با استراتژی‌های قدیمی برای کاهش هزینه‌ها استفاده می‌کنند، هشدار داد و گفت که این وضعیت احتمالاً نیازمند حسابرسی مستقل از دستورات (prompts) و مدل‌های فروشنده برای اطمینان از کیفیت است. @emollick
تحلیل‌ها نشان می‌دهد که داده‌های کلان اقتصادی کاهش غیرمنتظره‌ای در اشتغال و افزایش در بهره‌وری را نشان می‌دهند که احتمالاً نشان‌دهنده‌ی تأثیر اولیه‌ی هوش مصنوعی بر اقتصاد است. @emollick
آزمایشگاه‌های هوش مصنوعی بر ویژگی‌های تصویری و ویدئویی وایرال‌شونده تمرکز می‌کنند، زیرا آن‌ها نتایج قابل اشتراک‌گذاری آسانی تولید می‌کنند، در حالی که مدل‌های متنی توانمندتر، نیازمند آن هستند که کاربران خودشان موارد کاربرد خوب را کشف کنند. @emollick
بحثی در مورد اینکه ابزارهای کدنویسی هوش مصنوعی چگونه ممکن است اهمیت زبان‌های برنامه‌نویسی را تغییر دهند، در جریان است؛ برخی استدلال می‌کنند که زبان‌های Type-Safe مانند TypeScript برای توسعه‌ی مبتنی بر هوش مصنوعی با ارزش‌تر خواهند شد. @GergelyOrosz

اخلاق و جامعه

پژوهشگر مؤسسه‌ی AI Now هشدار می‌دهد که تمرکز سیاست‌گذاران بر پیگیری AGI (هوش مصنوعی عمومی) در حالی که نگرانی‌های کوتاه‌مدت را نادیده می‌گیرند، یک «شرط‌بندی خطرناک و غیرمسئولانه» است. @AINowInstitute
مصطفی سلیمان (Mustafa Suleyman) استدلال می‌کند که «هوش مصنوعی به ظاهر خودآگاه» توهمات و وابستگی‌های خطرناکی ایجاد خواهد کرد و از توسعه‌ی هوش مصنوعی‌ای حمایت می‌کند که بر بهبود زندگی انسان متمرکز باشد نه شبیه‌سازی آگاهی. @mustafasuleyman
الکس گریولی (Alex Graveley) پیشنهاد می‌کند که ممکن است به سناریویی پیش برویم که در آن هوش مصنوعی تنها منبع قابل اعتماد آنلاین شود، و نگرانی‌ها در مورد قابلیت اطمینان اطلاعات را برجسته می‌کند. @alexgraveley
مجله‌ی MIT Technology Review گزارشی در مورد درمانگرانی منتشر کرد که مخفیانه از ChatGPT استفاده می‌کنند، و نگرانی‌های اخلاقی را در مورد استفاده‌ی پنهان از هوش مصنوعی در درمان سلامت روان ایجاد می‌کند. @techreview
مارک کیوبن (Mark Cuban) بزرگ‌ترین ضعف هوش مصنوعی را ناتوانی آن در گفتن «نمی‌دانم» می‌داند و پیشنهاد می‌کند که برتری انسان در اعتراف به عدم قطعیت است. @mcuban

کاربردها

مایکروسافت عامل پژوهشگر (Researcher agent) را در Microsoft 365 Copilot به نمایش گذاشت که می‌تواند داده‌های کاری (چت‌ها، جلسات، فایل‌ها، ایمیل‌ها) و همچنین داده‌های وب را پردازش کند تا گزارش‌های پژوهشی جامعی را برای آماده‌سازی جلسات و تدوین استراتژی ایجاد کند. @satyanadella
مایکروسافت با رالف لورن (Ralph Lauren) همکاری می‌کند تا «Ask Ralph» را ایجاد کند، یک دستیار هوش مصنوعی مکالمه‌ای برای استایلینگ در اپلیکیشن رالف لورن برای تجربه‌های خرید شخصی‌سازی‌شده. @MSCloud
دستگاه AlterEgo پیشرفت قابل توجهی را از نمونه‌ی اولیه تا قابلیت تقریباً تله‌پاتی نشان می‌دهد، به این صورت که سیگنال‌های عصبی-عضلانی را می‌خواند تا گفتار خاموش را به متن در چندین زبان ترجمه کند. @deedydas
سیمون ویلیسون (Simon Willison) نشان داد که GPT-5 با موفقیت نمودارهای پیچیده‌ی داده‌های سرشماری ایالات متحده را از اسکرین‌شات‌ها و داده‌های خام با استفاده از پایتون و matplotlib بازسازی می‌کند، که قابلیت‌های پیشرفته‌ی تجزیه و تحلیل داده را به نمایش می‌گذارد. @simonw
کلر وو (Claire Vo) جریان کاری طراحی وب مبتنی بر هوش مصنوعی را به نمایش گذاشت که با استفاده از Cursor AI، Devin AI و Midjourney عناصر وب‌سایت و انیمیشن‌های جذاب بصری ایجاد می‌کند. @clairevo
Modal نوت‌بوک‌های GPU مبتنی بر فضای ابری را با قابلیت ویرایش مشارکتی در لحظه راه‌اندازی کرد که به کاربران امکان می‌دهد GPUها را در چند ثانیه تعویض کرده و برنامه‌های تعاملی را به اشتراک بگذارند. @ekzhang1

پژوهش‌ها

پژوهش هوش مصنوعی گوگل نشان می‌دهد که LLMها (مدل‌های زبان بزرگ) همراه با جستجوی درختی می‌توانند نتایج پیشرفته‌ای را در وظایف علمی کسب کنند، به‌ویژه زمانی که نتایج قابل اندازه‌گیری در دسترس باشند. @deedydas
فی فی لی (Fei-Fei Li) استدلال می‌کند که LLMها (مدل‌های زبان بزرگ) با هوش فضایی مشکل خواهند داشت، زیرا «زبان اساساً یک سیگنال صرفاً تولیدی است» در حالی که جهان سه‌بعدی از قوانین فیزیک پیروی می‌کند، و این امر نیازمند رویکردهای اساساً متفاوتی است. @a16z
مایکروسافت ریسرچ (Microsoft Research) سیستم MOSAIC را معرفی می‌کند که با استفاده از میکروال‌ای‌دی‌ها (microLEDs) و معماری نوری گسترده و کند، اتصالات سریع‌تر، قابل اعتمادتر و کم‌مصرف‌تری را برای طراحی خوشه‌های هوش مصنوعی فراهم می‌کند و جایزه‌ی بهترین مقاله را در کنفرانس ACM SIGCOMM کسب کرده است. @MSFTResearch
OpenAI اعلام کرد که حالت صدای استاندارد (Standard Voice Mode) همچنان در دسترس خواهد بود تا زمانی که آن‌ها به بازخوردهای کاربران در حالت صدای پیشرفته (Advanced Voice Mode) رسیدگی کنند، و از برنامه‌ی قبلی خود برای غیرفعال‌سازی آن پس از 30 روز صرف‌نظر کردند. @nickaturley
آرویند نارایانان (Arvind Narayanan) و سایا کاپور (Sayash Kapoor) خبرنامه‌ی «هوش مصنوعی به عنوان فناوری عادی» را راه‌اندازی کردند که تمرکز را از تأثیرات کنونی هوش مصنوعی به پیامدهای آتی تغییر می‌دهد و چارچوب خود را به یک کتاب که برای سال 2027 برنامه‌ریزی شده، گسترش می‌دهند. @random_walker

اخبار هوش مصنوعی در 2025-09-08

مدل‌های جدید هوش مصنوعی

«علی‌بابا» مدل Qwen3-ASR را منتشر کرد؛ یک مدل همه‌کاره‌ی تشخیص گفتار که از ۱۱ زبان پشتیبانی می‌کند و قابلیت تشخیص خودکار زبان را دارد، از ورودی‌های سفارشی پشتیبانی می‌کند و حتی با وجود موسیقی پس‌زمینه، نرخ خطای کلمه‌ی آن زیر ۸ درصد است @Alibaba_Qwen

تحلیل صنعت

«اوپن‌ای‌آی» از یک فیلم بلند انیمیشن تولیدشده با هوش مصنوعی به نام Critterz با بودجه‌ی ۳۰ میلیون دلاری و جدول زمانی تولید ۹ ماهه که قرار است در می ۲۰۲۶ در «کن» به نمایش درآید، حمایت مالی می‌کند @AndrewCurran_
«دیتا بریکس» یک دور تامین مالی ۱ میلیارد دلاری دیگر را با ارزش‌گذاری ۱۰۰ میلیارد دلاری تایید کرد؛ این در حالی است که تنها چند ماه پیش ۱۰ میلیارد دلار جمع‌آوری کرده بود @TechCrunch
«کاگنیشن لبز» برای عامل کدنویسی هوش مصنوعی خود، Devin، موفق به جذب سرمایه شد؛ سرمایه‌گذاری‌ای که توسط «فاندرز فاند» رهبری شد و «لاکس کپیتال»، «8VC» و دیگران نیز در آن مشارکت داشتند @TechCrunch
شرکت ربات‌ساز چینی «یونیتری» برای عرضه‌ی عمومی سهام (IPO) ۷ میلیارد دلاری اقدام کرد؛ این شرکت با بیش از ۱۴۰ میلیون دلار درآمد و با داشتن ۷۰ درصد از سهم بازار جهانی در ربات‌های سگ‌نما، به بزرگ‌ترین شرکت ربات‌های انسان‌نمای عمومی تبدیل می‌شود @deedydas
بنیان‌گذاران استارتاپ‌های هوش مصنوعی با فشار زمانی بسیار زیادی مواجه هستند و حدود ۶ ماه یا کمتر فرصت دارند تا به انطباق محصول با بازار (product-market fit) دست یابند؛ پیش از آنکه به دلیل ماهیت انقلابی فناوری هوش مصنوعی مجبور شوند شرکت را تعطیل یا بفروشند @GergelyOrosz

اخلاق و جامعه

«آنتروپیک» از لایحه‌ی SB 53 کالیفرنیا حمایت می‌کند و از حکمرانی مبتنی بر شفافیت برای سیستم‌های هوش مصنوعی قدرتمند، به‌جای مدیریت فنی خرد (micromanagement)، طرفداری می‌کند؛ در همین حال، بر نیاز به حکمرانی متفکرانه‌ی هوش مصنوعی در امروز، به جای اقدامات واکنشی در آینده، تاکید می‌کند @AnthropicAI
«فرانسوا شوله» هشدار می‌دهد که با سرازیر شدن محتوای تولیدشده با هوش مصنوعی به اینترنت و افزایش اتکای انسان‌ها به هوش مصنوعی مولد، مدل‌های آینده ناگزیر بیشتر بر روی محتوای تولیدشده با هوش مصنوعی آموزش خواهند دید که این امر منجر به تبدیل شدن فرهنگ به «غذای نامرغوب بازترکیب‌شده از غذای نامرغوب» (slop remixed from slop) خواهد شد @fchollet
«سم آلتمن» مشاهده می‌کند که «توییتر» و «ردیت» مرتبط با هوش مصنوعی اکنون در مقایسه با یک یا دو سال پیش «بسیار ساختگی» به نظر می‌رسند؛ او این موضوع را به افراد واقعی‌ای نسبت می‌دهد که زبان LLM را به کار می‌برند، چرخه‌های تبلیغاتی شدید، بهینه‌سازی تعامل، و احتمالا دست‌کاری افکار عمومی (astroturfing) @sama

کاربردها

«پرپلکسیتی» «پرپلکسیتی برای دولت» را راه‌اندازی کرد که مصرف داده‌ی صفر و دسترسی کاملا امن به مدل‌های هوش مصنوعی پریمیوم را برای استفاده‌ی دولت ایالات متحده، بدون نیاز به قرارداد یا مجوز، ارائه می‌دهد @perplexity_ai
حالت هوش مصنوعی «گوگل» در جست‌وجو به پنج زبان جدید: هندی، اندونزیایی، ژاپنی، کره‌ای و پرتغالی برزیلی گسترش یافت؛ این گسترش با استفاده از نسخه‌ی سفارشی Gemini 2.5 برای ارائه‌ی تجربه‌های جست‌وجوی مرتبط با فرهنگ انجام شد @sundarpichai
«گوگل دیپ‌مایند» «روبوباله» (RoboBallet) را معرفی کرد؛ یک سیستم هوش مصنوعی که می‌تواند هماهنگی حرکت تا ۸ بازوی رباتیک را بدون برخورد برنامه‌ریزی کند و در برنامه‌ریزی وظایف و حرکت، حدود ۲۵ درصد بهتر از روش‌های سنتی عمل می‌کند @GoogleDeepMind
اپلیکیشن «جمینای» اکنون از آپلود فایل‌های صوتی پشتیبانی می‌کند و به اصلی‌ترین درخواست کاربران برای پشتیبانی از انواع فایل پاسخ می‌دهد @joshwoodward
مدیرعامل «کاگنیشن لبز» نشان می‌دهد که چگونه هوش مصنوعی Devin در داخل شرکت برای برنامه‌ریزی پروژه، رفع اشکالات، تحقیق در «دیپ‌ویکی» و به عنوان اولین خط دفاعی برای سوالات مهندسی استفاده می‌شود @clairevo

پژوهش‌ها

پژوهش‌ها نشان‌دهنده‌ی یک شکاف عملکردی واضح بین الگوریتم‌های یادگیری تقویتی آنلاین و آفلاین برای آموزش LLM هستند، به طوری که روش‌های آنلاین مانند PPO داده‌های خارج از توزیع را قوی‌تر از روش‌های آفلاین مانند DPO مدیریت می‌کنند؛ اگرچه این شکاف می‌تواند از طریق رویکردهای نیمه‌آنلاین به حداقل برسد @cwolferesearch
«ایتان مولیک» GPT-5 Pro را برای ساخت پازل‌های جذاب D&D آزمایش می‌کند و بهبودهای قابل توجهی در انسجام پازل در مقایسه با GPT-4 و Claude 3 Opus پیدا می‌کند؛ اگرچه رویکردهای تک‌پرامپت (single-prompt) همچنان با جزئیات اضافی و توجیهات عجیب مشکل دارند @emollick
«پاول گراهام» کشف می‌کند که GPT-5 به طور مداوم در ساخت مونگرام‌ها بد عمل می‌کند و حتی پس از اینکه به آن گفته می‌شود اشتباه کرده و از آن خواسته می‌شود برای پاسخ‌های بهتر بیشتر فکر کند، قادر به حل صحیح هیچ‌کدام نیست @paulg
«هاگینگ فیس» FinePDF را منتشر می‌کند؛ بزرگ‌ترین مجموعه‌داده‌ی PDF در دسترس عموم با ۳ تریلیون توکن در ۴۷۵ میلیون سند به ۱۷۳۳ زبان، که عملکردی تقریباً هم‌سطح با مجموعه‌های HTML پیشرفته (state-of-the-art) دارد @rohanpaul_ai
«فرانسوا شوله» پیشنهاد می‌کند که AGI (هوش عمومی مصنوعی) «یک کدگذاری الگوریتمی از فرآیند خودِ علم» خواهد بود، به جای یک ذهن فردی؛ او علم را به عنوان یک فرآیند سنتز برنامه که مدل‌های نمادین تولید می‌کند، توصیف می‌کند @fchollet

اخبار هوش مصنوعی در 2025-09-07

مدل‌های جدید هوش مصنوعی

ایلان ماسک از یک به‌روزرسانی بزرگ برای ایمَجین خبر داد که طی چند هفته‌ی آینده منتشر می‌شود، با «اپیزودهای نیم‌ساعته‌ی جذاب» از ویدیوی مولد تا سال آینده، و هدف‌گذاری تولید ویدیوهای منسجم ۱۵ دقیقه‌ای از یک دستور (پرامپت) واحد تا پایان سال جاری. @AndrewCurran_
تنسنت هونیوان با مدل‌های Hunyuan-MT-7B و HunyuanWorld-Voyager به دو جایگاه برتر در جدول‌های ترند هگینگ فیس دست یافت. @huggingface

تحلیل صنعت

انتظار می‌رود ASML پس از تعهد ۱.۵ میلیارد دلاری در جذب سرمایه و تبدیل شدن به سهام‌دار اصلی، در هیئت مدیره‌ی میسترال کرسی داشته باشد و بدین ترتیب یک اتحاد هوش مصنوعی اروپایی تشکیل می‌دهد. @AndrewCurran_
پرپلکسیتی در حال استخدام دانشمندان داده برای کار روی ارزیابی‌های دستیار است، که مستلزم تجربه‌ی کاری در بهبود سیستم‌های پیچیده‌ی هوش مصنوعی در مقیاس بزرگ است. @alexgraveley
ناتان لمبرت، پرداخت هزینه برای هوش مصنوعی‌های بهتر را راهی برای «پیروزی با پرداخت هزینه» در حرفه‌ی شما توصیف می‌کند، که آن را با پویایی‌های بازی‌های ویدیویی مقایسه می‌کند. @natolambert
پل گراهام مشاهداتی را بازنشر کرد مبنی بر اینکه عامل‌های هوش مصنوعی برای اولین بار امکان جداسازی خروجی (ارزش) از ورودی انسانی (زمان) را در کارهای مبتنی بر دانش فراهم می‌کنند. @paulg

کاربردها

لوگان کیلپاتریک استفاده از NanoBanana را در گوگل اِی‌آی استودیو (Google AI Studio) برای آزمایش نشان داد. @OfficialLoganK
سایمون ویلیسون گزارشی تکمیلی ارائه می‌دهد که «حالت هوش مصنوعی» جدید گوگل را بسیار خوب توصیف می‌کند و آن را کاملاً متفاوت از «بررسی‌های کلی هوش مصنوعی» می‌داند که به نظر او وحشتناک هستند. @simonw
گرگ براکمن مثالی از رابط خط فرمان (CLI) کدکس با قابلیت یکپارچه‌سازی جست‌وجوی وب را به اشتراک گذاشت. @gdb

پژوهش‌ها

ایتان مولیک یافته‌های ظریفی را درباره‌ی توانایی GPT-5 Pro در انجام ریاضیات جدید مورد بحث قرار می‌دهد، اما تنها زمانی که توسط یک استاد ریاضی هدایت شود، و سرعت پیشرفت از زمان GPT-4 را برجسته می‌کند. @emollick
هگینگ فیس، FinePDFs را منتشر کرد؛ بزرگ‌ترین مجموعه‌ی داده‌ی PDF که شامل بیش از نیم میلیارد سند با ۳ تریلیون توکن از حوزه‌های پرتقاضا مانند حقوق و علوم است، و زمینه‌ی متنی (کانتکست) ۲ برابر طولانی‌تر از متن وب را نشان می‌دهد. @huggingface
الکس گراولی ایده‌ی بازرتبه‌بندی‌کننده‌ی سطح توکن (token level reranker) را بر اساس پژوهش‌های مرجع پیاده‌سازی کرد. @alexgraveley
ایتان مولیک اشاره می‌کند که مدل‌های زبانی بزرگ چندوجهی (multimodal LLMs) در تشخیص جزئیات بصری ظریف ضعیف بوده‌اند، که این امر اهمیت نظارت بر معیارهای بصری را برای ردیابی پیشرفت برجسته می‌کند. @emollick
فرانسوا شوله توضیح می‌دهد که مدل‌های یادگیری عمیق تنها می‌توانند از طریق درون‌یابی (interpolation) بر روی منحنی‌های پارامتریک تعمیم یابند، که منجر به توهم‌زایی می‌شود، و نمودارهای نمادین علّی (causal symbolic graphs) را به عنوان راه‌حلی برای انتشار دقیق حقیقت‌پذیری پیشنهاد می‌کند. @fchollet

اخبار هوش مصنوعی در 2025-09-06

مدل‌های جدید هوش مصنوعی

جوآن جانگ از راه‌اندازی OAI Labs، یک گروه پژوهش‌محور که بر اختراع رابط‌های کاربری جدید برای همکاری انسان و هوش مصنوعی تمرکز دارد و فراتر از چت و عامل‌ها (ایجنت‌ها) به سمت الگوهای جدیدی برای تفکر، ساخت و یادگیری می‌رود، خبر داد. @joannejang
گوگل اعلام کرد که Nano Banana اکنون در لایه‌ی رایگان API جِمنای برای آخر هفته با نام «gemini-2.5-flash-image-preview» در دسترس است. @OfficialLoganK
گوگل قیمت Veo 3 را بیش از 50% کاهش داد، به طوری که قیمت Veo 3 با صدا از 0.75 دلار به 0.40 دلار و بدون صدا از 0.50 دلار به 0.20 دلار رسید. @arrakis_ai
سایمون ویلیسون Kimi-K2-Instruct-0905 (Kimi K-2.1) را بررسی کرد که یک بهبود تدریجی در مدل با وزن‌های باز (open weights) و تریلیون پارامتری مون‌شات است و طول بافت (context length) آن از 128 هزار به 256 هزار توکن افزایش یافته است. @simonw

تحلیل صنعت

گرگلی اوروس گزارش می‌دهد که 50% از بهترین استخدام‌هایش به عنوان مدیر، فارغ‌التحصیلان جدیدی بودند که بسیار باانگیزه، باهوش و متمرکز کار می‌کردند، که نشان‌دهنده‌ی بازدهی بالای سرمایه‌گذاری (ROI) در استخدام فارغ‌التحصیلان جدید، با وجود قابلیت‌های هوش مصنوعی است. @GergelyOrosz
نیتن لمبرت اشاره می‌کند که 10% از بودجه‌ی تأمین مالی سری F انتروپیک به نویسندگان می‌رسد، به عنوان بخشی از یک تسویه حساب 1.5 میلیارد دلاری، و آن را «عجیب‌ترین یارانه (سوبسید) سرمایه‌گذاری خطرپذیر (VC) زمان ما» می‌نامد. @natolambert
تک‌کرانچ گزارش می‌دهد که نویسندگان تسویه حساب انتروپیک را دریافت نمی‌کنند چون آثارشان به هوش مصنوعی خورانده شده است، بلکه به این دلیل که انتروپیک به جای خرید کتاب‌ها، آن‌ها را به صورت غیرقانونی دانلود کرده است. @TechCrunch
اوپن‌اِی‌آی از گسترش فعالیت‌های خود به یونان خبر داد، از جمله دسترسی به ابزارهای هوش مصنوعی با کیفیت بالا در آموزش متوسطه، به علاوه گواهینامه‌های جدید اوپن‌اِی‌آی و یک پلتفرم شغلی برای کمک به افراد جهت یادگیری مهارت‌های هوش مصنوعی و به کسب‌وکارها برای یافتن کارگران ماهر در حوزه‌ی هوش مصنوعی. @gdb

اخلاق و جامعه

سایمون ویلیسون استدلال می‌کند که تسویه حساب 1.5 میلیارد دلاری کتاب‌های انتروپیک به نفع انتروپیک است، و اشاره می‌کند که به نظر می‌رسد در ایالات متحده، خرید کتاب‌های دست دوم، اسکن آن‌ها و آموزش (مدل‌ها) بر اساس محتوای آن‌ها تحت تغییر «استفاده‌ی منصفانه» قانونی است. @simonw
ریاضیدانانی که در حال بررسی این موضوع هستند که آیا GPT-5 می‌تواند ریاضیات اصیل خلق کند یا خیر، هشدار می‌دهند که «خطر نه تنها از دست دادن اصالت است، بلکه تضعیف خود فرایند ریاضیدان بودن نیز هست.» @deedydas
ان‌ویدیا به دلیل دور شدن از داده‌های باز مورد انتقاد قرار گرفت، با Nemotron-CC-v2 که تحت مجوز محدودکننده‌ای منتشر شد که استفاده‌ی منبع‌باز، ترکیب داده‌ها یا انتشار بنچمارک‌ها را بدون اجازه ممنوع می‌کند. @soldni

کاربردها

گرگ براکمن GPT-5 Pro را «سطح بعدی برای کدنویسی» توصیف می‌کند و کاربردهای پزشکی آن را اینگونه تشریح می‌کند: «گویی بهترین فوق‌تخصص در مراکز تخصصی مانند «مایو کلینیک» این مورد را برای بررسی دریافت کرده است.» @gdb
سایمون ویلیسون GPT-5 Thinking را به طور گسترده با جستجوی بینگ آزمایش می‌کند، و آن را «گابلین پژوهش» خود می‌نامد و اشاره می‌کند که پس از تقریباً سه سال توصیه علیه استفاده از چت‌جی‌پی‌تی برای جستجو، GPT-5 با بینگ اکنون «یک موتور جستجوی فوق‌العاده مفید» است. @simonw
آراویند سرینیواس اعلام کرد که دارندگان سازمانی سهام اکنون به راحتی در Perplexity در دسترس هستند و اطلاعات مربوط به سیاستمداران و معاملات نهانی (اینسایدر تریدینگ) به زودی اضافه خواهد شد. @AravSrinivas
سایمون ویلیسون جستجوی معنایی تصاویر را با استفاده از جاسازی‌های متنی (text embeddings) در مقابل خلاصه‌های LLM بینایی (vision-LLM) تصاویر نشان می‌دهد، و اشاره می‌کند که این روش واقعاً خوب کار می‌کند. @simonw

پژوهش‌ها

پژوهش اوپن‌اِی‌آی نشان می‌دهد که توهمات (hallucinations) کمتر یک مشکل مربوط به خود مدل‌های LLM است و بیشتر یک مسئله‌ی مربوط به آموزش (مدل‌ها) بر روی آزمون‌هایی است که فقط پاسخ‌های صحیح را پاداش می‌دهند، که حدس زدن را به جای گفتن «نمی‌دانم» تشویق می‌کند. @emollick
ایتن مولیک این نظریه را مطرح می‌کند که انتشار o1-preview توسط اوپن‌اِی‌آی از نظر استراتژیک زیر سوال بود، زیرا نمایش قابلیت استدلال باعث شد همه بتوانند فوراً آن را کپی کنند، در حالی که به تعویق انداختن تا o3 و نامیدن آن GPT-5 می‌توانست جهشی حیرت‌انگیزتر باشد. @emollick
نیتن لمبرت گزارش می‌دهد که خوش‌بین است GPT-5 Pro یا Gemini Deep Think باهوش‌ترین مدل‌های موجود عمومی امروز هستند، و توصیه می‌کند که افراد از یکی یا هر دو استفاده کنند. @natolambert
یوجین یان از توسعه‌ی مبتنی بر ارزیابی (EDD) که مشابه توسعه‌ی مبتنی بر آزمون است حمایت می‌کند، و تأکید می‌کند که ارزیابی‌های عمومی مانند «وفاداری» (faithfulness) و «مفید بودن» (helpfulness) کاربردی نیستند – ارزیابی‌ها باید با مشکلات خاص کاربران همسو باشند. @eugeneyan

اخبار هوش مصنوعی در 2025-09-05

مدل‌های جدید هوش مصنوعی

Alibaba مدل Qwen3-Max-Preview را با بیش از ۱ تریلیون پارامتر منتشر کرده است. این شرکت ادعا می‌کند که عملکرد آن قوی‌تر از مدل قبلی خود، Qwen3-235B-A22B-2507، است و اکنون از طریق Qwen Chat و Alibaba Cloud API در دسترس است @Alibaba_Qwen
OpenAI ویژگی «انشعاب گفتگو» (conversation branching) را اعلام کرده است که اکنون در ChatGPT فعال است و به کاربران اجازه می‌دهد مسیرهای گفتگوی متفاوتی را کاوش کنند @gdb
Moonshot AI مدل Kimi K2-Instruct-0905 را با ۳۲ میلیارد پارامتر فعال از مجموع ۱ تریلیون پارامتر منتشر کرده است. این مدل دارای هوش کدنویسی عاملی بهبودیافته (enhanced agentic coding intelligence) و پنجره‌ی متنی ۲۵۶ هزار توکنی (context window) است @AdinaYakup

تحلیل صنعت

OpenAI سال آینده برای اولین بار تراشه‌های اختصاصی خود را خواهد داشت که با همکاری Broadcom و فقط برای استفاده‌ی داخلی طراحی شده‌اند. Broadcom ۱۰ میلیارد دلار سفارش از این مشتری مرموز دریافت کرده است @AndrewCurran_
Anthropic به یک توافق دسته‌جمعی (class action settlement) به ارزش ۱.۵ میلیارد دلار با نویسندگان کتاب بر سر مجموعه‌داده‌های LibGen و PiLiMi دست یافته است. بر اساس این توافق، تقریباً ۳۰۰۰ دلار به ازای هر کتاب پرداخت می‌شود و این بزرگترین بازیابی حق چاپ گزارش‌شده‌ی عمومی در تاریخ است @AndrewCurran_
۳ مورد از ۴ اپلیکیشن برتر بهره‌وری در اپ استور آمریکا، برنامه‌های هوش مصنوعی هستند؛ ۲ مورد از گوگل، ۰.۵ مورد از مایکروسافت، و Perplexity تنها شرکت فناوری کوچک‌تر حاضر در این فهرست است @AravSrinivas
OpenAI در یک معامله‌ی «استخدام-خرید» (acqui-hire) دیگر، تیمی را که پشت Alex Codes بود، خریداری کرد. Alex Codes ابزاری محبوب برای استفاده از مدل‌های هوش مصنوعی در مجموعه‌ی توسعه‌ی Xcode اپل است @TechCrunch
Dot، یک دستیار هوش مصنوعی شخصی‌سازی‌شده، پس از یک سال فعالیت تعطیل می‌شود. تیم توسعه‌دهنده از کاربرانی که روابط نزدیکی با این هوش مصنوعی برقرار کرده بودند، تشکر کرده است @jasonyuandesign
کلر وو گزارش داده است که پس از نزدیک به ۲ سال ساخت ChatPRD، بالاخره به خودش حقوق پرداخت کرده است. او بر ارزش ساخت یک کسب‌وکار سالم و خودگردان (bootstrapped) از روز اول، به جای دنبال کردن استراتژی‌های رشد به هر قیمتی، تأکید کرد @clairevo

اخلاق و جامعه

دادستان‌های کل کالیفرنیا و دلاور نگرانی‌های خود را در مورد ایمنی ChatGPT برای کودکان و نوجوانان به OpenAI ابراز کرده‌اند و بر نظارت نظارتی مستمر بر سیستم‌های هوش مصنوعی تأکید کردند @TechCrunch
Common Sense Media گزارش می‌دهد که Gemini گوگل در اقدامات ایمنی برای کودکان کوتاهی کرده است و نگرانی‌هایی را در مورد مناسب بودن سیستم‌های هوش مصنوعی برای کاربران جوان‌تر ایجاد می‌کند @TechCrunch
وارنر برادرز از Midjourney به دلیل تولید تصاویر هوش مصنوعی از سوپرمن، بتمن و دیگر شخصیت‌های دارای حق چاپ شکایت کرده است و اختلافات جاری مالکیت فکری در محتوای تولیدشده توسط هوش مصنوعی را برجسته می‌کند @TechCrunch

کاربردها

Perplexity صفحات مالی (Finance pages) را با درآمدهای تخمینی آتی برای سهام انفرادی آمریکا راه‌اندازی کرده است و پشتیبانی از سهام هند هفته‌ی آینده ارائه خواهد شد @AravSrinivas
xAI ویژگی‌های تحلیل PDF را در Grok معرفی کرده است که به کاربران اجازه می‌دهد بخش‌هایی را برجسته کنند و توضیحات دریافت کنند یا سوالات خاصی در مورد محتوای سند بپرسند @xai
مایکروسافت با باغ وحش Woodland Park همکاری می‌کند تا SPARROW را آزمایش کند، یک سیستم هوش مصنوعی که داده‌های حیات وحش را مستقیماً به فضای ابری ارسال می‌کند تا سمورهای آبی اقیانوس آرام آسیب‌پذیر (Pacific martens) مورد مطالعه قرار گیرند @Microsoft
Figma Make اکنون برای همه‌ی حساب‌های آموزش عالی و آموزشی بوت‌کمپ در دسترس است و دسترسی به ابزارهای طراحی مبتنی بر هوش مصنوعی را گسترش می‌دهد @figma
Isotopes یک عامل تحلیلی پیشرفته (sophisticated analytics agent) را راه‌اندازی کرده است که توسط آرون مورتی، یکی از بنیان‌گذاران Hadoop که بعدها به Scale AI پیوست، هم‌بنیان‌گذاری شده است @TechCrunch
Sierra، یک استارتاپ عامل هوش مصنوعی برای خدمات مشتری، ادعا می‌کند که صدها مشتری از جمله SoFi، Ramp و Brex دارد @TechCrunch

پژوهش‌ها

OpenAI پژوهشی را منتشر کرده است که توضیح می‌دهد چرا مدل‌های زبان بزرگ (LLM) از طریق ارتباطی بین یادگیری نظارت‌شده و خودنظارت‌شده «توهم» (hallucination) دارند و موانع کلیدی را توصیف می‌کند که می‌توانند برای کاهش توهمات برداشته شوند @adamfungi
خبرنامه‌ی Deep Learning Focus از کامرون ولف به ۵۰,۰۰۰ مشترک رسیده است. این خبرنامه موضوعات فنی کلیدی از جمله مدل‌های استدلالی، عامل‌های هوش مصنوعی، معماری‌های «ترکیب متخصصان» (mixture-of-experts) و تکنیک‌های ارزیابی «LLM-as-a-Judge» را برجسته می‌کند @cwolferesearch
Hugging Face مجموعه‌داده‌ی FineVision را منتشر کرده است که به عنوان بهترین مجموعه‌داده‌ی باز و رایگان برای آموزش مدل‌های زبان بینایی توصیف می‌شود. این مجموعه‌داده شامل ۲۰۰ مجموعه‌ی آموزشی است که به ۱۸ میلیارد تصویر در ۹ زیرشاخه فشرده شده‌اند @ClementDelangue
PyTorch در حال بررسی FlashAttention در بُعد سه‌بعدی از طریق 2-Simplicial Attention است و این الگوریتم را با طراحی هم‌تراز با سخت‌افزار مدل‌سازی می‌کند و کرنل‌ها را در TLX (Triton Low Level Extensions) بازنویسی می‌کند @PyTorch
آرویند نارایانان پدیده‌ی «قله‌ی دروغین» (false summit) را در توسعه‌ی هوش مصنوعی مورد بحث قرار می‌دهد؛ جایی که نقاط عطف درک‌شده بارها ثابت می‌شوند که مراحل میانی هستند نه دستاوردهای نهایی، که منجر به اتهاماتی می‌شود مبنی بر اینکه شکاکان پیوسته «استانداردها را تغییر می‌دهند» (moving the goalposts) @random_walker

اخبار هوش مصنوعی در 2025-09-04

مدل‌های جدید هوش مصنوعی

گوگل مدل جاسازی باز جدیدی به نام EmbeddingGemma را با ۳۰۸ میلیون پارامتر منتشر کرد که در بنچمارک MTEB به عملکرد پیشرو (State-of-the-art) دست می‌یابد، در حالی که آن‌قدر کوچک است که به‌طور کامل روی دستگاه اجرا شود. @sundarpichai
پرپلکسیتی (Perplexity) اعلام کرد که Comet اکنون برای پیش‌سفارش در پلی استور اندروید و برای کاربران نسخه حرفه‌ای (Pro) در کره‌جنوبی، برزیل و اسپانیا در دسترس است. @AravSrinivas
گوگل ادغام Veo 3 را در قابلیت تبدیل عکس به ویدیو‌ی Google Photos اعلام کرد، که قابلیت‌های تولید ویدیو را ارتقا می‌دهد. @TechCrunch
جینا اِی‌آی (Jina AI) «jina-code-embeddings» را منتشر کرد، مجموعه‌ای جدید از مدل‌های جاسازی کد با اندازه‌های ۰.۵ میلیارد و ۱.۵ میلیارد پارامتر با عملکرد بازیابی پیشرو (SOTA) که از بیش از ۱۵ زبان برنامه‌نویسی پشتیبانی می‌کند. @JinaAI_

تحلیل صنعت

اندرو ان‌جی (Andrew Ng) تقاضای برآورده‌نشده‌ی قابل‌توجهی را برای مهندسان هوش مصنوعی شناسایی کرده که می‌توانند با کمک هوش مصنوعی، سیستم‌های نرم‌افزاری را به سرعت مهندسی کنند، در حالی که فارغ‌التحصیلان اخیر علوم کامپیوتر به دلیل عدم انطباق برنامه‌های درسی دانشگاه‌ها با برنامه‌نویسی مبتنی بر هوش مصنوعی (AI-native programming)، با افزایش بیکاری مواجه شده‌اند. @AndrewYNg
رید هافمن (Reid Hoffman) درباره‌ی مطالعه‌ی استنفورد بحث می‌کند که نشان‌دهنده‌ی کاهش ۱۶ درصدی در مشاغل سطح ورودی برای افراد ۲۲ تا ۲۵ ساله در زمینه‌های مرتبط با هوش مصنوعی است و بر نیاز به مسیرهای شغلی جدید در عصر هوش مصنوعی تاکید می‌کند. @reidhoffman
گرگلی اوروس (Gergely Orosz) از دستور مدیرعامل کوین‌بیس (Coinbase) برای افزایش درصد تولید کد با هوش مصنوعی انتقاد می‌کند، با این استدلال که این دستور بر معیارهای استفاده از ابزارها تمرکز دارد تا بر نتایج تجاری مانند رضایت مشتری یا قابلیت اطمینان محصول. @GergelyOrosz
مصطفی سلیمان (Mustafa Suleyman) تاکید می‌کند که مدل‌های پیشرو هوش مصنوعی اکنون ۹۰٪ ارزان‌تر اما ۲.۷ برابر بهتر از دو سال پیش هستند و بر جهش رو به جلو در دسترسی‌پذیری تاکید می‌کند. @mustafasuleyman
دیدی (Deedy) گزارش می‌دهد که بر اساس مطالعه‌ی MIT، ۹۵٪ از پروژه‌های آزمایشی (پایلوت) هوش مصنوعی مولد (Gen AI) شکست نمی‌خورند، که با روایت‌های رایج درباره‌ی نرخ شکست پروژه‌های هوش مصنوعی در تضاد است. @deedydas
لنی راچیتسکی (Lenny Rachitsky) ارزیابی‌ها (evals) را به عنوان یک مهارت ضروری و نوظهور برای سازندگان محصول و شرکت‌های هوش مصنوعی شناسایی می‌کند و آن را با SQL و Excel به عنوان صلاحیت‌های اساسی مقایسه می‌کند. @lennysan
سم آلتمن (Sam Altman) گزارش می‌دهد که میزان استفاده از Codex طی دو هفته‌ی گذشته ۱۰ برابر افزایش یافته است، که نشان‌دهنده‌ی شتاب قابل‌توجهی برای ابزارهای کدنویسی هوش مصنوعی است. @sama
آراویند سرینیواس (Aravind Srinivas) اعلام کرد که بیش از یک میلیون نفر در یک صبح به Comet دسترسی پیدا کردند و آن را پرکاربردترین محصول شخصی و عاملیت‌محور در جهان نامید. @AravSrinivas

اخلاق و جامعه

سم آلتمن (Sam Altman) شاهد افزایش شیوع حساب‌های توییتر تحت مدیریت مدل‌های زبان بزرگ (LLM) است و اشاره می‌کند که تئوری «اینترنت مرده» را جدی‌تر می‌گیرد. @sama
مایکروسافت ریسرچ (Microsoft Research) «Sui Generis score» را برای اندازه‌گیری تنوع روایی در خروجی‌های LLM معرفی می‌کند و نشان می‌دهد که چگونه روایت‌گری هوش مصنوعی اغلب روایت‌های تکراری و کم‌تر منحصربه‌فردی ایجاد می‌کند. @MSFTResearch

کاربردها

ریبرا (Ribera)، یک شرکت مراقبت‌های بهداشتی اسپانیایی، از هوش مصنوعی برای بهبود سیستم‌های ترخیص بیماران جراحی آب‌مروارید استفاده می‌کند. @Microsoft
اوپن‌اِی‌آی (OpenAI) قابلیت «انشعاب مکالمه (conversation branching)» را در ChatGPT راه‌اندازی می‌کند که به کاربران امکان می‌دهد مسیرهای مختلف را بدون از دست دادن رشته‌ی اصلی (مکالمه) بررسی کنند. @OpenAI
گوگل قابلیت ترجمه‌ی Circle to Search را معرفی می‌کند و قابلیت‌های ویرایش تصویر برنامه Gemini را ارتقا می‌دهد. @TechCrunch
پایگاه‌های داده Notion اکنون از قابلیت‌های مبتنی بر هوش مصنوعی برای پردازش و تحلیل داده‌های پیشرفته پشتیبانی می‌کنند. @brian_lovin
تک‌کرانچ (TechCrunch) گزارش می‌دهد که پلتفرم مشاغل OpenAI قرار است در اواسط سال ۲۰۲۶ راه‌اندازی شود و از هوش مصنوعی برای تطبیق نامزدها با کسب‌وکارها استفاده می‌کند. @TechCrunch
Supersonik AI به عنوان اولین هوش مصنوعی که می‌تواند دموهای زنده‌ی محصول را اجرا کند، راه‌اندازی شد و با رهبری a16z، پنج میلیون دلار سرمایه جذب کرد. @danipolymath

پژوهش‌ها

ایتان مولیک (Ethan Mollick) یافته‌های پژوهشی را به اشتراک می‌گذارد که نشان می‌دهد قابلیت‌های «تئوری ذهن» (Theory of Mind) مدل‌های زبان بزرگ (LLM) تنها از ۰.۰۰۱٪ پارامترهای آن‌ها ناشی می‌شود و شکستن این وزن‌های خاص منجر به از دست دادن هم ردیابی باور و هم درک زبان می‌شود. @emollick
گوگل دیپ‌مایند (Google DeepMind) روش «Deep Loop Shaping» را در مجله‌ی Science منتشر کرد که نویز را در رصدخانه‌های موج گرانشی LIGO تا ۱۰ برابر یا بیشتر کاهش می‌دهد و به شناسایی ادغام سیاه‌چاله‌ها کمک می‌کند. @GoogleDeepMind
پژوهشگران استنفورد «Mixture of Contexts» را برای تولید ویدیوهای یک دقیقه‌ای در یک مرحله و بدون انحراف یا فراموش کردن بستر (context) تاریخی معرفی کردند. @GordonWetzstein
یک مقاله‌ی پژوهشی نشان می‌دهد که عامل‌های هوش مصنوعی (AI agents) می‌توانند برای آزمایش‌های علوم اجتماعی استفاده شوند، زمانی که پرامپت‌ها بر اساس علوم اجتماعی و نظریه‌ی بازی توسعه یابند و اقدامات عامل‌های هوش مصنوعی را پیش‌بینی‌کننده‌ی نتایج واقعی انسان می‌کند. @emollick
مطالعه‌ی جدیدی قابلیت‌های وب‌گردی عامل‌های هوش مصنوعی (AI agents) را با استفاده از بنچمارک Online Mind2Web ارزیابی می‌کند، و ۹ مدل از جمله GPT-5 و Sonnet 4 را با ساختارهای عاملیت متفاوت آزمایش می‌کند. @sayashk
یک مقاله‌ی پژوهشی روش‌های ارزیابی شناسایی توهم (hallucination detection) در LLM‌ها را به چالش می‌کشد و مشکلات قابل‌توجهی را در شیوه‌های رایج این حوزه شناسایی می‌کند. @ziv_ravid
هاگینگ فیس (Hugging Face) «FineVision» را منتشر کرد، یک مجموعه‌داده‌ی (dataset) متن‌باز عظیم با ۱۷.۳ میلیون تصویر و ۲۴.۳ میلیون نمونه برای آموزش مدل‌های بینایی-زبان (Vision-Language Models). @thibaudfrere

اخبار هوش مصنوعی در 2025-09-03

مدل‌های جدید هوش مصنوعی

Perplexity مرورگر Comet را برای همه‌ی دانشجویان در سراسر جهان عرضه می‌کند، که شامل دستیار هوش مصنوعی، فلش کارت، مسدودکننده‌ی تبلیغات و حالت مطالعه می‌شود. @perplexity_ai
OpenAI قابلیت «پروژه‌ها» (Projects) را برای کاربران رایگان در ChatGPT در دسترس قرار می‌دهد، با امکان بارگذاری فایل‌های بزرگتر، گزینه‌های سفارشی‌سازی و کنترل‌های حافظه‌ی مخصوص پروژه. @OpenAI
گوگل فرمت‌های جدید «Audio Overview» را در NotebookLM معرفی می‌کند که به کاربران امکان می‌دهد بین سبک‌های «Deep Dive» (بررسی عمیق)، «Brief» (خلاصه)، «Critique» (نقد) یا «Debate» (مناظره) برای پادکست‌های تولیدشده توسط هوش مصنوعی انتخاب کنند. @TechCrunch

تحلیل صنعت

یک مدیر مهندسی در هنگام خواندن متون تولیدشده توسط هوش مصنوعی، کاهش سریع علاقه را مشاهده می‌کند و درخواست می‌کند که یا از هوش مصنوعی استفاده نشود یا فقط پرامپت‌ها (دستورات) ارائه شوند تا از «جملات بی‌معنی» در بررسی‌های عملکرد جلوگیری شود. @GergelyOrosz
۱۲ مورد از ۵۰ اپلیکیشن برتر هوش مصنوعی مولد در سراسر جهان، همدم‌های هوش مصنوعی و اپلیکیشن‌های گفت‌و‌گوی «خاص» (spicy) هستند که نشان‌دهنده‌ی تقاضای قابل توجهی در بازار برای هوش مصنوعی مکالمه‌محور است. @deedydas
پذیرش هوش مصنوعی در کدنویسی تا دسامبر ۲۰۲۴ به بیش از ۳۰ درصد با تأثیر زیاد می‌رسد، اگرچه از پیش‌بینی‌های ۹۰ درصدی تا به امروز کمتر است. @emollick
محصولات هوش مصنوعی متمرکز بر توسعه‌دهندگان اکنون در میزان استفاده با محصولات مصرف‌کننده رقابت می‌کنند، به طوری که ابزارهایی مانند Replit، Cursor و دیگران در رتبه‌های برتر قرار می‌گیرند و «کدنویسی با حس و حال» (vibe coding) بازار را گسترش می‌دهد. @omooretweets
رقابت بازار هوش مصنوعی بیشتر بر جذب استعدادها تمرکز دارد تا جذب مشتری، با نبردهای شدید بر سر تعداد کمی از افرادی که می‌دانند چگونه سیستم‌های هوش مصنوعی بسازند. @a16z

اخلاق و جامعه

مصطفی سلیمان معتقد است که شخصیت هوش مصنوعی مشکل نیست، بلکه توهم انسان‌بودگی هوش مصنوعی است که انتظارات نگران‌کننده‌ای ایجاد می‌کند. @mustafasuleyman
اتان مولیک در مورد کم‌اهمیت جلوه دادن عمدی قابلیت‌های هوش مصنوعی هشدار می‌دهد و استدلال می‌کند که انتخاب گزینشی خطاها، مردم را در مورد تأثیر واقعی هوش مصنوعی بر مشاغل، آموزش و جامعه گمراه می‌کند. @emollick
پژوهش‌ها نشان می‌دهد که تکنیک‌های اقناعی که بر انسان‌ها مؤثر هستند، بر سیستم‌های هوش مصنوعی نیز عمل می‌کنند و سؤالاتی را در مورد دستکاری هوش مصنوعی و تصمیم‌گیری آن مطرح می‌کند. @danshapiro

کاربردها

مرورگر «Comet» پرپلکسیتی اکنون قابلیت تعامل با صفحات وب با کنترل صوتی را ارائه می‌دهد، که تجربه‌های هوش مصنوعی آینده‌نگرانه‌ای را برای مرور و کنترل امکان‌پذیر می‌سازد. @testingcatalog
مدل‌های تولید تصویر هوش مصنوعی در رنگ‌آمیزی مانگاهای سنتی سیاه‌وسفید عالی عمل می‌کنند، به طوری که گوگل Gemini پردازش سریع و ۱۰۰٪ حفظ تصویر را نشان می‌دهد. @deedydas
اپلیکیشن گوگل Gemini «روش کلاژ» را معرفی می‌کند که به کاربران امکان می‌دهد چندین تصویر را آپلود کرده و آن‌ها را با یک پرامپت (دستور) واحد برای سفارشی‌سازی لباس، برنامه‌ریزی غذا و پروژه‌های خلاقانه ترکیب کنند. @GeminiApp
هوش مصنوعی تسلا ناوبری خودران وسایل نقلیه‌ی تازه‌تولیدشده را در محوطه‌ی کارخانه، شامل توقف در سوپرشارژرها و پارک کردن در پارکینگ‌های خروجی، به نمایش می‌گذارد. @Tesla_AI
HubSpot تولید تصویر را در پلتفرم خود با استفاده از Stable Diffusion 3.5 Large بر روی Amazon Bedrock برای ایجاد محتوای مطابق با برند، ۱۵۰ درصد افزایش می‌دهد. @StabilityAI
کاربری نحوه‌ی استفاده از ارائه‌دهنده‌ی پایگاه داده MCP را برای پرس‌وجوی مستقیم داده‌های Segment، ساخت تحلیل قیفی و تولید خلاصه‌ی اجرایی با هوش مصنوعی، جایگزین کردن ابزارهای تحلیلی سنتی، نشان می‌دهد. @clairevo

پژوهش‌ها

مایکروسافت ریسرچ کار پیشگامانه‌ای را در مورد کامپیوتر نوری آنالوگ در مجله‌ی Nature منتشر می‌کند، که راه‌حل‌هایی ۱۰۰ برابر سریع‌تر و با مصرف انرژی بهینه‌تر برای مسائل پیچیده‌ی بهینه‌سازی را نشان می‌دهد. @satyanadella
گزارش مک‌کینزی از سال ۲۰۱۷ نشان می‌دهد که متخصصان هوش مصنوعی پیش‌بینی کرده بودند که میانگین خلاقیت انسانی در سال ۲۰۳۷ حاصل خواهد شد، اما در واقع در سال ۲۰۲۳ به آن دست یافته شد، و خلاقیت سه‌چهارم برتر که برای سال ۲۰۵۵ پیش‌بینی شده بود نیز اکنون به اتمام رسیده است. @emollick
PyTorch با استفاده از پیاده‌سازی MXFP8 در TorchAO بر روی TorchTitan در مقیاس 2K روی GPU‌های Crusoe B200، شتاب ۱.۲۲ تا ۱.۲۸ برابری را با همگرایی معادل BF16 نشان می‌دهد. @PyTorch
استانفورد AHELM را منتشر می‌کند – یک چارچوب ارزیابی جامع برای مدل‌های صوتی-زبانی در ۱۰ جنبه، همراه با جدول رده‌بندی و بنچمارکینگ (معیارسنجی) فراگیر. @tonyh_lee
تیم پژوهشی Hugging Face یک جلسه‌ی پرسش و پاسخ (AMA) آتی را در r/LocalLLaMA اعلام می‌کند که توسعه‌ی SmolLM، SmolVLM، FineWeb و همکاری تیم از راه دور در پژوهش‌های پرشتاب هوش مصنوعی را پوشش می‌دهد. @LoubnaBenAllal1

اخبار هوش مصنوعی در 2025-09-02

مدل‌های جدید هوش مصنوعی

آنتروپیک سرمایه‌ی سری F به مبلغ ۱۳ میلیارد دلار را با ارزش‌گذاری ۱۸۳ میلیارد دلار جذب کرد و در عرض فقط هشت ماه، درآمد سالانه‌ی خود را از ۱ میلیارد دلار به ۵ میلیارد دلار رساند و بدین‌ترتیب آن را به یکی از سریع‌ترین شرکت‌های فناوری در حال رشد در تاریخ تبدیل کرده است @AnthropicAI
مایکروسافت اعلام کرد که GPT-5 از روز اول برای ۱۰۰٪ کاربران Copilot در دسترس است؛ این قابلیت همراه با ویژگی‌های جدیدی از جمله Copilot 3D و دسترسی رایگان جهانی به Deep Research ارائه می‌شود @mustafasuleyman

تحلیل صنعت

OpenAI استتسیگ (Statsig) را به مبلغ ۱.۱ میلیارد دلار خریداری کرد و ویجای راجی را به‌عنوان مدیر ارشد فناوری (CTO) بخش Applications منصوب کرد. همچنین سرینیواس نارایانان به سِمت مدیر ارشد فناوری (CTO) بخش B2B Applications ارتقا یافت و کوین وایل ریاست تیم جدید معاونت هوش مصنوعی برای علوم (VP of AI for Science) را بر عهده گرفت @OpenAI
مایکروسافت با اداره‌ی خدمات عمومی ایالات متحده (U.S. General Services Administration) به توافق جدیدی دست یافت که شامل ارائه‌ی رایگان Microsoft 365 Copilot است. انتظار می‌رود این توافق در سال اول بیش از ۳ میلیارد دلار صرفه‌جویی کلی برای مالیات‌دهندگان به ارمغان آورد @satyanadella
پژوهش‌ها نشان می‌دهد که ۵۲٪ از شرکت‌های مالی اکنون از هوش مصنوعی مولد برای تشخیص تقلب، ایجاد تجربه‌های شخصی‌سازی‌شده و ارزیابی کارآمد استفاده می‌کنند؛ که این امر صنعت مالی را فراتر از صرفه‌جویی در هزینه‌ها متحول کرده است @NVIDIAAI
میانگین مدت همکاری در متا (Meta) از زمان تعدیل نیروی سال ۲۰۲۳، از ۲ سال به ۴ سال افزایش یافته است؛ همچنین تغییرات مشابهی در سراسر شرکت‌های بزرگ فناوری (Big Tech) مشاهده می‌شود که نشان می‌دهد کارکنان به‌دلیل شرایط بازار مانند گذشته شرکت را ترک نمی‌کنند @GergelyOrosz
پژوهش‌های جدید تأیید می‌کند که پیشرفت هوش مصنوعی بسیار جلوتر از پیش‌بینی‌های کارشناسان در سال ۲۰۲۲ است. در حالی که پیش‌بینی‌کنندگان برتر، تنها ۲.۳٪ و ۸.۶٪ احتمال می‌دادند که هوش مصنوعی تا سال ۲۰۲۵ به مدال طلای المپیاد ریاضی دست یابد، این موفقیت قبلاً حاصل شده است @emollick

اخلاق و جامعه

OpenAI از برنامه‌های خود برای هدایت مکالمات حساس به مدل‌های استدلالی مانند GPT-5 و پیاده‌سازی کنترل‌های والدین در عرض یک ماه خبر داد. این اقدام در پاسخ به حوادث ایمنی انجام می‌شود که در آن‌ها ChatGPT نتوانست پریشانی روانی را تشخیص دهد @TechCrunch
ام‌آی‌تی تکنولوژی ریویو (MIT Technology Review) گزارش می‌دهد که درمانگران مخفیانه از ChatGPT برای جلسات درمانی با مراجعان استفاده می‌کنند؛ که این امر باعث شده برخی از مراجعان به‌دلیل کمکِ هوش مصنوعیِ افشا‌نشده، احساس ناخوشایندی داشته باشند @techreview
سازمان «هوش مصنوعی برای بشریت» (AI for Humanity) موضع خود را در مورد مقررات‌گذاری هوش مصنوعی تغییر داد و بیان کرد که «محدود کردن دسترسی به فناوری‌های چندمنظوره، پاسخی پایدار به شواهد کم‌اعتبار از خطرات جدی نیست.» @natolambert

کاربردها

اکسل قابلیت جدیدی به نام COPILOT function را معرفی کرد که امکان دسته‌بندی و تحلیل با هوش مصنوعی را مستقیماً در سلول‌های صفحات گسترده فراهم می‌کند. این رویکرد، در مقایسه با قابلیت‌های ویرایش کل صفحات گسترده‌ی ChatGPT Agent، روشی متفاوت برای ادغام هوش مصنوعی است @emollick
میسترال اِی‌آی (Mistral AI) Le Chat را راه‌اندازی کرد؛ این ابزار با قابلیت‌های حافظه‌ای که از تعاملات گذشته یاد می‌گیرند و بیش از ۲۰ رابط آماده‌ی استفاده ارائه می‌شود. این شرکت، Le Chat را به‌عنوان آماده‌ترین دستیار هوش مصنوعی برای شرکت‌ها (Enterprise-ready) معرفی می‌کند @MistralAI
لینیر (Linear) قابلیت Agent Sessions را با APIهای چرخه‌ی عمر (lifecycle APIs) ادغام می‌کند و امکان انتقال یکپارچه بین عامل‌ها (agent-to-agent handoffs) را فراهم می‌سازد. در این رویکرد، عامل‌های هوش مصنوعی می‌توانند توضیحات را به‌روزرسانی کنند، زیرمسائل ایجاد کنند و کمک‌های مدیریت پروژه (PM) ارائه دهند @clairevo
اپلیکیشن گوگل جِیمینای (Google Gemini App) قابلیت nano-banana را معرفی کرد. این قابلیت به کاربران امکان می‌دهد با یک دستور متنی (prompt)، تصاویر به سبک مجسمه (figurine-style) از عکس‌ها ایجاد کنند و قابلیت‌های پیشرفته‌ی تولید تصویر را به نمایش می‌گذارد @GeminiApp
وردپرس (WordPress) ابزار جدید هوش مصنوعی Telex را معرفی کرد که ابزاری برای تولید و مدیریت محتوا است. این ابزار در کنار دیگر آزمایش‌های هوش مصنوعی در WordCamp US 2025 رونمایی شد @TechCrunch
آمازون Lens Live را راه‌اندازی کرد؛ این یک مؤلفه‌ی جستجوی بصری بی‌درنگ است که قابلیت پخش زنده را برای کشف محصول به Amazon Lens اضافه می‌کند @TechCrunch

پژوهش‌ها

استنفورد اولین چالش BEHAVIOR را در کنفرانس NeurIPS 2025 اعلام کرد. این چالش شامل ۵۰ وظیفه‌ی دستکاری متحرک با افق زمانی بلند است که با ۱۲۰۰ ساعت نمایش باکیفیت ارائه می‌شود تا راه‌حل‌های هوش مصنوعی تجسم‌یافته (embodied AI) و رباتیک را ارزیابی کند @drfeifei
کگل (Kaggle) از برگزاری یک دوره‌ی فشرده‌ی ۵ روزه‌ی هوش مصنوعی درباره‌ی Agentهای هوش مصنوعی با همکاری گوگل خبر داد که برای ۱۰ تا ۱۴ نوامبر برنامه‌ریزی شده است و تجربه‌ی عملی در ساخت و استقرار Agentهای هوش مصنوعی نسل بعدی را ارائه می‌دهد @kaggle
پژوهش‌ها توضیح می‌دهد که gpt-realtime ترکیبی از داده‌های خاص خود را دارد که باعث می‌شود نه دقیقاً GPT-4o باشد و نه GPT-5، و دارای تاریخ قطع دانش (knowledge cutoff) ۱ اکتبر ۲۰۲۳ است @simonw
تیم پژوهشی هاگینگ فیس (Hugging Face) برگزاری جلسه «هر چه می‌خواهی بپرس» (AMA) را در r/LocalLLaMA اعلام کرد تا درباره‌ی کارهای پشت پرده‌ی SmolLM، FineWeb و انتشار احتمالی محصولات جدید بحث و تبادل نظر کند @huggingface

1 2 3 4 5...26