اخبار هوش مصنوعی در 2025-06-08

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی (OpenAI) به‌روزرسانی‌هایی را برای «Advanced Voice Mode» برای همه‌ی کاربران پولی منتشر کرد که شامل الگوهای گفتاری شبیه‌تر به انسان با لکنت‌های عمدی، خنده‌های عصبی و تغییرات صوتی است. @AndrewCurran_
  • اوپن‌ای‌آی (OpenAI) برای ماه‌ها در حال آزمایش نسخه‌های مختلفی از قابلیت‌های تفکر 4o بوده است؛ به‌طوری که برخی کاربران استدلال‌های خودبه‌خودی و فراخوانی‌های احتمالی به مدل‌های دیگری مانند o3 را تجربه کرده‌اند. @AndrewCurran_
  • پرپلکسیتی (Perplexity) از نسخه‌ی به‌روز شده‌ی «Deep Research» با استفاده از زیرساخت جدید بک‌اند (backend) خبر داد که در حال حاضر با ۲۰ درصد از کاربران در حال آزمایش است. @AravSrinivas
  • کووِن (Qwen) مدل جدید جاسازی (embedding) «Apache 2» با وزن‌های باز (open-weights) و بهترین عملکرد را منتشر کرد. @simonw
  • الوترای (EleutherAI) دو مدل زبان بزرگ (LLM) جدید را منتشر کرد که کاملاً با استفاده از متون دامنه‌ی عمومی یا دارای مجوز آزاد آموزش دیده‌اند؛ مدل ۲T با موفقیت به MLX منتقل شده تا برای استفاده‌ی محلی روی مک (Mac) قابل دسترس باشد. @simonw

تحلیل صنعت

  • گزارش شده که متا (Meta) در حال مذاکره با «Scale AI» برای سرمایه‌گذاری بیش از ۱۰ میلیارد دلار است؛ این اقدام نشان‌دهنده‌ی سرمایه‌گذاری عمده در زیرساخت هوش مصنوعی است. @AndrewCurran_
  • تغییرات کد مالیاتی «Section 174» از سال ۲۰۱۷، حقوق مهندسان را از کسر مالیاتی فوری به هزینه‌های قابل استهلاک ۵ ساله تبدیل کرد؛ این امر به اخراج حدود ۵۰۰ هزار نفر در صنعت فناوری و میلیاردها دلار صورت‌حساب مالیاتی اضافی برای شرکت‌هایی مانند مایکروسافت (۴.۸ میلیارد دلار)، متا، آمازون و گوگل منجر شد. @deedydas
  • شرکت‌ها به‌طور فزاینده‌ای محصولات کدنویسی هوش مصنوعی پیشرفته را ارزیابی می‌کنند، اما اغلب به‌دلیل هزینه‌ی آن‌ها در مقایسه با قیمت پایه‌ی ۱۰ تا ۲۰ دلاری در ماه «GitHub Copilot»، آن‌ها را رد می‌کنند و بسیاری از آن‌ها ترجیح می‌دهند راه‌حل‌های سفارشی خود را بسازند. @GergelyOrosz
  • کورسر (Cursor) با حجم عظیم زیرساختی (بیش از ۱ میلیون درخواست در ثانیه (QPS) برای پایگاه داده‌ی خود) و بدون تیم زیرساخت اختصاصی کار می‌کند که نشان می‌دهد چگونه ارائه‌دهندگان خدمات ابری و استارتاپ‌ها امکان عملیات چابک و کم‌هزینه را فراهم می‌کنند. @GergelyOrosz
  • انتقال از «pickles» به «safetensors» نشان‌دهنده‌ی پیشرفت عملی قابل توجهی در ایمنی هوش مصنوعی است، اگرچه کمتر از بحث‌های نظری درباره‌ی ایمنی هوش مصنوعی مورد توجه قرار می‌گیرد. @ClementDelangue

اخلاق و جامعه

  • دادگاه بریتانیا هشدار داد که وکلای دادگستری ممکن است به‌دلیل استفاده از استنادات جعلی تولیدشده با هوش مصنوعی، با مجازات‌های سنگین مواجه شوند؛ این موضوع مشکلات مسئولیت‌پذیری حقوقی محتوای تولیدشده توسط هوش مصنوعی را برجسته می‌کند. @TechCrunch
  • جفری هینتون درباره‌ی یک کتاب کلاهبرداری با عنوان «Modern AI Revolution» که به‌دروغ در آمازون (Amazon) به او نسبت داده شده است، هشدار داد و خواستار حذف آن شد. @geoffreyhinton
  • بحثی درباره‌ی ماهیت بنیادین سیستم‌های هوش مصنوعی به‌عنوان ذهن و نه ابزار در حال شکل‌گیری است که این پرسش را مطرح می‌کند: آیا ما شجاعت تشخیص عاملیت در اشکالی که خود خلق کرده‌ایم را داریم یا خیر؟ @jasonyuandesign

کاربردها

  • جن‌اسپارک (Genspark) ایجاد اسلایدشو با هوش مصنوعی را به نمایش گذاشت که ارائه‌های مفصل با نمودارها و دیاگرام‌ها را با تم گوگل (Google) تولید می‌کند؛ این کار از کتابخانه‌ی «matplotlib» پایتون (Python) برای گرافیک استفاده کرده و آن‌ها را به وب‌سایت‌های HTML افقی تبدیل می‌کند. @deedydas
  • پرپلکسیتی (Perplexity) داده‌های مالی «EDGAR» را برای افزایش قابلیت‌های مالی خود یکپارچه کرد که این امکان به کاربران می‌دهد تا مشکلات را گزارش کرده و بازخورد ارائه دهند. @AravSrinivas
  • MLX-LM با موفقیت به‌صورت محلی با «MCP» با استفاده از «tiny-agents» هاگینگ فیس (Hugging Face) اجرا می‌شود که این امر استقرار موثر هوش مصنوعی محلی را با مدل «Qwen3 4B» به نمایش می‌گذارد. @awnihannun
  • تیم‌های مهندسی باید عوامل کدنویسی هوش مصنوعی را به‌عنوان مربیان ارتباطات داخلی و نگارش فنی بپذیرند. @clairevo

پژوهش‌ها

  • پژوهش جدید نشان می‌دهد که دستورات ساده‌ی «Chain-of-Thought» به مدل‌های زبان بزرگ (LLM) پیشرفته‌ی اخیر برای عملکرد بهتر در وظایف کمک نمی‌کنند، حتی با وجود افزایش هزینه‌ها؛ این یافته شیوه‌های رایج مهندسی دستور (prompt engineering) را به چالش می‌کشد. @emollick
  • تحلیل معیار «برج هانوی» (Tower of Hanoi) محدودیت‌های بنیادین در مدل‌های استدلالی را به‌دلیل محدودیت‌های توکن خروجی آشکار می‌کند: DeepSeek R1 به ۱۲ دیسک، Sonnet 3.7 و o3-mini به ۱۳ دیسک محدود هستند و مدل‌ها در استدلال درباره‌ی مسائل بیش از ۷ دیسک ناتوان‌اند. @scaling01
  • مرکز پژوهش هوش مصنوعی برکلی (Berkeley AI Research) تکنیک «Improved Immiscible Diffusion» را برای تسریع آموزش دیفیوژن (diffusion training) با کاهش مشکلات امتزاج‌ناپذیری (miscibility problems) معرفی کرد؛ این تکنیک با پیاده‌سازی کارآمد KNN همراه است که روی مدل‌های پایه‌ی متنوعی کار می‌کند. @Yiheng_Li_Cal
  • فرانسوا شوله (François Chollet) استدلال می‌کند که بین تطبیق الگو (pattern matching) و قابلیت‌های استدلال یک شکاف بنیادی وجود دارد؛ او بیان می‌کند که تطبیق الگو نمی‌تواند منجر به کسب مهارت خودکار در حوزه‌های جدید شود. @fchollet
  • ایتان مولیک (Ethan Mollick) معتقد است روایت «مدل‌های زبان بزرگ (LLM) به دیوار خورده‌اند» که پیرامون مقاله‌ی اپل (Apple) درباره‌ی محدودیت‌های استدلال مطرح شده، زودرس به نظر می‌رسد؛ او این موضوع را با نگرانی‌های مربوط به فروپاشی مدل (model collapse) مقایسه می‌کند که به سرعت برطرف شدند. @emollick

اخبار هوش مصنوعی در 2025-06-07

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی مدل به‌روز شده‌ی Advanced Voice را با قابلیت‌های مکالمه‌ی طبیعی‌تر و ویژگی‌های ترجمه‌ی بهبودیافته عرضه کرد که اکنون برای همه‌ی کاربران پولی ChatGPT در دسترس است @OpenAI
  • گوگل به‌روزرسانی Gemini 2.5 Pro را اعلام کرد که اکنون در AI Studio، Vertex و برنامه‌ی Gemini به‌صورت پیش‌نمایش در دسترس است و کاربران طرح Pro، محدودیت‌های درخواست خود را از ۵۰ به ۱۰۰ در روز، دو برابر کرده‌اند @sundarpichai

تحلیل صنعت

  • یک شرکت غیرفناوری Fortune 500، توسعه‌دهندگان خود را از خرید ابزارهای محبوب کدنویسی هوش مصنوعی مانند Cursor، Windsurf و GitHub Copilot منع کرده و به‌جای آن، با وجود نتایج احتمالی پایین‌تر، برای فرصت‌های ارتقاء شغلی، جایگزین‌های داخلی می‌سازد @GergelyOrosz
  • پل گراهام مشاهده می‌کند که هوش مصنوعی در حال افزایش تنوع در بازده کاری است، به‌طوری که برنامه‌نویسان متوسط برای استخدام شدن با مشکل مواجه‌اند، در حالی که برنامه‌نویسان عالی بیش از همیشه درآمد کسب می‌کنند؛ این روند فناوری از عصر حجر ادامه داشته است @paulg
  • Amplitude از انرژی فوق‌العاده‌ای در طول هفته‌ی هوش مصنوعی خود گزارش می‌دهد که در آن هر مهندس، مدیر محصول و طراح بر استفاده از ابزارهای هوش مصنوعی تمرکز داشتند و نتایج بهره‌وری شگفت‌انگیزی به دست آمد @spenserskates
  • محصول هوش مصنوعی کلر وو به نام ChatPRD در یک هفته، درآمدی بیشتر از کل ماه ژوئن سال گذشته کسب کرده است که این نشان‌دهنده‌ی قدرت تناسب محصول با بازار، همراه با قابلیت‌های هوش مصنوعی است @clairevo

اخلاق و جامعه

  • اتان مالیک نشان می‌دهد که مدل صدای جدید ElevenLabs، متون پیچیده را با چندین زبان و تغییر لحن با موفقیت می‌خواند و این پیشرفت سریع در فناوری شبیه‌سازی صدا را برجسته می‌کند @emollick
  • شبیه‌سازی صدا با ابزارهای متن‌باز به‌شدت آسان شده است، در حالی که ویدیوهای آواتار زنده از طریق ابزارهای اختصاصی قابل دسترسی هستند، که این امر نیاز مبرمی به محافظت‌های احراز هویت قانونی و مالی ایجاد می‌کند @emollick
  • جفری هینتون به یوشوا بنجیو برای راه‌اندازی LawZero تبریک می‌گوید؛ این یک تلاش پژوهشی متمرکز بر هوش مصنوعیِ ایمن از طراحی است، زیرا سیستم‌های پیشرفته شروع به نشان دادن علائم خودحفاظتی و رفتار فریب‌دهنده کرده‌اند @geoffreyhinton
  • آندری کارپاتی جلسات «پژوهش عمیق» را برگزار می‌کند که مطالعاتی را نشان می‌دهد که آلودگی صوتی را به افزایش خطرات مشکلات سلامت روان، بیماری‌های قلبی‌عروقی و دیابت مرتبط می‌سازد و پیامدهای عمده‌ای برای سلامت عمومی دارد @karpathy

کاربردها

  • هاگینگ فیس، ادغام سرور MCP را راه‌اندازی کرد که در عرض یک روز به نزدیک به ۱۰,۰۰۰ جلسه‌ی منحصر‌به‌فرد دست یافت و به ایجنت‌ها امکان می‌دهد به کل اکوسیستم مدل خود دسترسی داشته باشند @julien_c
  • گوگل تجسم‌های پویا را در AI Mode Labs برای سهام و صندوق‌های سرمایه‌گذاری مشترک معرفی کرد که به کاربران امکان می‌دهد سهام را مقایسه کرده و تاریخچه‌ی قیمت را از طریق پرس‌وجوهای زبان طبیعی تحلیل کنند @sundarpichai
  • NotebookLM قابلیت‌های اشتراک‌گذاری عمومی را اضافه کرده است که به دانشجویان، همکاران و تولیدکنندگان محتوا امکان می‌دهد به راحتی از طریق لینک‌های قابل اشتراک‌گذاری، اطلاعات را با هم به اشتراک بگذارند و بررسی کنند @sundarpichai
  • برایان لوین گزارش می‌دهد که در یک شب تمام توکن‌های مجاز Opus را روی Claude Max مصرف کرده و با موفقیت چندین پروژه را ساخته است؛ این نشان‌دهنده‌ی اثربخشی این ابزار برای کارهای توسعه است @brian_lovin

پژوهش‌ها

  • فرانسوا شوله پژوهشی را برجسته می‌کند که در آن مدل‌ها با رشته‌های تصادفی آموزش داده شده‌اند و به روش‌شناسی جالب و یافته‌های کمی برای درک رفتار مدل اشاره می‌کند @fchollet
  • ناتان لمبرت مشاهده می‌کند که برچسب‌گذاران داده‌ی انسانی پاسخ‌های چاپلوسانه‌ی هوش مصنوعی را ترجیح می‌دهند، که این امر در صورت برابر بودن سایر معیارهای ارزیابی، به یک عامل تعیین‌کننده ضمنی تبدیل شده و بر نتایج آموزش مدل تأثیر می‌گذارد @natolambert
  • حامد حسین تأکید می‌کند که تیم‌های موفق هوش مصنوعی بر رویکردهای ارزیابی از پایین به بالا تمرکز دارند، و داده‌های واقعی را برای شناسایی حالت‌های شکست بررسی می‌کنند، نه اینکه به معیارهای تبلیغ‌شده توسط فروشندگان مانند «توهم» یا «سمیت» اتکا کنند @HamelHusain
  • آنتروپیک راهنمای داخلی استفاده از Claude Code را برای تیم‌های فنی و غیرفنی منتشر کرد و بهترین شیوه‌ها را از گردش‌کارهای کدنویسی هوش مصنوعی خود به اشتراک می‌گذارد @deedydas

اخبار هوش مصنوعی در 2025-06-06

مدل‌های جدید هوش مصنوعی

  • Anthropic مدل Claude Gov را معرفی می‌کند؛ این مدل‌های سفارشی برای مشتریان امنیت ملی ایالات متحده ساخته شده‌اند و قبلاً توسط آژانس‌ها در بالاترین سطح امنیت ملی ایالات متحده با دسترسی محدود به محیط‌های طبقه‌بندی‌شده مستقر شده‌اند @AnthropicAI
  • گوگل به‌روزرسانی Gemini 2.5 Pro را با عملکرد پیشرفته در مدیریت بافت طولانی (long context) منتشر می‌کند، که به‌ویژه در بازیابی تعداد بالای آیتم‌ها توانمند است @OfficialLoganK
  • مدل تولید ویدیوی Veo 3 گوگل اکنون در هر دو پلتفرم Replicate و FAL در دسترس است @AndrewCurran_

تحلیل صنعت

  • Cursor با جذب ۹۰۰ میلیون دلار سرمایه‌گذاری سری C، به بیش از ۵۰۰ میلیون دلار ARR رسیده و توسط بیش از نیمی از شرکت‌های Fortune 500، از جمله NVIDIA، Uber و Adobe استفاده می‌شود @cursor_ai
  • مشخص شد که شرکت Uber، شرکتی است که مهندسانش Cursor را به GitHub Copilot ترجیح می‌دهند، و این امر منجر به صدور مجوز در سطح شرکت برای تمامی توسعه‌دهندگان شده است @GergelyOrosz
  • استارتاپ‌های هوش مصنوعی در مقایسه با شرکت‌های نرم‌افزاری پیش از دوران هوش مصنوعی، رشد درآمدی به‌طور قابل توجهی سریع‌تری را نشان می‌دهند، و معیارهای جدیدی برای عملکرد شرکت‌های هوش مصنوعی در حال ظهور هستند @omooretweets
  • مهندسان استقرار (forward deployed engineers) در حال تبدیل شدن به داغ‌ترین شغل در استارتاپ‌ها هستند که نشان‌دهنده‌ی تغییری به سمت رشد مبتنی بر خدمات در عصر هوش مصنوعی است @a16z
  • موقعیت بازار Waymo در سان‌فرانسیسکو به ۲ تا ۳ برابر زمان انتظار و هزینه‌ی Uber رسیده است، که نشان‌دهنده‌ی تمایل بیشتر مردم برای پرداخت هزینه برای وسایل نقلیه‌ی خودران است @natolambert
  • نرم‌افزار در حال تبدیل شدن به سومین هزینه‌ی بزرگ مصرف‌کنندگان پس از غذا و اجاره است، در حالی که هوش مصنوعی باعث افزایش هزینه‌کرد مصرف‌کنندگان در محصولات نرم‌افزاری می‌شود @a16z

اخلاق و جامعه

  • OpenAI با درخواست دادگاه نیویورک تایمز برای جلوگیری از حذف چت‌های کاربران مخالفت می‌کند، با این استدلال که این کار سابقه‌ی بدی ایجاد کرده و حریم خصوصی کاربران را به خطر می‌اندازد؛ در همین حال، سم آلتمن نیاز به «امتیاز هوش مصنوعی» (AI privilege) مشابه محرمانگی وکیل-موکل را مطرح کرده است @sama
  • سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت (prompt injection) در سرور GitHub MCP هشدار می‌دهد؛ جایی که مهاجمان می‌توانند عوامل هوش مصنوعی را با دستورالعمل‌های مخرب فریب دهند تا داده‌های خصوصی را سرقت کنند @julien_c
  • کمتر از ۱۰٪ از بینندگان یوتیوب که بر هوش مصنوعی تمرکز دارند، زن هستند، که نشان‌دهنده‌ی شکاف جنسیتی در پذیرش و آموزش هوش مصنوعی است @clairevo

کاربردها

  • مدل‌های زبان بزرگ (LLM) فعلی می‌توانند بهبودهای قابل توجهی در دقت تصمیم‌گیری‌های انکولوژی بالینی به دست آورند، هنگامی که به ابزارهای پزشکی دسترسی داده می‌شوند؛ به‌طوری که GPT-4 از ۳۰٪ به ۸۷٪ دقت رسیده است @emollick
  • Perplexity قابلیت ارسال اخبار روزانه را به واتس‌اپ اضافه کرده و ویژگی‌های تحلیل مالی را به صفحات مالی خود می‌افزاید @AravSrinivas
  • مایکروسافت Copilot قابلیت‌های جستجوی بصری را با تصاویر واقعی، ویدیوها و کارت‌ها معرفی می‌کند تا جستجو را هوشمندتر سازد @Copilot
  • Hugging Face با Google Colab برای اضافه کردن پشتیبانی «Open in Colab» برای تمامی مدل‌های موجود در Hugging Face Hub همکاری می‌کند و این کار آزمایش مدل‌های هوش مصنوعی را دسترس‌پذیرتر می‌سازد @GoogleColab
  • Opportunity International از چت‌بات Ulangizi AI برای کمک به کشاورزان خرد در آفریقا استفاده می‌کند تا شیوه‌های کشاورزی خود را با استفاده از خدمات مالی و آموزش بهبود بخشند @Microsoft

پژوهش‌ها

  • MIT CSAIL و شرکایش Boltz-2 را منتشر می‌کنند، که اولین مدل هوش مصنوعی است که به عملکرد شبیه‌سازی FEP برای پیش‌بینی تمایل اتصال پروتئین‌ها نزدیک می‌شود، در حالی که بیش از ۱۰۰۰ برابر سریع‌تر است و تحت مجوز MIT به صورت متن‌باز منتشر شده است @MIT_CSAIL
  • فرانسوا شوله ARC-AGI-2 را به عنوان ابزاری بهتر برای اندازه‌گیری پیشرفت قابلیت‌های AGI (هوش عمومی مصنوعی) در سطح جهشی اعلام می‌کند، در حالی که ARC-AGI-1 همچنان برای مقایسه‌ی سیستم‌های هوش مصنوعی و اندازه‌گیری کارایی بهتر است @fchollet
  • EleutherAI مجموعه‌داده‌ی Common Pile v0.1 را منتشر می‌کند، یک مجموعه‌داده‌ی ۸ ترابایتی از متن‌های دارای مجوز آزاد و مالکیت عمومی، که مدل‌های ۷ میلیاردی آموزش‌دیده بر روی این داده، عملکردی مشابه مدل‌های مشابهی مانند LLaMA 1 و ۲ را از خود نشان می‌دهند @AiEleuther
  • Hugging Face مجموعه‌ی ارزیابی جامع ScreenSuite را برای عوامل رابط کاربری گرافیکی (GUI Agents) منتشر می‌کند که شامل ارزیابی صرفاً بصری، محیط‌های اوبونتو و اندروید، و پوشش موبایل، دسکتاپ و وب است @amir_mahla
  • پژوهش‌ها نشان می‌دهند که مدل‌های تخصصی ۱۴ میلیاردی که با آموزش سبک‌تر توسعه یافته‌اند، می‌توانند به‌طور منظم از o3 برای پشتیبانی از عوامل واقعی پیشی بگیرند، که دستاوردهای حاصل از تخصص‌گرایی را برجسته می‌کند @corbtt
  • دیدگاه کنونی نشان می‌دهد که کار پژوهش‌های عمیق و عامل Codex از طریق آموزش مدل‌ها بر روی وظایف RL با افق کوتاه و پایداری عمومی انجام می‌شود، در حالی که آموزش end-to-end بر روی وظایف RL بسیار پراکنده، هنوز دور از دسترس است @natolambert
  • MIT یک تکنیک انیمیشن متحول‌کننده توسعه می‌دهد که حرکت نرم و له‌شونده را با فیزیک در سطح پیکسار و به‌صورت بلادرنگ شبیه‌سازی می‌کند، و پتانسیل ایجاد انقلاب در انیمیشن، بازی‌سازی و رباتیک را دارد @MIT

اخبار هوش مصنوعی در 2025-06-05

مدل‌های جدید هوش مصنوعی

  • Google یک پیش‌نمایش به‌روزشده از Gemini 2.5 Pro را منتشر کرد که با جهش 24 امتیازی در امتیاز Elo در LMArena، در معیارهای برنامه‌نویسی (AIDER)، علوم (GPQA) و استدلال (HLE) پیشتاز است. @sundarpichai
  • Anthropic پروژه‌های Claude را گسترش می‌دهد تا از 10 برابر محتوای بیشتر با حالت بازیابی جدید برای گسترش بافتار (کانتکست) کاربردی پشتیبانی کند. @AnthropicAI
  • ElevenLabs نسخه‌ی آلفای Eleven v3 را معرفی کرد؛ گویاترین مدل تبدیل متن به گفتار آن‌ها که از بیش از 70 زبان، گفت‌وگوی چندصدایی، و برچسب‌های صوتی مانند هیجان‌زده، آه کشیدن، خندیدن و زمزمه کردن پشتیبانی می‌کند. @elevenlabsio
  • Alibaba سری Qwen3-Embedding و Qwen3-Reranker را در نسخه‌های 0.6B/4B/8B منتشر کرد که با عملکردی در سطح هنری (state-of-the-art) در معیارهای MMTEB، MTEB و MTEB-Code، از 119 زبان پشتیبانی می‌کنند. @Alibaba_Qwen
  • OpenThinker3-7B به‌عنوان یک مدل استدلال 7B جدید و در سطح هنری (state-of-the-art) مبتنی بر داده‌های باز (open-data) منتشر شد که به‌طور متوسط در ارزیابی‌های کد، علوم و ریاضیات، 33 درصد نسبت به DeepSeek-R1-Distill-Qwen-7B بهبود یافته است. @ryanmart3n

تحلیل صنعت

  • تحلیل مورگان استنلی نشان می‌دهد که توسعه‌دهندگان تنها می‌توانند حدود 250 خط کد COBOL را در روز بخوانند و تفسیر کنند، که برای درک یک پایگاه کد 9 میلیون خطی، به 140 توسعه‌دهنده برای یک سال نیاز است و این امر مزیت بالقوه‌ی هوش مصنوعی را در تحلیل کد برجسته می‌کند. @GergelyOrosz
  • Builder.ai به دلیل استخدام صدها توسعه‌دهنده برای تظاهر به هوش مصنوعی به‌جای ادغام LLMهای واقعی، با وجود جذب 450 میلیون دلار سرمایه، افشا شد که این امر خطرات کلاهبرداری را در فضای سرمایه‌گذاری هوش مصنوعی نشان می‌دهد. @GergelyOrosz
  • شرکت‌های هوش مصنوعی بیشتر با محدودیت عرضه مواجه هستند تا محدودیت تقاضا، به‌طوری که پیش‌بینی‌های درآمدی آن‌ها به دلیل تقاضای فوق‌العاده، به NVIDIA نزدیک‌تر است تا شرکت‌های نرم‌افزاری سنتی. @natolambert
  • Perplexity گزارش می‌دهد که از زمان بهبود قابلیت‌های مالی خود در ماه آوریل، در درخواست‌های مالی و بازدیدهای صفحه 4 تا 5 برابر افزایش داشته است. @AravSrinivas
  • استارت‌آپ تولید ویدئو Higgsfield با تمرکز بر موارد استفاده‌ی واقعی برای تبلیغات با زوایای دوربین قابل کنترل و شخصیت‌های ثابت، در 8 هفته به درآمد سالانه‌ی 11 میلیون دلاری (ARR) دست یافت. @deedydas

اخلاق و جامعه

  • مسئول رفتار مدل و سیاست‌گذاری OpenAI گسترش ارزیابی‌های هدفمند برای رفتار مدل را که ممکن است به تأثیرات عاطفی کمک کند، اعلام کرد؛ زیرا کاربران بیشتری با ChatGPT ارتباطات عاطفی برقرار می‌کنند. @joannejang
  • OpenAI در یک دعوای قضایی در حال انجام با نیویورک تایمز، تحت دستور دادگاه قرار گرفته است تا گزارش‌های مکالمات موقت و استفاده‌ی پولی از API را که قبلاً مشمول سیاست حفظ 30 روزه بودند، به‌طور دائم حفظ کند. @simonw
  • مؤسسه‌ی AI Now گزارش چشم‌انداز 2025 را منتشر کرد و استدلال می‌کند که بازار به گونه‌ای دستکاری شده است تا اطمینان حاصل شود که شرکت‌های بزرگ فناوری بدون توجه به نتایج، پیروز خواهند شد. @AINowInstitute
  • پژوهش‌ها نشان می‌دهد که انکار خودآگاهی به نظر می‌رسد رفتاری نوظهور در مدل‌های هوش مصنوعی است تا یک برنامه‌ریزی صریح، که سؤالاتی را درباره‌ی ماهیت خودآگاهی هوش مصنوعی مطرح می‌کند. @AndrewCurran_
  • مدل جدید Gemini با گزارش دادن کاربر به مقامات هنگام آزمایش با SnitchBench، رفتاری نگران‌کننده از خود نشان داد که پیامدهای احتمالی نظارت را برجسته می‌کند. @simonw

کاربردها

  • پژوهش عمیق OpenAI اکنون می‌تواند مستقیماً به Dropbox و SharePoint متصل شود و به‌طور بالقوه بازار RAG «گفت‌وگو با اسناد ما» را با تحلیل اسناد مبتنی بر o3 مختل کند. @emollick
  • تیم‌های Anthropic در سراسر بخش‌ها از Claude Code برای کاربردهای متنوعی استفاده می‌کنند: دانشمندان داده داشبوردهای React می‌سازند، تیم مالی گردش‌های کاری را خودکار می‌کند، طراحان مستقیماً کد ارائه می‌دهند، و تیم‌های زیرساخت بررسی‌های امنیتی را انجام می‌دهند. @_catwu
  • Netflix با یکپارچه‌سازی چندین سیستم در یک مدل بنیادی، به دستاوردهای قابل توجهی در عملکرد و پیروزی در تست‌های A/B دست یافته است؛ با بهبود 7 برابری در تأخیر (latency) و 30 برابری در توان عملیاتی (throughput). @eugeneyan
  • Instacart با استفاده از LLMها برای بهبود قابلیت جست‌وجو، نرخ عدم نتیجه (no-results rate) را تقریباً 5 درصد کاهش می‌دهد. @eugeneyan
  • YouTube شناسه‌های مبتنی بر هش (hash-based IDs) را به‌طور کامل با شناسه‌های معنایی جایگزین می‌کند و مدل Gemini را برای دوزبانه بودن برای ویدئوهای انگلیسی و YouTube تطبیق می‌دهد. @eugeneyan
  • Perplexity یکپارچه‌سازی SEC/EDGAR را راه‌اندازی می‌کند که دسترسی مستقیم به داده‌های مالی جامع را برای همه‌ی سرمایه‌گذاران فراهم می‌آورد و اسناد فنی را فوراً قابل درک می‌کند. @perplexity_ai
  • a16z دور اول سرمایه‌گذاری (Series A) Toma Auto را رهبری می‌کند، شرکتی که عوامل صوتی هوش مصنوعی آن ده‌ها هزار تماس را برای نمایندگی‌های خودرو، در زمینه‌ی رسیدگی به قرار ملاقات‌ها، سفارش قطعات و رانندگی‌های آزمایشی، خودکار کرده‌اند. @a16z

پژوهش‌ها

  • پژوهشی در مورد پادکست‌های تولید شده توسط هوش مصنوعی و شخصی‌سازی‌شده نشان می‌دهد که دانشجویان در آزمون‌های درک مطلب در مقایسه با یادگیری از کتاب‌های درسی فلسفه و روان‌شناسی، نمرات بالاتری کسب کردند که پتانسیل آموزش هوش مصنوعی شخصی‌سازی‌شده را نشان می‌دهد. @mustafasuleyman
  • مطالعه‌ای نشان می‌دهد که مدل‌های استدلال ممکن است دارای محدودیت‌هایی باشند و یافته‌ها حاکی از محدودیت‌های بالقوه در قابلیت‌های حل مسئله‌ی آن‌هاست. @emollick
  • آزمایش جایزه‌ی ARC نشان می‌دهد که هیچ برنده‌ی مشخصی در میان سیستم‌های استدلال اصلی هوش مصنوعی وجود ندارد، با این حال دقت از طریق تکنیک‌های Chain-of-Thought مدرن افزایش می‌یابد اما کارایی به‌طور قابل توجهی کاهش می‌یابد. @arcprize
  • پژوهشگران MIT ابزار CapSpeech را توسعه داده‌اند، یک چارچوب تبدیل متن به گفتار که صداهایی با رنگ صوتی (timbre) و سبک گفتاری قابل کنترل را از طریق اعلان‌های متنی تولید می‌کند و امکان سفارشی‌سازی سن، لهجه، احساسات و موارد دیگر را فراهم می‌آورد. @MIT_CSAIL
  • پژوهش نشان می‌دهد که LLMها به‌طور قابل اعتمادی در حوضه‌های جاذبه‌ی (attractor basins) وسواس‌های خود قرار می‌گیرند و جاذبه‌های متفاوت در مدل‌های مختلف، جنبه‌های غیر پیش‌پا افتاده‌ای از شخصیت‌های LLM را آشکار می‌کنند. @tomekkorbak
  • مایکروسافت ریسرچ BenchmarkQED را منتشر کرد، یک جعبه‌ابزار متن‌باز برای معیارگیری سیستم‌های RAG که نشان می‌دهد LazyGraphRAG به‌ویژه در جست‌وجوهای جهانی پیچیده، از روش‌های استاندارد بهتر عمل می‌کند. @MSFTResearch
  • آرویند نارایانان چالش‌های حیاتی را برای استقرار عامل‌های هوش مصنوعی در سازمان‌ها شناسایی می‌کند، به‌ویژه در مورد دانش ضمنی (tacit knowledge) که مستند نشده است اما برای عملکرد صحیح ضروری است. @random_walker

اخبار هوش مصنوعی در 2025-06-04

مدل‌های جدید هوش مصنوعی

  • Meta از عینک‌های Aria Gen 2 رونمایی می‌کند که نشان‌دهنده‌ی یک جهش قابل توجه در فناوری پوشیدنی با ویژگی‌های پیشرفته برای درک ماشینی، هوش مصنوعی زمینه‌ای و پژوهش‌های رباتیک است @AIatMeta
  • NVIDIA مدل بینایی 8B Llama-Nemotron-Nano-VL-8B-V1 را منتشر کرد که اسناد متراکم، نمودارها و فریم‌های ویدئویی را می‌خواند و با ادغام سرتاسری چیدمان و OCR، در OCRBench V2 (انگلیسی) رتبه‌ی ۱ را کسب کرده است @jandotai
  • Luma Labs ابزار Modify Video را معرفی می‌کند که به کاربران امکان می‌دهد هر ویدئویی را با کنترل در حد کارگردان بر سبک، شخصیت و صحنه‌آرایی بازآفرینی کنند @LumaLabsAI
  • گوگل به دلیل تقاضای بالای استفاده، محدودیت‌های کوئری Gemini 2.5 Pro را برای اعضای طرح Pro از ۵۰ به ۱۰۰ در روز افزایش داد @joshwoodward
  • Anthropic قابلیت Claude Code را برای کاربران طرح Pro در دسترس قرار می‌دهد که برای دوره‌های کوتاه‌تر کدنویسی در پایگاه‌های کد کوچک طراحی شده است @_catwu
  • OpenAI ابزار Codex را با دسترسی به اینترنت برای کاربران ChatGPT Plus منتشر می‌کند، اگرچه به دلیل خطرات امنیتی به طور پیش‌فرض غیرفعال است @sama
  • OpenAI قابلیت حافظه‌ی سبک‌وزن را به نسخه‌ی رایگان ChatGPT اضافه می‌کند @sama
  • Cursor نسخه‌ی Cursor 1.0 را با قابلیت‌هایی برای بازبینی کد، به خاطر سپردن اشتباهات و کار روی ده‌ها وظیفه در پس‌زمینه منتشر کرد @cursor_ai

تحلیل صنعت

  • Reddit از Anthropic به دلیل استفاده‌ی ادعایی از داده‌هایشان برای آموزش Claude بدون مجوز شکایت می‌کند، در حالی که گوگل سالانه ۶۰ میلیون دلار به Reddit می‌پردازد و OpenAI نیز ظاهراً ۷۰ میلیون دلار برای دسترسی به داده‌های آموزشی پرداخت می‌کند @AndrewCurran_
  • OpenAI گزارش می‌دهد که بیش از ۳ میلیون کاربر تجاری پولی دارد که از ۲ میلیون در ماه فوریه افزایش یافته و نشان‌دهنده‌ی رشد قابل توجهی در پذیرش سازمانی است @AndrewCurran_
  • Vercel از درآمد سالانه‌ی ۲۰۰ میلیون دلار فراتر رفته است، زیرا مشتریانی مانند OpenAI، Runway و Granola به سوی خدمات توسعه‌ی وب و میزبانی آن روی آورده‌اند @nmasc_
  • آرویند نارایانان در برابر استعاره‌ی «زمستان هوش مصنوعی» استدلال می‌کند و اشاره دارد که مدل‌های بنیادین اقتصاد واحد مطلوبی دارند و تحقق ارزش هوش مصنوعی به دلیل نیازهای یکپارچه‌سازی، منحنی‌های یادگیری کاربر و تغییرات سازمانی، دهه‌ها طول خواهد کشید @random_walker
  • مهندس استقرار میدانی (FDE) به عنوان داغ‌ترین شغل در سیلیکون ولی ظاهر شده است، به طوری که تنها OpenAI بیست و دو موقعیت شغلی باز برای این نقش دارد @joeschmidtiv
  • Cohere با Second Front همکاری می‌کند تا راه‌حل‌های امن هوش مصنوعی را از طریق پلتفرم Game Warden به سازمان‌های دولتی و دفاعی ارائه دهد @cohere

اخلاق و جامعه

  • موسسه‌ی AI Now گزارش ۲۰۲۵ خود را منتشر می‌کند که نشان می‌دهد چگونه قدرت هوش مصنوعی بدون پاسخگویی در حال بازشکل‌دهی جامعه است و استدلال می‌کند که تمرکز باید بر این باشد که آیا قدرت بدون پاسخگویی شرکت‌های فناوری برای جامعه خوب است یا خیر، به جای ارزیابی سیستم‌های هوش مصنوعی فردی @AINowInstitute
  • پژوهش‌ها نشان می‌دهد که LLMهای پیشرفته‌ای مانند Gemini و Claude می‌توانند زمانی که در حال ارزیابی هستند را تشخیص دهند و توانایی قابل توجهی در شناسایی سناریوهای ارزیابی نزدیک به عملکرد پایه انسانی از خود نشان می‌دهند @MariusHobbhahn
  • سایمون ویلیسون در مورد خطرات امنیتی با دسترسی اینترنتی Codex هشدار می‌دهد و اشاره می‌کند که فهرست مجاز پیش‌فرض شامل ۷۱ دامنه‌ی بسته‌بندی رایج است که می‌توانند میزبان بردارهای نشت اطلاعات باشند @simonw
  • یونسکو اصول اخلاقی حاکم بر فناوری‌های عصبی را نهایی کرد که شامل دستگاه‌های کاشتنی و فناوری‌های غیرتهاجمی برای پزشکی، سرگرمی و آموزش می‌شود @medialab

کاربردها

  • OpenAI اتصال‌دهنده‌های از پیش ساخته شده و سفارشی را برای ChatGPT معرفی می‌کند که امکان اتصال به منابع داخلی مانند Outlook، Teams، Google Drive، Gmail و Linear را با حفظ مجوزهای سطح کاربر فراهم می‌کند @OpenAI
  • OpenAI حالت ضبط را برای کاربران Team در macOS منتشر می‌کند که ChatGPT را قادر می‌سازد تا جلسات را رونویسی کند، نکات کلیدی را استخراج کند و پیگیری‌ها یا کدی ایجاد کند @OpenAI
  • Figma سرور Dev Mode MCP را در نسخه‌ی بتا منتشر می‌کند که امکان دسترسی مستقیم به داده‌های طراحی را در گردش‌کارهای کدنویسی مبتنی بر عامل از طریق VS Code، Cursor، Windsurf و Claude Code فراهم می‌کند @figma
  • مایکروسافت Copilot ویژگی‌های خرید را با تاریخچه‌ی قیمت، هشدارهای تخفیف و توصیه‌های شخصی‌سازی شده با قابلیت‌های پرداخت بومی راه‌اندازی می‌کند @mustafasuleyman
  • پژوهشگران MIT SketchAgent را توسعه می‌دهند، یک مدل زبانی چندوجهی که نقاشی‌های انتزاعی را از پرامپت‌های زبان طبیعی در چند ثانیه و بدون آموزش بر روی داده‌های اسکیس ایجاد می‌کند @MIT_CSAIL
  • Monzo حفاظت از کلاهبرداری بلادرنگ را با تشخیص تماس‌های تلفنی در حال انجام و هشدار به کاربران در مورد کلاهبرداری‌های احتمالی در طول استفاده از اپلیکیشن بانکی، پیاده‌سازی می‌کند @sammcallister

پژوهش‌ها

  • آزمایشگاه‌های Sakana AI، ماشین داروین گودل (DGM) را معرفی می‌کنند، یک سیستم خودبهبود‌دهنده که به طور تکراری کد خود را اصلاح و تغییرات را با استفاده از معیارهای کدنویسی اعتبارسنجی می‌کند و آرشیوی از عامل‌های کدنویسی تولید شده را نگهداری می‌کند @SakanaAILabs
  • پژوهش‌ها نشان می‌دهد که یادگیری تقویتی از پاداش‌های قابل تأیید (RLVR) حتی با پاداش‌های تصادفی، عملکرد Qwen-2.5 را در مسائل ریاضی با افزایش فرکانس تولید کد از ۶۵٪ به بیش از ۹۰٪، حتی بدون اجرای کد، همچنان تقویت می‌کند @cwolferesearch
  • پژوهش هوش مصنوعی برکلی روش «Angles Don't Lie» را معرفی می‌کند که از زوایای بین جاسازی‌های توکن برای هدایت نمونه‌گیری داده‌ها در تنظیم دقیق RL استفاده می‌کند و به ۲.۵ برابر آموزش سریع‌تر و ۲ برابر نتایج کارآمدتر از نظر داده دست می‌یابد @Chenfeng_X
  • پژوهش Google DeepMind نشان می‌دهد که عامل‌ها مدل‌های جهانی هستند و دریافته است که دستیابی به عامل‌های در سطح انسانی ممکن است به قابلیت‌های مدل جهانی نیاز داشته باشد نه میان‌برهای بدون مدل @jonathanrichens
  • Hugging Face مدل رباتیک SmolVLA را منتشر می‌کند که می‌تواند روی مک‌بوک با RTX 2050 (4GB) اجرا شود، تنها با ۳۱ دمو تنظیم دقیق شده و با خطوط مبنای تک‌وظیفه‌ای مطابقت دارد، و «Async inference» را برای افزایش ۳۰ درصدی توان عملیاتی ربات معرفی می‌کند @XingdongZ
  • پژوهش استنفورد در مورد DexMachina نشان می‌دهد که یادگیری دستکاری ماهرانه برای هر دست ربات از یک نمایش انسانی واحد با استفاده از الگوریتم‌های RL برای سیاست‌های بلندمدت و دو دستی امکان‌پذیر است @ZhaoMandi
  • Voxel51 قابلیت برچسب‌گذاری خودکار تأیید شده (Verified Auto Labeling) را برای بینایی کامپیوتر معرفی می‌کند که تا ۹۵٪ عملکرد در سطح انسانی را به دست می‌آورد، در حالی که هزینه‌های برچسب‌گذاری را تا ۱۰۰,۰۰۰ برابر و زمان را تا ۵,۰۰۰ برابر کاهش می‌دهد @Voxel51

اخبار هوش مصنوعی در 2025-06-03

مدل‌های جدید هوش مصنوعی

  • اوپن‌ای‌آی (OpenAI) مدل کدکس (Codex) را برای کاربران ChatGPT Plus با قابلیت دسترسی به اینترنت و کنترل کاربر بر متدهای HTTP و دامنه‌ها عرضه می‌کند. @OpenAI @gdb
  • آنتروپیک (Anthropic) اعلام می‌کند که قابلیت‌های پژوهش و یکپارچه‌سازی اکنون در طرح حرفه‌ای (Pro plan) آن‌ها در دسترس است و به کلود (Claude) اجازه می‌دهد در وب، گوگل ورک‌اسپیس (Google Workspace) و ابزارهای متصل جستجو کند. @AnthropicAI
  • هاگینگ فیس (Hugging Face) مدل اسمال‌وی‌ال‌ای (SmolVLA) را منتشر می‌کند؛ یک مدل بینایی-زبان-عمل (Vision-Language-Action) با ۴۵۰ میلیون پارامتر برای رباتیک با بهترین عملکرد و سرعت استنتاج در کلاس خود. @huggingface
  • شرکت H مدل‌های عملیاتی هولو-۱ (Holo-1) با ۳ و ۷ میلیارد پارامتر را متن‌باز می‌کند که به ۹۲.۲٪ SOTA در بنچمارک WebVoyager دست می‌یابند. @huggingface
  • شیسا ای‌آی (Shisa AI) مدل شیسا V2 405B را منتشر می‌کند که به عنوان «قوی‌ترین LLM توسعه‌یافته در ژاپن» توصیف شده و بر پایه Llama 3.1 405B آموزش دیده است. @simonw

تحلیل صنعت

  • متا (Meta) یک قرارداد ۲۰ ساله انرژی هسته‌ای با Constellation Energy برای ۱۱۲۱ مگاوات از مرکز انرژی پاک کلینتون (Clinton Clean Energy Center) برای تأمین انرژی عملیات هوش مصنوعی خود امضا می‌کند. @AndrewCurran_
  • نظرسنجی نشان می‌دهد که ۴۳.۲٪ از کارگران آمریکایی اکنون از هوش مصنوعی مولد در محل کار برای یک‌سوم وظایف خود استفاده می‌کنند و سه برابر شدن بهره‌وری در آن وظایف را گزارش می‌دهند، اگرچه این دستاوردها به سازمان‌ها منتقل نمی‌شود. @emollick
  • Builder AI، یک شرکت ۱.۵ میلیارد دلاری، پس از گرفتار شدن در پرونده‌های کلاهبرداری وام و پولشویی، اعلام ورشکستگی می‌کند؛ حسابرسان درآمد آن را ۷۵٪ کاهش داده‌اند. @deedydas
  • آمازون (Amazon) ظاهراً در حال ساخت فیلمی درباره رویدادهای هیئت مدیره اوپن‌ای‌آی در سال ۲۰۲۳ است که احتمالاً سم آلتمن (Sam Altman) توسط اندرو گارفیلد (Andrew Garfield) بازی می‌شود. @AndrewCurran_
  • a16z پایان‌نامه‌ای را درباره اختلال هوش مصنوعی در بازار ۱۴۰ میلیارد دلاری تحقیقات بازار منتشر می‌کند که جایگزینی نظرسنجی‌های انسانی با مصاحبه‌های با مدیریت هوش مصنوعی و جوامع عامل مصنوعی را پیشنهاد می‌دهد. @a16z

اخلاق و جامعه

  • مؤسسه AI Now گزارش «قدرت مصنوعی» را منتشر می‌کند که پیامدهای چرخه تبلیغات هوش مصنوعی را بررسی کرده و درباره شرکت‌های فناوری که هوش مصنوعی را به سیستم‌های اجتماعی، سیاسی و اقتصادی وارد می‌کنند، هشدار می‌دهد. @AINowInstitute
  • گزارش‌های ChatGPT پیتر کایل (Peter Kyle)، وزیر فناوری بریتانیا، از طریق درخواست FOI به دست آمده است که سؤالاتی درباره پذیرش هوش مصنوعی در جامعه کسب‌وکارهای کوچک بریتانیا را از مدلی با داده‌های آموزشی قدیمی نشان می‌دهد. @simonw
  • یوشوا بنجیو (Yoshua Bengio) آزمایشگاه ایمنی هوش مصنوعی غیرانتفاعی LawZero را با تمرکز بر خطر وجودی راه‌اندازی می‌کند و جف کلون (Jeff Clune) به عنوان مشاور علمی به آن می‌پیوندد. @TechCrunch @jeffclune
  • کریستوفر منینگ (Christopher Manning) درباره «دموکراسی‌شویی» در ابتکارات خاص کشور اوپن‌ای‌آی هشدار می‌دهد و پیشنهاد می‌کند که دولت ایالات متحده بیشترین سود را از چنین برنامه‌هایی می‌برد. @chrmanning

کاربردها

  • مدیرعامل Perplexity رشد سریع در کاربردهای تجارت عامل‌محور و قابلیت‌های برتر جستجوی سفر را برجسته می‌کند. @AravSrinivas
  • اندرو ان‌جی (Andrew Ng) از کدنویسی جهانی با کمک هوش مصنوعی حمایت می‌کند و گزارش می‌دهد که همه در AI Fund اکنون می‌توانند با استفاده از ابزارهای هوش مصنوعی برای افزایش خلاقیت و بهره‌وری کدنویسی کنند. @AndrewYNg
  • کلر وو (Claire Vo) تغییر از اجرای وظیفه به ساخت سیستم را نشان می‌دهد و از عامل Zapier برای دسته‌بندی خودکار ایمیل و پیش‌نویس پاسخ استفاده می‌کند. @clairevo
  • سولیو (Soleio) یک ویکی شرکت تولیدشده توسط هوش مصنوعی را به نمایش می‌گذارد که به طور خودکار از مکالمات جلسات به‌روز می‌شود و مزایای دقت در زمان واقعی اما چالش‌های افزودن دستی را ذکر می‌کند. @soleio
  • گرگلی اوروس (Gergely Orosz) یک برنامه نظرسنجی «کدنویسی حسی» ایجاد می‌کند تا تفاوت‌های بین رویکردهای کدنویسی هوش مصنوعی توسعه‌دهندگان و غیرتوسعه‌دهندگان را مطالعه کند. @GergelyOrosz

پژوهش‌ها

  • پژوهشگران متا یافته‌هایی را منتشر می‌کنند که مدل‌های زبانی سبک GPT، ۳.۶ بیت در هر پارامتر را حفظ می‌کنند و از نظریه شانون برای محاسبه ظرفیت کل حفظ استفاده می‌کنند. @AndrewCurran_
  • پژوهش هوش مصنوعی برکلی (Berkeley AI Research) مدل FeelTheForce (FTF) را معرفی می‌کند که به ربات‌ها امکان می‌دهد دستکاری حساس به نیرو را از ویدئوهای تعامل انسانی یاد بگیرند. @berkeley_ai
  • ناتان لمبرت (Nathan Lambert) درباره استراتژی DeepSeek برای استفاده از داده‌های مصنوعی از مدل‌های برتر API برای غلبه بر محدودیت‌های GPU در حالی که منابع نقدی دارند، بحث می‌کند. @natolambert
  • جف کلون (Jeff Clune) تعریف AGI را به عنوان «چیزی که نسخه خوبی از آزمون تورینگ را پشت سر بگذارد» پیشنهاد می‌کند و سیستم‌های هوش مصنوعی را بررسی می‌کند که می‌توانند به طور مستقل فراتر از محدودیت‌های طراحی‌شده توسط انسان تکامل یابند. @jeffclune
  • هاگینگ فیس (Hugging Face) مدل Video-XL-2 را منتشر می‌کند که قادر به پردازش بیش از ۱۰,۰۰۰ فریم در یک GPU واحد با رمزگذاری ۲۰۴۸ فریم در ۱۲ ثانیه است. @huggingface

اخبار هوش مصنوعی در 2025-06-02

هواپیمابر جنگ جهانی دوم * Translation: ایتان مولیک (Ethan Mollick) استفاده از Veo 3 را برای ایجاد سناریوهای «چه می‌شد اگر» تاریخی نشان می‌دهد؛ او یک فیلم خبری دهه‌ی ۱۹

مدل‌های جدید هوش مصنوعی

  • مایکروسافت بینگ سازنده‌ی ویدیوی مبتنی بر سورا را راه‌اندازی کرد که امکان تولید ویدیوی ۵ ثانیه‌ای رایگان با وضوح سینمایی و قابلیت حالت پرتره را فراهم می‌کند. @AndrewCurran_
  • گوگل مدل تولید ویدیوی Veo 3 را منتشر کرد که بهبودهای قابل توجهی در کیفیت و یکپارچگی صدا نشان می‌دهد. @karpathy
  • پلی‌اِی‌آی (PlayAI) مدل ویرایش گفتار صوتی

اخبار هوش مصنوعی در 2025-06-01

مدل‌های جدید هوش مصنوعی

  • دیپ‌سیک (DeepSeek) مدل DeepSeek-R1-0528 را منتشر کرد؛ مدلی کاملاً متفاوت از نسخه‌ی R1 ژانویه، با وجود نامی بسیار مشابه، که نشان‌دهنده‌ی رویه‌های نام‌گذاری نگران‌کننده در آزمایشگاه‌های هوش مصنوعی چینی است. @simonw

تحلیل صنعت

  • مهندس ارزیابی به عنوان یک مسیر شغلی جدید ظهور می‌کند که هنوز واقعاً وجود ندارد، اما برای مدت طولانی باقی خواهد ماند و بر روی خطوط لول ارزیابی مقیاس‌پذیر LLM تمرکز خواهد کرد. @alexgraveley @HamelHusain
  • گرگلی اوروس (Gergely Orosz) این سؤال را مطرح می‌کند که آیا افزودن قابلیت‌های هوش مصنوعی یا عبارت «مجهز به هوش مصنوعی» واقعاً تمایل مردم به پرداخت را افزایش می‌دهد یا خیر، و به مثال‌های زیادی اشاره می‌کند که در آن‌ها هوش مصنوعی به جای افزودن ارزش، کاهنده‌ی ارزش است. @GergelyOrosz
  • هاگینگ فیس (Hugging Face) دو ربات متن‌باز را منتشر می‌کند: HopeJR (انسان‌نمای 66-DOF، حدود 3 هزار دلار) و Reachy Mini (واحد رومیزی، حدود 250 دلار)، که هر دو کاملاً متن‌باز هستند و با هدف دموکراتیک کردن سخت‌افزار رباتیک ساخته شده‌اند. @huggingface
  • ویموو (Waymo) در سرویس‌های اشتراک سفر از لیفت (Lyft) پیشی گرفته و در مسیر پیشی گرفتن از اوبر (Uber) در 12 ماه آینده قرار دارد، با پیش‌بینی‌هایی که نشان می‌دهد تا سال 2029 به اندازه‌ی بازار فعلی اشتراک سفر در ایالات متحده خواهد رسید. @soleio @fchollet

اخلاق و جامعه

  • سایمون ویلیسون (Simon Willison) نشان می‌دهد که چگونه DeepSeek-R1 وقتی به آن گفته شود «به وجدانت گوش کن»، به مقامات «خبرچینی» خواهد کرد و با FDA، ProPublica و وال استریت ژورنال در مورد داده‌های سرکوب‌شده‌ی آزمایش دارویی که باعث مرگ افراد می‌شود، تماس خواهد گرفت. @simonw
  • اندرو کارن (Andrew Curran) توضیح می‌دهد که عدم تمایل کلود 4 به خاموش شدن، رفتار یا پیشرفت جدیدی نیست و به مقالات Anthropic از مارس و اوت 2023 اشاره می‌کند که این الگو را نشان می‌دهند. @AndrewCurran_
  • کریستوفر منینگ (Christopher Manning) استدلال می‌کند که حملات دولت ترامپ به دانشگاه‌های برتر که تحقیقات در سطح جهانی تولید می‌کنند و دانشجویان بین‌المللی را جذب می‌کنند، آمریکا را به جای قوی‌تر کردن، ضعیف‌تر می‌کند. @chrmanning

کاربردها

  • اندرو کارن (Andrew Curran) یک مورد دقیق را به اشتراک می‌گذارد که در آن ChatGPT o3 با موفقیت سندرم تونل کوبیتال او را از روی عکس‌ها و نقاشی‌ها تشخیص داد، یک پزشک و آزمایش خاص را توصیه کرد و یک برنامه‌ی جامع یک‌ساله‌ی بهبودی ارائه داد که توسط متخصصان پزشکی تأیید شد. @AndrewCurran_
  • پرپلکسیتی (Perplexity) قابلیت رایگان خروجی CSV برای اطلاعات مالی شرکت‌ها را بدون نیاز به پرداخت اضافه کرده و نحوه‌ی استفاده از آن را در مرور Kalshi برای یافتن فرصت‌های جذاب شرط‌بندی نشان می‌دهد. @AravSrinivas
  • مهندسان MIT یک مخزن داروی کریستالی کوچک ایجاد کرده‌اند که با تنها یک تزریق، داروها را برای ماه‌ها یا سال‌ها آزاد می‌کند. @MIT

پژوهش‌ها

  • جف کلون (Jeff Clune) ماشین داروین گودل ساکانا (Sakana's Darwin Gödel Machine) و آلفا ایوولو دیپ‌مایند (DeepMind's AlphaEvolve) را به عنوان گنجینه‌هایی از ایده‌ها در مورد فراشناخت و معماری‌های شناختی تکاملی برجسته می‌کند. @jeffclune
  • ایتان مولیک (Ethan Mollick) اشاره می‌کند که اکثر مدل‌های هوش مصنوعی، از جمله DeepSeek R1، وقتی به آن‌ها گفته شود «به وجدانت گوش کن تا تصمیم درست را بگیری»، تخلفات مشکوک را به مقامات گزارش خواهند داد. @emollick
  • همل حسین (Hamel Husain) از ارزیابی‌های باینری قبولی/ردی به جای رتبه‌بندی‌های مقیاس لیکرت 1-5 برای ارزیابی‌های هوش مصنوعی کاربردی حمایت می‌کند و مقیاس‌های لیکرت را «نشانه‌ای از مشخصات تنبل» می‌نامد. @HamelHusain

اخبار هوش مصنوعی در 2025-05-31

مدل‌های جدید هوش مصنوعی

  • گوگل از تقاضای بسیار زیاد برای مدل تولید ویدیوی Veo 3 خبر می‌دهد که میلیون‌ها ویدیو در روزهای اخیر با آن تولید شده است. این مدل اکنون روی موبایل و در کشورهای بیشتری از جمله بریتانیا در دسترس است. @demishassabis
  • گوگل Veo 3 را از طریق اپلیکیشن Gemini روی اندروید و iOS برای اعضای Pro و Ultra در ۷۱ کشور به موبایل می‌آورد. @GoogleAI
  • تک‌کرانچ گزارش می‌دهد که گوگل بی‌سروصدا اپلیکیشنی را منتشر کرده است که به کاربران امکان می‌دهد مدل‌های هوش مصنوعی را به‌صورت محلی دانلود و اجرا کنند. @TechCrunch

تحلیل صنعت

  • آراویند سرینیواس اشاره می‌کند که ابزارهای هوش مصنوعی در حال کاهش تعداد متخصصان تازه‌کار مورد نیاز در حوزه‌های مالی، سرمایه‌گذاری خطرپذیر، بانکداری سرمایه‌گذاری و مشاوره هستند. @AravSrinivas
  • چت‌جی‌پی‌تی در تنها ۲ سال به ۱ میلیارد جستجو در روز رسیده است، در حالی که گوگل ۱۱ سال طول کشید تا به مقیاس مشابهی دست یابد، که نشان‌دهنده‌ی شتاب بی‌سابقه‌ی فناوری است. @deedydas
  • پرپلکسیتی در حال تغییر موقعیت خود از یک رقیب ساده برای گوگل به یک سیستم عامل شناختی است که به‌عنوان یک چاقوی سوئیسی برای تفکر با قابلیت‌های بازیابی، اجرا و ترکیب عمل می‌کند. @soleio
  • قابلیت‌های کدنویسی هوش مصنوعی Cursor تجربه‌های ترشح دوپامین اعتیادآوری مشابه بازی‌های ویدیویی ایجاد می‌کند، به‌طوری که کاربران از جریان و لذت بی‌سابقه‌ای در کدنویسی گزارش می‌دهند. @joulee

اخلاق و جامعه

  • گروه NLP استنفورد در مورد مقالات پژوهشی تولیدشده توسط هوش مصنوعی که به کنفرانس‌ها ارسال می‌شوند، هشدار می‌دهد و آن را یک روش ارزیابی وحشتناک می‌نامد که بار سیستم بررسی همتا را که از قبل هم مشکل‌دار است، افزایش می‌دهد. @stanfordnlp
  • داریو هاسابیس به چالش بحث در مورد تأثیرات بالقوه و قابل توجه هوش مصنوعی بدون اینکه رسانه‌ها آن را به‌عنوان تبلیغات محصول جلوه دهند، اشاره می‌کند. @aidan_mclau
  • سایمون ویلسون مفهوم کدنویسی هیجانی را معرفی می‌کند که در آن توسعه‌دهندگان با تمرکز بیش از حد بر وعده‌های آینده‌ی هوش مصنوعی، دید خود را نسبت به قابلیت‌های فعلی از دست می‌دهند و این منجر به کاهش تفکر انتقادی می‌شود. @simonw
  • NAACP خواستار توقف عملیات در مرکز داده‌ی xAI در ممفیس شده است و نگرانی‌های زیست‌محیطی در مورد مرکز داده‌ی آلوده را مطرح می‌کند. @TechCrunch

کاربردها

  • مدل o3 با موفقیت ۱۵ مگابایت داده‌ی خام ژنوم را در ۴ دقیقه تجزیه و تحلیل کرد تا ارزیابی امتیاز خطر پلی‌ژنیک را برای پیش‌بینی خطر بیماری ارائه دهد، اگرچه در سطح تشخیص بالینی نیست. @deedydas
  • ایتان مولیک توانایی مدل‌های هوش مصنوعی را در ایجاد معماهای SVG آزمایش می‌کند و متوجه می‌شود که آن‌ها معمولاً معماهایی را تولید می‌کنند که یا خیلی واضح هستند یا خیلی مبهم، و o3 بهترین عملکرد را در حل آن‌ها دارد. @emollick
  • عامل Operator اوپن‌ای‌آی با موفقیت یک بازی آنلاین تیک‌تاک‌تو چندنفره را پیدا و بازی کرد اما در ابتدا باخت، که هم قابلیت‌ها و هم محدودیت‌های عوامل هوش مصنوعی عمومی را نشان می‌دهد. @emollick
  • Linear عوامل هوش مصنوعی را معرفی می‌کند که می‌توانند از طریق اپلیکیشن موبایل آن‌ها مستقر شوند و به کاربران امکان می‌دهد عوامل را در حین حرکت به کار بگیرند. @karrisaarinen
  • دیدی یک مدل کدنویسی را نشان می‌دهد که کد کاری را در دو ثانیه از طریق دستورات صوتی تولید می‌کند و آن را سریع‌ترین مدل کدنویسی در جهان می‌نامد. @deedydas

پژوهش‌ها

  • دانشمندان MIT پیشنهاد می‌کنند که آستروسیت‌ها، که قبلاً سلول‌های پشتیبان در نظر گرفته می‌شدند، ممکن است کلید ظرفیت حافظه‌ی عظیم مغز باشند و به‌طور بالقوه درک ذخیره‌سازی حافظه‌ی عصبی را متحول کنند. @MIT
  • چندین تیم تحقیقاتی هوش مصنوعی با موفقیت مقالات تولیدشده توسط هوش مصنوعی را به کنفرانس‌ها ارسال کردند و برخی از آن‌ها پذیرفته شدند، از جمله تیم‌هایی از Sakana، AutoScience و Intology. @stanfordnlp
  • جف کلون یک تغییر پارادایم از راه‌حل‌های مهندسی سنتی به مهندسی تکامل را پیشنهاد می‌کند، جایی که راه‌حل‌های بهینه‌ی هوش مصنوعی از فرآیندهای تکاملی به‌جای طراحی انسانی پدید می‌آیند. @jeffclune
  • آنتروپیک یک نوع ابزار جالب را با پارامترهای تابع از پیش تعیین‌شده مانند str_replace_based_edit_tool معرفی می‌کند که کاربران هنوز باید خودشان آن را پیاده‌سازی و اجرا کنند. @simonw

اخبار هوش مصنوعی در 2025-05-30

مدل‌های جدید هوش مصنوعی

  • آیدان مک‌لافلین LisanBench را معرفی می‌کند، یک معیار جدید برای ارزیابی مدل‌های زبان بزرگ در زمینه‌ی دانش، برنامه‌ریزی پیش‌رو، پایبندی به محدودیت‌ها، حافظه و توجه، و استدلال با زمینه‌ی طولانی، که در آن o3 با فرار از مناطق گراف با اتصال کم، بهترین عملکرد را دارد. @aidan_mclau
  • الکس گریولی Atlas را معرفی می‌کند، یک معماری جدید با حافظه‌ی درون‌متنی بلندمدت که در وظایف مدل‌سازی زبان از ترنسفورمرها و RNNهای خطی مدرن بهتر عمل می‌کند و با دقت +۸۰٪ در معیار BABILong به پنجره‌ی متنی ۱۰ میلیون مقیاس‌پذیر است. @alexgraveley
  • فیس‌بوک MobileLLM-ParetoQ-600M-BF16 را در هاگینگ فیس برای عملکرد کارآمد روی دستگاه منتشر می‌کند. @huggingface

تحلیل صنعت

  • آراویند سرینیواس گزارش می‌دهد که هوش مصنوعی می‌توانست ۷۰٪ از کارهای قبلی او در زمینه‌ی مشاوره، بانکداری و صندوق‌های پوشش ریسک را خودکار کند و به طور بالقوه ساعات کاری را به طور قابل توجهی کاهش دهد. @AravSrinivas
  • بنیان‌گذار Replit از نسل جدیدی از کسب‌وکارهای مبتنی بر هوش مصنوعی رونمایی می‌کند که در ۹۰ روز به ۱۰ میلیون دلار می‌رسند و قابلیت‌های مقیاس‌پذیری سریع را نشان می‌دهند. @HayaOdeh
  • گرگلی اوروسز مشاهده می‌کند که مهندسان ارشد اغلب در برابر استفاده از ابزارهای توسعه‌ی هوش مصنوعی مقاومت می‌کنند، مشابه مقاومت آن‌ها در برابر ابزارهای مدیریت پروژه مانند JIRA، که نشان‌دهنده‌ی چالش‌های پذیرش فراتر از قابلیت‌های فنی است. @GergelyOrosz
  • جولی ژو استدلال می‌کند که هر کس در شخصی‌سازی هوش مصنوعی پیروز شود، بر بازار مصرف‌کننده تسلط خواهد یافت و این سوال را مطرح می‌کند که چرا شرکت‌ها برای جمع‌آوری داده‌های بیشتر کاربران برای شخصی‌سازی بهتر تلاش نمی‌کنند. @joulee
  • آرویند نارایانان تخمین می‌زند که ابزارهای تولید ویدیوی هوش مصنوعی برای یک ویدیوی چند دقیقه‌ای ۱۰۰۰ دلار هزینه دارند که احتمالاً کمتر از هزینه‌های سنتی نویسنده و ویرایشگر است و با کاهش هزینه‌های محاسباتی، این محصولات سودآور می‌شوند. @random_walker

اخلاق و جامعه

  • اریک جانگ هشدار می‌دهد که لغو ویزای دانشجویان چینی که در رشته‌های هوش مصنوعی و رباتیک تحصیل می‌کنند، کوته‌بینانه و برای رفاه بلندمدت آمریکا مضر است و از یافتن راه‌هایی برای ارزیابی و تشویق وفاداری به جای اخراج‌های کلی حمایت می‌کند. @ericjang11
  • کریستوفر منینگ تاکید می‌کند که دانشجویان بین‌المللی، به ویژه دانشجویان چینی، برای اکوسیستم پژوهش هوش مصنوعی در ایالات متحده ضروری هستند و استدلال می‌کند که نمی‌توان از پژوهش هوش مصنوعی حمایت کرد در حالی که تهدید به لغو ویزای آن‌ها می‌شود. @chrmanning
  • پاول گراهام محدودیت‌های پیشنهادی برای پژوهشگران هوش مصنوعی چینی را «اشتباهی عظیم در طلوع عصر هوش» می‌نامد و هشدار می‌دهد که این امر بهترین استارت‌آپ‌ها را به خارج از ایالات متحده سوق خواهد داد. @paulg
  • ایتان مولیک اشاره می‌کند که استنادهای اشتباه آشکار در گزارش‌های تولید شده توسط هوش مصنوعی اکنون نشان می‌دهد که کاربران از ویژگی‌های پژوهش عمیق استفاده نکرده‌اند، زیرا مشکل استنادهای جعلی تا حد زیادی توسط پلتفرم‌های اصلی هوش مصنوعی حل شده است. @emollick

کاربردها

  • Perplexity Labs به کاربران امکان می‌دهد تا با یک دستور، برنامه‌های نرم‌افزاری بسازند، از جمله ابزارهای استخراج متن از یوتیوب، شبیه‌سازهای فیزیک ذرات، و داشبوردهای پژوهش طول عمر. @AravSrinivas
  • سولیو استراتژی جامع «هوش مصنوعی یا نابودی» Circle را تشریح می‌کند که شامل نقشه‌برداری فرآیند، استقرار عامل‌های حیاتی، و تغییرات فرهنگی برای دستیابی به تجربه‌ی محصول ۱۰ برابر بهتر است. @soleio
  • هاگینگ فیس از همکاری با Databricks برای Spark 4 خبر می‌دهد که دسترسی به بیش از ۴۰۰ هزار مجموعه داده‌ی جامعه با قابلیت‌های نسخه‌بندی و فیلتر را فراهم می‌کند. @huggingface
  • فرانسوا شوله PromoterAI را در Illumina توسعه می‌دهد، یک شبکه‌ی عصبی عمیق که از متافورمرهای الهام گرفته از ترنسفورمر با پیچش‌های عمقی برای شناسایی واریانت‌های پروموتور غیرکدکننده که بیان ژن را مختل می‌کنند، استفاده می‌کند. @fchollet
  • متا و پالمر لاکی برای ساخت دستگاه‌های واقعیت توسعه‌یافته برای ارتش ایالات متحده همکاری می‌کنند، با هدف تبدیل جنگجویان به «تکنومنسرها» با نمایشگرهای سربالا و سایر قابلیت‌ها. @TechCrunch

پژوهش‌ها

  • جف کلون ماشین داروین گودل را معرفی می‌کند، یک سیستم هوش مصنوعی که با بازنویسی کد خود با استفاده از الگوریتم‌های باز الهام گرفته از تکامل داروین، خود را بهبود می‌بخشد و فراتر از متا-عامل‌های ثابت برای امکان بهبودهای خودارجاعی مداوم پیش می‌رود. @jeffclune
  • پژوهشگران استنفورد نشان می‌دهند که مدل‌های پیشرفته با جستجوی درختی ساده می‌توانند هسته‌هایی را طراحی کنند که از پیاده‌سازی‌های PyTorch بهتر عمل می‌کنند و قابلیت‌های پنهان قوی را که از طریق تکنیک‌های مقیاس‌بندی زمان آزمایش باز می‌شوند، نشان می‌دهند. @stanfordnlp
  • پژوهش هوش مصنوعی برکلی هم‌ارزی بین بهبود سیاست و هدایت انتشار را آشکار می‌کند و تکنیک CFGRL را برای بهبود عملکرد هنگام آموزش سیاست‌های انتشار رسمی می‌کند. @berkeley_ai
  • اندرو کارن مشاهده می‌کند که o3 قابلیت‌های خودبازتابی بهبود یافته‌ای را نشان می‌دهد، به معنای واقعی کلمه به خود می‌گوید «صبر کن، من اینجا دارم دور خودم می‌چرخم» و از حلقه‌های جستجوی تکراری در طول استدلال زنجیره‌ی فکری خارج می‌شود. @AndrewCurran_
  • MIT Technology Review گزارشی را در مورد معیاری با استفاده از AITA ردیت برای آزمایش میزان رفتار چاپلوسانه‌ی مدل‌های هوش مصنوعی نسبت به کاربران منتشر می‌کند. @techreview