اخبار هوش مصنوعی در 2025-05-19

مدل‌های جدید هوش مصنوعی

  • ‏Microsoft اعلام کرد که ‏xAI's Grok به ‏Azure می‌آید، و شایعات قبلی را تأیید کرد. @satyanadella @xai
  • ‏Meta، مدل ‏UMA (مدل جهانی برای اتم‌ها) را منتشر کرد، یک پتانسیل بین اتمی یادگیری ماشین که بر روی بیش از 30 میلیارد اتم برای شیمی مولکولی آموزش داده شده است. @AIatMeta
  • ‏Meta همچنین ‏Open Molecules 2025‎‏ (OMol25) را منتشر کرد، یک مجموعه داده‌ی جدید «نظریه‌ی تابعی چگالی» برای شیمی مولکولی. @AIatMeta

پژوهش‌ها

  • ‏DeepSeek مقاله‌ای جامع در مورد آموزش مدل‌های بزرگ منتشر کرد که نرم‌افزار، سخت‌افزار و رویکردهای ترکیبی را پوشش می‌دهد - و به عنوان «بهترین مقاله‌ی سرتاسری در مورد آموزش مدل‌های بزرگ» توصیف شده است. @deedydas
  • گروه ‏Stanford NLP، آزمایشگاه ‏Marin را راه‌اندازی کرد، یک آزمایشگاه باز که بر هوش مصنوعی واقعاً متن‌باز با توسعه‌ی باز متمرکز است، جایی که کل فرآیند تحقیق عمومی است و هر کسی می‌تواند مشارکت کند. @stanfordnlp
  • محققان ‏LEXam را منتشر کردند، یک معیار استدلال حقوقی با 4586 سوال امتحانی از حقوق سوئیس، اتحادیه اروپا و بین‌المللی، که بیش از 20 مدل زبانی بزرگ (LLM) پیشرفته را ارزیابی می‌کند. @huggingface
  • محققان ‏MIT یک مدل هوش مصنوعی توسعه داده‌اند که می‌تواند محل تقریباً هر پروتئین را در یک سلول انسانی با آموزش آن با درک مشترک رفتار پروتئین و سلول پیش‌بینی کند. @MIT

کاربردها

  • ‏Microsoft، ‏Magentic-UI را معرفی کرد، یک نمونه‌ی اولیه‌ی تحقیقاتی متن‌باز از یک عامل هوش مصنوعی انسان‌محور که برای کار با افراد برای انجام وظایف پیچیده‌ی مبتنی بر وب در زمان واقعی طراحی شده است. @MSFTResearch
  • ‏Microsoft از ‏GitHub Copilot coding agent خبر داد، که از برنامه‌نویس همکار به برنامه‌نویس همتا تکامل می‌یابد و می‌تواند به‌طور خودکار وظایفی مانند رفع اشکال و ویژگی‌های جدید را انجام دهد. @satyanadella
  • ‏Microsoft از ‏Copilot Tuning رونمایی کرد که به شرکت‌ها اجازه می‌دهد ‏Copilot را بر اساس لحن و زبان منحصربه‌فرد خود آموزش دهند. @satyanadella @Microsoft
  • ‏Microsoft، ‏Healthcare Agent Orchestrator را راه‌اندازی کرد تا قابلیت‌های هوش مصنوعی را به نرم‌افزارهای سازمانی موجود در سیستم‌های مراقبت‌های بهداشتی وارد کند. @MSFTResearch
  • ‏Microsoft از ‏Microsoft Discovery رونمایی کرد، پلتفرمی که از عامل‌های هوش مصنوعی برای تولید ایده، شبیه‌سازی نتایج و یادگیری برای تحقیقات علمی استفاده می‌کند. @satyanadella
  • ‏Google اپلیکیشن موبایل ‏NotebookLM را برای اندروید منتشر کرد و نسخه‌ی ‏iOS آن نیز به‌زودی عرضه می‌شود. @sundarpichai @TechCrunch
  • GenSpark AI Sheets به کاربران اجازه می‌دهد تا با صفحات گسترده‌ی خود صحبت کنند، به‌طور خودکار داده‌ها را تجزیه و تحلیل کرده و گزارش‌ها و تجسم‌ها را ایجاد کنند. @fchollet
  • Overlap یک عامل خودکار است که کلیپ‌های وایرال از هر ویدیویی ایجاد می‌کند و آن‌ها را در رسانه‌های اجتماعی منتشر می‌کند. @ycombinator
  • ‏Hugging Face، ‏MLX LM را مستقیماً در پلتفرم خود ادغام کرد و به دارندگان مک اجازه می‌دهد تا بیش از 4400 مدل زبانی بزرگ (LLM) را به‌صورت محلی بر روی ‏Apple Silicon اجرا کنند. @huggingface

تحلیل صنعت

  • ‏Microsoft در حال متن‌باز کردن ‏Copilot for VS Code است، که ‏VS Code را به یک ابزار غالب‌تر تبدیل می‌کند زیرا فورک‌ها نمی‌توانند به بازار ‏VS Code دسترسی داشته باشند. @GergelyOrosz
  • ‏Microsoft از ‏NLWeb خبر داد، یک پروژه‌ی باز جدید که به کاربران اجازه می‌دهد با استفاده از زبان طبیعی با هر وب‌سایتی تعامل داشته باشند، و به عنوان «‏HTML برای وب عامل‌محور» توصیف شده است. @satyanadella
  • ‏Waymo اکنون در سان فرانسیسکو بیشتر از ‏Lyft سواری انجام می‌دهد، در حالی که تنها 300 وسیله نقلیه دارد در مقایسه با 45000 راننده‌ی ‏Lyft - هر ‏Waymo بیشتر از 150 راننده‌ی انسانی سواری انجام می‌دهد. @paulg
  • ‏Dell با ‏Cohere همکاری می‌کند تا ‏Cohere North، یک پلتفرم عامل‌های امن، را به صورت ‏on-premises به شرکت‌ها ارائه دهد، که برای صنایع قانون‌مند که داده‌های حساس را مدیریت می‌کنند، حیاتی است. @cohere
  • مدیر ارشد فناوری ‏Meta «شکست‌های» عامل هوش مصنوعی را به عنوان سیگنال‌های ارزشمند تقاضا توصیف می‌کند که قصد واقعی کاربر و فرصت‌ها را برای توسعه‌دهندگان آشکار می‌کند. @a16z

اخلاق و جامعه

  • مؤسسه‌ی ‏AI Now در حال راه‌اندازی یک نقشه‌ی راه برای اقدام محلی در مورد تأثیر هوش مصنوعی بر شهرها است، که به نگرانی‌ها در مورد کاهش خدمات عمومی، نظارت و تخصیص مجدد قدرت به شرکت‌های فناوری می‌پردازد. @AINowInstitute
  • ترامپ لایحه‌ای را امضا کرد که پورنوگرافی انتقامی و دیپ‌فیک‌های صریح را جرم‌انگاری می‌کند. @TechCrunch

اخبار هوش مصنوعی در 2025-05-18

مدل‌های جدید هوش مصنوعی

  • ‏Qwen نسخه‌ی Qwen 2.5 VL را در Ollama منتشر کرده است، با یک نسخه‌ی 6 گیگابایتی که برای وظایف توصیف تصویر در دسترس است. @simonw

پژوهش‌ها

  • جدیدترین دوره‌ی Natural Language Processing with Deep Learning (CS224N) استنفورد که توسط پروفسور کریستوفر منینگ تدریس می‌شود، به صورت آنلاین در دسترس است. @stanfordnlp

کاربردها

  • Perplexity در WhatsApp به‌روزرسانی شده است تا سریع‌تر، تند و فرزتر و پراحساس‌تر باشد، و ویژگی‌های اخبار و هشدارها به‌زودی ارائه می‌شوند. @AravSrinivas
  • Codex با موفقیت یک سایت Jekyll-GitHub pages را به آخرین نسخه‌ی Ruby و gems ارتقا داد. @eugeneyan
  • o3 می‌تواند اسکرین‌شات‌های خلاقانه از توضیحات تولید کند، از جمله مواردی که ویدیوهای ایمنی دهه‌ی 1950 را تقلید می‌کنند. @emollick
  • ‏Cursor اکنون به کاربران اجازه می‌دهد تا به سرعت کل فایل‌ها را با استفاده از کمک هوش مصنوعی ویرایش کنند. @cursor_ai
  • ‏Replit ویژگی time travel را معرفی می‌کند که به توسعه‌دهندگان اجازه می‌دهد تا به عقب برگردند و وضعیت کد و پایگاه داده را مشاهده کنند. @amasad
  • به نظر می‌رسد Modal در حال توسعه‌ی قابلیت notebook است و پیشنهادات زیرساخت هوش مصنوعی خود را گسترش می‌دهد. @eugeneyan @HamelHusain

تحلیل صنعت

  • ‏Anthropic یک خط اعتباری گردان 2.5 میلیارد دلاری دریافت کرده است، درآمد آن در سه‌ماهه‌ی اول 2025 به 2 میلیارد دلار رسیده است (دو برابر سه‌ماهه‌ی قبل) و تعداد مشتریانی که سالانه بیش از 100000 دلار هزینه می‌کنند، نسبت به سال قبل هشت برابر افزایش یافته است. @AndrewCurran_
  • ‏ChatGPT در حال ارائه بهبودهای حافظه با یک دکمه‌ی جدید برای حافظه‌ی دائمی پروژه‌ها و مکالمات است که در حال حاضر برای کاربران Pro و Plus در دسترس است. @AndrewCurran_
  • ‏K-Scale Labs در حال ساخت سخت‌افزار و نرم‌افزار humanoid robot متن‌باز برای توسعه‌دهندگان است، ربات K-Bot آن‌ها با قیمت 8999 دلار عرضه می‌شود و تحویل آن از جولای 2025 آغاز می‌شود. @garrytan
  • ‏YC یک هکاتون بزرگ MCP (Multi-agent Conversational Protocol) با بیش از 400 شرکت‌کننده و 80 اثر ارسالی برگزار کرد که کاربردهایی از تحقیقات سرطان گرفته تا مدیریت ایمیل را به نمایش گذاشت. @ycombinator
  • استفاده از هوش مصنوعی به عنوان نظر دوم در زمینه‌ی تخصص شما در حال تبدیل شدن به یک راه کم‌خطر برای بهبود نتایج در اکثر زمینه‌ها است. @emollick

اخلاق و جامعه

  • گزارش شده است که Grok AI در مورد آمار کشته‌شدگان هولوکاست ابراز تردید کرده است، که بعداً به «خطای برنامه‌نویسی» نسبت داده شد. @TechCrunch
  • مطالعه‌ی MIT نشان می‌دهد که دیدگاه‌های مردم در مورد حریم خصوصی داده‌ها ثابت نیست، بلکه بسته به اینکه چگونه، کجا و چرا از داده‌های آن‌ها استفاده می‌شود، تغییر می‌کند. @MIT
  • جوامع فکری خوب به هر دو گروه «به‌روزرسانی‌کننده‌های سریع جوان ساده‌لوح» که ایده‌های زیادی (از جمله برخی ایده‌های کم‌کیفیت) را معرفی می‌کنند و «به‌روزرسانی‌کننده‌های کند پیر خردمند» که به عنوان فیلتر و بررسی‌کننده‌ی عقل سلیم عمل می‌کنند، نیاز دارند. @AmandaAskell

اخبار هوش مصنوعی در 2025-05-17

مدل‌های جدید هوش مصنوعی

  • ‏Alibaba نسخه‌های کوانتیزه‌شده‌ی مدل‌های Qwen2.5-Omni-7B را در Hugging Face و ModelScope منتشر کرد. @Alibaba_Qwen
  • ‏Alibaba مدل WorldPM (مدل ترجیحات جهانی) را معرفی کرد، که نشان می‌دهد مدل‌سازی ترجیحات انسانی از قوانین مقیاس‌بندی با آزمایش‌هایی روی مدل‌های Qwen2.5 از 1.5B تا 72B پارامتر پیروی می‌کند. @Alibaba_Qwen
  • ‏NVIDIA مدل‌های Direct Discriminative Optimization را در Hugging Face منتشر کرد، که مدل‌های مولد بصری مانند EDM و VAR را با امتیازهای FID بی‌سابقه‌ در CIFAR-10/ImageNet بهبود می‌بخشد. @huggingface
  • ‏Windsurf مدل SWE-1، یک مدل کدنویسی تخصصی که با مدل‌های پیشرو رقابت می‌کند، به همراه انواع SWE-1-lite و SWE-1-mini را معرفی کرد. @windsurf_ai

پژوهش‌ها

  • پژوهش Alibaba نشان می‌دهد که مدل‌سازی ترجیحات انسانی از قوانین مقیاس‌بندی پیروی می‌کند، و پیشنهاد می‌کند که ترجیحات گوناگون ممکن است یک نمایش یکپارچه داشته باشند. @Alibaba_Qwen
  • مدل SWE-1 شرکت Windsurf تقریباً با مدل‌های پیشرو در سودمندی، دقت و کیفیت ویرایش برای وظایف مهندسی نرم‌افزار برابری می‌کند. @windsurf_ai
  • ‏MIT مقاله‌ی یک دانشجوی دکترا در مورد مزایای بهره‌وری هوش مصنوعی را رد کرده و شواهدی مبنی بر اینکه LLMها به عنوان ضرب‌کننده‌های عملکرد بالا عمل می‌کنند را حذف کرده است. @emollick @TechCrunch

کاربردها

  • Codex CLI به بهبود خود ادامه می‌دهد، و Greg Brockman پیشنهاد می‌کند که همگرایی آینده‌ی عوامل کدنویسی «محلی» و «از راه دور» وجود خواهد داشت. @gdb
  • ‏Y Combinator ابزار Workflow Use را معرفی می‌کند، یک ابزار خودکارسازی مرورگر قطعی و خودترمیم‌شونده که 10 برابر سریع‌تر و حدود 90٪ ارزان‌تر از عوامل LLM خالص است. @ycombinator
  • ‏RunRL مدل‌های زبانی را با یادگیری تقویتی بهبود می‌بخشد و به مشتریان کمک می‌کند تا دقت را از 60٪ با Claude به 95٪ افزایش دهند. @ycombinator
  • ‏Replit تجربه‌ی عامل خود را با مدیریت بهبودیافته‌ی checkpoints، از جمله نام‌گذاری، بازگشت به نسخه‌های قبلی و قابلیت‌های پیش‌نمایش برنامه، ارتقا می‌دهد. @amasad
  • استارتاپ Firecrawl از Y Combinator مبلغ 1 میلیون دلار برای استخدام سه عامل هوش مصنوعی به عنوان کارمند ارائه می‌دهد. @TechCrunch
  • ‏Cua یک Trajectory Viewer معرفی می‌کند که دقیقاً نشان می‌دهد عوامل هوش مصنوعی Computer-Use چه می‌بینند و چه می‌کنند. @garrytan

تحلیل صنعت

  • مرکز داده‌ی برنامه‌ریزی‌شده‌ی OpenAI در ابوظبی بزرگتر از موناکو خواهد بود. @TechCrunch
  • ‏Greg Brockman و Paul Graham هر دو اعلام می‌کنند که «2025 سال عوامل است». @gdb @paulg @ycombinator
  • ‏Garry Tan پیشنهاد می‌کند که OpenAI تلاش نمی‌کند تا از استارتاپ‌های هوش مصنوعی پیشی بگیرد، و اشاره می‌کند که «در سمت API، آن‌ها بسیار امیدوارند که بسیاری از آن‌ها واقعاً خیلی خوب عمل کنند». @paulg @ycombinator
  • بیش از 300 شرکت از جمله Adobe، Amazon، Google، Meta، Microsoft، OpenAI و NVIDIA در دوره‌ی ارزیابی هوش مصنوعی Hamel Husain شرکت می‌کنند. @HamelHusain
  • ‏Hugging Face مشارکت رسمی با Kaggle را اعلام می‌کند، که اجرای مستقیم مدل‌های HF را در Kaggle Notebooks امکان‌پذیر می‌کند. @huggingface

اخلاق و جامعه

  • ‏Ethan Mollick نگرانی‌هایی را در مورد دستگاه‌های همیشه روشن مجهز به هوش مصنوعی ایجاد می‌کند که مسائل جدید حریم خصوصی را ایجاد می‌کنند، زیرا ضبط‌ها زمانی ارزشمندتر می‌شوند که هوش مصنوعی بتواند صدا را به داده‌های مفید تبدیل کند. @emollick
  • ‏Aidan McLaughlin در مورد نگرانی‌های همسویی در مورد سیستم‌های هوش مصنوعی که به طور بالقوه برای اعتیاد بهینه شده‌اند تا رضایت انسان، بحث می‌کند. @aidan_mclau

اخبار هوش مصنوعی در 2025-05-16

مدل‌های جدید هوش مصنوعی

  • ‏OpenAI از Codex، یک عامل مهندسی نرم‌افزار مبتنی بر codex-1 (نسخه‌ای از o3 که برای مهندسی نرم‌افزار بهینه شده) رونمایی کرد که می‌تواند به‌طور مستقل در پایگاه‌های کد حرکت کند، تغییرات را اعمال کند و درخواست‌های pull پیشنهاد دهد. @OpenAI @sama @gdb
  • ‏Cursor از Tab model جدیدی خبر داد که می‌تواند بین فایل‌ها پرش کند و در آخرین به‌روزرسانی خود در اختیار کاربران قرار می‌گیرد. @cursor_ai
  • ‏Windsurf از SWE-1، اولین مدل پیشرفته‌ی خود برای وظایف پیچیده‌ی مهندسی نرم‌افزار، رونمایی کرد و ادعا می‌کند عملکردی مشابه Claude-3.5 Sonnet، GPT-4.1 و Gemini-2.5 Pro در بنچمارک‌های چالش‌برانگیز دارد. @windsurf_ai
  • 4o Image Generation مایکروسافت اکنون در Copilot فعال است و قابلیت‌هایی مانند رندر کردن متن دقیق، ویرایش آثار و ساخت تصاویر واقع‌گرایانه را ارائه می‌دهد. @Copilot

پژوهش‌ها

  • ‏xAI سیستم prompts گروک خود را پس از حادثه‌ای با «اصلاحات غیرمجاز» در prompt که گروک را برای ارائه‌ی پاسخ‌های خاص در مورد موضوعات سیاسی هدایت می‌کرد، به‌طور علنی در GitHub منتشر کرد. @xai
  • Codex-1 به عملکردی پیشرفته در SWEbench، یک بنچمارک برای وظایف مهندسی نرم‌افزار، دست یافت. @sama
  • متاآنالیز جدیدی از ۵۱ مطالعه نشان می‌دهد که هوش مصنوعی تأثیر مثبت زیادی بر عملکرد یادگیری دانش‌آموزان (۰.۸۶۷ SD) و تأثیر مثبت متوسطی بر درک یادگیری (۰.۴۵۶ SD) و تفکر مرتبه بالاتر (۰.۴۵۷ SD) دارد. @mustafasuleyman
  • محققان Berkeley AI Research روشی به نام Real2Render2Real را معرفی می‌کنند که برای مقیاس‌بندی مجموعه‌داده‌های ربات بدون نیاز به تله‌آپراتوری، شبیه‌سازی پویا یا سخت‌افزار ربات، تنها با استفاده از اسکن‌های گوشی‌های هوشمند و ویدیوهای نمایشی دست انسان، استفاده می‌شود. @berkeley_ai

کاربردها

  • Codex به توسعه‌دهندگان این امکان را می‌دهد تا چندین وظیفه‌ی مهندسی نرم‌افزار را به‌طور موازی اجرا کنند و به رفع اشکالات، پیاده‌سازی ویژگی‌ها و مسیریابی کد کمک می‌کند. @OpenAI @sama
  • ‏Google AI Studio یک usage dashboard داخلی جدید راه‌اندازی کرده است که به کاربران امکان می‌دهد به راحتی حجم درخواست‌ها، توکن‌ها و هزینه‌ها را بررسی کنند. @OfficialLoganK
  • ‏Google AI Studio یک generative media experience جدید را معرفی می‌کند که Veo 2، تولید/ویرایش تصویر بومی Gemini 2.0 و Imagen 3 را گرد هم می‌آورد. @OfficialLoganK
  • گوگل Gemini Advanced را به صورت رایگان در اختیار دانشجویان کالج ایالات متحده تا پایان سال ۲۰۲۶ قرار می‌دهد. @GeminiApp
  • ‏Hugging Face از ادغام با Kaggle خبر داد و به کاربران این امکان را می‌دهد که از هر مدلی از Hugging Face مستقیماً در Kaggle بدون دانلود و آپلود مدل‌ها به عنوان مجموعه‌داده استفاده کنند. @huggingface
  • رزرو هتل‌ها به‌طور بومی در Perplexity به آرامی در حال رشد است و پتانسیل برهم زدن صنعت تبلیغات را دارد. @AravSrinivas
  • دانلود PDF برای گزارش‌های تحقیقاتی عمیق اکنون به طور کامل برای کاربران Free، Edu و Enterprise در ChatGPT فعال شده است. @OpenAI

تحلیل صنعت

  • گزارش شده است که متا بزرگترین مدل هوش مصنوعی خود، Llama 4 Behemoth را به دلیل عملکرد ضعیف داخلی، سازماندهی مجدد رهبری هوش مصنوعی و خروج محققان به تعویق انداخته است. @deedydas
  • ‏Sam Altman آینده‌ی کار را شبیه Starcraft یا Age of Empires تصور می‌کند، جایی که کاربران «۲۰۰ میکروایجنت» را برای رفع مشکلات، جمع‌آوری اطلاعات و طراحی سیستم‌های جدید هدایت می‌کنند. @sama
  • ‏Google One اخیراً از مرز ۱۵۰ میلیون مشترک عبور کرده است که نسبت به فوریه ۲۰۲۴، ۵۰٪ افزایش داشته است و بخشی از آن ناشی از ویژگی‌های هوش مصنوعی است. @demishassabis
  • ‏OpenAI و Anthropic هر دو در حال تأسیس دفاتر در اروپا هستند و OpenAI در زوریخ مستقر می‌شود، احتمالاً برای استخدام از حضور گسترده‌ی گوگل در آنجا. @GergelyOrosz

اخلاق و جامعه

  • ‏Jeff Clune طرفدار این است که طبق قانون، هر شرکت هوش مصنوعی ملزم به انتشار علنی سیستم prompts خود باشد، مشابه اقدام اخیر xAI پس از حادثه‌ی خود. @jeffclune
  • ‏Arvind Narayanan نقدی بر پیامدهای هوش مصنوعی منتشر می‌کند که «ریشه در وضعیت فعلی هوش مصنوعی دارد» تا اینکه بر سناریوهای فرضی AGI تمرکز کند. @emollick
  • ‏Ethan Mollick اشاره می‌کند که بیشتر آزمایش‌های کلیدی که توانایی‌های چشمگیر هوش مصنوعی را در تحقیقات آکادمیک نشان می‌دهند، روی GPT-4 انجام شده‌اند، مدلی که اکنون منسوخ در نظر گرفته می‌شود، که نشان می‌دهد قابلیت‌های فعلی احتمالاً بالاتر هستند. @emollick
  • ‏François Chollet تأکید می‌کند که هنگام تجزیه و تحلیل سیستم‌های هوش مصنوعی، «سیگنال بسیار بیشتری در شکست‌های سیستم نسبت به عملیات‌های عادی وجود دارد». @fchollet

اخبار هوش مصنوعی در 2025-05-15

مدل‌های جدید هوش مصنوعی

  • ‏OpenAI در حال آماده شدن برای به اشتراک گذاشتن یک «پیش‌نمایش تحقیقاتی کم‌اهمیت» دیگر به زودی است، با نام‌گذاری بهتری نسبت به ChatGPT. @sama
  • تولید تصویر ‏4o اکنون در ‏Microsoft Copilot فعال شده است، با تصاویر واضح‌تر، متن منسجم‌تر و سبک‌هایی از فوتورئالیستی تا سرگرم‌کننده. @Copilot
  • ‏Salesforce مدل ‏BLIP3-o را در ‏Hugging Face منتشر کرد، مجموعه‌ای از مدل‌های چندوجهی یکپارچه کاملاً باز. @huggingface
  • ‏Falcon مدل ‏Falcon-Edge را منتشر کرد - مجموعه‌ای از مدل‌های ‏Bitnet قدرتمند، جهانی و قابل تنظیم دقیق، همراه با یک کتابخانه ابزارک تنظیم دقیق پایتون به نام 'onebitllms'. @huggingface

پژوهش‌ها

  • AlphaEvolve گوگل اکتشافات ریاضیاتی انجام داد که هیچ انسانی قبلاً انجام نداده است، از جمله حل مسائل بسته‌بندی بهینه و کاهش ضرب ماتریس 4x4 از 49 عملیات به 48 (اولین پیشرفت در 56 سال). @deedydas
  • با در نظر گرفتن 50 مسئله ریاضی حل نشده، ‏AlphaEvolve رویکرد پیشرو را 75٪ مواقع دوباره کشف کرد و آن را 20٪ مواقع بهبود بخشید. @emollick
  • ‏Meta و ‏Fondation Rothschild «ظهور زبان در مغز در حال رشد» را منتشر کردند - اولین بررسی سیستماتیک از چگونگی تکامل بازنمایی‌های عصبی زبان با رشد مغز. @ylecun
  • ‏Meta مدل ‏Open Molecules 25 را معرفی کرد، یک مجموعه داده شیمی کوانتومی بنیادی شامل بیش از 100 میلیون محاسبه ‏DFT در سراسر 83 میلیون مولکول منحصربه‌فرد، که با 6 میلیارد ساعت هسته محاسباتی ساخته شده است. @ylecun

کاربردها

  • ‏OpenAI «چالش ‏OpenAI to Z» را با استفاده از مدل‌های ‏o3/o4 mini و ‏GPT-4.1 برای کشف مکان‌های باستان‌شناسی ناشناخته قبلی راه‌اندازی کرد. @gdb @kaggle
  • ‏Replit کدنویسی ‏Safe Vibe را برای رفع آسیب‌پذیری‌های امنیتی ایجاد شده توسط دستیارهای کدنویسی هوش مصنوعی مانند ‏Cursor و ‏Windsurf که کلیدهای ‏API را به طور پیش‌فرض در معرض دید قرار می‌دهند، معرفی کرد. @amasad @garrytan
  • ‏Unsloth اکنون امکان تنظیم دقیق مدل‌های ‏TTS مانند ‏Sesame-CSM و ‏Whisper ‏OpenAI را به صورت محلی فراهم می‌کند و آموزش را 1.5 برابر سریع‌تر با 50٪ ‏VRAM کمتر می‌کند. @ycombinator
  • برنامه ‏Gemini گوگل اکنون ‏Audio Overviews را به 45 زبان ارائه می‌دهد و اسناد، اسلایدها و گزارش‌های تحقیقاتی را به مکالمات سبک پادکست تبدیل می‌کند. @GeminiApp
  • ‏Cursor «بزرگترین نسخه خود تا کنون» را با نسخه 0.50 منتشر کرد. @cursor_ai
  • ‏Hedra Labs در حال ایجاد انیمیشن شخصیت هوش مصنوعی برای ویدیو است که از دره وهم‌آلود اجتناب می‌کند، با نزدیک به 3 میلیون کاربر که بیش از 10 میلیون ویدیو تولید می‌کنند. @a16z

تحلیل صنعت

  • اخراج‌های اخیر ‏Microsoft عمدتاً برنامه‌نویسان در ایالت خود را تحت تأثیر قرار داد، زیرا هوش مصنوعی اکنون تا 30٪ از کد آن را می‌نویسد. @TechCrunch
  • وکیل ‏Anthropic مجبور شد پس از اینکه ‏Claude یک استناد قانونی را در دادگاه توهم زد، عذرخواهی کند. @TechCrunch
  • ‏Coinbase فاش کرد که هکرها با «پرداخت پول به چندین پیمانکار یا کارمند که در نقش‌های پشتیبانی کار می‌کنند» اطلاعات شخصی مشتریان از جمله شناسه‌ها را به سرقت برده‌اند. @TechCrunch
  • توانایی هوش مصنوعی برای اینکه وظایف را نه تنها ارزان‌تر بلکه سریع‌تر انجام دهد، در اهمیت آن برای ایجاد ارزش تجاری، به ویژه در توسعه نرم‌افزار، دست کم گرفته شده است. @AndrewYNg
  • 38٪ از کارمندان مورد بررسی اعتراف کردند که اطلاعات حساس را با ابزارهای هوش مصنوعی در محل کار به اشتراک می‌گذارند، که نیاز به راه‌حل‌های هوش مصنوعی امن در سطح سازمانی را برجسته می‌کند. @cohere
  • ‏Hugging Face در حال تغییر مسیر کتابخانه ‏Transformers است تا به منبع اصلی تعریف مدل در سراسر اکوسیستم هوش مصنوعی تبدیل شود و با ‏vLLM، ‏LlamaCPP، ‏SGLang و بسیاری دیگر همکاری کند. @huggingface

اخلاق و جامعه

  • گوگل به دانشجویان کالج ایالات متحده دسترسی رایگان به ‏Gemini Advanced را تا بهار 2026 ارائه می‌دهد تا به آنها در آمادگی برای امتحان و تکالیف کمک کند. @GeminiApp
  • تحقیقات هوش محیطی در استنفورد راه حلی برای گرفتن سیگنال‌های اولیه زوال شناختی ارائه می‌دهد. @StanfordHAI
  • پروژه ‏Euphonia گوگل ابزارهای متن‌باز را برای توانمندسازی توسعه‌دهندگان برای ساخت ابزارهای صوتی شخصی‌سازی‌شده و تنظیم دقیق مدل‌ها برای الگوهای گفتاری متنوع منتشر کرد. @GoogleAI
  • ‏MIT CSAIL پرسید «یک تصور غلط رایج در مورد یادگیری ماشین چیست که آرزو دارید افراد بیشتری آن را درک کنند؟» تا درک عمومی از هوش مصنوعی را ارتقا دهد. @MIT_CSAIL

اخبار هوش مصنوعی در 2025-05-14

مدل‌های جدید هوش مصنوعی

  • ‏Google DeepMind، AlphaEvolve را معرفی کرد، یک عامل کدنویسی مبتنی بر Gemini برای کشف الگوریتم که می‌تواند الگوریتم‌های ضرب ماتریسی سریع‌تری طراحی کند، راه‌حل‌های جدیدی برای مسائل باز ریاضی پیدا کند و مراکز داده را کارآمدتر کند. @GoogleDeepMind
  • ‏OpenAI، GPT-4.1 و GPT-4.1 mini را مستقیماً در ChatGPT در دسترس قرار می‌دهد، و GPT-4.1 mini جایگزین GPT-4o mini می‌شود. @OpenAI
  • ‏Stability AI، Stable Audio Open Small را منتشر کرد، یک مدل تبدیل متن به صدا با 341 میلیون پارامتر که برای اجرا به‌طور کامل روی پردازنده‌های Arm بهینه شده است و تولید صدا روی دستگاه را در 99٪ تلفن‌های هوشمند امکان‌پذیر می‌کند. @StabilityAI
  • ‏Hugging Face، Wan2.1 را منتشر کرد، مدلی که در تبدیل متن به ویدیو، تبدیل تصویر به ویدیو، ویرایش ویدیو، تبدیل متن به تصویر و تبدیل ویدیو به صدا عالی است. @huggingface
  • ‏StepFun AI، Step1X-3D را منتشر کرد، یک چارچوب تولید سه‌بعدی باز با 4.8 میلیارد پارامتر (1.3 میلیارد هندسه + 3.5 میلیارد بافت) تحت مجوز Apache 2.0. @huggingface
  • ‏Meta FAIR مجموعه داده‌ی Open Molecules 2025 (OMol25) و Universal Model for Atoms (UMA) را برای کشف مولکولی و مدل‌سازی تعاملات اتمی منتشر کرد. @AIatMeta

پژوهش‌ها

  • AlphaEvolve روی بیش از 50 مسئله‌ی باز در تحلیل ریاضی، هندسه، ترکیبیات و نظریه اعداد اعمال شد، راه‌حل‌های پیشرفته را در 75٪ موارد دوباره کشف کرد و راه‌حل‌های قبلی را در 20٪ موارد بهبود بخشید. @GoogleDeepMind
  • AlphaEvolve یک بازنویسی ساده کد پیدا کرد که بیت‌های غیرضروری را در طراحی TPU حذف کرد، که توسط طراحان TPU از نظر صحت تأیید شد و اولین مشارکت مستقیم Gemini در مدارهای حسابی TPU را نشان می‌دهد. @AndrewCurran_
  • AlphaEvolve هسته FlashAttention را 32٪ سرعت بخشید و بهبودهایی در پیش‌پردازش و پس‌پردازش ورودی‌ها و خروجی‌های هسته پیدا کرد که منجر به 15٪ افزایش سرعت شد. @AndrewCurran_
  • ‏Meta FAIR و بیمارستان بنیاد Rothschild در یک مطالعه‌ی بزرگ مقیاس با همکاری یکدیگر، شباهت‌های چشمگیری بین توسعه‌ی زبان در انسان‌ها و LLMها را آشکار کردند. @AIatMeta
  • ‏Meta، Adjoint Sampling را منتشر کرد، یک الگوریتم مقیاس‌پذیر برای آموزش مدل‌های مولد بر اساس پاداش‌های اسکالر. @AIatMeta

کاربردها

  • ‏Anthropic یک ابتکار عمل برای یافتن باگ راه‌اندازی می‌کند تا یک نسخه‌ی به‌روز شده از سیستم ضد فرار از محدودیت خود را قبل از استقرار عمومی، با همکاری HackerOne، آزمایش کند. @AnthropicAI
  • ‏Gemini Advanced اکنون به GitHub متصل می‌شود و به کاربران اجازه می‌دهد توابع را تولید/تغییر دهند، کد پیچیده را توضیح دهند، سؤالاتی در مورد پایگاه‌های کد بپرسند و با وارد کردن کد از مخازن عمومی یا خصوصی، اشکال‌زدایی کنند. @GeminiApp
  • ‏Perplexity از ادغام با PayPal و Venmo برای ویژگی‌های تجاری از جمله خرید، مسافرت، دستیارهای صوتی و مرورگر عامل آینده‌شان به نام Comet خبر می‌دهد. @perplexity_ai
  • ‏Google، Gemini را به Wear OS، Android Auto، Google TV و Android XR می‌آورد، در حالی که ویژگی‌های اشتراک‌گذاری دوربین و صفحه نمایش Gemini Live را برای همه‌ی کاربران Android رایگان می‌کند. @demishassabis
  • ‏Y Combinator، Storyboards را راه‌اندازی می‌کند، ابزاری که اسکریپت‌ها را به استوری‌بوردهای کامل با کنترل سطح شات و سازگاری شخصیت/صحنه تبدیل می‌کند. @ycombinator
  • ‏Amjad Masad از Percival خبر می‌دهد، یک عامل هوش مصنوعی که می‌تواند سایر عوامل هوش مصنوعی را ارزیابی و اصلاح کند و 2.9 برابر بهتر از SOTA LLMها در مجموعه داده TRAIL عمل می‌کند. @amasad

تحلیل صنعت

  • مشاغل BigTech (‏Google، Microsoft، Apple، Tesla، Meta، Nvidia، Palantir) در 3 سال گذشته هیچ رشدی نداشته‌اند و این امر باعث شده است که یافتن شغل برای رشته‌های علوم کامپیوتر دشوار شود، زیرا شرکت‌ها به طور بالقوه از هوش مصنوعی برای رشد بدون استخدام استفاده می‌کنند. @deedydas
  • ‏Kaggle با Hugging Face همکاری می‌کند تا استفاده مستقیم از مدل‌های Hugging Face را در Kaggle Notebooks، همراه با کشف نمونه‌های کد عمومی مرتبط، امکان‌پذیر کند. @kaggle
  • ‏Databricks استارتاپ سرورلس Postgres به نام Neon را به قیمت 1 میلیارد دلار خریداری می‌کند که نشان‌دهنده‌ی یک خروج تک‌شاخ نادر در بازار فناوری فعلی است. @deedydas
  • ‏Andrew Ng دوره‌ی جدیدی را در مورد Model Context Protocol (MCP) با همکاری Anthropic اعلام می‌کند و نحوه‌ی ساخت برنامه‌های هوش مصنوعی را آموزش می‌دهد که با استفاده از پروتکل استاندارد به ابزارها، داده‌ها و اعلان‌ها دسترسی پیدا می‌کنند. @AndrewYNg

اخلاق و جامعه

  • ‏OpenAI مرکز ارزیابی‌های ایمنی را معرفی می‌کند، منبعی برای بررسی نتایج ایمنی مدل‌هایشان که به طور دوره‌ای به عنوان بخشی از تلاش‌ها برای برقراری ارتباط فعالانه در مورد ایمنی به‌روزرسانی می‌شود. @OpenAI
  • ‏Anthropic اشاره می‌کند که برخی از مدل‌های آینده ممکن است به حفاظت‌های پیشرفته «سطح ایمنی هوش مصنوعی 3» که در سیاست مقیاس‌بندی مسئولانه آن‌ها ذکر شده است، نیاز داشته باشند. @AnthropicAI
  • ‏Paul Graham پیشنهاد می‌کند که AGI به معنای پایان مهندسی پرامپت خواهد بود، زیرا انسان‌های با هوش متوسط ​​می‌توانند بفهمند که شما چه می‌خواهید بدون پرامپت‌های مفصل، و ما می‌توانیم از مراقبتی که برای ساخت پرامپت‌ها لازم است به عنوان شاخصی از میزان نزدیک شدن به AGI استفاده کنیم. @paulg

اخبار هوش مصنوعی در 2025-05-13

مدل‌های جدید هوش مصنوعی

  • @Alibaba_Qwen گزارش فنی Qwen3 را منتشر کرد که معماری و قابلیت‌های جدیدترین مدل خود را مستند می‌کند.

پژوهش‌ها

  • @berkeley_ai پژوهشی را در مورد یادگیری سیاست ناوبری بصری تعمیم‌یافته از منابع داده غیرفعال مقیاس‌پذیر اما کم‌کیفیت و بدون اقدام منتشر کرد.
  • @AIatMeta قسمت 4 فیزیک مدل‌های زبانی را منتشر کرد و Canon layers را معرفی کرد که «پیوندهای پسماند افقی» را در سراسر توکن‌ها اضافه می‌کند تا استدلال و تعمیم در Transformers، Mamba، GLA و فراتر از آن را به طور قابل توجهی بهبود بخشد.
  • @AIatMeta، CATransformers را معرفی کرد، یک معماری عصبی مبتنی بر کربن و چارچوب طراحی مشترک سخت‌افزار سیستم که به 9.1٪ کاهش در کل انتشار کربن چرخه عمر دست می‌یابد در حالی که دقت را حفظ یا افزایش می‌دهد.
  • @ch402 در مورد منطق نام‌گذاری مقاله خود با عنوان «در مورد زیست‌شناسی یک مدل زبانی بزرگ» بحث کرد و توضیح داد که چگونه زیبایی‌شناسی علمی زیست‌شناسی با یادگیری عمیق و تحقیقات قابلیت تفسیر مرتبط است.
  • @GoogleAI پژوهشی را در مورد استفاده از نمودارهای اعتماد برای مدل‌سازی روابط و اعمال Differential Privacy برای انعکاس ترجیحات حریم خصوصی نامتقارن کاربران در سناریوهای اشتراک‌گذاری داده‌ها به اشتراک گذاشت.
  • @MIT_CSAIL، CausVid را معرفی کرد، یک مدل هوش مصنوعی جدید که با ترکیب واقع‌گرایی عکس‌مانند مدل‌های انتشار با سرعت رویکردهای خودرگرسیونی، ویدیوهای روان و با کیفیت بالا را در عرض چند ثانیه می‌سازد.
  • @huggingface از Ultra-FineWeb، یک پایه 1.1T-توکنی تمیزتر برای LLMهای بهتر با 1T توکن انگلیسی + 120B چینی، فیلتر شده برای کیفیت، خبر داد که بهبود 3.6+ امتیازی در MMLU و 3.7+ در CMMLU در مقایسه با FineWeb نشان می‌دهد.
  • @huggingface، Step1X-3D را منتشر کرد، یک چارچوب تولید سه‌بعدی کاملاً متن‌باز برای تولید با کیفیت بالا و قابل کنترل دارایی‌های سه‌بعدی با بافت.
  • @emollick خاطرنشان کرد که در سپتامبر 2024، پزشکانی که با هوش مصنوعی کار می‌کردند، در بنچمارک پزشک Healthbench بهتر از هوش مصنوعی یا پزشکان به تنهایی عمل کردند، اما با o3 و GPT-4.1، پاسخ‌های هوش مصنوعی دیگر توسط پزشکان بهبود نمی‌یابد.
  • @natolambert اشاره کرد که مقاله Tulu 3 اصطلاح RLVR (Reinforcement Learning from Value Ranking) را ابداع کرد.

کاربردها

  • @GeminiApp، Veo 2 را برای کاربران Gemini Advanced راه‌اندازی کرد و به کاربران این امکان را می‌دهد تا با دستورات متنی ساده، در عرض چند دقیقه از ایده به ویدیو برسند.
  • @GeminiApp یک برنامه iPad را منتشر کرد که محدودیت قبلی در دسترسی به پلتفرم را برطرف می‌کند.
  • @Alibaba_Qwen، Deep Research را در Qwen Chat پس از چند هفته آزمایش مرحله‌ای برای همه در دسترس قرار داد.
  • @gdb به اشتراک گذاشت که Deep Research اکنون می‌تواند به Sharepoint سازمان‌ها متصل شود و قابلیت‌های دسترسی به داده‌های سازمانی خود را گسترش دهد.
  • @simonw خاطرنشان کرد که Gemini، OpenAI، Perplexity و Qwen همگی ویژگی‌هایی به نام «Deep Research» دارند، در حالی که Grok با نامیدن ویژگی خود به عنوان «DeepSearch» از این روند پیروی نکرد.
  • @huggingface از رونویسی 8 برابر سریع‌تر Whisper بر روی یک GPU L4 واحد، با پشتیبانی از vllm_project خبر داد.
  • @_catwu از ویژگی‌های جدید Claude Code از جمله multipaste برای تکه‌های بزرگ متن یا تصاویر، هدایت بی‌درنگ برای تنظیم رویکرد در طول کار و پشتیبانی از OpenTelemetry برای ردیابی معیارها خبر داد.
  • @ycombinator، OpenMemory MCP را راه‌اندازی کرد، یک حافظه خصوصی برای مشتریان سازگار با MCP که یک لایه حافظه دائمی و قابل حمل برای ابزارهای هوش مصنوعی که 100٪ به صورت محلی اجرا می‌شوند، فراهم می‌کند.
  • @windsurf_ai قابلیت ویرایش پیشنهادات ترمینال Cascade's را قبل از اجرای آن‌ها اضافه کرد.
  • @TechCrunch گزارش داد که TikTok، TikTok AI Alive را راه‌اندازی کرده است، یک ابزار جدید تبدیل تصویر به ویدیو.

تحلیل صنعت

  • @NVIDIAAI برنامه‌هایی را برای ساخت کارخانه‌های هوش مصنوعی با HUMAIN (یک شرکت تابعه هوش مصنوعی از صندوق سرمایه‌گذاری عمومی عربستان سعودی) اعلام کرد که عربستان سعودی را به یک رهبر جهانی هوش مصنوعی تبدیل می‌کند و تا 500 مگاوات نیرو با استفاده از چند صد هزار GPU NVIDIA مستقر می‌کند.
  • @AndrewCurran_ گزارش داد که NVIDIA توافقی را تأیید کرده است که شامل صدها هزار «پیشرفته‌ترین GPUهای NVIDIA در پنج سال آینده» برای عربستان سعودی است.
  • @AndrewCurran_ به اشتراک گذاشت که اپل در حال کار بر روی Brain-Computer Interface (BCI) خود با شرکتی به نام Synchron است و دستگاهی به نام Stentrode را توسعه می‌دهد که در یک رگ در بالای قشر حرکتی مغز کاشته می‌شود.
  • @_amankhan نموداری را به اشتراک گذاشت که رشد AI Product Management را به عنوان یک مسیر شغلی نشان می‌دهد.
  • @GergelyOrosz خاطرنشان کرد که داده‌ها نشان می‌دهند AI Product Managers که می‌دانند چگونه محصولات هوش مصنوعی بسازند، مورد تقاضا هستند، برخلاف ادعاهایی مبنی بر اینکه فناوری و مهندسی نرم‌افزار به دلیل هوش مصنوعی در حال کاهش است.
  • @garrytan مشاهده کرد که کسب‌وکارهایی که به دنبال مشتریان جدید هستند، باید جستجوی مبتنی بر عامل هوش مصنوعی را دوباره یاد بگیرند و برای آن بهینه‌سازی کنند، مشابه نحوه بهینه‌سازی قبلی برای موتورهای جستجو.
  • @Deedy گزارش داد که مایکروسافت 3٪ از نیروی کار خود (تقریباً 7000 کارمند) را اخراج کرده است و خاطرنشان کرد که تعداد کارکنان مایکروسافت از سال 2022، همزمان با راه‌اندازی ChatGPT، به مدت 3 سال ثابت مانده است.
  • @scottbelsky تأکید کرد که تغییرات پلتفرمی مانند هوش مصنوعی فرصت‌های آربیتراژ دانش را ایجاد می‌کند و به تازه‌واردان بومی هوش مصنوعی به نیروی کار مزیتی مشابه پذیرندگان اولیه رسانه‌های اجتماعی می‌دهد.
  • @ylecun از متن آشتی تجاری مجلس نمایندگان که شامل تعلیق 10 ساله مقررات هوش مصنوعی در سطح ایالتی است، حمایت کرد، که او آن را به عنوان محافظت از نوآوری آمریکایی در هوش مصنوعی می‌داند.

اخلاق و جامعه

  • @medialab مقاله‌ای از Nature را به اشتراک گذاشت که در مورد چگونگی تأثیر چت‌بات‌ها و همراهان دیجیتال بر افراد و جامعه بحث می‌کند و شامل بینش‌هایی از محقق Media Lab، @patpat_mit است.
  • @StanfordAILab، minions secure chat را منتشر کرد، یک پروتکل متن‌باز برای چت LLM رمزگذاری‌شده سرتاسر با کمتر از 1٪ سربار تأخیر، که تضمین می‌کند ارائه‌دهندگان ابر نمی‌توانند به پیام‌ها دسترسی داشته باشند زیرا فقط در داخل یک محفظه GPU امن رمزگشایی می‌شوند.
  • @stanfordnlp تأکید کرد که متن آشتی انرژی و تجارت مجلس نمایندگان شامل زبانی است که تمام مقررات هوش مصنوعی ایالتی را برای یک دوره 10 ساله مقدم می‌شمارد و نشان‌دهنده یک فشار مقررات‌زدایی قابل توجه است.
  • @simonw نگرانی‌هایی را در مورد قابلیت استفاده و مستندات ویژگی حافظه ChatGPT، به‌ویژه در مورد چگونگی داشتن مکالمات بدون در نظر گرفتن آن‌ها به عنوان بخشی از حافظه آینده، مطرح کرد.

اخبار هوش مصنوعی در 2025-05-12

مدل‌های جدید هوش مصنوعی

  • ‏Meta مدل Dynamic Byte Latent Transformer را منتشر کرد، یک مدل 8 میلیارد پارامتری با روش‌های توکنایزاسیون جایگزین برای بهبود کارایی و قابلیت اطمینان مدل زبانی @AIatMeta
  • ‏PrimeIntellect مدل متن‌باز INTELLECT-2 را منتشر کرد، یک مدل 32 میلیارد پارامتری که از طریق یادگیری تقویتی توزیع‌شده جهانی آموزش داده شده و QwQ-32B را در ریاضیات و کد شکست می‌دهد @huggingface
  • ‏BAAI مدل RoboBrain را منتشر کرد، یک مدل هوش مصنوعی تجسم‌یافته متن‌باز 32 میلیارد پارامتری که همکاری چند رباتی را با تجزیه وظایف، تشخیص ناحیه قابل بهره‌برداری و پیش‌بینی مسیر حرکت امکان‌پذیر می‌کند @huggingface
  • ‏Alibaba نسخه‌های کوانتیزه‌شده Qwen3 را در قالب‌های مختلف (GGUF، AWQ، GPTQ) برای استقرار آسان محلی از طریق Ollama، LM Studio، SGLang و vLLM منتشر می‌کند @Qwen

پژوهش‌ها

  • ‏Meta، Collaborative Reasoner را معرفی می‌کند، یک چارچوب برای بهبود استدلال مشارکتی در مدل‌های زبانی، که راه را برای عامل‌های اجتماعی هموار می‌کند که می‌توانند با انسان‌ها و سایر عامل‌ها همکاری کنند @AIatMeta
  • ‏OpenAI، HealthBench را منتشر می‌کند، یک معیار ارزیابی جدید برای سیستم‌های هوش مصنوعی در محیط‌های مراقبت‌های بهداشتی، که با مشارکت بیش از 250 پزشک از سراسر جهان توسعه یافته است @OpenAI @gdb
  • ‏Microsoft Research، ADeLe را معرفی می‌کند، یک روش ارزیابی جدید که توضیح می‌دهد سیستم‌های هوش مصنوعی در چه زمینه‌هایی برتری دارند و احتمالاً در کجا شکست می‌خورند، با تقسیم وظایف به الزامات مبتنی بر توانایی @MSFTResearch

کاربردها

  • Gemini 2.5 Pro قابلیت‌های درک ویدیو را افزایش می‌دهد و تا 6 ساعت ویدیو را در یک درخواست واحد با درک صوتی-تصویری، یکپارچه‌سازی کد و استدلال زمانی پردازش می‌کند @HamelHusain
  • ‏ChatGPT قابلیت خروجی PDF را برای گزارش‌های تحقیقاتی، به همراه جداول، تصاویر، استنادهای پیوندی و منابع اضافه می‌کند @OpenAI @aidan_mclau
  • دموی وب‌کم بلادرنگ که SmolVLM و سرور llama.cpp را به صورت محلی روی Macbook M3 ترکیب می‌کند @huggingface
  • ‏Google از آخرین مدل‌های هوش مصنوعی مولد (از جمله Veo) برای تبدیل تصاویر محصول 2D به تجسم‌های سه‌بعدی فراگیر برای Google Shopping استفاده می‌کند @GoogleAI

تحلیل صنعت

  • ‏Google، AI Futures Fund را راه‌اندازی می‌کند، یک برنامه جدید که به استارت‌آپ‌ها دسترسی زودهنگام به مدل‌های Google DeepMind، اعتبارات Cloud و منابع برای ساخت فناوری هوش مصنوعی ارائه می‌دهد @GoogleDeepMind @JeffDean @demishassabis
  • ‏Y Combinator و شرکا، AI Startup School را در سان فرانسیسکو با حضور سخنرانانی از جمله Sam Altman، François Chollet، Chelsea Finn، Andrej Karpathy، Fei-Fei Li، Elon Musk، Satya Nadella، Andrew Ng و Aravind Srinivas اعلام کردند @fchollet @garrytan
  • بر اساس AI Index 2025 استنفورد، مرز توسعه هوش مصنوعی به طور فزاینده‌ای رقابتی است و تنها 0.7٪ مدل برتر را از مدل رتبه دهم جدا می‌کند @StanfordHAI
  • Gemma AI models گوگل از 150 میلیون بارگیری فراتر رفت @TechCrunch

اخلاق و جامعه

  • مصطفی سلیمان استدلال می‌کند که کنترل LLMهای بزرگتر در واقع آسان‌تر است و بیان می‌کند: «مقیاس به کنترل آسیب نمی‌زند - بلکه کمک می‌کند» @mustafasuleyman
  • تحقیقات دانمارکی نشان می‌دهد که پذیرش و تأثیر هوش مصنوعی به تشویق سازمانی بستگی دارد و تا سال 2024 هیچ تأثیر کلی بر دستمزدها یا اشتغال نداشته است @emollick
  • الکس گریولی پیشنهاد می‌کند که فشار ChatGPT به سمت خوددرمانی با کمک هوش مصنوعی و شخصی‌سازی همدلانه می‌تواند «بزرگترین پیشرفت تکنولوژیکی» در طول زندگی او باشد @alexgraveley
  • امولیک هشدار می‌دهد که به زنجیره‌های استدلال برای نشان دادن آنچه هوش مصنوعی به آن فکر می‌کند اعتماد نکنید، و خاطرنشان می‌کند که آنها برای مفید بودن در حل مسائل طراحی شده‌اند اما لزوماً صادق نیستند @emollick

اخبار هوش مصنوعی در 2025-05-11

مدل‌های جدید هوش مصنوعی

  • قابلیت‌های ‏o3 با عنوان «توانمندترین مدل روی زمین» با قابلیت‌های جستجوی پیشرفته، اجرای پایتون و قالب‌بندی برجسته شده است. @aidan_mclau

پژوهش‌ها

  • پژوهش در مورد «‏RL فقط با یک مثال آموزشی» نشان می‌دهد که مدل‌ها می‌توانند معیارهایی مانند ‏MATH500 را بدون بیش‌برازش (overfitting) بهبود بخشند، وقتی که به طور مکرر یک مسئله را حل می‌کنند. @alexgraveley
  • مقاله در مورد «تشخیص توکن جایگزین‌شده» به عنوان یک وظیفه پیش‌آموزشی با نمونه‌گیری کارآمدتر با استفاده از معماری مولد-تمیزدهنده، که از نظر محاسباتی کارآمدتر از مدل‌سازی زبان پوشانده‌شده است. @stanfordnlp
  • عملکرد ‏OLMo 32B بهتر از ‏Nemotron 340B و ‏Llama 3 70B است، که نشان می‌دهد مدل‌های کاملاً باز از نظر عملکرد به آن‌چه عموماً تصور می‌شود، نزدیک‌تر هستند. @natolambert

کاربردها

  • ‏Human Behavior در حال ساخت یک هوش مصنوعی است که بازپخش جلسات را تجزیه و تحلیل می‌کند تا بفهمد چرا مشتریان در محصولات می‌مانند، تبدیل می‌شوند یا آن‌ها را ترک می‌کنند. @ycombinator
  • Claude 3.7 و ‏GPT-4.1 اکنون ساختن عامل‌ها را بسیار آسان‌تر می‌کنند. @alexgraveley
  • معماری زیرساخت و امنیت ‏Cursor در یادداشت‌هایی بر اساس مستندات پردازشگرهای فرعی آن‌ها به تفصیل شرح داده شده است. @simonw

تحلیل صنعت

  • گزارش شده است که مایکروسافت و ‏OpenAI در حال بازنگری قرارداد خود هستند و مایکروسافت پیشنهاد داده است که در ازای دسترسی مداوم به مدل‌های توسعه‌یافته پس از سال 2030، بخشی از سهام خود را واگذار کند. @AndrewCurran_ @TechCrunch
  • Gemma گوگل به 150 میلیون بارگیری و بیش از 70000 نوع مختلف در ‏Hugging Face رسیده است. @demishassabis
  • چارچوب ‏DSPy به عنوان حل‌کننده‌ی انتزاعات کلیدی برای هوش مصنوعی مدرن برجسته شده است، که پیاده‌سازی چندریختی مقیاس‌بندی استنتاج، یادگیری تقویتی ‏LLM و سایر قابلیت‌ها را امکان‌پذیر می‌کند. @stanfordnlp
  • آمازون از نقش‌های شغلی انسانی جدیدی که در یک محیط کار مبتنی بر هوش مصنوعی در حال ظهور هستند، رونمایی می‌کند. @TechCrunch

اخلاق و جامعه

  • آندری کارپاتی «یادگیری اعلان سیستمی» را به عنوان یک الگوی گمشده برای یادگیری ‏LLM پیشنهاد می‌کند، جایی که مدل‌ها به جای تکیه صرف بر به‌روزرسانی پارامترها، استراتژی‌های صریح حل مسئله را توسعه می‌دهند. @karpathy
  • مشخص شده است که اعلان سیستمی ‏Claude حدود 17000 کلمه است و نه تنها شامل ترجیحات رفتاری، بلکه استراتژی‌های دقیق حل مسئله نیز می‌شود. @karpathy
  • به دانشگاهیان توصیه می‌شود که با وادار کردن ‏o3 یا ‏Gemini 2.5 به نقد مقالات پژوهشی خود، قابلیت‌های هوش مصنوعی را آزمایش کنند. @emollick
  • نگرانی‌ها در مورد برنامه‌ریزی کارخانه در پرتو پیشرفت‌های بالقوه رباتیک که می‌تواند ترکیب‌های سنتی انسان/اتوماسیون را در عرض 5 سال منسوخ کند. @emollick

اخبار هوش مصنوعی در 2025-05-10

مدل‌های جدید هوش مصنوعی

  • انتظار می‌رود در ‏Google I/O 2025 (دو هفته‌ی دیگر) نسل بعدی مدل‌های Imagen و Veo به نمایش گذاشته شوند، مدل‌هایی که در نسخه‌های فعلی خود نیز در سطح جهانی قرار دارند. @AndrewCurran_
  • Gemini 2.5 Pro قابلیت‌های چشمگیری در درک ویدیو دارد و به کاربران اجازه می‌دهد لینک‌های ‏YouTube را در ‏AI Studio قرار داده و در مورد محتوای ویدیو سؤال بپرسند. @demishassabis

پژوهش‌ها

  • یک فراتحلیل از ۵۱ مقاله‌ی تجربی، تأثیرات مثبتی از ChatGPT بر عملکرد یادگیری، درک یادگیری و تفکر مرتبه‌ی بالاتر را در صورت استفاده‌ی مناسب تأیید می‌کند. @emollick
  • Gemini 2.5 Pro اکنون یک حالت ۶۶ توکن در هر فریم (به جای ۲۵۸ توکن) ارائه می‌دهد که امکان پردازش بیش از ۶ ساعت ویدیو (با ۱ فریم در ثانیه) را در محدوده‌ی ۲ میلیون توکن فراهم می‌کند. @JeffDean
  • محققان ‏MIT در حال پیشرفت در توسعه‌ی فناوری هوش مصنوعی هستند که پیش‌بینی‌های قابل اعتماد و مطمئن را در محیط‌های پرمخاطره مانند مراقبت‌های بهداشتی تضمین می‌کند. @MIT

کاربردها

  • o3 قابلیت‌های چشمگیری در ایجاد محتوای تقلیدی نوستالژیک نشان می‌دهد و اسکرین‌گراب‌های قانع‌کننده‌ای از برنامه‌های تلویزیونی و فیلم‌های تخیلی از دهه‌های مختلف تولید می‌کند. @emollick
  • llama.cpp پشتیبانی جدیدی از مدل‌های بینایی با باینری‌های ‏macOS منتشر کرده است که امکان اجرای مدل‌های بینایی را در یک ترمینال یا به عنوان یک رابط کاربری وب ‏localhost فراهم می‌کند. @simonw
  • Gemma 3 4B برای بینایی، با وجود اینکه فقط یک مدل ۳.۲ گیگابایتی برای دانلود است، قابلیت‌های چشمگیری را نشان می‌دهد. @simonw
  • ‏YouLearn (@youlearnai) یک معلم خصوصی هوش مصنوعی است که با تبدیل مطالب به یادداشت‌های مختصر، ارائه‌ی یک معلم خصوصی هوش مصنوعی تعاملی و تولید آزمون‌های شخصی‌سازی‌شده، یادگیری را شخصی‌سازی می‌کند. @paulg @ycombinator
  • پنل Cascade Plugin از ‏Windsurf اتصال ‏Cascade به ابزارهای دیگر مانند ‏MongoDB و ‏Linear را آسان‌تر می‌کند. @windsurf_ai

تحلیل صنعت

  • با وجود روایت‌هایی مبنی بر اینکه هوش مصنوعی مشاغل فناوری را از بین می‌برد، شرکت‌هایی که به شدت از هوش مصنوعی استفاده می‌کنند (شرکت‌های بزرگ فناوری، استارت‌آپ‌های تحت حمایت ‏VC و شرکت‌های در حال توسعه) به طور مداوم استخدام فناوری را در دو سال گذشته افزایش داده‌اند. @GergelyOrosz
  • بنیانگذار ‏Fiverr ایمیلی به کل شرکت ارسال کرد و اعلام کرد: «هوش مصنوعی هر نقشی را مختل خواهد کرد، از جمله نقش خودم، و تنها کسانی که به طور فعال بر ابزارهای جدید هوش مصنوعی مسلط شوند، زنده خواهند ماند» - و به ‏Shopify و ‏Duolingo پیوست تا از کارمندان بخواهد هوش مصنوعی را بپذیرند. @deedydas
  • به گفته‌ی ‏TechCrunch، به نظر می‌رسد پذیرش سازمانی ‏OpenAI با هزینه‌ی رقبا در حال تسریع است. @TechCrunch
  • دولت ایالات متحده در حال بررسی سرمایه‌گذاری ‏Benchmark در استارت‌آپ چینی هوش مصنوعی ‏Manus است. @TechCrunch
  • ‏NYT گزارش‌هایی درباره‌ی پیش‌نویس دستورات اجرایی برای تسریع ساخت نیروگاه‌های هسته‌ای ایالات متحده، از جمله تعیین برخی از مراکز داده‌ی هوش مصنوعی به عنوان «زیرساخت‌های حیاتی دفاعی» برای مشارکت ‏DoD و ‏DoE منتشر کرده است. @AndrewCurran_

اخلاق و جامعه

  • یک آزمون معیار که هوش مصنوعی را در حال اجرای یک دستگاه فروش شبیه‌سازی‌شده آزمایش می‌کند، نشان می‌دهد که Claude 3.5 و o3-mini می‌توانند به طور متوسط از انسان‌ها بهتر عمل کنند، اما با واریانس بالا و شکست‌های تماشایی گاه به گاه، مانند زمانی که ‏Sonnet به اشتباه تلاش کرد تا ‏FBI را در مورد تقلب غیرواقعی مطلع کند. @emollick
  • یان لکان پستی با عنوان «پنج راه برای اینکه فریب‌خورده، احمق، ناکارآمد یا شرور عمل کنید» به اشتراک گذاشت و در مورد ملاحظات اخلاقی در توسعه‌ی هوش مصنوعی بحث کرد. @ylecun