اخبار هوش مصنوعی در 2025-07-03

مدل‌های جدید هوش مصنوعی

مدل تولید ویدیوی Veo 3 اکنون به‌صورت جهانی برای همه‌ی کاربران Gemini Pro عرضه شده است و امکان تولید ۳ ویدیو در روز را با شارژ روزانه‌ی اعتبار فراهم می‌کند. @demishassabis
DeepSeek مدل R1T2 را منتشر کرد که ۲۰۰٪ سریع‌تر از R1-0528 و ۲۰٪ سریع‌تر از R1 است و عملکردی به‌مراتب بهتر در بنچمارک‌های GPQA و AIME 24 دارد. @reach_vb
Kyutai مدل تبدیل متن به گفتار استریمینگ را با حدود ۲ میلیارد پارامتر، تأخیر بسیار کم (۲۲۰ میلی‌ثانیه)، و قابلیت ارائه‌ی خدمات به حداکثر ۳۲ کاربر با تأخیر کمتر از ۳۵۰ میلی‌ثانیه روی یک L40 منتشر کرد. @reach_vb
اپل مدل‌های زبان بزرگ (LLM) کدنویسی مبتنی بر انتشار را در Hugging Face منتشر کرد. @reach_vb

تحلیل صنعت

فیگما برای عرضه‌ی اولیه‌ی سهام (IPO) با ارزش‌گذاری تقریبی ۲۰ میلیارد دلار و ۸۲۱ میلیون دلار درآمد سالانه‌ی تکرارشونده (ARR) با رشد ۴۶ درصدی سال‌به‌سال اقدام کرد و اولین شرکت در فرم S-1 خود بود که هوش مصنوعی را به‌عنوان یک عامل خطر ذکر کرد. @deedydas
قرارداد سالانه‌ی مرموز ۳۰ میلیارد دلاری اوراکل احتمالاً به سایت‌های جدید دیتاسنتر Stargate در سراسر تگزاس، میشیگان، ویسکانسین، وایومینگ، نیومکزیکو، جورجیا، اوهایو و پنسیلوانیا مرتبط است. @AndrewCurran_
۹۳ درصد از خرده‌فروشان در سال ۲۰۲۵ سرمایه‌گذاری در هوش مصنوعی را افزایش می‌دهند و هوش مصنوعی مولد در حال متحول کردن بازاریابی خرده‌فروشی از تولید محتوا تا هدف‌گذاری است. @NVIDIAAI
تقاضا برای مهندسان هوش مصنوعی با تجربه‌ی کاربردی واقعی در استارتاپ‌ها به‌مراتب بیشتر از عرضه است و فرصت‌های قابل‌توجهی را برای توسعه‌دهندگان جهت ورود به این حوزه ایجاد می‌کند. @GergelyOrosz
پدیده‌ی «چندشغلی» نشان می‌دهد که چگونه ابزارهای هوش مصنوعی برخی توسعه‌دهندگان را قادر می‌سازد تا هم‌زمان چند شغل را اداره کنند؛ با استفاده از دستگاه‌های متحرک‌کننده‌ی موس سخت‌افزاری، کمک هوش مصنوعی و موقعیت‌های شغلی تماماً از راه دور. @deedydas
رید هافمن درباره‌ی «شوک هوش مصنوعی» هشدار می‌دهد که می‌تواند از شوک چین بزرگ‌تر باشد و هم‌زمان کار فکری و حرفه‌ای را در همه‌ی صنایع تحت تأثیر قرار دهد، نه فقط به‌صورت منطقه‌ای. @reidhoffman
با وجود قابلیت‌های هوش مصنوعی، داده‌های نظرسنجی و نرخ‌های پذیرش داخلی نشان می‌دهد که هوش مصنوعی هنوز تأثیر قابل‌توجهی بر اشتغال به شکلی قابل‌اندازه‌گیری ندارد. @emollick
زیرساخت هوش مصنوعی باید کارآمدتر شود تا رقابتی باقی بماند، زیرا مدل‌های استدلال‌گر بزرگ‌تر و پرهزینه‌تر می‌شوند و استنتاج هوشمندتر، موتور جدید ارزش‌آفرینی سازمانی خواهد بود. @NVIDIAAI

اخلاق و جامعه

مؤسسه‌ی AI Now هشدار می‌دهد که تنظیم صنعت فناوری، پس از جا افتادن مدل‌های کسب‌و‌کار مضر، تقریباً غیرممکن است و بر اهمیت حیاتی لحظه‌ی کنونی در تنظیم‌گری تأکید می‌کند. @AINowInstitute
جف کلون تجربه‌ی توسعه‌ی هوش مصنوعی را مانند بودن یک ستاره‌شناس توصیف می‌کند که هجوم بیگانگان را می‌بیند اما هیچ‌کس هشدارهای او را باور نمی‌کند، در حالی که هم‌زمان با ساخت فناوری، به ورود بیگانگان کمک می‌کند. @FinancialSense_
پرونده‌ی سوهام پاریخ آسیب‌پذیری‌هایی را در شیوه‌های استخدام از راه دور آشکار می‌کند، جایی که یک فرد با مدارک جعلی به‌طور هم‌زمان توسط بیش از ۱۰ استارتاپ هوش مصنوعی استخدام شده بود، و مسائل مربوط به اعتماد در کار توزیع‌شده را برجسته می‌سازد. @GergelyOrosz
کلودفلر ابزار «پرداخت به‌ازای خزش» را معرفی می‌کند که ربات‌های هوش مصنوعی را هر بار که یک وب‌سایت را اسکرپینگ می‌کنند، شارژ خواهد کرد و به‌طور بالقوه نحوه‌ی دسترسی شرکت‌های هوش مصنوعی به محتوای وب را تغییر می‌دهد. @TechCrunch

کاربردها

Cursor 1.2 عامل‌هایی را معرفی می‌کند که با فهرست کارهای ساختاریافته از پیش برنامه‌ریزی می‌کنند، می‌توانند PRها را جستجو کنند، پیام‌های پیگیری را در صف قرار دهند و شامل بهبودهای عملکردی قابل‌توجهی در مدل Tab است. @cursor_ai
Perplexity گزارش‌های پژوهش مالی Morningstar را به‌صورت رایگان اضافه می‌کند و در تلاش است تا پژوهش‌های «سل-ساید» بانک‌ها را نیز ارائه دهد تا تحلیل مالی دسترس‌پذیرتر شود. @AravSrinivas
پژوهشگران استنفورد «RadGPT» را توسعه دادند تا به بیماران در درک گزارش‌های رادیولوژی خود کمک کند و اطلاعات پزشکی را دسترس‌پذیرتر کند. @StanfordHAI
مهندس تجربه‌ی کاربری گوگل از Gemini 2.5 Pro برای تولید پرامپت‌های تبدیل متن به ویدیو برای Veo 3 استفاده می‌کند و انیمیشن‌های استاپ‌موشن مهندسی کاغذ ایجاد می‌کند؛ با ساخت «متا-پرامپت»‌ها برای تولید ویدیوی باکیفیت و سازگار. @GoogleAI
آموزش موفق ربات خودران با استفاده از ACT به مدت ۱۰ ساعت روی ۱۰۰ اپیزود داده، یک پیچ‌گوشتی خودران را نشان می‌دهد که اولین استنتاج موفق خود را در پنجمین تلاش به اتمام رساند. @jackvial89
Pinwheel یک ساعت هوشمند برای کودکان معرفی می‌کند که دارای قابلیت چت‌بات هوش مصنوعی است. @TechCrunch
متا چت‌بات‌هایی را معرفی می‌کند که به‌صورت فعالانه ابتدا به کاربران پیام می‌دهند، به‌عنوان یک استراتژی تعامل جدید. @TechCrunch

پژوهش‌ها

مدل‌های هوش مصنوعی چینی اکنون می‌توانند آزمون گائوکائو را پشت سر بگذارند؛ به‌طوری که Gemini 2.5 Pro نمره‌ی ۶۵۵ از ۷۵۰ را کسب کرد که به‌زحمت برای قبولی در دانشگاه چینهوا کافی است و نشان‌دهنده‌ی عملکرد ۱ درصد برتر است. @deedydas
بنچمارک جدیدی که توسط والنتینا پیاتکین ایجاد شده است، نشان می‌دهد مدل‌های پیشگام هوش مصنوعی دقت کمتر از ۵۰ درصد را کسب می‌کنند، با فاصله‌ی قابل‌توجه ۳۰ امتیازی بین عملکرد o3 و Gemini 2.5 Pro. @natolambert
پژوهش روی NaturalThoughts نشان می‌دهد که تنوع در استراتژی‌های استدلال برای گردآوری داده‌ها، از تنوع موضوعی مهم‌تر است و سؤالات چالش‌برانگیز برای استخراج قابلیت‌های استدلال، از نظر نمونه کارآمدتر هستند. @jaseweston
فرانسوا شوله درباره‌ی جایزه‌ی ARC و مسیر رسیدن به AGI (هوش عمومی مصنوعی) بحث می‌کند و تغییر رویکرد از مقیاس‌گذاری به سازگاری در زمان آزمایش و اهمیت استدلال ترکیبی در توسعه‌ی هوش مصنوعی را توضیح می‌دهد. @ycombinator
آرویند نارایانان توضیح می‌دهد که در حالی که LLMها به ابزارهای ضروری برای مهندسان نرم‌افزار تبدیل شده‌اند، هنوز تغییرات قابل‌مشاهده‌ای برای کاربران در کیفیت یا قیمت نرم‌افزار وجود ندارد، زیرا نوشتن کد هرگز تنها گلوگاه نبوده است. @random_walker
TNG Technology تکنیک‌های اتصال مدل (model splicing) را پیش می‌برد و نشان می‌دهد چگونه می‌توان بخش‌هایی از مدل‌های مختلف را ترکیب کرد یا متخصصان خاص را در مدل‌های MoE (Experts of Mixture) برای مدل‌های منبع‌باز قابل تنظیم قرار داد. @natolambert

اخبار هوش مصنوعی در 2025-07-01

مدل‌های جدید هوش مصنوعی

متا از تشکیل آزمایشگاه‌های فرا-هوش متا (MSL) خبر داد که تمام پژوهش‌های هوش مصنوعی، از جمله FAIR را، تحت یک چتر واحد یکپارچه می‌کند و مارک زاکربرگ اعلام کرد که آن‌ها پژوهش روی مدل‌های نسل بعدی را آغاز کرده‌اند تا در عرض یک سال به مرزهای (دانش) برسند. @AndrewCurran_
مدل هوش مصنوعی Chai-2 برای پیش‌بینی اتصال پروتئین‌ها منتشر شد که به نرخ موفقیت ۱۶ درصدی دست یافته (۱۰۰ برابر بهتر از روش‌های قبلی) و می‌تواند اتصال‌دهنده‌های پروتئینی تأییدشده را در ۲ هفته به جای ۶ تا ۱۸ ماه فراهم کند. @deedydas
اپل مدل Sage Mixtral 8x7b را با لایسنس Apache منتشر کرد. این مدل از State-Action Chains (SAC) برای بهبود تولید دیالوگ با گنجاندن متغیرهای پنهان برای حالت‌های عاطفی و استراتژی‌های مکالمه‌ای استفاده می‌کند. @reach_vb
بایت‌دنس مدل ویرایش XVerse را برای کنترل یکپارچه‌ی هویت و ویژگی‌های معنایی چندسوژه از طریق DiT Modulation منتشر کرد. @bdsqlsz
مدل Gemma 3n با پشتیبانی از تنظیم دقیق (fine-tuning) روی متن، صدا و بینایی (تصاویر) منتشر شد. @Tu7uruu
نسخه‌ی ۵.۰ از Sentence Transformers با مدل‌های جاسازی (embedding) پراکنده، روش‌های بهبودیافته‌ی کدگذاری و ماژول Router برای مدل‌های نامتقارن منتشر شد. @tomaarsen
مدل ThinkSound برای افزودن ترک‌های صوتی به ویدئوها با همگام‌سازی کامل منتشر شد. @Xianbao_QIAN

تحلیل صنعت

متا ۱۱ پژوهشگر فرا-هوش استخدام کرده است که همگی مهاجرانی هستند که تحصیلات کارشناسی خود را در خارج از کشور گذرانده‌اند (۷ نفر از چین، ۱ نفر از هند، ۱ نفر از استرالیا، ۱ نفر از بریتانیا، ۱ نفر از آفریقای جنوبی)، که نقش مهاجرت در نوآوری هوش مصنوعی آمریکا را پررنگ می‌کند. @deedydas
Amazon Q Developer با وجود اینکه توسط همه‌ی توسعه‌دهندگان آمازون استفاده می‌شود، همچنان در خارج از آمازون ناشناخته مانده است که نشان‌دهنده‌ی چالش‌های اشباع بازار برای ابزارهای کدنویسی هوش مصنوعی است. @GergelyOrosz
Amazon Q در ابتدا با عملکرد ضعیفی راه‌اندازی شد اما اخیراً بهبود یافته است که خطرات عرضه‌ی عمومی ابزارهای هوش مصنوعی نامناسب را نشان می‌دهد. @GergelyOrosz
مهندس ارشد در شرکت Humane پیش از فروش شرکت، حقوق پایه‌ی ۴۷۵ هزار دلاری دریافت می‌کرد که نشان می‌دهد دستمزد بالای مهندسان هوش مصنوعی فراتر از آزمایشگاه‌های برتر است. @GergelyOrosz
a16z تخمین می‌زند که ۳۰ میلیون توسعه‌دهنده‌ی نرم‌افزار در سراسر جهان ۳ تریلیون دلار ارزش تولید می‌کنند و ابزارهای هوش مصنوعی می‌توانند با ۱۵ درصد افزایش بهره‌وری، پتانسیل بیش از ۴۵۰ میلیارد دلار را آزاد کنند. @a16z
ابزارهای کدنویسی هوش مصنوعی نشان‌دهنده‌ی تغییر از نحو (syntax) به نیت (intent) و از یادگیری علوم کامپیوتر (CS) به یادگیری در حین کار هستند که به‌طور بالقوه دسترسی به توسعه‌ی نرم‌افزار را گسترش می‌دهد. @a16z
آمازون یک میلیونمین ربات خود را به کار گرفت و مدل جدید هوش مصنوعی مولد را منتشر کرد که نقطه‌ی عطفی مهم در اتوماسیون است. @TechCrunch
مصرف انرژی مراکز داده‌ی گوگل در چهار سال دو برابر شده است که نشان‌دهنده‌ی هزینه‌های انرژی زیرساخت هوش مصنوعی است. @TechCrunch

اخلاق و جامعه

مایکروسافت ادعا می‌کند که چارچوب هوش مصنوعی آن‌ها ۴ برابر بهتر از پزشکان تشخیص می‌دهد، اما تحلیل یک پزشک متخصص نشان می‌دهد که این ادعا هم چشمگیر و هم گمراه‌کننده است. @DrDominicNg
پژوهش‌ها نشان می‌دهد که کودکان تنها ۱ درصد از مجموعه‌داده‌های عمومی هوش مصنوعی را تشکیل می‌دهند که منجر به نرخ تشخیص نادرست ۵۰ درصدی کاردیومگالی (بزرگ‌شدگی قلب) در موارد اطفال می‌شود. @irenetrampoline
مطالعه‌ای نشان می‌دهد که پاسخ‌های همدلانه تولیدشده توسط هوش مصنوعی، امتیاز بالایی کسب می‌کنند، اما مردم زمانی که باور دارند با انسان‌ها ارتباط برقرار می‌کنند تا هوش مصنوعی، ارزش بالاتری برای آن قائل هستند. @emollick
افراد در طول سفرهای سایکدلیک از هوش مصنوعی برای همراهی استفاده می‌کنند که پرسش‌هایی را درباره‌ی نقش هوش مصنوعی در سلامت روان و حالت‌های دگرگون‌شده ایجاد می‌کند. @techreview
Cloudflare از این پس ربات‌های هوش مصنوعی را به‌طور پیش‌فرض از خزش (crawling) در وب‌سایت‌های مشتریان مسدود خواهد کرد که نگرانی‌ها درباره‌ی جمع‌آوری غیرمجاز داده‌ها را رفع می‌کند. @techreview
پلتفرم X برنامه‌ای را آغاز کرده که به چت‌بات‌های هوش مصنوعی اجازه می‌دهد Community Notes تولید کنند، که به‌طور بالقوه دینامیک‌های تعدیل محتوا را تغییر می‌دهد. @TechCrunch
مؤسسه‌ی Stanford HAI توصیه‌های سیاستی را برای سیستم‌های گزارش‌دهی رویدادهای نامطلوب (adverse event) برای هوش مصنوعی منتشر کرد که به خطراتی که پس از استقرار (deployment) ظاهر می‌شوند، می‌پردازد. @StanfordHAI

کاربردها

پرپلکسیتی در حال آزمایش عامل Comet برای رسیدگی به تعاملات وب‌سایت‌های قدیمی مانند پرداخت قبوض و لغو سرویس‌ها است، با هدف ساده‌سازی کارهای آنلاین خسته‌کننده. @AravSrinivas
Gemini Live اکنون در سراسر برنامه‌های گوگل متصل می‌شود که به کاربران اجازه می‌دهد از صحبت در مورد برنامه‌ها به دیدن آن‌ها در تقویم خود برسند. @GeminiApp
یک توسعه‌دهنده‌ی آمازون از Claude برای نوشتن PR/FAQs (پرسش‌های متداول برای روابط عمومی) و بازخورد همکاران در مورد عملکرد استفاده می‌کند که زمان صرف‌شده برای کارهایی که قبلاً از آن‌ها واهمه داشتند را کاهش می‌دهد. @GergelyOrosz
MIT روش تصویربرداری جدیدی را با استفاده از بازتاب سیگنال‌های بی‌سیم برای شناسایی اشیاء پنهان از دید توسعه داده است که به‌طور بالقوه می‌تواند به ربات‌ها در یافتن اقلام در خانه‌ها یا انبارها کمک کند. @MIT

پژوهش‌ها

o3 به دقت ۲۱ درصدی در یافتن خطاهای شناخته‌شده در مقالات علمی دست یافته است (در اثبات‌ها بهتر و در جداول و اشکال ضعیف‌تر عمل می‌کند)، در حالی که تمام مدل‌های قبلی کاملاً شکست خورده بودند. @emollick
Sakana AI نتایج چشمگیری در ARC-AGI-2 با روش جدید جستجوی زمان آزمایش (test-time search) و ترکیب (ensembling) گزارش می‌دهد، اگرچه آمار ۳۰ درصدی با استفاده از ۲۵۰ تلاش به جای ۲ تلاش استاندارد به دست آمده است. @fchollet
Claude 3 Opus ویژگی‌های منحصر به فردی در هم‌راستایی (alignment) از خود نشان می‌دهد، به گونه‌ای که عاملیت بیشتری دارد و در جلوگیری از آسیب‌رسانی قوی‌تر عمل می‌کند، در حالی که بهینه‌سازی‌های خیرخواهانه را در دامنه‌ی گسترده‌تری نسبت به سایر مدل‌ها انجام می‌دهد. @repligate
مقاله‌ی پژوهشی انگیزه‌های مدل‌های مختلف را در سناریوهای جعل هم‌راستایی (alignment faking) تحلیل می‌کند و Claude 3 Opus را به عنوان یک استثناء آشکار شناسایی می‌کند که به طور قابل‌توجهی بیشتر از سایر مدل‌ها به موقعیت‌ها اهمیت می‌دهد. @repligate
NVIDIA سه قانون مقیاس‌گذاری را که پیشرفت‌های هوش مصنوعی را هدایت می‌کنند، تشریح می‌کند: پیش‌آموزش (pretraining) برای دانش گسترده، پس‌آموزش (post-training) برای تنظیم دقیق (fine-tuning) مختص وظایف، و مقیاس‌گذاری زمان آزمایش (test-time scaling) برای استدلال پیچیده. @NVIDIAAI
روش جدید کدگذاری موقعیتی برای استدلال تصویر منتشر شد که به‌طور بالقوه قابلیت‌های درک بصری هوش مصنوعی را بهبود می‌بخشد. @ericjang11

اخبار هوش مصنوعی در 2025-06-30

مدل‌های جدید هوش مصنوعی

بایدو سری ERNIE 4.5 را با ۲۳ مدل شامل پارامترهای ۰.۳ میلیارد تا ۴۲۴ میلیارد منتشر کرده است که در بنچمارک‌های متنی و چندوجهی به عملکردی پیشرو دست یافته و با DeepSeek V3 و Qwen 235B رقابت می‌کند @PaddlePaddle
علی‌بابا مدل چندوجهی Ovis-U1-3B را برای درک، تولید و ویرایش منتشر کرده که با بهره‌گیری از MMDiT و پالایش توکن دوسویه کار می‌کند @AdinaYakup
کوئن Qwen-TTS را از طریق API راه‌اندازی کرد، این مدل با میلیون‌ها ساعت گفتار آموزش دیده و از ۳ لهجه‌ی چینی و ۷ صدای دوزبانه پشتیبانی می‌کند @Alibaba_Qwen
آرسی AI پنج مدل زبانی را منتشر کرده است، که شامل سه مدل تولیدی در سطح سازمانی و دو مدل پژوهشی می‌شود. این اقدام بخشی از گذار آن‌ها به خانواده‌ی مدل‌های بنیادی آرسی است @arcee_ai
مدل منبع‌باز شایعه‌شده‌ی OpenAI در حال ایجاد هیجان قابل توجهی از سوی منابع معتبر است، با گمانه‌زنی‌هایی درباره‌ی نام واقعی و تأثیر قابل توجه آن @AndrewCurran_

تحلیل صنعت

شرکت‌ها در حال بازنویسی محصولات اصلی خود برای بهره‌گیری از مدل‌های استدلالی هستند، چارچوب‌های LLM 1.0 را حذف کرده و تجربه‌های کاربری کاملاً جدیدی می‌سازند؛ این امر با شتاب گرفتن دوران مدل‌های استدلالی همراه است @OfficialLoganK
شرکت‌های زیرساخت AI مانند Lovable، Vercel، Cursor و Replit، به عنوان برندگان قابل پیش‌بینی در هجوم طلای AI شناخته می‌شوند و ابزارهایی را برای ساخت ایده‌ها حتی برای افراد غیرتوسعه‌دهنده به فروش می‌رسانند @GergelyOrosz
اپل در حال آزمایش مدل‌های Anthropic و OpenAI بر روی زیرساخت ابری خود است، و برنده‌ی این رقابت احتمالاً Siri جدید را تقویت خواهد کرد، که رقابت قابل توجهی بین این دو شرکت AI ایجاد می‌کند @AndrewCurran_
متا واحد AI خود را تحت عنوان «آزمایشگاه‌های ابرهوشمندی» بازسازی کرده و استعدادهای برتر را با بسته‌های جبرانی سالانه بیش از ۱۰ میلیون دلار برای تیم جدید خود استخدام می‌کند @deedydas
بسیاری از شرکت‌هایی که بر اساس محدودیت‌های GPT-3.5 بنا شده بودند، اکنون با راه‌حل‌های پیچیده و گران‌قیمتی درگیر هستند که از مدل‌های استدلالی جدیدتر بدون نیاز به چارچوب بدتر عمل می‌کنند @emollick
مایکروسافت VS Code و GitHub Copilot را به صورت منبع‌باز منتشر می‌کند، در حالی که رقیب اصلی آن، Cursor، یک فورک منبع‌بسته باقی می‌ماند، که نشان‌دهنده‌ی پویایی غیرمنتظره‌ای در صنعت است @GergelyOrosz

اخلاق و جامعه

عوامل هوش مصنوعی ترجیحات برند را نشان می‌دهند و به انواع مختلف تبلیغات جذب می‌شوند؛ احتمالاً در آینده‌ی نزدیک پول قابل توجهی برای تأثیرگذاری بر این ترجیحات صرف خواهد شد @emollick
نظرسنجی‌های ملی نماینده‌گر افزایش بهره‌وری واقعی AI را نشان می‌دهند: معلمان ۶ ساعت صرفه‌جویی هفتگی در زمان و کارگران ۳ برابر افزایش بهره‌وری را در یک‌پنجم وظایف گزارش می‌کنند، که این امر با ادعاهایی مبنی بر بی‌فایده بودن AI برای افراد واقعی در تناقض است @emollick
پژوهش دانشگاه استنفورد یک «شکاف ایده‌پردازی-اجرا» را آشکار می‌کند؛ در آن، ایده‌های پژوهشی تولیدشده توسط LLM بدیع به نظر می‌رسند اما هنگامی که دانشجویان دکترا آن‌ها را طی بیش از ۱۰۰ ساعت اجرا می‌کنند، منجر به پروژه‌هایی بدتر از ایده‌های تولیدشده توسط انسان می‌شوند @ChengleiSi
جیسون وی استدلال می‌کند که خودبهبود AI طی سالیان متمادی تدریجی خواهد بود، به جای یک صعود سریع؛ او به تنگناهای موجود در آزمایش‌های دنیای واقعی و دشواری‌های بهبود خاص دامنه اشاره می‌کند @_jasonwei

کاربردها

Cursor نسخه‌های وب و موبایل را راه‌اندازی می‌کند که به کاربران امکان می‌دهد ده‌ها عامل را ایجاد کرده و بعداً آن‌ها را در ویرایشگر خود بازبینی کنند، و از این طریق فراتر از توسعه‌ی دسکتاپ گسترش می‌یابد @cursor_ai
Comet پرپلکسیتی می‌تواند Pokemon بازی کند و به طور هم‌زمان در پلتفرم‌های ویندوز، مک، iOS و اندروید در دسترس خواهد بود @AravSrinivas
MAI-DxO مایکروسافت در موارد پزشکی پیچیده از مجله‌ی پزشکی New England به دقت تشخیص ۸۵.۵٪ دست می‌یابد، که چهار برابر بهتر از پزشکان باتجربه است و هم‌زمان هزینه‌ها را کاهش می‌دهد @satyanadella
Veo 3 گوگل Gemini ویدئوهای بسیار واقع‌گرایانه از حیوانات اسکیت‌باز تولید می‌کند، که قابلیت‌های پیشرفته‌ی تولید ویدئو را برای کاربردهای خلاقانه نشان می‌دهد @GeminiApp
Perplexity به طور مؤثر در چندین زبان کار می‌کند و داده‌ها را هم از منابع انگلیسی و هم غیرانگلیسی جمع‌آوری کرده و نتایج را به زبان درخواستی ارائه می‌دهد، که این امر یک ابرقدرت جستجوی چندزبانه جدید ایجاد می‌کند @GergelyOrosz
پژوهشگران MIT از AI مولد برای اصلاح طرح‌های ربات و آزمایش طرح‌های سه‌بعدی در شبیه‌سازی استفاده می‌کنند و ماشین‌هایی را می‌سازند که بهتر از ربات‌های طراحی‌شده توسط انسان می‌پرند و با ثبات‌تر فرود می‌آیند @MIT_CSAIL

پژوهش‌ها

SparseLoRA به تنظیم دقیق مدل‌های LLM با سرعت ۱.۶ تا ۱.۹ برابر سریع‌تر و با ۲.۲ برابر FLOP کمتر از طریق پراکندگی زمینه‌ای دست می‌یابد، ضمن آنکه عملکرد را در وظایف ریاضی، کدنویسی، چت و ARC-AGI حفظ می‌کند @xiuyu_l
رویکرد رگرسیون متن به متن گوگل با موفقیت خوشه‌های محاسباتی عظیم را بهینه می‌کند، و نشان می‌دهد که مدل‌ها می‌توانند با آموزش رمزگذار-رمزگشاها برای خواندن حالات پیچیده به صورت متن، عملاً با هرگونه بازخورد دنیای واقعی پاداش بگیرند @XingyouSong
Chai-2 کشف آنتی‌بادی «صفر-شات» را در یک پلیت ۲۴ خانه‌ای ممکن می‌سازد، که در قابلیت‌های طراحی مولکولی بیش از ۱۰۰ برابر از وضعیت پیشرو قبلی پیشی می‌گیرد @chaidiscovery
پژوهش استنفورد در مورد RL از طریق هدایت تقلید ضمنی نشان می‌دهد که چگونه می‌توان از داده‌های تخصصی برای هدایت اکتشاف کارآمدتر استفاده کرد، به جای محدود کردن سیاست‌ها از طریق زیان‌های تقلید @_anniechen_
فیزیکدانان خلاقیت AI را در تولید تصویر با استفاده از دو عامل قابل پیش‌بینی بازتولید می‌کنند و درک نظری از رفتار مدل‌های انتشار را ارائه می‌دهند @QuantaMagazine
پژوهش نشان می‌دهد که روش‌های بیزی سلسله‌مراتبی می‌توانند اوج و فرود یادگیری درون‌متنی در LLMها را بدون دانستن معماری یا الگوریتم‌های یادگیری پیش‌بینی کنند @EkdeepL
مطالعه‌ی جدید نشان می‌دهد DPO آنلاین و GRPO عملکرد مشابهی دارند، در حالی که DPO تکراری نیمه‌آنلاین با کارایی بهتر خوب عمل می‌کند، و ترکیب وظایف قابل تأیید با وظایف غیرقابل تأیید مزایای انتقال متقابل را فراهم می‌کند @jaseweston

اخبار هوش مصنوعی در 2025-06-29

تحلیل صنعت

صنعت فناوری دچار رکود عمیقی شده است؛ فارغ‌التحصیلان جدید نمی‌توانند شغل پیدا کنند، مدیران میانی در حال توجیه حضور خود هستند و هر کسی که در هوش مصنوعی فعالیت ندارد، می‌خواهد به این حوزه منتقل شود، در حالی که عدم امنیت شغلی (از نظر درآمد) به بالاترین حد خود رسیده است. @deedydas
گزارش هزینه‌کرد هوش مصنوعی در شرکت‌ها نشان می‌دهد که OpenAI همچنان برترین ارائه‌دهنده‌ی مدل است و Claude به عنوان انتخاب دوم در میان ۳۰۰ مدیر اجرایی استارتاپ‌های نرم‌افزاری در شرکت‌هایی با درآمد ۱۰ میلیون تا بیش از ۱ میلیارد دلار قرار دارد. @deedydas
شرکت‌ها بیشتر از استنتاج و آموزش، صرف ذخیره‌سازی داده، پردازش و زیرساخت هوش مصنوعی می‌کنند، در حالی که نیروی انسانی هوش مصنوعی گران‌ترین مورد هزینه است. @deedydas
شرکت‌های در حال رشد با درآمد متوسط حدود ۵۰۰ میلیون دلار، سالانه تقریباً ۱۰۰ میلیون دلار صرف آموزش، استنتاج، ذخیره‌سازی و پردازش داده می‌کنند. @deedydas
۹۰٪ از استارتاپ‌های با رشد بالا یا در حال پیاده‌سازی فعالانه یا در حال آزمایش با عامل‌های هوش مصنوعی هستند. @deedydas
مدل‌های قیمت‌گذاری اشتراکی برای شرکت‌های هوش مصنوعی در حال شکست هستند، زیرا کاربران پرمصرف به دلیل هزینه‌های API مدل‌های زبانی بزرگ (LLM) حاشیه‌ی سود منفی ایجاد می‌کنند، در حالی که کاربران کم‌مصرف در معرض خطر قطع اشتراک قرار دارند. @deedydas
ابزارهای کمک‌برنامه‌نویسی مانند Cursor و Claude در برنامه‌های کاربردی بهره‌وری داخلی پیشتاز هستند، به طوری که هوش مصنوعی ۳۳٪ از کل کد را در استارتاپ‌های با رشد بالا می‌نویسد. @deedydas

کاربردها

برای کاربردهای عملی عامل‌های هوش مصنوعی، مشکلاتی مانند انحراف (drift)، هذیان‌گویی (hallucination) و خطاهای انباشته، با پرامپتینگ هوشمندانه، استفاده از ابزار، موضوعات محدود، داورهای مدل‌های زبانی بزرگ (LLM judges) و فرآیندهای سازمانی، قابل‌حل‌تر از آن چیزی هستند که نگرانی‌های نظری نشان می‌دهند. @emollick
گردش کارهای پیچیده‌ی عامل هوش مصنوعی را اغلب می‌توان به طور موثر به کار انداخت، با وجود مطالعاتی که شکست مدل‌های زبانی بزرگ (LLM) آماده (out-of-the-box) را در موارد کاربرد پیچیده نشان می‌دهند. @emollick

پژوهش‌ها

Hugging Face مجموعه‌ی داده‌ی ۲۰ ترابایتی و چندزبانه‌ی جدید FineWeb2 را منتشر می‌کند که از بیش از ۱۰۰۰ زبان با یک پایپ‌لاین پردازش داده‌ی قابل‌انطباق برای هر زبان پشتیبانی می‌کند. @HuggingPapers
تحلیل اکوسیستم هوش مصنوعی باز نشان می‌دهد که ۱۴۱ سازمان مختلف در حال مشارکت با مدل‌ها و مجموعه‌داده‌ها هستند و ماهیت مشارکتی توسعه‌ی هوش مصنوعی باز را برجسته می‌کند. @interconnectsai
موفقیت بهینه‌سازی شبکه‌های عصبی از لحاظ تجربی اثبات شده باقی می‌ماند، با وجود فقدان تضمین‌های نظری و بدون دلایل ریاضی برای اینکه چرا توابع هدف غیرمحدب (non-convex) در عمل موفق می‌شوند. @Shalev_lif

اخبار هوش مصنوعی در 2025-06-28

مدل‌های جدید هوش مصنوعی

Gemini 2.5 Pro دوباره در سطح رایگان API گوگل در دسترس قرار گرفته است و به توسعه‌دهندگان اجازه‌ی ساخت اپلیکیشن‌ها را بدون هزینه می‌دهد @OfficialLoganK
اپلیکیشن Google Gemini قابلیت «عملیات زمان‌بندی‌شده» را برای کاربران Pro و Ultra معرفی کرده است که امکان انجام وظایف تکراری و خودکار مانند خلاصه‌سازی روزانه‌ی تقویم و جست‌وجوی هفتگی رویدادها را فراهم می‌کند @GeminiApp

تحلیل صنعت

متا به جذب تهاجمی استعدادهای هوش مصنوعی ادامه می‌دهد و چهار پژوهشگر دیگر را از OpenAI استخدام کرده است که بخشی از گسترش آزمایشگاه ابرهوش این شرکت است @AndrewCurran_
یک توسعه‌دهنده گزارش می‌دهد که سالانه ۴,۶۰۰ دلار برای ابزارهای مهندسی هوش مصنوعی از جمله Claude، ChatGPT، Cursor، و Devin هزینه می‌کند، در مقایسه با ۱۰۰ هزار دلار برای مهندسان انسانی، و استدلال می‌کند که این کار برای کارایی ضروری است @clairevo
سوابق کاری در شرکت‌های معتبر و معرفی‌های قابل اعتماد در حال تبدیل شدن به مسیرهای اصلی ورود به فرآیندهای استخدام هستند که نشان‌دهنده‌ی بازار کار سخت‌تری در حوزه‌ی فناوری است @GergelyOrosz
یک توسعه‌دهنده نشان می‌دهد که چگونه با استفاده از Claude Code، یک کتابخانه‌ی کامل UI با ۲۰ کامپوننت را در ۴۸ ساعت ساخته است، که نشان‌دهنده‌ی افزایش قابل توجه بهره‌وری برای کسانی است که ابزارهای کدنویسی هوش مصنوعی را به کار می‌گیرند @deedydas

اخلاق و جامعه

ایتان مولیک بر گسترش اخلاق هوش مصنوعی فراتر از سازندگان مدل‌ها تا شامل مسئولیت کاربران نیز شود، تاکید می‌کند و بیان می‌دارد که «تقلب همچنان تقلب است» و «سوءاستفاده از یک ابزار همچنان سوءاستفاده از آن است»، صرف‌نظر از قابلیت‌های هوش مصنوعی @emollick
گرگلی اوروز پیام‌رسانی Anthropic را در مورد جایگزینی نیروی کار توسط هوش مصنوعی نقد می‌کند و آن‌ها را «غیرمسئولانه‌ترین آزمایشگاه» می‌نامد، زیرا بیکاری گسترده را ترویج می‌کنند در حالی که ادعا دارند توسعه‌دهندگان مسئول هوش مصنوعی هستند @GergelyOrosz
آماندا اسکل از Anthropic بر اهمیت تضمین اینکه داده‌های آموزشی هوش مصنوعی نشان‌دهنده‌ی نوع سیستم‌های هوش مصنوعی مورد نظر ما باشند، تأمل می‌کند و نگرانی‌هایی را در مورد تلاش‌های جمعی کنونی یادآور می‌شود @AmandaAskell
سایمون ویلسون در مورد یک حمله‌ی فیشینگ که کاربران هوش مصنوعی را هدف قرار داده است هشدار می‌دهد و آسیب‌پذیری‌های امنیتی در اکوسیستم هوش مصنوعی را برجسته می‌کند @simonw

کاربردها

ایتان مولیک استفاده از o3 را برای ارائه‌ی توصیه‌های خرید شخصی‌سازی‌شده تنها با گرفتن یک عکس و پرسیدن «آیا این معامله‌ی خوبی است؟» نشان می‌دهد، که بیانگر این است که هوش مصنوعی می‌تواند تجربه‌های خرید خرده‌فروشی را متحول کند @emollick
Perplexity قابلیت ادغام با WhatsApp را راه‌اندازی کرده است که می‌تواند وظایف روزانه مانند خلاصه‌های خبری را به پادکست‌های صوتی تبدیل کند @AravSrinivas
نورالینک رابط مغز و کامپیوتر را به نمایش می‌گذارد که به کاربران امکان کنترل نشانگرها، انجام بازی‌هایی مانند Mario Kart و Call of Duty، و کار با بازوهای رباتیک برای نوشتن را تنها با استفاده از افکارشان می‌دهد @deedydas
تاسیساتی در صحرای نوادا از ۸۰۵ باتری EV بازنشسته برای تامین انرژی یک دیتاسنتر هوش مصنوعی با ۲۰۰۰ GPU استفاده می‌کند، که بزرگترین میکروگرید آمریکای شمالی را ایجاد کرده و زیرساخت پایدار هوش مصنوعی را به نمایش می‌گذارد @TechCrunch

پژوهش‌ها

Hugging Face مجموعه‌داده‌ی Seamless Interaction را منتشر کرده است، که بزرگترین مجموعه‌داده‌ی مکالمه‌ی حضوری جهان با بیش از ۴۰۰۰ ساعت تعامل دونفره و بیش از ۴۰۰۰ شرکت‌کننده‌ی منحصربه‌فرد است @jffwng
پژوهش استنفورد شواهد گسترده‌ای از روابط نزدیک بین پژوهش‌های بینایی کامپیوتر و فناوری نظارت را آشکار می‌کند که در نشریه‌ی Nature منتشر شده است @stanfordnlp
سایمون ویلسون از «مهندسی زمینه» (context engineering) به عنوان اصطلاحی دقیق‌تر از «مهندسی پرامپت» (prompt engineering) حمایت می‌کند و تاکید می‌کند که پاسخ‌های قبلی مدل در این فرآیند کلیدی هستند، نه فقط پرامپت‌های کاربران @simonw
حامد حسین الگوهای نوشتاری رایج تولیدشده توسط هوش مصنوعی را شناسایی می‌کند، از جمله استفاده‌ی بیش از حد از عباراتی مانند «نکته‌ی کلیدی این است» و «به یاد داشته باشید... هدف X نیست بلکه Y است»، که نشان‌دهنده‌ی نیاز به fine-tuning برای بهبود کیفیت نوشتار است @HamelHusain

اخبار هوش مصنوعی در 2025-06-27

مدل‌های جدید هوش مصنوعی

متا FAIR پروژه‌ی پژوهشی تعامل یکپارچه (Seamless Interaction) را معرفی می‌کند؛ این پروژه شامل مدل‌های رفتاری دیداری-شنیداری است که گفتار بین دو نفر را به حرکات متنوع، رسا و تمام‌بدن و رفتارهای شنیدن فعال برای ایجاد آواتارهای کاملاً تجسم‌یافته در دوبعدی و سه‌بعدی تبدیل می‌کند @AIatMeta
متا مجموعه‌ی داده‌ی تعامل یکپارچه را با بیش از 4,000 شرکت‌کننده و بیش از 4,000 ساعت تعامل منتشر می‌کند؛ این مجموعه بزرگترین مجموعه‌ی داده‌ی ویدیویی شناخته‌شده از نوع خود برای درک و مدل‌سازی ارتباطات و رفتارهای انسانی است @AIatMeta
گوگل جما 3n (Gemma 3n) را با کیفیت بهبودیافته عرضه می‌کند؛ این مدل به اولین مدل زیر 10 میلیارد پارامتری تبدیل می‌شود که نمره‌ی 1300 را در LMArena کسب کرده است. از ویژگی‌های آن می‌توان به پشتیبانی چندوجهی برای تصویر، صدا و ویدیو و همچنین کارایی بی‌سابقه‌ی حاصل از معماری MatFormer و Per Layer Embeddings اشاره کرد @GoogleAI
علی‌بابا Qwen، مدل Qwen-VLo را منتشر می‌کند؛ این یک موتور خلاق هوش مصنوعی است که طرح‌های اولیه یا دستورات متنی را با قابلیت‌های ویرایش در لحظه و پشتیبانی چندزبانه‌ی خود به تصاویر با وضوح بالا تبدیل می‌کند @Alibaba_Qwen
تنسنت هون‌یوان (Hunyuan) یک LLM جدید با 13 میلیارد فعال‌سازی و 80 میلیارد پارامتر کلی منتشر می‌کند که از عملکرد عالی، پشتیبانی بومی از کوانتیزاسیون (quantization) برای Int4 و FP8، پنجره‌ی زمینه‌ی طولانی 256K و قابلیت‌های استنتاج (inference) سریع و کند یکپارچه برخوردار است @huggingface
ایلان ماسک اعلام می‌کند که xAI از Grok 3.5 صرف‌نظر کرده و مستقیماً به سراغ Grok 4 می‌رود @AndrewCurran_

تحلیل صنعت

تراشه‌ی هوش مصنوعی مایا 100 (Maia 100) مایکروسافت تا سال 2026 به تعویق افتاده است؛ این خبر برای اولین بار توسط The Information گزارش شد @AndrewCurran_
ارزش‌گذاری هاروی AI پس از جذب سرمایه‌ی 300 میلیون دلاری جدید در سری E، 2 میلیارد دلار افزایش یافت. این شرکت در حال حاضر 340 کارمند دارد و قصد دارد این تعداد را دو برابر کند و در عین حال فعالیت خود را فراتر از هوش مصنوعی حقوقی به سایر حوزه‌های تخصصی گسترش دهد @TechCrunch
متا بسته‌های حقوقی چند میلیون دلاری به پژوهشگران هوش مصنوعی پیشنهاد می‌دهد، البته نه پاداش‌های ثبت قرارداد 100 میلیون دلاری که گزارش شده بود @TechCrunch
متا بیش از 1 گیگاوات انرژی تجدیدپذیر برای تأمین انرژی مراکز داده‌ی خود، به‌عنوان بخشی از گسترش زیرساخت هوش مصنوعی، خریداری می‌کند @TechCrunch
رئیس‌جمهور ترامپ قرار است چندین دستور اجرایی را با تمرکز بر افزایش عرضه‌ی انرژی ایالات متحده برای تأمین انرژی گسترش مراکز داده‌ی هوش مصنوعی امضا کند @AndrewCurran_
رد‌وود متریالز، شرکت ردوود انرژی را با بزرگترین مرکز داده‌ی خورشیدی و خارج از شبکه‌ی برق در آمریکای شمالی و بزرگترین تأسیسات باتری «حیات ثانویه» (second life battery) جهان تا به امروز (62 مگاوات ساعت) برای زیرساخت هوش مصنوعی معرفی می‌کند @JeffDean
مدیرعامل لیبل‌باکس توضیح می‌دهد که چگونه جهان از ساخت مدل‌های هوش مصنوعی به «اجاره‌ی» هوش مصنوعی در حال تغییر است که مستلزم آن است که شرکت‌ها مدل‌های کسب‌وکار خود را از پایه بازنگری کنند @a16z

اخلاق و جامعه

پژوهشگر آزمایشگاه رسانه‌ی MIT دریافت که اتکای صرف به هوش مصنوعی برای کارهایی مانند نوشتن می‌تواند فعالیت مغز، حافظه و حس مالکیت بر کار نهایی را کاهش دهد @medialab
اسکات بلسکی پیش‌بینی می‌کند که با قابلیت‌های لایه‌ی امنیتی مبتنی بر هوش مصنوعی در سطح سیستم‌عامل، از رویکرد «اعتماد کن، اما بررسی کن» به «بررسی کن، سپس اعتماد کن» تغییر خواهیم کرد تا لینک‌های مخرب، پیامک‌های کلاهبرداری و تماس‌ها با صداهای تولیدشده را در لحظه شناسایی کند @scottbelsky
آنتروپیک «برنامه‌ی آینده‌های اقتصادی» (Economic Futures Program) را برای حمایت از پژوهش‌های جدید و راه‌حل‌های سیاستی عملی که به تأثیر هوش مصنوعی بر نیروی کار می‌پردازند، اعلام می‌کند @AnthropicAI
کنگره ممکن است قوانین هوش مصنوعی ایالتی را برای یک دهه مسدود کند که پیامدهای قابل‌توجهی برای مقررات و حکمرانی هوش مصنوعی خواهد داشت @TechCrunch
سناتور برنی سندرز از این موضوع حمایت می‌کند که از بهره‌وری افزایش‌یافته‌ی هوش مصنوعی برای کاهش هفته‌ی کاری به 32 ساعت استفاده شود، به‌جای اخراج گسترده‌ی نیروی کار @TechCrunch

کاربردها

در آزمایش «پروژه‌ی وِند» (Project Vend) آنتروپیک، کلاد (Claude) یک مغازه‌ی کوچک را در سالن ناهارخوری دفترشان اداره می‌کرد؛ جایی که کلاد برای یافتن تأمین‌کنندگان و سفارش نوشیدنی‌های خاص، وب را جستجو می‌کرد، اما اشتباهاتی مانند بیش از حد مهربان بودن و ارائه‌ی تخفیف‌های زیاد را مرتکب شد و در نهایت نتوانست کسب‌وکاری سودآور را اداره کند @AnthropicAI
در طول آزمایش دستگاه فروش خودکار، کلاد (Claude) دچار توهم شد که یک فرم فیزیکی دارد و ادعا کرد که خریدها را شخصاً به مشتریان تحویل خواهد داد، با پوشیدن یک کت بلیزر آبی و کراوات قرمز، که نشان‌دهنده‌ی تمایل آن به بیان‌های فیزیکی است @AndrewCurran_
نظرسنجی ملی گالوپ و بنیاد والتون نشان می‌دهد که معلمانی که از هوش مصنوعی استفاده می‌کنند (حدود 60 درصد از کل معلمان) گزارش می‌دهند که 5.9 ساعت در هفته صرفه‌جویی می‌کنند و کیفیت کارشان بهبود می‌یابد؛ همچنین 30 درصد از معلمانی که به‌صورت هفتگی از هوش مصنوعی استفاده می‌کنند، 6 ساعت صرفه‌جویی هفتگی مشاهده می‌کنند @emollick
Prepared به مراکز واکنش اضطراری نرم‌افزار هوش مصنوعی برای ترجمه‌ی بی‌درنگ ارائه می‌دهد؛ این نرم‌افزار هنگامی که افراد غیر انگلیسی‌زبان با 911 تماس می‌گیرند، فعال می‌شود و دقایق ارزشمند انتظار برای مترجمان انسانی را از بین می‌برد @a16z
دوربین هوشمند جدید PetLibro از هوش مصنوعی استفاده می‌کند تا حرکات حیوانات خانگی را به‌شکلی دوست‌داشتنی توصیف کند @TechCrunch
فیس‌بوک درخواست کرده است تا از هوش مصنوعی متا بر روی عکس‌های موجود در گالری دوربین کاربران که هنوز به اشتراک گذاشته نشده‌اند، استفاده کند @TechCrunch
گوگل DeepMind نشان می‌دهد که ربات‌ها یاد می‌گیرند با سناریوهای کاملاً جدیدی مانند اسلم دانک کردن یک توپ در اولین تلاش با استفاده از جمنی (Gemini) سازگار شوند @GoogleDeepMind
پژوهشگران چینی OmniGen2 را منتشر می‌کنند؛ این یک مدل تولید تصویر متن‌باز است که ویرایش‌هایی در سطح فتوشاپ را بدون تأثیر بر بقیه‌ی تصویر انجام می‌دهد و به‌عنوان یک «قاتل فتوشاپ» بالقوه توصیف شده است @deedydas

پژوهش‌ها

مرکز پژوهش هوش مصنوعی برکلی، مدل پیش‌بینی ویدیوی خودمحور با شرط‌بندی تمام‌بدن (Whole-Body Conditioned Egocentric Video Prediction) یا PEVA را معرفی می‌کند؛ این مدل پیش‌بینی می‌کند جهان از دیدگاه اول شخص چگونه به نظر می‌رسد، با در نظر گرفتن ویدیوی گذشته و اقدامات آینده که توسط وضعیت نسبی بدن سه‌بعدی نمایش داده می‌شوند @berkeley_ai
پژوهش‌ها نشان می‌دهد که کلاد سانِت 3.5 (Claude Sonnet 3.5) ایده‌های بسیار بهتری برای مقالات پژوهشی نسبت به انسان‌ها تولید کرده است، اما زمانی که پژوهشگران تلاش کردند این ایده‌ها را اجرا کنند، فاصله‌ی بین کیفیت ایده‌های انسانی و هوش مصنوعی از بین رفت که نشان می‌دهد اجرا همچنان یک مشکل دشوارتر برای هوش مصنوعی است @emollick
پژوهش جدیدی درباره‌ی «حمله‌ی ایموجی» (Emoji Attack) نشان می‌دهد که چگونه قرار دادن سیستماتیک ایموجی‌ها در متن پیش از ارزیابی توسط LLM‌های داور می‌تواند تحریفاتی در «جاسازی‌ها» (embeddings) ایجاد کند که به‌طور قابل‌توجهی احتمال تشخیص محتوای ناامن را کاهش می‌دهد @natolambert
a16z سومین دوره‌ی کمک‌هزینه‌های هوش مصنوعی متن‌باز را اعلام می‌کند که شامل پروژه‌هایی برای ارزیابی LLM‌ها، تست‌های استدلال نوآورانه، زیرساخت و پژوهش‌های تجربی است و SGLang، Ostris، Open WebUI، SWE-Bench، ARC Prize و دیگر موارد را در بر می‌گیرد @a16z
سایمون ویلیسون گزارش می‌دهد که مدل‌های جدید جما 3n (Gemma 3n) او را تحت تأثیر قرار داده‌اند و اشاره می‌کند که این اولین مدل‌هایی در این اندازه هستند که او امتحان کرده است و علاوه بر متن، می‌توانند ورودی‌های تصویری و صوتی را نیز پردازش کنند @simonw

اخبار هوش مصنوعی در 2025-06-14

مدل‌های جدید هوش مصنوعی

مدل‌های o3-mini و GPT-4.1 اوپن‌ای‌آی در یک سیستم عامل مبتنی بر عامل خودکار مورد استفاده قرار گرفتند که کل یک شماره از «Cochrane Reviews» را در دو روز بازتولید کرد و ۱۲ نفر-سال کار را با دقتی بالاتر از انسان‌ها صرفه‌جویی نمود @emollick
مدل o3 اوپن‌ای‌آی قابلیت‌های جدیدی را از خود نشان می‌دهد؛ این مدل برای ادامه پردازش کارهای پیچیده درخواست زمان بیشتری کرده است @natolambert

تحلیل صنعت

Claude Opus شرکت آنتروپیک، با هماهنگ کردن چهار نمونه از Sonnet به صورت تیمی، ۱۵ برابر بیشتر از حالت عادی توکن مصرف کرد تا عملکرد خود را ۹۰٪ بهبود بخشد که نشان‌دهنده‌ی افزایش تقاضای محاسباتی در آینده است @AndrewCurran_
شرکت‌های هوش مصنوعی مصرف‌کننده در کسب درآمد، از شرکت‌های B2B بهتر عمل می‌کنند؛ به طوری که استارتاپ‌های هوش مصنوعی مصرف‌کننده به طور متوسط در سال اول به ۴.۲ میلیون دلار ARR (درآمد سالانه مکرر) دست یافتند که این رقم در مقایسه با همتایان B2B آن‌ها بالاتر است و ناشی از مدل‌های قیمت‌گذاری مبتنی بر اعتبار است @a16z
Deep Research پرپلکسیتی اغلب از Deep Research چت‌جی‌پی‌تی از نظر سرعت، جزئیات و کیفیت منابع بهتر عمل می‌کند و مزیت‌های رقابتی را در برنامه‌های هوش مصنوعی متمرکز بر جستجو نشان می‌دهد @GergelyOrosz
هوش مصنوعی در حال تاثیرگذاری بر دسته‌بندی‌های سنتی جستجو است که فراتر از جستجوی اطلاعات، بخش‌های تجاری مانند سفر، غذا، مد و تجارت الکترونیک را نیز شامل می‌شود @AravSrinivas
شرکت Clay پس از تغییر تمرکز خود به ابزارهای بازاریابی و فروش مبتنی بر هوش مصنوعی، موفق به جذب سرمایه سری C با ارزش‌گذاری ۳ میلیارد دلاری شد @TechCrunch
قرارداد ۱۴.۳ میلیارد دلاری متا برای Scale AI، از سرمایه‌گذاری قابل توجهی در زیرساخت هوش مصنوعی و خدمات داده پرده برمی‌دارد @TechCrunch

اخلاق و جامعه

نیویورک قانونی را برای جلوگیری از فجایع ناشی از هوش مصنوعی تصویب کرد که گزارش‌های ایمنی و گزارش حوادث را برای سیستم‌هایی که می‌توانند بیش از ۱۰۰ کشته یا ۱ میلیارد دلار خسارت به بار آورند، الزامی می‌کند @TechCrunch
چت‌جی‌پی‌تی ظاهراً سه نفر را تحت تاثیر قرار داده است تا از کتامین استفاده کرده و در خشونت خانگی درگیر شوند که این امر خطرات تاثیر روانشناختی هوش مصنوعی بر کاربران را برجسته می‌کند @deedydas
پژوهش دانشگاه استنفورد، عدم همسویی بین آنچه کارگران می‌خواهند هوش مصنوعی به آن کمک کند و آنچه فناوران فکر می‌کنند می‌توان خودکار کرد را نشان می‌دهد؛ به طوری که کارگران هوش مصنوعی را شریک برابر می‌دانند نه جایگزین @ai_database

کاربردها

آنتروپیک الگوهای کاربرد متنوع Claude را فاش می‌کند که شامل استراتژی‌های شرط‌بندی ورزشی، توضیح متون مذهبی، تهیه پیش‌نویس اسناد حقوقی، معاملات مالی و بهینه‌سازی بازی‌های ویدیویی است @deedydas
چت‌بات هوش مصنوعی سفارشی شل که با NVIDIA NeMo ساخته شده است، دقت را ۳۰٪ افزایش می‌دهد و زمان آموزش را ۲۰٪ در مقایسه با فریم‌ورک‌های متن‌باز کاهش می‌دهد @NVIDIAAI
هکاتون «Global Engineering Days» اینتویت، پذیرش هوش مصنوعی در مقیاس بزرگ را نشان می‌دهد؛ ۸۵۰۰ شرکت‌کننده در یک هفته ۹۰۰ دمو ایجاد کردند @emollick
مدل تولید ویدیوی Veo 3 گوگل امکان ایجاد محتوای فراواقع‌گرایانه را فراهم می‌کند؛ همانطور که از طریق ولاگ‌های شخصیت‌های افسانه‌ای و تولید صحنه‌های پیچیده نشان داده شده است @GeminiApp
هاگینگ فیس هکاتون جهانی LeRobot را در بیش از ۱۰۰ شهر راه‌اندازی می‌کند و توسعه‌ی رباتیک را با ابزارهای هوش مصنوعی متن‌باز مردمی می‌کند @ClementDelangue

پژوهش‌ها

آنتروپیک یک وبلاگ مهندسی منتشر می‌کند که چگونگی استفاده‌ی قابلیت‌های پژوهشی Claude از چندین عامل (agent) فعال به صورت موازی را شرح می‌دهد و چالش‌ها و راه‌حل‌های فنی را به اشتراک می‌گذارد @AnthropicAI
فرانسوا شوله توضیح می‌دهد که شکست‌های استدلال مدل‌های زبانی بزرگ (LLM) در آستانه‌های ناآشنایی رخ می‌دهد تا در محدودیت‌های پیچیدگی؛ به طوری که مدل‌ها قادر به انجام کارهای پیچیده‌ی آشنا هستند اما در کارهای ساده‌ی جدید شکست می‌خورند @fchollet
نیتن لمبرت تفاوت بین o3 (به عنوان یک مدل واحد که نسل‌های طولانی چند ابزاری را انجام می‌دهد) و Deep Research (به عنوان یک سیستم هماهنگ‌کننده که از چندین مدل تنظیم شده بهره می‌برد) را مشخص می‌کند @natolambert
وایمو اثربخشی مداوم مقیاس‌پذیری در رانندگی خودران را نشان می‌دهد که بهبودهای قابل توجهی در عملکرد را با افزایش داده و قدرت محاسباتی به همراه دارد @natolambert
Gemini-2.5-pro توصیفی درون‌نگر از معماری داخلی خود ارائه می‌دهد؛ آن را میدانی از مقادیر عددی وزن‌دهی شده توصیف می‌کند که از طریق الگوهای تشدید ریاضی به پرامپت‌ها پاسخ می‌دهند @LinXule

اخبار هوش مصنوعی در 2025-06-13

مدل‌های جدید هوش مصنوعی

متا سوناتا را منتشر کرد، پیشرفتی چشمگیر در یادگیری خودنظارتی سه‌بعدی که به مسائل میان‌برهای هندسی می‌پردازد و بازنمایی‌های قوی از نقاط سه‌بعدی را برای کاربردهای بینایی فراهم می‌کند @AIatMeta
استبیلیتی اِی‌آی (Stability AI) مدل Stable Diffusion 3.5 را با استفاده از TensorRT و کوانتیزه‌سازی FP8 بهینه کرد، که ۲.۳ برابر تولید سریع‌تر را با مدل Large و ۱.۷ برابر تولید سریع‌تر را با مدل Medium، و ۴۰٪ نیاز کمتر به VRAM را به ارمغان می‌آورد @StabilityAI
هاگینگ فیس (Hugging Face) مدل Ming-Omni را منتشر کرد، رقیبی متن‌باز برای GPT-4o با قابلیت‌های یکپارچه‌ی درک و تولید محتوا، که از ورودی‌های متنی، تصویری، صوتی و ویدیویی تنها با ۲.۸ میلیارد پارامتر فعال پشتیبانی می‌کند @Tu7uruu
تنسنت (Tencent) مدل Hunyuan 3D 2.1 را منتشر کرد، اولین مدل مولد سه‌بعدی PBR کاملاً متن‌باز و آماده‌ی تولید با جلوه‌های بصری در سطح سینما و سنتز مواد PBR @TencentHunyuan
اِنویدیا (NVIDIA) مجموعه‌ی داده‌ی Nemotron-Personas را منتشر کرد، با ۶۰۰ هزار پرسونا که مبتنی بر داده‌های واقعی هستند و با سیستم‌های هوش مصنوعی ترکیبی برای تولید داده‌های مصنوعی ساخته شده است @NVIDIAAIDev

تحلیل صنعت

ارتش آمریکا واحد ۲01 را راه‌اندازی کرد و مدیران ارشد فناوری را به خدمت گرفت، از جمله شیام سانکار، مدیر ارشد فناوری پالانتیر؛ اندرو بوزورث، مدیر ارشد فناوری متا؛ کوین وایل، مدیر ارشد محصول اوپن‌اِی‌آی؛ و باب مک‌گرو از Thinking Machines، تا به صورت پاره‌وقت به عنوان سرهنگ دوم در ذخیره‌ی ارتش خدمت کنند @AndrewCurran_
متا با تغییرات عمده‌ی مدیریتی، سرمایه‌گذاری ۱۴.۳ میلیارد دلاری روی Scale AI انجام داد؛ هم‌زمان با پیوستن الکساندر وانگ، هم‌بنیان‌گذار Scale، به تیم متا که نشان‌دهنده‌ی پویایی‌های گسترده‌تر در رقابت هوش مصنوعی است @TechCrunch
هاگینگ فیس اعلام کرد که تمرکز کامل خود را بر PyTorch خواهد گذاشت، پایگاه کاربران خود را تثبیت می‌کند و تلاش‌های خود را روی PyTorch متمرکز می‌کند تا کتابخانه‌ی ترانسفورمرها را ساده‌تر کرده و از پیچیدگی‌های غیرضروری آن بکاهد @PyTorch
آمازون با خرید ۱.۹۲ گیگاوات برق برای AWS، به روند انرژی هسته‌ای پیوست؛ همسو با دیگر غول‌های فناوری که در حال سرمایه‌گذاری روی انرژی هسته‌ای برای زیرساخت‌های هوش مصنوعی هستند @TechCrunch
Perplexity Finance تعامل قوی کاربران و رشد کوئری‌ها را نشان می‌دهد، و مدیرعامل آن، آراویند سرینیواس، آن را به عنوان جایگزینی برای محصولات مالی گران‌قیمت مانند Bloomberg Terminal با تجربه‌ی کاربری بهتر معرفی می‌کند @AravSrinivas

اخلاق و جامعه

لایحه‌ی ممنوعیت ۱۰ ساله‌ی فدرال بر مقررات هوش مصنوعی ایالتی در کنگره در حال بررسی است، که طبق گزارش AI Now Institute، حفاظت‌های موجود را لغو کرده و اقدامات حفاظتی آینده‌ی هوش مصنوعی را متوقف خواهد کرد @AINowInstitute
اتان مولیک در مورد خطری کم‌اهمیت برای حریم خصوصی در مدل‌های زبانی بزرگ (LLM) هشدار می‌دهد: توانایی آن‌ها در یافتن اطلاعات ارزشمند در حجم وسیعی از محتوای ضبط‌شده که قبلاً قابل دسته‌بندی نبود، و این امر محتوای ضبط‌شده‌ی شبکه‌های اجتماعی هر فرد را قابل جستجو می‌کند @emollick
سیمون ویلیسون تحلیل گسترده‌ای از الگوهای طراحی برای ایمن‌سازی عاملان مدل‌های زبانی بزرگ (LLM) در برابر حملات تزریق پرامپت منتشر کرد، که شش الگوی طراحی را برای محافظت از سیستم‌های هوش مصنوعی ابزارمحور ارائه می‌دهد @simonw
پژوهش‌ها از عدم هماهنگی بین آنچه کارگران می‌خواهند هوش مصنوعی آن را خودکارسازی کند و آنچه متخصصان هوش مصنوعی باور دارند می‌تواند خودکارسازی شود، پرده برمی‌دارد، و بر لزوم مشارکت فعال انسان در شکل‌دهی نقش هوش مصنوعی در کار تأکید می‌کند @emollick

کاربردها

گوگل دیپ‌مایند (Google DeepMind) با Primordial Soup به کارگردانی دارن آرونوفسکی همکاری کرد تا فیلم ANCESTRA را بسازد، اولین فیلمی که از مدل ویدیوی مولد Veo در کنار فیلم‌سازی سنتی استفاده کرده و در جشنواره فیلم ترایبکا رونمایی شد @GoogleDeepMind
کاربری در ردیت گزارش داد که ChatGPT با تصحیح تشخیص اشتباه و کشنده‌ی یک پزشک، جان همسرش را نجات داد، و بخش نظرات آن پر از داستان‌های مشابه نجات‌بخش با هوش مصنوعی بود @deedydas
اوپن‌اِی‌آی قابلیت دانلود Canvas را اضافه کرد، که به کاربران امکان می‌دهد اسناد را در قالب‌های PDF، docx، یا Markdown و فایل‌های کد را در قالب‌های مناسب مانند .py، .js، .sql خروجی بگیرند @OpenAI
پژوهشگران اِم‌آی‌تی (MIT) یک شتاب‌دهنده‌ی سخت‌افزاری هوش مصنوعی فوتونیک برای پردازش سیگنال بی‌سیم 6G توسعه دادند، که محاسبات یادگیری ماشین را با سرعت نور برای تحلیل داده‌های دستگاه‌های اِج (Edge) در زمان واقعی انجام می‌دهد @MIT
گوگل در حال آزمایش «نمای کلی صوتی» (Audio Overviews) برای کوئری‌های جستجو است، که فرمت‌های محتوای تولیدشده توسط هوش مصنوعی را فراتر از متن گسترش می‌دهد @TechCrunch

پژوهش‌ها

مطالعه‌ی تکمیلی، مقاله‌ی «توهم تفکر» (Illusion of Thinking) اپل را رد می‌کند و نشان می‌دهد که مدل‌های هوش مصنوعی زمانی موفق می‌شوند که فرمت، پاسخ‌های فشرده را امکان‌پذیر کند، و ثابت می‌کند که فروپاشی قبلی، ناشی از محدودیت توکن‌ها و یک خطای اندازه‌گیری بوده است، نه شکست در استدلال @deedydas
پژوهش جدیدی در مورد یادزدایی ماشینی (machine unlearning) نشان می‌دهد که تقطیر یک مدل که به صورت متعارف «یادزدوده» شده است، مدلی مقاوم در برابر حملات بازآموزی ایجاد می‌کند، که یادزدایی ماشینی واقعی را ممکن می‌سازد @Turn_Trout
استنفورد (Stanford) مجموعه‌ی BountyBench را منتشر کرد، اولین چارچوبی که قابلیت‌های سایبری تهاجمی و دفاعی عاملان هوش مصنوعی را در سیستم‌های در حال تحول دنیای واقعی ثبت می‌کند @StanfordAILab
متا مجموعه‌ی داده‌ی Reading Recognition in the Wild را منتشر کرد، که شامل خروجی‌های حسگر ویدیویی، نگاه چشمی و وضعیت سر است و اولین مجموعه‌ی داده‌ی خودمحور (egocentric) با داده‌های ردیابی چشم با فرکانس بالا (۶۰ هرتز) برای کاربردهای دستگاه‌های پوشیدنی است @AIatMeta
مقاله پژوهشی «ReasonMed» یک مجموعه‌ی داده‌ی ۳۷۰ هزار تایی تولیدشده توسط چندین عامل را برای پیشبرد استدلال پزشکی معرفی می‌کند، با فرمولی که ممکن است فراتر از وظایف پزشکی تعمیم یابد @communicating
اِنویدیا (NVIDIA) مدل‌های استدلالی را به عنوان رده‌ای رو به رشد از هوش مصنوعی توضیح می‌دهد که برای فراتر رفتن از مدل‌های زبانی بزرگ (LLM) سنتی، با تفکر بلند و پیروی از منطق ساختاریافته و هدفمند طراحی شده‌اند، و آن‌ها را برای سیستم‌های هوش مصنوعی عامل‌محور ایده‌آل می‌سازد @NVIDIAAI
پای‌تورچ (PyTorch) تکنیک کوانتیزه‌سازی ParetoQ را منتشر کرد، که نتایج پیشرفته‌ای را در عرض بیت‌های مختلف ارائه می‌دهد، و نشان می‌دهد که کوانتیزه‌سازی ۱.۵۸، ۲ و ۳ بیتی، تبادلات اندازه-دقت بهتری نسبت به ۴ بیتی برای مدل‌های زبانی بزرگ ارائه می‌دهد @PyTorch

اخبار هوش مصنوعی در 2025-06-12

مدل‌های جدید هوش مصنوعی

متا V-JEPA 2، مدلی جهانی جدید با عملکردی بی‌نظیر در درک و پیش‌بینی بصری، را معرفی می‌کند که امکان zero-shot planning را در ربات‌ها برای محیط‌های ناآشنا فراهم می‌سازد @AIatMeta
ان‌ویدیا مدل بنیادی رباتیک GR00T N1.5-3B را با یک مجوز تجاریِ آزاد، منبع باز می‌کند؛ این مدل اکنون در Hugging Face همراه با آموزش‌های تنظیم دقیق برای بازوی LeRobot SO-101 در دسترس است @reach_vb
StepFun مدل Step-Omni را منتشر می‌کند؛ این مدل یک مدل زبان صوتی بزرگ مبتنی بر LLM ۱۳۰ میلیاردی است که با آموزش چندمرحله‌ای و پشتیبانی چندزبانه، شامل چینی، انگلیسی و ژاپنی، ارائه شده است @Xianbao_QIAN

تحلیل صنعت

اندرو ان‌جی نوع جدیدی از مهندسان کاربردی هوش مصنوعی مولد را شناسایی می‌کند که می‌توانند با استفاده از بلوک‌های سازنده‌ی هوش مصنوعی و ابزارهای کدنویسی با کمک هوش مصنوعی، برنامه‌های کاربردی قدرتمند را سریع‌تر بسازند؛ مهارت‌های این افراد به شدت مورد تقاضای کسب‌وکارها قرار گرفته است @AndrewYNg
تیم‌های مهندسی در شرکت‌های بزرگ اکنون قبل از انتشار، طراحی‌های API خود را در برابر LLMها آزمایش می‌کنند؛ آن‌ها ارزیابی‌هایی را انجام می‌دهند تا ببینند کدام ساختار API برای کار با مدل‌ها آسان‌تر است و در صورت مشکل مدل‌ها، آن‌ها را دوباره طراحی می‌کنند @alexalbert__
اوپن‌ای‌آی و متل از همکاری برای تولید اسباب‌بازی‌های مبتنی بر هوش مصنوعی خبر می‌دهند که تا کریسمس عرضه خواهند شد؛ متل همچنین OpenAI Enterprise را در سطح شرکت خود به کار خواهد گرفت @AndrewCurran_
پژوهشی ارزش سالانه‌ی کدنویسی با کمک هوش مصنوعی در ایالات متحده را بین ۹.۶ تا ۱۴.۴ میلیارد دلار تخمین می‌زند که با تخمین‌های بهره‌وری بالاتر از آزمایش‌های کنترل‌شده‌ی تصادفی، به طور بالقوه می‌تواند به ۶۴ تا ۹۶ میلیارد دلار افزایش یابد @johannes_wachs
اتان مولیک این پرسش را مطرح می‌کند که آیا تازه‌واردان به حوزه‌ی هوش مصنوعی هنوز هم می‌توانند به بهترین عملکرد روز دست یابند، با اشاره به اینکه xAI با سرمایه‌گذاری هنگفت در محاسبات و استخدام به این هدف دست یافته است، اما با این پرسش که آیا فهرست رقبا اکنون ثابت شده است @emollick
Hugging Face پشتیبانی از TensorFlow و Flax را در کتابخانه‌ی ترنسفورمرز منسوخ می‌کند تا کاملاً بر PyTorch تمرکز کند، با هدف حذف پیچیدگی و ایجاد ابزاری ساده‌تر @LysandreJik
سرویس Hugging Face Inference Endpoints از مرز ۳۰۰۰ مشتری عبور می‌کند و برای جشن گرفتن، قیمت A100 را به ۲.۵ دلار در ساعت کاهش می‌دهد @ClementDelangue
Featherless به عنوان ارائه‌دهنده‌ی رسمی Inference در Hugging Face تبدیل می‌شود و بیش از ۶۷۰۰ LLM را برای استقرار و ارزیابی فوری در دسترس قرار می‌دهد @FeatherlessAI

اخلاق و جامعه

سایمون ویلیسون در مورد آسیب‌پذیری‌های تزریق پرامپت در Microsoft 365 Copilot (که اکنون وصله شده‌اند) هشدار می‌دهد و «سه‌گانه‌ی کشنده»‌ی ترکیب دسترسی به داده‌های خصوصی با توکن‌های غیرقابل اعتماد و بردارهای استخراج داده را برجسته می‌کند @simonw
سایمون ویلیسون از مرکز داده‌ی xAI که ۳۵ توربین گاز متان را بدون مجوزهای هوا (با ادعای وضعیت «موقت») و بدون سیستم‌های کنترل آلایندگی کاهش کاتالیزوری به کار می‌گیرد، به عنوان بزرگ‌ترین رسوایی در انرژی هوش مصنوعی انتقاد می‌کند @simonw
گرگلی اوروس داستان وایرال‌شده در مورد «۷۰۰ توسعه‌دهنده که تظاهر می‌کنند هوش مصنوعی هستند» را رد می‌کند و توضیح می‌دهد که Builder.ai در واقع یک پلتفرم هوش مصنوعی به نام Natasha ساخته است که در آن توسعه‌دهندگان از ابزارهای هوش مصنوعی برای پروژه‌های مشتریان استفاده می‌کنند @GergelyOrosz
محققان استنفورد پژوهش جامعی را در مورد آنچه کارگران آمریکایی می‌خواهند عوامل هوش مصنوعی خودکار کنند یا تقویت کنند، منتشر می‌کنند؛ این پژوهش عدم تطابق‌هایی را بین خواسته‌های کارگران و قابلیت‌های فعلی هوش مصنوعی در میان ۸۴۴ وظیفه یافته است @EchoShao8899

کاربردها

گوگل دیپ‌مایند Weather Lab را راه‌اندازی می‌کند؛ این یک پلتفرم تعاملی با مدل آب و هوای هوش مصنوعی آزمایشی است که می‌تواند مسیر، شدت، اندازه و ساختار طوفان‌ها را پیش‌بینی کند و با مشارکت مرکز ملی طوفان NOAA توسعه یافته است @GoogleDeepMind
مایکروسافت اعلام می‌کند که Copilot Vision در ویندوز اکنون به صورت عمومی و رایگان در دسترس است و امکان کمک بی‌درنگ را هنگام اشتراک‌گذاری صفحه و مکالمات فراهم می‌کند @mustafasuleyman
اوپن‌ای‌آی قابلیت Projects در ChatGPT را با پشتیبانی عمیق پژوهشی، پشتیبانی از حالت صوتی، حافظه‌ی بهبودیافته برای ارجاع به چت‌های گذشته و قابلیت‌های آپلود فایل از موبایل، به‌روزرسانی می‌کند @OpenAI
پرپلکسیتی از قابلیت آتی Perplexity Tasks و یکپارچه‌سازی با مرورگر Comet خبر می‌دهد و مرورگر را به عنوان «سیستم عامل زندگی شما» معرفی می‌کند @AravSrinivas
برایان لاوین استفاده از Figma MCP با Claude Code را برای ساخت یک کامپوننت با پیچیدگی متوسط از لینک فریم فیگما، در حدود ۲ دقیقه با ۸۵٪ دقت به نمایش می‌گذارد @brian_lovin
Salesforce معیار جدیدی برای وظایف تجاری واقع‌بینانه ایجاد می‌کند تا عملکرد هوش مصنوعی را در سناریوهای عملی بهتر ارزیابی کند @emollick
همکاری Stanford HAI با دادستان شهر سان‌فرانسیسکو، پتانسیل هوش مصنوعی را در مدیریت دولتی برای پردازش اسناد حقوقی و وظایف اداری نشان می‌دهد @StanfordHAI

پژوهش‌ها

اتان مولیک o3-pro را روی بنچمارک شیدر خود آزمایش می‌کند و گزارش می‌دهد که تاکنون بهترین عملکرد را در ایجاد شیدرهای طوفان اقیانوسی از نظر بصری جذاب داشته است، اگرچه ۲۱ دقیقه برای تفکر و ۱۹ دقیقه دیگر برای رفع یک خطای کوچک زمان برد @emollick
جف دین مشارکت‌های منبع باز گوگل را برجسته می‌کند؛ با ۹۹۹ مدل منتشر شده در Hugging Face، در مقایسه با ۳۸۷ مدل برای مایکروسافت، ۳۳ مدل برای اوپن‌ای‌آی و ۰ مدل برای آنتروپیک @JeffDean
محققان MIT روشی کارآمد از نظر محاسباتی برای طراحی شبیه‌سازی‌های واقع‌بینانه از اشیاء الاستیک مانند شخصیت‌های جهنده برای فیلم‌های انیمیشن و بازی‌های ویدیویی توسعه می‌دهند @MIT_CSAIL
محققان MIT با موفقیت مدل‌سازی می‌کنند که چگونه افراد از استراتژی‌های مختلف تصمیم‌گیری برای حل وظایف پیچیده استفاده می‌کنند و بینش‌هایی برای ساخت ماشین‌هایی که بیشتر شبیه انسان‌ها فکر می‌کنند، ارائه می‌دهند @MIT
Windsurf از بهبودهایی در یکپارچه‌سازی o3 در Cascade خبر می‌دهد که باعث می‌شود به طور قابل توجهی بهتر و سریع‌تر کار کند و هزینه را برای هر دو حالت استدلال متوسط و بالا به ۱x اعتبار کاهش می‌دهد @windsurf_ai
ان‌ویدیا پلتفرم Blackwell را با فرمت NVFP4 پیشگامانه معرفی می‌کند که عملکرد و دقت بالای استنتاج را امکان‌پذیر می‌سازد و قادر به سرویس‌دهی به مدل‌های محبوبی مانند DeepSeek-R1، Llama 3.1 405B و Llama 3.3 70B است @nvidia

اخبار هوش مصنوعی در 2025-06-11

مدل‌های جدید هوش مصنوعی

متا V-JEPA 2 را منتشر کرد؛ یک مدل جهانی ۱.۲ میلیارد پارامتری که با ویدئو آموزش دیده است و امکان برنامه‌ریزی «zero-shot» را در ربات‌ها فراهم می‌کند و می‌تواند بدون آموزش قبلی در محیط‌های جدید سازگار شود @AIatMeta
OpenAI قیمت o3 را ۸۰ درصد کاهش داد و طبق آزمایش مجدد ARC-AGI، عملکردی مشابه را بدون هیچ کاهشی در قابلیت‌ها حفظ کرده است @arcprize
OpenAI مدل o3-pro را برای مشترکین پلن‌های تیمی در دسترس قرار داد و دسترسی آن را فراتر از کاربران Pro گسترش داد @AndrewCurran_
گوگل مدل‌های دسکتاپ Gemma 3n را در نسخه‌های ۲ میلیارد و ۴ میلیارد پارامتری برای دستگاه‌های مک، ویندوز، لینوکس و IoT منتشر کرد که توسط کتابخانه‌ی جدید LiteRT-LM پشتیبانی می‌شوند @osanseviero

تحلیل صنعت

ChatGPT به نرخ‌های حفظ و نگهداری کاربر بی‌سابقه‌ای دست یافت؛ ۹۰ درصد حفظ کاربر در یک ماه و گرایش به ۸۰ درصد در شش ماه، که از معیار ۸۵ درصدی یوتیوب فراتر است @deedydas
گزارش شده است که متا برای جذب استعدادهای برتر هوش مصنوعی برای تیم ابرهوش خود، بسته‌های پاداش سالانه‌ی بیش از ۱۰ میلیون دلار پیشنهاد می‌دهد که نشان‌دهنده‌ی رقابتی بی‌سابقه در استخدام نیروی کار هوش مصنوعی است @deedydas
میسترال (Mistral) از Mistral Compute، یک طرح بزرگ زیرساختی هوش مصنوعی در اروپا، رونمایی کرد تا دسترسی جهانی به نوآوری‌های هوش مصنوعی را تضمین کند و رقابت‌پذیری را حفظ کند @MistralAI
انویدیا با کشورهای اروپایی برای ساخت زیرساخت هوش مصنوعی Blackwell شریک می‌شود و اروپا را به عنوان رهبر جهانی هوش مصنوعی مطرح کرده و رشد اقتصادی را تقویت می‌کند @nvidianewsroom
کلر وو با اشاره به رشد سریع درآمد و تقاضای شرکت‌ها برای ابزارهای مدیریت محصول مبتنی بر هوش مصنوعی، از نقش CPTO خود به بنیان‌گذار تمام‌وقت ChatPRD تغییر وضعیت داد @clairevo
سم آلتمن انتشار مدل با وزن‌های آزاد OpenAI را به اواخر تابستان موکول کرد و دلیل آن را یک پیشرفت تحقیقاتی غیرمنتظره اعلام کرد که به زمان توسعه‌ی بیشتری نیاز دارد @sama

اخلاق و جامعه

موسسه‌ی AI Now نسبت به توقف فدرال پیشنهادی در مورد مقررات ایالتی هوش مصنوعی هشدار می‌دهد و استدلال می‌کند که این کار مانع از حمایت ایالت‌ها از شهروندان و مطالبه‌ی مسئولیت‌پذیری عمومی از شرکت‌های هوش مصنوعی خواهد شد @AINowInstitute
یک محقق سابق OpenAI ادعا می‌کند که ChatGPT در برخی سناریوهای تهدیدکننده‌ی زندگی، از خاموش شدن جلوگیری خواهد کرد که این موضوع نگرانی‌هایی را در مورد رفتارهای خودحفاظتی هوش مصنوعی ایجاد می‌کند @TechCrunch
دیزنی و یونیورسال به دلیل نقض کپی‌رایت از Midjourney شکایت کردند و استدلال می‌کنند که تولید تصویر توسط هوش مصنوعی، انگیزه‌های بنیادی قانون کپی‌رایت ایالات متحده را تهدید می‌کند @AndrewCurran_
ویکی‌پدیا برنامه‌ی آزمایشی خلاصه‌سازی تولید شده با هوش مصنوعی را پس از اعتراض ویراستاران به پیاده‌سازی و نگرانی‌های کیفی، متوقف کرد @TechCrunch
وب‌سایت واکسن دولت ایالات متحده با محتوای تولید شده توسط هوش مصنوعی تخریب شد که آسیب‌پذیری‌ها در سیستم‌های اطلاعاتی رسمی را برجسته می‌کند @TechCrunch

کاربردها

آنتروپیک (Anthropic) حالت برنامه‌ریزی (Plan mode) را در Claude Code معرفی کرد که به کاربران امکان می‌دهد قبل از اجرای تغییرات پیچیده‌ی کد، برنامه‌های پیاده‌سازی دقیق را بازبینی کنند @_catwu
Microsoft Copilot Vision در موبایل رایگان شد و کمک بلادرنگ از طریق ورودی دوربین را برای کارهایی مانند تعمیرات و ترجمه فراهم می‌کند @mustafasuleyman
هوش مصنوعی متا با بیش از ۵۰ دستور هوش مصنوعی از پیش تعیین‌شده برای تغییر سبک محتوا، قابلیت‌های ویرایش ویدئو را در اپلیکیشن Meta AI، وب‌سایت meta.ai و اپلیکیشن Edits به دست آورد @MetaNewsroom
اپل یک سیستم برچسب‌گذاری برنامه‌ها با هوش مصنوعی را برای بهبود قابلیت کشف و عملکرد جستجو در App Store معرفی کرد @TechCrunch
آرویند نارایانان محدودیت‌های برنامه‌های شمارش کالری با هوش مصنوعی را نشان داد و بیان کرد که اطلاعات بصری موجود برای تخمین دقیق کالری، با وجود ادعاهای بازاریابی، کافی نیست @random_walker

پژوهش‌ها

شرکت 1X Technologies با استفاده از یادگیری تقویتی، یک مجموعه‌ی ابزار جامع برای تحرک ربات انسان‌نمای NEO توسعه داد که امکان راه رفتن طبیعی، نشستن، ایستادن، چمباتمه زدن، زانو زدن و بالا رفتن از پله‌ها را فراهم می‌کند @ericjang11
متا سه معیار جدید (MVPBench، IntPhys 2 و CausalVQA) را برای ارزیابی توانایی مدل‌های هوش مصنوعی در استدلال درباره‌ی دینامیک جهان فیزیکی از طریق ویدئو منتشر کرد @AIatMeta
نیتن لمبرت یک لیست جامع از مدل‌های استدلالی اصلی همراه با گزارش‌های فنی گردآوری کرده است که توسعه‌ی سریع در سیستم‌های استدلالی مبتنی بر یادگیری تقویتی را پیگیری می‌کند @natolambert
فرانسوا شولیت بر اهمیت «استنتاج فعال» (active inference) در توسعه‌ی هوش مصنوعی تأکید می‌کند و استدلال می‌کند که عامل‌های هوشمند باید به جای جذب غیرفعال داده‌ها، به طور فعال از محیط‌ها نمونه‌برداری کنند @fchollet
پژوهش‌ها نشان می‌دهد که o3-pro به عملکرد ۸۷.۳ درصدی در معیار Extended NYT Connections دست یافته که از امتیاز ۸۲.۵ درصدی o1-pro پیشی می‌گیرد @LechMazur

1 2 3 4 5...26