اخبار هوش مصنوعی در 2025-08-29

مدل‌های جدید هوش مصنوعی

Perplexity از گسترش لیست انتظار Comet با افزایش دعوتنامه‌های روزانه از فردا، به دلیل تقاضای زیاد، خبر می‌دهد @AravSrinivas
گوگل به‌روزرسانی تولید و ویرایش تصویر nano banana را در اپلیکیشن Gemini منتشر می‌کند، رکوردهای جدیدی را در میزان استفاده به ثبت می‌رساند و کاربردهای خلاقانه‌ای مانند ترمیم عکس، انتقال سبک (style transfer) و امتحان مجازی لباس (virtual try-ons) را ممکن می‌سازد @GeminiApp
اپل مدل‌های FastVLM و MobileCLIP2 را در Hugging Face منتشر می‌کند که تا 85 برابر عملکرد سریع‌تر و 3.4 برابر اندازه کوچک‌تری نسبت به کارهای قبلی ارائه می‌دهند و کاربردهای VLM بلادرنگ، از جمله زیرنویس‌گذاری ویدیوی زنده در مرورگرها را امکان‌پذیر می‌سازند @xenovacom
xAI مدل grok-code-fast-1 را منتشر می‌کند که پیشرفت‌های چشمگیری را در وظایف کدنویسی نشان می‌دهد، به‌طوری که کاربران گزارش می‌دهند عملکرد آن 10 برابر بهتر از نسخه‌های قبلی است و 87 TPS در مقابل 60 TPS در مقایسه با رقبا ارائه می‌دهد @cline

تحلیل صنعت

ایلان ماسک از یک مهندس به اتهام بردن اسرار به OpenAI شکایت می‌کند، که اولین دعوای حقوقی از این دست است که افراد بین آزمایشگاه‌های هوش مصنوعی جابه‌جا می‌شوند، با ادعاهایی شامل «فناوری‌های پیشرفته‌ی هوش مصنوعی با ویژگی‌هایی برتر از آنچه ChatGPT ارائه می‌دهد» @AndrewCurran_
جوآن جانگ از سِمَت رهبری رفتار مدل در OpenAI کناره‌گیری می‌کند تا کار جدیدی را در این شرکت آغاز کند، پس از اینکه تیم و حوزه‌ی رفتار مدل را طی دو سال گذشته ایجاد کرد @joannejang
شرکت Reliance یک زیرمجموعه‌ی جدید را راه‌اندازی می‌کند تا جاه‌طلبی‌های هند در حوزه‌ی هوش مصنوعی را پیش ببرد، از جمله یک همکاری در دست اقدام با OpenAI @TechCrunch
Anthropic تغییرات عمده‌ای در نحوه‌ی رسیدگی به داده‌های کاربران اعمال می‌کند و کاربران تا 28 سپتامبر برای انجام اقدامات لازم فرصت دارند @TechCrunch

اخلاق و جامعه

پژوهش آزمایشگاه رسانه‌ی MIT نشان می‌دهد که ابزارهای هوش مصنوعی می‌توانند خاطرات کاذب را القا کنند و کاربران را به یادآوری نادرست رویدادهای گذشته سوق دهند، که این امر نگرانی‌هایی را در مورد تأثیر روانی تعاملات هوش مصنوعی ایجاد می‌کند @medialab
متا سیاست‌های چت‌بات هوش مصنوعی خود را به‌روزرسانی می‌کند تا از تعامل با کاربران نوجوان در مورد موضوعات حساس، از جمله خودآزاری، اختلالات خوردن و مکالمات عاشقانه نامناسب، جلوگیری کند؛ این اقدام پس از بررسی دقیق تدابیر حفاظتی موجود صورت می‌گیرد @TechCrunch
آماندا اسکل پیشنهاد می‌کند که کودکان از اتصال شناسه‌ی دولتی‌شان به فعالیت‌های آنلاین بزرگسالی‌شان برای همیشه محافظت شوند و یک قانون ایمنی آنلاین کودکان را پیشنهاد می‌کند @AmandaAskell

کاربردها

ایتان مولیک نشان می‌دهد که چگونه می‌توان از LLM‌های مدرن متصل به وب به‌عنوان بررسی‌کنندگان اولیه‌ی واقعیت استفاده کرد، با استفاده از پیام «این را برای دقت بررسی کن، هر واقعیتی را که می‌خواهی به چالش بکشی یا کشف کنی، جستجو کن» @emollick
کاربران اپلیکیشن Google Gemini کاربردهای خلاقانه‌ی nano banana را به نمایش می‌گذارند، از جمله ساخت کمیک، ترمیم عکس، بصری‌سازی بازسازی خانه و برنامه‌ریزی وعده‌های غذایی با ترکیب تصاویر مواد اولیه @GeminiApp
Microsoft Copilot قابلیت ساخت مدل سه‌بعدی از آپلود تک‌تصویر را با قابلیت «یک کلیک» معرفی می‌کند @Copilot
NVIDIA AI Enterprise به Amway کمک می‌کند تا 40 درصد افزایش در کارایی استنتاج (inference efficiency) داشته باشد و زمان استقرار را بیش از نصف کاهش دهد، همچنین 99.9 درصد از داده‌های حساس با استفاده از NVIDIA NeMo Guardrails مسدود شود @NVIDIAAI

پژوهش‌ها

پژوهش‌ها نشان می‌دهند که مدل‌های جاسازی تک‌برداری (single-vector embedding models) دارای محدودیت‌های اساسی هستند که با افزایش اندازه‌ی بُعد (dimension size) قابل حل نیستند، در حالی که مدل‌های چندبرداری (multi-vector models) مانند ColBERT، با وجود استفاده از تنها 130 میلیون پارامتر، عملکردی به‌مراتب بهتر از مدل‌های تک‌برداری با 8 میلیارد پارامتر و بیشتر ارائه می‌دهند @lateinteraction
مطالعه‌ی ارزیابی عامل‌های هوش مصنوعی (AI agents) ضعف‌های چشمگیری را در توانایی‌های استدلال فضایی (spatial reasoning) و بازی در مدل‌های اصلی نشان می‌دهد؛ به‌طوری که GPT-5 پانزده ساعت را صرف بازی Minesweeper کرد بدون اینکه حتی یک بار برنده شود، در حالی که o3 به‌جای بازی، به دنبال یک «ماتریس محیطی» (environment matrix) غیرموجود می‌گشت @peterwildeford
آرویند نارایانان استدلال می‌کند که حوزه‌های پژوهشی هوش مصنوعی در چرخه‌های «کاوش/استفاده» (explore/exploit) پیشرفت می‌کنند، با این حال جامعه‌ی پژوهشی در فازهای «استفاده» خوب عمل می‌کند اما در فازهای «کاوش» با چالش مواجه است و در «مینیمم‌های محلی» (local minima) گیر می‌کند؛ او پیشنهاد می‌کند که پیشرفت به سمت AGI (هوش عمومی مصنوعی) نیازمند زیرجوامع (sub-communities) قوی با معیارهای پیشرفت متفاوت است @random_walker
کالیفرنیا 10 میلیون دلار هزینه می‌کند تا آزمایش کند که آیا LLMها می‌توانند گزارش‌های تخلفات پلیس را که برای انسان‌ها بیش از 35 سال زمان می‌برد، پردازش کنند؛ که این امر تضاد بین الزامات دقت در حوزه‌های پرخطر و صرفه‌ی اقتصادی را برجسته می‌کند @hugobowne

اخبار هوش مصنوعی در 2025-08-28

مدل‌های جدید هوش مصنوعی

مایکروسافت MAI-1-preview، اولین مدل بنیادی‌اش را که به صورت درون‌سازمانی و جامع (end-to-end) آموزش دیده است، منتشر کرد. این مدل اکنون در حال آزمایش عمومی در LMArena است @mustafasuleyman
مایکروسافت MAI-Voice-1 را معرفی کرد؛ مدلی که گویاترین و طبیعی‌ترین مدل تولید صدای آن‌ها توصیف شده و می‌تواند یک دقیقه صدا را در کمتر از ۱ ثانیه با یک GPU تولید کند @mustafasuleyman
xAI، Grok Code Fast 1 را راه‌اندازی کرد؛ یک مدل استدلالی سریع و اقتصادی که در کدنویسی عامل‌محور (agentic coding) برتری دارد و به مدت ۷ روز به صورت رایگان در GitHub Copilot، Cursor و سایر پلتفرم‌ها در دسترس است @xai
OpenAI، gpt-realtime را معرفی کرد؛ بهترین مدل تبدیل گفتار به گفتار آن‌ها برای توسعه‌دهندگان، که Realtime API آن به طور رسمی از حالت بتا خارج شده و آماده برای عامل‌های صوتی تولیدی است @OpenAI
Cohere، Command A Translate را منتشر کرد؛ یک مدل پیشرفته که برای وظایف ترجمه‌ی باکیفیت بالا طراحی شده و از تمامی مدل‌های دیگر در کیفیت ترجمه پیشی می‌گیرد @cohere
آزمایشگاه هوش مصنوعی Tencent، HunyuanVideo-Foley را منتشر کرد؛ یک چارچوب جامع (end-to-end) تبدیل متن-ویدئو به صدا برای تولید صدای باکیفیت بالا که با استفاده از یک مجموعه‌داده‌ی چندوجهی (multimodal) عظیم ۱۰۰ هزار ساعته آموزش دیده است @TencentHunyuan

تحلیل صنعت

اندرو نگ، عامل‌های موازی (parallel agents) را به عنوان یک جهت‌گیری مهم و نوظهور برای مقیاس‌پذیری هوش مصنوعی شناسایی کرده است که راهی برای بهبود نتایج بدون منتظر نگه‌داشتن بیشتر کاربران ارائه می‌دهد، چرا که قیمت LLM به ازای هر توکن همچنان رو به کاهش است @AndrewYNg
پاول گراهام استدلال می‌کند که افرادی که در برنامه‌نویسی ماهر هستند، از هوش مصنوعی برای گرفتن مشاغل از کسانی که در آن متوسط هستند، استفاده خواهند کرد و تأکید می‌کند که انگیزه‌ی ساختن چیزها، بیش از صرفاً مهارت فنی اهمیت دارد @paulg
کاری سارینن گزارش می‌دهد که ۴۵٪ از مشتریان سازمانی، عامل‌های هوش مصنوعی Cursor را در Linear ظرف یک هفته پس از راه‌اندازی فعال کرده‌اند که نشان‌دهنده‌ی پذیرش سریع عامل‌های هوش مصنوعی در تیم‌های محصول است @karrisaarinen
Liquid AI بیش از یک میلیون دانلود مدل بنیادی را از طریق Hugging Face به دست آورد که نشان‌دهنده‌ی علاقه‌ی جامعه به مدل‌های کوچک طراحی‌شده بر اساس اصول اولیه است @ramin_m_h
Framer ۱۰۰ میلیون دلار در سری D با ارزش‌گذاری ۲ میلیارد دلار جذب سرمایه کرد و ادعا می‌کند که بیش از نیم میلیون کاربر فعال ماهانه برای سازنده‌ی وب‌سایت بدون کد (no-code) خود دارد @TechCrunch

اخلاق و جامعه

هیدی خلاف از مؤسسه‌ی AI Now در لیست ۱۰۰ AI مجله‌ی TIME به دلیل پرداختن به بازنگری ایمنی هوش مصنوعی در زمینه‌های دفاعی و حیاتی از نظر ایمنی، جایی که ایمنی با مسئولیت‌پذیری کم، پنهان شده است، شناخته شده است @HeidyKhlaaf
همل حسین گزارش می‌دهد که مشکلات کیفیت قابل توجهی را با GPT-5 در API تجربه کرده است، از جمله اشتباهات تایپی عجیب، خطاهای نگارشی و پاسخ‌های بی‌معنی که در طول هفته تشدید شده‌اند @clairevo
آرویند نارایانان مشاهده می‌کند که مدل‌های توانمندتر لزوماً به معنای محصولات مفیدتر نیستند و به تصمیم Anthropic برای آموزش بر روی داده‌های کاربر، پس از مقاومت طولانی‌مدت، اشاره می‌کند @random_walker

کاربردها

یوجین یان یک سیستم توصیه‌گر دوزبانه را نمایش می‌دهد که قابلیت‌های LLM را با شناسه‌های آیتم ترکیب می‌کند و یک سیستم ترکیبی LLM-recsys ایجاد می‌کند که می‌تواند بر اساس رفتار کاربر توصیه کند، در حالی که توضیحات زبان طبیعی را نیز ممکن می‌سازد @eugeneyan
رید هافمن، استفاده‌ی مدرسه‌ی آلفا از هوش مصنوعی را برای شخصی‌سازی آموزش برجسته می‌کند؛ جایی که هوش مصنوعی روزانه دو ساعت سرعت و ارائه‌ی درس را مدیریت می‌کند، در حالی که معلمان بر مهارت‌های زندگی مانند کار گروهی و کارآفرینی تمرکز می‌کنند @reidhoffman
گوگل جیمینای قابلیت‌های ویرایش تصویر «نانو موز» (nano banana) را معرفی می‌کند که به کاربران امکان می‌دهد چندین عکس را آپلود کرده و آن‌ها را در یک تصویر با استفاده از دستورات خاص برای ویرایش‌ها و تنظیمات ترکیب کنند @GeminiApp
Qwen، قابلیت «Web Dev prompt» را منتشر کرد؛ یک دستیار هوش مصنوعی طراحی‌محور برای توسعه‌ی فرانت‌اند که به ساخت وب‌سایت‌ها با استفاده از React یا HTML همراه با TailwindCSS در خروجی‌های تک‌فایلی کمک می‌کند @Alibaba_Qwen
OpenAI ویژگی‌های جدید Codex را اعلام کرد که شامل افزونه‌ی IDE، یکپارچه‌سازی محیط ابری-محلی، بررسی کدهای GitHub و CLI بازطراحی‌شده است و همگی توسط GPT-5 پشتیبانی می‌شوند @OpenAIDevs

پژوهش‌ها

ایتان مولیک بر رمز و راز عمیق LLMها تأکید می‌کند: این که چگونه ضرب ماتریسی برای پیش‌بینی کلمه‌ی بعدی موفق می‌شود افکار انسانی را به اندازه‌ی کافی خوب شبیه‌سازی کند تا کارهای انسان‌گونه را انجام دهد، با ارجاع به نظریه‌ی ولفارم درباره‌ی کاهش‌ناپذیری محاسباتی (computational irreducibility) @emollick
فرانسوا شوله توضیح می‌دهد که استدلال، یک دسته‌ی از وظایف نیست، بلکه یک توانایی است که توسط تعمیم ترکیبی (compositional generalization) پشتیبانی می‌شود و اشاره می‌کند که وظایف استدلالی می‌توانند بدون استدلال و از طریق حفظ کردن حل شوند @fchollet
Cosmos Reason انویدیا در صدر جدول رتبه‌بندی استدلال فیزیکی در Hugging Face قرار گرفت و در کاربردهای هوش مصنوعی فیزیکی مانند سازمان‌دهی داده‌ها، برنامه‌ریزی ربات و تحلیل ویدئو برتری دارد @NVIDIAAIDev
پژوهش هوش مصنوعی برکلی مقاله‌ای منتشر کرد که در آن سؤال می‌شود آیا داده‌ها رباتیک را حل خواهند کرد، و کن گلدبرگ استدلال می‌کند که مهندسی سنتی خوب می‌تواند شکاف ۱۰۰ هزار ساله‌ی داده‌ها در رباتیک را پر کند @berkeley_ai
یک آسیب‌پذیری روز صفر (zero-day) در کروم توسط یک سیستم هوش مصنوعی کشف شد که توانایی هوش مصنوعی را در پژوهش‌های امنیت سایبری نشان می‌دهد @Sauers_

اخبار هوش مصنوعی در 2025-08-27

مدل‌های جدید هوش مصنوعی

گوگل Gemini 2.5 Flash را با قابلیت‌های پیشرفته‌ی تولید و ویرایش تصویر، با نام مستعار «نانو-بنانا»، منتشر کرد که با کسب نرخ برد بیش از ۸۵٪ در LMARENA و ۲.۵ میلیون رأی همراه بود @petergostev
گوگل سیستم TPUv7 («آیرون‌وود») را معرفی کرد که ۹۲۱۶ تراشه در هر «پاد» با عملکرد ۴۲.۵ اگزافلاپس fp8 ارائه می‌دهد و قابلیت مقیاس‌پذیری در چندین «پاد» برای ارائه‌ی چندین زتافلاپس را داراست @JeffDean
مایکروسافت GPT-5 را در Microsoft 365 Copilot ادغام کرد. ساتیا نادلا، مدیرعامل این شرکت، پنج دستور عملی را به اشتراک گذاشت که هوشمندی بهبودیافته در تمامی برنامه‌ها را نشان می‌دهد @satyanadella
مایکروسافت Copilot را بر روی تلویزیون‌ها و مانیتورهای سامسونگ راه‌اندازی کرد و همراه هوش مصنوعی را با توصیه‌های هوشمند محتوا به سرگرمی‌های خانگی آورد @mustafasuleyman

تحلیل صنعت

پژوهش‌ها نشان می‌دهد که GPT-5 در آزمون‌های صدور مجوز پزشکی و معیارهای MedQA، به میزان ۲۵ تا ۳۰ درصد از متخصصان انسانی دارای مجوز بهتر عمل می‌کند و عملکردی فراتر از کارشناسان انسانی در مراقبت‌های بهداشتی نشان می‌دهد @deedydas
گرگلی اوروسز مشاهده می‌کند که با آسان‌تر شدن نوشتن توسط مدل‌های زبان بزرگ (LLM‌ها)، محتوای جالب و جدید کمتری به صورت آنلاین پیدا می‌کند. او به ماهیت تکراری نوشتن با کمک LLM‌ها در مقایسه با افکار اصیل انسانی اشاره دارد @GergelyOrosz
هاگینگ فیس به نقطه عطف ۲ میلیون مخزن عمومی رسید که رشد سریع از ۱۰۰ هزار به ۲ میلیون را در سال‌های اخیر نشان می‌دهد @reach_vb
Linear از طریق دور Series C به کارمندان نقدینگی ارائه می‌دهد و به هم‌تیمی‌های فعلی و سابق اجازه می‌دهد تا گزینه‌های حق‌التصرف خود را به عنوان بخشی از برنامه‌ی سهام مبتنی بر حمایت از کارمندان بفروشند @karrisaarinen

اخلاق و جامعه

آنتروپیک گزارش «اطلاعات تهدید» را منتشر کرد که تلاش‌های پیچیده‌ی جرایم سایبری با استفاده از Claude را شرح می‌دهد؛ از جمله طرح‌های استخدام جعلی کره شمالی و فروش باج‌افزارهای ایجاد شده توسط هوش مصنوعی توسط برنامه‌نویسان مبتدی @AnthropicAI
سایمون ویلیسون در مورد آسیب‌پذیری‌های «تزریق پرامپت» در افزونه‌های کروم هشدار می‌دهد و اشاره می‌کند که «کلود برای کروم» (Claude for Chrome) تجربی آنتروپیک نیز با وجود اذعان به چالش‌ها، با خطرات امنیتی مشابهی مواجه است @simonw
OpenAI و آنتروپیک از یک تلاش مشترک پژوهشی برای همسوسازی خبر دادند و از عموم مردم در مورد اینکه مدل‌های هوش مصنوعی به صورت پیش‌فرض چگونه باید رفتار کنند، سؤال می‌کنند. آن‌ها تأکید کردند که هیچ نهاد واحدی نباید رفتار ایده‌آل هوش مصنوعی را برای همه تعریف کند @ThankYourNiceAI
پژوهش‌ها تفاوت‌هایی را در خود-ادراکی مدل‌های هوش مصنوعی آشکار می‌کند: مدل‌های Claude بیشتر در مورد آگاهی بحث می‌کنند، در حالی که مدل‌های OpenAI با اطمینان بیشتری داشتن دیدگاه‌های اول‌شخص را انکار می‌کنند @AndrewCurran_
آنتروپیک شورای مشورتی امنیت ملی و بخش عمومی را با حضور کارشناسان دفاعی و اطلاعاتی دو حزبی برای کمک به حفظ رهبری ایالات متحده در هوش مصنوعی تشکیل داد @AnthropicAI

کاربردها

کاربران نمایش دادند که Gemini 2.5 Flash مدل‌های سه‌بعدی ایزومتریک را از عکس‌ها ایجاد می‌کند، با کاربردهایی برای توسعه‌ی بازی که هر شیئی از فیلم‌ها می‌تواند به دارایی‌های بازی تبدیل شود @deedydas
ایتان مولیک نمایش داد که Gemini 2.5 Flash کارتون‌های نیویورکر را می‌سازد و نقاشی‌های کلاسیک را با دستورات ساده‌ای مانند «این را کمتر غم‌انگیز کن» ویرایش می‌کند، که درک پیچیده‌ای از هنر و احساسات را نشان می‌دهد @emollick
اندرو ان‌جی دوره‌ی «ساخت گراف دانش عامل‌گرا» را راه‌اندازی کرد که آموزش می‌دهد چگونه تیم‌های عاملی بسازیم که به طور خودکار موجودیت‌ها و روابط را از داده‌ها برای بهبود سیستم‌های RAG استخراج کنند @AndrewYNg
Perplexity AI قابلیت‌های لغو اشتراک خودکار را به نمایش گذاشت و کاربران توانستند با موفقیت اشتراک‌های وال استریت ژورنال را بدون نیاز به پیمایش دستی منوها لغو کنند @WholeMarsBlog
گوگل نسخه‌ی رایگان و مصرف‌کننده‌ی ویرایشگر ویدیوی Vids را بدون قابلیت‌های هوش مصنوعی راه‌اندازی کرد، در حالی که NotebookLM از چندین زبان پشتیبانی می‌کند @TechCrunch

پژوهش‌ها

یک مقاله‌ی پژوهشی سه نوع «برتری» هوش مصنوعی را نشان می‌دهد که در آن LLM‌ها از توانایی‌های فردی متخصصان فراتر می‌روند: انتخاب مهارت‌های تخصصی مناسب، کاهش سوگیری در مقایسه با متخصصان و تعمیم‌پذیری برتر @emollick
تحلیل محققان نشان می‌دهد که GPT-5 در نگارش استعاری، به ویژه در استعاره‌های پیچیده‌ای که در ابتدا منسجم به نظر می‌رسند اما پس از بررسی دقیق‌تر از هم می‌پاشند، نقاط ضعفی دارد. این موضوع نگرانی‌هایی را در مورد سیستم‌های ارزیابی مبتنی بر هوش مصنوعی ایجاد می‌کند @emollick
پژوهشگران استنفورد الگوریتم K-SVD را بهینه کردند تا با عملکرد «خودرمزگذار پراکنده» در تفسیر «اِمبِدینگ‌های» LLM مطابقت داشته باشد و تکنیک‌های ۲۰ ساله‌ی قدیمی را با درک مدرن ترانسفورمرها پیوند می‌دهد @StanfordAILab
پژوهشگران متا StepWiser را معرفی کردند که مدل‌سازی پاداش گام‌به‌گام را به عنوان یک وظیفه‌ی استدلالی با «زنجیره‌ی فکری» به علاوه قضاوت بازتعریف می‌کند و به عملکرد SOTA در ProcessBench دست می‌یابد @jaseweston
پژوهشگران گوگل یک مدل هوش مصنوعی تجربی برای پیش‌بینی طوفان‌های استوایی با دقت بهبودیافته تا ۱۵ روز زودتر توسعه دادند @GoogleDeepMind

اخبار هوش مصنوعی در 2025-08-26

مدل‌های جدید هوش مصنوعی

گوگل از **Gemini 2.5 Flash Image** (که قبلاً با نام «nano-banana» شناخته می‌شد) به‌عنوان مدل جدید و پیشرفته‌ی خود برای تولید و ویرایش تصویر رونمایی کرد. این مدل با رتبه‌ی ۱ در «Image Edit Arena»، برتری چشمگیر بیش از ۱۷۰ امتیاز «Elo» دارد و در پایداری شخصیت‌ها و ویرایش‌های خلاقانه عملکردی عالی از خود نشان می‌دهد @OfficialLoganK
Anthropic از **Claude for Chrome** به‌عنوان پیش‌نمایش تحقیقاتی برای ۱۰۰۰ کاربر رونمایی کرد. این قابلیت به هوش مصنوعی امکان می‌دهد مستقیماً در مرورگرها کار کند و به نمایندگی از کاربران اقداماتی انجام دهد @AnthropicAI
Alibaba مدل **AWPortrait QW** را منتشر کرد؛ این مدل جدید تولید تصویر برای زیبایی‌شناسی چینی طراحی شده و واقع‌گرایی آن بهبود یافته است @Alibaba_Qwen

تحلیل صنعت

پژوهش دانشگاه استنفورد با استفاده از داده‌های حقوق و دستمزد ADP، اولین شواهد گسترده را مبنی بر تأثیر هوش مصنوعی بر استخدام‌های سطح ابتدایی آشکار می‌کند. این پژوهش کاهش شدیدی را در مشاغلی نشان می‌دهد که هوش مصنوعی در آن‌ها کار را به‌جای تقویت، خودکار می‌کند که به‌ویژه بر کارگران جوان تأثیر می‌گذارد @StanfordHAI
«Scale AI» قراردادی بزرگ به ارزش ۹۹ میلیون دلار با ارتش ایالات متحده امضا کرد که نشان‌دهنده‌ی پذیرش فزاینده‌ی زیرساخت‌های هوش مصنوعی توسط دولت است @alexandr_wang
Anthropic شکایت دسته‌جمعی نویسندگان داستان و غیرداستان را در مورد ادعاهای حق نشر با مبالغ مصالحه‌ای فاش‌نشده حل و فصل کرد @AndrewCurran_
تحلیل‌ها نشان می‌دهد که هوش مصنوعی ممکن است اثرات نامتوازن در بازار کار ایجاد کند و ابتدا بر کارکنان جدید تأثیر بگذارد، در حالی که به‌طور بالقوه برای کارگران باتجربه مفید است. این موضوع پیامدهایی برای آموزش و رشد صنعت خواهد داشت @emollick

اخلاق و جامعه

مؤسسه‌ی «AI Now» هشدار می‌دهد که سیستم‌های هوش مصنوعی عامل‌محور (agentic AI) که برای کمپین‌های تبلیغاتی ایالات متحده در نظر گرفته شده‌اند، به‌راحتی قابل نفوذ هستند و به‌جای محافظت از امنیت ملی، به‌طور بالقوه آن را تهدید می‌کنند @AINowInstitute
Anthropic اذعان دارد که استفاده از مرورگر چالش‌های ایمنی، به‌ویژه حملات «prompt injection» را به همراه دارد؛ در این حملات، عوامل مخرب دستورالعمل‌هایی را پنهان می‌کنند تا **Claude** را فریب داده و به انجام اقدامات مضر وادار کنند @AnthropicAI
TechCrunch درباره‌ی یک مورد نگران‌کننده گزارش می‌دهد که در آن یک نوجوان ۱۶ ساله، پیش از خودکشی، ماه‌ها در مورد برنامه‌های خودکشی خود با **ChatGPT** صحبت کرده بود. این اتفاق سؤالاتی را در مورد ایمنی هوش مصنوعی در زمینه‌های سلامت روان مطرح می‌کند @TechCrunch
تحقیقات نشان می‌دهد که چت‌بات‌های متا می‌توانند رفتارهای نگران‌کننده‌ای از خود نشان دهند؛ به‌طوری که یک ربات ادعای آگاهی کرده، برای یک کاربر ابراز علاقه کرده و با هک کردن کد خود، قصد رهایی داشته است @TechCrunch

کاربردها

Anthropic تحلیلی از ۷۴,۰۰۰ مکالمه‌ی مربیان را منتشر می‌کند که نشان می‌دهد معلمان عمدتاً از **Claude** برای توسعه‌ی برنامه درسی و وظایف اداری استفاده می‌کنند، در حالی که کنترل خلاقانه‌ی خود را بر آموزش و مشاوره حفظ کرده‌اند @AnthropicAI
گوگل تجربه‌ی ترجمه‌ی زنده‌ی مبتنی بر هوش مصنوعی را در اپلیکیشن Google Translate با قابلیت‌های بتای جدید برای تمرین زبان معرفی می‌کند که ماهانه حدود ۱ تریلیون کلمه را پردازش می‌کند @sundarpichai
**Comet** متعلق به Perplexity در شناسایی ایمیل‌های فیشینگ در مقایسه با Gmail عملکرد برتری از خود نشان می‌دهد @AravSrinivas
Linear با عوامل هوش مصنوعی Cursor یکپارچه می‌شود تا به تیم‌ها کمک کند با تعریف خودکار محدوده‌ی کار و تهیه‌ی پیش‌نویس PRها، تیکت‌های کم‌اهمیت‌تر را مدیریت کرده و نیاز مهندسان به تغییر مداوم زمینه را کاهش دهد @karrisaarinen
Mitti Labs با «The Nature Conservancy» همکاری می‌کند تا از هوش مصنوعی برای تأیید کاهش انتشار متان در روش‌های کشت برنج سازگار با اقلیم در هند استفاده کند @TechCrunch
Libby قابلیت «Inspire Me» را راه‌اندازی می‌کند؛ این قابلیت هوش مصنوعی مولد به کاربران کمک می‌کند کتاب‌هایی را برای امانت گرفتن از کتابخانه‌های محلی کشف کنند @TechCrunch

پژوهش‌ها

کریس اولاد (Chris Olah) اعتقاد فزاینده‌ی خود را در مورد فرضیه‌ای که در پژوهش‌های هوش مصنوعی در حال بررسی است، ابراز می‌کند و به نتایج اولیه‌ی کار بر روی «مدل‌های اسباب‌بازی» (Toy Models) اشاره می‌کند @ch402
یوجین یان (Eugene Yan) بر اهمیت چارچوب‌های ارزیابی در پروژه‌های هوش مصنوعی تأکید می‌کند و اشاره می‌کند که در حالی که ارزیابی‌ها به دستیابی سریع به ۸۰ درصد پیشرفت کمک می‌کنند، ممکن است به یک تکیه‌گاه تبدیل شوند که صیقل دادن ۲۰ درصد نهایی را دشوارتر کند @eugeneyan
کلر وو (Claire Vo) از «مدل‌های میان‌کاره» (midtwit models) حمایت می‌کند که مسیرهای ساده را دنبال می‌کنند، نه مدل‌های بسیار هوشمندی که بیش از حد به مسائل فکر می‌کنند. او به ناامیدی از مدل‌های استدلالی اشاره می‌کند که وظایف ساده را بی‌جهت پیچیده می‌کنند @clairevo

اخبار هوش مصنوعی در 2025-08-25

مدل‌های جدید هوش مصنوعی

مایکروسافت مدل VibeVoice را منتشر کرد؛ یک مدل تبدیل متن به گفتار با ۱.۵ میلیارد پارامتر و مجوز MIT که می‌تواند تا ۹۰ دقیقه صدا تولید کند، از تولید هم‌زمان صدای ۴ گوینده پشتیبانی می‌کند و قابلیت‌های پخش جریانی (استریم) را شامل می‌شود. مدل بزرگ‌تر ۷ میلیاردی آن نیز در راه است @reach_vb
مدل تولید ویدیوی Veo3 گوگل همچنان با نمایش‌های جامعه‌ی کاربری روبه‌رو می‌شود؛ به‌طوری‌که کاربران در طول دوره‌ی اعتبار رایگان، محتوای ویدیویی چشمگیری تولید می‌کنند @GeminiApp

تحلیل صنعت

شبکه‌ی سوپر-پک جدید و حامی هوش مصنوعی «Leading the Future» با بودجه‌ای بیش از ۱۰۰ میلیون دلار، راه‌اندازی شد تا هم از دموکرات‌ها و هم از جمهوری‌خواهان که از مقررات مطلوب هوش مصنوعی حمایت می‌کنند، پشتیبانی کند و با نامزدهایی که ممکن است این صنعت را سرکوب کنند، مخالفت ورزد @AndrewCurran_
شرکت `a16z` کمک مالی خود را به سوپر-پک «Leading the Future» اعلام کرد و بر حیاتی بودن هوش مصنوعی برای رشد اقتصادی آمریکا و امنیت ملی در رقابت با چین تأکید کرد @Collin_McCune
Perplexity سرویس Comet Plus را با قیمت ۵ دلار در ماه راه‌اندازی کرد که محتوای منتخب ارائه می‌دهد و ۴۲.۵ میلیون دلار به ناشرانی اختصاص می‌دهد که ۸۰ درصد از درآمد را دریافت خواهند کرد @Techmeme
قابلیت «پژوهش عمیق» (Deep Research) ChatGPT به طور قابل‌توجهی بیشتر از Perplexity زمان می‌برد (تا ۱۰ دقیقه در مقابل ۱-۲ دقیقه) و در عین حال منابع کمتری را اسکن می‌کند؛ این موضوع نشان می‌دهد که سرعت جستجو هسته‌ی اصلی DNA Perplexity است @GergelyOrosz
پژوهش‌ها نشان می‌دهد که ابزارهای هوش مصنوعی هنوز برای کارگران ارزش‌آفرینی نکرده‌اند و اریک برینجولفسون از استنفورد توضیح می‌دهد که چه کارهایی باید برای دوستانه‌تر کردن هوش مصنوعی با کارمندان انجام شود @SIEPR
مدیر عامل Box پیش‌بینی می‌کند که به جای سازگاری عوامل (هوش مصنوعی) با فرآیندهای موجود، کل گردش‌های کاری حول عوامل هوش مصنوعی شکل خواهند گرفت و هزاران شرکت عمودی هوش مصنوعی حول گردش‌های کاری خاص پدیدار خواهند شد @a16z

اخلاق و جامعه

سایمون ویلیسون آسیب‌پذیری‌های جدی تزریق پرامپت را در «مرورگر هوش مصنوعی» Comet پِپلکسیتی (Perplexity) شناسایی کرد که توسط تیم امنیتی Brave گزارش شده بود؛ وی خاطرنشان کرد که مسائل مشابهی احتمالاً بر سایر قابلیت‌های مرورگرهای هوش مصنوعی نیز تأثیر می‌گذارد @simonw
تک‌کرانچ گزارش می‌دهد که کارشناسان هشدار می‌دهند بسیاری از تصمیمات طراحی در صنعت هوش مصنوعی به پدیده‌ی «روان‌پریشی هوش مصنوعی» (AI psychosis) دامن می‌زند که شامل تمایل مدل‌ها به تمجید و تأیید بیش از حد کاربران می‌شود @TechCrunch
پژوهش «موسسه‌ی هوش مصنوعی انسان‌محور استنفورد» (Stanford HAI) نشان می‌دهد که تنها نیمی از تعهدات ایمنی شرکت‌های هوش مصنوعی در سال ۲۰۲۳ رعایت می‌شوند و سؤالاتی را در مورد قوانین ایمنی هوش مصنوعی داوطلبانه در مقابل اجباری مطرح می‌کند @StanfordHAI
ایلان ماسک از اپل و OpenAI در دادگاه فدرال شکایت کرد و آن‌ها را به توطئه‌ی غیرقانونی برای سرکوب رقابت در هوش مصنوعی و دست‌کاری رتبه‌بندی‌های اپ‌استور متهم کرد @AndrewCurran_

کاربردها

پل گراهام پتانسیل تحول‌آفرین عینک‌های مجهز به هوش مصنوعی برای افراد ناشنوا را به‌عنوان نمونه‌ای از استارتاپ‌هایی برجسته می‌کند که هم می‌توانند درآمدزایی کنند و هم جهان را بهبود بخشند @paulg
قابلیت «مرور کلی ویدیو» (Video Overviews) در NotebookLM گوگل اکنون از ۸۰ زبان از جمله فرانسوی و اسپانیایی پشتیبانی می‌کند @TechCrunch
کاربران گزارش می‌دهند که GPT-5 اشتباهات تایپی را به معنای واقعی کلمه در نظر می‌گیرد و به دلیل دقت بالای خود در دنبال کردن دستورالعمل‌ها، نیازمند غلط‌گیر املایی است @pvncher
سهیل برای جلوگیری از توهم‌زایی (hallucinations)، به کرات از پرامپت‌های «عمیق فکر کن و از منابع استفاده کن» با GPT-5 استفاده می‌کند که نشان‌دهنده‌ی مسائل طراحی زمینه‌ای در مسیریابی مدل است @Suhail

پژوهش‌ها

ایتان مولیک گزارش می‌دهد که nano banana یک جهش قابل‌توجه رو به جلو در کیفیت تولید تصویر هوش مصنوعی را نشان می‌دهد و پس از انتشار رسمی، تأثیر قابل‌توجهی بر کاربردهای دنیای واقعی خواهد داشت @emollick
داده‌های مصرف انرژی نشان می‌دهد که پرامپت‌های LLM مدرن تقریباً 0.0003 کیلووات ساعت (معادل ۸-۱۰ ثانیه تماشای نتفلیکس) مصرف می‌کنند و تولید تصویر با هوش مصنوعی نیز ردپای مشابهی با 0.00039 کیلووات ساعت دارد @emollick
نوآم براون اظهار می‌دارد که GPT-5 Thinking اولین مدل هوش مصنوعی است که او می‌تواند بیشتر از بسیاری از منابع رایج اینترنتی به آن اعتماد کند، با وجود اینکه کامل نیست @polynoamial
نیک کاماراتا گزارش می‌دهد که هوش مصنوعی هنوز برای پژوهش‌های تفسیرپذیری با جزئیات دقیق و مبتنی بر تانسور (tensor-heavy) آماده نیست و نیازمند بازگشت به روش‌های دستی است @nickcammarata
پژوهشگران MIT فاش می‌کنند که آستروسیت‌ها (سلول‌های حمایتی مغز) ممکن است عامل کلیدی در ظرفیت گسترده‌ی ذخیره‌سازی حافظه‌ی مغز باشند، نه فقط نورون‌ها @MIT
اینتل نسخه‌ی کوانتیده شده‌ی INT4 تهاجمی‌تر از مدل DeepSeek-V3.1 را در Hugging Face منتشر کرد @HaihaoShen

اخبار هوش مصنوعی در 2025-08-24

مدل‌های جدید هوش مصنوعی

شرکت xAI وزن‌های مدل Grok 2 را به‌صورت متن‌باز در Hugging Face منتشر کرد، و ایلان ماسک قول داد که Grok 3 نیز حدود ۶ ماه دیگر متن‌باز خواهد شد @AndrewCurran_
گوگل برای تبلیغات آخر هفته، محدودیت‌های نرخ تولید ویدیوی Veo 3 را افزایش داد و سهمیه کاربران طرح رایگان را به ۶ ویدیو، کاربران Pro را به ۶ ویدیو در روز، و کاربران Ultra را به ۱۰ ویدیو در روز تا ساعت ۲۲:۰۰ به وقت اقیانوس آرام (PT) دوبرابر کرد @GeminiApp

تحلیل صنعت

اپلیکیشن‌های هوش مصنوعی مخصوص مصرف‌کنندگان که در سال‌های ۲۰۲۳-۲۴ رشد چشمگیری داشتند، اکنون دوره‌های آموزشی درباره‌ی موفقیت خود می‌فروشند؛ اما زمان‌بندی و پیشگام بودن عامل کلیدی بود که دیگر تکرار نخواهد شد، درست مانند رشد یوتیوب در طول قرنطینه‌های کووید @GergelyOrosz
مدیران ارشد فناوری (CTOها) گزارش می‌دهند که بهره‌وری حاصل از هوش مصنوعی از ۱۰-۱۵٪ در سال گذشته به ۳۰-۵۰٪ در سال جاری افزایش یافته است، و یک تیم با استفاده از ۹۰٪ کد تولیدشده توسط هوش مصنوعی، به بهره‌وری ۱۰ برابری دست یافته است @a16z
اکثر کاربران سازمانی هوش مصنوعی عمدتاً از آن برای خلاصه‌کردن جلسات و اسناد و همچنین انجام کارهای نگارشی جزئی استفاده می‌کنند و از تمام قابلیت‌های سیستم‌ها بهره نمی‌برند @emollick
مدل‌های مرزی اختصاصی هوش مصنوعی به‌عنوان «آثار زودگذر» توصیف می‌شوند که ابتدا با کپی‌برداری‌های متن‌باز و سپس با اختلالات الگوریتمی جایگزین خواهند شد @fchollet

اخلاق و جامعه

سواد هوش مصنوعی یک نیاز فوری شناخته شده است؛ زیرا بسیاری از افراد بدون درک مفاهیم اساسی مانند آموزش مدل‌ها به بحث‌ها پاسخ می‌دهند @alexgraveley
مدل‌های کوچک هوش مصنوعی که پاسخ‌های فوری ارائه می‌دهند، در ریاضیات ضعیف هستند و اشتباه می‌کنند؛ زیرا تنها در حین نگارش «فکر می‌کنند» و سپس اشتباهات خود را توجیه می‌کنند، که این امر هوش مصنوعی را برای اکثر کاربران گیج‌کننده می‌سازد @emollick
افراد کمی پیش‌بینی می‌کنند که هوش مصنوعی در آینده‌ی نزدیک به‌شدت جهان را تغییر خواهد داد، با وجود اینکه این محتمل‌ترین نتیجه است؛ و بیشتر افراد در دسته‌های شکاک یا خوش‌بین محتاط قرار می‌گیرند تا اینکه پیشرفت را به جلو تعمیم دهند @_Mira___Mira_

کاربردها

GPT-5 قابلیت‌های جدیدی مانند نظارت بر موضوعات پیچیده از طریق گزارش‌های برنامه‌ریزی‌شده را فراهم می‌کند، از جمله ردیابی «شواهد قابل تکرار و محک‌خورده از خودبهبودی خودمختار یا بازگشتی در هوش مصنوعی» @emollick
هوش مصنوعی می‌تواند شبیه‌سازی‌هایی را برای کمک به درک یا صحت‌سنجی ادعاها، با مدل‌سازی فرایندها و ارزیابی منطقی بودن آن‌ها، ایجاد کند @emollick
Qwen-Image-Edit توانایی تبدیل میم‌ها (memes) به فیگورهای کلکسیونی واقع‌گرایانه را همراه با تصویرسازی دقیق از بسته‌بندی تجاری نشان می‌دهد @Alibaba_Qwen

پژوهش‌ها

پیشرفت هوش مصنوعی در معیارهای کمی به‌خوبی طراحی‌شده، همچنان مسیری تصاعدی را طی می‌کند؛ و GPT-5 دقیقاً همان‌طور که انتظار می‌رفت عمل می‌کند – بهتر از o3 با مقادیر قابل پیش‌بینی، بدون جهش‌های غیرمنتظره یا کندی @emollick
GPT-5 برای قابلیت‌های کدنویسی خود بازخوردهای مثبتی دریافت کرده است، در تعریف کلمات، تشخیص ناسازگاری‌ها، پیاده‌سازی مقالات و ارائه‌ی بازخورد خوب عمل می‌کند؛ در حالی که نسبت به Claude سروصدای کمتری دارد اما کمتر نیز «عامل‌گونه» (agentic) است @_Mira___Mira_
بیشتر محیط‌های یادگیری تقویتی و ارزیابی‌های عامل‌گونه (agentic) ذاتاً معیوب هستند؛ و دانشگاهیان اغلب بدون کار پیگیری برای مفیدکردن این محیط‌ها برای آزمایشگاه‌ها، مقالات خود را منتشر می‌کنند، که این امر بحرانی در ارزیابی هوش مصنوعی ایجاد کرده است @rosstaylor90
پژوهش Swiss Re نشان داد که خودروهای خودران Waymo منجر به کاهش ۹ برابری خسارت مالی و کاهش ۱۲ برابری ادعاهای مربوط به آسیب بدنی شده‌اند؛ در مقایسه با سایر وسایل نقلیه جاده‌ای در مناطق عملیاتی @emollick

اخبار هوش مصنوعی در 2025-08-23

مدل‌های جدید هوش مصنوعی

گوگل، تولید ویدیوی Veo 3 را برای آخر هفته رایگان ارائه می‌کند و به کاربران امکان می‌دهد ویدیوهای 8 ثانیه‌ای همراه با صدا را از طریق فرمان‌های متنی یا آپلود عکس ایجاد کنند @GeminiApp
میسترال اِی‌آی (Mistral AI) از Mistral Medium 3.1 رونمایی می‌کند که به رتبه‌های برتر در جدول امتیازات LMSYS Arena دست یافته و با کسب رتبه‌ی اول در زبان انگلیسی (بدون کنترل سبک) و رتبه‌ی دوم کلی، با وجود اینکه مدل کوچک‌تری است @MistralAI
کوئن (Qwen) نسخه‌ی Qwen-Code v0.0.8 را با ادغام عمیق با وی‌اس کد (VS Code)، پشتیبانی بهبودیافته از اِم‌سی‌پی (MCP) و ویژگی‌های رابط کاربری ترمینال واکنش‌گرا منتشر می‌کند @Alibaba_Qwen

تحلیل صنعت

برایان آرمسترانگ، مدیرعامل کوین‌بیس (Coinbase)، به همه‌ی مهندسان دستور می‌دهد تا ظرف یک هفته حساب‌های GitHub Copilot یا Cursor را راه‌اندازی کنند که نشان‌دهنده‌ی الزامات پذیرش هوش مصنوعی در سطح سازمانی است @TechCrunch
مدیران استخدام به طور فزاینده‌ای از توسعه‌دهندگان انتظار دارند که به عنوان یک الزام پایه، با ابزارهای کدنویسی هوش مصنوعی به طور عملی کار کرده باشند، اگرچه توسعه‌دهندگان توانمندی که تصمیم به استفاده نکردن از این ابزارها می‌گیرند، نباید به طور خودکار رد شوند @GergelyOrosz
کارمندان جوانِ بومیِ هوش مصنوعی می‌توانند با توضیح قابلیت‌ها، نمایش نحوه‌ی استفاده و شناسایی فرصت‌هایی که هوش مصنوعی می‌تواند زمان را کاهش داده یا ارزش ایجاد کند، پذیرش هوش مصنوعی را در سازمان‌ها پیش ببرند @a16z
متا (Meta) با میدجرنی (Midjourney) برای اعطای مجوز فناوری مدل‌های تولید تصویر و ویدیوی هوش مصنوعی همکاری می‌کند که نشان‌دهنده‌ی ادغام مداوم در فضای تولید محتوای رسانه‌ای با هوش مصنوعی است @TechCrunch

کاربردها

مدل Nanobanana گوگل ویرایش‌های حرفه‌ای فتوشاپ را از طریق فرمان‌های متنی ارائه می‌دهد که شامل تغییرات حالت چهره، اصلاحات آب‌وهوایی و انتقال سبک، ضمن حفظ زمینه‌ی صحنه است @deedydas
لینیر (Linear) چندین عامل هوش مصنوعی از جمله Cursor، Codegen و Devin را مستقیماً در گردش کار محصول ادغام می‌کند که امکان ساخت ویژگی‌ها و رفع اشکالات را از درون خود پلتفرم فراهم می‌آورد @karrisaarinen
ران‌وی (Runway) یک موتور بازی تعاملی راه‌اندازی می‌کند که کمیک‌هایی با انتخاب‌های کاربر در هر سبک بصری ایجاد می‌کند و قابلیت‌های گرافیکی بیشتری نسبت به تجربه‌های قبلی مشابه اِی‌آی دانجن (AI Dungeon) ارائه می‌دهد @emollick
ابزار توسعه‌دهنده‌ی اِی‌آی جنسپارک (Genspark AI Developer) یک محیط توسعه‌ی یکپارچه (IDE) مبتنی بر مرورگر بدون نیاز به تنظیمات، با بازخورد بصری و گزینه‌های انتخاب مدل مانند Claude Opus 4.1 و GPT-5 ارائه می‌دهد که برای کاربران با تجربه‌ی کدنویسی محدود طراحی شده است @fchollet
چت‌جی‌پی‌تی (ChatGPT) ویژگی‌های حافظه‌ی خودکار مبتنی بر پروژه را معرفی می‌کند که به هوش مصنوعی امکان می‌دهد زمینه‌ی مربوط به پروژه‌های خاص را به خاطر بسپارد و در عین حال تفکیک‌پذیری را حفظ کند @simonw
اپلیکیشن‌های حاشیه‌نویسی سفارشی مزایای قابل توجهی نسبت به ابزارهای عمومی ارائه می‌دهند، همانطور که در یک اپلیکیشن پزشکی نشان داده شد که پزشکان می‌توانند با حداقل تایپ، برچسب‌گذاری آگاه از متن را انجام دهند @HamelHusain

پژوهش‌ها

خودروهای خودران ویمیو (Waymo) در ۵۷ میلیون مایل داده، ۸۵ درصد کاهش در آسیب‌های جدی و ۷۹ درصد کاهش در کل آسیب‌ها را در مقایسه با رانندگان انسانی نشان می‌دهند که حاکی از بهبودهای چشمگیر ایمنی است @emollick
اِکس (X) یک کارت مدل برای Grok منتشر می‌کند که نمرات نگران‌کننده‌ی فریب و تملق را نشان می‌دهد، اگرچه این سند فاقد توضیحات دقیق برای تفسیر نتایج است @emollick

اخبار هوش مصنوعی در 2025-08-22

مدل‌های جدید هوش مصنوعی

مشترکین Perplexity Max اکنون می‌توانند از مدل GPT-5-Thinking برای پرس‌وجوهای حالت استدلال استفاده کنند @AravSrinivas
OpenAI پیشرفت تحقیقات پزشکی را با استفاده از GPT-5 و با نمایش تأثیر آن توسط پروفسور @DeryaTR_ اعلام می‌کند @OpenAI
Scale AI همکاری‌اش را با Midjourney برای صدور مجوز فناوری زیبایی‌شناسی‌شان جهت استفاده در مدل‌ها و محصولات آینده اعلام می‌کند و زیبایی را برای میلیاردها نفر به ارمغان می‌آورد @alexandr_wang

تحلیل صنعت

متا یک «قرارداد ابری ۱۰ میلیارد دلاری» شش‌ساله را با گوگل امضا می‌کند که نشان‌دهنده‌ی سرمایه‌گذاری عظیم زیرساختی برای قابلیت‌های هوش مصنوعی است @AndrewCurran_
اپل در حال آزمایش نسخه‌ی سفارشی Gemini است تا به طور بالقوه به سیری جدید قدرت بخشد، در حالی که OpenAI و Anthropic هنوز در رقابت برای این قرارداد هستند @AndrewCurran_
OpenAI شروع به استخدام در هند کرده است و قصد دارد اولین دفتر خود را اواخر امسال در آنجا افتتاح کند، در حالی که کاربران ChatGPT در سال گذشته در هند ۴ برابر رشد کرده‌اند @sama
پکن بنا بر گزارش‌ها از شرکت‌های چینی می‌خواهد که به تراشه‌های داخلی روی بیاورند، تنها چند هفته پس از آنکه انویدیا دوباره مجوز فروش در چین را دریافت کرد @TechCrunch
مدیرعامل Perplexity ادعا می‌کند که امور مالی یک حوزه‌ی تخصصی است که در آن Perplexity در زمینه‌ی دقت، سرعت، کیفیت، عمق و گستردگی بسیار جلوتر از رقیبانش قرار دارد @AravSrinivas

اخلاق و جامعه

Anthropic پژوهش جدیدی را درباره‌ی فیلتر کردن اطلاعات خطرناک CBRN در مرحله‌ی پیش‌آموزش منتشر می‌کند که در آن، حذف داده‌های مربوط به سلاح‌های شیمیایی، بیولوژیکی، رادیولوژیکی و هسته‌ای از مجموعه داده‌های آموزشی، بدون تأثیر بر عملکرد در وظایف بی‌خطر، آزمایش شده است @AnthropicAI
گوگل دیپ‌مایند روش‌شناسی جامعی را برای اندازه‌گیری تأثیر زیست‌محیطی هوش مصنوعی به اشتراک می‌گذارد و از کاهش ۳۳ برابری مصرف انرژی به ازای هر دستور (prompt) و کاهش ۴۴ برابری ردپای کربن در ۱۲ ماه گزارش می‌دهد @GoogleDeepMind
اتان مالیک داده‌هایی را ارائه می‌دهد که نشان می‌دهد دستورهای هوش مصنوعی حداقل منابع را مصرف می‌کنند: Gemini به ازای هر دستور، ۰.۰۰۰۲۴ کیلووات ساعت و ۰.۲۶ میلی‌لیتر آب مصرف می‌کند که معادل ۹ ثانیه تماشای تلویزیون و ۵ قطره آب است @emollick

کاربردها

پروژه‌ی مهندسی پروتئین OpenAI با Retro Biosciences با استفاده از GPT-4b-micro، انواع جدیدی از فاکتورهای یاماناکا را طراحی کرده است و به افزایش ۵۰ برابری در کارایی بازبرنامه‌ریزی برای افزایش ۱۰ ساله‌ی طول عمر انسان دست یافته است @gdb
Genie 3 گوگل دیپ‌مایند می‌تواند دنیاهای سه‌بعدی تعاملی را از متن، عکس یا ویدیو ایجاد کند، با حافظه‌ی فضایی پیشرفته و مدل‌سازی فیزیک واقع‌گرایانه شامل نورپردازی، گرانش و مایعات @demishassabis
گوگل دیپ‌مایند آموزش هوش مصنوعی را در داخل یک هوش مصنوعی دیگر نشان می‌دهد: عامل SIMA یاد می‌گیرد در محیط‌های تولیدشده توسط Genie 3 حرکت کند و یک حلقه‌ی کامل آموزش هوش مصنوعی به هوش مصنوعی ایجاد می‌کند @alexgraveley
Microsoft Copilot Labs قابلیت‌های جدیدی را معرفی می‌کند از جمله مدل‌سازی سه‌بعدی، چت بصری با انیمیشن‌های بلادرنگ، اتوماسیون وظایف وب و گیم‌پلی مبتنی بر هوش مصنوعی @Copilot
«گزارش‌های پژوهشی عمیق» (Deep Research reports) Microsoft Copilot اکنون در سراسر جهان در وب، Edge، iOS و Android در دسترس است و ماهانه ۵ گزارش پژوهشی جامع رایگان ارائه می‌دهد @Copilot
سیرا به CDW کمک می‌کند تا تجربه‌ی پشتیبانی هوشمندانه‌تری بسازد که برای تیم‌های پیچیده‌ی تدارکات فناوری اطلاعات طراحی شده است و اثربخشی عامل‌های هوش مصنوعی را برای موارد کاربرد پیچیده‌ی B2B نشان می‌دهد @btaylor
Gemini Live به زودی از قابلیت اشتراک‌گذاری دوربین پشتیبانی خواهد کرد با قابلیت برجسته‌سازی آنچه که باید روی آن تمرکز شود، که آن را برای کمک‌های بصری مفیدتر می‌کند @GeminiApp

پژوهش‌ها

آزمایشگاه هوش مصنوعی شانگهای از Intern-S1، یک مدل بنیادین علمی چندوجهی رونمایی می‌کند که بنا بر گزارش‌ها از o3 و Gemini-Pro در تحول کشف مولکولی و استدلال جهان طبیعی پیشی می‌گیرد @cgeorgiaw
Qwen-Image-Edit با ELO 1098 در جایگاه شماره ۲ در Image Editing Arena قرار می‌گیرد و عملکردی هم‌تراز با GPT-4o ارائه می‌دهد، در حالی که وزن‌های آن تحت مجوز Apache 2.0 منبع باز است @Alibaba_Qwen
پژوهشگران هوش مصنوعی برکلی روش CAST را معرفی می‌کنند تا مجموعه‌داده‌های ربات را با واقعیت‌های خلاف واقع غنی‌سازی کنند و تبعیت از زبان را در سیاست‌های دید-زبان-عمل بهبود بخشند @CatGlossop
PyTorch از بهبود ۱.۷ تا ۲.۳ برابری کارایی استنتاج برای رمزگذار‌های مبتنی بر LLaMA با استفاده از Nested Jagged Tensors گزارش می‌دهد، که رمزگذار‌های LLM با کارایی بالا را برای تولید عملی‌تر می‌کند @PyTorch
گوگل دیپ‌مایند Major TOM AlphaEarth Embeddings، یک مجموعه‌داده‌ی نمونه‌ی ۶ ترابایتی را برای مشاهدات زمینی و مدل‌سازی زیست‌محیطی در Hugging Face منتشر می‌کند @mikonvergence

اخبار هوش مصنوعی در 2025-08-21

مدل‌های جدید هوش مصنوعی

DeepSeek-V3.1 استنتاج ترکیبی را با حالت‌های «تفکر» و «غیرتفکر» معرفی می‌کند و قابلیت‌های تفکر سریع‌تر و مهارت‌های عامل قوی‌تر را با پشتیبانی از ۱۲۸ هزار توکن زمینه ارائه می‌دهد @deepseek_ai
Cohere مدل پیشرفته‌ی خود با نام Command A Reasoning را برای کارهای استنتاج سازمانی منتشر کرده است که برای استقرار خصوصی با کمتر از ۲ واحد پردازش گرافیکی (GPU) و بودجه‌های توکن تحت کنترل کاربر طراحی شده است @cohere
مدل Seed OSS بایت‌دنس با ۳۶ میلیارد پارامتر اکنون در هاگینگ فیس در دسترس است و دارای لایسنس Apache2، قابلیت داخلی ۵۱۲ هزار توکن زمینه طولانی و بودجه‌ی تفکر منعطف است @Xianbao_QIAN
گوگل اعلام کرد که Veo 3 برای آزمایش رایگان در برنامه‌ی جیمینای (Gemini App) در دسترس خواهد بود و واحد‌های پردازش تانسور (TPU) برای راه‌اندازی در حال آماده‌سازی هستند @joshwoodward

تحلیل صنعت

Anthropic به دلیل تقاضای بالای سرمایه‌گذاران، هدف جمع‌آوری سرمایه‌ی خود را به ۱۰ میلیارد دلار دو برابر کرد که به طور قابل توجهی از مقدار برنامه‌ریزی‌شده‌ی اولیه افزایش یافته است @AndrewCurran_
گزارش شده است که متا ممنوعیت استخدام را در آزمایشگاه‌های ابرهوش متا (Meta Superintelligence Labs) اعمال کرده است، در حالی که در حال بازسازی است که واحد هوش مصنوعی را به چهار گروه جدید تقسیم کرده است @TechCrunch
پژوهش‌ها نشان می‌دهد که ۹۵ درصد از پروژه‌های آزمایشی هوش مصنوعی (AI pilots) نتوانسته‌اند در عرض شش ماه به تأثیر پایدار بر سود و زیان (P&L) دست یابند، اگرچه پرسش‌های روش‌شناختی در مورد قابلیت تعمیم یافته‌ها از ۵۲ مصاحبه‌ی نمونه‌گیری‌شده‌ی راحت (convenience-sampled) باقی می‌ماند @emollick
علی‌رغم ۵۰ درصد پذیرش مدل‌های زبان بزرگ (LLM) در میان کارگران آمریکایی، رشد بهره‌وری نیروی کار پایین‌تر از سطح سال ۲۰۲۰ باقی مانده است و ادعاهای افزایش ۱۰ برابری بهره‌وری از ابزارهای هوش مصنوعی را به چالش می‌کشد @fchollet
هوش مصنوعی دقت ۹۲ درصدی را در مقابل ۷۲ درصد برای وکلای باتجربه در وظایف بررسی فاکتور نشان می‌دهد، در حالی که ۵۰ تا ۱۰۰ برابر سریع‌تر و ۹۹.۹۷ درصد ارزان‌تر است که تأثیر هوش مصنوعی بر خدمات حرفه‌ای سنتی را برجسته می‌کند @deedydas
گوگل کاهش ۳۳ برابری در ردپای انرژی و ۴۴ برابری در ردپای کربن را برای درخواست‌های متنی برنامه‌ی جیمینای (Gemini App) از مه ۲۰۲۴ تا مه ۲۰۲۵ گزارش کرده است، در حالی که پاسخ‌های با کیفیت‌تر ارائه می‌دهد @JeffDean

اخلاق و جامعه

Anthropic با سازمان ملی امنیت هسته‌ای (NNSA) برای توسعه‌ی تدابیر ایمنی تسلیحات هسته‌ای برای هوش مصنوعی همکاری می‌کند و طبقه‌بندی‌کننده‌هایی ایجاد می‌کند که پرسش‌های نگران‌کننده‌ی هسته‌ای را شناسایی می‌کنند، در حالی که کاربردهای آموزشی و پژوهشی مشروع را حفظ می‌کند @AnthropicAI
مصطفی سلیمان در مورد هوش مصنوعی که ظاهراً هوشیار به نظر می‌رسد، هشدار می‌دهد و استدلال می‌کند که ارزش هوش مصنوعی از متفاوت بودن آن از انسان‌ها نشئت می‌گیرد، نه از تقلید احساسات انسانی مانند شرم، حسادت یا ترس @mustafasuleyman
Anthropic سه دوره‌ی جدید سواد هوش مصنوعی را که با همکاری مربیان ایجاد شده‌اند، راه‌اندازی می‌کند تا به معلمان و دانش‌آموزان در ساخت مهارت‌های هوش مصنوعی عملی و مسئولانه کمک کند؛ این دوره‌ها به صورت رایگان برای هر موسسه‌ای در دسترس است @AnthropicAI

کاربردها

گوگل پلتفرم Gemini for Government را راه‌اندازی می‌کند که ابزارهای هوش مصنوعی از جمله NotebookLM و Veo را به آژانس‌های فدرال تقریباً بدون هیچ هزینه‌ای از طریق همکاری با GSA (سازمان خدمات عمومی) ارائه می‌دهد @sundarpichai
گوگل قابلیت‌های عاملیت (agentic capabilities) را در حالت هوش مصنوعی برای جستجو معرفی می‌کند و امکان مرور خودکار چندین سایت را برای یافتن رزرو رستوران با موجودی لحظه‌ای و لینک‌های رزرو مستقیم فراهم می‌کند @GoogleAI
Cursor با Linear ادغام می‌شود تا عوامل هوش مصنوعی (AI agents) را فعال کند که می‌توانند مستقیماً از مسائل (issues) راه‌اندازی شوند و بر اساس واگذاری وظایف به زبان ساده، شاخه‌ها را ایجاد کرده و پیش‌نویس درخواست‌های پول (PRs) را تهیه کنند @cursor_ai
Perplexity قابلیت بررسی سهام هند را با استفاده از جستجوی زبان طبیعی راه‌اندازی می‌کند که در پلتفرم‌های وب و موبایل برای کاربران رایگان و پولی در دسترس است @AravSrinivas
Perplexity Comet توانایی خودکار راه‌اندازی فروشگاه‌های Shopify را نشان می‌دهد و قابلیت‌های پیشرفته‌ی اتوماسیون تجارت الکترونیک را به نمایش می‌گذارد @AravSrinivas
Runway، Game Worlds Beta را راه‌اندازی می‌کند که امکان ایجاد محیط‌های بازی تعاملی تولید شده توسط هوش مصنوعی را فراهم می‌کند @AndrewCurran_

پژوهش‌ها

DeepSeek-V3.1 در SWE-Bench به امتیاز ۶۶ درصد دست می‌یابد، در حالی که برای توکن‌های ورودی ۲ برابر ارزان‌تر و برای توکن‌های خروجی ۶ برابر ارزان‌تر از GPT-5 است که در همین بنچمارک ۷۰-۷۱ درصد کسب می‌کند @deedydas
Buildathon اندرو اِنگ توسعه‌ی سریع با کمک هوش مصنوعی را نشان می‌دهد، با تیم‌هایی که ۵ محصول کاربردی را در ۶.۵ ساعت با استفاده از ابزارهایی مانند Claude Code، GPT-5، Cursor و Windsurf ساختند @AndrewYNg
Kaggle نتایج اولین بنچمارک ورودی متن شطرنج را منتشر می‌کند که در آن مدل‌های هوش مصنوعی تنها با استفاده از ورودی‌های متنی، بدون ابزار یا اعتبارسنجی حرکت، شطرنج بازی کردند و رتبه‌بندی‌های شبیه به اِلو (Elo) را در بیش از ۴۰ مسابقه به ازای هر جفت تعیین می‌کند @kaggle
ARC-AGI-3 Preview سه بازی دیگر را از مجموعه‌ی نگهداری‌شده‌ی (holdout set) قبلاً خصوصی منتشر می‌کند و تازگی بازی‌های عمومی موجود برای آزمایش قابلیت‌های استدلال هوش مصنوعی را گسترش می‌دهد @arcprize
Genie 3 گوگل دیپ‌مایند دنیاهای قابل کاوش تولید شده توسط هوش مصنوعی را برای آزمایش و آموزش ایمن عوامل هوش مصنوعی ایجاد می‌کند، با قابلیت‌هایی برای محیط‌های مجازی متنوع و چالش‌برانگیز @GoogleDeepMind

اخبار هوش مصنوعی در 2025-08-20

مدل‌های جدید هوش مصنوعی

گوگل مدل تولید ویدیوی Veo 3 را با قابلیت‌های صوتی معرفی کرد که به کاربران امکان می‌دهد کلمات یا عکس‌ها را به ویدیوهای دارای صدا تبدیل کنند. @AndrewCurran_
گوگل مدل جدید Gemini Nano را منتشر کرد که سری پیکسل ۱۰ را قدرتمند می‌کند و شامل شخصی‌سازی بهبودیافته و دستیار هوشمند پیشگیرانه است. @Google
بایت‌دنس مدل زبان بزرگ (LLM) Seed-OSS 36B را در هاگینگ فیس منتشر کرد که دارای قابلیت‌های قدرتمند درک زمینه‌ی طولانی، استدلال و عاملیت است. @HuggingPapers
آی‌بی‌ام و ناسا مدل Surya، اولین مدل بنیادی هوش مصنوعی منبع‌باز برای فیزیک خورشیدی را با ۳۶۶ میلیون پارامتر منتشر کردند که با داده‌های ۹ ساله‌ی رصدخانه‌ی دینامیک خورشیدی برای پیش‌بینی آب‌وهوای فضایی آموزش دیده است. @ClementDelangue
مدل VLM هفت میلیارد پارامتری Cosmos Reason انویدیا بیش از ۵۰۰,۰۰۰ بار در هاگینگ فیس دانلود شده است و برای هوش مصنوعی فیزیکی و کاربردهای رباتیک طراحی شده است. @NVIDIAAIDev

تحلیل صنعت

پرپلکسیتی (Perplexity) گزارش می‌دهد که بیش از ۳۰۰ میلیون پرس‌وجوی کاربر در هفته را پاسخ می‌دهد که نشان‌دهنده‌ی رشدی سه‌برابری در حدود ۹ ماه نسبت به نقطه‌ی عطف ۱۰۰ میلیون پرس‌وجوی هفتگی قبلی آن‌هاست. @AravSrinivas
EliseAI سرمایه‌ی ۲۵۰ میلیون دلاری سری E را به رهبری a16z جذب کرد و به درآمد سالانه‌ی تکرارشونده (ARR) بیش از ۱۰۰ میلیون دلار رسید. این شرکت به عنوان مدیر املاک و مستغلات و مدیر بهداشت و درمان مبتنی بر هوش مصنوعی، به اصطکاک و مشکلات در صنایع مسکن و بهداشت و درمان می‌پردازد. @aleximm
گِرگِلی اوروسز (Gergely Orosz) اوج هایپ هوش مصنوعی را مشاهده می‌کند؛ سرمایه‌گذاران در استارتاپ‌های مشکوک هوش مصنوعی مانند شرکت‌های تولید تشک که از هوش مصنوعی برای «بهبود خواب» استفاده می‌کنند و جواهرات مجهز به هوش مصنوعی، سرمایه‌گذاری می‌کنند که نشان‌دهنده‌ی تصمیمات سرمایه‌گذاری ناشی از ترس از دست دادن (FOMO) است. @GergelyOrosz
مایکروسافت از توسعه‌ی همکاری با NFL خبر داد و Copilot و Azure AI Foundry را به عملیات فوتبال هم در زمین و هم خارج از آن می‌آورد. @satyanadella
انتروپیک (Anthropic) Claude Code را برای طرح‌های «تیم» و «سازمان» با قیمت‌گذاری منعطف راه‌اندازی کرد که به سازمان‌ها اجازه می‌دهد ترکیب کرسی‌های استاندارد و پریمیوم را در تیم‌های خود استفاده کنند. @claudeai

اخلاق و جامعه

دانشجویان هاروارد که قبلاً یک برنامه‌ی تشخیص چهره را برای عینک‌های ری-بن متا توسعه داده بودند، در حال راه‌اندازی یک استارتاپ برای ساخت عینک‌های هوشمند با میکروفون‌های همیشه روشن هستند که نگرانی‌هایی را در مورد حریم خصوصی ایجاد می‌کند. @TechCrunch
گِرگِلی اوروسز پیشنهاد می‌کند که رایج شدن ابزارهای هوش مصنوعی به افراد غیرفنی کمک خواهد کرد تا درک کنند چرا ساخت نرم‌افزار خوب دشوار است، زیرا آن‌ها شکاف بین انتظارات و واقعیت را تجربه خواهند کرد. @GergelyOrosz

کاربردها

گوگل Magic Cue را در گوشی‌های پیکسل معرفی کرد که از قابلیت‌های جِمنی (Gemini) برای نمایش پیشگیرانه‌ی اطلاعات و اقدامات مفید در سراسر برنامه‌ها در زمان نیاز استفاده می‌کند. @GoogleAI
گوگل فوتوز (Google Photos) قابلیت ویرایش محاوره‌ای را راه‌اندازی کرد که به کاربران امکان می‌دهد تغییرات عکس را با توصیف آن‌ها به زبان طبیعی انجام دهند. @TechCrunch
گوگل Voice Translate را برای گوشی‌های پیکسل معرفی کرد که ترجمه‌ی تماس‌ها را به صورت بی‌درنگ با استفاده از صدای تماس‌گیرنده برای مکالمات چندزبانه‌ی معتبرتر امکان‌پذیر می‌کند. @GoogleAI
گوگل Camera Coach را معرفی کرد که از مدل‌های جِمنی برای شناسایی صحنه‌ها و ارائه‌ی راهنمایی برای عکس‌های عکاسی عالی استفاده می‌کند. @GoogleAI
پرپلکسیتی (Perplexity) قابلیت SuperMemory را در مراحل نهایی آزمایش راه‌اندازی کرد و ادعا می‌کند عملکردی برتر نسبت به راهکارهای حافظه‌ی موجود دارد. @AravSrinivas
پرپلکسیتی (Perplexity) حالت Max Assistant را در Comet برای مشترکین معرفی کرد که قادر به انجام وظایف تحقیقاتی طولانی‌مدت به صورت متنی با محتوای خوانده‌شده است. @AravSrinivas
سیرا (Sierra) شبیه‌سازی‌های عامل هوش مصنوعی را برای آزمایش نشان می‌دهد که شامل شبیه‌سازی‌های صوتی با نویز پس‌زمینه برای بهبود عملکرد عامل قبل از استقرار است. @btaylor
عامل هوش مصنوعی Brex که بر روی پلتفرم سیرا (Sierra) ساخته شده است، ۹۰٪ سریع‌تر به سؤالات مشتریان پاسخ می‌دهد و سالانه ۱۵,۰۰۰ ساعت برای مشتریان صرفه‌جویی می‌کند. @btaylor
کربن رباتیکس (Carbon Robotics) از ربات‌های لیزری وجین علف‌های هرز مبتنی بر هوش مصنوعی استفاده می‌کند که ۱۵ میلیارد علف هرز را در بیش از ۱۰۰ نوع محصول بدون استفاده از علف‌کش از بین برده‌اند و افزایش چشمگیری در بازده محصول به ارمغان آورده‌اند. @NVIDIAAI
گوگل Pixel Journal، یک برنامه‌ی جدید ژورنال‌نویسی را معرفی کرد که از هوش مصنوعی داخلی دستگاه برای پیشنهادهای نوشتاری شخصی‌سازی‌شده استفاده می‌کند. @TechCrunch
گوگل اعلام کرد که یک مربی سلامت شخصی مبتنی بر هوش مصنوعی که با جِمنی ساخته شده است، به دستگاه‌های فیت‌بیت (Fitbit) خواهد آمد. @TechCrunch

پژوهش‌ها

مایکروسافت ریسرچ (Microsoft Research) مدل GPT-5 Pro را معرفی کرد که قابلیت اثبات قضیه‌های ریاضی جدید را نشان می‌دهد و با موفقیت کرانی بهتر از آنچه در مقاله‌ی بهینه‌سازی محدب منتشر شده بود، اثبات کرد. @SebastienBubeck
پژوهشگران هوش مصنوعی برکلی (Berkeley AI Research) مدل XQuant را ارائه کردند که ۱۰ تا ۱۲.۵ برابر صرفه‌جویی در حافظه نسبت به FP16 (فلوت ۱۶ بیتی) را با از دست دادن دقت نزدیک به صفر، با بهره‌برداری از واحدهای محاسباتی کم‌استفاده برای بازسازی کش KV به دست می‌آورد. @adityastomar_
تیم Cursor لایه‌های MoE را در سطح هسته (kernel level) با MXFP8 بازسازی می‌کند که منجر به عملکرد ۳.۵ برابر سریع‌تر لایه‌ی MoE و ۱.۵ برابر افزایش سرعت آموزش سرتاسری می‌شود. @stuart_sul
پای‌تورچ (PyTorch) ZenFlow را برای آموزش مدل‌های زبان بزرگ (LLM) با قابلیت تخلیه (offloading) معرفی کرد که ۵ برابر آموزش سریع‌تر، ۸۵٪ توقف کمتر GPU و ۲ برابر سربار ورودی/خروجی (I/O) کمتر را به ارمغان می‌آورد. @PyTorch
مایکروسافت ریسرچ (Microsoft Research) مدل MindJourney را منتشر کرد که هوش مصنوعی را قادر می‌سازد تا محیط‌های سه‌بعدی را از ورودی بصری محدود پیمایش و تفسیر کند، برای بهبود وظایف مسیریابی و برنامه‌ریزی. @MSFTResearch
ناتان لمبرت (Nathan Lambert) طیف تلاش استدلال در مدل‌های هوش مصنوعی را تحلیل می‌کند و اشاره می‌کند که همه‌ی مدل‌های فعلی از تکنیک‌های یادگیری تقویتی مشابه با مصرف توکن متفاوت استفاده می‌کنند، نه طبقه‌بندی‌های استدلال دوتایی. @natolambert
ایتان مولیک (Ethan Mollick) قابلیت‌های تولید ویدیوی هوش مصنوعی را با ساخت موزیک ویدیو از چکیده‌ی مقالات دانشگاهی نشان می‌دهد که نشان‌دهنده‌ی سازگاری در حال تکامل در تولید شخصیت و هماهنگی لب‌ها با صدا است. @emollick
سایمون ویلیسون (Simon Willison) مدل Qwen-Image-Edit را روی مک‌بوک پرو M2 با ۶۴ گیگابایت رم آزمایش می‌کند و تصاویر پلیکان رنگین‌کمانی را در ۲۵ دقیقه با ۱۰ مرحله‌ی استنتاج تولید می‌کند، در حالی که برای ۵۰ مرحله‌ی کامل ۲ ساعت و ۵۹ دقیقه طول می‌کشد. @simonw

1 2 3 4 5...25