Мониторинг ввода / вывода памяти GPU

Есть ли способ отслеживать ввод / вывод памяти GPU из оболочки, с графическими картами Nvidia, используемыми с CUDA?

Я использую nvidia-smi чтобы увидеть текущее использование памяти, но я предпочел бы видеть дельта вместо этого (например, 10 МБ / с) и идеально разбитый процессами (как iotop для дискового ввода-вывода).

nvidia-smi :

введите описание изображения здесь

iotop :

введите описание изображения здесь

nvprof может печатать хорошую статистику, если вы поместите соответствующие переключатели. К сожалению, у меня нет выходного примера, но он может быть использован следующим образом:

 nvprof \ --devices 0 \ --metrics l1_cache_global_hit_rate \ --metrics shared_load_transactions \ ./your_app