A10 GPU using more GPU RAM than T4 GPU for inference using PyTorch TensorRT model

rehan2 · December 2, 2021, 10:03am

Screenshot 2021-12-02 at 3.27.32 PM

A10
Nvidia driver → 470 (A10 requires 470)
Cuda → 11.0
Cudnn → 8.1
TensorRT → 7.2.3.4
Torch → 1.7.1+cu110
TRTorch → 0.2.0
Python → 3.7

T4
Nvidia driver → 450
Cuda → 11.0
Cudnn → 8.1
TensorRT → 7.2.3.4
Torch → 1.7.1+cu110
TRTorch → 0.2.0
Python → 3.7
can you help why GPU RAM usage is higher for A10 than T4 and how we reduce it to run for multiple streams?

Topic		Replies	Views
Python TensorRT version TensorRT tensorrt , cuda , jetson-inference , cudnn	1	1161	January 31, 2024
Increased GPU memory footprint with Ampere architecture TensorRT	1	442	December 20, 2022
Why is cuda10.0 able to work with pytorch1.7? TensorRT cuda , pytorch	2	418	February 2, 2021
Higher Resource Consumption on Ampere architecture vs Turing architecture CUDA Setup and Installation cuda , ubuntu	0	618	February 20, 2022
TensortRT Memory Utilization TensorRT	1	378	August 19, 2020
Tensorrt take much more cpu ram in RTX3070 GPU-Accelerated Libraries cublas	7	1809	October 15, 2021
GPU memory usage issue while using TensorFlow GPU-Accelerated Libraries cuda , tensorflow , ubuntu	0	445	April 20, 2020
TensorRT on Windows 10 with CUDA 11.5 and cuDNN 8.3 TensorRT	1	1574	November 26, 2021
TensorRT inference time issues with different driver version TensorRT	1	386	September 20, 2023
About optimize cuda program and get more throughput on T4 TensorRT	0	290	August 4, 2019

A10 GPU using more GPU RAM than T4 GPU for inference using PyTorch TensorRT model

Related topics