Onnx -> TensorRT. No speed difference between models

frederikschoeller · June 24, 2021, 5:11pm

Description

I have two models of different sizes. One has 35.9m parameters, the other 12.7m.
When I convert the models to TensorRT with trtexec --onnx=model.onnx --batch=5 --fp16 the resulting models have roughly the same inference speed even though the speed should be vastly different.

Environment

TensorRT Version: 7.1.3
GPU Type: Jetson Xavier AGX
CUDA Version: 10.2.89
CUDNN Version: 8.0
Operating System + Version: Jetpack 4.5.1

NVES · June 24, 2021, 5:37pm

Hi,
This looks like a Jetson issue. We recommend you to raise it to the respective platform from the below link

Thanks!

Topic		Replies	Views
Onnx -> TensorRT. No speed difference between models of different sizes Jetson AGX Xavier tensorrt , onnx	6	908	September 19, 2021
Performance DECREASE with tensorRT under onnxruntime Jetson AGX Xavier tensorrt	2	847	March 8, 2022
TRT inference speed on two AGX Xavier TensorRT	1	348	September 12, 2021
Performance DECREASE with tensorRT under onnxruntime, pt2 Jetson AGX Xavier tensorrt	5	3313	May 25, 2022
Error when converting from ONNX model to Tensorrt Jetson AGX Xavier tensorrt , cuda , onnx	3	818	August 29, 2023
TX2 NX ONNX Convert TensorRT Engine Jetson TX2 tensorrt , hw , jetson-inference	2	669	October 18, 2021
TensorRT gives different results on Jetson Orin Jetson AGX Orin tensorrt , nvbugs	6	904	June 5, 2023
The same model produces different results in TensorRT8 and TensorRT7 Jetson Xavier NX tensorrt	6	504	November 22, 2022
Onnx and trt output has a large gap Jetson AGX Xavier tensorrt , onnx	7	178	July 17, 2024
No performance improvement for Tensorflow TensorRT model on converted on Jetsons Xavier NX Jetson Xavier NX tensorrt , tensorflow	2	735	October 18, 2021

Onnx -> TensorRT. No speed difference between models

Description

Environment

Related topics