Inference using FP16 and FP32 precision giving no performance gain on Jetson Nano

aniket.patil · January 28, 2020, 1:50pm

I am able to run deeplabv3+ model on jetson nano. My model is trained on tensorflow and exported into tensorflow frozen graph. Later on I convert TensorRT optimized graph with precision FP16 as shown below:

trt_graph_def = trt.create_inference_graph(
        input_graph_def=frozen_graph_def,
        outputs=['SemanticPredictions'],
        max_batch_size=1,
        max_workspace_size_bytes=1 << 26,
        precision_mode='FP16',
        is_dynamic_op =True,
        maximum_cached_engines=1,
        minimum_segment_size=10
    )

I get around 6 FPS for an image size of 320x240x3.
The same procedure is applied for creating a TensorRT optimized graph with precision mode FP32.
However I do not see any performance difference. In case of FP32 also I get 6 FPS.
What might be the reason behind this behaviour?

References:
If I see the benchmarks for precision modes then, I see only Turing and Volta architectures being mentioned in https://docs.nvidia.com/deeplearning/frameworks/tf-trt-user-guide/index.html#performance
If I see benchmark for Jetson Nano then I can see only FP16 results for different models but not the comparison between FP32 and FP16. https://developer.nvidia.com/embedded/jetson-nano-dl-inference-benchmarks

AastaLLL · February 4, 2020, 8:37am

Hi,

It’s recommended to check how much layers inside your model inference with TensorRT.

In TF-TRT, it will automatically fallback the TRT non-supported layer back to TensorFlow.
For those layers inference with TensorFlow implementation, low-precision benefit is quite limited.

In general, if you model is fully supported by our TensorRT library.
It’s recommended to use pure TensorRT directly for a better performance.

Thanks.

Topic		Replies	Views
No performance improvement for Tensorflow TensorRT model on converted on Jetsons Xavier NX Jetson Xavier NX tensorrt , tensorflow	2	677	October 18, 2021
inference speed not improve between FP32 vs FP16 when using tensorflow.contrib.tensorrt Jetson AGX Xavier	4	723	October 18, 2021
TensorRT Inferencing using TF-TRT framework FP32 vs FP16 Jetson AGX Orin tensorrt	6	293	June 3, 2024
Low FPS on Jetson Nano using TensorRT Jetson Nano tensorrt , tensorflow	7	1208	August 27, 2020
No speed up tensorrt model in inference (xavier) Jetson AGX Xavier tensorrt	4	624	October 18, 2021
converting a frozen graph to tensorRT Jetson Nano	5	1788	October 14, 2021
TensorFlow-TensorRT inference time and memory consumption on Nano Jetson Nano	2	979	October 18, 2021
Failed to use INT8 precision mode when using tf-trt on Xavier Jetson AGX Xavier	4	968	October 18, 2021
TensorRT INT8 conversion lack of performance increase. Jetson Nano	2	738	October 15, 2021
Optimize Tensorflow with Tensor RT to improve inference timing Jetson Nano	2	637	October 18, 2021

Inference using FP16 and FP32 precision giving no performance gain on Jetson Nano

Related topics