Loading Optimized saved_model with c++

igal.kroyter · November 24, 2021, 6:12pm

Hi,

so I was able to convert a model with tensorrt adn stored it locally:

converter = trt.TrtGraphConverterV2(input_saved_model_dir=saved_model_compiled, conversion_params=conversion_params)
converter.convert()
converter.build(input_fn=my_input_fn)
converter.save(output_saved_model_dir=output_saved_model_dir)

and I was able to load it back and infer with python. Though I’d like to do the loading and inference with C++. Is there an example on how to implement the following python lines?

saved_model_loaded = tf.saved_model.load(output_saved_model_dir, tags=[tag_constants.SERVING])
graph_func = saved_model_loaded.signatures[signature_constants.DEFAULT_SERVING_SIGNATURE_DEF_KEY]
frozen_func = convert_to_constants.convert_variables_to_constants_v2(graph_func)
x = tf.convert_to_tensor(np.random.normal(size=(infer_size,7,7)).astype(np.float32))
output = frozen_func(x)[0].numpy()

AastaLLL · November 25, 2021, 4:03am

Hi,

This is the TensorFlow sample.
The C++ version is identical to the C++ usage of TensorFlow.

But since you have applied the TensorRT acceleration.
It’s recommended to convert the model into pure TensorRT since it is better optimized for Jetson.

Below is an example for your reference:

Thanks.

igal.kroyter · November 25, 2021, 6:11am

@AastaLLL hi,

So the TrtGraphConverterV2 converts a saved_model format to some ‘optimized’ format that needs to be converted again to UFF format and only then loaded by C++ code?

please refer to Developer Guide :: NVIDIA Deep Learning TensorRT Documentation

Q: When will TensorRT support layer XYZ required by my network in the UFF parser?
A: UFF is deprecated. We recommend users switch their workflows to ONNX. The TensorRT ONNX parser is an open source project.

AastaLLL · December 2, 2021, 7:08am

Hi,

These are two different methods: TF-TRT and pure TensorRT.

In TF-TRF, there is an option to apply the TensorRT optimization.
The C++ and python interfaces should be very similar.

In pure TensorRT, you will need to convert the model into uff (v1.15.x) or ONNX (v2.x).
And then feed it into TensorRT to generate the engine.

Since TensorRT does the optimization based on the hardware information.
The engine (both TF-TRT and pure TensorRT) is strongly hardware-dependent and cannot use cross-platform.

Thanks.

system · December 22, 2021, 5:46am

This topic was automatically closed 14 days after the last reply. New replies are no longer allowed.

Topic		Replies	Views
TensorFlow to C++ Jetson AGX Xavier tensorflow	6	2375	October 18, 2021
tensorflow + tensorRT: ConvertGraphDefToTensorRT usage c++ Jetson AGX Xavier	11	1026	October 18, 2021
Jetson Nano convert tensorflow model to tensorrt Jetson Nano tensorrt , tensorflow	4	1082	February 7, 2023
TensorRT view the layers that are converted TensorRT tensorrt	1	570	June 11, 2021
Getting started witth Tensorflow to TRT conversion Jetson Xavier NX	4	1064	October 18, 2021
How can I optimize Tensorflow models on windows OS? The TF models are saved in the SavedModel format TensorRT	1	312	December 13, 2021
How To Generate A Stand-Alone TensorRT Plan TensorRT tensorrt , tensorflow	2	723	December 8, 2021
Not able to convert saved_model to TensorRT format on AGX Xavier Jetson AGX Xavier tensorrt , tensorflow	8	512	October 18, 2021
HELP running tensorflow2 model Jetson Nano tensorflow	4	837	January 26, 2022
Differences between tensorflow model inference and tensorRT model inference TensorRT tensorrt , tensorflow	6	1760	September 14, 2022

Loading Optimized saved_model with c++

Related topics