How do I import the trained model from TLT to Triton?

wilson850920 · May 20, 2021, 5:38am

I had trained a ResNet50 model using my own dataset for image classification via NVIDIA TLT. The output of the toolkit is resnet50.etlt and resnet50.trt. I’m trying to export the model to NVIDIA triton server, however, the server requires a model.plan format file and a config file.
How can I deploy my model to triton server smoothly, it seems that I have to do some kind of work to transfer my resnet50.trt into model.plan for the server.

I’m using
TLT docker image: nvcr.io/nvidia/tlt-streamanalytics:v3.0-dp-py3 (TRT:7.2.1)
Triton docker image: nvcr.io/nvidia/tritonserver:20.12-py3 (TRT:7.2.2)

System:
Ubuntu 16.04
NVIDIA Tesla V100

Morganh · May 20, 2021, 7:10am

A TensorRT model definition is called a Plan . A TensorRT Plan is a single file that by default must be named model.plan.
A simple way is that in the triton server, you can use tlt-converter to generate resnet50.trt engine and rename to model.plan

Please refer to server/model_repository.md at r20.12 · triton-inference-server/server · GitHub
Using TLT models with Triton Inference Server - #6 by Morganh
and
https://developer.nvidia.com/blog/nvidia-serves-deep-learning-inference/

Topic		Replies	Views
How to convert .etlt model to .plan model to use the TAO trained model in triton inference server TAO Toolkit inference-server-triton	3	1298	February 26, 2022
How to deploy the U-net model developed in the TAO toolkit to the Jetson device? TAO Toolkit	2	388	November 17, 2021
Using TensorRT Inference Server with TLT models TAO Toolkit	6	1275	October 12, 2021
Convert .engine extension file to .plan extension TensorRT omniverse_extension	1	1181	November 3, 2021
Convert . etlt to .plan model to deploy to triton server TAO Toolkit	6	1015	March 11, 2022
How to run nvidia pretrained model directly on T4（or similar cards, not edge device）? TAO Toolkit tensorrt , python	3	680	March 10, 2022
Using TLT models with Triton Inference Server TAO Toolkit tensorrt	8	1433	October 12, 2021
Tensorrt engine file generated by TLT is not acceptable to inference server TensorRT	3	624	August 16, 2020
Tlt-convert on jetson nano TAO Toolkit	6	1847	October 12, 2021
Lost accuracy Triton Inference Server - archived	0	428	May 31, 2021

How do I import the trained model from TLT to Triton?

Related topics