How to fast build Tensorrt engine for exact version of Triton-inference-server

Chieh · August 28, 2020, 8:12am

Description

Hi everyone,
I have a question about TensorRT (i.e., TRT) engine on Triton-inference-server (i.e., TRTIS).
We all know that we can use docker to deploy the Triton-inference-server very easily that we can deploy our models including TRT, onnx, etc) on local. However, the TRT engine should be generated by the environment as same as Triton-inference-server, so I have to create another container in order to generate a TRT engine for TRTIS.

On NGC tag, we can see that there are two images (One is for server, and the other is for client.). Hence, I checked the client which doesn’t have TRT relevant packages (libraries) so that I cannot build a TensorRT engine directly.

I wonder that is there any faster way to generate the TensorRT engine which can correspond to TRTIS environment.

Thank you so much!!!

Best regards,
Chieh

Chieh · September 4, 2020, 9:27am

Solved.

Solution:
Directly build from tensorrt images of NGC.
BTW You have to use the same version.

Topic		Replies	Views
How to fast build Tensorrt engine for exact version of Triton-inference-server TensorRT	2	394	August 28, 2020
Question regarding Tensorrt engine build vs inference environment (TensorRT version, Platform, etc) TensorRT	4	947	October 21, 2021
How to generate TRT engine from TAO on Triton-Server (TensorRT incompatible) TAO Toolkit	3	1096	July 6, 2023
Inferencing of Inception_v2 on OEM server with V100. TensorRT	0	533	January 13, 2020
TRT engine across different driver version TensorRT	3	1507	December 1, 2020
Tensorrt engine file generated by TLT is not acceptable to inference server TensorRT	3	673	August 16, 2020
Running TensorRT Inference Server without Docker Command TensorRT	1	622	August 5, 2019
TensorRT - Error: could not build engine GPU-Accelerated Libraries	4	3432	November 9, 2017
Error running TensorRT TensorRT	3	1407	October 12, 2021
What docker image should be used for TRITON: tensorrtserver or tritonserver? Triton Inference Server (archived)	0	491	October 9, 2020

How to fast build Tensorrt engine for exact version of Triton-inference-server

Description

Related topics