How to run latest Supported Triton Inference Server 23.07 on docker

kocar19 · October 19, 2024, 9:44pm

Hi, i have jetson xavier agx 16gb. I have flashed my device (JP 5.1.4, latest as of today).

When i looked support matrix(matrix) for xavier agx latest supported Triton version is

Release 2.36.0 corresponding to NGC container 23.07

I have updated my cuda version to latest supported cuda 12.2 successfully.
but when i run docker compose with
image: nvcr.io/nvidia/tritonserver:23.07-py3

i get

Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'csv'
invoking the NVIDIA Container Runtime Hook directly (e.g. specifying the docker --gpus flag) is not supported. Please use the NVIDIA Container Runtime instead.: unknown

AastaLLL · October 21, 2024, 5:46am

Hi,

Please find more info in the comment below:

But please use the default CUDA 11.4 version instead of 12.2.
Thanks.

kocar19 · October 21, 2024, 7:52pm

i was failing all the time using desktop version dockers. I used dusty jetson containers version 35.4.1
now it is working but will upgrading cuda make any benefit to me i was wondering. Also thanks for your reply.

AastaLLL · October 23, 2024, 10:28am

Hi,

For JetPack 5, only CUDA is upgradable and no corresponding cuDNN/TensorRT/PyTorch/TensorFlow packages are available.

Since the Triton server depends on these backends, it’s recommended to stay on the default CUDA 11.

Thanks.

system · November 20, 2024, 3:56am

This topic was automatically closed 14 days after the last reply. New replies are no longer allowed.

Topic		Replies	Views
Latest Supported Triton Inference Server for Jetson Xavier NX (JetPack 5.1.3) DeepStream SDK	6	741	April 22, 2024
Correct way to use triton in jp 5.1.2? Jetson AGX Orin inference-server-triton	2	252	May 24, 2024
Trouble running docker on Xavier Jetson AGX Xavier cuda , docker	4	759	August 23, 2023
Is it possible to run a Triton inference server with DALI backend on AGX Xavier running JP4.6 Jetson AGX Xavier inference-server-triton , jetson	2	791	February 1, 2023
Upgrading nvidia-container-toolkit to 1.16 wants to remove nvidia-jetpack Jetson AGX Xavier containers	6	632	August 31, 2024
Tritonserver:220-03 on jetson nano with jetpack 4.6.2 doesn't find CUDA compatible device Jetson Nano	3	753	August 8, 2022
Getting GPU docker passthrough working Jetson AGX Xavier docker	8	9432	July 12, 2022
Unable to access NVIDIA Driver in latest docker (docker version 23.0.3) Jetson Nano docker , containers	5	2607	April 17, 2023
Use Cuda 12.2 in a container Jetson Orin NX cuda , docker	12	3713	December 6, 2023
Error run docker image nvcr.io/nvidia/l4t-base:r32.6.1 on jetson AGX Jetson AGX Xavier docker , jetson	9	2551	November 10, 2021

How to run latest Supported Triton Inference Server 23.07 on docker

Release 2.36.0 corresponding to NGC container 23.07

Related topics