gRPC end point unavailable status on triton inference server

stejama · December 2, 2024, 5:22pm

Description

I am trying to deploy python backend models using triton inference server. Server launches successfully exposing the ports for HTTP, gRPC and Metrics. However, when trying to use the inference, only HTTP endpoint is working.
When trying to get gRPC, it throws status.UNAVAILABLE error.

What i have tried:
checked for http endpoint :

httpclient.InferenceServerClient(url="httpendpoint_address:port").is_server_live()

This returns true.

But when i tried the same using

grpcclient.InferenceServerClient(url="grpcendpoint_address:port").is_server_live()

triton server is running out of a 23.05 ngc image, the model is based on python backend.

Environment

GPU Type: A100
Nvidia Driver Version: 560.35.03
CUDA Version: 12.6
CUDNN Version:
Operating System + Version: ubuntu 22.04
Baremetal or Container (if container which image + tag): dtr.f1.local:5030/nvidia/tritonserver:23.05-py3

Relevant Files

took motivation from : tutorials/HuggingFace at main · triton-inference-server/tutorials

AakankshaS · December 31, 2024, 7:44am

Hi @stejama ,
I would recommend you reaching out to Issues · triton-inference-server/server · GitHub

Topic		Replies	Views
Triton infererence server example 'simple_grpc_infer_client.py' DeepStream SDK	11	5017	March 23, 2022
Triton Inference Server's health status shows 'Connection peer reset' Triton Inference Server - archived inference-server-triton	6	6355	January 18, 2021
Failed to deploy the reference server. Make an inference request to the peoplenet model via http TensorRT cudnn , inference-server-triton , deepstream	1	21	August 29, 2024
Deepstream with triton DeepStream SDK	12	552	October 9, 2023
How to Send FP16 Input Tensors Using gRPC in C# for NVIDIA Triton Inference Server? TensorRT cudnn	1	34	February 28, 2025
DeepStream Triton gRPC example does not run with Deepstream Triton Docker images DeepStream SDK	12	1155	January 17, 2023
Unable to run Triton example TensorRT inference-server-triton	1	886	May 31, 2024
Serving Peoplenet model using Triton gRPC Inference Server and make calls to it from outside the container DeepStream SDK tensorrt , gstreamer , python , inference-server-triton , tao , deepstream	14	1047	February 2, 2023
Morpheus and MRC are quite difficult to get examples running TensorRT	1	487	September 20, 2023
GPU support with Triton iGPU image and Python Backend Jetson Orin Nano python	9	306	October 14, 2024

gRPC end point unavailable status on triton inference server

Description

Environment

Relevant Files

Related topics