Scaling problem using Triton server and RTSP Multi-stream

simon.renuart · April 30, 2024, 12:26am

Using CAPI mode and analysing triton server logs (curl <your_ip>:8002/metrics) :

nv_inference_pending_request_count{model="people_nvidia_detector",version="1"} 0

To sum up, using nveglessink in CAPI mode with several streams, I have latency.
When analysing latency with DeepStream SDK FAQ - #12 by bcao, no significant latency appears. No growing queue at the triton server.

How is it possibly… Can’t find the bottleneck of that latency…

Topic		Replies	Views
Multisession inference, segmentation DeepStream SDK jira	50	1290	July 3, 2024
Facing Glitches RTSP using my deepstream app DeepStream SDK rtsp , jetson-inference , gstreamer , jetson , deepstream	15	57	December 11, 2024
RTSP latency does not work with NVSTREAMMUX DeepStream SDK nvbugs	37	5138	January 23, 2022
Reconnection Issue DeepStream SDK	40	1489	January 25, 2024
Order within triton inference server python backend DeepStream SDK python , inference-server-triton , deepstream	31	1218	May 6, 2024
Some question about Deep stream 5 DeepStream SDK	42	1780	October 12, 2021
TX2 H264 RTSP Stream decoding issues Jetson TX2	27	11553	October 18, 2021
Deepstreamer Pipeline: Optimisation GPU Utilisation DeepStream SDK gstreamer , fps , deepstream	21	48	December 12, 2024
DeepStream 7.1 nvinferserver tensor clone error DeepStream SDK deepstream	12	66	November 29, 2024
Runtime errors from Deepstream 7.1 via GXF on Jetson Xavier NX DeepStream SDK docker , deepstream	28	138	November 21, 2024

Scaling problem using Triton server and RTSP Multi-stream

Related topics