Triton Server CUDA_ERROR_ILLEGAL_ADDRESS: an illegal memory access was encountered

shubhaamm · June 12, 2020, 8:35am

Triton Inference Server Image: nvcr.io/nvidia/tritonserver:20.03.1-py3
GPU: T4
OS: Ubuntu 18.04
Driver: 440.33.01
CUDA version: 10.1, cudnn 7.6.5
Tensorflow: 2.2

Hi, I am using Triton inference server for doing dynamic batching based inference.
Following is my config.pbtxt file -

name: “effdet”
platform: “tensorflow_savedmodel”
max_batch_size: 64

input {
name: “image_arrays:0”
data_type: TYPE_UINT8
dims: -1
dims: -1
dims: -1
}

output {
name: “detections:0”
data_type: TYPE_FP32
dims: 100
dims: 7
}

instance_group [
{
count: 1
kind: KIND_GPU
}
]

dynamic_batching {
preferred_batch_size: [8, 64]
max_queue_delay_microseconds: 100
}

default_model_filename: “model.savedmodel”

I am successfully able to run the inferrence using a single instance of my effdet model.
However changing number of model instances to anything other than 1, i.e

instance_group [
{
count: 2 #[or 3,4 etc]
kind: KIND_GPU
}
]
leads to an error CUDA_ERROR_ILLEGAL_ADDRESS: an illegal memory access was encountered.

Refering to the screenshot, can someone please assist me with a solution.

Thank you,
Shubham

Topic		Replies	Views
Error when using Triton Server for Inference on deepstream-imagedata-example DeepStream SDK	21	2030	October 12, 2021
Trition exiting after every batch inference on cpu Triton Inference Server (archived) natural-language-processing-nlp	5	3099	September 30, 2021
Model has kind KIND_GPU but no GPUs are available TensorRT cudnn , inference-server-triton	2	225	September 30, 2024
rtExt/cuda/cudaGatherRunner.cpp (111) - Cuda Error in execute: 700 (an illegal memory access was encountered) TensorRT	2	593	November 20, 2020
Cuda Error in executeInternal: 700 (an illegal memory access was encountered) Jetson AGX Xavier tensorrt	10	6348	December 2, 2021
GPU Illegal Memory Access when using pycuda/tensorrt with FP16 input TensorRT	3	1404	December 1, 2022
[executionContext.cpp::executeInternal::652] Error Code 1: Cuda Runtime (an illegal memory access was encountered) \| Cuda failure: 700 TensorRT tensorrt	5	3188	April 11, 2022
Cuda Error depending on batchsize of engine file TensorRT cuda	1	969	March 8, 2023
Unexpected exception an illegal memory access was encountered DeepStream SDK	4	2643	February 1, 2022
CUDA_ERROR_ILLEGAL_ADDRESS: an illegal memory access was encountered General Topics and Other SDKs cuda , tensorflow	0	761	January 11, 2023

Triton Server CUDA_ERROR_ILLEGAL_ADDRESS: an illegal memory access was encountered

Related topics