How to preprocess images for ActionRecognitionNet_3D_RGB

shihao28 · November 13, 2024, 2:30am

Hi,

I intend to run inference on pretrained ActionRecognitionNet (resnet18_3d_rgb_hmdb5_32.onnx) using onnxruntime but I fail to get the right prediction. It seems like there is something wrong with my preprocessing step. For normalization, i tried both mean=[0.5, 0.5, 0.5] & std=[0.5, 0.5, 0.5] as well as mean=[0.485, 0.456, 0.406] & std=[0.229, 0.224, 0.225] but to to avail.

Below shows the steps taken for preprocessing by referring SpatialDataset class tao_pytorch_backend/nvidia_tao_pytorch/cv/action_recognition/dataloader/ar_dataset.py at main · NVIDIA/tao_pytorch_backend · GitHub:

import numpy as np
import onnxruntime as ort
from PIL import Image
import torchvision.transforms as transforms

# Initialization
im_transforms = transforms.Compose([
       transforms.Resize(int(256)),
       transforms.CenterCrop([224, 224]),
       transforms.ToTensor(),
       transforms.Normalize(
              mean=[0.5, 0.5, 0.5],  # [0.485, 0.456, 0.406],
              std=[0.5, 0.5, 0.5]  # [0.229, 0.224, 0.225]
       )
])

input_layer_name = 'input_rgb'
output_layer_name = ['fc_pred']
model= ort.InferenceSession('resnet18_3d_rgb_hmdb5_32.onnx', providers=['CUDAExecutionProvider', 'CPUExecutionProvider'])

labels = ['walk', 'ride_bike', 'run', 'fall_floor', 'push']

# Preprocess
im_processed = []
for im_ in im:  # im is List[np.ndarray] in BGR format with length of 32
       im_ = im_[..., ::-1]  # Convert to RGB
       im_ = Image.fromarray(im_)
       im_processed_ = self.transforms(im_)
       im_processed.append(im_processed_)
im_processed = torch.stack(im_processed, 1).numpy()[np.newaxis]  # shape (1,3,32,224,224)

# Predict
prediction = model.run(output_layer_name , {input_layer_name : im_processed })[0][0]  # shape (5,)

# Postprocess
decoded_prediction = labels[prediction .argmax()]

Morganh · November 13, 2024, 5:01am

Please try to leverage TensorRT inference sample for TAO ActionRecognitionNet. ActionRecognitionNet - NVIDIA Docs → tao_toolkit_recipes/tao_action_recognition/tensorrt_inference at main · NVIDIA-AI-IOT/tao_toolkit_recipes · GitHub.

Topic		Replies	Views
Preprocessing steps for UNET using TensorRT TAO Toolkit cudnn	3	53	August 5, 2024
Action recognition preprocessing TAO Toolkit	3	91	July 30, 2024
Preprocessing steps for dashcamnet TensorRT	1	460	November 19, 2020
Tao Segformer inference on tensorRT preprocessing and post processing TAO Toolkit	2	289	February 9, 2024
TAO Preprocessing steps for yolo_v4 model and grayscale dataset TensorRT tensorrt , cudnn	2	77	July 11, 2024
How to change the preprocessing of jetson.inference.imagenet Jetson TX2 tensorrt , cuda	4	617	July 13, 2022
TAO classification results problem TAO Toolkit	2	433	April 4, 2023
ActionRecognitionNet deployment error : Failed to parse onnx model (IIfConditionalOutputLayer) TAO Toolkit tensorrt	11	627	September 8, 2023
Bad results, while running inference on the pretrained Image Classification models TAO Toolkit image-processing	5	32	November 15, 2024
NGC Container Networks preprocessing TAO Toolkit	3	850	October 12, 2021

How to preprocess images for ActionRecognitionNet_3D_RGB

Related topics