Failed to deploy citrinet nemo to riva

choiuijin1125 · December 3, 2021, 9:23am

Please provide the following information when requesting support.

Hardware - GPU V100
Operating System
Riva Version 1.7.0 beta

I tried to custom deploy stt_en_citrinet_256.nemo(STT En Citrinet 256 | NVIDIA NGC) model to riva 1.7.0 and got error while I convert to riva-trt-speech_recognition-am-streaming-offline/1/model_graph.onnx to TRT engine.

2021-12-03 08:58:40,061 [INFO] Building TRT engine from ONNX file
[TensorRT] WARNING: onnx2trt_utils.cpp:362: Your ONNX model has been generated with INT64 weights, while TensorRT does not natively support INT64. Attempting to cast down to INT32.
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] WARNING: Output type must be INT32 for shape outputs
[TensorRT] ERROR: 4: [network.cpp::validate::2712] Error Code 4: Internal Error (length: dynamic input is missing dimensions in profile 0.)
2021-12-03 08:58:54,555 [ERROR] Traceback (most recent call last):
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/cli/deploy.py", line 84, in deploy_from_rmir
    generator.serialize_to_disk(
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/triton/triton.py", line 396, in serialize_to_disk
    module.serialize_to_disk(repo_dir, rmir, config_only, verbose, overwrite)
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/triton/triton.py", line 280, in serialize_to_disk
    self.update_binary(version_dir, rmir, verbose)
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/triton/triton.py", line 676, in update_binary
    with self.build_trt_engine_from_onnx(model_weights) as engine, open(
AttributeError: __enter__

How to reproduce the issue ? (This is for errors. Please share the command and the detailed log here)

Download stt_en_citrinet_256.nemo(STT En Citrinet 256 | NVIDIA NGC)
install riva_quickstart_v1.7.0-beta and nemo2riva-1.7.0b0-py3-none-any.whl
run nemo2riva --out stt_en_citrinet_256.riva stt_en_citrinet_256.nemo
run riva servicemaker-dev

docker run --gpus all -it --rm -v /home/ubuntu/riva/riva_quickstart_v1.7.0-beta/riva_model:/servicemaker-dev -v /home/ubuntu/riva/riva_quickstart_v1.7.0-beta/riva_output:/data --entrypoint="/bin/bash" nvcr.io/nvidia/riva/riva-speech:1.7.0-beta-servicemaker

run riva-build

riva-build speech_recognition /servicemaker-dev/stt_en_citrinet_256.rmir /servicemaker-dev/stt_en_citrinet_256.riva --decoder_type greedy --offline

get stt_en_citrinet_256.rmir file
run riva-deploy

riva-deploy /servicemaker-dev/stt_en_citrinet_256.rmir /data/models

while generate riva-deploy file I got above error.

Topic		Replies	Views
Error in riva deployment Riva deployment aborted Riva ubuntu , nemo , riva	3	1173	February 27, 2023
RIVA error, when deploying official Conformer ASR network Riva riva	10	2050	January 27, 2023
Encounter "Unsupported model IR version: 9, max supported IR version: 8" during deploy custom model in riva for TTS Riva onnx , riva	9	3600	January 22, 2024
Speech-to-text-deployment notebook Riva	1	783	December 22, 2021
RIVA v2.15.0 fails to build NeMo model Riva	0	444	March 30, 2024
Riva 1.8.0 deploy pretrained Tacotron2+Waveglow TTS Riva tensorrt , nemo , riva	2	864	February 9, 2022
Failed to convert Nemo model to Riva (nemo2riva) - ASR Riva nemo	4	1284	May 31, 2023
RIVA 2.11.0, nemo:23.03, unable to deploy NMT Riva	2	560	June 10, 2023
Unable to convert any nemo models. PermissionError: Cannot encrypt the artifact without encryption Riva nemo , riva	1	681	March 4, 2024
Riva model deployment issue Riva inception	8	1648	April 4, 2024

Failed to deploy citrinet nemo to riva

Related topics