[BUG] Riva deploy model with non-unigram BPE tokenizer

ilb · January 14, 2022, 10:29am

Please provide the following information when requesting support.

Hardware - GPU (A100/A30/T4/V100)
Hardware - CPU
Operating System ubuntu 18.04
Riva Version 1.8.0b0, NeMo 1.6.0r0
TLT Version (if relevant)

call nemo2riva for model build with non-unigram BPE tokenizer, follow by riva2rmir. Both succeed, deploy_all_models will however fail with the following error:

2022-01-13 21:39:18,634 [ERROR] Traceback (most recent call last):                                                                                                                                                                             
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/cli/deploy.py", line 100, in deploy_from_rmir                                                                                                                                      
    generator.serialize_to_disk(                                                                                                                                                                                                               
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/triton/triton.py", line 397, in serialize_to_disk                                                                                                                                  
    module.serialize_to_disk(repo_dir, rmir, config_only, verbose, overwrite)                                                                                                                                                                  
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/triton/triton.py", line 281, in serialize_to_disk                                                                                                                                  
    self.update_binary(version_dir, rmir, verbose)                                                                                                                                                                                             
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/triton/asr.py", line 505, in update_binary                                                                                                                                         
    RivaSpeechCTCFlashlightDecoder.vocab_to_lexicon(tokenizer, vocab_file, self.config.lexicon_file)                                                                                                                                           
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/triton/asr.py", line 568, in vocab_to_lexicon                                                                                                                                      
    enc_lines = list(map(encode_line, lines))                                                                                                                                                                                                  
  File "/opt/conda/lib/python3.8/site-packages/servicemaker/triton/asr.py", line 558, in encode_line                                                                                                                                           
    encoded_line = encode(line)[0]                                                                                                                                                                                                             
IndexError: list index out of range

The culprit is line 531 in /opt/conda/lib/python3.8/site-packages/servicemaker/triton/asr.py, which calls return sp.NBestEncodeAsPieces(l, nbest_size). This call will return an empty list in case of a non-unigram tokenizer (see Google Colab). Since nbest_size is set to 1 (line 524), consider changing the line to return [sp.encode_as_pieces(l)] to support also non-unigram tokenizers.

NVES_R · January 14, 2022, 9:30pm

Hi @ilb , thanks for reporting this issue. I’ll reach out to the team about this. Please stay tuned.

Topic		Replies	Views
Bugreport: Riva ASR Citrinet with WPE tokenizer Riva	3	743	December 22, 2021
Riva model deployment issue Riva inception	8	1535	April 4, 2024
Riva-build does not work Riva	2	241	March 26, 2024
Riva Build fails for finetuned conformer NeMo models with batch size 1 Riva	2	733	November 1, 2022
Unable to deploy riva model trained in with tao 4.0.0 Riva tensorrt , riva , tao	1	533	February 2, 2023
Riva ASR Citrinet with WPE tokenizer Riva	3	412	August 30, 2022
[BUG] Riva deploy NeMo trained Punctuation_and_Capitalisation Riva	0	487	January 20, 2022
RIVA error, when deploying official Conformer ASR network Riva riva	10	1909	January 27, 2023
Error using riva build (KeyError: 'g2p') Riva	3	484	January 20, 2023
Problems when running ./riva_init.sh with custom Quartznet Model Riva	1	748	September 7, 2021

[BUG] Riva deploy model with non-unigram BPE tokenizer

Related Topics