sample_rate: 8000 repeat: 5 dropout: 0.0 separable: true labels: - ก - ข - ค - ฆ - ง - จ - ฉ - ช - ซ - ฌ - ญ - ฎ - ฏ - ฐ - ฑ - ฒ - ณ - ด - ต - ถ - ท - ธ - น - บ - ป - ผ - ฝ - พ - ฟ - ภ - ม - ย - ร - ฤ - ล - ว - ศ - ษ - ส - ห - ฬ - อ - ฮ - ะ - ั - า - ำ - ิ - ี - ึ - ื - ุ - ู - เ - แ - โ - ใ - ไ - ๅ - ็ - ่ - ้ - ๊ - ๋ - ์ - a - b - c - d - e - f - g - h - i - j - k - l - m - 'n' - o - p - q - r - s - t - u - v - w - x - 'y' - z - '''' - ' ' train_ds: manifest_filepath: data-nemo/train.json sample_rate: 8000 labels: - ก - ข - ค - ฆ - ง - จ - ฉ - ช - ซ - ฌ - ญ - ฎ - ฏ - ฐ - ฑ - ฒ - ณ - ด - ต - ถ - ท - ธ - น - บ - ป - ผ - ฝ - พ - ฟ - ภ - ม - ย - ร - ฤ - ล - ว - ศ - ษ - ส - ห - ฬ - อ - ฮ - ะ - ั - า - ำ - ิ - ี - ึ - ื - ุ - ู - เ - แ - โ - ใ - ไ - ๅ - ็ - ่ - ้ - ๊ - ๋ - ์ - a - b - c - d - e - f - g - h - i - j - k - l - m - 'n' - o - p - q - r - s - t - u - v - w - x - 'y' - z - '''' - ' ' batch_size: 64 trim_silence: true max_duration: 16.7 shuffle: true is_tarred: false tarred_audio_filepaths: null num_workers: 16 validation_ds: manifest_filepath: data-nemo/dev.json sample_rate: 8000 labels: - ก - ข - ค - ฆ - ง - จ - ฉ - ช - ซ - ฌ - ญ - ฎ - ฏ - ฐ - ฑ - ฒ - ณ - ด - ต - ถ - ท - ธ - น - บ - ป - ผ - ฝ - พ - ฟ - ภ - ม - ย - ร - ฤ - ล - ว - ศ - ษ - ส - ห - ฬ - อ - ฮ - ะ - ั - า - ำ - ิ - ี - ึ - ื - ุ - ู - เ - แ - โ - ใ - ไ - ๅ - ็ - ่ - ้ - ๊ - ๋ - ์ - a - b - c - d - e - f - g - h - i - j - k - l - m - 'n' - o - p - q - r - s - t - u - v - w - x - 'y' - z - '''' - ' ' batch_size: 64 shuffle: false num_workers: 16 preprocessor: cls: nemo.collections.asr.modules.AudioToMelSpectrogramPreprocessor params: normalize: per_feature window_size: 0.02 sample_rate: 8000 window_stride: 0.01 window: hann features: 64 n_fft: 512 frame_splicing: 1 dither: 1.0e-05 stft_conv: false spec_augment: cls: nemo.collections.asr.modules.SpectrogramAugmentation params: rect_freq: 50 rect_masks: 5 rect_time: 120 encoder: cls: nemo.collections.asr.modules.ConvASREncoder params: feat_in: 64 activation: relu conv_mask: true jasper: - dilation: - 1 dropout: 0.0 filters: 256 kernel: - 33 repeat: 1 residual: false separable: true stride: - 2 - dilation: - 1 dropout: 0.0 filters: 256 kernel: - 33 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 256 kernel: - 33 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 256 kernel: - 33 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 256 kernel: - 39 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 256 kernel: - 39 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 256 kernel: - 39 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 51 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 51 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 51 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 63 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 63 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 63 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 75 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 75 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 512 kernel: - 75 repeat: 5 residual: true separable: true stride: - 1 - dilation: - 2 dropout: 0.0 filters: 512 kernel: - 87 repeat: 1 residual: false separable: true stride: - 1 - dilation: - 1 dropout: 0.0 filters: 1024 kernel: - 1 repeat: 1 residual: false stride: - 1 decoder: cls: nemo.collections.asr.modules.ConvASRDecoder params: feat_in: 1024 num_classes: 93 vocabulary: - ก - ข - ค - ฆ - ง - จ - ฉ - ช - ซ - ฌ - ญ - ฎ - ฏ - ฐ - ฑ - ฒ - ณ - ด - ต - ถ - ท - ธ - น - บ - ป - ผ - ฝ - พ - ฟ - ภ - ม - ย - ร - ฤ - ล - ว - ศ - ษ - ส - ห - ฬ - อ - ฮ - ะ - ั - า - ำ - ิ - ี - ึ - ื - ุ - ู - เ - แ - โ - ใ - ไ - ๅ - ็ - ่ - ้ - ๊ - ๋ - ์ - a - b - c - d - e - f - g - h - i - j - k - l - m - 'n' - o - p - q - r - s - t - u - v - w - x - 'y' - z - '''' - ' ' optim: name: novograd lr: 0.005 betas: - 0.8 - 0.5 weight_decay: 0.0005 sched: name: CosineAnnealing warmup_steps: null warmup_ratio: null min_lr: 0.0 last_epoch: -1 target: nemo.collections.asr.models.ctc_models.EncDecCTCModel