In [1]:
import pytorch_lightning as pl
from omegaconf import OmegaConf, DictConfig
import nemo.collections.asr as nemo_asr
from nemo.core.config import hydra_runner
from nemo.utils import logging
from nemo.utils.exp_manager import exp_manager
import datetime
from pathlib import Path
import torch
from sbb_project import consts
import copy
from pytorch_lightning.loggers import WandbLogger  
import wandb
from ruamel.yaml import YAML
import functools
import copy

[NeMo W 2023-01-02 16:53:56 optimizers:77] Could not import distributed_fused_adam optimizer from Apex


In [2]:
sweep_config = {
  "method": "random",   # Random search
  "metric": {           # We want to minimize `val_loss`
      "name": "val_wer",
      "goal": "minimize"
  },
  "parameters": {
        "lr": {
            # log uniform distribution between exp(min) and exp(max)
            "distribution": "log_uniform",
            "min": -9.21,   # exp(-9.21) = 1e-4
            "max": -4.61    # exp(-4.61) = 1e-2
        },
        "epoch": {
            "distribution": "int_uniform",
            "min": 3,
            "max": 10
        },
        "freq_width": {
            "distribution": "uniform",
            "min": 25,  
            "max": 29     
        }
      
    }
}

In [3]:
train_manifest = [
        str(consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("train", "none"))),
        str(consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("train", "neg10"))),
        str(consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("train", "0"))),
        str(consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("train", "10"))),
        str(consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("train", "20"))),
        str(consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("train", "30"))),
        str(consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("train", "40"))),
    ]
val_manifest = consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("val", "random"))
test_manifest = consts.MANIFEST_DIR.joinpath(consts.MANIFEST_FILE.format("test", "random"))

In [4]:
def sweep_iteration():
    
    # set up W&B logger
    wandb.init()    # required to have access to `wandb.config`
    wandb_logger = WandbLogger(log_model='all')  # log final model
        
    trainer = pl.Trainer(gpus=1, max_epochs=wandb.config.epoch, logger=wandb_logger)
    
    # setup model - note how we refer to sweep parameters with wandb.config
    model = nemo_asr.models.ASRModel.from_pretrained(model_name='stt_de_citrinet_1024')
    
    model.set_trainer(trainer)
    
    model.cfg.train_ds.is_tarred = False
    
    model.cfg.train_ds.manifest_filepath = ','.join(train_manifest)
    model.cfg.validation_ds.manifest_filepath = str(val_manifest)
    model.cfg.test_ds.manifest_filepath = str(test_manifest)
    
    model.cfg.train_ds.batch_size = 8
    model.cfg.validation_ds.batch_size = 8
    model.cfg.test_ds.batch_size = 8
    
    model.cfg.optim.lr = wandb.config.lr
    model.cfg.spec_augment.freq_width = wandb.config.freq_width

    model.setup_training_data(model.cfg.train_ds)
    model.setup_validation_data(model.cfg.validation_ds)
    model.setup_test_data(model.cfg.test_ds)
    model.setup_optimization(model.cfg.optim)

    # train
    trainer.fit(model)


In [None]:
sweep_id = wandb.sweep(sweep_config, project="ASR")
wandb.agent(sweep_id, function=sweep_iteration)

Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


Create sweep with ID: v7qi12lc
Sweep URL: https://wandb.ai/unisg-ds-nlp/ASR/sweeps/v7qi12lc


[34m[1mwandb[0m: Agent Starting Run: m9lgm488 with config:
[34m[1mwandb[0m: 	epoch: 10
[34m[1mwandb[0m: 	freq_width: 28.36039261652943
[34m[1mwandb[0m: 	lr: 0.00017064384838052422
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.
[34m[1mwandb[0m: Currently logged in as: [33mmarccgrau[0m ([33munisg-ds-nlp[0m). Use [1m`wandb login --relogin`[0m to force relogin


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 16:54:09 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 16:54:09 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 16:54:09 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 16:54:14 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 16:54:14 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 16:54:14 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 16:54:14 features:225] PADDING: 16
[NeMo I 2023-01-02 16:54:21 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 16:54:21 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 16:54:21 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 16:54:21 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 16:54:21 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 16:54:21 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 16:54:21 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 16:54:21 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 16:54:21 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.00017064384838052422
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 16:54:21 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f83876ac9d0>" 
    will be used during training (effective maximum steps = 2370) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 2370
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 16:54:24 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:54:24 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 16:54:24 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 16:54:25 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:54:25 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 16:54:25 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 16:54:53 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:54:53 wer_bpe:188] reference:umstellmanöver vom gleis india eins vier ins sierra acht fünf via gleis bravo zwei eins antworten
[NeMo I 2023-01-02 16:54:53 wer_bpe:189] predicted:vomten
[NeMo I 2023-01-02 16:55:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:55:20 wer_bpe:188] reference:umstellmanöver von neun vier nach gleis bravo sieben via echo acht drei antworten
[NeMo I 2023-01-02 16:55:20 wer_bpe:189] predicted:man neu nachbra wieo drei an
[NeMo I 2023-01-02 16:55:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:55:46 wer_bpe:188] reference:rangierfahrt von yankee neun eins ins vier acht antworten
[NeMo I 2023-01-02 16:55:46 wer_bpe:189] predicted:vonk aacht
[NeMo I 2023-01-02 16:56:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:56:13 wer_bpe:188] reference:rangierfahrt von zwei neun nach gleis papa null fünf antworten
[NeMo I 2023-01-02 16:56:13 wer_bpe:189] predicted:


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 16:56:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:56:34 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 16:56:34 wer_bpe:189] predicted:ierfahrlei zwei drei drei drei
[NeMo I 2023-01-02 16:56:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:56:34 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 16:56:34 wer_bpe:189] predicted:sprach eingab
[NeMo I 2023-01-02 16:56:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:56:34 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 16:56:34 wer_bpe:189] predicted:umstell manöver vom drei sechs nachleisy sieben wie nur viel an
[NeMo I 2023-01-02 16:56:35 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:56:35 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 16:56:35 wer_bpe:189] predicted:rangchierfahrt vonlei sechs neu insleidel sieben an
[NeMo I 2023-01-02

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 16:58:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:58:51 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 16:58:51 wer_bpe:189] predicted:frierfahrt von gleis ma zwei drei in drei drei als
[NeMo I 2023-01-02 16:58:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:58:51 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 16:58:51 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 16:58:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:58:51 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 16:58:51 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null viel antworten
[NeMo I 2023-01-02 16:58:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 16:58:51 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 16:58:51 wer_bpe:189] predicted:rangierfahrt von gleis sechs n

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:01:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:01:09 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:01:09 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 17:01:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:01:09 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:01:09 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:01:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:01:09 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:01:09 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null v antworten
[NeMo I 2023-01-02 17:01:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:01:09 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:01:09 wer_bpe:189] predicted:rangierfahrt von gleis se

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:03:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:03:26 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:03:26 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:03:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:03:26 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:03:26 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:03:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:03:26 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:03:26 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:03:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:03:26 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:03:26 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:05:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:05:44 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:05:44 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:05:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:05:44 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:05:44 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:05:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:05:44 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:05:44 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:05:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:05:44 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:05:44 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:08:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:08:02 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:08:02 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:08:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:08:02 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:08:02 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:08:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:08:02 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:08:02 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:08:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:08:02 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:08:02 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:10:19 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:10:19 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:10:19 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:10:19 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:10:19 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:10:19 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:10:19 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:10:19 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:10:19 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:10:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:10:20 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:10:20 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:12:37 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:12:37 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:12:37 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:12:37 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:12:37 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:12:37 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:12:38 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:12:38 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:12:38 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:12:38 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:12:38 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:12:38 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:14:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:14:55 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:14:55 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:14:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:14:56 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:14:56 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:14:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:14:56 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:14:56 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:14:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:14:56 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:14:56 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:17:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:17:13 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:17:13 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:17:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:17:13 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:17:13 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:17:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:17:14 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:17:14 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:17:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:17:14 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:17:14 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=10` reached.


0,1
epoch,▁▁▁▁▂▂▂▂▃▃▃▃▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▆▆▆▆▆▇▇▇▇████
global_step,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███
learning_rate,▁▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇███
train_loss,███▇▆▇▆▇▅▄▄▄▄▃▄▃▅▃▃▆▃▃▃▃▃▂▃▂▁▁▂▅▂▂▂▁▁▁▂▁
trainer/global_step,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███
training_batch_wer,███▇▇▅▆▆▅▄▄▄▄▄▃▃▃▂▃▃▄▂▃▂▃▂▃▂▁▃▄▂▃▂▁▂▂▂
val_loss,█▄▂▂▁▁▁▁▁▁
val_wer,█▄▂▂▁▁▁▁▁▁

0,1
epoch,9.0
global_step,2370.0
learning_rate,4e-05
train_loss,16.65577
trainer/global_step,2369.0
training_batch_wer,0.24444
val_loss,2.19811
val_wer,0.02611


[34m[1mwandb[0m: Sweep Agent: Waiting for job.
[34m[1mwandb[0m: Job received.
[34m[1mwandb[0m: Agent Starting Run: 406x50tt with config:
[34m[1mwandb[0m: 	epoch: 7
[34m[1mwandb[0m: 	freq_width: 26.12758172796314
[34m[1mwandb[0m: 	lr: 0.00506738073216013
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 17:18:10 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 17:18:10 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 17:18:10 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 17:18:14 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 17:18:15 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 17:18:15 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 17:18:15 features:225] PADDING: 16
[NeMo I 2023-01-02 17:18:20 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 17:18:20 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 17:18:20 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 17:18:20 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 17:18:20 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 17:18:20 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 17:18:20 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 17:18:20 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 17:18:20 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.00506738073216013
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 17:18:20 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f842c9c0b50>" 
    will be used during training (effective maximum steps = 1659) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1659
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:18:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:18:22 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:18:22 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:18:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:18:22 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:18:22 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:18:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:18:51 wer_bpe:188] reference:umstellmanöver vom hotel acht zwei nach zwei sieben via golf sechs acht antworten
[NeMo I 2023-01-02 17:18:51 wer_bpe:189] predicted:umlö für auch zwei zwei sieben wie ses
[NeMo I 2023-01-02 17:19:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:19:18 wer_bpe:188] reference:umstellmanöver von whisky fünf fünf ins gleis sierra null sechs via gleis oscar fünf neun antworten
[NeMo I 2023-01-02 17:19:18 wer_bpe:189] predicted:umstände von whisk fünf fünf ins gleis sierra null sechs gleis oskel s fünf neun ein
[NeMo I 2023-01-02 17:19:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:19:44 wer_bpe:188] reference:rangierfahrt von hotel eins drei ins gleis papa fünf vier antworten
[NeMo I 2023-01-02 17:19:44 wer_bpe:189] predicted:rangierfahrt von hotel eins insspa fünf antworten
[NeMo I 2023-01-02 17:20:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:20:10 wer_bpe:188] reference:umstellmanöver vom sechs drei n

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:20:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:20:31 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:20:31 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:20:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:20:32 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:20:32 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:20:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:20:32 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:20:32 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:20:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:20:32 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:20:32 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:22:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:22:49 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:22:49 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:22:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:22:50 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:22:50 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:22:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:22:50 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:22:50 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:22:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:22:50 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:22:50 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:25:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:25:09 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:25:09 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:25:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:25:09 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:25:09 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:25:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:25:09 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:25:09 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:25:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:25:09 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:25:09 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:27:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:27:27 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:27:27 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:27:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:27:27 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:27:27 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:27:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:27:27 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:27:27 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:27:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:27:27 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:27:27 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:29:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:29:45 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:29:45 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:29:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:29:46 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:29:46 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:29:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:29:46 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:29:46 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:29:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:29:46 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:29:46 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:32:03 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:32:03 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:32:03 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:32:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:32:04 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:32:04 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:32:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:32:04 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:32:04 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:32:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:32:04 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:32:04 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:34:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:34:22 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:34:22 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:34:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:34:22 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:34:22 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:34:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:34:22 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:34:22 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:34:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:34:22 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:34:22 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=7` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇▇██████
global_step,▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇████
learning_rate,▁▁▁▂▂▂▂▃▃▃▃▃▄▄▄▄▅▅▅▅▅▆▆▆▆▆▇▇▇▇███
train_loss,█▄▆▄▃▄▂▂▂▂▂▂▁▁▂▂▁▂▁▂▂▁▁▁▂▄▂▁▁▂▂▂▂
trainer/global_step,▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇████
training_batch_wer,█▅▆▆▃▃▃▃▄▄▂▂▃▂▂▂▁▂▃▃▂▃▂▁▂▁▁
val_loss,█▄▂▂▁▂▂
val_wer,█▂▂▂▁▂▁

0,1
epoch,6.0
global_step,1659.0
learning_rate,0.00084
train_loss,12.90124
trainer/global_step,1658.0
training_batch_wer,0.04706
val_loss,1.38932
val_wer,0.01305


[34m[1mwandb[0m: Agent Starting Run: 6vxzf6r4 with config:
[34m[1mwandb[0m: 	epoch: 9
[34m[1mwandb[0m: 	freq_width: 26.209630088021832
[34m[1mwandb[0m: 	lr: 0.0008043429678150011
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 17:35:08 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 17:35:08 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 17:35:08 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 17:35:13 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 17:35:13 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 17:35:13 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 17:35:13 features:225] PADDING: 16
[NeMo I 2023-01-02 17:35:18 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 17:35:18 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 17:35:18 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 17:35:18 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 17:35:18 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 17:35:19 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 17:35:19 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 17:35:19 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 17:35:19 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0008043429678150011
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 17:35:19 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f842c69eac0>" 
    will be used during training (effective maximum steps = 2133) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 2133
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:35:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:35:21 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:35:21 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:35:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:35:21 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:35:21 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:35:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:35:50 wer_bpe:188] reference:umstellmanöver vom acht acht via zwei null ins alpha fünf vier antworten
[NeMo I 2023-01-02 17:35:50 wer_bpe:189] predicted:um vom denn
[NeMo I 2023-01-02 17:36:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:36:16 wer_bpe:188] reference:umstellmanöver von vier fünf via gleis lima eins vier nach acht neun antworten
[NeMo I 2023-01-02 17:36:16 wer_bpe:189] predicted:umsch man ihm noch neu
[NeMo I 2023-01-02 17:36:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:36:43 wer_bpe:188] reference:rangierfahrt vom gleis null null nach eins eins antworten
[NeMo I 2023-01-02 17:36:43 wer_bpe:189] predicted:
[NeMo I 2023-01-02 17:37:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:37:10 wer_bpe:188] reference:umstellmanöver von gleis quebec null sechs via gleis xray sechs drei ins gleis drei zwei antworten
[NeMo I 2023-01-02 17:37:10 wer_bpe:189] predicted:umstellman von las cabe nun sieia gleis hew drei gleis drei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:37:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:37:31 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:37:31 wer_bpe:189] predicted:roierfahrt vom gleis ma zwei drei ins drei drei al
[NeMo I 2023-01-02 17:37:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:37:31 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:37:31 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:37:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:37:31 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:37:31 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null v antworten
[NeMo I 2023-01-02 17:37:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:37:32 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:37:32 wer_bpe:189] predicted:rangierfahrt von gleis sechs neun

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:39:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:39:50 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:39:50 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:39:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:39:50 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:39:50 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:39:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:39:51 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:39:51 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:39:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:39:51 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:39:51 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:42:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:42:42 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:42:42 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:42:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:42:42 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:42:42 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 17:42:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:42:43 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:42:43 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:42:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:42:43 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:42:43 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:47:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:47:00 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:47:00 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:47:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:47:00 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:47:00 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:47:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:47:00 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:47:00 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:47:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:47:00 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:47:00 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:51:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:51:33 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:51:33 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:51:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:51:33 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:51:33 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:51:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:51:34 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:51:34 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:51:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:51:34 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:51:34 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:53:54 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:53:54 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:53:54 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:53:54 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:53:54 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:53:54 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:53:54 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:53:54 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:53:54 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:53:54 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:53:54 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:53:54 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:56:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:56:34 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:56:34 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:56:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:56:34 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:56:34 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:56:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:56:34 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:56:34 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:56:35 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:56:35 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:56:35 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 17:59:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:59:50 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:59:50 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 17:59:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:59:50 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 17:59:50 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 17:59:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:59:50 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:59:50 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 17:59:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 17:59:50 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 17:59:50 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:02:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:02:33 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:02:33 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:02:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:02:33 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:02:33 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:02:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:02:33 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:02:33 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:02:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:02:33 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:02:33 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=9` reached.


0,1
epoch,▁▁▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▅▅▅▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇████
global_step,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇▇██
train_loss,█▆▇▆▅▅▄▄▂▃▄▃▃▃▃▂▄▄▂▂▂▂▂▃▃▃▃▁▂▂▂▃▂▁▁▁▁▂▁▁
trainer/global_step,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,█▇▇▆▅▃▅▄▅▃▃▄▂▃▃▄▃▃▂▂▂▂▂▂▁▂▃▂▄▂▂▂▂▁
val_loss,█▃▂▁▁▁▁▁▁
val_wer,█▃▂▁▁▁▁▁▁

0,1
epoch,8.0
global_step,2133.0
learning_rate,0.00017
train_loss,2.89411
trainer/global_step,2132.0
training_batch_wer,0.02667
val_loss,1.71852
val_wer,0.02089


[34m[1mwandb[0m: Agent Starting Run: yo3onjfu with config:
[34m[1mwandb[0m: 	epoch: 6
[34m[1mwandb[0m: 	freq_width: 28.83777522133322
[34m[1mwandb[0m: 	lr: 0.0002701039617679204
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 18:03:21 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 18:03:21 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 18:03:21 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 18:03:26 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 18:03:27 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 18:03:27 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 18:03:27 features:225] PADDING: 16
[NeMo I 2023-01-02 18:03:32 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 18:03:32 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 18:03:32 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:03:32 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 18:03:32 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:03:32 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 18:03:32 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:03:32 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 18:03:32 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0002701039617679204
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 18:03:32 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f835edc95e0>" 
    will be used during training (effective maximum steps = 1422) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1422
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:03:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:03:34 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:03:34 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:03:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:03:34 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:03:34 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:04:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:04:04 wer_bpe:188] reference:umstellmanöver vom gleis xray eins null ins sechs acht via gleis sieben null antworten
[NeMo I 2023-01-02 18:04:04 wer_bpe:189] predicted:um ihn wie gleich sieben
[NeMo I 2023-01-02 18:04:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:04:30 wer_bpe:188] reference:rangierfahrt vom gleis null antworten
[NeMo I 2023-01-02 18:04:30 wer_bpe:189] predicted:
[NeMo I 2023-01-02 18:04:57 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:04:57 wer_bpe:188] reference:rangierfahrt von gleis sechs sieben ins gleis vier neun antworten
[NeMo I 2023-01-02 18:04:57 wer_bpe:189] predicted:aber man nach gleichs sie mich sie die aber
[NeMo I 2023-01-02 18:05:24 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:05:24 wer_bpe:188] reference:rangierfahrt von uniform neun nach sechs vier antworten
[NeMo I 2023-01-02 18:05:24 wer_bpe:189] predicted:rangieriform neu vier


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:05:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:05:46 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:05:46 wer_bpe:189] predicted:ierfahrlei zwei drei drei drei
[NeMo I 2023-01-02 18:05:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:05:46 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:05:46 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:05:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:05:46 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:05:46 wer_bpe:189] predicted:umstell manövver vom drei sechs nach gleisray viel sieben wie nur viel an
[NeMo I 2023-01-02 18:05:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:05:46 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:05:46 wer_bpe:189] predicted:rangchierfahrt von gleis sechs neu insleidelta sieben an
[N

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:08:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:08:06 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:08:06 wer_bpe:189] predicted:rangierfahrt von gleis ma zwei drei ins drei drei al
[NeMo I 2023-01-02 18:08:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:08:06 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:08:06 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:08:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:08:06 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:08:06 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null v antworten
[NeMo I 2023-01-02 18:08:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:08:06 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:08:06 wer_bpe:189] predicted:rangierfahrt von gleis sechs ne

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:10:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:10:27 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:10:27 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:10:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:10:27 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:10:27 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:10:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:10:28 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:10:28 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:10:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:10:28 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:10:28 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:12:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:12:49 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:12:49 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:12:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:12:49 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:12:49 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:12:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:12:49 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:12:49 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:12:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:12:49 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:12:49 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:15:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:15:09 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:15:09 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:15:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:15:09 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:15:09 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:15:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:15:09 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:15:09 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:15:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:15:09 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:15:09 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:17:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:17:29 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:17:29 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:17:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:17:29 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:17:29 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:17:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:17:29 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:17:29 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:17:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:17:30 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:17:30 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=6` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▄▄▄▄▄▄▅▅▅▅▅▇▇▇▇▇▇██████
global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▆▇▇▇▇██
train_loss,██▇▄█▄▄▄▅▄▄▂▃▂▂▁▁▃▂▄▂▁▂▁▁▂▃▃
trainer/global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,███▆▇▇▅▆▄▅▃▅▄▃▃▃▂▄▃▂▃▁▁
val_loss,█▃▂▁▁▁
val_wer,█▃▂▁▁▁

0,1
epoch,5.0
global_step,1422.0
learning_rate,4e-05
train_loss,51.15728
trainer/global_step,1421.0
training_batch_wer,0.17347
val_loss,2.70646
val_wer,0.02872


[34m[1mwandb[0m: Agent Starting Run: okhfpg6i with config:
[34m[1mwandb[0m: 	epoch: 5
[34m[1mwandb[0m: 	freq_width: 25.764773169138447
[34m[1mwandb[0m: 	lr: 0.001195863304589692
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 18:18:19 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 18:18:19 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 18:18:19 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 18:18:24 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 18:18:24 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 18:18:24 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 18:18:24 features:225] PADDING: 16
[NeMo I 2023-01-02 18:18:29 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 18:18:29 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 18:18:29 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:18:29 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 18:18:29 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:18:29 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 18:18:29 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:18:29 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 18:18:29 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.001195863304589692
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 18:18:29 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f8387784df0>" 
    will be used during training (effective maximum steps = 1185) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1185
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:18:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:18:31 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:18:31 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:18:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:18:32 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:18:32 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:19:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:19:02 wer_bpe:188] reference:rangierfahrt vom romeo sieben sechs ins gleis acht antworten
[NeMo I 2023-01-02 18:19:02 wer_bpe:189] predicted:schierfahrs inacht
[NeMo I 2023-01-02 18:19:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:19:28 wer_bpe:188] reference:umstellmanöver vom drei eins ins zulu fünf neun via acht drei antworten
[NeMo I 2023-01-02 18:19:28 wer_bpe:189] predicted:umell man eins in zu wieacht teil mit
[NeMo I 2023-01-02 18:19:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:19:55 wer_bpe:188] reference:rangierfahrt vom gleis romeo vier fünf nach gleis hotel zwei antworten
[NeMo I 2023-01-02 18:19:55 wer_bpe:189] predicted:fahrt vom glas homeo vier fünf nach gleis hotels zwei antwort
[NeMo I 2023-01-02 18:20:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:20:21 wer_bpe:188] reference:umstellmanöver von gleis neun vier ins gleis null fünf via gleis lima eins acht antworten
[NeMo I 2023-01-02 18:20:21 wer_bpe:189] p

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:20:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:20:43 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:20:43 wer_bpe:189] predicted:rangierfahrt von gleis ma zwei drei ins drei drei also
[NeMo I 2023-01-02 18:20:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:20:43 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:20:43 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:20:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:20:44 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:20:44 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis ex ray vier sieben via null v antworten
[NeMo I 2023-01-02 18:20:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:20:44 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:20:44 wer_bpe:189] predicted:rangierfahrt von gleis sechs

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:23:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:23:05 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:23:05 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:23:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:23:05 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:23:05 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:23:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:23:05 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:23:05 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:23:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:23:05 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:23:05 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:25:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:25:27 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:25:27 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:25:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:25:27 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:25:27 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:25:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:25:27 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:25:27 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:25:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:25:27 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:25:27 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:27:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:27:49 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:27:49 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:27:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:27:49 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:27:49 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:27:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:27:49 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:27:49 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:27:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:27:49 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:27:49 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:30:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:30:14 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:30:14 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:30:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:30:14 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:30:14 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:30:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:30:14 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:30:14 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:30:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:30:14 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:30:14 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=5` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▅▅▅▅▅▅▆▆▆▆▆██████
global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
learning_rate,▁▁▂▂▂▃▃▃▄▄▄▄▅▅▅▆▆▆▇▇▇██
train_loss,█▆▄▅▆▄▃▃▂▂▃▃▃▃▂▂▃▁▂▂▁▁▁
trainer/global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
training_batch_wer,█▇▆▆▄▄▃▃▁▄▂▂▂▂▁▃▃▁▁
val_loss,█▂▂▁▁
val_wer,█▃▂▁▁

0,1
epoch,4.0
global_step,1185.0
learning_rate,0.00014
train_loss,7.22004
trainer/global_step,1184.0
training_batch_wer,0.23158
val_loss,1.53391
val_wer,0.01828


[34m[1mwandb[0m: Agent Starting Run: ai7ba7qh with config:
[34m[1mwandb[0m: 	epoch: 6
[34m[1mwandb[0m: 	freq_width: 25.3492391388578
[34m[1mwandb[0m: 	lr: 0.0029319001833792444
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 18:31:03 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 18:31:03 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 18:31:03 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 18:31:08 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 18:31:09 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 18:31:09 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 18:31:09 features:225] PADDING: 16
[NeMo I 2023-01-02 18:31:14 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 18:31:14 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 18:31:14 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:31:14 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 18:31:14 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:31:14 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 18:31:14 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:31:14 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 18:31:15 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0029319001833792444
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 18:31:15 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f83870894c0>" 
    will be used during training (effective maximum steps = 1422) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1422
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:31:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:31:16 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:31:16 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:31:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:31:17 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:31:17 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:31:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:31:47 wer_bpe:188] reference:umstellmanöver vom acht acht via zwei null ins alpha fünf vier antworten
[NeMo I 2023-01-02 18:31:47 wer_bpe:189] predicted:
[NeMo I 2023-01-02 18:32:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:32:13 wer_bpe:188] reference:rangierfahrt von gleis mike acht zwei nach gleis juliet null drei antworten
[NeMo I 2023-01-02 18:32:13 wer_bpe:189] predicted:rangchierfahrt von gleis me zwei t juliet null dreiten
[NeMo I 2023-01-02 18:32:39 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:32:39 wer_bpe:188] reference:umstellmanöver vom lima sechs via uniform sechs und sieben ins zwei antworten
[NeMo I 2023-01-02 18:32:39 wer_bpe:189] predicted:nie ja
[NeMo I 2023-01-02 18:33:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:33:06 wer_bpe:188] reference:umstellmanöver von gleis vier drei via gleis drei neun ins vier sieben antworten
[NeMo I 2023-01-02 18:33:06 wer_bpe:189] predicted:mit sie sehr stmaöswandnal ra bau

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:33:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:33:28 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:33:28 wer_bpe:189] predicted:rangierfahrt vom gleis miik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:33:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:33:28 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:33:28 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:33:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:33:28 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:33:28 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:33:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:33:28 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:33:28 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:35:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:35:49 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:35:49 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:35:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:35:49 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:35:49 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:35:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:35:49 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:35:49 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:35:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:35:49 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:35:49 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:38:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:38:09 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:38:09 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:38:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:38:09 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:38:09 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:38:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:38:09 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:38:09 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:38:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:38:09 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:38:09 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:40:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:40:29 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:40:29 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:40:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:40:29 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:40:29 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:40:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:40:29 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:40:29 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:40:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:40:30 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:40:30 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:42:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:42:51 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:42:51 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:42:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:42:51 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:42:51 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:42:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:42:51 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:42:51 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:42:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:42:52 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:42:52 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:45:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:45:12 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:45:12 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:45:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:45:12 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:45:12 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 18:45:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:45:12 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:45:12 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:45:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:45:12 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:45:12 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=6` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▄▄▄▄▄▄▅▅▅▅▅▇▇▇▇▇▇██████
global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▆▇▇▇▇██
train_loss,█▆▆▄▃▃▃▃▂▂▂▂▂▁▁▂▁▃▂▃▂▁▁▂▁▁▁▂
trainer/global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,█▇▇▅▂▄▄▂▃▃▃▂▂▁▁▁▁▂▁▂▁▂▁
val_loss,█▃▂▁▁▁
val_wer,█▂▂▁▁▁

0,1
epoch,5.0
global_step,1422.0
learning_rate,0.00041
train_loss,17.3621
trainer/global_step,1421.0
training_batch_wer,0.08696
val_loss,1.24088
val_wer,0.01828


[34m[1mwandb[0m: Sweep Agent: Waiting for job.
[34m[1mwandb[0m: Job received.
[34m[1mwandb[0m: Agent Starting Run: vmyrzkz3 with config:
[34m[1mwandb[0m: 	epoch: 8
[34m[1mwandb[0m: 	freq_width: 28.69852351609853
[34m[1mwandb[0m: 	lr: 0.00017679415879711709
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 18:46:09 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 18:46:09 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 18:46:09 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 18:46:13 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 18:46:14 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 18:46:14 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 18:46:14 features:225] PADDING: 16
[NeMo I 2023-01-02 18:46:19 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 18:46:19 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 18:46:19 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:46:19 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 18:46:19 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:46:19 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 18:46:19 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 18:46:19 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 18:46:20 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.00017679415879711709
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 18:46:20 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f83879f8f40>" 
    will be used during training (effective maximum steps = 1896) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1896
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:46:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:46:22 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:46:22 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:46:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:46:22 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:46:22 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:46:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:46:52 wer_bpe:188] reference:umstellmanöver von tango neun acht ins gleis whisky zwei drei via gleis zwei fünf antworten
[NeMo I 2023-01-02 18:46:52 wer_bpe:189] predicted:in ja
[NeMo I 2023-01-02 18:47:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:47:18 wer_bpe:188] reference:umstellmanöver vom xray neun vier via mike sieben zwei nach gleis uniform neun drei antworten
[NeMo I 2023-01-02 18:47:18 wer_bpe:189] predicted:um vom ex sie noch ju drei dort
[NeMo I 2023-01-02 18:47:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:47:44 wer_bpe:188] reference:umstellmanöver vom gleis fünf eins via acht sieben ins bravo eins null antworten
[NeMo I 2023-01-02 18:47:44 wer_bpe:189] predicted:vom gleis fünf eins wieacht sie wo an
[NeMo I 2023-01-02 18:48:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:48:11 wer_bpe:188] reference:umstellmanöver vom acht acht via zwei null ins alpha fünf vier antworten
[NeMo I 2023-01-02 18:48:11 wer_bpe:189

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:48:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:48:33 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:48:33 wer_bpe:189] predicted:ierfahrlei zwei drei drei drei
[NeMo I 2023-01-02 18:48:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:48:33 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:48:33 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:48:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:48:33 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:48:33 wer_bpe:189] predicted:umstell manöver vom drei sechs nachleisray sieben wie nur viel an
[NeMo I 2023-01-02 18:48:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:48:33 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:48:33 wer_bpe:189] predicted:ngchierfahrt gleis sechs neu insleidelta sieben
[NeMo I 2023-01-02 

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:50:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:50:55 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:50:55 wer_bpe:189] predicted:frierfahrt vom gleis ma zwei drei in drei drei
[NeMo I 2023-01-02 18:50:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:50:55 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:50:55 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:50:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:50:55 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:50:55 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null viel antworten
[NeMo I 2023-01-02 18:50:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:50:55 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:50:55 wer_bpe:189] predicted:rangierfahrt von gleis sechs neun 

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:53:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:53:14 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:53:14 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 18:53:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:53:14 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:53:14 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:53:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:53:14 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:53:14 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis ray vier sieben via null v antworten
[NeMo I 2023-01-02 18:53:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:53:14 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:53:14 wer_bpe:189] predicted:rangierfahrt von gleis sec

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:55:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:55:40 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:55:40 wer_bpe:189] predicted:rangierfahrt vom gleis miig zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:55:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:55:40 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:55:40 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:55:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:55:40 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:55:40 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:55:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:55:40 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:55:40 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 18:58:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:58:00 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:58:00 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 18:58:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:58:00 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 18:58:00 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 18:58:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:58:00 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:58:00 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 18:58:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 18:58:00 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 18:58:00 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:00:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:00:21 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:00:21 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:00:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:00:21 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:00:21 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:00:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:00:21 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:00:21 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:00:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:00:21 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:00:21 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:02:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:02:43 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:02:43 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:02:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:02:43 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:02:43 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:02:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:02:43 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:02:43 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:02:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:02:43 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:02:43 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:05:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:05:06 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:05:06 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:05:07 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:05:07 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:05:07 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:05:07 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:05:07 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:05:07 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:05:07 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:05:07 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:05:07 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=8` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇████
global_step,▁▁▁▂▂▂▂▂▃▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇▇██
learning_rate,▁▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
train_loss,▇█▆▆▇▅▅▅▅▄▃▆▄▅▃▃▃▃▃▃▂▄▃▂▄▁▂▂▁▂▂▃▁▃▂▁▁
trainer/global_step,▁▁▁▂▂▂▂▂▃▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇▇██
training_batch_wer,██▇▇▇▇▇▄▅▅▆▅▃▅▄▃▆▂▃▂▂▂▃▃▂▃▂▁▄▂
val_loss,█▄▂▂▁▁▁▁
val_wer,█▄▂▂▁▁▁▁

0,1
epoch,7.0
global_step,1896.0
learning_rate,3e-05
train_loss,20.17568
trainer/global_step,1895.0
training_batch_wer,0.33333
val_loss,2.48518
val_wer,0.02872


[34m[1mwandb[0m: Agent Starting Run: zh6n46sc with config:
[34m[1mwandb[0m: 	epoch: 4
[34m[1mwandb[0m: 	freq_width: 28.909369819570205
[34m[1mwandb[0m: 	lr: 0.0032186754053060043
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 19:05:56 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 19:05:56 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 19:05:56 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 19:06:01 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 19:06:02 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 19:06:02 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 19:06:02 features:225] PADDING: 16
[NeMo I 2023-01-02 19:06:06 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 19:06:07 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 19:06:07 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:06:07 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 19:06:07 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:06:07 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 19:06:07 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:06:07 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 19:06:07 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0032186754053060043
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 19:06:07 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f842c6c6700>" 
    will be used during training (effective maximum steps = 948) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 948
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:06:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:06:09 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:06:09 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:06:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:06:10 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:06:10 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:06:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:06:40 wer_bpe:188] reference:umstellmanöver vom vier zwei via echo acht eins ins gleis foxtrot fünf eins antworten
[NeMo I 2023-01-02 19:06:40 wer_bpe:189] predicted:man zwar wie ich so fxs dort und
[NeMo I 2023-01-02 19:07:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:07:06 wer_bpe:188] reference:rangierfahrt vom tango zwei zwei nach zwei neun antworten
[NeMo I 2023-01-02 19:07:06 wer_bpe:189] predicted:nche tango zwei zweiwar noch zwei neun antworten
[NeMo I 2023-01-02 19:07:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:07:33 wer_bpe:188] reference:umstellmanöver vom acht neun nach gleis hotel null sieben via gleis eins eins antworten
[NeMo I 2023-01-02 19:07:33 wer_bpe:189] predicted:neu warleis oder jasel eins antwort
[NeMo I 2023-01-02 19:08:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:08:00 wer_bpe:188] reference:umstellmanöver vom gleis bravo null null nach vier eins via gleis fünf sechs antworten
[NeMo I 2023-01-02

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:08:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:08:22 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:08:22 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:08:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:08:22 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:08:22 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:08:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:08:22 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:08:22 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:08:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:08:23 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:08:23 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:10:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:10:44 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:10:44 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:10:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:10:44 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:10:44 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:10:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:10:44 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:10:44 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:10:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:10:45 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:10:45 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:13:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:13:05 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:13:05 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:13:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:13:05 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:13:05 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:13:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:13:05 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:13:05 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:13:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:13:05 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:13:05 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:15:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:15:26 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:15:26 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:15:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:15:26 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:15:26 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:15:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:15:26 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:15:26 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:15:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:15:26 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:15:26 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=4` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▆▆▆▆▆▆█████
global_step,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▆▆▆▆▇▇██
learning_rate,▁▁▂▂▃▃▃▄▄▅▅▆▆▆▇▇██
train_loss,█▇▅▇▄▄▂▃▂▄▁▃▂▂▃▁▂▂
trainer/global_step,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▆▆▆▆▇▇██
training_batch_wer,█▆▅▆▃▃▃▂▂▂▃▁▂▂▂
val_loss,█▃▁▁
val_wer,█▂▁▁

0,1
epoch,3.0
global_step,948.0
learning_rate,0.00029
train_loss,26.15583
trainer/global_step,947.0
training_batch_wer,0.24419
val_loss,1.13003
val_wer,0.01567


[34m[1mwandb[0m: Agent Starting Run: fryfil87 with config:
[34m[1mwandb[0m: 	epoch: 5
[34m[1mwandb[0m: 	freq_width: 27.07563802611988
[34m[1mwandb[0m: 	lr: 0.005917196726829276
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 19:16:15 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 19:16:15 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 19:16:15 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 19:16:19 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 19:16:20 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 19:16:20 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 19:16:20 features:225] PADDING: 16
[NeMo I 2023-01-02 19:16:25 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 19:16:25 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 19:16:25 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:16:25 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 19:16:25 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:16:25 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 19:16:25 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:16:25 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 19:16:26 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.005917196726829276
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 19:16:26 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f842c748910>" 
    will be used during training (effective maximum steps = 1185) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1185
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:16:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:16:28 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:16:28 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:16:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:16:28 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:16:28 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:16:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:16:58 wer_bpe:188] reference:umstellmanöver vom alpha fünf sieben via gleis sieben nach victor drei null antworten
[NeMo I 2023-01-02 19:16:58 wer_bpe:189] predicted:
[NeMo I 2023-01-02 19:17:25 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:17:25 wer_bpe:188] reference:umstellmanöver vom romeo fünf via november sieben und acht drei nach gleis xray fünf antworten
[NeMo I 2023-01-02 19:17:25 wer_bpe:189] predicted:umstellung vom erro für nov sieben und  drei nach gleis baray fühl
[NeMo I 2023-01-02 19:17:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:17:51 wer_bpe:188] reference:umstellmanöver vom sechs vier via gleis eins drei nach gleis alpha fünf null antworten
[NeMo I 2023-01-02 19:17:51 wer_bpe:189] predicted:umstellmanöver vom sechs vier via glei eins drei nach gleis alha fünf nl
[NeMo I 2023-01-02 19:18:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:18:18 wer_bpe:188] reference:umstellmanöver vom fünf eins ins gleis papa se

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:18:39 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:18:39 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:18:39 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:18:39 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:18:39 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:18:39 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:18:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:18:40 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:18:40 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:18:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:18:40 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:18:40 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:21:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:21:01 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:21:01 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:21:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:21:02 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:21:02 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:21:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:21:02 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:21:02 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:21:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:21:02 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:21:02 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:23:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:23:23 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:23:23 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:23:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:23:23 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:23:23 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:23:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:23:23 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:23:23 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:23:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:23:23 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:23:23 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:25:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:25:42 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:25:42 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:25:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:25:43 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:25:43 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:25:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:25:43 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:25:43 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:25:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:25:43 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:25:43 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:28:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:28:05 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:28:05 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:28:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:28:05 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:28:05 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:28:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:28:05 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:28:05 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:28:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:28:05 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:28:05 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=5` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▅▅▅▅▅▅▆▆▆▆▆██████
global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
learning_rate,▁▁▂▂▂▃▃▃▄▄▄▄▅▅▅▆▆▆▇▇▇██
train_loss,▇█▄▅▃▂▂▂▂▁▂▁▂▁▂▂▁▂▂▁▂▁▂
trainer/global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
training_batch_wer,██▅▇▃▂▂▃▁▂▂▃▂▂▂▁▂▂▃
val_loss,█▃▁▁▁
val_wer,█▃▁▁▂

0,1
epoch,4.0
global_step,1185.0
learning_rate,0.00068
train_loss,14.66708
trainer/global_step,1184.0
training_batch_wer,0.27885
val_loss,1.16609
val_wer,0.02089


[34m[1mwandb[0m: Agent Starting Run: vjx66afd with config:
[34m[1mwandb[0m: 	epoch: 4
[34m[1mwandb[0m: 	freq_width: 27.20496872533753
[34m[1mwandb[0m: 	lr: 0.0004452014476918365
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 19:28:54 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 19:28:54 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 19:28:54 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 19:28:59 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 19:28:59 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 19:28:59 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 19:28:59 features:225] PADDING: 16
[NeMo I 2023-01-02 19:29:04 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 19:29:04 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 19:29:04 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:29:04 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 19:29:04 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:29:04 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 19:29:04 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:29:04 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 19:29:05 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0004452014476918365
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 19:29:05 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f835e15dd30>" 
    will be used during training (effective maximum steps = 948) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 948
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:29:07 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:29:07 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:29:07 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:29:07 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:29:07 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:29:07 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:29:37 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:29:37 wer_bpe:188] reference:umstellmanöver vom vier zwei via echo acht eins ins gleis foxtrot fünf eins antworten
[NeMo I 2023-01-02 19:29:37 wer_bpe:189] predicted:man ichlei ein an
[NeMo I 2023-01-02 19:30:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:30:04 wer_bpe:188] reference:umstellmanöver von neun vier nach gleis bravo sieben via echo acht drei antworten
[NeMo I 2023-01-02 19:30:04 wer_bpe:189] predicted:der vor ja
[NeMo I 2023-01-02 19:30:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:30:31 wer_bpe:188] reference:rangierfahrt von gleis bravo neun sieben ins drei sechs antworten
[NeMo I 2023-01-02 19:30:31 wer_bpe:189] predicted:leibravo sieben ins dreichs
[NeMo I 2023-01-02 19:30:57 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:30:57 wer_bpe:188] reference:rangierfahrt von gleis sieben sieben ins eins zwei antworten
[NeMo I 2023-01-02 19:30:57 wer_bpe:189] predicted:sie


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:31:19 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:31:19 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:31:19 wer_bpe:189] predicted:schierfahr gleis zwei drei drei drei
[NeMo I 2023-01-02 19:31:19 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:31:19 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:31:19 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:31:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:31:20 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:31:20 wer_bpe:189] predicted:umstellmaövver vom drei sechs nach gleis exray vier sieben wie nul viel an
[NeMo I 2023-01-02 19:31:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:31:20 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:31:20 wer_bpe:189] predicted:rangchierfahrt von gleis sechs neun ins gleisdelta s

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:33:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:33:41 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:33:41 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 19:33:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:33:42 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:33:42 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:33:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:33:42 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:33:42 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null v antworten
[NeMo I 2023-01-02 19:33:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:33:42 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:33:42 wer_bpe:189] predicted:rangierfahrt von gleis se

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:36:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:36:02 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:36:02 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:36:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:36:02 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:36:02 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:36:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:36:02 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:36:02 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:36:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:36:02 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:36:02 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:38:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:38:22 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:38:22 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:38:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:38:22 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:38:22 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:38:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:38:23 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:38:23 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:38:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:38:23 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:38:23 wer_bpe:189] predicted:rangierfahrt von gle

`Trainer.fit` stopped: `max_epochs=4` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▆▆▆▆▆▆█████
global_step,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▆▆▆▆▇▇██
learning_rate,▁▁▂▂▃▃▃▄▄▅▅▆▆▆▇▇██
train_loss,█▆▇▅▄▃▃▂▁▃▃▃▃▁▁▃▂▁
trainer/global_step,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▆▆▆▆▇▇██
training_batch_wer,█▇█▇▄▅▄▄▂▁▄▃▁▄▂
val_loss,█▂▁▁
val_wer,█▂▂▁

0,1
epoch,3.0
global_step,948.0
learning_rate,4e-05
train_loss,37.70523
trainer/global_step,947.0
training_batch_wer,0.33333
val_loss,3.24113
val_wer,0.03916


[34m[1mwandb[0m: Agent Starting Run: ymwvqsp0 with config:
[34m[1mwandb[0m: 	epoch: 9
[34m[1mwandb[0m: 	freq_width: 27.864157355359424
[34m[1mwandb[0m: 	lr: 0.001574030864918526
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 19:39:17 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 19:39:17 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 19:39:17 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 19:39:21 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 19:39:22 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 19:39:22 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 19:39:22 features:225] PADDING: 16
[NeMo I 2023-01-02 19:39:27 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 19:39:28 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 19:39:28 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:39:28 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 19:39:28 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:39:28 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 19:39:28 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 19:39:28 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 19:39:28 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.001574030864918526
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 19:39:28 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f8386e3d640>" 
    will be used during training (effective maximum steps = 2133) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 2133
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:39:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:39:30 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:39:30 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:39:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:39:31 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:39:31 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:40:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:40:01 wer_bpe:188] reference:rangierfahrt vom null eins ins gleis drei neun antworten
[NeMo I 2023-01-02 19:40:01 wer_bpe:189] predicted:s ihn
[NeMo I 2023-01-02 19:40:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:40:27 wer_bpe:188] reference:umstellmanöver von november neun nach fünf via gleis tango vier und romeo drei antworten
[NeMo I 2023-01-02 19:40:27 wer_bpe:189] predicted:umstellmann noch neu
[NeMo I 2023-01-02 19:40:54 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:40:54 wer_bpe:188] reference:umstellmanöver vom acht acht via zwei null ins alpha fünf vier antworten
[NeMo I 2023-01-02 19:40:54 wer_bpe:189] predicted:umstellmann vom ab wie zweino ins fünf vier am
[NeMo I 2023-01-02 19:41:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:41:20 wer_bpe:188] reference:umstellmanöver von sechs null via acht vier ins golf eins vier antworten
[NeMo I 2023-01-02 19:41:20 wer_bpe:189] predicted:umstellmanöver von sechsno via auch ih

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:41:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:41:42 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:41:42 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 19:41:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:41:42 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:41:42 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:41:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:41:43 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:41:43 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null v antworten
[NeMo I 2023-01-02 19:41:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:41:43 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:41:43 wer_bpe:189] predicted:rangierfahrt von gleis se

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:44:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:44:09 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:44:09 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:44:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:44:10 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:44:10 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 19:44:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:44:10 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:44:10 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:44:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:44:10 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:44:10 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:46:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:46:30 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:46:30 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:46:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:46:30 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:46:30 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:46:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:46:30 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:46:30 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:46:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:46:30 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:46:30 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:48:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:48:51 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:48:51 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:48:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:48:51 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:48:51 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:48:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:48:51 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:48:51 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:48:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:48:51 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:48:51 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:51:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:51:12 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:51:12 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:51:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:51:12 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:51:12 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:51:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:51:12 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:51:12 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:51:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:51:13 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:51:13 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:53:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:53:33 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:53:33 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:53:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:53:33 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:53:33 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:53:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:53:33 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:53:33 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:53:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:53:33 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:53:33 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:55:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:55:55 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:55:55 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:55:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:55:55 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:55:55 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:55:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:55:55 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:55:55 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:55:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:55:56 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:55:56 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 19:58:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:58:16 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:58:16 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 19:58:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:58:16 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 19:58:16 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 19:58:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:58:16 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:58:16 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 19:58:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 19:58:16 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 19:58:16 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:00:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:00:34 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:00:34 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:00:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:00:34 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:00:34 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:00:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:00:34 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:00:34 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:00:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:00:34 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:00:34 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=9` reached.


0,1
epoch,▁▁▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▅▅▅▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇████
global_step,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇▇██
train_loss,▇▇█▅▅▃▂▃▃▂▂▂▃▃▂▂▂▃▁▁▂▁▂▂▂▁▃▂▁▂▂▂▁▁▁▁▁▁▂▂
trainer/global_step,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,██▇▆▅▄▆▅▃▂▃▂▂▂▃▁▂▂▂▂▂▁▁▁▁▂▁▂▁▁▂▂▂▂
val_loss,█▃▂▁▁▁▁▁▁
val_wer,█▃▂▂▁▁▁▁▁

0,1
epoch,8.0
global_step,2133.0
learning_rate,0.00033
train_loss,17.09785
trainer/global_step,2132.0
training_batch_wer,0.16092
val_loss,0.89333
val_wer,0.01567


[34m[1mwandb[0m: Agent Starting Run: x10ebqmi with config:
[34m[1mwandb[0m: 	epoch: 4
[34m[1mwandb[0m: 	freq_width: 27.60208893813757
[34m[1mwandb[0m: 	lr: 0.00934070361290924
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 20:01:20 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 20:01:20 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 20:01:20 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 20:01:25 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 20:01:26 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 20:01:26 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 20:01:26 features:225] PADDING: 16
[NeMo I 2023-01-02 20:01:30 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 20:01:30 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 20:01:30 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:01:30 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 20:01:30 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:01:30 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 20:01:30 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:01:30 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 20:01:31 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.00934070361290924
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 20:01:31 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f83876ce7c0>" 
    will be used during training (effective maximum steps = 948) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 948
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:01:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:01:33 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:01:33 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:01:33 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:01:33 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:01:33 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:02:03 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:02:03 wer_bpe:188] reference:dazu ist demokratie erforderlich
[NeMo I 2023-01-02 20:02:03 wer_bpe:189] predicted:
[NeMo I 2023-01-02 20:02:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:02:29 wer_bpe:188] reference:rangierfahrt zwei vier vier golf drei
[NeMo I 2023-01-02 20:02:29 wer_bpe:189] predicted:frngngierfahr drei sie sie gott drei
[NeMo I 2023-01-02 20:02:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:02:56 wer_bpe:188] reference:umstellmanöver von gleis vier fünf ins gleis foxtrot sechs drei via neun antworten
[NeMo I 2023-01-02 20:02:56 wer_bpe:189] predicted:umstellmanöver von gleis v fünf ins  vomstrot sechs drei vier neun antworten
[NeMo I 2023-01-02 20:03:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:03:22 wer_bpe:188] reference:antworten
[NeMo I 2023-01-02 20:03:22 wer_bpe:189] predicted:ken


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:03:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:03:44 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:03:44 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:03:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:03:45 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:03:45 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 20:03:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:03:45 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:03:45 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:03:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:03:45 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:03:45 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:06:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:06:08 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:06:08 wer_bpe:189] predicted:rangierfahrt von gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:06:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:06:08 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:06:08 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:06:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:06:09 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:06:09 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:06:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:06:09 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:06:09 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:08:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:08:34 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:08:34 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:08:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:08:34 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:08:34 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:08:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:08:34 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:08:34 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:08:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:08:34 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:08:34 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:11:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:11:02 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:11:02 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:11:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:11:02 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:11:02 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:11:03 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:11:03 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:11:03 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:11:03 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:11:03 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:11:03 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=4` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▆▆▆▆▆▆█████
global_step,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▆▆▆▆▇▇██
learning_rate,▁▁▂▂▃▃▃▄▄▅▅▆▆▆▇▇██
train_loss,█▅▆▃▃▂▂▁▄▂▂▁▃▁▁▁▃▂
trainer/global_step,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▆▆▆▆▇▇██
training_batch_wer,█▆▅▄▂▄▄▂▂▁▂▁▂▂▂
val_loss,█▄▂▁
val_wer,█▅▂▁

0,1
epoch,3.0
global_step,948.0
learning_rate,0.00084
train_loss,16.15112
trainer/global_step,947.0
training_batch_wer,0.16484
val_loss,0.81053
val_wer,0.01305


[34m[1mwandb[0m: Agent Starting Run: 60zx2as2 with config:
[34m[1mwandb[0m: 	epoch: 6
[34m[1mwandb[0m: 	freq_width: 25.89323150324468
[34m[1mwandb[0m: 	lr: 0.0001604817555787073
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 20:11:53 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 20:11:53 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 20:11:53 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 20:11:59 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 20:12:00 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 20:12:00 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 20:12:00 features:225] PADDING: 16
[NeMo I 2023-01-02 20:12:05 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 20:12:06 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 20:12:06 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:12:06 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 20:12:06 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:12:06 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 20:12:06 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:12:06 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 20:12:07 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0001604817555787073
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 20:12:07 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f838753f2e0>" 
    will be used during training (effective maximum steps = 1422) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1422
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:12:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:12:09 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:12:09 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:12:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:12:09 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:12:09 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:12:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:12:41 wer_bpe:188] reference:umstellmanöver von gleis bravo drei via vier eins nach drei sieben antworten
[NeMo I 2023-01-02 20:12:41 wer_bpe:189] predicted:manö es drei ein nach sieben
[NeMo I 2023-01-02 20:13:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:13:09 wer_bpe:188] reference:umstellmanöver vom acht sieben via gleis november eins sechs ins gleis golf eins sieben antworten
[NeMo I 2023-01-02 20:13:09 wer_bpe:189] predicted:ungstell man sieben wielei eins insks ein sieben
[NeMo I 2023-01-02 20:13:37 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:13:37 wer_bpe:188] reference:umstellmanöver von neun zwei via whisky vier sechs ins gleis sierra sechs eins antworten
[NeMo I 2023-01-02 20:13:37 wer_bpe:189] predicted:umell manö wie wis seslei dererchs
[NeMo I 2023-01-02 20:14:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:14:04 wer_bpe:188] reference:umstellmanöver von eins via india zwei drei nach gleis zwei fünf antworten
[Ne

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:14:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:14:28 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:14:28 wer_bpe:189] predicted:ierlei zwei drei drei drei
[NeMo I 2023-01-02 20:14:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:14:28 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:14:28 wer_bpe:189] predicted:sprach eingab
[NeMo I 2023-01-02 20:14:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:14:28 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:14:28 wer_bpe:189] predicted:umstell manöver vom drei sechs nachleisy sieben wie nur viel an
[NeMo I 2023-01-02 20:14:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:14:28 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:14:28 wer_bpe:189] predicted:ngchierfahrlei sechs neu insleidelter sieben
[NeMo I 2023-01-02 20:14:28 w

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:16:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:16:58 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:16:58 wer_bpe:189] predicted:fr schierfahrt von gleis ma zwei drei in drei drei
[NeMo I 2023-01-02 20:16:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:16:58 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:16:58 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 20:16:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:16:58 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:16:58 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null viel antworten
[NeMo I 2023-01-02 20:16:59 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:16:59 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:16:59 wer_bpe:189] predicted:rangierfahrt von gleis sechs n

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:19:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:19:34 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:19:34 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 20:19:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:19:34 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:19:34 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 20:19:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:19:34 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:19:34 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis  ray vier sieben via null v antworten
[NeMo I 2023-01-02 20:19:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:19:34 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:19:34 wer_bpe:189] predicted:rangierfahrt von gleis se

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:22:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:22:02 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:22:02 wer_bpe:189] predicted:rangierfahrt vom gleis miik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:22:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:22:02 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:22:02 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 20:22:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:22:02 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:22:02 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null v antworten
[NeMo I 2023-01-02 20:22:03 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:22:03 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:22:03 wer_bpe:189] predicted:rangierfahrt von gleis 

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:24:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:24:32 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:24:32 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:24:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:24:32 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:24:32 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 20:24:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:24:32 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:24:32 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:24:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:24:32 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:24:32 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:27:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:27:05 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:27:05 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:27:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:27:05 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:27:05 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 20:27:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:27:06 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:27:06 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:27:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:27:06 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:27:06 wer_bpe:189] predicted:rangierfahrt von gle

`Trainer.fit` stopped: `max_epochs=6` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▄▄▄▄▄▄▅▅▅▅▅▇▇▇▇▇▇██████
global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▆▇▇▇▇██
train_loss,▆█▅▇█▇▅▅▄▄▅▅▅▃▃▃▂▃▅▄▂▂▁▂▃▂▃▁
trainer/global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,▆██▇▇▇▆▇▄▅▄▄▂▂▄▄▃▄▁▂▃▃▃
val_loss,█▄▂▁▁▁
val_wer,█▄▂▂▁▁

0,1
epoch,5.0
global_step,1422.0
learning_rate,2e-05
train_loss,18.40176
trainer/global_step,1421.0
training_batch_wer,0.51724
val_loss,3.70384
val_wer,0.04961


[34m[1mwandb[0m: Agent Starting Run: ijmhrchh with config:
[34m[1mwandb[0m: 	epoch: 6
[34m[1mwandb[0m: 	freq_width: 26.139677664826255
[34m[1mwandb[0m: 	lr: 0.003854526527915413
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 20:27:54 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 20:27:54 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 20:27:54 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 20:27:59 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 20:28:00 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 20:28:00 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 20:28:00 features:225] PADDING: 16
[NeMo I 2023-01-02 20:28:05 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 20:28:05 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 20:28:05 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:28:05 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 20:28:05 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:28:05 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 20:28:05 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:28:05 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 20:28:06 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.003854526527915413
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 20:28:06 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f836ad07ac0>" 
    will be used during training (effective maximum steps = 1422) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1422
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:28:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:28:08 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:28:08 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:28:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:28:08 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:28:08 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:28:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:28:41 wer_bpe:188] reference:umstellmanöver vom gleis juliet vier fünf nach sieben acht via vier acht antworten
[NeMo I 2023-01-02 20:28:41 wer_bpe:189] predicted:fürli neben wie ja vier
[NeMo I 2023-01-02 20:29:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:29:08 wer_bpe:188] reference:rangierfahrt von eins sieben nach gleis fünf antworten
[NeMo I 2023-01-02 20:29:08 wer_bpe:189] predicted:
[NeMo I 2023-01-02 20:29:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:29:36 wer_bpe:188] reference:rangierfahrt von fünf drei nach gleis charlie drei eins antworten
[NeMo I 2023-01-02 20:29:36 wer_bpe:189] predicted:s frei aus gleiszahl eins antwort
[NeMo I 2023-01-02 20:30:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:30:04 wer_bpe:188] reference:rangierfahrt von charlie null neun ins drei zwei antworten
[NeMo I 2023-01-02 20:30:04 wer_bpe:189] predicted:zierfahrt vonch neu ins drei zweiiert


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:30:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:30:27 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:30:27 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:30:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:30:27 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:30:27 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 20:30:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:30:27 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:30:27 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:30:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:30:28 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:30:28 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:32:57 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:32:57 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:32:57 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:32:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:32:58 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:32:58 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:32:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:32:58 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:32:58 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:32:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:32:58 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:32:58 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:35:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:35:28 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:35:28 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:35:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:35:29 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:35:29 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:35:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:35:29 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:35:29 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:35:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:35:29 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:35:29 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:37:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:37:55 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:37:55 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:37:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:37:55 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:37:55 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:37:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:37:55 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:37:55 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:37:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:37:55 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:37:55 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:40:25 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:40:25 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:40:25 wer_bpe:189] predicted:rangierfahrt von gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:40:25 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:40:25 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:40:25 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:40:25 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:40:25 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:40:25 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:40:25 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:40:25 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:40:25 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:42:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:42:55 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:42:55 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:42:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:42:55 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:42:55 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:42:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:42:55 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:42:55 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:42:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:42:55 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:42:55 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=6` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▄▄▄▄▄▄▅▅▅▅▅▇▇▇▇▇▇██████
global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▆▇▇▇▇██
train_loss,▇█▃▄▃▃▂▃▃▁▁▂▁▂▁▁▁▂▂▁▂▁▁▁▁▂▁▁
trainer/global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,▇█▄▆▃▃▃▁▂▂▂▃▂▂▂▁▂▁▂▁▁▂▁
val_loss,█▄▂▂▁▁
val_wer,█▃▂▂▂▁

0,1
epoch,5.0
global_step,1422.0
learning_rate,0.00054
train_loss,6.60354
trainer/global_step,1421.0
training_batch_wer,0.12346
val_loss,0.76253
val_wer,0.01044


[34m[1mwandb[0m: Agent Starting Run: a1jm99g2 with config:
[34m[1mwandb[0m: 	epoch: 7
[34m[1mwandb[0m: 	freq_width: 27.44230701499851
[34m[1mwandb[0m: 	lr: 0.005007783445923379
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 20:43:48 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 20:43:48 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 20:43:48 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 20:43:54 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 20:43:55 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 20:43:55 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 20:43:55 features:225] PADDING: 16
[NeMo I 2023-01-02 20:44:01 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 20:44:02 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 20:44:02 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:44:02 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 20:44:02 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:44:02 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 20:44:02 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 20:44:02 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 20:44:02 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.005007783445923379
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 20:44:02 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f835ea9c910>" 
    will be used during training (effective maximum steps = 1659) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1659
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:44:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:44:05 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:44:05 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:44:05 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:44:05 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:44:05 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:44:38 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:44:38 wer_bpe:188] reference:umstellmanöver vom mike zwei null via gleis xray null sechs ins gleis eins sieben antworten
[NeMo I 2023-01-02 20:44:38 wer_bpe:189] predicted:zweislei ein sie
[NeMo I 2023-01-02 20:45:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:45:06 wer_bpe:188] reference:umstellmanöver von gleis sieben ins gleis sechs neun via gleis yankee vier zwei antworten
[NeMo I 2023-01-02 20:45:06 wer_bpe:189] predicted:ö sieben ins gleis sexsykei vier z
[NeMo I 2023-01-02 20:45:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:45:34 wer_bpe:188] reference:umstellmanöver vom hotel acht zwei nach zwei sieben via golf sechs acht antworten
[NeMo I 2023-01-02 20:45:34 wer_bpe:189] predicted:um vom hotel acht nach zwei via golf sechs acht antworten
[NeMo I 2023-01-02 20:46:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:46:02 wer_bpe:188] reference:rangierfahrt von neun vier ins null sechs antworten
[NeMo I 2023-01-02 20:46:02 w

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:46:25 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:46:25 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:46:25 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:46:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:46:26 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:46:26 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 20:46:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:46:26 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:46:26 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:46:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:46:26 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:46:26 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:48:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:48:56 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:48:56 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:48:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:48:56 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:48:56 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:48:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:48:56 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:48:56 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:48:57 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:48:57 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:48:57 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:51:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:51:27 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:51:27 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:51:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:51:27 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:51:27 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:51:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:51:27 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:51:27 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:51:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:51:27 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:51:27 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:54:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:54:02 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:54:02 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:54:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:54:02 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:54:02 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:54:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:54:02 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:54:02 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:54:02 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:54:02 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:54:02 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:56:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:56:31 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:56:31 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:56:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:56:31 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:56:31 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:56:31 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:56:31 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:56:31 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:56:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:56:32 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:56:32 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 20:59:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:59:01 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:59:01 wer_bpe:189] predicted:rangierfahrt von gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 20:59:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:59:01 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 20:59:01 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 20:59:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:59:01 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:59:01 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 20:59:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 20:59:01 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 20:59:01 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:01:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:01:32 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:01:32 wer_bpe:189] predicted:rangierfahrt von gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:01:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:01:32 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:01:32 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:01:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:01:32 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:01:32 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:01:32 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:01:32 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:01:32 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=7` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇▇██████
global_step,▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇████
learning_rate,▁▁▁▂▂▂▂▃▃▃▃▃▄▄▄▄▅▅▅▅▅▆▆▆▆▆▇▇▇▇███
train_loss,█▅▆▃▂▃▃▃▂▁▂▂▃▁▂▂▂▂▁▂▃▁▂▁▁▁▂▁▁▁▂▁▁
trainer/global_step,▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇████
training_batch_wer,█▅▅▄▄▂▃▃▃▂▂▃▂▄▂▂▁▁▂▂▂▂▁▁▃▂▁
val_loss,█▃▂▄▂▂▁
val_wer,█▄▂▄▁▁▁

0,1
epoch,6.0
global_step,1659.0
learning_rate,0.00083
train_loss,6.75188
trainer/global_step,1658.0
training_batch_wer,0.03488
val_loss,0.58759
val_wer,0.01305


[34m[1mwandb[0m: Agent Starting Run: 7t78xw1b with config:
[34m[1mwandb[0m: 	epoch: 5
[34m[1mwandb[0m: 	freq_width: 28.519595155981182
[34m[1mwandb[0m: 	lr: 0.0008331560252793354
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 21:02:31 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 21:02:31 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 21:02:31 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 21:02:37 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 21:02:38 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 21:02:38 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 21:02:38 features:225] PADDING: 16
[NeMo I 2023-01-02 21:02:44 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 21:02:45 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 21:02:45 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:02:45 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 21:02:45 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:02:45 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 21:02:45 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:02:45 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 21:02:46 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0008331560252793354
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 21:02:46 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f838521bf70>" 
    will be used during training (effective maximum steps = 1185) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1185
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:02:48 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:02:48 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:02:48 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:02:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:02:49 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:02:49 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:03:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:03:21 wer_bpe:188] reference:rangierfahrt von gleis sieben sieben ins eins zwei antworten
[NeMo I 2023-01-02 21:03:21 wer_bpe:189] predicted:sie in ein ihm
[NeMo I 2023-01-02 21:03:48 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:03:48 wer_bpe:188] reference:rangierfahrt von india sieben fünf ins foxtrot acht acht antworten
[NeMo I 2023-01-02 21:03:48 wer_bpe:189] predicted:von ihn dirben den
[NeMo I 2023-01-02 21:04:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:04:16 wer_bpe:188] reference:rangierfahrt vom gleis quebec eins eins ins gleis november sieben sechs antworten
[NeMo I 2023-01-02 21:04:16 wer_bpe:189] predicted:rochierfahrt vom la eins einss gleis nur antworten
[NeMo I 2023-01-02 21:04:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:04:44 wer_bpe:188] reference:umstellmanöver von gleis bravo drei via vier eins nach drei sieben antworten
[NeMo I 2023-01-02 21:04:44 wer_bpe:189] predicted:s umöfe von g gleichvo drei wie 

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:05:07 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:05:07 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:05:07 wer_bpe:189] predicted:frierfahrt vom gleis ma zwei drei in drei drei al
[NeMo I 2023-01-02 21:05:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:05:08 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:05:08 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:05:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:05:08 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:05:08 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null viel antworten
[NeMo I 2023-01-02 21:05:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:05:08 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:05:08 wer_bpe:189] predicted:rangierfahrt von gleis sechs ne

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:07:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:07:36 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:07:36 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:07:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:07:36 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:07:36 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:07:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:07:36 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:07:36 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:07:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:07:36 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:07:36 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:10:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:10:04 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:10:04 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:10:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:10:04 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:10:04 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:10:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:10:04 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:10:04 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:10:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:10:04 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:10:04 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:12:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:12:36 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:12:36 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:12:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:12:36 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:12:36 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:12:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:12:36 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:12:36 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:12:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:12:36 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:12:36 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:15:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:15:06 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:15:06 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:15:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:15:06 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:15:06 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:15:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:15:06 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:15:06 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:15:06 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:15:06 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:15:06 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=5` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▅▅▅▅▅▅▆▆▆▆▆██████
global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
learning_rate,▁▁▂▂▂▃▃▃▄▄▄▄▅▅▅▆▆▆▇▇▇██
train_loss,██▆▇▄▅▅▄▅▅▃▄▂▄▂▂▂▂▃▃▁▄▂
trainer/global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
training_batch_wer,█▇▆▇▄▆▄▃▅▂▃▂▃▁▁▁▂▂▂
val_loss,█▃▁▁▁
val_wer,█▃▂▁▁

0,1
epoch,4.0
global_step,1185.0
learning_rate,0.0001
train_loss,26.76494
trainer/global_step,1184.0
training_batch_wer,0.22772
val_loss,2.02818
val_wer,0.0235


[34m[1mwandb[0m: Agent Starting Run: ls84oygr with config:
[34m[1mwandb[0m: 	epoch: 7
[34m[1mwandb[0m: 	freq_width: 26.94295643792087
[34m[1mwandb[0m: 	lr: 0.0004201550263381561
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 21:15:59 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 21:15:59 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 21:15:59 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 21:16:05 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 21:16:05 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 21:16:05 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 21:16:05 features:225] PADDING: 16
[NeMo I 2023-01-02 21:16:11 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 21:16:11 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 21:16:11 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:16:11 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 21:16:11 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:16:11 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 21:16:11 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:16:11 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 21:16:12 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0004201550263381561
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 21:16:12 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f83872b8850>" 
    will be used during training (effective maximum steps = 1659) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1659
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:16:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:16:15 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:16:15 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:16:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:16:15 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:16:15 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:16:48 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:16:48 wer_bpe:188] reference:umstellmanöver vom vier via sieben eins ins neun fünf antworten
[NeMo I 2023-01-02 21:16:48 wer_bpe:189] predicted:um wie sie
[NeMo I 2023-01-02 21:17:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:17:15 wer_bpe:188] reference:umstellmanöver vom sechs vier via gleis eins drei nach gleis alpha fünf null antworten
[NeMo I 2023-01-02 21:17:15 wer_bpe:189] predicted:manö vom eins
[NeMo I 2023-01-02 21:17:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:17:43 wer_bpe:188] reference:rangierfahrt von gleis sieben fünf nach victor neun eins antworten
[NeMo I 2023-01-02 21:17:43 wer_bpe:189] predicted:sieben neu
[NeMo I 2023-01-02 21:18:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:18:10 wer_bpe:188] reference:rangierfahrt vom drei vier ins alpha sechs sechs antworten
[NeMo I 2023-01-02 21:18:10 wer_bpe:189] predicted:vier inss


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:18:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:18:34 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:18:34 wer_bpe:189] predicted:schierfahr gleis zwei drei drei drei
[NeMo I 2023-01-02 21:18:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:18:34 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:18:34 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:18:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:18:34 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:18:34 wer_bpe:189] predicted:umstellmaövver vom drei sechs nach gleis exray vier sieben wienul viel an
[NeMo I 2023-01-02 21:18:34 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:18:34 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:18:34 wer_bpe:189] predicted:rangchierfahrt von gleis sechs neun ins gleisdelta si

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:21:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:21:10 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:21:10 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 21:21:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:21:10 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:21:10 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:21:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:21:11 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:21:11 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis x ray vier sieben via null v antworten
[NeMo I 2023-01-02 21:21:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:21:11 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:21:11 wer_bpe:189] predicted:rangierfahrt von gleis s

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:23:39 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:23:39 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:23:39 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:23:39 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:23:39 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:23:39 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:23:39 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:23:39 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:23:39 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:23:39 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:23:39 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:23:39 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:26:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:26:08 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:26:08 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:26:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:26:08 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:26:08 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:26:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:26:09 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:26:09 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:26:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:26:09 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:26:09 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:28:38 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:28:38 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:28:38 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:28:38 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:28:38 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:28:38 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:28:38 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:28:38 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:28:38 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:28:38 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:28:38 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:28:38 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:31:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:31:08 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:31:08 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:31:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:31:08 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:31:08 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:31:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:31:08 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:31:08 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:31:08 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:31:08 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:31:08 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:33:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:33:40 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:33:40 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:33:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:33:40 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:33:40 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:33:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:33:41 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:33:41 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:33:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:33:41 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:33:41 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=7` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇▇██████
global_step,▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇████
learning_rate,▁▁▁▂▂▂▂▃▃▃▃▃▄▄▄▄▅▅▅▅▅▆▆▆▆▆▇▇▇▇███
train_loss,▇█▇▇▆▄▇▄▄▅▂▃▄▃▃▅▁▃▂▂▂▃▃▂▃▁▃▂▂▂▃▄▂
trainer/global_step,▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇████
training_batch_wer,▇█▇▇▆▅▄▅▄▃▄▅▃▂▂▂▂▄▃▁▂▂▂▂▄▂▃
val_loss,█▃▂▁▁▁▁
val_wer,█▃▂▁▁▁▁

0,1
epoch,6.0
global_step,1659.0
learning_rate,7e-05
train_loss,23.26056
trainer/global_step,1658.0
training_batch_wer,0.33945
val_loss,1.84343
val_wer,0.02611


[34m[1mwandb[0m: Agent Starting Run: 6sd4urvp with config:
[34m[1mwandb[0m: 	epoch: 5
[34m[1mwandb[0m: 	freq_width: 27.99271698769651
[34m[1mwandb[0m: 	lr: 0.0014928914135438089
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 21:34:32 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 21:34:32 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 21:34:32 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 21:34:38 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 21:34:39 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 21:34:39 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 21:34:39 features:225] PADDING: 16
[NeMo I 2023-01-02 21:34:45 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 21:34:45 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 21:34:45 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:34:45 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 21:34:45 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:34:45 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 21:34:45 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:34:46 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 21:34:46 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0014928914135438089
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 21:34:47 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f838749b5b0>" 
    will be used during training (effective maximum steps = 1185) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1185
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:34:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:34:50 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:34:50 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:34:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:34:50 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:34:50 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:35:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:35:22 wer_bpe:188] reference:umstellmanöver von gleis neun vier ins gleis null fünf via gleis lima eins acht antworten
[NeMo I 2023-01-02 21:35:22 wer_bpe:189] predicted:um von ins nur gleich ein
[NeMo I 2023-01-02 21:35:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:35:50 wer_bpe:188] reference:umstellmanöver von sechs null via acht vier ins golf eins vier antworten
[NeMo I 2023-01-02 21:35:50 wer_bpe:189] predicted:für wie ja ins ein
[NeMo I 2023-01-02 21:36:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:36:18 wer_bpe:188] reference:rangierfahrt vom gleis null null nach eins eins antworten
[NeMo I 2023-01-02 21:36:18 wer_bpe:189] predicted:rangierlei nun nach ein eins an
[NeMo I 2023-01-02 21:36:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:36:46 wer_bpe:188] reference:umstellmanöver vom drei acht via gleis neun fünf nach echo sieben sieben antworten
[NeMo I 2023-01-02 21:36:46 wer_bpe:189] predicted:uman vom dreiia gleis n

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:37:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:37:09 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:37:09 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 21:37:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:37:09 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:37:09 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:37:09 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:37:09 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:37:09 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis  ray vier sieben via null viel antworten
[NeMo I 2023-01-02 21:37:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:37:10 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:37:10 wer_bpe:189] predicted:rangierfahrt von gleis

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:39:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:39:41 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:39:41 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:39:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:39:41 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:39:41 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:39:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:39:41 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:39:41 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:39:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:39:41 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:39:41 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:42:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:42:11 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:42:11 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:42:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:42:11 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:42:11 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:42:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:42:11 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:42:11 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:42:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:42:11 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:42:11 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:44:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:44:47 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:44:47 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:44:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:44:47 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:44:47 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:44:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:44:47 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:44:47 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:44:48 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:44:48 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:44:48 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:47:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:47:17 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:47:17 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:47:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:47:17 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:47:17 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:47:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:47:17 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:47:17 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:47:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:47:17 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:47:17 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=5` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▅▅▅▅▅▅▆▆▆▆▆██████
global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
learning_rate,▁▁▂▂▂▃▃▃▄▄▄▄▅▅▅▆▆▆▇▇▇██
train_loss,▇██▇▆▅▄▄▂▃▂▃▁▄▂▂▄▃▁▁▂▃▁
trainer/global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
training_batch_wer,███▅▆▃▄▃▃▃▃▄▃▂▂▃▂▁▂
val_loss,█▂▁▁▁
val_wer,█▂▂▁▁

0,1
epoch,4.0
global_step,1185.0
learning_rate,0.00017
train_loss,6.40444
trainer/global_step,1184.0
training_batch_wer,0.24138
val_loss,1.59974
val_wer,0.02089


[34m[1mwandb[0m: Agent Starting Run: 79s6v0an with config:
[34m[1mwandb[0m: 	epoch: 6
[34m[1mwandb[0m: 	freq_width: 27.465425918658777
[34m[1mwandb[0m: 	lr: 0.008246189629441911
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 21:48:27 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 21:48:27 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 21:48:27 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 21:48:32 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 21:48:33 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 21:48:33 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 21:48:33 features:225] PADDING: 16
[NeMo I 2023-01-02 21:48:37 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 21:48:38 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 21:48:38 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:48:38 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 21:48:38 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:48:38 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 21:48:38 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 21:48:38 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 21:48:39 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.008246189629441911
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 21:48:39 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f842c8db820>" 
    will be used during training (effective maximum steps = 1422) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1422
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:48:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:48:41 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:48:41 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:48:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:48:41 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:48:41 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:49:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:49:14 wer_bpe:188] reference:umstellmanöver vom eins acht ins gleis quebec neun zwei via gleis juliet null neun antworten
[NeMo I 2023-01-02 21:49:14 wer_bpe:189] predicted:imstell manö einssbe neu zwei wielei an
[NeMo I 2023-01-02 21:49:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:49:42 wer_bpe:188] reference:rangierfahrt von gleis uniform vier null ins gleis zwei vier antworten
[NeMo I 2023-01-02 21:49:42 wer_bpe:189] predicted:rofahrt vom gleis uniform vier null ins gleis zwei antworten
[NeMo I 2023-01-02 21:50:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:50:10 wer_bpe:188] reference:rangierfahrt vom gleis sechs acht nach gleis acht sechs antworten
[NeMo I 2023-01-02 21:50:10 wer_bpe:189] predicted:rangierfafen g gleich s acht nach gs acht sechs antworten
[NeMo I 2023-01-02 21:50:37 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:50:37 wer_bpe:188] reference:umstellmanöver vom drei neun via foxtrot sechs sechs ins gleis mik

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:51:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:51:01 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:51:01 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:51:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:51:01 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:51:01 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 21:51:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:51:01 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:51:01 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:51:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:51:01 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:51:01 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:53:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:53:41 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:53:41 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antwortenn
[NeMo I 2023-01-02 21:53:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:53:41 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:53:41 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:53:41 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:53:41 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:53:41 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:53:42 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:53:42 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:53:42 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:56:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:56:12 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:56:12 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:56:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:56:12 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:56:12 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:56:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:56:12 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:56:12 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:56:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:56:13 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:56:13 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 21:58:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:58:44 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:58:44 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 21:58:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:58:44 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 21:58:44 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 21:58:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:58:44 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:58:44 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 21:58:44 wer_bpe:187] 
    
[NeMo I 2023-01-02 21:58:44 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 21:58:44 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:01:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:01:18 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:01:18 wer_bpe:189] predicted:rangierfahrt von gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:01:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:01:18 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:01:18 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:01:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:01:18 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:01:18 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:01:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:01:18 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:01:18 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:03:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:03:45 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:03:45 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:03:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:03:45 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:03:45 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:03:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:03:45 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:03:45 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:03:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:03:46 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:03:46 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=6` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▄▄▄▄▄▄▅▅▅▅▅▇▇▇▇▇▇██████
global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▆▇▇▇▇██
train_loss,█▆▅▃▂▂▂▂▂▂▁▂▂▂▂▁▁▂▂▁▂▁▁▁▁▁▂▁
trainer/global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,█▅▅▄▄▂▃▂▂▃▂▃▂▂▂▁▂▂▁▁▂▁▁
val_loss,█▄▄▃▂▁
val_wer,█▂▅▃▂▁

0,1
epoch,5.0
global_step,1422.0
learning_rate,0.00115
train_loss,9.98928
trainer/global_step,1421.0
training_batch_wer,0.09184
val_loss,0.66695
val_wer,0.01305


[34m[1mwandb[0m: Agent Starting Run: 3hlqenfy with config:
[34m[1mwandb[0m: 	epoch: 9
[34m[1mwandb[0m: 	freq_width: 27.07435839084202
[34m[1mwandb[0m: 	lr: 0.0010161776347549047
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 22:04:39 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 22:04:39 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 22:04:39 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 22:04:46 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 22:04:46 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 22:04:46 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 22:04:46 features:225] PADDING: 16
[NeMo I 2023-01-02 22:04:53 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 22:04:53 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 22:04:53 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:04:53 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 22:04:53 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:04:53 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 22:04:53 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:04:53 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 22:04:54 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0010161776347549047
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 22:04:54 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f835e5cbfd0>" 
    will be used during training (effective maximum steps = 2133) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 2133
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:04:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:04:56 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:04:56 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:04:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:04:56 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:04:56 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:05:28 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:05:28 wer_bpe:188] reference:rangierfahrt von gleis vier zwei ins gleis quebec zwei vier antworten
[NeMo I 2023-01-02 22:05:28 wer_bpe:189] predicted:aber vor und ihnslei zwei vier an
[NeMo I 2023-01-02 22:05:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:05:56 wer_bpe:188] reference:rangierfahrt vom tango zwei zwei nach zwei neun antworten
[NeMo I 2023-01-02 22:05:56 wer_bpe:189] predicted:ranggi vom tawar nach war ihn neu an
[NeMo I 2023-01-02 22:06:24 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:06:24 wer_bpe:188] reference:rangierfahrt von gleis yankee eins neun ins null neun antworten
[NeMo I 2023-01-02 22:06:24 wer_bpe:189] predicted:gleis jaki a neun ihns nur neu antwort
[NeMo I 2023-01-02 22:06:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:06:51 wer_bpe:188] reference:rangierfahrt von victor acht null nach gleis neun antworten
[NeMo I 2023-01-02 22:06:51 wer_bpe:189] predicted:ra sie auffahr von wsor acht null nach an


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:07:14 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:07:14 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:07:14 wer_bpe:189] predicted:rangierfahrt vom gleis ma zwei drei ins drei drei al
[NeMo I 2023-01-02 22:07:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:07:15 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:07:15 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:07:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:07:15 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:07:15 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null v antworten
[NeMo I 2023-01-02 22:07:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:07:15 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:07:15 wer_bpe:189] predicted:rangierfahrt von gleis sechs ne

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:09:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:09:43 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:09:43 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:09:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:09:43 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:09:43 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:09:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:09:43 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:09:43 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:09:43 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:09:43 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:09:43 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:12:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:12:18 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:12:18 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:12:18 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:12:18 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:12:18 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:12:19 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:12:19 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:12:19 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:12:19 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:12:19 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:12:19 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:14:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:14:46 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:14:46 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:14:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:14:46 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:14:46 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:14:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:14:47 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:14:47 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:14:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:14:47 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:14:47 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:17:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:17:17 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:17:17 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:17:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:17:17 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:17:17 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:17:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:17:17 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:17:17 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:17:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:17:17 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:17:17 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:19:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:19:50 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:19:50 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:19:50 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:19:50 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:19:50 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:19:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:19:51 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:19:51 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:19:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:19:51 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:19:51 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:22:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:22:20 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:22:20 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:22:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:22:20 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:22:20 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:22:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:22:20 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:22:20 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:22:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:22:20 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:22:20 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:24:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:24:47 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:24:47 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:24:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:24:47 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:24:47 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:24:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:24:47 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:24:47 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:24:48 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:24:48 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:24:48 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:27:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:27:15 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:27:15 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:27:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:27:15 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:27:15 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:27:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:27:15 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:27:15 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:27:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:27:15 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:27:15 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=9` reached.


0,1
epoch,▁▁▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▅▅▅▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇████
global_step,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇▇▇██
train_loss,█▆▅▅▅▄▄▄▅▄▃▃▃▂▃▂▂▂▂▁▁▂▁▂▁▃▁▁▂▁▂▁▁▁▁▁▁▂▁▁
trainer/global_step,▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▆▆▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,██▆▇▅▆▅▄▃▄▃▄▃▂▂▂▂▂▃▂▃▁▁▂▄▂▂▃▃▃▂▁▂▁
val_loss,█▃▂▁▁▁▁▁▁
val_wer,█▃▂▁▁▁▁▁▁

0,1
epoch,8.0
global_step,2133.0
learning_rate,0.00021
train_loss,5.41812
trainer/global_step,2132.0
training_batch_wer,0.04717
val_loss,1.37759
val_wer,0.01828


[34m[1mwandb[0m: Agent Starting Run: 12igiylc with config:
[34m[1mwandb[0m: 	epoch: 6
[34m[1mwandb[0m: 	freq_width: 26.937256308320254
[34m[1mwandb[0m: 	lr: 0.0006051546028578256
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 22:28:14 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 22:28:14 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 22:28:14 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 22:28:20 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 22:28:20 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 22:28:20 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 22:28:20 features:225] PADDING: 16
[NeMo I 2023-01-02 22:28:27 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 22:28:27 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 22:28:27 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:28:27 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 22:28:27 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:28:27 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 22:28:27 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:28:27 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 22:28:28 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0006051546028578256
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 22:28:28 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f836ad7e9d0>" 
    will be used during training (effective maximum steps = 1422) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1422
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:28:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:28:30 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:28:30 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:28:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:28:30 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:28:30 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:29:01 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:29:01 wer_bpe:188] reference:umstellmanöver vom eins eins via gleis quebec acht vier ins neun antworten
[NeMo I 2023-01-02 22:29:01 wer_bpe:189] predicted:um man ja kobelacht
[NeMo I 2023-01-02 22:29:29 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:29:29 wer_bpe:188] reference:er will am donnerstag nicht in die schule gehen
[NeMo I 2023-01-02 22:29:29 wer_bpe:189] predicted:er will am donnerstag nicht indej
[NeMo I 2023-01-02 22:29:56 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:29:56 wer_bpe:188] reference:rangierfahrt vom quebec fünf nach alpha zwei null antworten
[NeMo I 2023-01-02 22:29:56 wer_bpe:189] predicted:der aber
[NeMo I 2023-01-02 22:30:24 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:30:24 wer_bpe:188] reference:rangierfahrt von eins fünf ins gleis sechs sieben antworten
[NeMo I 2023-01-02 22:30:24 wer_bpe:189] predicted:rao einsh


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:30:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:30:47 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:30:47 wer_bpe:189] predicted:fr schierfahrt von gleis ma zwei drei in drei drei
[NeMo I 2023-01-02 22:30:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:30:47 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:30:47 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:30:48 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:30:48 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:30:48 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null viel antworten
[NeMo I 2023-01-02 22:30:48 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:30:48 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:30:48 wer_bpe:189] predicted:rangierfahrt von gleis sechs n

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:33:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:33:16 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:33:16 wer_bpe:189] predicted:rangierfahrt vom gleis miig zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:33:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:33:17 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:33:17 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:33:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:33:17 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:33:17 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null v antworten
[NeMo I 2023-01-02 22:33:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:33:17 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:33:17 wer_bpe:189] predicted:rangierfahrt von gleis 

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:35:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:35:46 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:35:46 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:35:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:35:46 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:35:46 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:35:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:35:46 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:35:46 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:35:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:35:46 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:35:46 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:38:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:38:16 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:38:16 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:38:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:38:16 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:38:16 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:38:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:38:17 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:38:17 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:38:17 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:38:17 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:38:17 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:40:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:40:45 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:40:45 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:40:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:40:45 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:40:45 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:40:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:40:45 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:40:45 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:40:45 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:40:45 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:40:45 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:43:12 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:43:13 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:43:13 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:43:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:43:13 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:43:13 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:43:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:43:13 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:43:13 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:43:13 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:43:13 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:43:13 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=6` reached.


0,1
epoch,▁▁▁▁▁▂▂▂▂▂▂▄▄▄▄▄▄▅▅▅▅▅▇▇▇▇▇▇██████
global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
learning_rate,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▆▇▇▇▇██
train_loss,▇▇█▇▆▅▅▄▄▆▄▄▃▃▃▂▂▂▂▃▂▁▂▃▁▁▂▁
trainer/global_step,▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▅▅▅▅▆▆▆▆▆▇▇▇▇▇███
training_batch_wer,███▇▆▅▅▄▃▄▃▂▄▂▁▂▃▅▂▁▁▁▂
val_loss,█▃▂▁▁▁
val_wer,█▃▂▁▁▁

0,1
epoch,5.0
global_step,1422.0
learning_rate,8e-05
train_loss,14.81412
trainer/global_step,1421.0
training_batch_wer,0.22472
val_loss,1.7354
val_wer,0.02611


[34m[1mwandb[0m: Agent Starting Run: 94cw7jb6 with config:
[34m[1mwandb[0m: 	epoch: 4
[34m[1mwandb[0m: 	freq_width: 27.818941161126755
[34m[1mwandb[0m: 	lr: 0.0016149446743489088
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 22:44:04 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 22:44:04 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 22:44:04 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 22:44:11 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 22:44:11 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 22:44:11 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 22:44:11 features:225] PADDING: 16
[NeMo I 2023-01-02 22:44:17 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 22:44:17 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 22:44:17 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:44:18 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 22:44:18 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:44:18 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 22:44:18 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:44:18 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 22:44:18 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0016149446743489088
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 22:44:18 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f842c6b8700>" 
    will be used during training (effective maximum steps = 948) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 948
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:44:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:44:21 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:44:21 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:44:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:44:21 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:44:21 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:44:53 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:44:53 wer_bpe:188] reference:rangierfahrt von gleis mike acht zwei nach gleis juliet null drei antworten
[NeMo I 2023-01-02 22:44:53 wer_bpe:189] predicted:sch zwei nochli
[NeMo I 2023-01-02 22:45:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:45:21 wer_bpe:188] reference:umstellmanöver von vier null ins gleis drei via whisky zwei neun antworten
[NeMo I 2023-01-02 22:45:21 wer_bpe:189] predicted:vierno ihnsglei wie ja michskit z zwei neu an
[NeMo I 2023-01-02 22:45:49 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:45:49 wer_bpe:188] reference:umstellmanöver von gleis vier drei via gleis drei neun ins vier sieben antworten
[NeMo I 2023-01-02 22:45:49 wer_bpe:189] predicted:umstellma vor sei vier dreiia gleis drei neun in vieria sieben antworten
[NeMo I 2023-01-02 22:46:16 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:46:16 wer_bpe:188] reference:verstellmanöver vom zwei fünf vier ins neun sieben antworten
[NeMo I 2023-01-02 22:46:16

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:46:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:46:40 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:46:40 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 22:46:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:46:40 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:46:40 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:46:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:46:40 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:46:40 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis  ray vier sieben via null v antworten
[NeMo I 2023-01-02 22:46:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:46:40 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:46:40 wer_bpe:189] predicted:rangierfahrt von gleis se

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:49:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:49:10 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:49:10 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:49:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:49:10 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:49:10 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:49:10 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:49:10 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:49:10 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:49:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:49:11 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:49:11 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:51:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:51:40 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:51:40 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:51:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:51:40 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:51:40 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:51:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:51:40 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:51:40 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:51:40 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:51:40 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:51:40 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:54:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:54:11 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:54:11 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:54:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:54:11 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:54:11 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 22:54:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:54:11 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:54:11 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:54:11 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:54:12 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:54:12 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=4` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▆▆▆▆▆▆█████
global_step,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▆▆▆▆▇▇██
learning_rate,▁▁▂▂▃▃▃▄▄▅▅▆▆▆▇▇██
train_loss,█▇▅▄▂▃▃▁▆▃▂▂▃▁▂▃▁▁
trainer/global_step,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▆▆▆▆▇▇██
training_batch_wer,█▇▇▅▂▄▄▂▁▃▃▂▂▂▂
val_loss,█▃▁▁
val_wer,█▃▂▁

0,1
epoch,3.0
global_step,948.0
learning_rate,0.00015
train_loss,18.41476
trainer/global_step,947.0
training_batch_wer,0.25882
val_loss,1.57898
val_wer,0.01567


[34m[1mwandb[0m: Sweep Agent: Waiting for job.
[34m[1mwandb[0m: Job received.
[34m[1mwandb[0m: Agent Starting Run: vi3396za with config:
[34m[1mwandb[0m: 	epoch: 5
[34m[1mwandb[0m: 	freq_width: 25.44177623876992
[34m[1mwandb[0m: 	lr: 0.0007388525764681137
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 22:55:10 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 22:55:10 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 22:55:10 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 22:55:16 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 22:55:16 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 22:55:16 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 22:55:16 features:225] PADDING: 16
[NeMo I 2023-01-02 22:55:23 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 22:55:24 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 22:55:24 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:55:24 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 22:55:24 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:55:24 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 22:55:24 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 22:55:24 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 22:55:24 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0007388525764681137
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 22:55:24 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f835ecd27f0>" 
    will be used during training (effective maximum steps = 1185) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1185
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:55:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:55:27 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:55:27 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:55:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:55:27 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:55:27 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:56:00 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:56:00 wer_bpe:188] reference:rangierfahrt von gleis sieben neun nach sechs fünf antworten
[NeMo I 2023-01-02 22:56:00 wer_bpe:189] predicted:an einlei sieben
[NeMo I 2023-01-02 22:56:27 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:56:27 wer_bpe:188] reference:rangierfahrt von alpha zwei sieben sieben nach oscar null neun fünf
[NeMo I 2023-01-02 22:56:27 wer_bpe:189] predicted:ied auch sie nach
[NeMo I 2023-01-02 22:56:55 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:56:55 wer_bpe:188] reference:der film wurde in england und portugal gedreht
[NeMo I 2023-01-02 22:56:55 wer_bpe:189] predicted:der undportuggal ge
[NeMo I 2023-01-02 22:57:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:57:23 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:57:23 wer_bpe:189] predicted:um gleiissx sieben wie ja vier


Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 22:57:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:57:46 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 22:57:46 wer_bpe:189] predicted:roierfahrt vom gleis ma zwei drei in drei drei als
[NeMo I 2023-01-02 22:57:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:57:46 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 22:57:46 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 22:57:46 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:57:46 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 22:57:46 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis exray vier sieben via null viel antworten
[NeMo I 2023-01-02 22:57:47 wer_bpe:187] 
    
[NeMo I 2023-01-02 22:57:47 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 22:57:47 wer_bpe:189] predicted:rangierfahrt von gleis sechs n

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:00:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:00:15 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:00:15 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:00:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:00:15 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:00:15 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 23:00:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:00:15 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:00:15 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:00:15 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:00:15 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:00:15 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:02:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:02:52 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:02:52 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:02:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:02:52 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:02:52 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 23:02:53 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:02:53 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:02:53 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:02:53 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:02:53 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:02:53 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:05:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:05:22 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:05:22 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:05:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:05:22 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:05:22 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 23:05:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:05:23 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:05:23 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:05:23 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:05:23 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:05:23 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:07:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:07:52 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:07:52 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:07:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:07:52 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:07:52 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 23:07:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:07:52 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:07:52 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:07:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:07:52 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:07:52 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=5` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▅▅▅▅▅▅▆▆▆▆▆██████
global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
learning_rate,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▅▆▆▆▇▇▇██
train_loss,██▅▆▄▃▃▃▄▃▂▃▂▂▂▁▂▂▁▂▁▁▃
trainer/global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
training_batch_wer,██▇▆▅▃▄▄▃▃▃▂▁▃▂▁▂▂▁
val_loss,█▃▁▁▁
val_wer,█▃▂▁▁

0,1
epoch,4.0
global_step,1185.0
learning_rate,8e-05
train_loss,47.07915
trainer/global_step,1184.0
training_batch_wer,0.12987
val_loss,2.01184
val_wer,0.02611


[34m[1mwandb[0m: Agent Starting Run: sei60vld with config:
[34m[1mwandb[0m: 	epoch: 5
[34m[1mwandb[0m: 	freq_width: 26.385198630166737
[34m[1mwandb[0m: 	lr: 0.0018579550558574696
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 23:08:48 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 23:08:48 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 23:08:48 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 23:08:53 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 23:08:54 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 23:08:54 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 23:08:54 features:225] PADDING: 16
[NeMo I 2023-01-02 23:09:00 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 23:09:00 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 23:09:00 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 23:09:00 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 23:09:00 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 23:09:00 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 23:09:00 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 23:09:00 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 23:09:01 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.0018579550558574696
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 23:09:01 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f835e759ac0>" 
    will be used during training (effective maximum steps = 1185) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 1185
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:09:03 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:09:03 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:09:03 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:09:04 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:09:04 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:09:04 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:09:36 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:09:36 wer_bpe:188] reference:umstellmanöver vom eins acht ins gleis quebec neun zwei via gleis juliet null neun antworten
[NeMo I 2023-01-02 23:09:36 wer_bpe:189] predicted:um manö einsleis g neu zwei noch neu an
[NeMo I 2023-01-02 23:10:03 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:10:03 wer_bpe:188] reference:umstellmanöver vom gleis eins eins ins gleis golf drei zwei via gleis sierra eins neun antworten
[NeMo I 2023-01-02 23:10:03 wer_bpe:189] predicted:umstellmas einss grollf drei zwei wie eins neu an
[NeMo I 2023-01-02 23:10:30 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:10:30 wer_bpe:188] reference:umstellmanöver vom hotel acht zwei nach zwei sieben via golf sechs acht antworten
[NeMo I 2023-01-02 23:10:30 wer_bpe:189] predicted:umstellen hotel acht zwei sieben via goldolf sechs acht antworten
[NeMo I 2023-01-02 23:10:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:10:58 wer_bpe:188] reference:umstellmanöver von gleis nu

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:11:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:11:22 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:11:22 wer_bpe:189] predicted:rangierfahrt vom gleis maig zwei drei ins drei drei antwort
[NeMo I 2023-01-02 23:11:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:11:22 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:11:22 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 23:11:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:11:22 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:11:22 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null v antworten
[NeMo I 2023-01-02 23:11:22 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:11:22 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:11:22 wer_bpe:189] predicted:rangierfahrt von gleis se

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:13:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:13:51 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:13:51 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:13:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:13:51 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:13:51 wer_bpe:189] predicted:sprach eingabe
[NeMo I 2023-01-02 23:13:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:13:51 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:13:51 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:13:51 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:13:51 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:13:51 wer_bpe:189] predicted:rangierfahrt von gle

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:16:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:16:21 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:16:21 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:16:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:16:21 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:16:21 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 23:16:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:16:21 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:16:21 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:16:21 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:16:21 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:16:21 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:18:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:18:52 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:18:52 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:18:52 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:18:52 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:18:52 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 23:18:53 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:18:53 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:18:53 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:18:53 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:18:53 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:18:53 wer_bpe:189] predicted:rangierfahrt von glei

Validation: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:21:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:21:20 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:21:20 wer_bpe:189] predicted:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:21:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:21:20 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:21:20 wer_bpe:189] predicted:spracheingabe
[NeMo I 2023-01-02 23:21:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:21:20 wer_bpe:188] reference:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:21:20 wer_bpe:189] predicted:umstellmanöver vom drei sechs nach gleis xray vier sieben via null vier antworten
[NeMo I 2023-01-02 23:21:20 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:21:20 wer_bpe:188] reference:rangierfahrt von gleis sechs neun ins gleis delta sieben antworten
[NeMo I 2023-01-02 23:21:20 wer_bpe:189] predicted:rangierfahrt von glei

`Trainer.fit` stopped: `max_epochs=5` reached.


0,1
epoch,▁▁▁▁▁▃▃▃▃▃▃▅▅▅▅▅▅▆▆▆▆▆██████
global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
learning_rate,▁▁▂▂▂▃▃▃▄▄▄▅▅▅▅▆▆▆▇▇▇██
train_loss,█▅▄▆▂▅▃▅▂▂▃▂▂▁▁▂▁▂▂▃▂▁▂
trainer/global_step,▁▁▂▂▂▂▃▃▃▃▄▄▄▄▅▅▅▅▆▆▆▇▇▇▇▇██
training_batch_wer,█▆▅▆▄▃▃▂▃▃▁▃▂▂▁▂▁▁▂
val_loss,█▂▂▁▁
val_wer,█▂▁▁▁

0,1
epoch,4.0
global_step,1185.0
learning_rate,0.00021
train_loss,26.38791
trainer/global_step,1184.0
training_batch_wer,0.1978
val_loss,1.25338
val_wer,0.02089


[34m[1mwandb[0m: Agent Starting Run: typlne0m with config:
[34m[1mwandb[0m: 	epoch: 9
[34m[1mwandb[0m: 	freq_width: 28.464764025774773
[34m[1mwandb[0m: 	lr: 0.00018272697741051136
Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


      rank_zero_warn(
    
      rank_zero_deprecation(
    
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


[NeMo I 2023-01-02 23:22:11 cloud:56] Found existing object /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 23:22:11 cloud:62] Re-using file from: /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo
[NeMo I 2023-01-02 23:22:11 common:910] Instantiating model from pre-trained checkpoint
[NeMo I 2023-01-02 23:22:18 mixins:170] Tokenizer SentencePieceTokenizer initialized with 1024 tokens


[NeMo W 2023-01-02 23:22:18 modelPT:142] If you intend to do training or fine-tuning, please call the ModelPT.setup_training_data() method and provide a valid configuration file to setup the train data loader.
    Train config : 
    manifest_filepath: /data/train/tarred_audio_manifest.json
    sample_rate: 16000
    batch_size: 32
    trim_silence: false
    max_duration: 35.0
    shuffle: true
    is_tarred: true
    tarred_audio_filepaths: /data/train/audio__OP_0..1023_CL_.tar
    use_start_end_token: false
    shuffle_n: 1024
    num_workers: 16
    pin_memory: true
    
[NeMo W 2023-01-02 23:22:18 modelPT:149] If you intend to do validation, please call the ModelPT.setup_validation_data() or ModelPT.setup_multiple_validation_data() method and provide a valid configuration file to setup the validation data loader(s). 
    Validation config : 
    manifest_filepath:
    - /data/voxpopuli_de/dev/voxpopuli_dev_manifest.json
    - /data/voxpopuli_de/test/voxpopuli_test_manifest.json
  

[NeMo I 2023-01-02 23:22:18 features:225] PADDING: 16
[NeMo I 2023-01-02 23:22:23 save_restore_connector:243] Model EncDecCTCModelBPE was successfully restored from /home/user/.cache/torch/NeMo/NeMo_1.12.0/stt_de_citrinet_1024/8743e4cecb8017ca2b49a035e07b2893/stt_de_citrinet_1024.nemo.
[NeMo I 2023-01-02 23:22:23 collections:194] Dataset loaded with 1890 files totalling 7.41 hours
[NeMo I 2023-01-02 23:22:23 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 23:22:23 collections:194] Dataset loaded with 34 files totalling 0.13 hours
[NeMo I 2023-01-02 23:22:23 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 23:22:23 collections:194] Dataset loaded with 34 files totalling 0.14 hours
[NeMo I 2023-01-02 23:22:23 collections:195] 0 files were filtered totalling 0.00 hours
[NeMo I 2023-01-02 23:22:23 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08


LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]


[NeMo I 2023-01-02 23:22:24 modelPT:597] Optimizer config = Novograd (
    Parameter Group 0
        amsgrad: False
        betas: [0.8, 0.25]
        eps: 1e-08
        grad_averaging: False
        lr: 0.00018272697741051136
        weight_decay: 0.001
    )
[NeMo I 2023-01-02 23:22:24 lr_scheduler:910] Scheduler "<nemo.core.optim.lr_scheduler.CosineAnnealing object at 0x7f836a36fd00>" 
    will be used during training (effective maximum steps = 2133) - 
    Parameters : 
    (warmup_steps: 10000
    warmup_ratio: null
    min_lr: 1.0e-05
    last_epoch: -1
    max_steps: 2133
    )



  | Name              | Type                              | Params
------------------------------------------------------------------------
0 | preprocessor      | AudioToMelSpectrogramPreprocessor | 0     
1 | encoder           | ConvASREncoder                    | 140 M 
2 | decoder           | ConvASRDecoder                    | 1.1 M 
3 | loss              | CTCLoss                           | 0     
4 | spec_augmentation | SpectrogramAugmentation           | 0     
5 | _wer              | WERBPE                            | 0     
------------------------------------------------------------------------
141 M     Trainable params
0         Non-trainable params
141 M     Total params
564.897   Total estimated model params size (MB)


Sanity Checking: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:22:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:22:26 wer_bpe:188] reference:rangierfahrt vom gleis mike zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:22:26 wer_bpe:189] predicted:prongierfahrt vom gleis maik zwei drei ins drei drei antworten
[NeMo I 2023-01-02 23:22:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:22:26 wer_bpe:188] reference:spracheingabe
[NeMo I 2023-01-02 23:22:26 wer_bpe:189] predicted:spracheingabe


Training: 0it [00:00, ?it/s]

[NeMo I 2023-01-02 23:22:58 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:22:58 wer_bpe:188] reference:rangierfahrt von eins sieben nach gleis fünf antworten
[NeMo I 2023-01-02 23:22:58 wer_bpe:189] predicted:
[NeMo I 2023-01-02 23:23:26 wer_bpe:187] 
    
[NeMo I 2023-01-02 23:23:26 wer_bpe:188] reference:rangierfahrt von alpha zwei sieben sieben nach oscar null neun fünf
[NeMo I 2023-01-02 23:23:26 wer_bpe:189] predicted:fort zwei sie nach aus
