Combined Finnish: Finnish Parliament and Lahjoita Puhetta

Data prep

Look in run.sh and in local/ for the dataprep. This repository contains useful snippets for prepping Lahjoita Puhetta and Finnish Parliament Data alone, too.

HMM systems

See run.sh

The basic HMM/GMM recipe outline is taken from Librispeech. Then, DNN acoustic models are trained in SpeechBrain.

For an example of simple batch transcription, see transcribe-hmmdnn-basic.sh

AED models

See run-attn.sh

wav2vec 2.0

There are basic outlines for training wav2vec 2.0 models, copied from earlier experiments we did on Librispeech. However, the basic configuration did not produce good results, and we left the experiments there, as this data size is already very demanding, even without huge wav2vec 2.0 Encoders.

Further work would almost certainly find improvements with large SSL Transformer-based models though.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
conf		conf
hyperparams		hyperparams
local		local
README.md		README.md
cmd.sh		cmd.sh
compute_perplexities.sh		compute_perplexities.sh
path.sh		path.sh
run-2.sh		run-2.sh
run-attn-conformer.sh		run-attn-conformer.sh
run-attn-w2v2.sh		run-attn-w2v2.sh
run-attn.sh		run-attn.sh
run-hmm-conformer.sh		run-hmm-conformer.sh
run-scoring-again.sh		run-scoring-again.sh
run-w2v2.sh		run-w2v2.sh
run.sh		run.sh
steps		steps
transcribe-hmmdnn-basic.sh		transcribe-hmmdnn-basic.sh
transcribe-one-wav.sh		transcribe-one-wav.sh
utils		utils

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Combined Finnish: Finnish Parliament and Lahjoita Puhetta

Data prep

HMM systems

AED models

wav2vec 2.0

About

Releases

Packages

Languages

aalto-speech/fin-parl-lahjoita-puhetta-s5

Folders and files

Latest commit

History

Repository files navigation

Combined Finnish: Finnish Parliament and Lahjoita Puhetta

Data prep

HMM systems

AED models

wav2vec 2.0

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages