Skip to content

Hyfforddi a defnyddio modelau adnabod lleferydd Cymraeg coqui-stt a KenLM // Train and use coqui-stt and KenLM based Welsh language speech recognition models.

License

Notifications You must be signed in to change notification settings

techiaith/docker-coqui-stt-cy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

docker-coqui-stt-cy

(click here to read the README in English)

Hyfforddi Modelau

Mae'r project yma yn darparu amgylchedd Docker sy'n hwyluso hyfforddi modelau acwsteg ar gyfer wireddu adnabod lleferydd Cymraeg gyda'r llyfrgell coqui-stt (fersiwn 1.4)

Defnyddir data gan project Mozilla Common Voice ar gyfer hyfforddi'r modelau acwsteg.

Mae'r project hefyd yn cynnwys modd hyfforddi model iaith KenLM Cymraeg mwyn gwella canlyniadau yn sylweddol, yn enwedig ar gyfer yr ap cynorthwydd digidol Macsen.

Gweinydd Adnabod Lleferydd

Mae'r project yn ogystal yn cynnwys modd i chi defnyddio modelau eich hunain neu modelau sydd eisoes wedi eu hyfforddi gan yr Uned Technolegau Iaith ym Mhrifysgol Bangor yn lleol ar gyfrifiadur eich hunain neu eu gweini arlein dros API syml.

Diolchiadau

Diolch i'r cwmniau, sefydliadau ac unigolion canlynol sydd wedi ein helpu i wireddu datrysiad adnabod lleferydd mor effeithiol..

  • Mozilla a phawb sydd wedi cyfrannu yn hael ac yn wirfoddol drwy gwefan Common Voice, yn enwedig i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i'r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o'r ymgyrchoedd hyn, ac hefyd i Lywodraeth Cymru.
  • coqui-stt (https://coqui.ai/code)
  • KenLM : (https://github.com/kpu/kenlm)