(click here to read the README in English)
Mae'r project yma yn darparu amgylchedd Docker sy'n hwyluso hyfforddi modelau acwsteg ar gyfer wireddu adnabod lleferydd Cymraeg gyda'r llyfrgell coqui-stt (fersiwn 1.4)
Defnyddir data gan project Mozilla Common Voice ar gyfer hyfforddi'r modelau acwsteg.
Mae'r project hefyd yn cynnwys modd hyfforddi model iaith KenLM Cymraeg mwyn gwella canlyniadau yn sylweddol, yn enwedig ar gyfer yr ap cynorthwydd digidol Macsen.
Mae'r project yn ogystal yn cynnwys modd i chi defnyddio modelau eich hunain neu modelau sydd eisoes wedi eu hyfforddi gan yr Uned Technolegau Iaith ym Mhrifysgol Bangor yn lleol ar gyfrifiadur eich hunain neu eu gweini arlein dros API syml.
Diolch i'r cwmniau, sefydliadau ac unigolion canlynol sydd wedi ein helpu i wireddu datrysiad adnabod lleferydd mor effeithiol..
- Mozilla a phawb sydd wedi cyfrannu yn hael ac yn wirfoddol drwy gwefan Common Voice, yn enwedig i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i'r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o'r ymgyrchoedd hyn, ac hefyd i Lywodraeth Cymru.
- coqui-stt (https://coqui.ai/code)
- KenLM : (https://github.com/kpu/kenlm)