Ffeiliau ar gyfer adnabod lleferydd Cymraeg drwy Julius | Files for realising Welsh speech recognition with Julius
Branch: master
Clone or download
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
audio_test/001 modelau acwstig 16kHz acoustic models Jul 3, 2017
osx Rhedeg Macsen ar OS X Jan 31, 2016
.gitignore cwestiynau ac orchmynion syml ~ simple questions and commands Jan 13, 2016
CEFNDIR.md Update CEFNDIR.md Jan 19, 2016
LICENSE
README.md dogfennaeth OS X Jan 31, 2016
README_en.md dogfennaeth OS X Jan 31, 2016
compile.sh cynyddu'r nifer o gwestiynau bosib i 5000 Mar 29, 2018
julius-dictate.jconf
julius-osx.jconf Rhedeg Macsen ar OS X Jan 31, 2016
julius.grammar cynyddu'r nifer o gwestiynau bosib i 5000 Mar 29, 2018
julius.jconf modelau acwstig 16kHz acoustic models Jul 3, 2017
julius.voca cynyddu'r nifer o gwestiynau bosib i 5000 Mar 29, 2018
juliusTestOutput modelau acwstig 16kHz acoustic models Jul 3, 2017
macsen ychwanegu adnabod lleferydd arddweud cychwynol / prototype dictation … Mar 15, 2016
requirements.txt Rhedeg Macsen ar OS X Jan 31, 2016
setup-osx.sh Does dim wget ar OS X Feb 5, 2016
setup.sh
start-julius-dictate.sh ychwanegu adnabod lleferydd arddweud cychwynol / prototype dictation … Mar 15, 2016
start-julius.py
test.sh profi modelau o fewn Julius / test models within Julius Feb 1, 2016
wavlist

README.md

julius-cy

Adnabod Lleferydd Cymraeg ar gyfer Julius / Welsh Speech Recognition for Julius

(Click Here for English README)

Mae Julius yn feddalwedd adnabod lleferydd LVCSR (large vocabulary speech recognition) cod agored. Yma ceir ffeiliau a sgriptiau yn ogystal â dogfennaeth ar gyfer addasu Julius i ddarparu adnabod lleferydd Cymraeg.

Mae'r fersiwn cyntaf i'w ryddhau yn galluogi Julius i adnabod cwestiynau a gorchmynion Cymraeg syml ynghylch y tywydd, newyddion, amser, cerddoriaeth yn ogystal â gofyn am jôc neu ddihareb Cymraeg yn unig. Golyga hyn bod julius-cy yn cyfyngu'r defnyddiwr i lefaru brawddegau a geirfa benodol:

e.e.

  • "BETH YDY'R TYWYDD HEDDIW?"
  • "BETH YW TYWYDD YFORY?"
  • "BETH YW'R NEWYDDION?"
  • "FAINT O'R GLOCH YDY HI?"
  • "CHWARAEA GERDDORIAETH CYMRAEG"

Bydd fersiynau o julius-cy yn y dyfodol yn ceisio cynorthwyo nodweddion arddweud ac adnabod lleferydd mwy rhydd.

Gosod julius-cy ar eich gyfrifiadur

Bydd angen cyfrifiadur gyda system weithredu Linux fel Ubuntu neu Raspberry Pi ar gyfer y cyfarwyddiadau canlynol ar gyfer gosod adnabod lleferydd Cymraeg julius-cy ar eich cyfrifiadur:

NODER: Cewch hefyd gosod julius-cy ar Mac OS X try defnyddio'r sgript setup sydd yn gorffen efo -osx (setup-osx.sh). Cyn rhedeg y sgript yma, mae angen i chi gosod XCode ar eich cyrfifiadur.

$ git clone https://github.com/techiaith/julius-cy.git
$ cd julius-cy
$ ./setup.sh

Bydd y camau hyn yn gosod meddalwedd sylfaenol Julius ar eich cyfrifiadur yn ogystal â llwytho i lawr a gosod y ffeiliau pellach sydd yn ei addasu ar gyfer cynorthwyo’r Gymraeg.

Cychwyn julius-cy

Defnyddiwch y camau canlynol i'w rhoi ar waith o fewn eich amgylchedd:

$ ./compile.sh

Bydd y sgript yn rhestru'r brawddegau y bydd julius-cy yn gallu'u hadnabod:

pi@raspberrypi:~/src/julius-cy $ ./compile.sh 
julius.grammar has 21 rules
julius.voca    has 28 categories and 39 words
---
Now parsing grammar file
Now modifying grammar to minimize states[8]
Now parsing vocabulary file
Now making nondeterministic finite automaton[37/37]
Now making deterministic finite automaton[36/36] 
Now making triplet list[36/36]
28 categories, 36 nodes, 49 arcs
-> minimized: 22 nodes, 35 arcs
---
generated: julius.dfa julius.term julius.dict
Reading in term file (optional)...done
  BETH FYDD TYWYDD FORY 
  BETH FYDD TYWYDD YFORY 
  BETH OEDD NEWYDDION DDOE 
  BETH OEDD PENAWDAU DDOE 
  BETH OEDD Y NEWYDDION DDOE 
  BETH OEDD Y PENAWDAU DDOE 
  BETH YDY'R NEWYDDION 
  BETH YDY'R PENAWDAU 
  BETH YDY'R TYWYDD FORY 
  BETH YDY'R TYWYDD HEDDIW 
  BETH YDY'R TYWYDD YFORY 
  BETH YW TYWYDD FORY 
  BETH YW TYWYDD HEDDIW 
  BETH YW TYWYDD YFORY 
  BETH YW'R NEWYDDION 
  BETH YW'R NEWYDDION HEDDIW 
  BETH YW'R PENAWDAU 
  BETH YW'R PENAWDAU HEDDIW 
  BETH YW'R TYWYDD FORY 
  BETH YW'R TYWYDD HEDDIW 
  BETH YW'R TYWYDD YFORY 
  CHWARAEA FIWSIG 
  CHWARAEA FIWSIG ARAF 
  CHWARAEA FIWSIG CYMRAEG 
  CHWARAEA FIWSIG DAWNSIO 
  CHWARAEA FIWSIG HAPUS 
  CHWARAEA FIWSIG ROC 
  CHWARAEA GERDDORIAETH 
  CHWARAEA GERDDORIAETH ARAF 
  CHWARAEA GERDDORIAETH CYMRAEG 
  CHWARAEA GERDDORIAETH DAWNSIO 
  CHWARAEA GERDDORIAETH HAPUS 
  CHWARAEA GERDDORIAETH ROC 
  DISTAWA 
  DYWEDA DIHAREB 
  DYWEDA JÔC 
  FAINT O'R GLOCH YDY HI 
  FAINT O'R GLOCH YW HI 
  MACSEN 
  RHO DIHAREB 
----- 
28 categories, 39 words
DFA has 22 nodes and 35 arcs
Stat: init_voca: read 39 words
no further sentence in the last 300 trial

Rhedeg julius-cy

Cysylltwch feicroffon i'ch cyfrifiadur a rhedwch y rhaglen syml Python ganlynol:

$ python julius-cy.py

Llefarwch unrhyw un o'r brawddegau uchod i'r meicroffon. Dylai'r testun mae julius-cy yn credu ei fod wedi'i adnabod ymddangos ar y sgrin.

Rhybudd

Gan mae fersiwn cynnar o'r modelau acwstig sydd gennym, mae'n bosib na fydd julius-cy yn adnabod lleisiau rhai unigolion yn llwyddiannus. Os nad ydych chi eisoes wedi cyfrannu eich llais i'n Corpws Lleferydd Paldaruo, yna defnyddiwch ein ap (http://techiaith.bangor.ac.uk/paldaruo) ar unrhyw ddyfais iOS neu Android er mwyn i ni wella'r modelau acwstig gyda'ch llais chi. Darllenwch y cefndir am ragor

Diolch yn fawr!!