Közzéteszi: Horváth Iván (főszerkesztő), Fuchs Anna (szerkesztő), Bognár Péter, Buda Borbála Sára, Devescovi Balázs, Golden Dániel (sajtó alá rendezők), Király Péter (programozó).
1.0. kiadás, 2012.
Jelen project egy "qqq-kódolással" készült MS Word (.docx) állományból Perl és XSLT segitségével TEI XML és HTML állományokat készit.
- Java futtató környezet
- Perl futtató környezet
- SAXON9 XSLT könyvtár (Saxon-HE-9.*.jar)
A program alapértelmezésben a Maven könyvtárában keresi a Saxon-t, de ezt a bash szkriptekben át lehet irni.
A .docx állomány egy zippel tömöritett könyvtárrendszer, amiben külön-külön félokban található a főszöveg, a jegyzetek, stiluslapok stb.
Első lépésben ki kell csomagolni a fájlt a wordxml
könyvtárba:
unzip 2012-04-29-JA.docx -d wordxml
Word -> TEI konverzió:
./ja2tei.sh
TEI XML -> HTML konverzió:
./tei2html.sh