Skip to content

Commit

Permalink
use downloaded data instead of github data
Browse files Browse the repository at this point in the history
  • Loading branch information
redpony committed Jun 17, 2015
1 parent 1925994 commit dfdb5e0
Show file tree
Hide file tree
Showing 3 changed files with 169 additions and 2 deletions.
4 changes: 2 additions & 2 deletions compound-split/cdec-de.ini
Expand Up @@ -2,5 +2,5 @@ formalism=csplit
intersection_strategy=full
weights=de/weights.trained
#weights=de/weights.noun-only-1best-only
feature_function=CSplit_BasicFeatures de/large_dict.de.gz de/badlist.de.gz de/wordlist.de
feature_function=CSplit_ReverseCharLM de/charlm.rev.5gm.de.lm.gz
feature_function=CSplit_BasicFeatures csplit-data-01/de/large_dict.de.gz de/badlist.de de/wordlist.de
feature_function=CSplit_ReverseCharLM csplit-data-01/de/charlm.rev.5gm.de.lm.gz
163 changes: 163 additions & 0 deletions compound-split/de/badlist.de
@@ -0,0 +1,163 @@
land
wider
igen
iger
iges
igem
fort
ismus
ismen
hint
trans
tran
abge
nische
nischen
ende
endes
endem
ender
ender
enden
entsch
dis
nahmen
nahme
nahm
ent
bew
ins
beb
beg
ber
dra
kung
kungs
kungen
ige
bei
stische
stisches
stischen
stischem
stischer
istisch
istische
istisches
istischen
istischem
istischer
istisch
tungen
bis
tung
tungs
zuer
zuver
zuent
zusam
aber
ange
aufge
ausge
vorge
einge
aufzu
auszu
vorzu
einzu
zusammenzu
zus
zum
zur
anzu
zusammenge
ante
anten
arm
chung
chungen
chungs
den
dich
dir
doch
ihr
hung
hungen
hungs
der
die
das
dem
den
denen
nen
nis
nisse
ieren
iert
eien
erei
ser
min
eit
eiten
ereien
niss
eine
einen
gern
hung
and
her
per
gege
ges
sch
hes
ger
ber
dat
ter
ler
ner
mer
ver
zer
gen
hang
hat
heit
heiten
igkeits
igkeit
igkeiten
keit
keiten
kom
lich
liche
liches
lichen
lichste
lichsten
licher
losigkeit
men
mich
mir
mut
nen
nung
sich
ten
ung
ungen
ungs
voll
vom
von
yes
schaft
what
4 changes: 4 additions & 0 deletions compound-split/install-data-deps.sh
Expand Up @@ -3,7 +3,11 @@ set -e

data_version=csplit-data-01.tar.gz

ROOTDIR=`dirname $0`
cd $ROOTDIR

curl -f http://demo.clab.cs.cmu.edu/cdec/$data_version -o $data_version

tar xzf $data_version
rm -f $data_version

0 comments on commit dfdb5e0

Please sign in to comment.