Permalink
Browse files

new text pool version

  • Loading branch information...
1 parent dfd9cdd commit de9b26c5e8fb6f08bc8b0e6591838c1a341e3b98 @mjhsieh mjhsieh committed Oct 15, 2012
Showing with 37,607 additions and 37,602 deletions.
  1. +3 −2 Source/Data/BPMFMappings.txt
  2. +1 −2 Source/Data/Makefile
  3. +1 −1 Source/Data/bin/count.bash
  4. +1 −1 Source/Data/bin/count.occurrence.py
  5. +5 −2 Source/Data/phrase.list
  6. +37,596 −37,594 Source/Data/phrase.occ
@@ -11692,6 +11692,7 @@
倒回 ㄉㄠˋ ㄏㄨㄟˊ
倒回來 ㄉㄠˋ ㄏㄨㄟˊ ㄌㄞˊ
倒回去 ㄉㄠˋ ㄏㄨㄟˊ ㄑㄩˋ
+倒因為果 ㄉㄠˇ ㄧㄣ ㄨㄟˊ ㄍㄨㄛˇ
倒在 ㄉㄠˇ ㄗㄞˋ
倒地 ㄉㄠˇ ㄉㄧˋ
倒地不起 ㄉㄠˇ ㄉㄧˋ ㄅㄨˋ ㄑㄧˇ
@@ -120784,14 +120785,14 @@
門廊 ㄇㄣˊ ㄌㄤˊ
門徑 ㄇㄣˊ ㄐㄧㄥˋ
門徒 ㄇㄣˊ ㄊㄨˊ
+門得列夫 ㄇㄣˊ ㄉㄜˊ ㄌㄧㄝˋ ㄈㄨ
門戶 ㄇㄣˊ ㄏㄨˋ
門戶之見 ㄇㄣˊ ㄏㄨˋ ㄓ ㄐㄧㄢˋ
門戶開放 ㄇㄣˊ ㄏㄨˋ ㄎㄞ ㄈㄤˋ
門房 ㄇㄣˊ ㄈㄤˊ
門扇 ㄇㄣˊ ㄕㄢˋ
門扉 ㄇㄣˊ ㄈㄟ
門把 ㄇㄣˊ ㄅㄚˇ
-門捷列夫 ㄇㄣˊ ㄐㄧㄝˊ ㄌㄧㄝˋ ㄈㄨ
門斗 ㄇㄣˊ ㄉㄡˇ
門望 ㄇㄣˊ ㄨㄤˋ
門板 ㄇㄣˊ ㄅㄢˇ
@@ -129323,9 +129324,9 @@
魩仔魚 ㄇㄛˋ ㄗㄞˇ ㄩˊ
魯凱族 ㄌㄨˇ ㄎㄞˇ ㄗㄨˊ
魯國 ㄌㄨˇ ㄍㄨㄛˊ
-魯奔斯 ㄌㄨˇ ㄅㄣ ㄙ
魯恭王 ㄌㄨˇ ㄍㄨㄥ ㄨㄤˊ
魯智深 ㄌㄨˇ ㄓˋ ㄕㄣ
+魯本斯 ㄌㄨˇ ㄅㄣˇ ㄙ
魯濱遜 ㄌㄨˇ ㄅㄧㄣ ㄒㄩㄣˋ
魯班 ㄌㄨˇ ㄅㄢ
魯直 ㄌㄨˇ ㄓˊ
@@ -49,8 +49,7 @@ tidy:
@sed -i '' -e 's/1/˙/g;s/2/ˊ/g;s/3/ˇ/g;s/4/ˋ/g' BPMFMappings.txt
_phrase.occ: phrase.list
- bin/count.occurrence.py phrase.list > tmp
- mv tmp phrase.occ
+ @bin/count.occurrence.py phrase.list > tmp && mv tmp phrase.occ
phrase.list: BPMFBase.txt BPMFMappings.txt
awk 'length($$1)<4{print $$1}' BPMFBase.txt > tmp
@@ -9,7 +9,7 @@ if [ ! -f "${myPATH}/C_count.occ.exe" ]; then
( cd $myPATH; make C_count.occ.exe )
fi
if [ "${TEXTPOOL}_test" == "_test" ]; then
- TEXTPOOL=/Volumes/ramdisk/textpool.02282012
+ TEXTPOOL=/Volumes/ramdisk/textpool.10142012
fi
if [ -f "$TEXTPOOL" ]; then
$myPATH/C_count.occ.exe $TEXTPOOL $1
@@ -13,7 +13,7 @@
# not ideal, but should be sufficient.
bigstring = ''
try:
- handle = codecs.open('/Volumes/ramdisk/textpool.02282012', encoding='utf-8', mode='r')
+ handle = codecs.open('/Volumes/ramdisk/textpool.10142012', encoding='utf-8', mode='r')
except IOError as e:
print("({})".format(e))
bigstring=handle.read()
@@ -31433,6 +31433,7 @@
堂會
堂皇
堂而皇之
+堃
堅不可摧
@@ -52475,6 +52476,7 @@
打信號
打個
打倒
+打假球
打傘
打傷
打先鋒
@@ -74406,6 +74408,7 @@
沖積土
沖積堤
沖積層
+沖積岩
沖積平原
沖積成
沖積扇
@@ -128989,14 +128992,14 @@
門廊
門徑
門徒
+門得列夫
門戶
門戶之見
門戶開放
門房
門扇
門扉
門把
-門捷列夫
門斗
門望
門板
@@ -138310,9 +138313,9 @@
魯凱族
魯國
-魯奔斯
魯恭王
魯智深
+魯本斯
魯濱遜
魯班
魯直
Oops, something went wrong.

0 comments on commit de9b26c

Please sign in to comment.