What version of the product are you using? On what operating system?
mozc-1.12.1599.102
PCLinuxOS
python-2.7.5
Please provide any additional information below.
2013年11月29日版の郵便番号データを用いて mozc
をビルドすると、郵便番号辞書生成スクリプトが下記のエ��
�ーを吐きます。(KEN_ALL.CSV
は「読み仮名データの促音・拗音を小書きで表記するもの��
�を使用)
~/rpm/BUILD/mozc-1.12.1599.102
+ cd data/dictionary_oss
+ python ../../dictionary/gen_zip_code_seed.py --zip_code=KEN_ALL.CSV
--jigyosyo=JIGYOSYO.CSV
Traceback (most recent call last):
File "../../dictionary/gen_zip_code_seed.py", line 270, in <module>
sys.exit(main())
File "../../dictionary/gen_zip_code_seed.py", line 261, in main
ProcessZipCodeCSV(options.zip_code)
File "../../dictionary/gen_zip_code_seed.py", line 91, in ProcessZipCodeCSV
for entry in ReadZipCodeEntries(tokens[2], tokens[6], tokens[7], tokens[8]):
File "../../dictionary/gen_zip_code_seed.py", line 189, in ReadZipCodeEntries
for town in ParseTownName(level3)]
File "../../dictionary/gen_zip_code_seed.py", line 204, in ParseTownName
% level3.encode('utf-8'))
AssertionError: failed to be merged
大桑町(ア、イ、ヰ、ウ、上野、ヲ、オ乙、鐘搗山、上川��
�、上猫下、
error: Bad exit status from /var/tmp/rpm-tmp.1TepSE (%prep)
「大桑町(ア、イ、ヰ、ウ、上野、ヲ、オ乙、鐘搗山、上��
�原、上猫下、」の文字列で KEN_ALL.CSV
内を検索すると、51673行目の下記がヒットしました。
17201,"92181","9218046","イシカワケン","カナザワシ","オオクワ�
��チ(ア、イ、イ、ウ、ウエノ、オ、オオツ、カネツキヤマ��
�カミカワラ、カミネコシタ、","石川県","金沢市","大桑町(�
��、イ、ヰ、ウ、上野、ヲ、オ乙、鐘搗山、上川原、上猫下
、",1,0,0,1,1,5
試しにこの行を削除した KEN_ALL.CSV
を使ってビルドしてみたところ、エラーは出ませんでした��
�
10月31日版の郵便番号データを用いたビルドではエラーは出�
��いませんでしたので、ひょっとすると11月29日版のデータ��
�側の問題かも分かりませんが、取り敢えず報告させて頂き�
��す。
Original issue reported on code.google.com by superhor...@gmail.com on 3 Dec 2013 at 5:56
Original issue reported on code.google.com by
superhor...@gmail.com
on 3 Dec 2013 at 5:56The text was updated successfully, but these errors were encountered: