-
Notifications
You must be signed in to change notification settings - Fork 50
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
一部のレコードで「市区町村名ローマ字」フィールドが途切れている #118
Comments
@champierre ご対応ありがとうございます。 #123 拝見しました。 86813行目
86828行目
222618行目
222628行目
|
@champierre #129 確認しました。修正いただきありがとうございました! |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
バグの内容
再現手順
本来どう動作すべきか
"NISHIYATSUSHIRO GUN ICHIKAWAMISATO CHO"
スクリーンショット(オプション)
(なし)
参考情報(オプション)
データが欠けている原因
元データである 住所の郵便番号(ローマ字)(CSV 形式) を郵便局 Web サイトからダウンロードして確認したところ、同じように途切れていることが分かりました。これは、 郵便番号データ(ローマ字)の説明 ページの「留意点」に記載されている通り、半角フィールド長の上限 35 文字を超えてしまっているためです。
この上限を超えているのは現時点では上記の 4 パターンで、途切れている・完全に欠落しているのは全て市区町村区分の読み(MACHI / CHO / MURA)でした。latest.csv を利用する側で「市区町村名カナ」フィールドの読みから復元することも可能ですが、できれば latest.csv の段階で修正されていると便利だと思います。
修正案1: 「市区町村名カナ」フィールドの読みから復元する
欠けるのは「市区町村名ローマ字」フィールド末尾にある市区町村区分の読みに限るという前提を置くと、次の方法が考えられる。
' '
で区切るあるいは、「市区町村名ローマ字」フィールドのソースとして 住所の郵便番号(ローマ字)(CSV 形式) の情報を使わず、 ローマ字変換仕様 に基づいて「市区町村名カナ」フィールドから生成する。この方法であれば、現時点で存在するものよりも更に長い読みの市区町村名が現れて、市区町村区分よりも前が欠けてしまう状態になっても復元できる。
修正案2: 個別にパッチする
patches/
ディレクトリに上記 4 町村(計 63 レコード)をパッチの形で収録する。修正案3: ドキュメントに制限事項として記載する
元データの段階で欠落しているため、制限事項としてドキュメントに「市区町村名ローマ字」フィールドは欠けている可能性があることを記載する。
The text was updated successfully, but these errors were encountered: