-
Notifications
You must be signed in to change notification settings - Fork 14
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
道路のstring_valueが文字化け? #9
Comments
国土地理院の地理院地図担当です。 ご指摘いただきましてありがとうございます。 |
迅速なご返答ありがとうございます. |
本日、当方で把握している限りで文字化けの問題が解決しましたので、 よろしければ、ご確認いただけますと幸いです。 |
文字化け問題、別要因だと思いますがまだ残っています。 有名な難読地名ですが"畬"が化けています。 これはJIS第4水準の外字扱い文字からunicodeへの変換がうまくいってないケースだと思います。 |
"畬"の文字化けにつきましては、ご指摘いただきました通り、 どの過程で文字化けが生じているかについてまでは特定できておりますので、 |
本日(2020/3/19)の全国データ公開に伴い、ご指摘の件は解消しております。 |
"畬"の件は確認しました。クローズお願いします。 |
地理院からダウンロードした任意のpbfをprotocol bufferで読み取ると,
レイヤ名が道路のstring_valueがところどころ文字化けしています.
具体的には,3m未?や市区町?道等など,一部分が0xEFBFBDになっています.
(0xEFBFBDはutf-8化に失敗している証拠)
もちろん,protocol bufferが原因ではなく,生のpbfをバイナリ解析すると該当部分が0xEFBFBDとなっていることからpbfに問題があるといえます.
確認および修正願えますでしょうか.
よろしくお願いいたします.
The text was updated successfully, but these errors were encountered: