Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

道路のstring_valueが文字化け? #9

Closed
yosimusakun opened this issue Aug 30, 2019 · 7 comments
Closed

道路のstring_valueが文字化け? #9

yosimusakun opened this issue Aug 30, 2019 · 7 comments

Comments

@yosimusakun
Copy link

地理院からダウンロードした任意のpbfをprotocol bufferで読み取ると,
レイヤ名が道路のstring_valueがところどころ文字化けしています.
具体的には,3m未?や市区町?道等など,一部分が0xEFBFBDになっています.
(0xEFBFBDはutf-8化に失敗している証拠)
もちろん,protocol bufferが原因ではなく,生のpbfをバイナリ解析すると該当部分が0xEFBFBDとなっていることからpbfに問題があるといえます.
確認および修正願えますでしょうか.
よろしくお願いいたします.

@johofukyu
Copy link
Member

国土地理院の地理院地図担当です。

ご指摘いただきましてありがとうございます。
この文字化けについては、当方でも把握しており、
現在調査を行っているところです。

@yosimusakun
Copy link
Author

迅速なご返答ありがとうございます.
承知しました.
スムーズな解決を願っております.

@johofukyu
Copy link
Member

本日、当方で把握している限りで文字化けの問題が解決しましたので、
文字化け修正後のpbfファイルに差替えております。

よろしければ、ご確認いただけますと幸いです。

@wakufactory
Copy link

文字化け問題、別要因だと思いますがまだ残っています。

有名な難読地名ですが"畬"が化けています。
https://maps.gsi.go.jp/vector/#15/35.612297/139.334499/&ls=vstd&disp=1&d=l

これはJIS第4水準の外字扱い文字からunicodeへの変換がうまくいってないケースだと思います。

@johofukyu
Copy link
Member

"畬"の文字化けにつきましては、ご指摘いただきました通り、
前回までとは別の要因によって生じております。

どの過程で文字化けが生じているかについてまでは特定できておりますので、
今後具体的な解決手段を調査して参ります。

@johofukyu
Copy link
Member

本日(2020/3/19)の全国データ公開に伴い、ご指摘の件は解消しております。
どうぞよろしくお願いいたします。

@wakufactory
Copy link

"畬"の件は確認しました。クローズお願いします。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants