Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

EPGデータの文字化け #26

Closed
aspyge opened this issue Nov 7, 2017 · 1 comment
Closed

EPGデータの文字化け #26

aspyge opened this issue Nov 7, 2017 · 1 comment
Labels

Comments

@aspyge
Copy link

aspyge commented Nov 7, 2017

Environment

  • Version of Mirakurun: 2.5.7
  • Version of Node: v6.10.3
  • Version of NPM: 3.10.10
  • Platform:Ubuntu 16.04
  • Architecture: x64

Issue

EPGの番組表データが一部文字化けしています
当方の環境ではUTF-8のテキストデータとしてprograms.jsonを開き、\u0を検索すると異常箇所がヒットします

@kanreisa kanreisa added the bug label Nov 7, 2017
@hideo54
Copy link

hideo54 commented Nov 24, 2018

同様の現象 ( �\u0~) を確認した他、まれに

「ラブライブ!サンシャイン!!Aqわ をん ご よ ぬわ ゅぬら ゅぁ ~びめられらゎょ  わ  よゅ び ゎんよらゎゅ~」
(正しくは「ラブライブ!サンシャイン!!Aqours 4th LoveLive! ~Sailing to the Sunshine~」)

(出典: 2018/11/25 9:30~ TV東京/大阪で放送予定の「JAPAN COUNTDOWN」)

のように、部分的に異なった文字が現れる現象も確認しました。
上の例では、UTF-8 で XX (16進数) と表される文字が ISO-2022-JP で 24XX (16進数) と表される文字に変換されていることから、文字コード変換のあたりでバグがあると推測します。
(例: 「n」(UTF-8: 6E) →「ゎ」(ISO-2022-JP: 246E) )

programs.json で「ゎ」で検索すると同様の異常箇所を探しやすいです。

これ以上の詳細な調査ができておらず恐縮ですが、とりあえず報告させていただきました。

Environment

  • Version of Mirakurun: 2.7.4
  • Version of Node: v10.12.0
  • Version of NPM: 6.4.1
  • Platform: Debian 9.5
  • Architecture: x64

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants