ファイルでの「使用しない言語」の設定が「---cell---」のみ反映されない #534

TsuguSan · 2022-11-14T09:16:18Z

■お使いのKH Coderのバージョン
3.Beta.05a

■KH Coderのインストール先フォルダ（解凍先フォルダ）
C:\khcoder3

■どんなエラー・不具合・問題ですか？
使用しない言語選択時に、KH coderにデフォルトで設定されている「---cell---」は機能するが、テキストファイルで同様に「---cell---」を使用しない言語に設定しても分析結果に「---cell---」が入ってしまう。
「---cell---」以外の単語は、テキストファイルでも反映されます。

■分析しようとしているのは何語のテキストですか？
日本語

■分析対象として指定しているファイルの形式は何ですか？
Excel形式（.xlsx）

■お使いのOS
Windows 10

■お使いのセキュリティ対策／ウイルス対策ソフトウェア
無し

■お使いのCPU
Intel Core i5

ko-ichi-h · 2022-11-14T13:00:13Z

こんにちは、開発者の樋口です。書き込みありがとうございます。

なぜテキストファイルの分析で「---cell---」の指定が必用になるのでしょう？

ともあれ、「強制抽出」欄と「使用しない語」欄の両方に入力していることと、両方の欄の一番上に入力していることをご確認ください。

テキストファイルを分析するのではなく、「使用しない語」欄に直接打ち込むかわりに「ファイルから読み込み」にチェックを入れるということでしょうか。その場合でも対策は同じで、「強制抽出」「使用しない語」両方のファイルの一番上に「---cell---」を入力してください。

TsuguSan · 2022-11-15T04:16:32Z

回答ありがとうございます。
すみません、伝え方が悪かったようです。
分析対象としているファイルはExcel形式で、KH Coderの「使用しない語」欄に入力した「---cell---」は分析結果から無くなるのですが、「使用しない語」を「ファイルから読み込み」にし、その読み込ませるテキストファイルに「--cell---」と記述しても、分析結果に出てしまうという現象が起きています。
※「強制抽出」「使用しない語」の両方に設定するテキストファイルの一番上には「---cell---」と入力されています。

ko-ichi-h · 2022-11-15T09:02:43Z

こんにちは、開発者の樋口です。書き込みありがとうございます。

上の書き込みの編集部分にも書きましたが、状況、理解できたと思います。丁寧にご説明いただきありがとうございます。

さて本題ですが、再度「前処理の実行」はされましたか？　「前処理の実行」をしても「---cell---」が除外されない場合は、「強制抽出」「使用しない語」の両方のテキストファイルをここに貼り付けていただければ、何か分かるかもしれません。

手元の環境では、両方のファイルの一番上に「---cell---」を入力して「前処理の実行」をすれば、「---cell---」を除外できるようです。

TsuguSan · 2022-11-16T08:48:23Z

「前処理の実行」は実施済みです。
使用しているファイルを添付します。(個人情報が含まれている可能性があるため、「---cell---」のみ記述したファイルとなります。こちらのファイルでも「---cell---」が除外されないことは確認済みです。)
強制抽出する語r2.txt
使用しない語.txt

ko-ichi-h · 2022-11-16T10:30:13Z

こんにちは、開発者の樋口です。書き込みありがとうございます。

テキストファイルにBOMがついているのが原因でした。
BOMを削除してから前処理をやり直せば「---cell---」が除外されました。

フリーのサクラエディタを使ってBOMを外す方法がこちらのリンクに載っています。
https://boukenki.info/sakura-editor-bom-settei-houhou/

ちなみに、何というソフトでこのテキストファイルを作成されましたか？

この掲示板をご覧になっているすべての方にお伝えしたいのですが、このように状況を再現するためのファイルを最初から添付していただけば、ここでのやり取りや、解決までに必要な日数を大幅に短縮できるケースがまま見られます。最初の書き込み時になるべくご協力いただけましたら幸いです。

ko-ichi-h · 2022-11-16T10:55:18Z

941915a にてKH Coderの修正を行い、BOM付きテキストファイルの読み込みに対応しました。次のバージョンからは、BOMをわざわざ外していただかなくても大丈夫です。

ほかのたいていのテキストファイル読み込み局面では、BOM対応のための修正を既に行っていると思うのですが、ここは漏れていました。

TsuguSan · 2022-11-18T01:36:04Z

回答ありがとうございます。
BOM付きテキストファイルだったのが原因だったのですね、納得しました。
使用したテキストエディタは「TeraPad」です。

また、次回からは最初から原因のファイルを添付するように致します。

TsuguSan added error Non-English Communication in Japanese language. labels Nov 14, 2022

TsuguSan changed the title ~~ファイルでの「使用しない言語」の設定が反映されない~~ ファイルでの「使用しない言語」の設定が「---cell---」のみ反映されない Nov 14, 2022

ko-ichi-h added a commit that referenced this issue Nov 16, 2022

Minor: made it compatible with text files with BOM, regarding #534

941915a

TsuguSan closed this as completed Nov 18, 2022

ko-ichi-h added a commit that referenced this issue Nov 26, 2022

Minor: made it compatible with text files with BOM, regarding #534

769b189

ko-ichi-h mentioned this issue Nov 26, 2022

3.Beta.06c 語の取捨選択でファイルから読み込みをONにして前処理の実行をするとファイルを開けませんでした kh_dictio.pm line 115 #542

Closed

ko-ichi-h reopened this Apr 22, 2023

Repository owner locked and limited conversation to collaborators Apr 22, 2023

ko-ichi-h converted this issue into discussion #809 Apr 22, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

This issue was moved to a discussion.

ファイルでの「使用しない言語」の設定が「---cell---」のみ反映されない #534

ファイルでの「使用しない言語」の設定が「---cell---」のみ反映されない #534

TsuguSan commented Nov 14, 2022

ko-ichi-h commented Nov 14, 2022 •

edited

TsuguSan commented Nov 15, 2022

ko-ichi-h commented Nov 15, 2022

TsuguSan commented Nov 16, 2022

ko-ichi-h commented Nov 16, 2022 •

edited

ko-ichi-h commented Nov 16, 2022 •

edited

TsuguSan commented Nov 18, 2022

This issue was moved to a discussion.

This issue was moved to a discussion.

ファイルでの「使用しない言語」の設定が「---cell---」のみ反映されない #534

ファイルでの「使用しない言語」の設定が「---cell---」のみ反映されない #534

Comments

TsuguSan commented Nov 14, 2022

ko-ichi-h commented Nov 14, 2022 • edited

TsuguSan commented Nov 15, 2022

ko-ichi-h commented Nov 15, 2022

TsuguSan commented Nov 16, 2022

ko-ichi-h commented Nov 16, 2022 • edited

ko-ichi-h commented Nov 16, 2022 • edited

TsuguSan commented Nov 18, 2022

This issue was moved to a discussion.

ko-ichi-h commented Nov 14, 2022 •

edited

ko-ichi-h commented Nov 16, 2022 •

edited

ko-ichi-h commented Nov 16, 2022 •

edited