-
Notifications
You must be signed in to change notification settings - Fork 96
This issue was moved to a discussion.
You can continue the conversation there. Go to discussion →
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
共起ネットワーク(語―外部変数・見出し)のJaccard係数がほかの箇所での計算結果と一致しない #321
Comments
こんにちは、樋口です。書き込みありがとうございます。 具体的には、どう違うのですか? チュートリアルの漱石『こころ』データで分析を行って、数値が違うところのスクリーンショットを撮って貼り付けるか、あるいは「この数値とこの数値が違う」と文章で説明していただけますか? また、共起ネットワークについては、メニューから「ツール」「抽出語」「共起ネットワーク」とたどって作成した共起ネットワークですか? それとも、「関連語検索」の画面で「共起ネット」ボタンを押して作成したものですか? |
樋口先生
ご連絡ありがとうございます。
訳のわからない質問してしまい、申し訳ありません。
k-hコーダーの使い方が間違っていたらごめんなさい。
まず、「ツール」「抽出語」「共起ネットワーク」とたどって作成した共起ネットワークです。
添付と問2の図と特徴語(問2)を比べてみると
被災したことがある家族はJaccardが0.23にみえるのですが、特徴語の機能でみると0.219で、少し違うのです。
どうして違うのか気になってしまって・・
冨樫
被災したことあがある 被災したことがない わからない
家族 .219 災害 .259 医療 .200
理解 .175 周知 .167 実際 .133
得る .151 マニュアル .128 フロー .125
参集 .146 考える .094 安心 .125
必要 .113 病院 .091 機関 .125
基準 .112 対応 .058 思い込む .125
職員 .110 不足 .049 集合 .125
認識 .082 対策 .049 体験 .125
意識 .081 訓練 .048 話し合い .125
思う .078 施設 .044 甘い .111
…________________________________
差出人: HIGUCHI Koichi <notifications@github.com>
送信日時: 2021年2月25日 0:28
宛先: ko-ichi-h/khcoder <khcoder@noreply.github.com>
CC: 冨樫 千秋 <ctogashi@cis.ac.jp>; State change <state_change@noreply.github.com>
件名: Re: [ko-ichi-h/khcoder] 共起ネットワークJaccard係数について (#321)
こんにちは、樋口です。書き込みありがとうございます。
具体的には、どう違うのですか? チュートリアルの漱石『こころ』データで分析を行って、数値が違うところのスクリーンショットを撮って貼り付けるか、あるいは「この数値とこの数値が違う」と文章で説明していただけますか?
また、共起ネットワークについては、メニューから「ツール」「抽出語」「共起ネットワーク」とたどって作成した共起ネットワークですか? それとも、「関連語検索」の画面で「共起ネット」ボタンを押して作成したものですか?
—
You are receiving this because you modified the open/close state.
Reply to this email directly, view it on GitHub<#321 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AS7AEWOFUHSPYXBE5L4E7FTTAULI5ANCNFSM4YD27TRQ>.
|
こんにちは、樋口です。書き込みありがとうございます。 先ほども書きましたように、漱石『こころ』データで例を出していただきたいのですが、可能でしょうか? 漱石『こころ』データであれば、こちらでも手元で試して確認できるからです。 それと、これはGitHubの仕様なのですが、メール返信では画像を添付することができません。WebブラウザでこのIssueのページを開いていただかないと添付できません。 今の時点で思いつくこととしては、共起ネットワークの「集計単位」と、特徴語を出すときの「単位」指定が、一致していないために数値が微妙に異なるのかな?ということです。なお「集計単位」と「単位」というふうに表記が違いますが、意味するところは同じです。 |
樋口先生
素人すぎてISSUに掲載するのが恥ずかしくなりました。
でも、こころのDATAで試してみました。
ツール「外部変数・見出し」のところで、章(ラベル)を選んで、例えば1,2,3ラベルをつけて保存します。特徴語のところをエクセルで保存すると章の語句ごとにJaccard係数がでてくるのと思うのです。
次に
抽出語→共起ネットワーク→語- 外部変数見出のところでラベルを付けたの章(ラベル)を選んで、係数を表示を選んで、共起ネットワーク図がでてくると思うのですが(こころのdataでは、ラベルの共起ネットワーク図はでてこず)、共起ネットワーク図にでてくるJaccard係数と上記のJaccard係数が少し違うのです。
Jaccard係数は私のDATAだと特徴語からダウンロードしたエクセルのJaccard係数より、共起ネットワーク図のJaccard 係数のほうが正しいのでしょうか。
被災したことあがある 被災したことがない わからない
家族 .219 災害 .259 医療 .200
理解 .175 周知 .167 実際 .133
得る .151 マニュアル .128 フロー .125
参集 .146 考える .094 安心 .125
必要 .113 病院 .091 機関 .125
基準 .112 対応 .058 思い込む .125
職員 .110 不足 .049 集合 .125
認識 .082 対策 .049 体験 .125
意識 .081 訓練 .048 話し合い .125
思う .078 施設 .044 甘い .111
[cid:41abab1f-5036-42f7-a727-8310d2447ac0]
…________________________________
差出人: HIGUCHI Koichi <notifications@github.com>
送信日時: 2021年2月25日 0:42
宛先: ko-ichi-h/khcoder <khcoder@noreply.github.com>
CC: 冨樫 千秋 <ctogashi@cis.ac.jp>; State change <state_change@noreply.github.com>
件名: Re: [ko-ichi-h/khcoder] 共起ネットワークJaccard係数について (#321)
こんにちは、樋口です。書き込みありがとうございます。
先ほども書きましたように、漱石『こころ』データで例を出していただきたいのですが、可能でしょうか? 漱石『こころ』データであれば、こちらでも手元で試して確認できるからです。
それと、これはGitHubの仕様なのですが、メール返信では画像を添付することができません。WebブラウザでこのIssueのページを開いていただかないと添付できません。
—
You are receiving this because you modified the open/close state.
Reply to this email directly, view it on GitHub<#321 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AS7AEWK5OQNCQXE7G6AOGNTTAUM6FANCNFSM4YD27TRQ>.
|
こんにちは、樋口です。書き込みありがとうございます。 共起ネットワークを作成するためのオプション画面(「語 ― 外部変数・見出し」を選んだ画面)で、「係数を標準化する」のチェックを外すと一致しませんか? この「標準化」について詳しくはマニュアルのA.5.10節をご覧ください。 p.s. |
樋口先生
早々に回答ありがとうございます。夜遅くまで頭が下がります。
特徴語を「文」ではなく、「H5」でだし、共起ネットワークの「標準化」のチェックをはずしたところ、一致しました。
先生の書籍を読んで別の疑問が湧いてきまた。
特徴語のエクセルででる数値は「Jaccard係数」ではなく「Jaccardの類似性測度」と記載されておりました。
「Jaccard係数」=「Jaccardの類似性測度」と考えてよいでしょうか。
被災したことがある 被災したことがない わからない
家族 .233 災害 .259 医療 .200
理解 .189 周知 .177 実際 .133
得る .168 考える .100 フロー .125
参集 .157 病院 .095 安心 .125
基準 .123 対応 .065 機関 .125
職員 .122 不足 .054 思い込む .125
認識 .091 訓練 .054 集合 .125
思う .087 対策 .049 体験 .125
体制 .085 至る .044 話し合い .125
個人 .082 出来る .044 甘い .111
[cid:609d08f5-3b24-40fa-acf3-4f299f24ce45]
…________________________________
差出人: HIGUCHI Koichi <notifications@github.com>
送信日時: 2021年2月25日 1:38
宛先: ko-ichi-h/khcoder <khcoder@noreply.github.com>
CC: 冨樫 千秋 <ctogashi@cis.ac.jp>; State change <state_change@noreply.github.com>
件名: Re: [ko-ichi-h/khcoder] 共起ネットワークJaccard係数について (#321)
こんにちは、樋口です。書き込みありがとうございます。
共起ネットワークを作成するためのオプション画面(「語 ― 外部変数・見出し」を選んだ画面)で、「係数を標準化する」のチェックを外すと一致しませんか?
この「標準化」について詳しくはマニュアルのA.5.10節をご覧ください。
p.s.
メール返信による投稿機能を利用して、画像ファイル貼り付けに失敗されるのは、大変よくあることです。この点は、むしろGithubの仕様に問題があるように思います。
—
You are receiving this because you modified the open/close state.
Reply to this email directly, view it on GitHub<#321 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AS7AEWKFGHAJPFPL4YU4JUDTAUTOVANCNFSM4YD27TRQ>.
|
こんにちは、樋口です。書き込みありがとうございます。
はい、同じものです。 |
�靠谙壬
お返事ありがとうございました。安心しました。
��
…________________________________
差出人: HIGUCHI Koichi <notifications@github.com>
送信日�r: 2021年2月26日 22:19
宛先: ko-ichi-h/khcoder <khcoder@noreply.github.com>
CC: ��佟∏ <ctogashi@cis.ac.jp>; State change <state_change@noreply.github.com>
件名: Re: [ko-ichi-h/khcoder] 共起ネットワ`クJaccard�S数について (#321)
こんにちは、�靠冥扦埂�zみありがとうございます。
「Jaccard�S数」=「Jaccardの�似性�y度」と考えてよいでしょうか。
はい、同じものです。
―
You are receiving this because you modified the open/close state.
Reply to this email directly, view it on GitHub<#321 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AS7AEWMVMLGYYKBJORFJPG3TA6NWNANCNFSM4YD27TRQ>.
|
This issue was moved to a discussion.
You can continue the conversation there. Go to discussion →
-->「特徴語」の機能でJaccard係数が確認できるのですが、同じdataで作成した共起ネットワーク図に示させるJaccard係数と若干数字が異なるます。なぜかわからず教えていただければ嬉しいです。
■お使いのOS
Windows 10
■KH Coderのバージョ3.Alpha.14b
■エラーメッセージ
エラーメッセージが出ている場合は、内容をコピー&ペーストするか、スクリーンショットを添付して下さい。
■スクリーンショット
可能であれば、質問したい状況をあらわすようなスクリーンショットを添付してください。
■チュートリアル・データで試してみると
操作・分析が上手くいかない場合は、チュートリアルの漱石「こころ」データで同じことを試してみると上手くいくのかどうかをお知らせください。
■再現用ファイル
チュートリアル・データなら上手くいくけれど自分のファイルでは上手くいかないという場合、その現象を再現できるファイルをできれば添付してください。
The text was updated successfully, but these errors were encountered: