# 適合率、再現率、F値、正解率

文書分類や情報検索のモデル精度を評価するために、一般的によく使われている指標を実装してみましょう。<br>
詳細については、week10の資料(Week14-参考資料.pdf)を参照してください。

![tp-tn-fp-fn-pic.png](attachment:tp-tn-fp-fn-pic.png)

### ムービーレビューの極性分類結果を評価する

Bo Pang氏とLillian Lee氏が公開しているMovie Review Dataの<font color="MediumBlue">sentence polarity dataset v1.0[1]</font>を用いた，文を肯定的（ポジティブ:P）もしくは否定的（ネガティブ:N）に分類する<font color="MediumBlue">極性分析の結果</font>を用いて次の評価値を実装します。今回は、極性分類の実装はしません。 <br>極性分類の結果result.texを評価指標で評価します。  
[1]：5331 positive and 5331 negative processed sentences / snippets. Introduced in Pang/Lee ACL 2005. Released July 2005.   

#### 評価指標の解説（この例の場合に合わせて）
- 正解率(Accuracy): 正解率は、すべてのレビューのうち、正しく予測できたものの割合．
- 適合率(Precision)：肯定的と予測したレビューの中で、実際に肯定的だったものの割合．
- 再現率(Recall)：実際に肯定的なレビューの中で、肯定的と予測できたものの割合．
- F値(F-score)：適合率と再現率のバランスを定量化

#### ムービーレビュー（元データ）の例
項目左から、レビュー文. (極性 positive/negative)<br>
- simplistic , silly and tedious . （negative）
- one of the greatest family-oriented , fantasy-adventure movies ever .  （positive）
- worked better as a one-hour tv documentary . （negative）

学習データsentence polarity dataset v1.0に対してロジスティック回帰モデルを適用し，正解のラベル，予測されたラベル，予測確率をタブ区切り形式で出力したファイル<font color="MediumBlue"> result.txt </font>を利用する．<br>

#### レビューの極性を予測した結果 (result.txtの一部)
3要素から成り、左から 「正解極性」　「予測極性」 「予測確率」<br>
- -1  -1  0.7992886809287588
- +1  +1  0.9989116240762246
- -1  +1  0.6208624063497488

ただし，positive(+1), negative(-1) とする．

## result.txt の内容の確認

このセルの下に新しいセルを挿入し， codeモードで
`!head result.txt`
を入力し実行すると、ファイルの先頭から10行を表示できます。3要素について説明どおりになっているか確認しましょう。<br>
先頭から30行を表示させる場合は、`!head -30 result.txt`とすれば良いですね。
#### ※codeモードで unixコマンドを実行ができます． 実行したいコマンドの先頭にエクスクラメーション 「!」を付けて実行。

### 課題1：

以下に示すコードでは、cols[0]は正解極性、cols[1]は予測極性、dols[2]はコメントの要素になります。24行目から cols[0], cols[1]を参照しそれぞれのpositiveとnegativeをカウントしています。<br>
課題1では、week10で学んだ、TP, FP, FN, TNを求めます。<br>

4行目からの`def 関数名(引数)`は評価値を算出する処理を関数として定義しています。関数を使う場合は、`関数名(引数)`として使えます。（他の言語と同様ですね）<br>
36〜39行目に各評価指標の式を追加し、結果表示させ、分類精度を確認しましょう。

In [None]:
fname_result = 'result.txt' #sentence polarity dataset v1.0極性分類結果のファイル

#評価値を算出する関数 score(fname)を定義する
def score(fname):
    '''結果ファイルからスコア算出
    結果ファイルを読み込んで、正解率、適合率、再現率、F1スコアを返す
    戻り値：
    正解率,適合率,再現率,F1スコア
    '''
    # 結果を読み込んで集計する。各変数の初期値を代入する。
    TP = 0      # True-Positive     予想が+1、正解も+1
    FP = 0      # False-Positive    予想が+1、正解は-1
    FN = 0      # False-Negative    予想が-1、正解は+1
    TN = 0      # True-Negative     予想が-1、正解も-1

    with open(fname) as data_file: #ファイルをopenし，data_fileとする
        for line in data_file:
            cols = line.split('\t')    # "-1  -1  0.7992886809287588"の並びのデータをtabで分割しリスト化
#            print(cols)   #colsの内容を表示

            if len(cols) < 3:
                continue

            if cols[0] == '+1':         # 0番目：正解極性
                if cols[1] == '+1':     # 1番目：予想極性
                    TP += 1
                else:
                    FN += 1
            else:
                if cols[1] == '+1':
                    FP += 1
                else:
                    TN += 1

    # 各指標の算出式:ここに各指標の式をTP, FN, FP, TNを用い入力します。演算子は一般的な書式　＋、ー、＊、＼　優先する計算は（）を使えます。
    accuracy = 正解率の式     # 正解率
    precision = 適合率の式     # 適合率
    recall = 再現率の式    # 再現率
    f1 = F値の式   # F1スコア

    return accuracy, precision, recall, f1
#def score(fname)の終わり

# スコア算出 定義したscoreにデータを渡し，　return の返す値を左から順に各変数に格納する。
accuracy, precision, recall, f1 = score(fname_result)
print('正解率　\t{}\n適合率　\t{}\n再現率　\t{}\nF1スコア　\t{}'.format( accuracy, precision, recall, f1))


考察： この映画レビューデータを用いてロジスティック回帰モデルで生成した極性分類モデルの精度は良かったですか？悪かったですか？<br>
0.8前後だとまあまあよいといえるでしょう。