# 测试集总体准确率评估指标

分析测试集预测结果表格，计算总体准确率评估指标和各类别准确率评估指标。

同济子豪兄：https://space.bilibili.com/1900783

[代码运行云GPU环境](https://featurize.cn/?s=d7ce99f842414bfcaea5662a97581bd1)：GPU RTX 3060、CUDA v11.2

2022-8-16

## 进入 mmclassification 目录

In [1]:
import os
os.chdir('mmclassification')

## 导入工具包

In [2]:
import pandas as pd
import numpy as np

## 载入类别名称和ID

In [3]:
# 载入类别名称 和 ID索引号 的映射字典
idx_to_labels = np.load('idx_to_labels.npy', allow_pickle=True).item()
# 获得类别名称
classes = list(idx_to_labels.values())
print(classes)

['哈密瓜', '圣女果', '山竹', '杨梅', '柚子', '柠檬', '桂圆', '梨', '椰子', '榴莲', '火龙果', '猕猴桃', '石榴', '砂糖橘', '胡萝卜', '脐橙', '芒果', '苦瓜', '苹果-红', '苹果-青', '草莓', '荔枝', '菠萝', '葡萄-白', '葡萄-红', '西瓜', '西红柿', '车厘子', '香蕉', '黄瓜']


## 载入测试集预测结果表格

In [13]:
df = pd.read_csv('work_dirs/mobilenet_v2_1x_fruit30/测试集预测结果.csv')

## 准确率

In [15]:
sum(df['标注类别名称'] == df['top-1-预测名称']) / len(df)

0.865491651205937

## top-n准确率

In [16]:
sum(df['top-n预测正确']) / len(df)

0.963821892393321

## 各类别准确率评估指标

公众号 人工智能小技巧 回复 混淆矩阵

看子豪兄视频和笔记讲解

In [8]:
from sklearn.metrics import classification_report

In [9]:
print(classification_report(df['标注类别名称'], df['top-1-预测名称'], target_names=classes))

              precision    recall  f1-score   support

         哈密瓜       0.91      0.84      0.87        37
         圣女果       0.70      0.87      0.78        38
          山竹       0.94      0.97      0.96        35
          杨梅       0.92      0.89      0.90        37
          柚子       0.83      0.68      0.75        37
          柠檬       0.64      0.93      0.76        29
          桂圆       0.97      0.97      0.97        38
           梨       0.88      0.76      0.81        37
          椰子       0.94      0.79      0.86        38
          榴莲       0.80      0.97      0.88        36
         火龙果       1.00      0.92      0.96        36
         猕猴桃       0.83      0.95      0.89        37
          石榴       0.90      0.76      0.82        37
         砂糖橘       1.00      0.74      0.85        35
         胡萝卜       0.82      0.86      0.84        36
          脐橙       0.72      0.84      0.77        37
          芒果       0.82      0.70      0.75        33
          苦瓜       0.91    

maro avg 宏平均：直接将每一类的评估指标求和取平均（算数平均值）

weighted avg 加权平均：按样本数量（support）加权计算评估指标的平均值

In [10]:
report = classification_report(df['标注类别名称'], df['top-1-预测名称'], target_names=classes, output_dict=True)
del report['accuracy']
df = pd.DataFrame(report).transpose()

In [11]:
df

Unnamed: 0,precision,recall,f1-score,support
哈密瓜,0.911765,0.837838,0.873239,37.0
圣女果,0.702128,0.868421,0.776471,38.0
山竹,0.944444,0.971429,0.957746,35.0
杨梅,0.916667,0.891892,0.90411,37.0
柚子,0.833333,0.675676,0.746269,37.0
柠檬,0.642857,0.931034,0.760563,29.0
桂圆,0.973684,0.973684,0.973684,38.0
梨,0.875,0.756757,0.811594,37.0
椰子,0.9375,0.789474,0.857143,38.0
榴莲,0.795455,0.972222,0.875,36.0


In [12]:
df.to_csv('work_dirs/mobilenet_v2_1x_fruit30/各类别准确率评估指标.csv', index_label='类别')