# 工业缺陷检测实验分析

本notebook用于分析和可视化工业缺陷检测实验结果。

## 实验概述

- **数据集**: MVTec AD (15个类别)
- **建模方式**: 无监督学习
- **传统方法**: HOG/LBP特征 + Isolation Forest/One-Class SVM
- **深度学习方法**: PatchCore (anomalib)
- **评估指标**: Image AUROC, AUPR, F1, Pixel AUROC

In [None]:
import sys
sys.path.insert(0, '..')

import os
import json
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from src.data.dataset import CATEGORIES
from src.utils.visualization import (
    plot_metrics_comparison,
    plot_category_comparison,
    plot_comparison_curves,
    create_summary_table
)

# 设置绘图风格
plt.style.use('seaborn-v0_8-whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12

## 1. 加载实验结果

In [None]:
# 结果目录
RESULTS_DIR = '../results'

def load_results():
    """加载所有实验结果"""
    results = {}
    
    # 传统方法
    traditional_dir = os.path.join(RESULTS_DIR, 'traditional')
    if os.path.exists(traditional_dir):
        for f in os.listdir(traditional_dir):
            if f.endswith('_results.json'):
                method_name = f.replace('_results.json', '')
                with open(os.path.join(traditional_dir, f)) as fp:
                    results[method_name] = json.load(fp)
    
    # PatchCore
    patchcore_file = os.path.join(RESULTS_DIR, 'patchcore', 'patchcore_results.json')
    if os.path.exists(patchcore_file):
        with open(patchcore_file) as f:
            results['patchcore'] = json.load(f)
    
    return results

results = load_results()
print(f"加载了 {len(results)} 个方法的结果:")
for method in results.keys():
    print(f"  - {method}")

## 2. 结果汇总表格

In [None]:
# 创建结果DataFrame
data = []
for method, result in results.items():
    for category in CATEGORIES:
        if category in result and 'error' not in result[category]:
            row = {
                'Method': method,
                'Category': category,
                'Image AUROC': result[category].get('image_auroc', 0),
                'Image AUPR': result[category].get('image_aupr', 0),
                'Image F1': result[category].get('image_f1', 0),
                'Pixel AUROC': result[category].get('pixel_auroc', 0)
            }
            data.append(row)

df = pd.DataFrame(data)

# 按方法和类别展示
if not df.empty:
    pivot_auroc = df.pivot(index='Category', columns='Method', values='Image AUROC')
    print("Image AUROC 结果:")
    display(pivot_auroc.round(4))
else:
    print("暂无实验结果，请先运行训练脚本")

## 3. 方法对比 - 平均指标

In [None]:
# 计算各方法的平均指标
if not df.empty:
    avg_df = df.groupby('Method')[['Image AUROC', 'Image AUPR', 'Image F1', 'Pixel AUROC']].mean()
    print("各方法平均指标:")
    display(avg_df.round(4))
    
    # 绘制对比柱状图
    fig, ax = plt.subplots(figsize=(12, 6))
    avg_df.plot(kind='bar', ax=ax, width=0.8)
    ax.set_xlabel('Method')
    ax.set_ylabel('Score')
    ax.set_title('Average Metrics Comparison')
    ax.set_ylim([0, 1])
    ax.legend(loc='lower right')
    plt.xticks(rotation=45)
    plt.tight_layout()
    plt.show()

## 4. 各类别详细对比

In [None]:
if not df.empty:
    # 热力图
    fig, ax = plt.subplots(figsize=(14, 8))
    pivot_auroc = df.pivot(index='Category', columns='Method', values='Image AUROC')
    sns.heatmap(pivot_auroc, annot=True, fmt='.3f', cmap='RdYlGn', 
                vmin=0.5, vmax=1.0, ax=ax)
    ax.set_title('Image AUROC by Category and Method')
    plt.tight_layout()
    plt.show()

## 5. 传统方法 vs 深度学习方法对比

In [None]:
if not df.empty and 'patchcore' in results:
    # 对比各类别的性能提升
    traditional_methods = [m for m in results.keys() if m != 'patchcore']
    
    if traditional_methods:
        best_traditional = df[df['Method'].isin(traditional_methods)].groupby('Category')['Image AUROC'].max()
        patchcore_scores = df[df['Method'] == 'patchcore'].set_index('Category')['Image AUROC']
        
        comparison = pd.DataFrame({
            'Best Traditional': best_traditional,
            'PatchCore': patchcore_scores
        })
        comparison['Improvement'] = comparison['PatchCore'] - comparison['Best Traditional']
        
        print("传统方法 vs PatchCore:")
        display(comparison.round(4))
        
        # 绘制对比图
        fig, ax = plt.subplots(figsize=(14, 6))
        x = np.arange(len(comparison))
        width = 0.35
        
        ax.bar(x - width/2, comparison['Best Traditional'], width, label='Best Traditional', color='#3498db')
        ax.bar(x + width/2, comparison['PatchCore'], width, label='PatchCore', color='#e74c3c')
        
        ax.set_xlabel('Category')
        ax.set_ylabel('Image AUROC')
        ax.set_title('Traditional Methods vs PatchCore')
        ax.set_xticks(x)
        ax.set_xticklabels(comparison.index, rotation=45, ha='right')
        ax.legend()
        ax.set_ylim([0.5, 1.05])
        plt.tight_layout()
        plt.show()

## 6. 问题建模分析

### 6.1 为什么选择无监督学习?

在工业缺陷检测场景中，无监督学习是更合适的选择，原因如下:

1. **缺陷样本稀少**: 生产线上的缺陷品比例通常很低（<1%），收集足够的缺陷样本成本高昂
2. **缺陷类型多样**: 实际生产中可能出现训练时未见过的新型缺陷
3. **正常样本充足**: 正常产品容易获取，可以大量收集用于训练
4. **泛化能力**: 无监督方法学习"正常"的模式，对任何偏离正常的样本都能检测

### 6.2 特征提取思路对比

| 方法 | 特征类型 | 优势 | 局限 |
|------|---------|------|------|
| HOG | 边缘/梯度 | 计算简单，对形状敏感 | 对纹理变化不敏感 |
| LBP | 纹理 | 计算快，旋转不变 | 对噪声敏感 |
| 颜色直方图 | 颜色分布 | 简单直观 | 忽略空间信息 |
| PatchCore | 深度特征 | 语义丰富，表达能力强 | 计算量大，需要GPU |

## 7. 部署难点分析

### 7.1 实时性要求
- 工业生产线速度快，检测系统需要在毫秒级完成推理
- 传统方法推理快但准确率低，深度学习准确率高但推理慢

### 7.2 硬件资源限制
- 边缘设备可能没有GPU
- 需要模型轻量化（知识蒸馏、剪枝、量化）

### 7.3 产品类型泛化
- 不同产品需要单独训练模型
- 产品换型时需要重新采集数据

### 7.4 阈值选择
- 阈值过高：漏检率上升
- 阈值过低：误报率上升
- 需要根据实际场景调整

In [None]:
# 推理时间对比（如果有时间数据）
if not df.empty:
    time_data = []
    for method, result in results.items():
        if 'average' in result:
            avg = result['average']
            if 'total_time_ms' in avg:
                time_data.append({
                    'Method': method,
                    'Time (ms)': avg['total_time_ms']
                })
    
    if time_data:
        time_df = pd.DataFrame(time_data)
        print("推理时间对比:")
        display(time_df)

## 8. 结论

### 主要发现

1. **PatchCore显著优于传统方法**: 在图像级AUROC上平均提升约10-15个百分点
2. **传统方法仍有价值**: 在资源受限场景下可作为快速筛选工具
3. **不同类别差异明显**: 纹理类（如carpet, leather）传统方法表现较好，物体类（如bottle）深度学习优势更大

### 建议

1. **高精度场景**: 使用PatchCore，必要时结合TensorRT加速
2. **低延迟场景**: 可考虑两阶段方案，传统方法初筛 + 深度学习精检
3. **持续改进**: 收集误检样本，定期更新memory bank

In [None]:
# 保存报告
if not df.empty:
    # 保存为Excel
    output_path = '../results/report/detailed_results.xlsx'
    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    
    with pd.ExcelWriter(output_path) as writer:
        df.to_excel(writer, sheet_name='Raw Results', index=False)
        if 'avg_df' in dir():
            avg_df.to_excel(writer, sheet_name='Average Metrics')
        if 'comparison' in dir():
            comparison.to_excel(writer, sheet_name='Method Comparison')
    
    print(f"详细结果已保存至: {output_path}")