# 資料管理者第三章：資料驗證與品質檢查
使用 pandas 與自訂邏輯驗證資料完整性與品質

## 1. 匯入資料與檢查空值

In [None]:
import pandas as pd

df = pd.read_csv('product_inventory.csv')
print(df.isnull().sum())

## 2. 驗證數值範圍

In [None]:
invalid_price = df[df['price'] <= 0]
print('價格異常筆數:', len(invalid_price))

## 3. 驗證類別欄位合法性

In [None]:
valid_categories = ['A', 'B', 'C']
invalid_cat = df[~df['category'].isin(valid_categories)]
print('無效分類筆數:', len(invalid_cat))

## 4. 檢查重複與主鍵唯一性

In [None]:
duplicate_ids = df[df.duplicated('product_id')]
print('重複商品ID數:', len(duplicate_ids))

## 5. 建立簡單驗證報表

In [None]:
report = pd.DataFrame({
    '異常類型': ['空值', '價格<=0', '無效分類', '重複ID'],
    '筆數': [
        df.isnull().sum().sum(),
        len(invalid_price),
        len(invalid_cat),
        len(duplicate_ids)
    ]
})
print(report)