# pandas 入門：データフレーム操作・前処理・可視化
**到達目標**  
- CSV からの読み込みと基本統計の確認  
- `loc` / `query` / `groupby` の基本  
- 可視化（matplotlib）と簡単な前処理（欠損・型変換）

> 実行手順: 最初に `pip` セル→データ生成セル（CSVを書き出し）→以降のセルを実行


# Colab 用セットアップ
!pip -q install -U pandas matplotlib numpy tqdm

# サンプル CSV を作る（学内ネットワーク等に依存しないため）
from pathlib import Path
data_dir = Path("/content/data")
data_dir.mkdir(parents=True, exist_ok=True)
csv_path = data_dir/"iris_small.csv"
csv_text = 'species,sepal_length,sepal_width,petal_length,petal_width\nsetosa,5.1,3.5,1.4,0.2\nsetosa,4.9,3.0,1.4,0.2\nsetosa,4.7,3.2,1.3,0.2\nversicolor,7.0,3.2,4.7,1.4\nversicolor,6.4,3.2,4.5,1.5\nvirginica,6.3,3.3,6.0,2.5\nvirginica,5.8,2.7,5.1,1.9\n'
csv_path.write_text(csv_text, encoding="utf-8")
csv_path

# 読み込みと基本確認
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.read_csv("/content/data/iris_small.csv")
display(df.head())
display(df.describe(include='all'))

# 欠損値と型確認（今回は欠損なし想定）
print(df.isna().sum())
print(df.dtypes)

# loc / query / groupby の基本
short = df.query("sepal_length >= 5.0")
agg = df.groupby("species")[["sepal_length", "petal_length"]].mean()
display(short)
display(agg)

# 可視化：箱ひげ図と散布図
fig = plt.figure()
df.boxplot(column="sepal_length", by="species", grid=False)
plt.title("Sepal length by species")
plt.suptitle("")  # デフォルトタイトルを消す
plt.xlabel("species"); plt.ylabel("sepal_length")
plt.show()

fig = plt.figure()
for sp, g in df.groupby("species"):
    plt.scatter(g["sepal_length"], g["petal_length"], label=sp)
plt.legend()
plt.xlabel("sepal_length"); plt.ylabel("petal_length")
plt.title("Sepal vs Petal length")
plt.show()

# 前処理例：標準化（列ごとに平均0, 分散1）
num_cols = ["sepal_length","sepal_width","petal_length","petal_width"]
df_std = df.copy()
df_std[num_cols] = (df[num_cols] - df[num_cols].mean())/df[num_cols].std(ddof=0)
display(df_std.head())

# 練習問題 1:
# 1) species ごとに petal_width の最大・最小・平均を集計（列名は max/min/mean）
# 2) sepal_width が 3.0 以上の行のみのサブセットを作り、行数を表示
# 3) 標準化した df_std を使って散布図 (sepal_width vs petal_width) を species 別に描く
#
# --- ここから記述 ---
