# NumPyの使い方

## 最初の見取り図

NumPyの使い方で身につける狙いは、書いたコードを『読んで説明できる』状態にすることです。

前提: 中学数学レベルの四則演算と、変数という言葉への軽い慣れがあれば十分です。

到達目標: Pythonでデータを読み、加工し、簡単な可視化と検証までを一人で実行できる状態にします。

ここで扱う中心語は 「変数」、「関数」、「条件分岐」、「反復」、「データ構造」、「NumPyの使い方」 です。用語を先に暗記するのではなく、コード実行の結果と結びつけて理解します。

このノートは Python 分野の初学者向けに、説明とコードを交互に読み進める設計です。最初から完璧に理解する必要はありません。大切なのは、各コードの目的を一文で言えることと、出力が変わる理由を自分で確かめることです。

## 手を動かす 1: NumPy配列の生成と演算

このノートでは Python リストとの差を体感するため、NumPy のベクトル演算を最初に実行します。

In [None]:
try:
    import numpy as np
except ModuleNotFoundError:
    print('numpy is not installed')
else:
    a = np.array([1, 2, 3])
    b = np.array([10, 20, 30])
    print('a+b =', a + b)
    print('a*b =', a * b)

要素ごとの演算が自然に書ける点が NumPy の強みです。行列計算に進む前の入口として重要です。

変数 を1つ変更して、同じコードを別条件で再実行し、差分の理由を1段落でまとめてください。

## 手を動かす 2: 条件で分ける

次に、条件分岐で情報を分類します。分類は機械学習の前処理でも頻出なので、早い段階で手を慣らしておきます。

In [None]:
passed = []
for name, score in paired:
    if score >= 70:
        passed.append(name)
print('passed =', passed)

このコードは単純ですが、評価基準を変更したときの影響範囲が読みやすい形になっています。基準値を一箇所に集約すると保守しやすくなります。

変数 を1つ変更して、同じコードを別条件で再実行し、差分の理由を1段落でまとめてください。

## 数式メモ

1. 厳密な式より、入力 -> 変換 -> 出力の流れを言語化することが中心です。

## 手を動かす 3: 関数で再利用する

同じ処理を繰り返すときは、関数で意味を名前にします。名前付けは可読性の中心で、後から読む自分を助ける実装でもあります。

In [None]:
def normalize(xs):
    lo, hi = min(xs), max(xs)
    span = hi - lo if hi != lo else 1
    return [(x - lo) / span for x in xs]
print('normalized =', normalize(scores))

ここで大切なのは、ゼロ除算のような例外条件を先に潰すことです。初学者は正常系だけを考えがちですが、異常系を一行でも書くとコードの寿命が伸びます。

変数 を1つ変更して、同じコードを別条件で再実行し、差分の理由を1段落でまとめてください。

## 手を動かす 4: 辞書で意味を持たせる

配列だけでは意味が曖昧になるとき、辞書でキーを明示します。キーは設計者の意図を運ぶラベルです。

In [None]:
records = [{'name': n, 'score': s} for n, s in paired]
top = max(records, key=lambda r: r['score'])
avg = sum(r['score'] for r in records) / len(records)
print('top =', top)
print('avg =', round(avg, 2))

辞書形式にすると、列の追加や削除に強くなります。機械学習の特徴量を増減するときにも同じ考え方が使えます。

変数 を1つ変更して、同じコードを別条件で再実行し、差分の理由を1段落でまとめてください。

## 手を動かす 5: 小さな検証を自動化する

最後に、期待する性質を `assert` で固定します。これはテストの最小形で、理解の確認にも使えます。

In [None]:
normalized = normalize(scores)
assert len(normalized) == len(scores)
assert min(normalized) >= 0.0
assert max(normalized) <= 1.0
print('checks passed')

コードを読むだけでなく、実行して仮説を確認する流れを作ると学習効率が上がります。以後の章でもこの確認ループを維持してください。

変数 を1つ変更して、同じコードを別条件で再実行し、差分の理由を1段落でまとめてください。

## 最後のチェック

1. 型が想定と違っていても気づかず処理が進んでしまう
2. 条件分岐の境界値を検証しない
3. 同じロジックを複数箇所にコピペして保守不能になる

思考実験: 同じ処理を、要素数 0 / 1 / 10^6 のデータで実行したときの壊れ方を比較します。

同じ問題を別の実装で解き、何が本質かを比較してください。

次は「Pandasの使い方」へ進み、今回のコードと何が変わるかを比較してください。