# NumPy 中級チュートリアル

このチュートリアルでは、NumPy の発展的な機能を学びます。線形代数、高度な配列操作、パフォーマンス最適化のテクニックを習得しましょう。

## 学習内容
1. 線形代数演算
2. 高度なインデックス操作
3. ブロードキャストの詳細
4. 構造化配列
5. メモリレイアウトとビュー
6. ベクトル化とパフォーマンス
7. ファイル入出力
8. 乱数生成（新API）

## 環境設定

In [None]:
# JupyterLite 環境でのパッケージインストール
import sys
if 'pyodide' in sys.modules:
    import piplite
    await piplite.install('numpy')

import numpy as np
print(f'NumPy version: {np.__version__}')

---
## 1. 線形代数演算

NumPy の `linalg` モジュールは線形代数の基本演算を提供します。

### 1.1 行列の積

In [None]:
A = np.array([[1, 2],
              [3, 4]])
B = np.array([[5, 6],
              [7, 8]])

print('行列 A:')
print(A)
print('\n行列 B:')
print(B)

# 要素ごとの積（アダマール積）
print('\n要素ごとの積 (A * B):')
print(A * B)

# 行列の積
print('\n行列の積 (A @ B):')
print(A @ B)

# np.dot も使える
print('\nnp.dot(A, B):')
print(np.dot(A, B))

### 1.2 ベクトルの内積・外積

In [None]:
v1 = np.array([1, 2, 3])
v2 = np.array([4, 5, 6])

# 内積
print(f'v1 = {v1}')
print(f'v2 = {v2}')
print(f'内積 (v1 · v2): {np.dot(v1, v2)}')
print(f'内積 (v1 @ v2): {v1 @ v2}')

# 外積（3次元ベクトル）
print(f'外積 (v1 × v2): {np.cross(v1, v2)}')

# 外積（テンソル積）
print('\n外積（テンソル積）:')
print(np.outer(v1, v2))

### 1.3 行列式と逆行列

In [None]:
A = np.array([[1, 2],
              [3, 4]])

print('行列 A:')
print(A)

# 行列式
det = np.linalg.det(A)
print(f'\n行列式: {det:.4f}')

# 逆行列
A_inv = np.linalg.inv(A)
print('\n逆行列:')
print(A_inv)

# 検証: A @ A_inv = I
print('\nA @ A_inv (単位行列になるはず):')
print(np.round(A @ A_inv, 10))

### 1.4 固有値と固有ベクトル

In [None]:
A = np.array([[4, 2],
              [1, 3]])

print('行列 A:')
print(A)

# 固有値と固有ベクトル
eigenvalues, eigenvectors = np.linalg.eig(A)

print(f'\n固有値: {eigenvalues}')
print('固有ベクトル（列ごと）:')
print(eigenvectors)

# 検証: A @ v = λ @ v
for i in range(len(eigenvalues)):
    v = eigenvectors[:, i]
    lam = eigenvalues[i]
    print(f'\n固有値 {lam:.4f} の検証:')
    print(f'  A @ v = {A @ v}')
    print(f'  λ * v = {lam * v}')

### 1.5 連立方程式の解法

In [None]:
# 連立方程式: Ax = b
# 2x + y = 5
# x + 3y = 7

A = np.array([[2, 1],
              [1, 3]])
b = np.array([5, 7])

# 解を求める
x = np.linalg.solve(A, b)
print('連立方程式 Ax = b の解:')
print(f'x = {x}')

# 検証
print(f'\n検証 (A @ x): {A @ x}')
print(f'b: {b}')

### 1.6 特異値分解（SVD）

In [None]:
A = np.array([[1, 2, 3],
              [4, 5, 6]])

print('行列 A:')
print(A)

# 特異値分解
U, s, Vt = np.linalg.svd(A)

print('\nU (左特異ベクトル):')
print(U)
print(f'\n特異値: {s}')
print('\nVt (右特異ベクトルの転置):')
print(Vt)

# 復元: A = U @ S @ Vt
S = np.zeros_like(A, dtype=float)
S[:len(s), :len(s)] = np.diag(s)
A_reconstructed = U @ S @ Vt
print('\n復元された行列:')
print(np.round(A_reconstructed, 10))

### 1.7 ノルム

In [None]:
v = np.array([3, 4])
A = np.array([[1, 2],
              [3, 4]])

print(f'ベクトル v = {v}')
print(f'L2ノルム（ユークリッド）: {np.linalg.norm(v)}')
print(f'L1ノルム: {np.linalg.norm(v, ord=1)}')
print(f'無限大ノルム: {np.linalg.norm(v, ord=np.inf)}')

print('\n行列 A:')
print(A)
print(f'フロベニウスノルム: {np.linalg.norm(A)}')
print(f'行列の最大ノルム: {np.linalg.norm(A, ord=np.inf)}')

### 練習問題 1

以下の連立方程式を解いてください。

```
x + 2y + 3z = 14
4x + 5y + 6z = 32
7x + 8y + 10z = 53
```

In [None]:
# 練習問題 1 の解答をここに書いてください


---
## 2. 高度なインデックス操作

### 2.1 np.where

In [None]:
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

# 条件を満たす要素のインデックスを取得
indices = np.where(arr > 5)
print(f'arr > 5 のインデックス: {indices[0]}')

# 条件に応じて値を選択（三項演算子的な使い方）
result = np.where(arr > 5, arr * 10, arr)
print(f'5より大きければ10倍、そうでなければそのまま: {result}')

### 2.2 np.select

In [None]:
# 複数条件での選択
scores = np.array([45, 65, 75, 85, 95])

conditions = [
    scores >= 90,
    scores >= 80,
    scores >= 70,
    scores >= 60
]
choices = ['A', 'B', 'C', 'D']

grades = np.select(conditions, choices, default='F')
print(f'点数: {scores}')
print(f'成績: {grades}')

### 2.3 np.take と np.put

In [None]:
arr = np.array([10, 20, 30, 40, 50])

# 指定インデックスの要素を取得
indices = [0, 2, 4]
print(f'np.take: {np.take(arr, indices)}')

# 指定インデックスに値を設定
arr_copy = arr.copy()
np.put(arr_copy, [1, 3], [200, 400])
print(f'np.put後: {arr_copy}')

### 2.4 np.argmax, np.argmin, np.argsort

In [None]:
arr = np.array([3, 1, 4, 1, 5, 9, 2, 6])

print(f'配列: {arr}')
print(f'最大値のインデックス: {np.argmax(arr)}')
print(f'最小値のインデックス: {np.argmin(arr)}')
print(f'ソート後のインデックス: {np.argsort(arr)}')
print(f'ソートされた配列: {arr[np.argsort(arr)]}')

In [None]:
# 2次元配列での軸指定
arr2d = np.array([[3, 7, 2],
                  [8, 1, 5],
                  [4, 6, 9]])

print('2次元配列:')
print(arr2d)
print(f'\n各列の最大値のインデックス: {np.argmax(arr2d, axis=0)}')
print(f'各行の最大値のインデックス: {np.argmax(arr2d, axis=1)}')

### 2.5 np.nonzero と np.flatnonzero

In [None]:
arr = np.array([0, 1, 0, 2, 0, 3, 0])

# 非ゼロ要素のインデックス
print(f'配列: {arr}')
print(f'非ゼロ要素のインデックス: {np.nonzero(arr)}')
print(f'flatnonzero: {np.flatnonzero(arr)}')

# 2次元配列
arr2d = np.array([[0, 1, 0],
                  [2, 0, 3]])
rows, cols = np.nonzero(arr2d)
print(f'\n2次元での非ゼロ位置:')
print(f'  行: {rows}')
print(f'  列: {cols}')

---
## 3. ブロードキャストの詳細

ブロードキャストのルールを詳しく理解しましょう。

### 3.1 ブロードキャストのルール

1. 次元数が異なる場合、少ない方の形状の先頭に 1 を追加
2. 各次元のサイズが同じか、どちらかが 1 の場合にブロードキャスト可能
3. サイズが 1 の次元は、もう一方のサイズに拡張される

In [None]:
# 例1: (3, 3) と (3,) → (3, 3)
A = np.ones((3, 3))
b = np.array([1, 2, 3])

print('A の形状:', A.shape)
print('b の形状:', b.shape)
print('\nA + b:')
print(A + b)

In [None]:
# 例2: (3, 1) と (1, 4) → (3, 4)
a = np.array([[1], [2], [3]])  # (3, 1)
b = np.array([[10, 20, 30, 40]])  # (1, 4)

print('a の形状:', a.shape)
print('b の形状:', b.shape)
print('\na + b:')
print(a + b)

In [None]:
# np.newaxis を使った次元追加
arr = np.array([1, 2, 3])
print(f'元の形状: {arr.shape}')

row_vec = arr[np.newaxis, :]  # (1, 3)
col_vec = arr[:, np.newaxis]  # (3, 1)

print(f'行ベクトル: {row_vec.shape}')
print(f'列ベクトル: {col_vec.shape}')

# 外積を計算
print('\n外積 (col @ row):')
print(col_vec * row_vec)

### 3.2 broadcast_to と broadcast_arrays

In [None]:
# 配列を指定の形状にブロードキャスト
arr = np.array([1, 2, 3])
broadcasted = np.broadcast_to(arr, (4, 3))
print('ブロードキャスト結果 (4, 3):')
print(broadcasted)

In [None]:
# 複数配列を共通の形状にブロードキャスト
a = np.array([[1], [2], [3]])
b = np.array([10, 20, 30])

a_bc, b_bc = np.broadcast_arrays(a, b)
print('a をブロードキャスト:')
print(a_bc)
print('\nb をブロードキャスト:')
print(b_bc)

---
## 4. 構造化配列

異なるデータ型を持つフィールドを含む配列です。

In [None]:
# 構造化データ型の定義
dt = np.dtype([('name', 'U10'),    # Unicode文字列（最大10文字）
               ('age', 'i4'),       # 32ビット整数
               ('height', 'f8')])   # 64ビット浮動小数点

# データの作成
data = np.array([('Alice', 25, 165.5),
                 ('Bob', 30, 178.2),
                 ('Charlie', 35, 172.0)],
                dtype=dt)

print('構造化配列:')
print(data)
print(f'\nデータ型: {data.dtype}')

In [None]:
# フィールドへのアクセス
print(f'名前: {data["name"]}')
print(f'年齢: {data["age"]}')
print(f'身長: {data["height"]}')

# フィルタリング
print(f'\n30歳以上: {data[data["age"] >= 30]}')

In [None]:
# レコードへのアクセス
print('最初のレコード:', data[0])
print('最初のレコードの名前:', data[0]['name'])

# ソート
sorted_by_age = np.sort(data, order='age')
print('\n年齢でソート:')
print(sorted_by_age)

---
## 5. メモリレイアウトとビュー

### 5.1 C順序とFortran順序

In [None]:
# C順序（行優先）とFortran順序（列優先）
arr_c = np.array([[1, 2, 3],
                  [4, 5, 6]], order='C')  # C順序（デフォルト）
arr_f = np.array([[1, 2, 3],
                  [4, 5, 6]], order='F')  # Fortran順序

print('C順序のメモリレイアウト:', arr_c.ravel('K'))
print('Fortran順序のメモリレイアウト:', arr_f.ravel('K'))

print(f'\narr_c.flags.c_contiguous: {arr_c.flags.c_contiguous}')
print(f'arr_f.flags.f_contiguous: {arr_f.flags.f_contiguous}')

### 5.2 ビューとコピー

In [None]:
original = np.array([1, 2, 3, 4, 5])

# ビュー（元のデータを共有）
view = original[1:4]
view[0] = 100
print(f'ビューを変更後の元配列: {original}')

# コピー（独立したデータ）
original = np.array([1, 2, 3, 4, 5])
copy = original[1:4].copy()
copy[0] = 100
print(f'コピーを変更後の元配列: {original}')

In [None]:
# ビューかどうかを確認
original = np.array([[1, 2, 3],
                     [4, 5, 6]])

slice_view = original[:, 0]  # ビュー
fancy_copy = original[[0, 1], 0]  # コピー（ファンシーインデックス）

print(f'スライスはビュー: {slice_view.base is original}')
print(f'ファンシーインデックスはコピー: {fancy_copy.base is None}')

### 5.3 strides

In [None]:
arr = np.arange(12).reshape(3, 4)

print('配列:')
print(arr)
print(f'\n形状: {arr.shape}')
print(f'ストライド: {arr.strides}')  # 次の要素/行に移動するためのバイト数
print(f'要素サイズ: {arr.itemsize} バイト')

---
## 6. ベクトル化とパフォーマンス

### 6.1 ループ vs ベクトル化

In [None]:
import time

# サンプルデータ
np.random.seed(42)
data = np.random.randn(100000)

# ループによる計算
def loop_sum_squares(arr):
    result = 0
    for x in arr:
        result += x ** 2
    return result

start = time.time()
result_loop = loop_sum_squares(data)
time_loop = time.time() - start

# ベクトル化による計算
start = time.time()
result_vectorized = np.sum(data ** 2)
time_vectorized = time.time() - start

print(f'ループ: {time_loop:.6f} 秒')
print(f'ベクトル化: {time_vectorized:.6f} 秒')
print(f'高速化率: {time_loop / time_vectorized:.1f}倍')

### 6.2 np.vectorize

In [None]:
# スカラー関数を配列対応に変換
def scalar_func(x):
    if x < 0:
        return 0
    elif x < 1:
        return x
    else:
        return 1

# vectorize でラップ
vectorized_func = np.vectorize(scalar_func)

arr = np.array([-0.5, 0.3, 0.7, 1.2, 2.0])
result = vectorized_func(arr)
print(f'入力: {arr}')
print(f'出力: {result}')

### 6.3 np.einsum（アインシュタイン縮約記法）

In [None]:
A = np.array([[1, 2],
              [3, 4]])
B = np.array([[5, 6],
              [7, 8]])

# 行列の積
print('行列の積 (ij,jk->ik):')
print(np.einsum('ij,jk->ik', A, B))

# 要素ごとの積
print('\n要素ごとの積 (ij,ij->ij):')
print(np.einsum('ij,ij->ij', A, B))

# トレース（対角成分の和）
print(f'\nトレース (ii->): {np.einsum("ii->", A)}')

# 転置
print('\n転置 (ij->ji):')
print(np.einsum('ij->ji', A))

---
## 7. ファイル入出力

### 7.1 NumPy バイナリ形式

In [None]:
# 配列の保存（単一）
arr = np.array([[1, 2, 3],
                [4, 5, 6]])

# .npy 形式で保存
np.save('/tmp/array.npy', arr)

# 読み込み
loaded = np.load('/tmp/array.npy')
print('読み込んだ配列:')
print(loaded)

In [None]:
# 複数配列の保存
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

# .npz 形式で保存
np.savez('/tmp/arrays.npz', first=arr1, second=arr2)

# 読み込み
loaded = np.load('/tmp/arrays.npz')
print('first:', loaded['first'])
print('second:', loaded['second'])

### 7.2 テキスト形式

In [None]:
# テキストファイルとして保存
arr = np.array([[1.0, 2.0, 3.0],
                [4.0, 5.0, 6.0]])

np.savetxt('/tmp/array.txt', arr, fmt='%.2f', delimiter=',')

# 読み込み
loaded = np.loadtxt('/tmp/array.txt', delimiter=',')
print('テキストから読み込み:')
print(loaded)

In [None]:
# genfromtxt: より柔軟な読み込み（欠損値対応など）
# ヘッダー付きデータの例
data_str = """# x, y, z
1.0, 2.0, 3.0
4.0, , 6.0
7.0, 8.0, 9.0"""

# 文字列をファイルに書き込み
with open('/tmp/data_with_missing.csv', 'w') as f:
    f.write(data_str)

# genfromtxt で読み込み（欠損値を NaN として扱う）
data = np.genfromtxt('/tmp/data_with_missing.csv', 
                     delimiter=',', 
                     skip_header=1,
                     filling_values=np.nan)
print('欠損値を含むデータ:')
print(data)

---
## 8. 乱数生成（新API）

NumPy 1.17 以降で推奨される `Generator` ベースの乱数生成を学びます。

In [None]:
# Generator の作成
rng = np.random.default_rng(seed=42)

# 一様乱数 [0, 1)
print('一様乱数:')
print(rng.random((3, 3)))

In [None]:
# 整数乱数
print('整数乱数 (0-9):')
print(rng.integers(0, 10, size=(3, 4)))

In [None]:
# 正規分布
print('正規分布 (平均=0, 標準偏差=1):')
print(rng.standard_normal((3, 3)))

print('\n正規分布 (平均=50, 標準偏差=10):')
print(rng.normal(loc=50, scale=10, size=(3, 3)))

In [None]:
# 様々な分布
rng = np.random.default_rng(42)

# 二項分布
binomial = rng.binomial(n=10, p=0.5, size=10)
print(f'二項分布 (n=10, p=0.5): {binomial}')

# ポアソン分布
poisson = rng.poisson(lam=5, size=10)
print(f'ポアソン分布 (λ=5): {poisson}')

# 指数分布
exponential = rng.exponential(scale=2.0, size=5)
print(f'指数分布 (scale=2): {exponential}')

In [None]:
# シャッフルと選択
rng = np.random.default_rng(42)
arr = np.arange(10)

# シャッフル（インプレース）
arr_copy = arr.copy()
rng.shuffle(arr_copy)
print(f'シャッフル: {arr_copy}')

# シャッフルされたコピーを返す
permuted = rng.permutation(arr)
print(f'permutation: {permuted}')

# ランダム選択
choice = rng.choice(arr, size=5, replace=False)
print(f'ランダム選択（重複なし）: {choice}')

### 練習問題 8

1. シード 123 の Generator を作成し、平均 100、標準偏差 15 の正規分布から 1000 個のサンプルを生成してください
2. そのサンプルの平均、標準偏差、最小値、最大値を計算してください
3. 70 以上 130 以下の値の割合を計算してください

In [None]:
# 練習問題 8 の解答をここに書いてください


---
## まとめ

このチュートリアルで学んだ内容：

| トピック | 主な関数・操作 |
|---------|---------------|
| 線形代数 | `@`, `dot()`, `linalg.inv()`, `linalg.eig()`, `linalg.solve()` |
| 高度なインデックス | `where()`, `select()`, `argmax()`, `argsort()` |
| ブロードキャスト | `newaxis`, `broadcast_to()`, `broadcast_arrays()` |
| 構造化配列 | `dtype([...])`, フィールドアクセス |
| メモリ | ビューとコピー、`strides`, C/F順序 |
| パフォーマンス | ベクトル化、`vectorize()`, `einsum()` |
| ファイルI/O | `save()`, `load()`, `savetxt()`, `genfromtxt()` |
| 乱数（新API） | `default_rng()`, `Generator` メソッド |

---
## 練習問題の解答例

In [None]:
# 練習問題 1 の解答例
print('--- 練習問題 1 ---')
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 10]])
b = np.array([14, 32, 53])

x = np.linalg.solve(A, b)
print(f'解: x={x[0]:.4f}, y={x[1]:.4f}, z={x[2]:.4f}')

# 検証
print(f'検証 (A @ x): {A @ x}')
print(f'b: {b}')

In [None]:
# 練習問題 8 の解答例
print('--- 練習問題 8 ---')

# 1. Generator の作成とサンプル生成
rng = np.random.default_rng(123)
samples = rng.normal(loc=100, scale=15, size=1000)

# 2. 統計量の計算
print(f'平均: {np.mean(samples):.2f}')
print(f'標準偏差: {np.std(samples):.2f}')
print(f'最小値: {np.min(samples):.2f}')
print(f'最大値: {np.max(samples):.2f}')

# 3. 70以上130以下の割合
in_range = np.sum((samples >= 70) & (samples <= 130))
print(f'\n70以上130以下の割合: {in_range / len(samples) * 100:.1f}%')