# NumPy 初級チュートリアル

このチュートリアルでは、Python の数値計算ライブラリ **NumPy** の基本を学びます。NumPy は科学技術計算の基盤となるライブラリで、pandas や scipy など多くのライブラリが NumPy を基盤としています。

## 学習内容
1. NumPy とは
2. 配列（ndarray）の作成
3. 配列の属性
4. インデックスとスライス
5. 配列の演算
6. ユニバーサル関数
7. 基本的な統計関数
8. 配列の形状操作

## 環境設定

In [None]:
# JupyterLite 環境でのパッケージインストール
import sys
if 'pyodide' in sys.modules:
    import piplite
    await piplite.install('numpy')

import numpy as np
print(f'NumPy version: {np.__version__}')

---
## 1. NumPy とは

NumPy（Numerical Python）は、Python で高速な数値計算を行うためのライブラリです。

### NumPy の特徴
- **ndarray**: 高速な多次元配列オブジェクト
- **ベクトル化演算**: ループを使わずに配列全体に演算を適用
- **ブロードキャスト**: 異なる形状の配列間での演算
- **線形代数・フーリエ変換・乱数生成**: 豊富な数学関数

In [None]:
# Python リストと NumPy 配列の速度比較
import time

# Python リストでの計算
python_list = list(range(1000000))
start = time.time()
result_list = [x * 2 for x in python_list]
python_time = time.time() - start

# NumPy 配列での計算
numpy_array = np.arange(1000000)
start = time.time()
result_array = numpy_array * 2
numpy_time = time.time() - start

print(f'Python リスト: {python_time:.4f} 秒')
print(f'NumPy 配列: {numpy_time:.4f} 秒')
print(f'NumPy は約 {python_time / numpy_time:.1f} 倍高速')

---
## 2. 配列（ndarray）の作成

NumPy の中心となるデータ構造は `ndarray`（N-dimensional array）です。

### 2.1 リストから配列を作成

In [None]:
# 1次元配列
arr1d = np.array([1, 2, 3, 4, 5])
print('1次元配列:', arr1d)
print('型:', type(arr1d))

In [None]:
# 2次元配列（行列）
arr2d = np.array([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])
print('2次元配列:')
print(arr2d)

In [None]:
# 3次元配列
arr3d = np.array([[[1, 2], [3, 4]],
                  [[5, 6], [7, 8]]])
print('3次元配列:')
print(arr3d)
print('形状:', arr3d.shape)

### 2.2 特殊な配列の作成

In [None]:
# ゼロ配列
zeros = np.zeros((3, 4))
print('ゼロ配列 (3x4):')
print(zeros)

In [None]:
# 1で満たされた配列
ones = np.ones((2, 3))
print('1の配列 (2x3):')
print(ones)

In [None]:
# 任意の値で満たされた配列
full = np.full((2, 2), 7)
print('7で満たされた配列:')
print(full)

In [None]:
# 単位行列
identity = np.eye(3)
print('単位行列 (3x3):')
print(identity)

In [None]:
# 対角行列
diag = np.diag([1, 2, 3, 4])
print('対角行列:')
print(diag)

### 2.3 数列の生成

In [None]:
# arange: 等差数列（終点を含まない）
arr_range = np.arange(0, 10, 2)  # 0から10未満まで、2刻み
print('arange(0, 10, 2):', arr_range)

In [None]:
# linspace: 等間隔の数列（終点を含む）
arr_lin = np.linspace(0, 1, 5)  # 0から1まで5個の等間隔
print('linspace(0, 1, 5):', arr_lin)

In [None]:
# logspace: 対数スケールの等間隔
arr_log = np.logspace(0, 3, 4)  # 10^0 から 10^3 まで4個
print('logspace(0, 3, 4):', arr_log)

### 2.4 乱数による配列生成

In [None]:
# 乱数シードの設定（再現性のため）
np.random.seed(42)

# 一様乱数 [0, 1)
uniform = np.random.rand(3, 3)
print('一様乱数 (3x3):')
print(uniform)

In [None]:
# 標準正規乱数
normal = np.random.randn(3, 3)
print('標準正規乱数 (3x3):')
print(normal)

In [None]:
# 整数乱数
integers = np.random.randint(1, 100, size=(3, 4))
print('整数乱数 1-99 (3x4):')
print(integers)

### 練習問題 2

1. 5x5 のゼロ行列を作成し、対角成分を 1, 2, 3, 4, 5 に設定してください
2. 0 から 100 まで 11 個の等間隔の数列を作成してください

In [None]:
# 練習問題 2 の解答をここに書いてください


---
## 3. 配列の属性

ndarray には様々な属性があります。

In [None]:
arr = np.array([[1, 2, 3, 4],
                [5, 6, 7, 8],
                [9, 10, 11, 12]])

print('配列:')
print(arr)
print()
print(f'shape (形状): {arr.shape}')       # 行数 x 列数
print(f'ndim (次元数): {arr.ndim}')       # 次元の数
print(f'size (要素数): {arr.size}')       # 全要素数
print(f'dtype (データ型): {arr.dtype}')  # データ型

In [None]:
# データ型の指定
arr_float = np.array([1, 2, 3], dtype=np.float64)
arr_int = np.array([1.5, 2.7, 3.9], dtype=np.int32)
arr_complex = np.array([1, 2, 3], dtype=np.complex128)

print(f'float64: {arr_float}, dtype: {arr_float.dtype}')
print(f'int32: {arr_int}, dtype: {arr_int.dtype}')  # 小数点以下は切り捨て
print(f'complex128: {arr_complex}, dtype: {arr_complex.dtype}')

---
## 4. インデックスとスライス

配列の要素にアクセスする方法を学びます。

### 4.1 1次元配列のインデックス

In [None]:
arr = np.array([10, 20, 30, 40, 50])
print('配列:', arr)
print(f'arr[0] = {arr[0]}')    # 最初の要素
print(f'arr[-1] = {arr[-1]}')  # 最後の要素
print(f'arr[1:4] = {arr[1:4]}')  # インデックス 1 から 3 まで

### 4.2 2次元配列のインデックス

In [None]:
arr2d = np.array([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])
print('2次元配列:')
print(arr2d)
print()
print(f'arr2d[0, 0] = {arr2d[0, 0]}')  # 1行1列目
print(f'arr2d[1, 2] = {arr2d[1, 2]}')  # 2行3列目
print(f'arr2d[2] = {arr2d[2]}')        # 3行目全体

### 4.3 スライス

In [None]:
arr2d = np.arange(1, 17).reshape(4, 4)
print('元の配列:')
print(arr2d)
print()

# 行のスライス
print('最初の2行:')
print(arr2d[:2])
print()

# 列のスライス
print('最初の2列:')
print(arr2d[:, :2])
print()

# 部分行列
print('中央の 2x2 部分:')
print(arr2d[1:3, 1:3])

### 4.4 ブールインデックス

In [None]:
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print('元の配列:', arr)

# 条件を満たす要素を抽出
mask = arr > 5
print('mask (arr > 5):', mask)
print('5より大きい要素:', arr[mask])

# 複数条件
print('3以上7以下の要素:', arr[(arr >= 3) & (arr <= 7)])

### 4.5 ファンシーインデックス

In [None]:
arr = np.array([10, 20, 30, 40, 50])

# インデックスのリストで複数要素を取得
indices = [0, 2, 4]
print('arr[[0, 2, 4]]:', arr[indices])

# 2次元配列でのファンシーインデックス
arr2d = np.arange(1, 10).reshape(3, 3)
print('\n2次元配列:')
print(arr2d)
print('\narr2d[[0, 2], [1, 2]]:', arr2d[[0, 2], [1, 2]])  # (0,1) と (2,2) の要素

### 練習問題 4

以下の配列から指定された要素を抽出してください。

```python
arr = np.arange(1, 26).reshape(5, 5)
```

1. 3行目全体
2. 最後の列
3. 偶数の要素のみ
4. 右下の 3x3 部分行列

In [None]:
# 練習問題 4 の解答をここに書いてください
arr = np.arange(1, 26).reshape(5, 5)
print('元の配列:')
print(arr)


---
## 5. 配列の演算

NumPy の配列演算は要素ごと（element-wise）に行われます。

### 5.1 算術演算

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([10, 20, 30, 40])

print(f'a = {a}')
print(f'b = {b}')
print(f'a + b = {a + b}')  # 加算
print(f'a - b = {a - b}')  # 減算
print(f'a * b = {a * b}')  # 乗算（要素ごと）
print(f'b / a = {b / a}')  # 除算
print(f'a ** 2 = {a ** 2}')  # べき乗

### 5.2 スカラーとの演算

In [None]:
arr = np.array([1, 2, 3, 4, 5])
print(f'arr = {arr}')
print(f'arr + 10 = {arr + 10}')
print(f'arr * 2 = {arr * 2}')
print(f'arr / 2 = {arr / 2}')

### 5.3 ブロードキャスト

異なる形状の配列間で演算を行う仕組みです。

In [None]:
# 2次元配列と1次元配列の演算
arr2d = np.array([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])
arr1d = np.array([10, 20, 30])

print('2次元配列:')
print(arr2d)
print('\n1次元配列:', arr1d)
print('\n2次元 + 1次元（各行に加算）:')
print(arr2d + arr1d)

In [None]:
# 列ベクトルとの演算
col_vec = np.array([[100], [200], [300]])
print('2次元配列:')
print(arr2d)
print('\n列ベクトル:')
print(col_vec)
print('\n2次元 + 列ベクトル（各列に加算）:')
print(arr2d + col_vec)

### 5.4 比較演算

In [None]:
arr = np.array([1, 2, 3, 4, 5])
print(f'arr = {arr}')
print(f'arr > 3: {arr > 3}')
print(f'arr == 3: {arr == 3}')
print(f'arr != 3: {arr != 3}')

---
## 6. ユニバーサル関数（ufunc）

配列の各要素に対して高速に演算を行う関数です。

### 6.1 数学関数

In [None]:
arr = np.array([0, np.pi/6, np.pi/4, np.pi/3, np.pi/2])

print('角度（ラジアン）:', arr)
print('sin:', np.sin(arr))
print('cos:', np.cos(arr))
print('tan:', np.tan(arr[:4]))  # π/2 は除外

In [None]:
arr = np.array([1, 2, 3, 4, 5])

print('元の配列:', arr)
print('平方根:', np.sqrt(arr))
print('指数関数:', np.exp(arr))
print('自然対数:', np.log(arr))
print('常用対数:', np.log10(arr))

### 6.2 丸め関数

In [None]:
arr = np.array([1.2, 2.5, 3.7, -1.2, -2.5, -3.7])

print('元の配列:', arr)
print('四捨五入:', np.round(arr))
print('切り捨て:', np.floor(arr))
print('切り上げ:', np.ceil(arr))
print('ゼロ方向への切り捨て:', np.trunc(arr))

### 6.3 集約関数

In [None]:
arr = np.array([[1, 2, 3],
                [4, 5, 6],
                [7, 8, 9]])
print('配列:')
print(arr)
print()

print(f'全要素の合計: {np.sum(arr)}')
print(f'行ごとの合計: {np.sum(arr, axis=1)}')
print(f'列ごとの合計: {np.sum(arr, axis=0)}')
print()
print(f'全要素の積: {np.prod(arr)}')
print(f'累積和: {np.cumsum(arr.flatten())}')

---
## 7. 基本的な統計関数

NumPy には基本的な統計計算のための関数が用意されています。

In [None]:
np.random.seed(42)
data = np.random.randn(100)  # 標準正規分布からのサンプル

print('--- 基本統計量 ---')
print(f'平均: {np.mean(data):.4f}')
print(f'中央値: {np.median(data):.4f}')
print(f'標準偏差: {np.std(data):.4f}')
print(f'分散: {np.var(data):.4f}')
print(f'最小値: {np.min(data):.4f}')
print(f'最大値: {np.max(data):.4f}')

In [None]:
# パーセンタイル
print('--- パーセンタイル ---')
print(f'25%点: {np.percentile(data, 25):.4f}')
print(f'50%点: {np.percentile(data, 50):.4f}')
print(f'75%点: {np.percentile(data, 75):.4f}')

In [None]:
# 2次元配列での軸指定
arr2d = np.array([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])
print('配列:')
print(arr2d)
print()
print(f'各列の平均: {np.mean(arr2d, axis=0)}')
print(f'各行の平均: {np.mean(arr2d, axis=1)}')
print(f'各列の標準偏差: {np.std(arr2d, axis=0)}')

In [None]:
# 相関係数と共分散
np.random.seed(42)
x = np.random.randn(50)
y = 2 * x + np.random.randn(50) * 0.5  # x と相関のあるデータ

print('相関係数行列:')
print(np.corrcoef(x, y))
print()
print('共分散行列:')
print(np.cov(x, y))

### 練習問題 7

以下のデータについて統計量を計算してください。

```python
scores = np.array([78, 85, 92, 67, 88, 95, 72, 81, 89, 76])
```

1. 平均点、中央値、標準偏差を計算
2. 最高点と最低点、およびその差（レンジ）を求める
3. 80点以上の人数を数える

In [None]:
# 練習問題 7 の解答をここに書いてください
scores = np.array([78, 85, 92, 67, 88, 95, 72, 81, 89, 76])


---
## 8. 配列の形状操作

配列の形を変更する様々な方法を学びます。

### 8.1 reshape

In [None]:
arr = np.arange(12)
print('元の配列:', arr)
print()

# 3行4列に変形
reshaped = arr.reshape(3, 4)
print('reshape(3, 4):')
print(reshaped)
print()

# -1 を使うと自動計算
reshaped2 = arr.reshape(4, -1)
print('reshape(4, -1):')
print(reshaped2)

### 8.2 flatten と ravel

In [None]:
arr2d = np.array([[1, 2, 3],
                  [4, 5, 6]])
print('元の配列:')
print(arr2d)
print()

# flatten: コピーを返す
flat = arr2d.flatten()
print('flatten():', flat)

# ravel: 可能ならビューを返す
rav = arr2d.ravel()
print('ravel():', rav)

### 8.3 転置

In [None]:
arr = np.arange(6).reshape(2, 3)
print('元の配列 (2x3):')
print(arr)
print()

print('転置 (3x2):')
print(arr.T)

### 8.4 配列の結合

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])

print('配列 a:')
print(a)
print('\n配列 b:')
print(b)

# 縦方向に結合（行を追加）
print('\nvstack (縦結合):')
print(np.vstack([a, b]))

# 横方向に結合（列を追加）
print('\nhstack (横結合):')
print(np.hstack([a, b]))

In [None]:
# concatenate: 軸を指定して結合
print('concatenate (axis=0):')
print(np.concatenate([a, b], axis=0))

print('\nconcatenate (axis=1):')
print(np.concatenate([a, b], axis=1))

### 8.5 配列の分割

In [None]:
arr = np.arange(16).reshape(4, 4)
print('元の配列:')
print(arr)
print()

# 縦方向に分割
top, bottom = np.vsplit(arr, 2)
print('vsplit (上半分):')
print(top)
print('\nvsplit (下半分):')
print(bottom)

In [None]:
# 横方向に分割
left, right = np.hsplit(arr, 2)
print('hsplit (左半分):')
print(left)
print('\nhsplit (右半分):')
print(right)

---
## まとめ

このチュートリアルで学んだ内容：

| トピック | 主な関数・操作 |
|---------|---------------|
| 配列の作成 | `array()`, `zeros()`, `ones()`, `arange()`, `linspace()` |
| 配列の属性 | `shape`, `ndim`, `size`, `dtype` |
| インデックス | `arr[i]`, `arr[i, j]`, スライス, ブールインデックス |
| 算術演算 | `+`, `-`, `*`, `/`, `**`（要素ごと） |
| ユニバーサル関数 | `sin()`, `cos()`, `sqrt()`, `exp()`, `log()` |
| 統計関数 | `mean()`, `std()`, `var()`, `min()`, `max()`, `sum()` |
| 形状操作 | `reshape()`, `flatten()`, `T`, `vstack()`, `hstack()` |

---
## 練習問題の解答例

In [None]:
# 練習問題 2 の解答例
print('--- 練習問題 2 ---')

# 1. 5x5 のゼロ行列を作成し、対角成分を 1, 2, 3, 4, 5 に設定
mat = np.zeros((5, 5))
np.fill_diagonal(mat, [1, 2, 3, 4, 5])
print('対角成分を設定した行列:')
print(mat)

# 別解: np.diag を使う
mat2 = np.diag([1, 2, 3, 4, 5])
print('\nnp.diag を使った別解:')
print(mat2)

# 2. 0 から 100 まで 11 個の等間隔の数列
print('\n0 から 100 まで 11 個:', np.linspace(0, 100, 11))

In [None]:
# 練習問題 4 の解答例
print('--- 練習問題 4 ---')
arr = np.arange(1, 26).reshape(5, 5)
print('元の配列:')
print(arr)

# 1. 3行目全体
print('\n3行目:', arr[2])

# 2. 最後の列
print('最後の列:', arr[:, -1])

# 3. 偶数の要素のみ
print('偶数の要素:', arr[arr % 2 == 0])

# 4. 右下の 3x3 部分行列
print('右下 3x3:')
print(arr[2:, 2:])

In [None]:
# 練習問題 7 の解答例
print('--- 練習問題 7 ---')
scores = np.array([78, 85, 92, 67, 88, 95, 72, 81, 89, 76])

# 1. 平均点、中央値、標準偏差
print(f'平均点: {np.mean(scores):.2f}')
print(f'中央値: {np.median(scores):.2f}')
print(f'標準偏差: {np.std(scores):.2f}')

# 2. 最高点と最低点、レンジ
print(f'\n最高点: {np.max(scores)}')
print(f'最低点: {np.min(scores)}')
print(f'レンジ: {np.ptp(scores)}')  # ptp = peak to peak

# 3. 80点以上の人数
print(f'\n80点以上の人数: {np.sum(scores >= 80)}人')