In [None]:
import numpy as np

---
# 基本的な配列操作

## 配列の作成

In [None]:
# 基本的な配列作成
arr1 = np.array([1, 2, 3, 4, 5])               # リストから配列作成
arr2 = np.zeros((3, 4))                        # 0で初期化された配列
arr3 = np.ones((3, 4))                         # 1で初期化された配列
arr4 = np.empty((3, 4))                        # 未初期化配列
arr5 = np.arange(10)                           # 0から9までの配列
arr6 = np.linspace(0, 1, 5)                    # 0から1までを5等分

# 特殊な配列
eye = np.eye(3)                                # 3x3の単位行列
diag = np.diag([1, 2, 3])

## ランダムな値の生成

In [None]:
random_normal = np.random.normal(0, 1, (100, 2))    # 正規分布
random_uniform = np.random.uniform(0, 1, (100, 2))  # 一様分布
random_integers = np.random.randint(0, 10, (5, 5))  # ランダムな整数

## 配列の基本情報

In [None]:
print(arr1.shape)                              # 形状
print(arr1.dtype)                              # データ型
print(arr1.size)                               # 要素数
print(arr1.ndim)                               # 次元数

arr = np.array([1, 1, 2, 3, 2, 1, 4])
counts = np.bincount(arr)
print("元の配列:", arr)
print("カウント結果:", counts)
print("インデックス:", np.arange(len(counts)))

# 出力:
# 元の配列: [1 1 2 3 2 1 4]
# カウント結果: [0 3 2 1 1]
# インデックス: [0 1 2 3 4]
# → 0は0回、1は3回、2は2回、3は1回、4は1回出現

---
# 配列の操作と変形

## スライシングと要素アクセス

In [None]:
arr = np.array([[1, 2, 3], [4, 5, 6]])
print(arr[0, 1])                               # 特定要素へのアクセス
print(arr[:, 1])                               # 列の取得
print(arr[0, :])                               # 行の取得

## 配列の変形

In [None]:
arr = np.arange(12)
reshaped = arr.reshape(3, 4)                   # 3x4に変形
flattened = arr.flatten()                      # 1次元に平坦化
transposed = arr.reshape(3, 4).T               # 転置

## 配列の結合

In [None]:
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])
vertical = np.vstack((arr1, arr2))             # 垂直方向の結合
horizontal = np.hstack((arr1, arr2))           # 水平方向の結合
concatenated = np.concatenate((arr1, arr2))    # 結合

## 配列の分割

In [None]:
split_arr = np.split(arr, 3)                   # 3つに分割
hsplit = np.hsplit(arr, 2)                     # 水平方向に分割
vsplit = np.vsplit(arr, 2)                     # 垂直方向に分割

---
# 数学的操作

## 基本的な演算

In [None]:
arr = np.array([1, 2, 3, 4])
print(arr + 2)                                 # 各要素に2を加算
print(arr * 2)                                 # 各要素を2倍
print(arr ** 2)                                # 各要素を2乗

## 統計演算

In [None]:
print(np.mean(arr))                            # 平均
print(np.median(arr))                          # 中央値
print(np.std(arr))                             # 標準偏差
print(np.var(arr))                             # 分散
print(np.min(arr))                             # 最小値
print(np.max(arr))                             # 最大値
print(np.sum(arr))                             # 合計
print(np.prod(arr))                            # 積

## 線形代数演算

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])
print(np.dot(a, b))                            # 行列積
print(np.linalg.inv(a))                        # 逆行列
print(np.linalg.det(a))                        # 行列式
eigenvalues = np.linalg.eigvals(a)             # 固有値

---
# 機械学習のための操作

## データの正規化

In [None]:
data = np.array([[1, 2], [3, 4], [5, 6]])
normalized = (data - np.mean(data, axis=0)) / np.std(data, axis=0)

## マスキング操作

In [None]:
data = np.array([1, 2, 3, 4, 5])
mask = data > 3
filtered_data = data[mask]                          # 条件に合う要素の抽出

## 次元の追加と削除

In [None]:
data = np.array([1, 2, 3])
expanded = np.expand_dims(data, axis=0)             # 次元の追加
squeezed = np.squeeze(expanded)                     # 次元の削除

---
# 高度な操作

## ブロードキャスト

In [None]:
arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([10, 20, 30])
result = arr1 + arr2                               # 自動的にブロードキャスト

## ユニバーサル関数

In [None]:
arr = np.array([1, 2, 3, 4])
print(np.sqrt(arr))                                # 平方根
print(np.exp(arr))                                 # 指数
print(np.log(arr))                                 # 自然対数
print(np.sin(arr))                                 # サイン

## 集約関数

In [None]:
data = np.array([[1, 2], [3, 4], [5, 6]])
print(np.sum(data, axis=0))                        # 列方向の合計
print(np.mean(data, axis=1))                       # 行方向の平均
print(np.cumsum(data))                             # 累積和
print(np.cumprod(data))                            # 累積積

---
# 応用

In [None]:
### 特徴量の標準化
def standardize(X):
    """特徴量の標準化"""
    mean = np.mean(X, axis=0)
    std = np.std(X, axis=0)
    return (X - mean) / std



In [None]:
### 主成分分析（PCA）の実装例
def simple_pca(X, n_components):
    """簡単なPCAの実装"""
    # 平均を引く
    X_centered = X - np.mean(X, axis=0)
    
    # 共分散行列の計算
    cov_matrix = np.dot(X_centered.T, X_centered) / X_centered.shape[0]
    
    # 固有値と固有ベクトルの計算
    eigenvalues, eigenvectors = np.linalg.eigh(cov_matrix)
    
    # 上位n_components個の固有ベクトルを選択
    indices = np.argsort(eigenvalues)[::-1][:n_components]
    selected_eigenvectors = eigenvectors[:, indices]
    
    # データを変換
    return np.dot(X_centered, selected_eigenvectors)

### ミニバッチの生成
def create_minibatches(X, batch_size):
    """データをミニバッチに分割"""
    indices = np.random.permutation(len(X))
    return np.array_split(X[indices], len(X) // batch_size)

In [None]:
### 欠損値の処理
def handle_missing(X):
    """欠損値を平均値で補完"""
    mean_vals = np.nanmean(X, axis=0)
    mask = np.isnan(X)
    X[mask] = np.take(mean_vals, np.where(mask)[1])
    return X

### One-hot エンコーディング
def one_hot_encode(labels, num_classes):
    """ラベルのOne-hotエンコーディング"""
    return np.eye(num_classes)[labels]

### データの正規化
def normalize_data(X):
    """データを0-1の範囲に正規化"""
    return (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))

In [None]:
### ベクトル化された操作
# 遅い方法（ループ使用）
def slow_distance(x1, x2):
    n = len(x1)
    result = 0
    for i in range(n):
        result += (x1[i] - x2[i]) ** 2
    return np.sqrt(result)

# 速い方法（ベクトル化）
def fast_distance(x1, x2):
    return np.sqrt(np.sum((x1 - x2) ** 2))

### メモリ効率の良い操作
# 大きな配列の効率的な処理
def process_large_array(filename, chunk_size):
    """大きな配列を分割して処理"""
    with np.load(filename) as data:
        for chunk in np.array_split(data, len(data) // chunk_size):
            # chunkの処理
            process_chunk(chunk)