# Multilayer Perceptron (MLP) Classification Tutorial / 多層パーセプトロン分類チュートリアル


In this tutorial, you will learn:
このチュートリアルでは、以下を学習します：

- **Nonlinear classification problems** / 非線形分類問題
- **Multilayer perceptron architecture** / 多層パーセプトロンアーキテクチャ
- **TensorFlow/Keras implementation** / TensorFlow/Keras実装
- **Comparison between linear and nonlinear models** / 線形モデルと非線形モデルの比較
- **Decision boundary visualization** / 決定境界の可視化


While perceptrons can only learn linearly separable patterns, multilayer perceptrons (MLPs) can learn complex nonlinear decision boundaries. This tutorial demonstrates the power of adding hidden layers and nonlinear activation functions.

パーセプトロンは線形分離可能なパターンしか学習できませんが、多層パーセプトロン（MLP）は複雑な非線形決定境界を学習できます。このチュートリアルでは、隠れ層と非線形活性化関数を追加することの威力を実証します。

In [None]:
# Import required libraries / 必要なライブラリをインポート
import numpy as np
import matplotlib.pyplot as plt
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Activation

np.random.seed(42)

print("Libraries imported successfully / ライブラリのインポートが完了しました")
print("TensorFlow version:", keras.__version__)

## Q1: Generate Sinusoidal Boundary Classification Data / 正弦波境界分類データの生成

Create a complex nonlinear classification problem where the decision boundary follows a sinusoidal pattern.

決定境界が正弦波パターンに従う複雑な非線形分類問題を作成します。

In [None]:
# Generate nonlinear classification data / 非線形分類データ生成
N = 500  # Number of samples / サンプル数

x = np.random.uniform(low=-1, high=1, size=(N, 2))
y = np.zeros(N)

y[x[:, 1] - np.sin(2*np.pi*x[:, 0]) > 0] = 1

plt.figure(figsize=(10, 8))
plt.plot(x[y==0, 0], x[y==0, 1], 'bo', alpha=0.6, label='Class 0', markersize=6)
plt.plot(x[y==1, 0], x[y==1, 1], 'ro', alpha=0.6, label='Class 1', markersize=6)

xx = np.linspace(-1, 1, 200)
yy = np.sin(2*np.pi*xx)
plt.plot(xx, yy, 'g-', linewidth=3, label='True Boundary')

plt.xlim(-1, 1)
plt.ylim(-1, 1)
plt.xlabel('X1')
plt.ylabel('X2')
plt.title('Nonlinear Classification Problem: Sinusoidal Boundary')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

print(f"Generated {N} samples with sinusoidal decision boundary")
print(f"正弦波決定境界を持つ{N}個のサンプルを生成しました")
print(f"Class 0: {np.sum(y==0)} samples, Class 1: {np.sum(y==1)} samples")
print(f"クラス0: {np.sum(y==0)}サンプル、クラス1: {np.sum(y==1)}サンプル")

## Q2: Implement Linear Logistic Regression Baseline / 線形ロジスティック回帰ベースラインの実装

First, try to solve the problem with a simple linear model to demonstrate its limitations.

まず、シンプルな線形モデルで問題を解決しようとして、その限界を実証します。

In [None]:
# Create linear logistic regression model / 線形ロジスティック回帰モデル作成
print("Training linear logistic regression model...")
print("線形ロジスティック回帰モデルを訓練中...")

linear_model = Sequential()
linear_model.add(Dense(1, input_shape=(2,), use_bias=True))
linear_model.add(Activation('sigmoid'))

linear_model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

linear_history = linear_model.fit(x, y, epochs=1000, batch_size=100, verbose=0)

print("Linear model training completed!")
print("線形モデルの訓練が完了しました！")

plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)
plt.plot(linear_history.history['loss'], 'b-', linewidth=2)
plt.title('Linear Model: Loss Evolution')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.grid(True, alpha=0.3)

plt.subplot(1, 2, 2)
plt.plot(linear_history.history['accuracy'], 'r-', linewidth=2)
plt.title('Linear Model: Accuracy Evolution')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

final_loss = linear_history.history['loss'][-1]
final_accuracy = linear_history.history['accuracy'][-1]
print(f"Linear model final loss: {final_loss:.4f}")
print(f"Linear model final accuracy: {final_accuracy:.4f}")
print(f"線形モデル最終損失: {final_loss:.4f}")
print(f"線形モデル最終精度: {final_accuracy:.4f}")

## Q3: Build MLP Model with TensorFlow/Keras / TensorFlow/KerasによるMLP構築

Create a multilayer perceptron with hidden layers to handle the nonlinear classification problem.

非線形分類問題を処理するために隠れ層を持つ多層パーセプトロンを作成します。

In [None]:
# Create multilayer perceptron model / 多層パーセプトロンモデル作成
print("Building multilayer perceptron model...")
print("多層パーセプトロンモデルを構築中...")

mlp_model = Sequential()
mlp_model.add(Dense(5, input_shape=(2,), use_bias=True))  # Hidden layer with 5 neurons / 5ニューロンの隠れ層
mlp_model.add(Activation('relu'))  # ReLU activation for nonlinearity / 非線形性のためのReLU活性化
mlp_model.add(Dense(1))  # Output layer / 出力層
mlp_model.add(Activation('sigmoid'))  # Sigmoid for binary classification / 二値分類のためのSigmoid

mlp_model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

print("\nMLP Model Architecture:")
print("MLPモデルアーキテクチャ:")
mlp_model.summary()

print("\nMLP model built successfully!")
print("MLPモデルの構築が完了しました！")

## Q4: Train and Compare Models / モデル学習と比較

Train the MLP model and compare its performance with the linear baseline.

MLPモデルを訓練し、線形ベースラインとの性能を比較します。

In [None]:
# Train MLP model / MLPモデル訓練
print("Training MLP model...")
print("MLPモデルを訓練中...")

mlp_history = mlp_model.fit(x, y, epochs=2000, batch_size=100, verbose=0)

print("MLP model training completed!")
print("MLPモデルの訓練が完了しました！")

plt.figure(figsize=(15, 5))

plt.subplot(1, 3, 1)
plt.plot(linear_history.history['loss'], 'b-', linewidth=2, label='Linear Model')
plt.plot(mlp_history.history['loss'], 'r-', linewidth=2, label='MLP Model')
plt.title('Loss Evolution Comparison')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.grid(True, alpha=0.3)
plt.yscale('log')  # Log scale for better visualization / より良い可視化のための対数スケール

plt.subplot(1, 3, 2)
plt.plot(linear_history.history['accuracy'], 'b-', linewidth=2, label='Linear Model')
plt.plot(mlp_history.history['accuracy'], 'r-', linewidth=2, label='MLP Model')
plt.title('Accuracy Evolution Comparison')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()
plt.grid(True, alpha=0.3)

models = ['Linear', 'MLP']
final_losses = [linear_history.history['loss'][-1], mlp_history.history['loss'][-1]]
final_accuracies = [linear_history.history['accuracy'][-1], mlp_history.history['accuracy'][-1]]

plt.subplot(1, 3, 3)
x_pos = np.arange(len(models))
plt.bar(x_pos, final_accuracies, alpha=0.7, color=['blue', 'red'])
plt.xlabel('Model Type')
plt.ylabel('Final Accuracy')
plt.title('Final Accuracy Comparison')
plt.xticks(x_pos, models)
plt.grid(True, alpha=0.3)

for i, acc in enumerate(final_accuracies):
    plt.text(i, acc + 0.01, f'{acc:.3f}', ha='center', va='bottom')

plt.tight_layout()
plt.show()

print("\n" + "="*50)
print("MODEL PERFORMANCE COMPARISON / モデル性能比較")
print("="*50)
print(f"Linear Model - Loss: {final_losses[0]:.4f}, Accuracy: {final_accuracies[0]:.4f}")
print(f"MLP Model    - Loss: {final_losses[1]:.4f}, Accuracy: {final_accuracies[1]:.4f}")
print(f"線形モデル - 損失: {final_losses[0]:.4f}, 精度: {final_accuracies[0]:.4f}")
print(f"MLPモデル  - 損失: {final_losses[1]:.4f}, 精度: {final_accuracies[1]:.4f}")
print("="*50)

## Q5: Visualize Decision Boundaries / 決定境界の可視化

Visualize and compare the decision boundaries learned by both models.

両方のモデルが学習した決定境界を可視化し比較します。

In [None]:
# Create meshgrid for decision boundary visualization / 決定境界可視化のためのメッシュグリッド作成
def create_meshgrid(resolution=200):
    """Create meshgrid for visualization / 可視化用メッシュグリッド作成"""
    xx = np.linspace(-1, 1, resolution)
    yy = np.linspace(-1, 1, resolution)
    XX, YY = np.meshgrid(xx, yy)
    grid_points = np.hstack((XX.reshape(-1, 1), YY.reshape(-1, 1)))
    return XX, YY, grid_points

XX, YY, grid_points = create_meshgrid(128)

linear_predictions = linear_model.predict(grid_points, verbose=0).reshape(128, 128)
mlp_predictions = mlp_model.predict(grid_points, verbose=0).reshape(128, 128)

fig, axes = plt.subplots(2, 2, figsize=(15, 12))

axes[0, 0].contourf(XX, YY, linear_predictions, levels=50, alpha=0.6, cmap='RdYlBu')
axes[0, 0].plot(x[y==0, 0], x[y==0, 1], 'bo', alpha=0.6, markersize=3)
axes[0, 0].plot(x[y==1, 0], x[y==1, 1], 'ro', alpha=0.6, markersize=3)
axes[0, 0].set_title('Linear Model Decision Boundary')
axes[0, 0].set_xlabel('X1')
axes[0, 0].set_ylabel('X2')
axes[0, 0].grid(True, alpha=0.3)

im = axes[0, 1].contourf(XX, YY, mlp_predictions, levels=50, alpha=0.6, cmap='RdYlBu')
axes[0, 1].plot(x[y==0, 0], x[y==0, 1], 'bo', alpha=0.6, markersize=3)
axes[0, 1].plot(x[y==1, 0], x[y==1, 1], 'ro', alpha=0.6, markersize=3)
axes[0, 1].set_title('MLP Model Decision Boundary')
axes[0, 1].set_xlabel('X1')
axes[0, 1].set_ylabel('X2')
axes[0, 1].grid(True, alpha=0.3)

plt.colorbar(im, ax=axes[0, 1], label='Prediction Probability')

xx_true = np.linspace(-1, 1, 200)
yy_true = np.sin(2*np.pi*xx_true)

axes[1, 0].plot(x[y==0, 0], x[y==0, 1], 'bo', alpha=0.4, markersize=4, label='Class 0')
axes[1, 0].plot(x[y==1, 0], x[y==1, 1], 'ro', alpha=0.4, markersize=4, label='Class 1')
axes[1, 0].plot(xx_true, yy_true, 'g-', linewidth=3, label='True Boundary')
axes[1, 0].contour(XX, YY, linear_predictions, levels=[0.5], colors='blue', linewidths=2, linestyles='--', label='Linear Boundary')
axes[1, 0].set_title('Linear Model vs True Boundary')
axes[1, 0].set_xlabel('X1')
axes[1, 0].set_ylabel('X2')
axes[1, 0].legend()
axes[1, 0].grid(True, alpha=0.3)

axes[1, 1].plot(x[y==0, 0], x[y==0, 1], 'bo', alpha=0.4, markersize=4, label='Class 0')
axes[1, 1].plot(x[y==1, 0], x[y==1, 1], 'ro', alpha=0.4, markersize=4, label='Class 1')
axes[1, 1].plot(xx_true, yy_true, 'g-', linewidth=3, label='True Boundary')
axes[1, 1].contour(XX, YY, mlp_predictions, levels=[0.5], colors='red', linewidths=2, linestyles='--', label='MLP Boundary')
axes[1, 1].set_title('MLP Model vs True Boundary')
axes[1, 1].set_xlabel('X1')
axes[1, 1].set_ylabel('X2')
axes[1, 1].legend()
axes[1, 1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

linear_train_pred = (linear_model.predict(x, verbose=0) > 0.5).astype(int).flatten()
mlp_train_pred = (mlp_model.predict(x, verbose=0) > 0.5).astype(int).flatten()

linear_errors = np.sum(linear_train_pred != y)
mlp_errors = np.sum(mlp_train_pred != y)

print("\n" + "="*60)
print("CLASSIFICATION ERROR ANALYSIS / 分類誤差解析")
print("="*60)
print(f"Linear Model - Training Errors: {linear_errors}/{len(y)} ({linear_errors/len(y)*100:.1f}%)")
print(f"MLP Model    - Training Errors: {mlp_errors}/{len(y)} ({mlp_errors/len(y)*100:.1f}%)")
print(f"線形モデル - 訓練誤差: {linear_errors}/{len(y)} ({linear_errors/len(y)*100:.1f}%)")
print(f"MLPモデル  - 訓練誤差: {mlp_errors}/{len(y)} ({mlp_errors/len(y)*100:.1f}%)")
print("="*60)

## Summary / まとめ

In this tutorial, you learned:
このチュートリアルでは以下を学習しました：

1. **Nonlinear Problems**: How to create and visualize complex classification problems that cannot be solved by linear models
   **非線形問題**: 線形モデルでは解決できない複雑な分類問題の作成と可視化方法

2. **Linear Limitations**: Why simple linear models fail on nonlinear decision boundaries
   **線形の限界**: なぜシンプルな線形モデルが非線形決定境界で失敗するのか

3. **MLP Architecture**: How to build multilayer perceptrons with hidden layers and nonlinear activations
   **MLPアーキテクチャ**: 隠れ層と非線形活性化を持つ多層パーセプトロンの構築方法

4. **TensorFlow/Keras**: Practical implementation of neural networks using modern deep learning frameworks
   **TensorFlow/Keras**: 現代の深層学習フレームワークを使用したニューラルネットワークの実践的実装

5. **Decision Boundary Visualization**: Techniques to visualize and compare model performance
   **決定境界可視化**: モデル性能を可視化し比較する技術

6. **Performance Analysis**: How to evaluate and compare different model architectures
   **性能解析**: 異なるモデルアーキテクチャの評価と比較方法

**Key Insights / 重要な洞察:**

- **Linear models** are limited to linear decision boundaries and struggle with complex patterns
  **線形モデル**は線形決定境界に限定され、複雑なパターンに苦労します

- **MLPs with hidden layers** can approximate complex nonlinear functions and decision boundaries
  **隠れ層を持つMLP**は複雑な非線形関数と決定境界を近似できます

- **ReLU activation** provides the nonlinearity needed to learn complex patterns
  **ReLU活性化**は複雑なパターンを学習するために必要な非線形性を提供します

- **Proper visualization** is crucial for understanding model behavior and performance
  **適切な可視化**はモデルの動作と性能を理解するために重要です

This foundation prepares you for more advanced neural network architectures and deep learning techniques!

この基礎により、より高度なニューラルネットワークアーキテクチャと深層学習技術への準備が整います！