# Machine Learning Basics Tutorial / 機械学習基礎チュートリアル

This notebook demonstrates fundamental machine learning concepts using linear regression with artificial data generation and model selection.

このノートブックでは、人工データ生成とモデル選択を用いた線形回帰による基本的な機械学習概念を実演します。

1. Artificial Data Generation (f=ma) / 人工データ生成（f=ma）
2. Linear Regression with Scikit-learn / Scikit-learnによる線形回帰
3. Analytical Solution / 解析解
4. Model Selection using Cross-validation / 交差検証によるモデル選択
5. Comparison: f=ma vs f=ma+b / 比較：f=ma vs f=ma+b

In [None]:
# Import required libraries / 必要なライブラリをインポート
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import cross_val_score, LeaveOneOut
from sklearn.metrics import mean_squared_error, r2_score
import pandas as pd

np.random.seed(42)

plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

## 1. Artificial Data Generation (f=ma) / 人工データ生成（f=ma）

We'll generate artificial data based on Newton's second law of motion: F = ma, where:
- F: Force (dependent variable)
- m: Mass (independent variable)  
- a: Acceleration (parameter)

ニュートンの運動第二法則に基づいて人工データを生成します：F = ma、ここで：
- F：力（従属変数）
- m：質量（独立変数）
- a：加速度（パラメータ）

In [None]:
def generate_physics_data(n_samples=50, acceleration=9.8, noise_level=0.1, add_bias=False, bias_value=2.0):
    """
    Generate artificial data based on F = ma (with optional bias)
    F = ma（オプションのバイアス付き）に基づいて人工データを生成
    """
    mass = np.linspace(0.5, 10.0, n_samples)
    
    if add_bias:
        force_true = acceleration * mass + bias_value
        print(f"True relationship: F = {acceleration:.2f} * m + {bias_value:.2f}")
    else:
        force_true = acceleration * mass
        print(f"True relationship: F = {acceleration:.2f} * m")
    
    noise = np.random.normal(0, noise_level * np.mean(force_true), n_samples)
    force_observed = force_true + noise
    
    return mass, force_observed, force_true

print("Generating data for model without bias (F = ma) / バイアスなしモデルのデータ生成（F = ma）")
mass1, force1, force_true1 = generate_physics_data(n_samples=30, acceleration=9.8, noise_level=0.15, add_bias=False)

print("\nGenerating data for model with bias (F = ma + b) / バイアス付きモデルのデータ生成（F = ma + b）")
mass2, force2, force_true2 = generate_physics_data(n_samples=30, acceleration=9.8, noise_level=0.15, add_bias=True, bias_value=5.0)

plt.figure(figsize=(15, 5))

plt.subplot(1, 2, 1)
plt.scatter(mass1, force1, alpha=0.7, label='Observed Data')
plt.plot(mass1, force_true1, 'r-', label='True Relationship', linewidth=2)
plt.xlabel('Mass (kg)')
plt.ylabel('Force (N)')
plt.title('Model 1: F = ma (No Bias)')
plt.legend()
plt.grid(True, alpha=0.3)

plt.subplot(1, 2, 2)
plt.scatter(mass2, force2, alpha=0.7, label='Observed Data', color='orange')
plt.plot(mass2, force_true2, 'r-', label='True Relationship', linewidth=2)
plt.xlabel('Mass (kg)')
plt.ylabel('Force (N)')
plt.title('Model 2: F = ma + b (With Bias)')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()