In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split

# Generate synthetic dataset
X, y = np.random.rand(100, 1) * 10, np.random.rand(100) * 50
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Define MLP Regressor
mlp_regressor = MLPRegressor(
    hidden_layer_sizes=(100, 50),  # Two hidden layers with 100 and 50 neurons
    activation="relu",            # Activation function
    solver="adam",                # Optimizer
    max_iter=1000,                # Maximum number of iterations
    random_state=42
)

# Train the model
mlp_regressor.fit(X_train, y_train.ravel())

# Predict and evaluate
y_pred = mlp_regressor.predict(X_test)
rmse = mean_squared_error(y_test, y_pred, squared=False)

# Visualize RMSE
print(f"MLP Regressor RMSE: {rmse:.4f}")

# Visualize Predictions vs. True Values
plt.figure(figsize=(8, 6))
plt.scatter(X_test, y_test, color='blue', label='True Values', s=10)
plt.scatter(X_test, y_pred, color='red', label='Predictions', s=10)
plt.title("MLP Regressor: Predictions vs. True Values")
plt.legend(loc="upper left", fontsize=8)
plt.xlabel("Feature")
plt.ylabel("Target")
plt.show()


基于神经网络的回归模型适用于复杂模式的识别与回归任务。多层感知机（MLP）是常用的神经网络回归模型，能够捕捉非线性关系。

---

### **基于神经网络的回归模型分类**

#### **1. MLP Regressor**
- **实现库**: Scikit-learn 提供
- **特点**:
  - 多层感知机（MLP），是一种前馈神经网络。
  - 支持多层隐藏层和激活函数，适用于非线性回归问题。
- **适用场景**:
  - 数据非线性关系复杂，且对预测精度要求较高。
- **优缺点**:
  - **优点**: 灵活性强，能够处理复杂数据模式。
  - **缺点**: 对超参数敏感，训练速度较慢。

#### **扩展神经网络模型**
若需要更复杂的模型（如卷积神经网络或循环神经网络），需要使用专门的深度学习框架（如 TensorFlow、PyTorch）。

---

### **参数说明**

- `hidden_layer_sizes`: 定义隐藏层的结构，如 `(100, 50)` 表示两层，分别包含 100 和 50 个神经元。
- `activation`: 激活函数，如 `'relu'`（推荐）、`'tanh'` 或 `'logistic'`。
- `solver`: 优化器，可选 `'adam'`（默认）、`'lbfgs'` 或 `'sgd'`。
- `max_iter`: 最大迭代次数，用于控制收敛。

---

### **模型选型建议**

#### **优点**
- 能够捕捉复杂的非线性关系。
- 对数据特征较少依赖，能自动提取高阶特征。

#### **缺点**
- 超参数（如层数、神经元数量、学习率）调节较复杂。
- 对大数据集的训练较慢。

#### **适用场景**
- 数据模式复杂且非线性。
- 对预测精度要求较高。

