# Matplotlib - Python 数据可视化基础教程

欢迎来到 Matplotlib 教程！Matplotlib 是 Python 中最基础、最广泛使用的数据可视化库。它提供了一个灵活的平台，可以创建各种静态、动态和交互式的图表。

**为什么 Matplotlib 对 ML/DL/数据科学很重要？**

1.  **探索性数据分析 (EDA)**：可视化是理解数据分布、关系和模式的关键步骤。
2.  **结果展示**：清晰地展示模型性能、比较结果或呈现发现。
3.  **调试与监控**：绘制损失曲线、激活值分布等，有助于监控模型训练过程。
4.  **生态系统基础**：许多其他高级可视化库（如 Seaborn, Pandas 的绘图功能）都构建在 Matplotlib 之上。

**Matplotlib 的两种主要接口：**

*   **`pyplot` 接口**：基于状态机的接口（类似于 MATLAB）。它简单易用，适合快速绘图。
*   **面向对象 (OO) 接口**：提供更多的控制和灵活性，特别适合创建复杂的图形和在 GUI 应用中嵌入图形。

本教程将主要使用 `pyplot` 接口入门，并简要介绍 OO 接口。

**本教程将涵盖：**

1.  基本绘图 (`plot`)
2.  常用图表类型 (散点图, 条形图, 直方图)
3.  自定义图形元素 (标题, 标签, 图例, 颜色, 样式)
4.  子图 (Subplots)
5.  图像显示 (`imshow`)
6.  保存图形 (`savefig`)
7.  面向对象接口简介

## 准备工作：导入 Matplotlib 和 NumPy

按照惯例，我们将 `matplotlib.pyplot` 导入为 `plt`。通常也需要 NumPy 来生成数据。

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 这行是 Jupyter Notebook 的魔法命令，通常确保图形在单元格内显示
%matplotlib inline

print("Matplotlib and NumPy imported.")

## 1. 基本绘图 (`plot`)

`plt.plot()` 是最基础的绘图函数，通常用于绘制线图。

In [None]:
# 准备数据
x = np.linspace(0, 10, 100) # 0 到 10 之间生成 100 个点
y_sin = np.sin(x)
y_cos = np.cos(x)

# 绘制简单的线图
plt.plot(x, y_sin)
plt.xlabel("x axis label")
plt.ylabel("sin(x)")
plt.title("Simple Sine Wave")
plt.grid(True) # 添加网格线
plt.show() # 显示图形 (在脚本中必需，在Jupyter中通常可选)

# 在同一张图上绘制多条线
plt.plot(x, y_sin, label='Sine') # 添加标签用于图例
plt.plot(x, y_cos, label='Cosine')
plt.xlabel("x")
plt.ylabel("y")
plt.title("Sine and Cosine Waves")
plt.legend() # 显示图例
plt.grid(True)
plt.show()

## 2. 常用图表类型

除了线图，Matplotlib 还可以轻松创建其他常见图表。

In [None]:
# --- 散点图 (Scatter Plot) ---
x_scatter = np.random.rand(50) # 50个随机 x
y_scatter = np.random.rand(50) # 50个随机 y
colors = np.random.rand(50)    # 随机颜色值
sizes = 100 * np.random.rand(50) # 随机大小

plt.scatter(x_scatter, y_scatter, c=colors, s=sizes, alpha=0.7, cmap='viridis')
# c: 颜色, s: 大小, alpha: 透明度, cmap: 颜色映射
plt.xlabel("X value")
plt.ylabel("Y value")
plt.title("Scatter Plot Example")
plt.colorbar() # 显示颜色条
plt.show()

# --- 条形图 (Bar Chart) ---
categories = ['Category A', 'Category B', 'Category C']
values = [10, 25, 15]

plt.bar(categories, values, color=['red', 'green', 'blue'])
plt.xlabel("Categories")
plt.ylabel("Values")
plt.title("Bar Chart Example")
plt.show()

# 水平条形图
plt.barh(categories, values, color='skyblue')
plt.xlabel("Values")
plt.ylabel("Categories")
plt.title("Horizontal Bar Chart Example")
plt.show()

# --- 直方图 (Histogram) ---
data_hist = np.random.randn(1000) # 1000个标准正态分布随机数

plt.hist(data_hist, bins=30, color='purple', alpha=0.7, edgecolor='black')
# bins: 分箱数量
plt.xlabel("Value")
plt.ylabel("Frequency")
plt.title("Histogram Example")
plt.show()

## 3. 自定义图形元素

Matplotlib 允许对图形的几乎所有方面进行详细定制。

In [None]:
x = np.linspace(0, 5, 20)
y1 = x**2
y2 = x**3

plt.plot(x, y1,
         color='blue',       # 线条颜色
         linestyle='--',     # 线条样式 ('-', '--', '-.', ':')
         linewidth=2,        # 线条宽度
         marker='o',         # 数据点标记样式 ('o', 's', '^', '+', '*')
         markersize=5,       # 标记大小
         label='y = x^2')    # 图例标签

plt.plot(x, y2,
         color='#FF8C00',    # 使用十六进制颜色码 (暗橙色)
         linestyle=':',      # 点线
         linewidth=2,
         marker='s',         # 方块标记
         markersize=6,
         label='y = x^3')

# 设置坐标轴范围
plt.xlim(0, 5)
plt.ylim(0, 130)

# 添加标题和标签
plt.title("Customized Plot", fontsize=16)
plt.xlabel("X Axis", fontsize=12)
plt.ylabel("Y Axis", fontsize=12)

# 添加网格和图例
plt.grid(True, linestyle='-.', alpha=0.5)
plt.legend(loc='upper left', fontsize=10) # loc 指定图例位置

plt.show()

## 4. 子图 (Subplots)

经常需要在同一个图形窗口 (Figure) 中绘制多个子图 (Axes)。有两种主要方式：
1.  `plt.subplot()` (状态机方法)
2.  `plt.subplots()` (面向对象方法 - 更推荐)

In [None]:
# --- 方法 1: plt.subplot() ---
plt.figure(figsize=(10, 4)) # 创建一个图形窗口, figsize 指定大小 (英寸)

plt.subplot(1, 2, 1) # (nrows, ncols, index), index 从 1 开始
plt.plot(x, y_sin, 'r--') # 红色虚线
plt.title('Sine Wave (subplot 1)')
plt.grid(True)

plt.subplot(1, 2, 2)
plt.plot(x, y_cos, 'g*-') # 绿色星号实线
plt.title('Cosine Wave (subplot 2)')
plt.grid(True)

plt.suptitle("Using plt.subplot()", fontsize=14) # 整个 Figure 的大标题
plt.tight_layout() # 自动调整子图参数以适应图形区域
plt.show()

# --- 方法 2: plt.subplots() (更推荐) ---
# 它会创建一个 Figure 和一个包含 Axes 对象的 NumPy 数组
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(10, 4)) # 返回 figure 和 axes 数组

# axes 是一个 NumPy 数组，包含子图对象
# print(f"Type of fig: {type(fig)}")
# print(f"Type of axes: {type(axes)}, shape: {axes.shape}")

# 在第一个子图 (axes[0]) 上绘制
axes[0].plot(x, y_sin, 'b-.') # 蓝色点划线
axes[0].set_title('Sine Wave (axes[0])')
axes[0].set_xlabel('x')
axes[0].set_ylabel('sin(x)')
axes[0].grid(True)

# 在第二个子图 (axes[1]) 上绘制
axes[1].plot(x, y_cos, 'm:') # 洋红色点线
axes[1].set_title('Cosine Wave (axes[1])')
axes[1].set_xlabel('x')
axes[1].set_ylabel('cos(x)')
axes[1].grid(True)

fig.suptitle("Using plt.subplots()", fontsize=14)
plt.tight_layout()
plt.show()

# 示例：2x2 子图
fig, axes = plt.subplots(nrows=2, ncols=2, figsize=(8, 8))
axes[0, 0].plot(x, x, 'r')
axes[0, 0].set_title('y = x')
axes[0, 1].plot(x, x**2, 'g')
axes[0, 1].set_title('y = x^2')
axes[1, 0].plot(x, np.exp(x), 'b')
axes[1, 0].set_title('y = e^x')
axes[1, 1].plot(x, np.log1p(x), 'k') # log(1+x)
axes[1, 1].set_title('y = log(1+x)')

for ax_row in axes:
    for ax in ax_row:
        ax.grid(True)

plt.tight_layout()
plt.show()

## 5. 图像显示 (`imshow`)

`plt.imshow()` 用于将 NumPy 数组显示为图像。

In [None]:
# 创建一个简单的灰度图像数据 (例如，一个棋盘格)
img_data = np.zeros((10, 10))
img_data[::2, ::2] = 1  # 偶数行偶数列设为1
img_data[1::2, 1::2] = 1 # 奇数行奇数列设为1

plt.imshow(img_data, cmap='gray') # cmap='gray' 指定灰度颜色映射
plt.title("Simple Grayscale Image (Checkerboard)")
plt.colorbar()
plt.show()

# 创建一个随机彩色图像数据 (3通道 RGB)
img_color = np.random.rand(10, 10, 3) # 10x10 像素, 3个颜色通道 (RGB)

plt.imshow(img_color)
plt.title("Random Color Image")
# plt.axis('off') # 可以关闭坐标轴
plt.show()

## 6. 保存图形 (`savefig`)

可以将绘制的图形保存到文件中。

In [None]:
import os

x = np.linspace(0, 2 * np.pi, 50)
y = np.sin(x)

plt.figure() # 创建一个新的图形
plt.plot(x, y)
plt.title("Plot to be Saved")
plt.xlabel("Radians")
plt.ylabel("sin(x)")
plt.grid(True)

output_filename = "sine_wave_plot.png"
plt.savefig(output_filename, dpi=150, bbox_inches='tight') 
# dpi: 分辨率 (dots per inch)
# bbox_inches='tight': 尝试裁剪掉空白边缘

print(f"Plot saved to {output_filename}")
plt.show() # 仍然可以在 notebook 中显示

# 清理
if os.path.exists(output_filename):
    os.remove(output_filename)
    print(f"Cleaned up {output_filename}")

## 7. 面向对象接口简介

虽然 `pyplot` 接口方便快捷，但对于更复杂的图形或需要更多控制的情况，面向对象 (OO) 的接口通常更好。核心思想是显式地创建和操作 `Figure` 和 `Axes` 对象。

*   **`Figure`**: 整个图形窗口或画布。
*   **`Axes`**: 图形中的一个子图区域，包含坐标轴、标签、数据点等。一个 Figure 可以包含多个 Axes。

`plt.subplots()` 是创建 Figure 和 Axes 的常用方法。

In [None]:
# OO 风格示例
x_oo = np.linspace(0, 10, 100)
y_oo = np.sqrt(x_oo)

# 1. 创建 Figure 和 Axes 对象
fig, ax = plt.subplots(figsize=(6, 4))

# 2. 使用 Axes 对象的方法进行绘图和设置
ax.plot(x_oo, y_oo, color='purple', label='sqrt(x)')
ax.set_xlabel("X Value")
ax.set_ylabel("Square Root")
ax.set_title("Object-Oriented Plotting Example")
ax.grid(True)
ax.legend()

# 3. 显示图形 (pyplot 仍然可以用于显示)
plt.show()

## 总结

Matplotlib 是 Python 数据可视化的基石。通过 `pyplot` 接口可以快速创建常见的图表，而面向对象的接口提供了更精细的控制。

**关键要点：**
*   使用 `plt.plot()` 绘制线图，`plt.scatter()`, `plt.bar()`, `plt.hist()` 绘制其他常见图表。
*   使用 `plt.xlabel()`, `plt.ylabel()`, `plt.title()`, `plt.legend()` 等添加标签和图例。
*   可以通过颜色、线型、标记等参数自定义图形外观。
*   使用 `plt.subplots()` 创建包含多个子图的图形。
*   使用 `plt.imshow()` 显示图像数据。
*   使用 `plt.savefig()` 保存图形。
*   理解 `pyplot` 接口和面向对象接口的区别。

Matplotlib 非常强大，有很多高级功能（3D绘图、动画、自定义样式等）值得探索。官方文档和示例库 (Gallery) 是非常好的学习资源。同时，Seaborn 库基于 Matplotlib 提供了更高级的统计可视化功能，通常与 Matplotlib 结合使用。