Image Processing Algorithms Learning Kit

数字图像处理算法实践集合

本项目是一个综合性的数字图像处理教学演示仓库，旨在通过Python和OpenCV实现课程中的核心算法概念。项目涵盖了从空域滤波、频域变换到图像压缩的完整流程，适合作为学习数字图像处理（Digital Image Processing）的实践参考。

📖 项目简介

该项目通过一系列独立的脚本（assignment1_x.py, assignment2_x.py），系统性地展示了以下关键技术模块：

空域图像增强 (Assignment 1)
- 直方图统计与均衡化（理论实现与OpenCV接口对比）
- 双线性插值算法实现图像缩放
- 拉普拉斯算子进行图像锐化
频域滤波与分析 (Assignment 2)
- 二维离散傅里叶变换（DFT）及其频谱可视化
- 理想高通/低通滤波器设计与应用
- 噪声模型（椒盐噪声）及均值/中值滤波去噪
- 逆滤波（Inverse Filtering）恢复模糊图像
图像压缩 (Assignment 2 Extension)
- JPEG压缩核心流程实现（非标准，教学用）
- 包含RGB转YUV、DCT变换、量化、ZigZag扫描及游程编码（RLE）

⚙️ 环境依赖与安装

本项目主要基于 Python 生态的图像处理库开发。请确保您的环境中已安装 Python 3.6+。

依赖库

项目所需的第三方库如下：

OpenCV (opencv-python): 用于核心的图像读写、DFT变换、滤波及显示操作。
NumPy: 用于高效的矩阵运算和数值计算。
Matplotlib: 用于绘制直方图和频谱图。

安装方式

推荐使用 pip 进行安装。请在终端中运行以下命令：

pip install opencv-python numpy matplotlib

Google Colab 注意事项

部分脚本（如 assignment1_1.py 和 assignment1_3.py）中包含 from google.colab.patches import cv2_imshow，这是专门为 Google Colab 环境设计的显示函数。如果在本地 Jupyter Notebook 或 PyCharm 中运行，请将 cv2_imshow() 替换为 cv2.imshow() 并注意窗口管理机制。

🚀 快速开始

本项目由多个独立的 Python 脚本组成，每个脚本对应一个数字图像处理的核心实验。您可以直接运行特定的 .py 文件来查看效果。

脚本功能速查表

以下是各脚本的主要功能及启动方式：

脚本文件名	核心功能描述	运行命令
`assignment1_1.py`	直方图均衡化实现灰度图像的直方图统计、显示，并通过 OpenCV 接口及手动计算两种方式实现直方图均衡化。	`python assignment1_1.py`
`assignment1_2.py`	图像缩放 (双线性插值) 不依赖 OpenCV 的 `resize` 函数，手动实现双线性插值算法对图像进行缩放。	`python assignment1_2.py`
`assignment1_3.py`	图像锐化使用高斯模糊与拉普拉斯算子（Laplacian）结合的方式实现图像高频增强与边缘提取。	`python assignment1_3.py`
`assignment2_1.py`	频域分析与滤波对图像进行二维 DFT 变换，可视化频谱与相位，并实现理想高通/低通滤波器。	`python assignment2_1.py`
`assignment2_2.py`	噪声与复原 (基础) 生成椒盐噪声，对比均值滤波和中值滤波的去噪效果，并实现基于阈值截断的逆滤波。	`python assignment2_2.py`
`assignment2_2_complex.py`	噪声与复原 (复数版) 在频域中对退化函数 $H$ 进行复数形式的逆滤波运算，结果更为精确。	`python assignment2_2_complex.py`
`assignment2_3.py`	JPEG 压缩模拟实现简化的 JPEG 压缩流程（RGB→YUV, DCT, 量化, ZigZag, RLE），支持压缩与解压。	`python assignment2_3.py`

示例：运行 JPEG 压缩

如果您想测试图像压缩效果，可以直接运行 assignment2_3.py。该程序会读取同目录下的 1.bmp，生成压缩文件 1.gpj，并解压显示结果图像 result.bmp。

python assignment2_3.py

🔄 核心工作流程

本项目所涵盖的算法并非孤立存在，它们共同构成了一套完整的数字图像处理学习路径。下图展示了从原始图像输入到最终结果输出的典型处理流程，体现了图像在空间域、频率域以及压缩域的转换关系。

图像处理通用管线

flowchart TD

A[原始输入图像] --> B{空间域处理}

B --> C[几何变换双线性插值缩放]

B --> D[空域增强直方图均衡化/拉普拉斯锐化]

A --> E{频域分析}
E --> F[DFT 傅里叶变换]
F --> G[频谱可视化]
F --> H[频域滤波<br>理想高低通/逆滤波]

A --> I{图像退化模型}
I --> J[添加椒盐噪声]
J --> K[空域去噪<br>均值/中值滤波]

A --> L{JPEG 压缩流程}
L --> M[RGB转YUV色彩空间]
M --> N[8x8 DCT 变换]
N --> O[量化与ZigZag扫描]
O --> P[游程编码 RLE]
P --> Q[生成 .gpj 压缩文件]
Q --> R[解压与重建图像]

style B fill:#f9f,stroke:#333,stroke-width:2px
style E fill:#bbf,stroke:#333,stroke-width:2px
style I fill:#f96,stroke:#333,stroke-width:2px
style L fill:#9cf,stroke:#333,stroke-width:2px

流程解读

空间域起点：图像通常以位图形式输入，首先可以进行几何变换（如 assignment1_2 的缩放）或空域增强（如 assignment1_1 的直方图均衡化、assignment1_3 的锐化）。
频域转换：通过 assignment2_1 的 DFT 将图像映射至频域，在此空间进行滤波操作（如模糊图像的复原 assignment2_2 逆滤波）。
退化与复原：模拟真实场景中的噪声干扰（assignment2_2 的椒盐噪声），并使用滤波器进行去除，验证算法的鲁棒性。
压缩与编码：最后通过 assignment2_3 的 JPEG 流程，将处理后的图像进行高效压缩，完成从模拟信号到数字编码的完整闭环。

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
Bonus		Bonus
assignment1		assignment1
assignment2		assignment2
.gitattributes		.gitattributes
README.md		README.md
test1.png		test1.png
test2.jpg		test2.jpg
test3.jpg		test3.jpg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Image Processing Algorithms Learning Kit

数字图像处理算法实践集合

📖 项目简介

⚙️ 环境依赖与安装

依赖库

安装方式

Google Colab 注意事项

🚀 快速开始

脚本功能速查表

示例：运行 JPEG 压缩

🔄 核心工作流程

图像处理通用管线

流程解读

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Image Processing Algorithms Learning Kit

数字图像处理算法实践集合

📖 项目简介

⚙️ 环境依赖与安装

依赖库

安装方式

Google Colab 注意事项

🚀 快速开始

脚本功能速查表

示例：运行 JPEG 压缩

🔄 核心工作流程

图像处理通用管线

流程解读

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages