NumPy 是 Python 中用于数值计算的基础库。它提供对多维数组、矩阵以及各种数学函数的支持，能够高效地操作这些数组。NumPy 的一些关键特点包括：
多维数组：NumPy 提供了 ndarray 对象，用于表示多维数组。它提供了强大的方法，可以在数组上执行各种数学运算，而无需编写循环。
数学函数：NumPy 拥有丰富的数学函数，用于执行各种操作，如三角函数、线性代数、统计分析、傅里叶分析等。
广播：这个特性允许 NumPy 处理不同形状的数组之间的操作，使得计算更加灵活和高效。
与其他库的集成：由于与其他科学计算、机器学习和数据分析库的兼容性，NumPy 经常与这些库一起使用。

PIL（Python Imaging Library）是一个用于打开、操作和保存多种不同图片格式的库。它提供了各种图像处理功能，可以方便地对图像进行各种操作。PIL 的主要特点包括：
图像处理：PIL 可以轻松加载、显示和保存多种格式的图像，如 JPEG、PNG、BMP 等。
图像操作：它提供了缩放、旋转、裁剪和应用滤镜等图像操作的方法。
图像处理：PIL 提供了基本图像处理任务的功能，如在不同颜色空间之间转换、调整亮度、对比度以及应用不同类型的滤镜等操作。
兼容性：PIL 与许多平台和 Python 的各个版本兼容性良好，使其成为在 Python 脚本或应用程序中处理图像数据的多功能选择。

In [None]:
import numpy as np
from PIL import Image

 `save_image_from_matrix` 函数，它的主要功能是将给定的图像矩阵保存为图像文件。

解释这个函数的工作原理：

### `save_image_from_matrix(img_matrix, file_path)`

- **img_matrix**: 表示图像的矩阵，其中每个元素是一个元组，代表像素的 RGB 值。
- **file_path**: 是要保存图像的文件路径。

### 函数内部工作流程：
1. `height` 和 `width` 的计算：通过取 `img_matrix` 的高度和宽度来确定图像的尺寸。
   
   ```python
   height = len(img_matrix)
   width = len(img_matrix[0])
   ```
2. 创建一个新的 `Image` 对象：使用 PIL 库中的 `Image.new()` 方法创建一个新的图像对象，使用 'RGB' 模式，并指定宽度和高度。
   
   ```python
   img = Image.new('RGB', (width, height))
   ```

3. 获取图像对象的像素数据：使用 `load()` 方法获取图像对象的像素数据，该数据会被存储在 `pixels` 变量中，以便后续修改。
   
   ```python
   pixels = img.load()
   ```

4. 将图像矩阵数据复制到图像对象中：通过双重循环遍历图像矩阵中的每个像素，然后将图像矩阵中每个像素的 RGB 值赋值给图像对象的对应像素位置。
   
   ```python
   for y in range(height):
       for x in range(width):
           pixels[x, y] = img_matrix[y][x]
   ```

5. 最后，使用 `save()` 方法保存图像到指定的文件路径 `file_path`。
   
   ```python
   img.save(file_path)
   ```

该函数实现了将给定的图像矩阵转换为图像对象，并将其保存为指定路径的图像文件。这对于将数字表示的图像数据转换为可视化图像文件非常有用，例如，将处理后的图像数据保存为图片文件以供进一步分析、显示或分享。

In [None]:
def save_image_from_matrix(img_matrix, file_path):

    # The height and width of the image
    height = len(img_matrix)
    width = len(img_matrix[0])
    
    # Create a new Image object in RGB mode
    img = Image.new('RGB', (width, height))
    pixels = img.load()
    
    # Copy data to the image
    for y in range(height):
        for x in range(width):
            pixels[x, y] = img_matrix[y][x]
    
    # Save the image
    img.save(file_path)

这段代码是一个用于读取 BMP 图像文件并将其转换为图像矩阵的函数。逐步解释该函数的工作原理：

### `read_bmp(filename)`

- **filename**: 是要读取的 BMP 图像文件路径。

### 函数内部工作流程：

1. 打开 BMP 文件并读取文件头部信息：使用 `open()` 函数以二进制模式打开 BMP 文件，并读取包含图像头部信息的前 54 字节数据。BMP 文件的头部信息通常包含图像的一些基本属性。

   ```python
   with open(filename, 'rb') as f:
       bmp_header = f.read(54)
   ```

2. 从图像头部信息中提取图像宽度和高度：BMP 图像文件中的宽度和高度信息通常存储在特定的字节偏移位置上。这里使用小端字节序解析 32 位整数来提取宽度和高度。

   ```python
   w = int.from_bytes(bmp_header[18:22], 'little')
   h = int.from_bytes(bmp_header[22:26], 'little')
   ```

3. 计算每行像素数据的长度：BMP 图像文件中，每行像素数据长度通常必须是 4 的倍数，而不是简单的 `宽度 x 3`。这里通过计算每行的字节数来确保这一点。

   ```python
   bytes_per_row = ((w * 3 + 3) // 4) * 4
   ```

4. 读取剩余的像素数据：使用 `read()` 方法读取剩余的图像像素数据。

   ```python
   pixel_data = f.read()
   ```

5. 创建空的图像矩阵：根据图像的宽度和高度创建一个空的图像矩阵，用于存储图像的像素数据。

   ```python
   image_matrix = [[None for _ in range(w)] for _ in range(h)]
   ```

6. 填充图像矩阵：通过双重循环遍历图像矩阵的每个像素位置，并根据像素数据的存储方式从 `pixel_data` 中提取 BGR 信息，并将其转换为 RGB 格式存储到图像矩阵中。

   ```python
   for j in range(h):
       for i in range(w):
           # 计算当前行的开始位置
           row_start = bytes_per_row * (h - 1 - j)
           index = row_start + i * 3
           # 从像素数据中提取BGR并转换为RGB，存储到图像矩阵中
           if index + 3 <= len(pixel_data):
               b, g, r = pixel_data[index:index+3]
               image_matrix[j][i] = (r, g, b)
           else:
               # 如果索引超出范围，则填充为黑色或任何默认值
               image_matrix[j][i] = (0, 0, 0)
   ```

7. 返回图像矩阵：最后，函数返回包含图像像素数据的图像矩阵。

   ```python
   return image_matrix
   ```

该函数的作用是将 BMP 图像文件的像素数据解析为图像矩阵，并且考虑了 BMP 图像特定的存储方式（BGR 格式），将其转换为常见的 RGB 格式以便后续处理。

In [None]:
def read_bmp(filename):
    with open(filename, 'rb') as f:
        # BMP文件头部信息通常是54字节
        bmp_header = f.read(54)  
        
        # 从头部信息中解析宽度和高度
        # 使用小端字节序解析32位整数
        w = int.from_bytes(bmp_header[18:22], 'little')
        h = int.from_bytes(bmp_header[22:26], 'little')
        
        # 每行的像素数据长度必须是4的倍数
        bytes_per_row = ((w * 3 + 3) // 4) * 4
        
        # 读取所有像素数据
        pixel_data = f.read()
        
        # 创建一个空的图像矩阵
        image_matrix = [[None for _ in range(w)] for _ in range(h)]
        
        # 填充图像矩阵
        for j in range(h):
            for i in range(w):
                # 计算当前行的开始位置
                row_start = bytes_per_row * (h - 1 - j)
                # 像素数据的索引计算需要考虑每行的填充字节
                index = row_start + i * 3
                # 检查索引是否在像素数据的长度内
                if index + 3 <= len(pixel_data):
                    # BMP格式存储顺序是BGR
                    b, g, r = pixel_data[index:index+3]
                    # 将BGR转换为RGB，并存储到图像矩阵中
                    image_matrix[j][i] = (r, g, b)
                else:
                    # 如果索引超出范围，则填充为黑色或任何默认值
                    image_matrix[j][i] = (0, 0, 0)
        
        return image_matrix

这段代码定义了一个名为 `mean_filter_color` 的函数，该函数用于对彩色图像矩阵应用均值滤波。逐步解释函数的工作原理：

### `mean_filter_color(img_matrix, kernel_size)`

- **img_matrix**: 一个三维列表，表示彩色图像的矩阵，其中每个元素是一个包含 RGB 值的元组，代表一个像素的颜色信息。
- **kernel_size**: 用于滤波的核大小，应为奇数，表示滤波器的尺寸。

### 函数内部工作流程：

1. 初始化变量：根据传入的图像矩阵和滤波器尺寸，计算图像的宽度、高度，并初始化一个新的矩阵 `filtered_img` 用于存储滤波后的图像数据。

   ```python
   k = kernel_size // 2
   width = len(img_matrix[0])
   height = len(img_matrix)
   filtered_img = [[(0, 0, 0)] * width for _ in range(height)]
   ```

2. 遍历图像矩阵中的每个像素：对于每个像素，计算其周围像素的 RGB 值的均值，并将结果存储在 `filtered_img` 中。

   - 对于每个像素 `(x, y)`：
     - 在以 `(x, y)` 为中心的滤波器区域内遍历周围的像素。
     - 计算该区域内所有像素的 R、G、B 值之和，以及像素总数。
     - 计算均值 `mean_r`、`mean_g`、`mean_b`，分别代表 R、G、B 通道的均值。
     - 将这些均值存储为 `(mean_r, mean_g, mean_b)`，即存储为新的像素值。

   ```python
   for y in range(height):
       for x in range(width):
           sum_r = sum_g = sum_b = 0
           count_pixels = 0
           
           for ky in range(-k, k + 1):
               for kx in range(-k, k + 1):
                   new_x = x + kx
                   new_y = y + ky
                   
                   if 0 <= new_x < width and 0 <= new_y < height:
                       r, g, b = img_matrix[new_y][new_x]
                       sum_r += r
                       sum_g += g
                       sum_b += b
                       count_pixels += 1
           
           mean_r = sum_r // count_pixels
           mean_g = sum_g // count_pixels
           mean_b = sum_b // count_pixels
           
           filtered_img[y][x] = (mean_r, mean_g, mean_b)
   ```

3. 返回经过均值滤波处理后的 `filtered_img` 图像矩阵。

   ```python
   return filtered_img
   ```

该函数的作用是对彩色图像矩阵应用均值滤波，通过计算像素周围区域的 RGB 值的平均值，以实现图像的平滑处理。

In [None]:
def mean_filter_color(img_matrix, kernel_size):
    """
    Apply mean filter to the color image matrix.
    :param img_matrix: 3D list of tuples - the image matrix where each tuple represents a pixel's RGB values.
    :param kernel_size: integer - the size of the kernel; it should be an odd number.
    :return: 3D list of tuples - the filtered image matrix.
    """
    k = kernel_size // 2
    width = len(img_matrix[0])
    height = len(img_matrix)
    
    filtered_img = [[(0, 0, 0)] * width for _ in range(height)]
    
    for y in range(height):
        for x in range(width):
            sum_r = sum_g = sum_b = 0
            count_pixels = 0
            
            for ky in range(-k, k + 1):
                for kx in range(-k, k + 1):
                    new_x = x + kx
                    new_y = y + ky
                    
                    if 0 <= new_x < width and 0 <= new_y < height:
                        r, g, b = img_matrix[new_y][new_x]
                        sum_r += r
                        sum_g += g
                        sum_b += b
                        count_pixels += 1
            
            mean_r = sum_r // count_pixels
            mean_g = sum_g // count_pixels
            mean_b = sum_b // count_pixels
            
            filtered_img[y][x] = (mean_r, mean_g, mean_b)

    return filtered_img


这段代码定义了一个名为 `median_filter` 的函数，用于对图像矩阵应用中值滤波。逐步解释该函数的工作原理：

### `median_filter(img_matrix, kernel_size)`

- **img_matrix**: 一个二维整数列表，表示图像的强度矩阵，每个值代表一个像素的亮度（灰度）。
- **kernel_size**: 用于滤波的核大小，应为奇数，表示滤波器的尺寸。

### 函数内部工作流程：

1. 初始化变量：根据传入的图像矩阵和滤波器尺寸，计算图像的宽度、高度，并初始化一个新的矩阵 `filtered_img` 用于存储滤波后的图像数据。

   ```python
   k = kernel_size // 2
   width = len(img_matrix[0])
   height = len(img_matrix)
   filtered_img = [[0] * width for _ in range(height)]
   ```

2. 遍历图像矩阵中的每个像素：对于每个像素，获取其周围的像素值，并收集到一个列表 `kernel_pixels` 中。

   - 对于每个像素 `(x, y)`：
     - 在以 `(x, y)` 为中心的滤波器区域内遍历周围的像素。
     - 将该区域内的所有像素值收集到 `kernel_pixels` 列表中。

   ```python
   for y in range(height):
       for x in range(width):
           kernel_pixels = []
           for ky in range(-k, k+1):
               for kx in range(-k, k+1):
                   new_x = x + kx
                   new_y = y + ky
                   
                   if (0 <= new_x < width) and (0 <= new_y < height):
                       kernel_pixels.append(img_matrix[new_y][new_x])
   ```

3. 对 `kernel_pixels` 中的像素值进行排序，并选择其中值作为该像素的新值。

   - 对 `kernel_pixels` 列表中的值进行排序。
   - 选择排序后列表的中间值作为该像素的新值，并将其存储在 `filtered_img` 中。

   ```python
   kernel_pixels.sort()
   filtered_img[y][x] = kernel_pixels[len(kernel_pixels) // 2]
   ```

4. 返回经过中值滤波处理后的 `filtered_img` 图像矩阵。

   ```python
   return filtered_img
   ```

该函数的作用是对图像矩阵应用中值滤波，通过选择像素周围区域的中间值来减少图像中的噪点，从而实现图像的平滑处理。

In [None]:
def median_filter(img_matrix, kernel_size):
    """
    Apply median filter to the image matrix.
    :param img_matrix: 2D list of integers - the image matrix where each value represents a pixel's intensity.
    :param kernel_size: integer - the size of the kernel; it should be an odd number.
    :return: 2D list of integers - the filtered image matrix.
    """
    k = kernel_size // 2
    width = len(img_matrix[0])
    height = len(img_matrix)
    
    filtered_img = [[0] * width for _ in range(height)]
    
    for y in range(height):
        for x in range(width):
            # Collect all the pixels within the kernel
            kernel_pixels = []
            for ky in range(-k, k+1):
                for kx in range(-k, k+1):
                    new_x = x + kx
                    new_y = y + ky
                    
                    if (0 <= new_x < width) and (0 <= new_y < height):
                        kernel_pixels.append(img_matrix[new_y][new_x])
            
            # Sort the list of pixels and choose the median value
            kernel_pixels.sort()
            filtered_img[y][x] = kernel_pixels[len(kernel_pixels) // 2]

    return filtered_img

## 主函数

In [None]:
filename = '/Users/sksx085/Desktop/各种实验报告等狗屎/数字图像处理/converted_image.bmp'  
image_matrix = read_bmp(filename)

"""
mean_filtered_img = mean_filter_color(image_matrix, 3)
median_filtered_img = median_filter(image_matrix, 3)

#print(mean_filtered_img, median_filtered_img)

for row in mean_filtered_img:
    show_row = '[' + ','.join(str(elem) for elem in row) +']'
    print(show_row)
    
"""

# Assuming you have your image_matrix and the functions mean_filter_color and median_filter are defined and working properly
mean_filtered_img = mean_filter_color(image_matrix, 3)
median_filtered_img = median_filter(image_matrix, 3)

# Save the mean filtered image to a file
save_image_from_matrix(mean_filtered_img, 'mean_filtered_image.bmp')

# Save the median filtered image to a file
save_image_from_matrix(median_filtered_img, 'median_filtered_image.bmp')