In [3]:
import matplotlib.pyplot as plt
import cv2
import numpy as np

In [8]:
import cv2
import numpy as np
import os
from pathlib import Path

def remove_red_watermark(input_path, output_path):
    # 读取图片
    img = cv2.imread(input_path)
    
    # 转换为HSV颜色空间
    hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
    
    # 缩小淡红色的HSV范围
    # 增加饱和度下限，缩小色调范围
    lower_red1 = np.array([0, 20, 170])    # 增加S下限(10->20)，增加V下限(150->170)
    upper_red1 = np.array([20, 130, 255])  # 缩小H上限(30->20)，减小S上限(150->130)
    
    lower_red2 = np.array([160, 20, 170])  # 增加S下限，增加V下限，缩小H下限(150->160)
    upper_red2 = np.array([180, 130, 255]) # 减小S上限
    
    # 创建两个掩码并合并
    mask1 = cv2.inRange(hsv, lower_red1, upper_red1)
    mask2 = cv2.inRange(hsv, lower_red2, upper_red2)
    mask = cv2.bitwise_or(mask1, mask2)
    
    # 移除掩码扩展操作（或减弱它）
    # 如果需要轻微的扩展，可以取消注释下面的代码
    # kernel = np.ones((1,1), np.uint8)  # 从(2,2)减小到(1,1)
    # mask = cv2.dilate(mask, kernel, iterations=1)
    
    # 将水印区域替换为白色
    img[mask > 0] = [255, 255, 255]
    
    # 保存结果
    cv2.imwrite(output_path, img)
    print(f"处理完成: {output_path}")

def process_all_images():
    # 定义输入和输出目录
    input_dir = "output/QJLY"
    output_dir = "output/QJLY_rm_water_mark"
    
    # 创建输出目录（如果不存在）
    Path(output_dir).mkdir(parents=True, exist_ok=True)
    
    # 支持的图片格式
    image_extensions = ['.jpg', '.jpeg', '.png', '.bmp', '.tiff']
    
    # 处理计数器
    count = 0
    failed = 0
    
    # 处理所有图片
    all_files = os.listdir(input_dir)
    total_files = len([f for f in all_files if os.path.splitext(f)[1].lower() in image_extensions])
    
    print(f"开始处理，共发现 {total_files} 张图片...")
    
    for filename in all_files:
        # 检查文件扩展名
        file_ext = os.path.splitext(filename)[1].lower()
        if file_ext in image_extensions:
            input_path = os.path.join(input_dir, filename)
            output_path = os.path.join(output_dir, filename)
            
            # 处理图片
            try:
                remove_red_watermark(input_path, output_path)
                count += 1
                # 显示进度
                if count % 10 == 0 or count == total_files:
                    print(f"进度: {count}/{total_files} ({(count/total_files*100):.1f}%)")
            except Exception as e:
                failed += 1
                print(f"处理 {filename} 时出错: {e}")
    
    print(f"处理完成! 成功处理: {count} 张图片, 失败: {failed} 张图片")
    print(f"处理后的图片已保存到 {output_dir} 目录")

if __name__ == "__main__":
    # 处理所有图片
    process_all_images()


开始处理，共发现 27 张图片...
处理完成: output/QJLY_rm_water_mark/page_2.png
处理完成: output/QJLY_rm_water_mark/page_3.png
处理完成: output/QJLY_rm_water_mark/page_1.png
处理完成: output/QJLY_rm_water_mark/page_4.png
处理完成: output/QJLY_rm_water_mark/page_5.png
处理完成: output/QJLY_rm_water_mark/page_7.png
处理完成: output/QJLY_rm_water_mark/page_6.png
处理完成: output/QJLY_rm_water_mark/page_19.png
处理完成: output/QJLY_rm_water_mark/page_25.png
处理完成: output/QJLY_rm_water_mark/page_24.png
进度: 10/27 (37.0%)
处理完成: output/QJLY_rm_water_mark/page_18.png
处理完成: output/QJLY_rm_water_mark/page_26.png
处理完成: output/QJLY_rm_water_mark/page_27.png
处理完成: output/QJLY_rm_water_mark/page_23.png
处理完成: output/QJLY_rm_water_mark/page_22.png
处理完成: output/QJLY_rm_water_mark/page_20.png
处理完成: output/QJLY_rm_water_mark/page_21.png
处理完成: output/QJLY_rm_water_mark/page_10.png
处理完成: output/QJLY_rm_water_mark/page_11.png
处理完成: output/QJLY_rm_water_mark/page_13.png
进度: 20/27 (74.1%)
处理完成: output/QJLY_rm_water_mark/page_12.png
处理完成: output/QJLY_rm_water_m