## 1.清洗沪深300成分股技术指标

In [16]:
import os
import pandas as pd

def process_excel(input_file, output_folder, rows, cols):
    """
    读取 Excel 文件的每个 sheet 的指定行列，并分别保存到新的文件中，确保格式不变。
    
    :param input_file: 输入的 Excel 文件路径
    :param output_folder: 输出文件夹路径
    :param rows: 指定的行范围（从1开始计数）
    :param cols: 指定的列索引（从0开始）
    """
    # 确保输出文件夹存在
    os.makedirs(output_folder, exist_ok=True)
    
    # 读取输入文件的所有 sheet
    excel_data = pd.ExcelFile(input_file)
    
    for sheet_name in excel_data.sheet_names:
        # 读取当前 sheet，禁用日期解析
        sheet_df = pd.read_excel(input_file, sheet_name=sheet_name, engine='openpyxl', dtype=str)
        
        # 提取第 2 行 B 列的内容作为输出文件名的一部分
        try:
            output_file_part = sheet_df.iloc[0, 1]  # 第 2 行 B 列（行索引从0开始，第 2 行是索引1，第 B 列是索引1）
        except IndexError:
            output_file_part = "undefined"  # 如果第 2 行 B 列没有内容，设置默认值
        
        # 提取指定行和列的数据
        selected_data = sheet_df.iloc[rows[0]-1:rows[1], cols[0]:cols[1]]
        
        # 构建输出文件路径（增加 sheet_name 确保唯一性）
        output_file = f"{output_folder}/{output_file_part}_{sheet_name}_processed.xlsx"
        
        # 写入新的文件，指定日期格式
        with pd.ExcelWriter(output_file, engine='openpyxl', datetime_format='yyyy/mm/dd') as writer:
            selected_data.to_excel(writer, index=False, sheet_name=sheet_name)
        
        print(f"已保存 {sheet_name} 到 {output_file}")

# 示例用法
input_file = "带技术指标/工作簿5-14.xlsx"  # 输入文件路径
output_folder = "0109沪深300股票1"  # 输出文件夹路径
rows = (2, 250)  # 指定行范围（从第3行到第250行）
cols = (0, 84)  # 指定列索引（从第0列到第84列）

process_excel(input_file, output_folder, rows, cols)


已保存 Sheet1 到 0109沪深300股票1/undefined_Sheet1_processed.xlsx
已保存 中国石化 到 0109沪深300股票1/600028.SH_中国石化_processed.xlsx
已保存 南方航空 到 0109沪深300股票1/600029.SH_南方航空_processed.xlsx
已保存 中信证券 到 0109沪深300股票1/600030.SH_中信证券_processed.xlsx
已保存 三一重工 到 0109沪深300股票1/600031.SH_三一重工_processed.xlsx
已保存 招商银行 到 0109沪深300股票1/600036.SH_招商银行_processed.xlsx
已保存 四川路桥 到 0109沪深300股票1/600039.SH_四川路桥_processed.xlsx
已保存 保利发展 到 0109沪深300股票1/600048.SH_保利发展_processed.xlsx
已保存 中国联通 到 0109沪深300股票1/600050.SH_中国联通_processed.xlsx
已保存 上汽集团 到 0109沪深300股票1/600104.SH_上汽集团_processed.xlsx
已保存 北方稀土 到 0109沪深300股票1/600111.SH_北方稀土_processed.xlsx
已保存 片仔癀 到 0109沪深300股票1/600436.SH_片仔癀_processed.xlsx
已保存 贵州茅台 到 0109沪深300股票1/600519.SH_贵州茅台_processed.xlsx
已保存 青岛啤酒 到 0109沪深300股票1/600600.SH_青岛啤酒_processed.xlsx
已保存 福耀玻璃 到 0109沪深300股票1/600660.SH_福耀玻璃_processed.xlsx
