In [1]:
import pandas as pd
import numpy as np

# 1. 创建包含缺失值的DataFrame并保存为CSV文件
def create_and_save_csv():
    # 创建包含缺失值的数据
    data = {
        'Student_ID': [1001, 1002, 1003, 1004, 1005],
        'Name': ['张三', '李四', np.nan, '赵六', '钱七'],
        'Score': [85, 92, 78, np.nan, 65],
        'Grade': ['A', 'B', 'B', 'C', 'A']
    }
    
    # 创建DataFrame
    df = pd.DataFrame(data)
    
    # 保存为CSV文件
    csv_path = 'students.csv'
    df.to_csv(csv_path, index=False, encoding='utf-8-sig')
    
    print(f"已创建并保存students.csv文件，数据如下：")
    print(df)
    return df, csv_path

# 2. 读取CSV文件并显示前3行
def read_and_display_csv(csv_path):
    # 读取CSV文件
    df = pd.read_csv(csv_path)
    
    print("\n读取的CSV文件前3行：")
    print(df.head(3))
    return df

# 3. 处理缺失值
def handle_missing_values(df):
    # 计算Score列的平均值
    score_mean = df['Score'].mean()
    
    # 填充缺失值
    df_cleaned = df.fillna({
        'Score': score_mean,
        'Name': 'Unknown'
    })
    
    print("\n处理缺失值后的数据：")
    print(df_cleaned)
    return df_cleaned

# 4. 保存处理后的DataFrame为新CSV文件
def save_cleaned_csv(df_cleaned, output_path):
    # 保存为新CSV文件，不包含索引列
    df_cleaned.to_csv(output_path, index=False, encoding='utf-8-sig')
    print(f"\n已保存处理后的文件到{output_path}")

# 主函数
def main():
    print("=== 开始处理学生数据CSV文件 ===")
    
    # 1. 创建并保存CSV文件
    df, csv_path = create_and_save_csv()
    
    # 2. 读取并显示CSV文件前3行
    df_read = read_and_display_csv(csv_path)
    
    # 3. 处理缺失值
    df_cleaned = handle_missing_values(df_read)
    
    # 4. 保存处理后的CSV文件
    output_path = 'students_cleaned.csv'
    save_cleaned_csv(df_cleaned, output_path)
    
    print("=== 学生数据处理完成 ===")

if __name__ == "__main__":
    main()

=== 开始处理学生数据CSV文件 ===
已创建并保存students.csv文件，数据如下：
   Student_ID Name  Score Grade
0        1001   张三   85.0     A
1        1002   李四   92.0     B
2        1003  NaN   78.0     B
3        1004   赵六    NaN     C
4        1005   钱七   65.0     A

读取的CSV文件前3行：
   Student_ID Name  Score Grade
0        1001   张三   85.0     A
1        1002   李四   92.0     B
2        1003  NaN   78.0     B

处理缺失值后的数据：
   Student_ID     Name  Score Grade
0        1001       张三   85.0     A
1        1002       李四   92.0     B
2        1003  Unknown   78.0     B
3        1004       赵六   80.0     C
4        1005       钱七   65.0     A

已保存处理后的文件到students_cleaned.csv
=== 学生数据处理完成 ===
