## 读取 写入 JSON 文件
- json.load() 读取文件内容   
json.load(file) 用于将 JSON 文件的内容解析为 Python 对象（通常是字典或列表）。必须先用 Python 的 open() 打开文件。

- json.dump(data, file, indent=4)：将 Python 对象序列化为 JSON 格式并写入文件。


In [None]:
import json
from pathlib import Path

# 文件路径
input_file = Path("data.json")  # 原始文件
output_file = Path("cleaned_data.json")  # 清理后的文件

# Step 1: 读取 JSON 文件
with open(input_file, "r") as file:
    data = json.load(file)  # 将 JSON 文件内容解析为 Python 列表

# Step 2: 数据清理
# 规则：移除包含 null 值的记录
cleaned_data = [entry for entry in data if None not in entry.values()]

# Step 3: 保存清理后的数据到新 JSON 文件
with open(output_file, "w") as file:
    json.dump(cleaned_data, file, indent=4)  # 格式化保存，设置缩进为 4 格

print(f"Cleaned data has been saved to {output_file}")


1. 文件路径：

使用 Path（来自 pathlib）模块操作路径，方便跨平台使用。
input_file 和 output_file 分别表示输入和输出的文件路径。
2. 读取数据：

json.load(file) 将文件内容加载为 Python 数据结构（这里是列表）。
3. 清理数据：

使用列表推导式 [entry for entry in data if None not in entry.values()]。
检查每个记录的值（entry.values()），如果包含 None，就过滤掉。
4. 保存清理后数据：

使用 json.dump(data, file, indent=4) 将 Python 数据写入文件。
indent=4 美化输出，方便阅读。




## txt 文件

In [None]:
from pathlib import Path

# 文件路径
file_path = Path("example.txt")

# 读取文本文件
with open(file_path, "r", encoding="utf-8") as file:
    content = file.readlines()  # 按行读取为列表

# 写入文本文件
new_file = Path("example_copy.txt")
with open(new_file, "w", encoding="utf-8") as file:
    file.write("".join(content))  # 将列表内容写入新文件

## csv 和 excel/.xlsx 文档，适合用pandas 读取 更快 更好 因为都是表格

In [None]:
import pandas as pd

# 使用 pandas 读取 Excel 文件
df = pd.read_excel("data/riket2023_åk9_np.xlsx")

# 显示读取的数据
print(df)

In [None]:
df = pd.read_csv("data/riket2023_åk9_np.csv")

## csv 文件

In [None]:
# 文件路径
file_path = "example.csv"

# 读取 CSV 文件
with open(file_path, "r", encoding="utf-8") as file:
    reader = csv.DictReader(file)  # 将每行作为字典读取
    data = [row for row in reader]  # 保存为列表

# 写入 CSV 文件
output_file = "output.csv"
with open(output_file, "w", encoding="utf-8", newline="") as file:
    fieldnames = data[0].keys()  # 获取列名
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    writer.writeheader()  # 写入表头
    writer.writerows(data)  # 写入行

## Excel 文件
使用 openpyxl 读取和写入 Excel

In [None]:
from openpyxl import load_workbook, Workbook

# 读取 Excel 文件
file_path = "example.xlsx"
wb = load_workbook(file_path)
sheet = wb.active  # 获取活动工作表

# 读取单元格内容
data = []
for row in sheet.iter_rows(values_only=True):  # 按行读取数据
    data.append(row)

# 写入新的 Excel 文件
output_file = "output.xlsx"
new_wb = Workbook()
new_sheet = new_wb.active
for row in data:
    new_sheet.append(row)  # 将数据逐行写入

new_wb.save(output_file)