# Python csv 模块用法

## 基本概念
`csv` 模块是Python标准库，用于读取和写入CSV（Comma-Separated Values）文件。

## 核心类和函数
- `csv.reader()` - 读取CSV文件
- `csv.writer()` - 写入CSV文件  
- `csv.DictReader()` - 将行读取为字典
- `csv.DictWriter()` - 将字典写入为行


In [8]:
import csv
from pathlib import Path
employee_parent_path = Path.cwd().parent.parent.parent
employee_path = Path(employee_parent_path / 'python巩固语法练习题' / 'employees.csv')
# 1. 基本读取 - csv.reader()
with open(employee_path, 'r', encoding='utf-8') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)  # 每行是一个列表 ['col1', 'col2', 'col3']

# 2. 基本写入 - csv.writer()  
with open('output.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(['姓名', '年龄', '城市'])      # 写入标题行
    writer.writerow(['张三', '25', '北京'])       # 写入数据行
    writer.writerows([                          # 批量写入
        ['李四', '30', '上海'],
        ['王五', '28', '广州']
    ])


['姓名', '部门', '工资', '入职日期']
['张三', '技术部', '8000', '2023-01-15']
['李四', '销售部', '6000', '2023-02-20']
['王五', '技术部', '9000', '2022-12-10']
['赵六', '人事部', '7000', '2023-03-05']
['钱七', '技术部', '8500', '2023-01-25']


## 字典方式操作 - 更便于处理带标题的CSV

### DictReader - 读取为字典
将第一行作为字段名，后续行作为对应值的字典

### DictWriter - 写入字典
需要指定字段名，将字典按字段顺序写入


In [9]:
# 字典方式操作示例

# 1. DictReader - 读取为字典
with open('output.csv', 'r', encoding='utf-8') as file:
    reader = csv.DictReader(file)
    for row in reader:
        print(row)  # 字典：{'姓名': '张三', '年龄': '25', '城市': '北京'}
        print(f"姓名: {row['姓名']}, 年龄: {row['年龄']}")

# 2. DictWriter - 写入字典
fieldnames = ['姓名', '年龄', '城市']
with open('output.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    writer.writeheader()  # 写入标题行
    writer.writerow({'姓名': '张三', '年龄': '25', '城市': '北京'})
    writer.writerows([    # 批量写入
        {'姓名': '李四', '年龄': '30', '城市': '上海'},
        {'姓名': '王五', '年龄': '28', '城市': '广州'}
    ])


{'姓名': '张三', '年龄': '25', '城市': '北京'}
姓名: 张三, 年龄: 25
{'姓名': '李四', '年龄': '30', '城市': '上海'}
姓名: 李四, 年龄: 30
{'姓名': '王五', '年龄': '28', '城市': '广州'}
姓名: 王五, 年龄: 28


## CSV Writer 方法详解

### csv.writer 核心方法

| 方法 | 功能 | 参数 | 示例 |
|------|------|------|------|
| `writerow(row)` | 写入单行数据 | 列表/元组 | `writer.writerow(['张三', 25])` |
| `writerows(rows)` | 批量写入多行 | 列表的列表 | `writer.writerows([['张三', 25], ['李四', 30]])` |

### csv.DictWriter 核心方法

| 方法 | 功能 | 参数 | 示例 |
|------|------|------|------|
| `writeheader()` | 写入表头 | 无 | `writer.writeheader()` |
| `writerow(rowdict)` | 写入单行字典 | 字典 | `writer.writerow({'name': '张三', 'age': 25})` |
| `writerows(rowdicts)` | 批量写入字典列表 | 字典列表 | `writer.writerows([{}, {}])` |


In [13]:
# Writer 方法详细演示

print("=== csv.writer 方法演示 ===")

# 1. writerow() - 逐行写入
with open('students.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    
    # 写入表头
    writer.writerow(['姓名', '年龄', '班级', '成绩'])
    
    # 逐行写入数据
    writer.writerow(['张三', 18, '高一1班', 85])
    writer.writerow(['李四', 17, '高一2班', 92])
    writer.writerow(['王五', 18, '高一1班', 78])

print("writerow() 写入完成")

# 2. writerows() - 批量写入
students_data = [
    ['赵六', 17, '高一3班', 88],
    ['钱七', 18, '高一2班', 95],
    ['孙八', 17, '高一3班', 82]
]

with open('students.csv', 'a', newline='', encoding='utf-8') as file:  # 追加模式
    writer = csv.writer(file)
    writer.writerows(students_data)

print("writerows() 批量写入完成")

# 读取验证
with open('students.csv', 'r', encoding='utf-8') as file:
    reader = csv.reader(file)
    print("写入结果:")
    for i, row in enumerate(reader):
        print(f"第{i+1}行: {row}")


=== csv.writer 方法演示 ===
writerows() 批量写入完成
写入结果:
第1行: ['赵六', '17', '高一3班', '88']
第2行: ['钱七', '18', '高一2班', '95']
第3行: ['孙八', '17', '高一3班', '82']
第4行: ['赵六', '17', '高一3班', '88']
第5行: ['钱七', '18', '高一2班', '95']
第6行: ['孙八', '17', '高一3班', '82']


In [None]:
# DictWriter 方法详细演示

print("\n=== csv.DictWriter 方法演示 ===")

# 准备字典数据
employees = [
    {'姓名': '张三', '部门': '技术部', '工资': 8000, '入职日期': '2023-01-15'},
    {'姓名': '李四', '部门': '销售部', '工资': 6000, '入职日期': '2023-02-20'},
    {'姓名': '王五', '部门': '技术部', '工资': 9000, '入职日期': '2022-12-10'}
]

# 1. 完整的DictWriter写入流程
fieldnames = ['姓名', '部门', '工资', '入职日期']

with open('employees_dict.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    
    # 1. 写入表头
    writer.writeheader()
    print("writeheader() 写入表头完成")
    
    # 2. 逐行写入字典
    writer.writerow(employees[0])
    print("writerow() 写入第一行完成")
    
    # 3. 批量写入剩余数据
    writer.writerows(employees[1:])
    print("writerows() 批量写入完成")

# 读取验证
print("\nDictWriter 写入结果:")
with open('employees_dict.csv', 'r', encoding='utf-8') as file:
    reader = csv.DictReader(file)
    for i, row in enumerate(reader, 1):
        print(f"第{i}行: {row}")


In [None]:
# Reader 方法详细演示

print("=== csv.reader vs csv.DictReader 对比 ===")

# 使用之前创建的 students.csv 文件

# 1. csv.reader - 返回列表
print("\n1. csv.reader 读取:")
with open('students.csv', 'r', encoding='utf-8') as file:
    reader = csv.reader(file)
    header = next(reader)  # 手动获取表头
    print(f"表头: {header}")
    
    for i, row in enumerate(reader, 1):
        print(f"第{i}行 (列表): {row}")
        print(f"  姓名: {row[0]}, 年龄: {row[1]}, 班级: {row[2]}, 成绩: {row[3]}")
        if i >= 3:  # 只显示前3行
            break

# 2. csv.DictReader - 返回字典
print("\n2. csv.DictReader 读取:")
with open('students.csv', 'r', encoding='utf-8') as file:
    dict_reader = csv.DictReader(file)
    print(f"字段名: {dict_reader.fieldnames}")
    
    for i, row in enumerate(dict_reader, 1):
        print(f"第{i}行 (字典): {row}")
        print(f"  姓名: {row['姓名']}, 年龄: {row['年龄']}, 班级: {row['班级']}, 成绩: {row['成绩']}")
        if i >= 3:  # 只显示前3行
            break


In [None]:
# 实际应用场景演示

print("=== 实际应用场景 ===")

# 场景1: 动态生成数据 - 使用 writerow()
print("\n场景1: 实时处理订单数据")
import random
from datetime import datetime, timedelta

with open('orders.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(['订单ID', '客户名', '金额', '日期'])
    
    # 模拟实时生成订单
    for i in range(1, 6):
        order_id = f'ORD{i:03d}'
        customer = f'客户{i}'
        amount = random.randint(100, 1000)
        date = (datetime.now() - timedelta(days=i)).strftime('%Y-%m-%d')
        
        writer.writerow([order_id, customer, amount, date])
        print(f"处理订单: {order_id}")

# 场景2: 批量导入数据 - 使用 writerows()
print("\n场景2: 批量导入产品数据")
products = [
    ['P001', '笔记本电脑', 5999, '电子产品'],
    ['P002', '无线鼠标', 99, '电子产品'],
    ['P003', '机械键盘', 299, '电子产品'],
    ['P004', '显示器', 1299, '电子产品']
]

with open('products.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(['产品ID', '产品名', '价格', '分类'])
    writer.writerows(products)  # 一次性写入所有数据

print("批量导入完成")

# 场景3: 字典数据处理 - 使用 DictWriter
print("\n场景3: 用户配置文件导出")
user_configs = [
    {'用户ID': 1, '用户名': 'admin', '权限': '管理员', '状态': '激活'},
    {'用户ID': 2, '用户名': 'user1', '权限': '普通用户', '状态': '激活'},
    {'用户ID': 3, '用户名': 'user2', '权限': '普通用户', '状态': '禁用'}
]

fieldnames = ['用户ID', '用户名', '权限', '状态']
with open('user_config.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.DictWriter(file, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerows(user_configs)

print("用户配置导出完成")


### reader = csv.DictReader(file)读取的文件的结构到底是什么？输出的只是一个DictReader的类型。其中csv文件的结构如output.csv所示，为什么只有一个表头，用for输出之后每一行的key都是表头？
`csv.DictReader 的工作原理是：`
- 自动读取第一行作为字典的键（表头）
- 之后的每一行数据作为对应键的值
- 每读取一行，就创建一个新字典，用表头作为键，当前行的数据作为值

所以对于 output.csv，第一行 姓名,年龄,城市 会被用作所有后续行的键，这就是为什么每行输出的字典都用相同的表头作为键。这种设计让处理带标题的 CSV 文件更直观。

## 常用参数

### 分隔符设置
- `delimiter=','` - 字段分隔符（默认逗号）
- `quotechar='"'` - 引用字符（默认双引号）
- `quoting=csv.QUOTE_MINIMAL` - 引用策略

### 编码和换行
- `encoding='utf-8'` - 文件编码
- `newline=''` - 写入时防止空行（Windows需要）


In [None]:
# 自定义参数示例

# 1. 自定义分隔符（分号分隔）
with open('data.csv', 'r', encoding='utf-8') as file:
    reader = csv.reader(file, delimiter=';')
    for row in reader:
        print(row)

# 2. 处理包含逗号的字段
with open('data.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file, quoting=csv.QUOTE_ALL)  # 所有字段加引号
    writer.writerow(['姓名', '地址', '备注'])
    writer.writerow(['张三', '北京市,朝阳区', '家住三环,近地铁'])

# 3. TSV文件（Tab分隔）
with open('data.tsv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file, delimiter='\t')  # Tab分隔符
    writer.writerow(['姓名', '年龄', '城市'])


## 注意事项

1. **文件编码**：使用 `encoding='utf-8'` 处理中文
2. **换行符**：写入时使用 `newline=''` 避免空行（Windows）
3. **关闭文件**：使用 `with` 语句自动关闭文件
4. **数据类型**：读取的所有数据都是字符串，需要手动转换类型

```python
# 类型转换示例
for row in reader:
    name = row[0]           # 字符串
    age = int(row[1])       # 转为整数
    salary = float(row[2])  # 转为浮点数
```


## 🤔 疑问：

```python
def save_results(self, filename, data):
        """将结果保存到新的CSV文件"""
        # TODO: 将处理后的数据保存为CSV
        if not data:
            print("当前没有数据需要保存")
        try:
            with open(filename, "w", newline="", encoding="utf-8") as file:
                if isinstance(data, list) and data:
                    fieldnames = data[0].keys()
                    print(fieldnames)
                    writer = csv.DictWriter(file, fieldnames=fieldnames)
                    writer.writeheader()
                    writer.writerows(data)
                elif isinstance(data, dict):
                    writer = csv.writer(file)
                    writer.writerows(data)
                print(f"数据已经保存到: {filename}")
        except Exception as e:
            print("写入文件出错", e)
```
#### 疑问1:

在这个函数中:
1. 为什么 if 中 csv.DictWriter 的第一个参数是 file 而不是 data？
2. 为什么 elif 中的 csv.writer 的第一个参数是 file 而不是 data？
3. 为什么 writerows 的参数是 data 而不是 file？

因为:
`csv.DictWriter/csv.writer` 需要一个文件对象来写入数据，所以第一个参数是已打开的文件 `file`
`writerows() `方法是用来写入实际数据的，所以参数是要写入的数据 `data`
这反映了职责分离:

`writer` 对象负责如何写入(处理文件 IO)

`writerows()`负责写入什么内容(处理数据)

#### 疑问2:
elif中的代码是否有问题？

有问题。`writer.writerows(data)`直接写入字典会导致键被分割成单独的字符写入CSV。应该将字典数据转换成合适的列表格式，比如：`writer.writerows([[k, v] for k, v in data.items()])`。这就是为什么在平均工资.csv中看到部门名被分割成单个字符。

平均工资.csv:

技,术,部
销,售,部
人,事,部

改进后的elif:
```python

```

`writer.writerows(data)`直接写入字典会导致键被分割成单独的字符写入CSV？

当使用csv.writer写入字典时，它会将字典的键当作字符串处理，并把这个字符串的每个字符作为CSV的单独一列。例如，键"技术部"会被拆分成"技"、"术"、"部"三列。这是因为csv.writer期望接收的是列表或元组，而不是字典。
```python

```


In [None]:
# 演示问题和解决方案

print("=== 演示字典写入问题 ===")

# 模拟部门平均工资数据
dept_salaries = {
    '技术部': 8500.0,
    '销售部': 6000.0,
    '人事部': 7000.0
}

# ❌ 错误方式：直接写入字典
print("\n错误方式的结果:")
with open('wrong_way.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerows(dept_salaries)  # 字典键被拆分

# 查看错误结果
with open('wrong_way.csv', 'r', encoding='utf-8') as file:
    print("错误结果内容:")
    for line in file:
        print(repr(line.strip()))

# ✅ 正确方式1：转换为列表的列表
print("\n正确方式1的结果:")
with open('correct_way1.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(['部门', '平均工资'])  # 表头
    writer.writerows([[k, v] for k, v in dept_salaries.items()])

# ✅ 正确方式2：使用DictWriter
print("\n正确方式2的结果:")
# 先转换字典格式
data_for_dict_writer = [{'部门': k, '平均工资': v} for k, v in dept_salaries.items()]

with open('correct_way2.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.DictWriter(file, fieldnames=['部门', '平均工资'])
    writer.writeheader()
    writer.writerows(data_for_dict_writer)

# 验证正确结果
print("\n正确方式1的内容:")
with open('correct_way1.csv', 'r', encoding='utf-8') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

print("\n正确方式2的内容:")
with open('correct_way2.csv', 'r', encoding='utf-8') as file:
    reader = csv.DictReader(file)
    for row in reader:
        print(row)
