## 文件读写

打开文件，读取文件内容，写入文件。

在Python中，文件操作是通过内置的`open`函数实现的，它可以打开一个文件，并返回一个文件对象。然后，你可以通过这个文件对象进行读取或写入操作。文件操作完成后，应该使用`close`方法来关闭文件，释放系统资源。Python也提供了一个`with`语句，自动管理文件的打开和关闭过程，这是处理文件时的首选方式。

### 打开文件

使用`open`函数打开文件。它的基本语法是：

```python
file_object = open(file_name, mode)
```

其中`file_name`是文件的路径，`mode`指定了打开文件的模式，如只读（`'r'`）、写入（`'w'`）、追加（`'a'`）等。如果不指定模式，默认为只读模式。

### 读取文件内容

- 使用`read(size)`方法可以读取指定数量的数据。如果`size`参数未指定或为负，`read`将读取并返回整个文件的内容。
- 使用`readline()`方法可以从文件中读取一行。
- 使用`readlines()`方法可以读取所有行并作为列表返回。

### 写入文件

- 使用`write(string)`方法可以将字符串写入文件。
- 使用`writelines(strings)`方法可以将一个字符串列表写入文件。

### 使用`with`语句处理文件

`with`语句可以自动管理文件的打开和关闭，即使在处理文件时发生异常也能确保文件正确关闭。

### 示例代码

#### 读取文件

```python
with open('example.txt', 'r') as file:
    content = file.read()
    print(content)
```

#### 读取文件每一行

```python
with open('example.txt', 'r') as file:
    for line in file:
        print(line, end='')
```

#### 写入文件

```python
with open('example.txt', 'w') as file:
    file.write("Hello, world!\n")
```

#### 追加内容到文件

```python
with open('example.txt', 'a') as file:
    file.write("Another line.\n")
```

使用文件操作时需要注意的是，当以写入（`'w'`）模式打开文件时，如果文件已存在，原有内容会被清空。如果需要在现有内容后追加内容，应该使用追加（`'a'`）模式打开文件。

正确地使用文件操作方法，你可以轻松地在Python程序中读取、写入和处理文件数据。

让我们通过更多的示例来深入了解Python文件操作的不同方面。

### 示例1：逐行读取文件内容

读取文件的每一行，并处理每一行数据。这对于处理大文件特别有用，因为它不会一次性将整个文件加载到内存中。

```python
with open('example.txt', 'r') as file:
    for line in file:
        # strip()方法移除字符串头尾指定的字符（默认为空格或换行符）
        processed_line = line.strip()
        print(processed_line)
```

### 示例2：读取大文件的一部分

对于非常大的文件，你可能只想读取文件的一部分，或者分块读取文件。

```python
with open('large_file.txt', 'r') as file:
    while True:
        chunk = file.read(1024)  # 读取下一个1KB大小的块
        if not chunk:
            break
        print(chunk)
```

### 示例3：使用`readlines()`一次读取所有行

`readlines()`方法读取文件的每一行，并将它们作为一个字符串列表返回。注意，这可能会消耗大量内存，尤其是在处理大文件时。

```python
with open('example.txt', 'r') as file:
    lines = file.readlines()
    for line in lines:
        print(line.strip())
```

### 示例4：写入多行到文件

将一个字符串列表写入文件，每个字符串占一行。

```python
lines = ["First line\n", "Second line\n", "Third line\n"]
with open('example.txt', 'w') as file:
    file.writelines(lines)
```

### 示例5：复制文件内容

读取一个文件的内容，并将内容写入到另一个文件中。

```python
with open('source.txt', 'r') as source_file:
    with open('destination.txt', 'w') as destination_file:
        for line in source_file:
            destination_file.write(line)
```

### 示例6：使用`with`语句同时处理多个文件

`with`语句支持同时打开多个文件。

```python
with open('input.txt', 'r') as input_file, open('output.txt', 'w') as output_file:
    for line in input_file:
        output_file.write(line.upper())  # 将输入文件的内容转换为大写并写入输出文件
```

### 示例7：搜索文件中的特定文本

读取文件内容并搜索包含特定文本的行。

```python
search_term = "Python"
with open('example.txt', 'r') as file:
    for line_number, line in enumerate(file, start=1):
        if search_term in line:
            print(f"Found '{search_term}' on line {line_number}: {line.strip()}")
```

### 示例8：读取CSV文件

处理CSV文件是一个常见任务。以下示例展示如何读取CSV文件并打印每一行的内容。在实际应用中，你可能会使用`csv`模块来简化处理。

```python
with open('data.csv', 'r') as file:
    for line in file:
        data = line.strip().split(',')
        print(data)
```

### 示例9：以二进制模式读写文件

有时你可能需要以二进制模式处理文件，例如，当你处理图像或视频文件时。

```python
# 写入二进制数据到文件
with open('binary.dat', 'wb') as file:
    file.write(b'\x00\x01\x02\x03')  # 写入一些二进制数据

# 从文件读取二进制数据
with open('binary.dat', 'rb') as file:
    data = file.read()
    print(data)  # 输出: b'\x00\x01\x02\x03'
```

### 示例10：使用`json`模块读写JSON文件

JSON是一种轻量级的数据交换格式。Python的`json`模块提供了简单的方法来编码和解码JSON数据。

```python
import json

# 写入JSON数据到文件
data = {
    "name": "John Doe",
    "age": 30,
    "city": "New York"
}
with open('data.json', 'w') as file:
    json.dump(data, file)

# 从文件读取JSON数据
with open('data.json', 'r') as file:
    data = json.load(file)
    print(data)
```

### 示例11：安全地创建文件

有时你只想创建一个文件，如果文件已经存在，则不进行任何操作。可以使用`x`模式（独占创建模式）来实现这一点。

```python
try:
    with open('myfile.txt', 'x') as f:
        f.write("Hello World\n")
except FileExistsError:
    print("myfile.txt already exists")
```

这些示例展示了Python在文件处理方面的多样化能力，从简单的文本读写到处理二进制文件，再到解析和生成JSON数据，Python都提供了简洁而强大的工具。

## 文件与上下文管理

with语句。

`with`语句在Python中用于上下文管理，它提供了一种简洁的方式来处理资源的获取与释放，确保使用资源如文件或网络连接时的正确管理。当使用`with`语句时，Python会在代码块开始时自动获取资源，并在代码块执行结束时，不论是正常结束还是因异常而结束，都会自动释放资源。

### 基本用法

最常见的`with`语句使用场景是文件操作，它确保打开的文件在使用后会被正确关闭，即使在读写文件时发生了异常。

```python
with open('example.txt', 'r') as file:
    content = file.read()
    print(content)
# 文件在这里已经被自动关闭
```

### 工作原理

`with`语句的工作原理基于所谓的上下文管理器对象。一个上下文管理器是实现了`__enter__`和`__exit__`这两个魔法方法的对象。`__enter__`方法在进入`with`语句的代码块时被调用，而`__exit__`方法在离开`with`代码块时执行。

- `__enter__`方法返回的值（如果有的话）会被赋给`as`子句中的变量。
- `__exit__`方法处理退出代码块时的清理工作，如释放资源或处理异常。

### 自定义上下文管理器

你可以创建自己的上下文管理器，以支持`with`语句。这里是一个简单的例子，演示了一个计时器上下文管理器，它记录并打印代码块的执行时间：

```python
import time

class Timer:
    def __enter__(self):
        self.start = time.time()
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        self.end = time.time()
        self.interval = self.end - self.start
        print(f"Elapsed time: {self.interval} seconds")

with Timer() as t:
    # 在这个代码块内的操作会被计时
    for _ in range(1000000):
        pass
```

### 异常处理

`__exit__`方法还负责处理`with`代码块内发生的异常。它有三个参数，分别是`exc_type`、`exc_val`和`exc_tb`，它们用于描述异常类型、值和追踪记录。如果`__exit__`方法返回`False`或者没有返回值，任何发生的异常都会被重新抛出；如果返回`True`，异常会被忽略，不会被重新抛出。

```python
class SuppressException:
    def __enter__(self):
        pass

    def __exit__(self, exc_type, exc_val, exc_tb):
        # 忽略特定类型的异常
        if exc_type is ValueError:
            print("Ignoring ValueError")
            return True
        return False

with SuppressException():
    raise ValueError("This ValueError will be ignored.")
```

通过使用`with`语句和上下文管理器，你可以更安全、更优雅地管理资源，同时也简化了异常处理的代码。

## 综合应用

让我们通过一个综合的示例来展示Python文件操作的详细用法，包括读取、处理、写入数据，并在过程中使用异常处理和上下文管理。这个例子将模拟一个简单的数据处理任务：读取一个文本文件中的数据，对数据进行处理，并将结果写入一个新的文件。

假设我们有一个名为`data.txt`的文件，其中包含了一系列以逗号分隔的数值。我们的任务是读取这些数值，计算它们的平方，然后将结果写入一个新文件`results.txt`。

### data.txt

```
1,2,3,4,5
6,7,8,9,10
```

### Python代码

```python
def process_data(input_file_path, output_file_path):
    try:
        with open(input_file_path, 'r') as file:
            lines = file.readlines()  # 读取所有行到一个列表中
    except FileNotFoundError:
        print(f"The file {input_file_path} does not exist.")
        return

    processed_lines = []

    for line in lines:
        # 分割每行的数值，转换为整数，计算平方，然后转换回字符串
        numbers = line.strip().split(',')
        squared_numbers = [str(int(number) ** 2) for number in numbers]
        processed_line = ','.join(squared_numbers)
        processed_lines.append(processed_line + '\n')

    try:
        with open(output_file_path, 'w') as file:
            file.writelines(processed_lines)  # 写入处理后的数据
    except IOError:
        print(f"Could not write to file {output_file_path}.")
        return

    print(f"Data processed successfully and saved to {output_file_path}.")

process_data('data.txt', 'results.txt')
```

### 解读

1. **读取数据**：使用`with`语句打开`data.txt`文件进行读取。`with`语句确保文件在读取完成后自动关闭，即使在读取过程中发生异常也是如此。如果文件不存在，捕获`FileNotFoundError`异常并打印一条错误消息。

2. **处理数据**：对于文件中的每一行，我们使用`strip()`方法去除末尾的换行符，然后用`split(',')`方法按逗号分割字符串，得到一个字符串列表。接着，使用列表推导式将每个字符串转换为整数，计算它的平方，再将其转换回字符串。将处理后的数值使用逗号连接回一个字符串，代表处理后的一行，然后添加到`processed_lines`列表中。

3. **写入结果**：再次使用`with`语句打开（或创建）`results.txt`文件进行写入。使用`writelines()`方法将处理后的数据写入文件。如果在写入过程中遇到任何I/O错误，捕获`IOError`异常并打印一条错误消息。

4. **异常处理和反馈**：通过异常处理，我们确保了代码的健壮性，可以优雅地处理文件不存在或无法写入的情况。通过打印消息给用户反馈操作结果，增加了代码的友好性。

这个例子展示了文件读取、数据处理和文件写入的完整流程，同时展示了如何使用异常处理和上下文管理来确保代码的健壮性和资源的正确管理。

让我们通过一个更复杂的示例来探索文件操作、数据处理和异常处理的进阶用法。这个例子将展示如何读取一个CSV文件，过滤数据，然后将过滤后的数据写入一个新的CSV文件。

假设我们有一个名为`employees.csv`的文件，其中包含了员工的ID、姓名、职位和部门。我们的任务是读取这个文件，过滤出特定部门的员工，然后将这些员工的信息保存到一个新文件中。

### employees.csv

```
ID,Name,Position,Department
1,John Doe,Software Engineer,Engineering
2,Jane Smith,Project Manager,Marketing
3,Bob Johnson,Data Scientist,Engineering
```

### Python代码

```python
import csv

def filter_employees(input_file_path, output_file_path, department_filter):
    try:
        with open(input_file_path, mode='r', newline='') as infile:
            reader = csv.DictReader(infile)
            employees = [row for row in reader if row['Department'] == department_filter]
    except FileNotFoundError:
        print(f"The file {input_file_path} does not exist.")
        return
    except csv.Error as e:
        print(f"Error reading CSV file: {e}")
        return

    if employees:
        with open(output_file_path, mode='w', newline='') as outfile:
            writer = csv.DictWriter(outfile, fieldnames=reader.fieldnames)
            writer.writeheader()
            writer.writerows(employees)
        print(f"Filtered employees saved to {output_file_path}.")
    else:
        print(f"No employees found in department: {department_filter}")

filter_employees('employees.csv', 'filtered_employees.csv', 'Engineering')
```

### 解读

1. **读取CSV文件**：使用`csv.DictReader`，它创建了一个reader对象，该对象将CSV文件中的每行映射为一个字典，其中包含的键是从文件的第一行（即列名）生成的。这使得按列名访问每个字段变得非常方便。

2. **数据过滤**：使用列表推导式和条件表达式过滤出特定部门的员工。这里，我们检查每行（即每位员工）的`'Department'`字段是否与`department_filter`匹配。

3. **写入过滤后的数据到新的CSV文件**：如果找到了匹配的员工，使用`csv.DictWriter`将过滤后的员工数据写入到新的CSV文件中。`DictWriter`被初始化为具有相同列名的writer对象，并且使用`writeheader`方法来写入列名作为文件的第一行。

4. **异常处理**：捕获`FileNotFoundError`以处理输入文件不存在的情况，并捕获`csv.Error`以处理可能的CSV文件读取错误。

5. **用户反馈**：通过打印消息给用户反馈操作结果，增加了代码的友好性和健壮性。

这个例子展示了如何结合使用`csv`模块、列表推导式、异常处理和条件逻辑来执行一个实际的数据处理任务。通过这种方式，你可以轻松地处理和分析CSV文件中的数据，并将结果保存到新文件中。