# 文件处理基础

本节课将介绍如何在 Python 中处理文件，包括文件的读写、管理、以及如何处理常见的文件类型如 CSV 文件。学习这些内容将为后续的 Excel 自动化处理打下基础。


## 1. 文件操作的基础

文件操作是指通过代码对文件进行读取、写入、修改等操作。在日常编程中，文件操作非常常见，尤其是在数据处理和自动化办公中。

常见的文件类型包括：
- 文本文件（.txt）
- CSV 文件（.csv）
- Excel 文件（.xlsx）

在进行文件操作时，我们需要使用文件路径来定位文件。文件路径有两种类型：
- **相对路径**：相对路径是相对于当前工作目录的路径。例如，`data\\example.txt` 是相对于当前目录的一个文件路径。
- **绝对路径**：绝对路径是文件在计算机中的完整路径。例如，`C:\\Users\\Username\\Documents\\data\\example.txt` 是一个 Windows 系统上的绝对路径。

### 示例：
- 相对路径：`data\\example.txt`
- 绝对路径：`C:\\Users\\Username\\Documents\\data\\example.txt`

## 2. open()函数的使用
open() 函数是 Python 中用来操作文件的重要工具，支持创建文件、读取文件、写入文件等功能。下面将详细介绍 open() 函数的用法，包括如何创建文件、读取文件、写入文件，以及如何使用 with 语句来安全地管理文件。

### 2.1 open() 的基本语法
`open()` 函数的基本语法如下：

```python
file_object = open(file_name, mode)
```

- `file_name`：文件的名称，可以是相对路径或绝对路径 。
- `mode`：文件的打开模式，例如 ：
  - `'r'`：只读模式（默认）
  - `'w'`：写入模式（会覆盖已有内容）
  - `'a'`：追加模式（在文件末尾添加内容）
  - `'x'`：创建模式
  - `'+'`：读写模式
  
下面我们来了解一下open()函数在不同场景下的使用方法

### 2.2 创建和写入文件
可以使用 `open()` 函数的 `'w'` 模式或`'x'`来创建文件，它们的区别在于如果你要创建的文件已存在时`'w'`模式会覆盖当前文件，而`'x'`模式会报错`FileExistsError`。

In [3]:
import os
print(os.getcwd())
# 创建一个文件，并在文件中写入'Hello World!'
file=open('./Resource/Hello.txt','w')
file.write('Hello World!')
file.close()
# 使用'x'模式创建同名文件
file=open('./Resource/Hello.txt','x')
file.write('Hello World!')
file.close()


C:\Users\Admin\PycharmProjects\Python_for_Office_Automation


FileExistsError: [Errno 17] File exists: './Resource/Hello.txt'

### 2.3 读取文件
使用 `'r'` 模式可以读取文件内容。如果文件不存在，Python 会抛出 `FileNotFoundError` 异常 。

In [None]:
# 使用'r'模式读取文件内容
file=open('./Resource/Hello.txt','r')
content=file.read()
file.close()
print(content)

对于多行文件可以使用`readline()`,或者`readlines()`方法来按行读取文件内容

In [6]:
# 创建一个有多行文本的文件
content='this is first line\nthis is second line\nthis is third line'
file=open('./Resource/multiple_lines.txt','w')
file.write(content)
file.close()
# 使用readline()读取文件
file=open('./Resource/multiple_lines.txt','r')
content=file.readline()
print(content)
content=file.readline()
print(content)
content=file.readline()
print(content)
file.close()
#使用readlines()读取文件
file=open('./Resource/multiple_lines.txt','r')
content=file.readlines()
print(content)
file.close()

this is first line

this is second line

this is third line
['this is first line\n', 'this is second line\n', 'this is third line']


### 2.4 写入文件
前面已经讲过可以使用`'w'`模式覆盖写入现有文件，对于希望在现有文件基础上增加内容的需求可以使用`'a'`追加模式

跟`readlines()`类似，也可以使用 `writelines()` 方法可以将数据写入文件,但是`writeline()`不会自动给数据加上换行符：

In [9]:
# 使用追加模式打开multiple_lines.txt
file=open('./Resource/multiple_lines.txt','a')
file.writelines(['x\n','y\n','z'])
file.close()
file=open('./Resource/multiple_lines.txt','r')
content=file.read()
file.close()
print(content)

this is first line
this is second line
this is third linexyzx
y
z



## 5. 文件操作的异常处理

文件操作中常见的错误包括：文件不存在、文件权限问题等。可以使用 `try-except` 结构来捕获并处理这些异常。

### 示例：


In [None]:
# 捕获文件不存在的错误
try:
    with open('non_existent_file.txt', 'r') as file:
        content = file.read()
except FileNotFoundError:
    print("文件不存在，请检查文件路径。")


## 6. 文件夹和文件的管理

使用 `os` 和 `shutil` 模块可以对文件和文件夹进行管理操作，例如创建、删除、重命名等。

### 示例：


In [None]:
import os

# 创建一个新的文件夹
os.makedirs('new_folder', exist_ok=True)

# 重命名文件
os.rename('example.txt', 'renamed_example.txt')

# 删除文件
os.remove('renamed_example.txt')

# 遍历文件夹
os.listdir('current_folder')

# 判断一个文件是否是特定格式
filename='content.txt'
filename.endswith('.txt')



## 7. 处理 CSV 文件

CSV 文件是一种常见的数据存储格式，可以使用 `csv` 模块读取和写入 CSV 文件。

### 示例：


In [None]:
import csv

# 读取 CSV 文件
with open('example.csv', 'r') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        print(row)

# 写入 CSV 文件
with open('output.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['Name', 'Age'])
    writer.writerow(['Alice', '25'])
    writer.writerow(['Bob', '30'])


## 8. Excel 文件的处理预告

在下一部分课程中，我们将学习如何使用 `openpyxl` 库对 Excel 文件进行自动化处理，进一步提高办公效率。

- 数据提取
- 数据清理
- 报表生成
