# 如何处理你的文件 📁

本节课将介绍如何在 Python 中处理文件，包括文件的读写、管理、以及如何处理常见的文件类型如 CSV 文件。学习这些内容将为后续的 Excel 自动化处理打下基础。

## 1. 文件操作的基础 🏠

文件操作是指通过代码对文件进行读取、写入、修改等操作。在日常编程中，文件操作非常常见，尤其是在数据处理和自动化办公中。

常见的文件类型包括：
- 文本文件（.txt）
- CSV 文件（.csv）
- Excel 文件（.xlsx）

在进行文件操作时，我们需要使用文件路径来定位文件。文件路径有两种类型：
- **相对路径**：相对路径是相对于当前工作目录的路径。例如，`data\\example.txt` 是相对于当前目录的一个文件路径。
- **绝对路径**：绝对路径是文件在计算机中的完整路径。例如，`C:\\Users\\Username\\Documents\\data\\example.txt` 是一个 Windows 系统上的绝对路径。

### 示例：
- 相对路径：`data\\example.txt`
- 绝对路径：`C:\\Users\\Username\\Documents\\data\\example.txt`

## 2. open()函数的使用 📖
open() 函数是 Python 中用来操作文件的重要工具，支持创建文件、读取文件、写入文件等功能。下面将详细介绍 open() 函数的用法，包括如何创建文件、读取文件、写入文件，以及如何使用 with 语句来安全地管理文件。

### 2.1 open() 的基本语法 🔧
`open()` 函数的基本语法如下：

```python
file_object = open(file_name, mode)
```

- `file_name`：文件的名称，可以是相对路径或绝对路径 。
- `mode`：文件的打开模式，例如 ：
  - `'r'`：只读模式（默认）
  - `'w'`：写入模式（会覆盖已有内容）
  - `'a'`：追加模式（在文件末尾添加内容）
  - `'x'`：创建模式
  - `'+'`：读写模式
  
下面我们来了解一下open()函数在不同场景下的使用方法

### 2.2 创建和写入文件 📝
可以使用 `open()` 函数的 `'w'` 模式或`'x'`来创建文件，它们的区别在于如果你要创建的文件已存在时`'w'`模式会覆盖当前文件，而`'x'`模式会报错`FileExistsError`。

In [None]:
import os
import string

print(os.getcwd())
# 创建一个文件，并在文件中写入'Hello World!'
file_hello=open('./Resource/Hello.txt','w')
file_hello.write('Hello World!')
file_hello.close()
# 使用'x'模式创建同名文件
file_hello=open('./Resource/Hello.txt','x')
file_hello.write('Hello World!')
file_hello.close()


### 2.3 读取文件 📚使用 `'r'` 模式可以读取文件内容。如果文件不存在，Python 会抛出 `FileNotFoundError` 异常 。

In [None]:
# 使用'r'模式读取文件内容
file_hello=open('./Resource/Hello.txt','r')
content=file_hello.read()
file_hello.close()
print(content)

对于多行文件可以使用`readline()`,或者`readlines()`方法来按行读取文件内容

In [None]:
# 创建一个有多行文本的文件
content='this is first line\nthis is second line\nthis is third line'
file_multiple=open('./Resource/multiple_lines.txt','w')
file_multiple.write(content)
file_multiple.close()
# 使用readline()读取文件
file_multiple=open('./Resource/multiple_lines.txt','r')
content=file_multiple.readline()
print(content)
content=file_multiple.readline()
print(content)
content=file_multiple.readline()
print(content)
file_multiple.close()
#使用readlines()读取文件
file_multiple=open('./Resource/multiple_lines.txt','r')
content=file_multiple.readlines()
print(content)
file_multiple.close()

### 2.4 写入文件 ✍️前面已经讲过可以使用`'w'`模式覆盖写入现有文件，对于希望在现有文件基础上增加内容的需求可以使用`'a'`追加模式

跟`readlines()`类似，也可以使用 `writelines()` 方法可以将数据写入文件,但是`writeline()`不会自动给数据加上换行符：

In [None]:
# 使用追加模式打开multiple_lines.txt
file=open('./Resource/multiple_lines.txt','a')
file.writelines(['x\n','y\n','z'])
file.close()
file=open('./Resource/multiple_lines.txt','r')
content=file.read()
file.close()
print(content)

### 2.5 with 关键字 🔐

你可能已经注意到了，文件操作总是需要以`file.close()`结尾，那是因为计算机需要通过执行`close()`方法来释放内存，在这之后就不能再对`file`对象进行操作了。


python 还提供了with关键字来代替`close()`方法，可以使用`with open(path) as obj`函数来避免手动调用`file.close()`

例如:

In [None]:
with open('./Resource/multiple_lines.txt','r') as file:
    # 在with语句内可以执行file相关函数
    content=file.read()
    print(content)
# 在此调用file相关函数会报错
file.read()

### 练习 📝

In [None]:
# 练习1
# 修改password字符串，并将该字符串作为参数传递给encrypt()函数，并将返回值保存为encrypted.txt
password='input your password'
def encrypt(passwd):
    encrypted=''
    for char in passwd:
        if char in string.ascii_uppercase:
            order= string.ascii_uppercase.index(char)
            order = order+13 if order<13 else order-13
            char_encrypted=string.ascii_uppercase[order]
        elif char in string.ascii_lowercase:
            order=string.ascii_lowercase.index(char)
            order = order+13 if order<13 else order-13
            char_encrypted=string.ascii_lowercase[order]
        else:
            char_encrypted=char
        encrypted+=char_encrypted
    return encrypted

# your code below
    


In [None]:
# 练习2
# 读取encrypted.txt并将内容保存到变量中，将变量作为参数传递给encrypt()函数，并尝试将返回值打印出来
content=''
# your code below

print(content)

## 6. 文件夹和文件的管理 🗂️

使用 `os` 模块可以对文件和文件夹进行管理操作，例如创建、删除、重命名等。

### 示例：


In [None]:
import os

# 创建一个新的文件夹
os.makedirs('new_folder', exist_ok=True)

# 重命名文件
os.rename('./Resource/Hello.txt', './Resource/hello.txt')

# 删除文件
os.remove('./Resource/multiple_lines.txt')

# 遍历文件夹
directories=os.listdir('./Resource')
print(directories)
# 判断一个文件是否是特定格式
for dir in directories:
    if dir.endswith('.txt'):
        print(dir+'\n')



## 7. 处理 CSV 文件 📊

CSV 文件是一种常见的数据存储格式，可以使用 `csv` 模块读取和写入 CSV 文件。

### 示例：


In [None]:
import csv

# 读取 CSV 文件
with open('example.csv', 'r') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        print(row)

# 写入 CSV 文件
with open('output.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['Name', 'Age'])
    writer.writerow(['Alice', '25'])
    writer.writerow(['Bob', '30'])


# 你知道吗？ 🕵️‍♂️

下面是this.py的源代码，也就是之前讲到的Python之禅的源代码。

他的实现则跟python之禅的意境完全反着来，既不优雅也不美观。

实际上它使用的就是对称加密的凯撒密码，我们可以尝试运行一下encrypt(s)，看看它的输出。有兴趣可以研究一下this.py中是怎么实现的。

In [None]:
s = """Gur Mra bs Clguba, ol Gvz Crgref

Ornhgvshy vf orggre guna htyl.
Rkcyvpvg vf orggre guna vzcyvpvg.
Fvzcyr vf orggre guna pbzcyrk.
Pbzcyrk vf orggre guna pbzcyvpngrq.
Syng vf orggre guna arfgrq.
Fcnefr vf orggre guna qrafr.
Ernqnovyvgl pbhagf.
Fcrpvny pnfrf nera'g fcrpvny rabhtu gb oernx gur ehyrf.
Nygubhtu cenpgvpnyvgl orngf chevgl.
Reebef fubhyq arire cnff fvyragyl.
Hayrff rkcyvpvgyl fvyraprq.
Va gur snpr bs nzovthvgl, ershfr gur grzcgngvba gb thrff.
Gurer fubhyq or bar-- naq cersrenoyl bayl bar --boivbhf jnl gb qb vg.
Nygubhtu gung jnl znl abg or boivbhf ng svefg hayrff lbh'er Qhgpu.
Abj vf orggre guna arire.
Nygubhtu arire vf bsgra orggre guna *evtug* abj.
Vs gur vzcyrzragngvba vf uneq gb rkcynva, vg'f n onq vqrn.
Vs gur vzcyrzragngvba vf rnfl gb rkcynva, vg znl or n tbbq vqrn.
Anzrfcnprf ner bar ubaxvat terng vqrn -- yrg'f qb zber bs gubfr!"""

d = {}
for c in (65, 97):
    for i in range(26):
        d[chr(i+c)] = chr((i+13) % 26 + c)

print("".join([d.get(c, c) for c in s]))


In [None]:
encrypt(s)