# 第十章：文件和异常

## 1.读取文件

### 1.1 读取文件的全部内容

要使用文件的内容，需要将其路径告知python。路径指的是文件或文件夹在系统中的准确位置。python提供了pathlib模块，让你能够更轻松的在各种操作系统中处理文件和目录。

提供特定功能的模块称为库（library）

In [None]:
from pathlib import Path

path = Path('Chapter10_pi_digits.txt')
contents = path.read_text()
print(contents)

这里首先从pathlib模块导入Path类。Path对象指向一个文件，可以用来做很多事情。这里创建一个表示文件的 pi_digits.txt 的Path对象，并将其赋给了变量path。由于这个文件与当前编写的文件位于同一个目录中，因此Path只需要知道文件名就能访问它。

创建好表示文件 pi_digits.txt 的Path对象后，使用read_text()方法来读取这个文件的全部内容。read_txt()将该文件的全部内容作为一个字符串返回，而我们将这个字符串赋给了变量contents。在打印contents的值时，将显示文本所有内容。

read_txt()在到达文件夹末尾时会返回一个空字符串，这个字符串会被显示为一个空行。要删除这个空行，可对字符串变量contents使用rstrip()

In [None]:
from pathlib import Path

path = Path('Chapter10_pi_digits.txt')
contents = path.read_text().rstrip()
print(contents)

### 1.2 相对文件路径和绝对文件路径

相对文件路径让python到当前程序运行的所在目录的位置去找，绝对文件路径是文件在计算机中的具体位置。

### 1.3 访问文件中的各行

可以使用splitlines()方法将冗长的字符串转换为一系列行，再使用for循环以每次一行的方式检查文件中的各行

In [None]:
from pathlib import Path

path = Path('Chapter10_pi_digits.txt')
contents = path.read_text()

lines = contents.splitlines()
for line in lines:
    print(line)
    print('\n')

## 2.写入文件

### 2.1 写入一行

定义一个文件的路径之后，就可以使用write_text()将数据写入文件了。下面将一条消息存储到文件中，而不是将其打印在屏幕上：

In [None]:
from pathlib import Path

path = Path('Chapter10_write_file.txt')
path.write_text("第十章第二节写入文件")

运行之后会发现程序建立了一个新文件，文件的内容就是“第十章第二节写入文件”

### 2.2 写入多行

In [None]:
from pathlib import Path

path = Path('Chapter10_write_file.txt')
path.write_text("第十章第二节写入文件，第一行\n")

contents = "第十章第二节写入文件，第二行\n"
contents += "第十章第二节写入文件，第三行\n"
contents += "第十章第二节写入文件，第四行\n"
path.write_text(contents)

程序不会在文件中写入“第十章第二节写入文件，第一行”。当你连续调用 write_text() 时，第二次调用会覆盖第一次写入的内容，而不是追加到文件末尾。

第二次可以使用追加模式写入，这样就不会覆盖第一次写入的内容

In [None]:
from pathlib import Path

path = Path('Chapter10_write_file.txt')

# 第一次写入
path.write_text("第十章第二节写入文件，第一行\n")

# 第二次以追加模式写入
contents = "第十章第二节写入文件，第二行\n"
contents += "第十章第二节写入文件，第三行\n"
contents += "第十章第二节写入文件，第四行\n"

with path.open('a', encoding='utf-8') as f:
    f.write(contents)

## 3.异常

### 3.1 处理ZeroDivisionError异常

In [None]:
print(5/0)

python无法这样做，因此你会看到一个traceback，给出这个异常对象的描述信息。python在无法按照你的要求做的时候，就会创建这种对象。在这种情况下，python将停止运行程序，并指出引发了哪种异常。

### 3.2 使用try-except代码块

当你认为可能发生错误时，可编写一个try-except代码块来处理可能引发的异常。你让python尝试运行特定代码，并告诉它如果这些代码引发了指定的异常，该怎么办。

In [None]:
try:
    print(5/0)
except ZeroDivisionError:
    print("You can't divide by zero!")

### 3.3 else代码块

只有try代码成功执行才需要继续执行的代码，都应放到else代码块中

In [None]:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while(True):
    first_number = input("\nFirst number: ")
    if first_number == 'q':
        break
    second_number = input("\nSecond number: ")
    if second_number == 'q':
        break
    try:
        answer = int(first_number) / int(second_number)
    except ZeroDivisionError:
        print("You can't divide by 0!")
    else:
        print(answer)

### 3.4 处理FileNotFoundError异常

In [None]:
from pathlib import Path

path = Path('file_not_found_error.txt')  # 文件夹中并没有这个文件，因此会返回一个traceback报错
try:
    contents = path.read_text(encoding = 'utf-8')  # 如果系统的默认编码与要读取的文件的编码不一致，参数encoding必不可少
except:
    print(f"Sorry, the file {path} doesn't exist.")

### 3.5 分析文本

下面来提取童话Alice in Wonderland的文本，并尝试计算它包含多少个单词。使用split()方法，它默认以空白为分隔符将字符串分拆成多个部分。

In [None]:
from pathlib import Path

path = Path('Chapter10_Alice_in_Wonderland.txt')
try:
    contents = path.read_text(encoding = 'utf-8')
except:
    print(f"Sorry, the file {path} doesn't exist.")
else:
    words = contents.split()
    num_words = len(words)
    print(f"The file {path} has about {num_words} words.")

### 3.6 使用多个文件

下面分析几本书。将计算Alice in Wonderland，Little Woman，Moby Dick，Siddhartha分别包含多少个单词（Siddhartha不在目录中，以便展示这个程序在文件不存在时怎么应对）

In [None]:
from pathlib import Path

def count_words(path):
    """计算一个文件包含多少个单词"""
    try:
        contents = path.read_text(encoding='utf-8')
    except FileNotFoundError:
        pass  # 让python什么都不做，直接跳过
    else:
        words = contents.split()
        num_words = len(words)
        print(f"The file {path} has about {num_words} words.")

filenames = ['Chapter10_Alice_in_Wonderland.txt', 'Chapter10_Siddhartha.txt', 'Chapter10_Moby_Dick.txt', 'Chapter10_Little_Women.txt']
for filename in filenames:
    path = Path(filename)
    count_words(path)

## 4.存储数据

模块json让你能够将简单的python数据结构转换为JSON格式的字符串，并在程序再次运行时从文件中加载数据。你还可以使用json在python程序之间共享数据。

### 4.1 使用json.dumps()和json.loads()

In [None]:
from pathlib import Path
import json

numbers = [2,3,5,7,11,13]

path = Path('numbers.json')
contents = json.dumps(numbers)
path.write_text(contents)

首先导入模块json，并创建一个数值列表。然后选择一个文件名，指定要将该数值列表存储到哪个文件中。通常使用文件扩展名为.json来指出文件存储的数据为JSON格式。接下来使用json.dumps()函数生成一个字符串，它包含我们要存储的数据的JSON表示形式。生成这个字符串之后，使用write_text()的方法将其写入文件。

这个程序没有输出，打开文件numbers.json，会发现该文件中数据的存储格式看起来与python中的一样。

下面再编写一个程序，使用json.loads()将列表读取到内存中。

In [None]:
from pathlib import Path
import json

path = Path('numbers.json')
contents = path.read_text()
numbers = json.loads(contents)

print(numbers)

使用read_text()方法来读取它，然后将这个文件的内容传递给json.loads()。这个函数将一个JSON格式的字符串作为参数，返回一个python对象（这里是列表）。

这是一种在程序之间共享数据的简单方式。

### 4.2 保存和读取用户生成的数据

In [None]:
from pathlib import Path
import json

path = Path('username.json')

if path.exists():
    contents = path.read_text()
    user_name = json.loads(contents)
    print(f"Welcome back, {user_name}!")
else:
    user_name = input("What's your name?")
    contents = json.dumps(user_name)
    path.write_text(contents)
    print(f"We'll remember you when you come back, {user_name}!")

程序首次运行，会提示用户输入姓名，并将姓名存储在文件 username.json 中。再次运行会打印一句问候语。