# 第10章 文件和异常
## 10.1 从文件中读取数据
##### 要使用文本文件中的信息，首先需要将信息读取到内存中。为此，你可以一次性读取文件的全部内容，也可以以每次一行的方式逐步读取。

### 10.1.1 读取整个文件
##### 本书的配套网站：https://www.nostarch.com/pythoncrashcourse/

#### file_reader.py

In [5]:
with open('pi_digits.txt') as file_object:
    contents = file_object.read()
    print(contents)

3.1415926535
  8979323846
  2643383279



### 注意：
##### 1.函数open()接受一个参数：要打开的文件的名称。
##### 2.Python在当前执行的文件所在的目录中查找指定的文件。
##### 3.函数open()返回一个表示文件的对象。
##### 4.Python将这个对象存储在我们将在后面使用的变量中。
##### 5.关键字with在不再需要访问文件后将其关闭。
##### 6.函数read()到达文件末尾时返回一个空字符串。
##### 7.要删除末尾的空行，可在print语句中使用rstrip()。
##### 8.Python方法rstrip()删除字符串末尾的空白。

#### file_reader.py

In [6]:
with open('pi_digits.txt') as file_object:
    contents = file_object.read()
    print(contents.rstrip())

3.1415926535
  8979323846
  2643383279


### 10.1.2 文件路径
#### 1.相对文件路径让Python到指定的位置去查找，而该位置是相对于当前运行的程序所在目录的。在Linux和OS X中，可以这样编写代码：with open('text_files/filename.txt') as file_object:
#### 2.在windows系统中，在文件系统中使用反斜杠(\)而不是斜杠(/)：with open('text_files\filename.txt') as file_object:
#### 3.还可以将文件在计算机中的准确位置告诉Python，这样就不用关心当前运行的程序存储在什么地方了。这称为绝对文件路径。
#### 4.绝对路径通常比相对路径更长，因此将其存储在一个变量中，再将该变量传递给open()会有所帮助。在Linux和OS X中，绝对路径类似于下面这样：file_path = '/home/ehmatthes/other_files/text_files/filename.txt'  with open(file_path) as file_object:
#### 5.而在windows系统中，将类似于下面这样：file_path = 'c:\Users\ehmattes\other_files\text_files\filename.txt'   with open(file_path) as file_object:

## 注意：
#### 1.Windows系统有时能够正确地解读文件路径中的斜杠。
#### 2.由于反斜杠在Python中被视为转义标记，为在Windows中确保万无一失，应以原始字符串的方式指定路径即在开头的单引号前加上r。

### 10.1.3 逐行读取
#### 要以每次一行的方式检查文件，可对文件对象使用for循环

#### file_reader.py

In [10]:
filename = 'pi_digits.txt'

with open(filename) as file_object:
    for line in file_object:
        print(line)

3.1415926535

  8979323846

  2643383279



##### 在这个文件中，每行的末尾都有一个看不见的换行符，而print语句也会加上一个换行符，因此每行末尾有两个换行符：一个来自文件，一个来自print语句。要消除这些多余的空白行，可在print语句中使用rstrip()。

#### file_reader.py

In [11]:
filename = 'pi_digits.txt'

with open(filename) as file_object:
    for line in file_object:
        print(line.rstrip())
        

3.1415926535
  8979323846
  2643383279


### 10.1.4 创建一个包含文件各行内容的列表
#### 使用关键字with时，open()返回的文件对象只在with代码块内可用。如果要在with代码块外访问文件的内容，可在with代码块内将文件的各行存储在一个列表中，并在with代码块外使用该列表。

In [12]:
filename = 'pi_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()
    
for line in lines:
    print(line.rstrip())

3.1415926535
  8979323846
  2643383279


### 注意：
#### 方法readlines()从文件中读取每一行，并将其存储到一个列表中

### 10.1.5 使用文件的内容
#### 将文件读取到内存中后，就可以以任何方式使用这些数据了

#### pi_string.py

In [16]:
filename = 'pi_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()
    
pi_string = ''
for line in lines:
    pi_string += line.rstrip() # 调用函数rstrip()删除每个line右端的空格，包括换行符\n
    
print(pi_string)
print(len(pi_string))

3.1415926535  8979323846  2643383279
36


#### 复习：后：rstrip() 前：lstrip() 两端：strip()

In [17]:
# 调用函数strip()删除每个line两端的空格,包括换行符\n
filename = 'pi_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()
    
pi_string = ''
for line in lines:
    pi_string += line.strip()
    
print(pi_string)
print(len(pi_string))

3.141592653589793238462643383279
32


### 注意：
#### 读取文本文件时，Python将其中的所有文本都解读为字符串。如果你读取的是数字，并要将其作为数值使用，就必须使用函数int()将其转换为整数，或使用函数float()将其转换为浮点数。

### 10.1.6 包含一百万位的大型文件

#### pi_string.py

In [26]:
filename = 'pi_million_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()
    
pi_string = ''
for line in lines:
    pi_string += line.strip()
    
print(pi_string[:52] + "...")
print(len(pi_string))

3.14159265358979323846264338327950288419716939937510...
1000002


### 注意：
#### 1.对于你可处理的数据量，Python没有任何限制；只要系统的内存足够多，你想处理多少数据都可以。
#### 2.对于后面的众多示例，可从 https://www.nostarch.com/pythoncrashcourse/ 下载相关的资源。

### 10.1.7 圆周率值中包含你的生日吗

In [27]:
# 可将生日表示为一个由数字组成的字符串，再检查这个字符串是否包含在pi_string中
filename = 'pi_million_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()
    
pi_string = ''
for line in lines:
    pi_string += line.strip()
    
birthday = input("Enter your birthday, in the form mmddyy: ")
if birthday in pi_string:
    print("Your birthday appears in the first million digits of pi!")
else:
    print("Your birthday does not appear in the first million digits of pi.")

Enter your birthday, in the form mmddyy: 031794
Your birthday does not appear in the first million digits of pi.


#### 读取文件的内容后，就可以以你能想到的任何方式对其进行分析。

## 10.2 写入文件

### 10.2.1 写入空文件
#### 要将文本写入文件，你在调用open()时需要提供另一个实参，告诉Python你要写入打开的文件

#### write_message.py

In [28]:
filename = 'programming.txt'

with open(filename, 'w') as file_object:
    file_object.write("I love programming.")

#### 1.打开文件时，可指定读取模式('r')、写入模式('w')、附加模式('a')或让你能够读取和写入文件的模式('r+')。如果你忽略了模式实参，Python将以默认的只读模式打开文件。
#### 2.如果你要写入的文件不存在，函数open()将自动创建它。
#### 3.以写入('w')模式打开文件时千万要小心，因为如果指定的文件已经存在，Python将在返回文件对象前清空该文件。

### 注意：
#### Python只能将字符串写入文本文件。要将数值数据存储到文本文件中，必须先使用函数str()将其转换为字符串格式。

### 10.2.2 写入多行

#### 函数write()不会在你写入的文本末尾添加换行符，因此如果你写入多行时没有指定换行符，文件看起来可能不是你希望的那样。

In [29]:
finename = 'programming.txt'

with open(filename, 'w') as file_object:
    file_object.write("I love programming.")
    file_object.write("I love creating new games.")

In [31]:
finename = 'programming.txt'

with open(filename, 'w') as file_object:
    file_object.write("I love programming.\n")
    file_object.write("I love creating new games.\n")

### 10.2.3 附加到文件
#### 1.如果要给文件附加内容，而不是覆盖原有的内容，可以附加模式打开文件。
#### 2.以附加模式打开文件时，Python不会在返回文件对象前清空文件，而你写入到文件的行都将添加到文件末尾。
#### 3.如果指定的文件不存在，Python将为你创建一个空文件。

#### write_message.py

In [32]:
filename = 'programming.txt'

with open(filename, 'a') as file_object:
    file_object.write("I also love finding meaning in large datasets.\n")
    file_object.write("I love creating apps that can run in a browser.\n")

### 注：之前我理解的文件的末尾是文件最后一行文本的右方，但后来发现理解错了。从这个例子也可以看出，文件末尾指的是文件最后一行文本的下一行。

## 10.3 异常

#### 1.Python使用被称为异常的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时，它都会创建一个异常对象。
#### 2.如果你编写了处理该异常的代码，程序将继续运行；如果你未对异常进行处理，程序将停止，并显示一个tranceback，其中包含有关异常的报告。
#### 3.异常是使用try-except代码块处理的。try-except代码块让Python执行指定的操作，同时告诉Python发生异常时怎么办。使用了try-except代码块时，即便出现异常，程序也将继续运行：显示你编写的友好的错误消息，而不是令用户迷惑的tranceback。

### 10.3.1 处理ZeroDivisionError异常

#### division.py

In [34]:
print(5/0)

ZeroDivisionError: division by zero

### 10.3.2 使用try-except代码块

#### 当你认为有可能发生错误时，可编写一个try-except代码块 来处理可能引发的异常。你让Python尝试运行一些代码，并告诉它如果这些代码引发了指定的异常，该怎么办。

In [35]:
try:
    print(5/0)
except ZeroDivisionError:
    print("You can't divide by zero.")

You can't divide by zero.


#### 1.将导致错误的代码行print(5/0)放在了一个try代码块中。
#### 2.如果try代码块中的代码运行起来没有问题，Python将跳过except代码块。
#### 3.如果try代码块中的代码导致了错误，Python将查找这样的except代码块，并运行其中的代码，即其中指定的错误与引发的错误相同。
#### 4.如果try-except代码块后面还有其他代码，程序将接着运行，因为已经告诉了Python如何处理这种错误。

### 10.3.3 使用异常避免崩溃

#### division.py

In [37]:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")

while True:
    first_number = input("\nFirst number: ")
    if first_number == 'q':
        break
    second_number = input("Second number: ")
    if second_number == 'q':
        break
    answer = int(first_number) / int(second_number)
    print(answer)

Give me two numbers, and I'll divide them.
Enter 'q' to quit.

First number: 5
Second number: 0


ZeroDivisionError: division by zero

### 10.3.4 else代码块
#### 1.通过将可能引发错误的代码放在try-except代码块中，可提高这个程序抵御错误的能力。
#### 2.依赖于try代码块成功执行的代码都应放到else代码块中。

In [41]:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")

while True:
    first_number = input("\nFirst number: ")
    if first_number == 'q':
        break
    second_number = input("Second number: ")
    if second_number == 'q':
        break
    try:
        answer = int(first_number) / int(second_number)
    except ZeroDivisionError:
        print("You can't divide by 0!")
    else:
        print(answer)

Give me two numbers, and I'll divide them.
Enter 'q' to quit.

First number: 6
Second number: 0
You can't divide by 0!

First number: 5
Second number: 2
2.5

First number: q


#### 1.try代码块只包含可能导致错误的代码行
#### 2.依赖于try代码块成功执行的代码都放在else代码块中
#### 3.try-except-else代码块的工作原理大致如下：Python尝试执行try代码块中的代码，只有可能引发异常的代码才需要放在try语句中。有时候，有一些仅在try代码块成功执行时才需要运行的代码，这些代码应放在else代码块中。except代码块告诉Python，如果尝试运行try代码块中的代码时引发了指定的异常，该怎么办。

### 10.3.5 处理FileNotFoundError异常

#### alice.py

In [42]:
filename = 'alice.txt'

with open(filename) as f_obj:
    contents = f_obj.read()

FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'

In [44]:
filename = 'alice.txt'

try:
    with open(filename) as f_obj:
        contents = f_obj.read()
except FileNotFoundError:
    msg = "Sorry, the file " + filename + " does not exist."
    print(msg)

Sorry, the file alice.txt does not exist.


### 10.3.6 分析文本
#### 1.方法split()以空格为分隔符将字符串分拆成多个部分，并将这些部分都存储到一个列表中。
#### 2.本节使用的文本来自项目 Gutenberg(http://gutenberg.org/)， 这个项目提供了一系列不受版权限制的文学作品。

In [45]:
filename = 'alice.txt'

try:
    with open(filename) as f_obj:
        contents = f_obj.read()
except FileNotFoundError:
    msg = "Sorry, the file " + filename + " does not exist."
    print(msg)
else:
    # 计算文件大致包含多少个单词
    words = contents.split()
    num_words = len(words)
    print("The file " + filename + " has about " + str(num_words) + " words.")

The file alice.txt has about 29465 words.


### 10.3.7 使用多个文件

#### word_count.py

In [48]:
def count_words(filename):
    """计算一个文件大概包含多少个单词"""
    try:
        with open(filename) as file_object:
            contents = file_object.read()
    except FileNotFoundError:
        msg = "Sorry, the file " + filename + " does not exist."
        print(msg)
    else:
        # 计算文件大致包含多少个单词
        words = contents.split()
        num_words = len(words)
        print("The file " + filename + " has about " + str(num_words) + " words.")
        
filename = 'alice.txt'
count_words(filename)

The file alice.txt has about 29465 words.


In [51]:
def count_words(filename):
    """计算一个文件大概包含多少个单词"""
    try:
        with open(filename) as file_object:
            contents = file_object.read()
    except FileNotFoundError:
        msg = "Sorry, the file " + filename + " does not exist."
        print(msg)
    else:
        # 计算文件大致包含多少个单词
        words = contents.split()
        num_words = len(words)
        print("The file " + filename + " has about " + str(num_words) + " words.")
        
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
    count_words(filename)

The file alice.txt has about 29465 words.
Sorry, the file siddhartha.txt does not exist.
The file moby_dick.txt has about 215830 words.
The file little_women.txt has about 189079 words.


### 10.3.8 失败时一声不吭
#### 并非每次捕获到异常时都需要告诉用户，有时候你希望程序在发生异常时一声不吭，就像什么都没有发生一样继续运行。要让程序在失败时一声不吭，可像通常那样编写try代码块，但在except代码块中明确地告诉Python什么都不要做。Python有一个pass语句，可在except代码块中使用它来让python什么都不要做。

In [52]:
def count_words(filename):
    """计算一个文件大概包含多少个单词"""
    try:
        with open(filename) as file_object:
            contents = file_object.read()
    except FileNotFoundError:
        pass
    else:
        # 计算文件大致包含多少个单词
        words = contents.split()
        num_words = len(words)
        print("The file " + filename + " has about " + str(num_words) + " words.")
        
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
    count_words(filename)

The file alice.txt has about 29465 words.
The file moby_dick.txt has about 215830 words.
The file little_women.txt has about 189079 words.


### 注意：
#### pass语句还充当了占位符，它提醒你在程序的某个地方什么都没有做，并且以后也许要在这里做些什么。

### 10.3.9 决定报告哪些错误

#### 如果用户知道要分析哪些文件，他们可能希望在有文件没有分析时出现一条消息，将其中的原因告诉他们。如果用户只想看到结果，而并不知道要分析哪些文件，可能就无需在有些文件不存在时告诉他们。

## 10.4 存储数据

#### 1.不管专注的是什么，程序都把用户提供的信息存储在列表和字典等数据结构中。用户关闭程序时，你几乎总是要保存他们提供的信息；一种简单的方式是使用模块json来存储数据。
#### 2.模块json让你能够将简单的python数据结构转储到文件中，并在程序再次运行时加载该文件中的数据。你还可以使用json在python程序之间分享数据。更重要的是，JSON数据格式并非Python专用的，这让你能够将以Python格式存储的数据与使用其他编程语言的人分享。

### 注意：
#### JSON(JavaScript Object Notation)格式最初是为JavaScript开发的，但随后成了一种常见格式，被包括Python在内的众多语言采用。

### 10.4.1 使用json.dump()和json.load()

#### 函数json.dump()接受两个实参：要存储的数据以及可用于存储数据的文件对象。

#### number_writer.py

In [53]:
import json

numbers = [2, 3, 5, 7, 11, 13]

filename = 'numbers.json'
with open(filename, 'w') as file_object:
    json.dump(numbers, file_object)

#### 通常使用文件扩展名.json来指出文件存储的数据为JSON格式。

#### number_reader.py

In [56]:
import json

filename = 'numbers.json'
with open(filename) as file_object:
    numbers = json.load(file_object)
    
print(numbers)

[2, 3, 5, 7, 11, 13]


### 10.4.2 保存和读取用户生成的数据

#### 对于用户生成的数据，使用json保存它们大有裨益，因为如果不以某种方式进行存储，等程序停止运行时用户的信息将丢失。

#### remember.py

In [57]:
import json

username = input("What is your name? ")

filename = 'username.json'
with open(filename, 'w') as file_object:
    json.dump(username, file_object)
    print("We'll remember you when you come back, " + username + "!")

What is your name? yang yahu
We'll remember you when you come back, yang yahu!


#### greet_user.py

In [58]:
import json

filename = 'username.json'

with open(filename) as file_object:
    username = json.load(file_object)
    print("Welcome back, " + username + "!")

Welcome back, yang yahu!


### 注：json.dump()函数保存数据，接受两个参数；json.load()函数读取数据，接受一个参数。

#### remember_me.py

In [62]:
import json

# 如果以前存储了用户名，就加载它；否则，就提示用户输入用户名并存储它
filename = 'username.json'
try:
    with open(filename) as file_object:
        username = json.load(file_object)
except FileNotFoundError:
    username = input("What is your name? ")
    with open(filename, 'w') as file_object:
        json.dump(username, file_object)
        print("We'll remember you when you come back, " + username + "!")
else:
    print("Welcome back, " + username + "!")

Welcome back, 杨亚虎!


### 10.4.3 重构

#### 你经常会遇到这样的情况：代码能够正确的运行，但可做进一步的改进——将代码划分为一系列完成具体工作的函数。这样的过程被称为重构。重构让代码更清晰、更易于理解、更容易扩展。

#### remember_me.py

In [63]:
import json

def greet_user():
    """问候用户，并指出其名字"""
    filename = 'username.json'
    try:
        with open(filename) as file_object:
            username = json.load(file_object)
    except FileNotFoundError:
        username = input("What is your name? ")
        with open(filename, 'w') as file_object:
            json.dump(username, file_object)
            print("We'll remember you when you come back, " + username + "!")
    else:
        print("Welcome back, " + username + "!")
        
greet_user()

Welcome back, 杨亚虎!


In [64]:
import json

def get_stored_username():
    """如果存储了用户名，就获取它"""
    filename = 'username.json'
    try:
        with open(filename) as file_object:
            username = json.load(file_object)
    except FileNotFoundError:
        return None
    else:
        return username
    
def greet_user():
    """问候用户，并指出其名字"""
    username = get_stored_username()
    if username:
        print("Welcome back, " + username + "!")
    else:
        username = input("What is your name? ")
        filename = 'username.json'
        with open(filename, 'w') as file_object:
            json.dump(username, file_object)
            print("We'll remember you when you come back, " + username + "!")
            
greet_user()

Welcome back, 杨亚虎!


In [65]:
import json

def get_stored_username():
    """如果存储了用户名，就获取它"""
    filename = 'username.json'
    try:
        with open(filename) as file_object:
            username = json.load(file_object)
    except FileNotFoundError:
        return None
    else:
        return username
    
def get_new_username():
    """提示用户输入名户名"""
    username = input("What is your name? ")
    filename = 'username.json'
    with open(filename, 'w') as file_object:
        json.dump(username, file_object)
    return username

def greet_user():
    """问候用户，并指出其名字"""
    username = get_stored_username()
    if username:
        print("Welcome back, " + username + "!")
    else:
        username = get_new_username()
        print("We'll remember you when you come back, " + username + "!")
        
greet_user()

Welcome back, 杨亚虎!


## 10.5 小结

### 在本章中，学习了：
#### 1.如何使用文件；
#### 2.如何一次性读取整个文件， 以及如何以每次一行的方式读取文件的内容；
#### 3.如何写入文件， 以及如何将文本附加到文件末尾；
#### 4.什么是异常以及如何处理程序可能引发的异常；
#### 5.如何存储Python数据结构， 以保存用户提供的信息， 避免用户每次运行程序时都需要重新提供。