### 第10章 文件和异常

在前面的学习中已经掌握了编程所需的基本技能，本章主要讲述的是Python的文件处理机制和异常处理机制，这些内容有助于提高程序的适用性和稳定性。

#### 10.1 从文件中读取数据

In [8]:
# 1.全部读取文本文件
with open("pi_digits.txt") as file_object: # open()函数返回文件对象
    contents = file_object.read() # read()函数读取文件的全部内容，把它作为一个字符串赋给contents
    print(contents.rstrip()) # 删除末尾的空白

3.1415926535
  8979323846
  2643383279


评注：open()函数接受文件的路径，返回一个表示文件的对象。with结构把文件的关闭时间交给系统来决定，在不再需要访问文件后会将其关闭。也可以采用open()和close()的组合来打开和关闭文件。但是有些时候并不能确切知道文件关闭的最佳时间，过早关闭文件反而会导致一些难以预料的错误。

文件路径：将类似于上述例子中的简单文件路径传递给函数open()时，python将在当前执行的py文件所在的目录中查找文件，此时传递的文件地址称为相对文件路径。如果文件不在当前执行的py文件所在目录程序就会报错，完美解决该问题的办法是将文件的绝对路径传递给open()函数，即文件所在的计算机的具体路径，这样做的好处是不需要考虑当前执行的py文件存储在哪里。注意：windows系统的路径分隔符是反斜杠“\”。

In [12]:
# 2.逐行读取文本文件
filename = "pi_digits.txt"

with open(filename) as file_object:
    for line in file_object:
        print(line.rstrip()) 
# print()语句默认有一个换行符，并且读取文件时每一行都有一个换行符，故需要用rstrip()函数去掉换行符，让输出变得更加紧凑。

3.1415926535
  8979323846
  2643383279


In [17]:
# readlines()逐行读取文件内容，并且将其存储在列表中
filename = "pi_digits.txt"

with open(filename) as file_object:
    lines = file_object.readlines()
    
for line in lines:
    print(line.rstrip())

3.1415926535
  8979323846
  2643383279


In [18]:
filename = "pi_digits.txt"

with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ''
for line in lines:
    pi_string += line.rstrip()
    
print(pi_string)
print(len(pi_string))

3.1415926535  8979323846  2643383279
36


In [20]:
filename = "pi_digits.txt"

with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ""
for line in lines:
    pi_string += line.strip()

print(pi_string)
print(len(pi_string))

3.141592653589793238462643383279
32


评注：读取文本文件时，Python将所有的文本都解读为字符串。如果读取的是数字，并且要作为数值来使用，则需要使用int()函数将其转换为整数，或使用函数float()将其转换为浮点数。

In [24]:
filename = "pi_million_digits.txt"

with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ""
for line in lines:
    pi_string += line.strip()

birthday = input("Please enter your birthday: ")
if  birthday in pi_string:
    print("Congratulation!Your birthady appears in the first million digits of pi.")
else:
    print("Your birthday does't appear on the first million digits of pi.")

Please enter your birthday: 110796
Your birthday does't appear on the first million digits of pi.


评注：python可以处理任意大的数据，只需要你的内存足够。

#### 10.2 写入文件

保存数据的最简单的方式是将其写入到文件中，通过将输出写入文件，即便关闭包含程序输出的终端窗口，这些输出也依然存在，你可以在程序结束运行后查看这些输出，可与别人分享输出文件。

In [2]:
# 1.写入一行
ilename = 'programming.txt'

with open(filename, 'w') as file_object: # 'w'代表以写模式打开文件，省略模式参数系统将以只读模式打开文件
    file_object.write("I love programming.") # 文件对象的write()方法能够将字符串写入文件。

评注：在使用open()函数打开文件时，可以指定文件的读取模式('r')、写入模式('w')、附加模式('a')或让你能够读取和写入文件的模式('r+')。如果省略了模式参数，则Python将以默认的只读模式打开文件。值得注意的是，使用'w'模式打开文件时，如果指定的文件不存在则Python会自动创建新的文件，如果文件已经存在则程序会先清空该文件。

主页：Python只能讲字符串写入文本文件，要将数值数据存储到文本文件中，必须先试用函数str()将其转换为字符串格式。

In [6]:
filename = 'programming.txt'

with open(filename, 'w') as file_object:
    file_object.write("I love programming.\n")
    file_object.write("I love creating new games.\n")

评注：write()函数不会再写入的文本末尾添加换行符，因此如果你写入多行时没有指定换行符，文件最后的数据组织形式就不是你想要的结果。如果想要得到每一句末尾换行的效果，需要手动添加换行符。

In [7]:
# 3.将新的内容添加到文件中
filename = 'programming.txt'

with open(filename, 'a') as file_object:
    file_object.write("I also love finding meaning in large datasets.\n")
    file_object.write("I love ctreating apps that can run in a browser.\n")
    

#### 10.3 异常

Python使用异常这种特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时，它都会创建一个异常对象。如果你编写了处理该异常的代码，程序将继续运行。如果你未对异常进行处理，程序将会停止，并显示一个traceback(回溯)，其中包含着有关异常的报告。

In [12]:
# 1.使用try-except代码块处理ZeroDivisionError异常
try:
    print(5/0)
except ZeroDivisionError:
    print("You can't divide by zero!")

You can't divide by zero!


评注：try-except结构首先会执行try代码块，如果能够成功运行则会跳过except代码块。如果出现了错误，Python会查找except代码块，如果cxcept语句指定的错误类型与try代码块引发的错误一致，excep代码块就会被执行，否则直接返回错误的traceback(回溯)。try-except结构的好处是，即使程序产生了错误也不会直接终止程序的运行，只要能够正确捕捉到产生的错误类型，try-except后面的程序就可以继续执行。

In [15]:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")

while True:
    first_number = input("\nFirst number: ")
    if first_number == 'q':
        break
    second_number = input("Second number: ")
    if second_number == 'q':
        break
    try:
        answer = int(first_number) / int(second_number)
    except ZeroDivisionError:
        print("You can't divide by zero!")
    else:
        print(answer)

Give me two numbers, and I'll divide them.
Enter 'q' to quit.

First number: 2
Second number: 0
You can't divide by zero!

First number: 2
Second number: 1
2.0

First number: q


评注：Python尝试执行try代码块中的袋代码；只有可能引发异常的代码才需要放在try语句中。有时候，有一些仅在try代码块成功执行时才需要运行的代码；这些代码应放在else代码块中。except代码块告诉Python，如果它尝试运行try代码块中的代码时引发了指定的异常该怎么办。

In [16]:
# 2.处理FileNotFoundError异常
filename = 'alien.txt'
try:
    with open(filename) as f_obj:
        contents = f_obj.read()
except FileNotFoundError:
    msg = "Sorry, the file " + filename + " does not exist."
    print(msg)

Sorry, the file alien.txt does not exist.


In [22]:
# 3.分析文本
title = 'Alice in Wonderland'
title.split()

['Alice', 'in', 'Wonderland']

评注：方法split()以空格为分隔符将字符串分拆成多个部分并将这些部分都存储到一个列表中。得到的结果是一个包含字符串中所有单词的列表，虽然有些单词会包含标点符号。

In [23]:
filename = 'alice.txt'

try:
    with open(filename) as f_obj: # 以默认的只读模式打开文件
        contents = f_obj.read()   # read()函数将文本文件的内容读取为长字符串
except FileNotFoundError:
    msg = "Sorry, the file " + filename + " dose not exist."
    print(msg)
# try代码块成功执行后，即文件被成功带开户，else代码块才会被执行
else:
    # 计算文件大致包含多少个单词
    words = contents.split()
    num_words = len(words)
    print("The file " + filename + " has about " + str(num_words) + " words.")

The file alice.txt has about 23953 words.


In [25]:
# 处理多个文件，方便起见，先将上面的代码组织成函数
def count_words(filename):
    """计算一个文件大致包含多少个单词"""
    try:
        with open(filename) as f_obj:
            contents = f_obj.read()
    except FileNotFoundError:
        msg = "Sorry, the file " + filename + " dose not exist."
        print(msg)
    else:
        # 计算文件大致包含多少个单词
        words = contents.split()
        num_words = len(words)
        print("The file " + filename + " has about " + str(num_words) + " words.")
filename = 'alice.txt'
count_words(filename)

The file alice.txt has about 23953 words.


In [27]:
filenames = ['alice.txt', 'moby_dict.txt', 'alice.txt']
for filename in filenames:
    count_words(filename)

The file alice.txt has about 23953 words.
Sorry, the file moby_dict.txt dose not exist.
The file alice.txt has about 23953 words.


评注：在上述的代码中，假想了一个不存在的moby_dict.txt文件。可以发现Python在捕获到FileNotFoundError后执行了except代码块，程序并没有被该错误中断。如果想让代码在捕捉到FileNotFoundError后什么也不做的话，可以把except后的代码块替换为pass语句，提醒Python此处不做任何工作。pass语句还可以充当占位符，方便以后添加代码。程序开发者应该弄清楚，什么时候应该向用户反馈错误信息，什么时候应该隐藏。

#### 10.4 存储数据

程序把用户提供的信息存储在列表和字典等数据结构中，用户关闭程序前，你需要保存他们提供的信息，否则数据就会丢失。一种简单的方式就是使用模块json来存储数据。

Json格式是为了JavaScript开发的，但是后来成为了一种常见的数据格式，被包括Python在内的众多语言采用。

In [3]:
# 1.使用json.dump()和json.load()
# json.dump()接受两个参数：要存储的数据以及可用于存储数据的文件对象。
import json

numbers = [2 ,3, 5, 7, 11, 13]
filename = 'numbers.json'
with open(filename, 'w') as f_obj: # 以'w'模式打开文件，文件不存时会自动创建一个新的文件，文件已经存在时会被清空
    json.dump(numbers, f_obj) # 两个参数：存储的数据；文件对象

In [10]:
# json.load()接收文件对象
import json 

filename = 'numbers.json'
with open(filename) as f_obj:
    numbers = json.load(f_obj)
    print(type(numbers))
print(numbers)

<class 'list'>
[2, 3, 5, 7, 11, 13]


评注：从json文件中恢复数据时，得到的数据类型与写入时一致。

In [14]:
# 2.保存和读取用户生成的数据
import json

username = input("What is your name? ")

filename = 'username.json'
with open(filename, 'w') as f_obj:
    json.dump(username, f_obj)
    print("We'll remember you when you come back, " + username + "!")

What is your name? Hesz
We'll remember you when you come back, Hesz!


In [15]:
import json
filename = 'username.json'

with open(filename) as f_obj:
    username = json.load(f_obj)
    print(type(username))
    print("Welcome back, " + username + "!")

<class 'str'>
Welcome back, Hesz!


In [17]:
import json

# 如果以前存储了用户名，就加载它
# 否则，就提示用户输入用户名并存储它
filename = 'username.json'
try:
    with open(filename) as f_obj:
        username = json.load(f_obj)
except FileNotFoundError:
    username = input("What is your name?")
    with open(filename, 'w') as f_obj:
        json,dump(username, f_obj)
        print("We'll remenber you when you come back, " + username + "!")
else:
    print("Welcome back, " + username + "!")


Welcome back, Hesz!


In [18]:
# 3. 函数重构
import json

def greet_user():
    '''问候用户，并指出姓名'''
    filename = 'username.json'
    try:
        with open(filename) as f_obj:
            username = json.load(f_obj)
    except FileNotFoundError:
        username = input("What is your name?")
        with open(filename, 'w') as f_obj:
            json,dump(username, f_obj)
            print("We'll remenber you when you come back, " + username + "!")
    else:
        print("Welcome back, " + username + "!")

greet_user()

Welcome back, Hesz!


In [20]:
import json

def get_stored_username():
    '''如果存储了用户名，就获取它'''
    filename = 'username.json'
    try:
        with open(filename) as f_obj:
            username = json.load(f_obj)
    except FileNotFoundError:
        return None
    else:
        return username

def greet_user():
    '''问候用户，并指出其姓名'''
    username = get_stored_username()
    if username:
        print("Welcome back, " + username + "!")
    else:
        username = input("What is your name? ")
        filename = 'username.json'
        with open(filename, 'w') as f_obj:
            json.dump(username, f_obj)
            print("We'll remember you when you come back, " + username + "!")
            
greet_user()

Welcome back, Hesz!


小结：我们在本章中学习了如何一次性读取整个文件，以及如何以每次一行的方法读取文件；如何写入文件，以及如何将文本附加到文件末尾；什么是异常以及如何处理程序可能引发的异常；如何利用json模块来存储Python数据结构。

### 第11章 测试代码

在本章中，你将学习如何使用Python模块unittest中的工具来测试代码。你将学习编写测试用例，核实一系列的输入都能得到预期的输出。

#### 11.1 测试函数

In [21]:
def get_formatted_name(first, last):
    '''Generation a neatly formatted full name.'''
    full_name = first + ' ' + last
    return full_name.title()

In [26]:
print("Enter 'q' to quit at any time.")
while True:
    first = input("\nPlease give me a first name: ")
    if first == 'q':
        break
    last = input("\nPlease give me a last name: ")
    if last == 'q':
        break
        
    formatted_name = get_formatted_name(first, last)
    print("\tNeatly formatted name: " + formatted_name + '.')

Enter 'q' to quit at any time.

Please give me a first name: janis

Please give me a last name: joplin
	Neatly formatted name: Janis Joplin.

Please give me a first name: q


In [28]:
'''unittest模块提供了代码测试工具，用于核实函数的某个方面没有问题，
   测试用例是一组单元测试，这些单元测试一起核实函数在各种情形下的行为都符合要求。'''
import unittest

class NamesTestCase(unittest.TestCase):
    '''测试代码'''
    def test_first_last_name(self):
        '''能够正确处理两个单词的姓名吗？'''
        formatted_name = get_formatted_name('janis', 'joplin')
        self.assertEqual(formatted_name, 'Janis Joplin') # 核实函数的输出是否和预期的输出一致

unittest.main()

E
ERROR: C:\Users\hsz\AppData\Roaming\jupyter\runtime\kernel-597b0807-e2f9-4860-a48d-8a9e9c442b91 (unittest.loader._FailedTest)
----------------------------------------------------------------------
AttributeError: module '__main__' has no attribute 'C:\Users\hsz\AppData\Roaming\jupyter\runtime\kernel-597b0807-e2f9-4860-a48d-8a9e9c442b91'

----------------------------------------------------------------------
Ran 1 test in 0.002s

FAILED (errors=1)


SystemExit: True

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [30]:
# 添加新的测试
import unittest

class NamesTestCase(unittest.TestCase):
    '''测试代码'''
    def test_first_last_name(self):
        '''能够正确处理两个单词的姓名吗？'''
        formatted_name = get_formatted_name('janis', 'joplin')
        self.assertEqual(formatted_name, 'Janis Joplin') # 核实函数的输出是否和预期的输出一致
    
    def test_first_middle_last_name(self):
        '''能够正确处理三个单词的姓名吗？'''
        formatted_name = get_formatted_name('wolfgang', 'mozart', 'amadeus' )
        self.assertEqual(formatted_name, 'Wolfgang Amadeus Mozart')
        
unittest.main()

E
ERROR: C:\Users\hsz\AppData\Roaming\jupyter\runtime\kernel-597b0807-e2f9-4860-a48d-8a9e9c442b91 (unittest.loader._FailedTest)
----------------------------------------------------------------------
AttributeError: module '__main__' has no attribute 'C:\Users\hsz\AppData\Roaming\jupyter\runtime\kernel-597b0807-e2f9-4860-a48d-8a9e9c442b91'

----------------------------------------------------------------------
Ran 1 test in 0.003s

FAILED (errors=1)


SystemExit: True

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


### 11.2 测试类

Python的unittest.TestCase类中提供了很多断言的方法。前面说过，断言方法检查你认为应该满足的条件是否确实满足，如果满足则程序正确运行，如果不满足则Python将引发异常。值得注意的是，只能在继承了unittest.TeseCase()的类中使用这些断言方法方法。

对类的测试与对函数的测试是类似的，在对类的测试中，大部分工作都是测试类中方法的行为，但存在一些不同之处。

##### 方法setUp()

unittest.TestCase类包含方法setUp()，让我们只需创建这些对象一次，并在每一个测试方法中使用它们。在TestCase类中包含方法setUp()，Python将先运行它，再运行各个以test_打头的方法。这样，在你编写的每个测试方法中都可以使用方法setUp()中创建的对象。

小结：在本章的学习中，我们学会了如何使用unittest模块工具来为函数和类编写测试代码；如何编写继承unittest.TestCase的类以及如何编写测试方法，以核实函数和类的行为符合预期。还学习了如何使用方法setUp()来根据类高效地创建实例并设置其属性，以便在类的所有测试方法中使用它们。