# 文件和异常

## 1.从文件中读取数据

### 1.1读取整个文件

要读取文件，需要一个包含几行文本的文件。下面首先来创建一个文件，它包含精确到小数点后30位的圆周率值，且在小数点后每10位处换行

用下面的程序打开并读取这个文件：

In [1]:
with open('pi_digits.txt')as file_object:
    contents = file_object.read()
    print(contents)

3.1415926535
  8979323846
  2643383279



在这个程序中，第1行代码做了大量的工作。我们先来看看函数open() 。要以任何方式使用文件——哪怕仅仅是打印其内容，都得先打开文件，这样才能访问它。函数open() 接受一个参数：**要打开的文件的名称**。Python在当前执行的文件所在的目录中查找指定的文件。在这个示例中，当前运行的是file_reader.py，因此Python在file_reader.py所在的目录中 查找pi_digits.txt。函数open() 返回一个表示文件的对象。在这里，open('pi_digits.txt') 返回一个表示文件pi_digits.txt 的对象；Python将这个对象存储在我们将 在后面使用的变量中。 

关键字with 在不再需要访问文件后将其关闭。在这个程序中，注意到我们调用了open() ，但没有调用close() ；你也可以调用open() 和close() 来打开和关闭文件，但 这样做时，如果程序存在bug，导致close() 语句未执行，文件将不会关闭。这看似微不足道，但未妥善地关闭文件可能会导致数据丢失或受损。如果在程序中过早地调 用close() ，你会发现需要使用文件时它已关闭 关闭 （无法访问），这会导致更多的错误。并非在任何情况下都能轻松确定关闭文件的恰当时机，但通过使用前面所示的结构，可 让Python去确定：你只管打开文件，并在需要时使用它，Python自会在合适的时候自动将其关闭。 有了表示pi_digits.txt的文件对象后，我们使用方法read() （前述程序的第2行）读取这个文件的全部内容，并将其作为一个长长的字符串存储在变量contents 中。这样，通过 打印contents 的值，就可将这个文本文件的全部内容显示出来： 

read()到达文件末尾时返回一个空字符串，而将这个空字符串显示出来时就是一个空行，要删除多出来的空行，可在print语句中使用rstrip()删除

In [2]:
with open('pi_digits.txt') as file_object:
    contents = file_object.read()
    print(contents.rstrip())

3.1415926535
  8979323846
  2643383279


### 1.2文件路径

当你将类似pi_digits.txt这样的简单文件名传递给函数open() 时，Python将在当前执行的文件（即.py程序文件）所在的目录中查找文件。 根据你组织文件的方式，有时可能要打开不在程序文件所属目录中的文件。例如，你可能将程序文件存储在了文件夹python_work中，而在文件夹python_work中，有一个名为 text_files的文件夹，用于存储程序文件操作的文本文件。虽然文件夹text_files包含在文件夹python_work中，但仅向open() 传递位于该文件夹中的文件的名称也不可行，因为Python 只在文件夹python_work中查找，而不会在其子文件夹text_files中查找。要让Python打开不与程序文件位于同一个目录中的文件，需要提供文件路径 文件路径 ，它让Python到系统的特定位置 去查找。


你还可以将文件在计算机中的准确位置告诉Python，这样就不用关心当前运行的程序存储在什么地方了。这称为绝对文件路径 绝对文件路径 。在相对路径行不通时，可使用绝对路径。例如， 如果text_files并不在文件夹python_work中，而在文件夹other_files中，则向open() 传递路径'text_files/ filename.txt' 行不通，因为Python只在文件夹python_work中查找 该位置。为明确地指出你希望Python到哪里去查找，你需要提供完整的路径。 

### 1.3逐行读取

要以每次一行的方式检查文件，可对文件对象使用for 循环： 

In [3]:
filename = 'pi_digits.txt'
with open(filename)as file_object:
    for line in file_object:
        print(line)

3.1415926535

  8979323846

  2643383279



### 1.4 创建一个包含文件各行内容的列表

使用关键字with 时，open() 返回的文件对象只在with 代码块内可用。如果要在with 代码块外访问文件的内容，可在with 代码块内将文件的各行存储在一个列表中，并 在with 代码块外使用该列表：你可以立即处理文件的各个部分，也可推迟到程序后面再处理。 下面的示例在with 代码块中将文件pi_digits.txt的各行存储在一个列表中，再在with 代码块外打印它们： 

使用关键字with 时，open() 返回的文件对象只在with 代码块内可用。如果要在with 代码块外访问文件的内容，可在with 代码块内将文件的各行存储在一个列表中，并 在with 代码块外使用该列表：你可以立即处理文件的各个部分，也可推迟到程序后面再处理。 下面的示例在with 代码块中将文件pi_digits.txt的各行存储在一个列表中，再在with 代码块外打印它们：

In [4]:
filename = 'pi_digits.txt'
with open(filename)as file_object:
    lines = file_object.readlines()
for line in lines:
    print(line.rstrip())

3.1415926535
  8979323846
  2643383279


readlines() 从文件中读取每一行，并将其存储在一个列表中；接下来，该列表被存储到变量lines 中；在with 代码块外，我们依然可以使用这个变量。在❷ 处，我们使用一个简单的for 循环来打印lines 中的各行。由于列表lines 的每个元素都对应于文件中的一行，因此输出与文件内容完全一致。 

### 1.5使用文件中的内容

。首先，我们将创建一个字符串，它包含文件中存储的所有数字，且没有任何空 格：


In [5]:
filename = 'pi_digits.txt'
with open(filename)as file_object:
    lines = file_object.readlines()
pi_string = ''
for line in lines:
    pi_string += line.rstrip()
print(pi_string)
print(len(pi_string))

3.1415926535  8979323846  2643383279
36


在变量pi_string 存储的字符串中，包含原来位于每行左边的空格，为删除这些空格，可使用strip() 而不是rstrip() ： 

In [6]:
filename = 'pi_digits.txt'
with open(filename)as file_object:
    lines = file_object.readlines()
pi_string = ''
for line in lines:
    pi_string += line.strip()
print(pi_string)
print(len(pi_string))

3.141592653589793238462643383279
32


注意 　读取文本文件时，Python将其中的所有文本都解读为字符串。如果你读取的是数字，并要将其作为数值使用，就必须使用函数int() 将其转换为整数，或使用 函数float() 将其转换为浮点数

### 1.6 包含一百万位的大型文件

In [12]:
filename = 'pi_million_digits.txt'
with open(filename) as file_object:
    lines = file_object.readlines()
    pi_string = ''
for line in lines:
    pi_string += line.strip()
print(pi_string[:52] + "...")
print(len(pi_string))

3.14159265358979323846264338327950288419716939937510...
1000002


### 圆周率中包含生日吗

我一直想知道自己的生日是否包含在圆周率值中。下面来扩展刚才编写的程序，以确定某个人的生日是否包含在圆周率值的前1 000 000位中。为此，可将生日表示为一个由数字 组成的字符串，再检查这个字符串是否包含在pi_string 中：

In [13]:
filename = 'pi_million_digits.txt'
with open(filename) as file_object:
    lines = file_object.readlines()
pi_string = ''
for line in lines:
    pi_string += line.rstrip()
birthday = input('Enter your birthday , in the form mmddyy:')
if birthday in pi_string:
    print("在里面")
else:
    print("不在")

Enter your birthday , in the form mmddyy:19990709
不在


### 1.7写入文件

保存数据的最简单的方式之一是将其写入到文件中。通过将输出写入文件，即便关闭包含程序输出的终端窗口，这些输出也依然存在：你可以在程序结束运行后查看这些输出， 可与别人分享输出文件，还可编写程序来将这些输出读取到内存中并进行处理

#### 1.7.1写入空文件

要将文本写入文件，你在调用open() 时需要提供另一个实参，告诉Python你要写入打开的文件。为明白其中的工作原理，我们来将一条简单的消息存储到文件中，而不是将其打 印到屏幕上：


In [14]:
filenam = 'programming.txt'
with open(filename,'w')as file_object:
    file_object.write("I love programming.")

在这个示例中，调用open() 时提供了两个实参（见❶）。第一个实参也是要打开的文件的名称；第二个实参（'w' ）告诉Python，我们要以写入模式 写入模式 打开这个文件。打开文件 时，可指定读取模式 读取模式 （'r' ）、写入模式 写入模式 （'w' ）、附加模式 附加模式 （'a' ）或让你能够读取和写入文件的模式（'r+' ）。如果你省略了模式实参，Python将以默认的只读模式打 开文件。 如果你要写入的文件不存在，函数open() 将自动创建它。然而，以写入（'w' ）模式打开文件时千万要小心，因为如果指定的文件已经存在，Python将在返回文件对象前清空 该文件。 

#### 1.7.2写入多行

In [16]:
filename = 'programming.txt'
with open(filename, 'w') as file_object:
    file_object.write("I love programming.\n")
    file_object.write("I love creating new games.\n")

#### 附加到文件

In [1]:
filename = 'programming.txt' 
with open(filename, 'a') as file_object: 
    file_object.write("I also love finding meaning in large datasets.\n")
    file_object.write("I love creating apps that can run in a browser.\n")

### 异常

Python使用被称为异常 异常 的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时，它都会创建一个异常对象。如果你编写了处理该异常的代码，程序将继 续运行；如果你未对异常进行处理，程序将停止，并显示一个traceback，其中包含有关异常的报告。 

异常是使用try-except 代码块处理的。try-except 代码块让Python执行指定的操作，同时告诉Python发生异常时怎么办。使用了try-except 代码块时，即便出现异常， 程序也将继续运行：显示你编写的友好的错误消息，而不是令用户迷惑的traceback。

#### 处理ZeroDivisionError异常

我们知道不能将一个数字除以0，下面我们用python试试

In [3]:
print(5/0)

ZeroDivisionError: division by zero

哦豁，果然报错了，我们看到python抛出了一个ZeroDivisionError异常

ZeroDivisionError 是一个异常对象。Python无法按你的要求做时，就会创建这种对象。在这种情况下，Python将停止运行程序，并指出 引发了哪种异常，而我们可根据这些信息对程序进行修改。下面我们将告诉Python，发生这种错误时怎么办；这样，如果再次发生这样的错误，我们就有备无患了。 

#### 使用try-except代码块

In [4]:
try:
    print(5/0)
except ZeroDivisionError:
    print("You can't divide by zero")

You can't divide by zero


我们将导致错误的代码行print(5/0) 放在了一个try 代码块中。如果try 代码块中的代码运行起来没有问题，Python将跳过except 代码块；如果try 代码块中的代码导致了 错误，Python将查找这样的except 代码块，并运行其中的代码，即其中指定的错误与引发的错误相同。
在这个示例中，try 代码块中的代码引发了ZeroDivisionError 异常，因此Python指出了该如何解决问题的except 代码块，并运行其中的代码。这样，用户看到的是一条友 好的错误消息，而不是traceback


#### 使用异常避免崩溃

发生错误时，如果程序还有工作没有完成，妥善地处理错误就尤其重要。这种情况经常会出现在要求用户提供输入的程序中；如果程序能够妥善地处理无效输入，就能再提示用 户提供有效输入，而不至于崩溃。
下面来创建一个只执行除法运算的简单计算器：


In [8]:
print("Give me two numbers , and I'll divide them.")
print("Enter 'q' to quit.")

while True:
    first_number = input("\n First number: ")
    if first_number == 'q':
        break
    second_number = input("Second number: ")
    if second_number == 'q':
        break
    answer = int(first_number)/int (second_number)
    print(answer)

Give me two numbers , and I'll divide them.
Enter 'q' to quit.

 First number: 5
Second number: 0


ZeroDivisionError: division by zero

#### else代码块

通过将可能引发错误的代码放在try-except 代码块中，可提高这个程序抵御错误的能力。错误是执行除法运算的代码行导致的，因此我们需要将它放到try-except 代码块 中。这个示例还包含一个else 代码块；依赖于try 代码块成功执行的代码都应放到else 代码块中： 

In [None]:
print("Give me two numbers , and I'll divide them.")
print("Enter 'q' to quit.")

while True:
    first_number = input("\n First number: ")
    if first_number == 'q':
        break
    second_number = input("Second number: ")
    try:
        answer = int(first_number)/int (second_number)
    except ZeroDivisionError:
        print("You can't divide by 0")
    else:
        print(answer)

#### 处理FileNotFoundError 异常 

使用文件时，一种常见的问题是找不到文件：你要查找的文件可能在其他地方、文件名可能不正确或者这个文件根本就不存在。对于所有这些情形，都可使用try-except 代码 块以直观的方式进行处理。
我们来尝试读取一个不存在的文件。下面的程序尝试读取文件alice.txt的内容，但我没有将这个文件存储在alice.py所在的目录中： 

In [3]:
filename = 'alice.txt'
with open(filename)as f_obj:
    contents = f_obj.read()

FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'

在上述traceback中，最后一行报告了FileNotFoundError 异常，这是Python找不到要打开的文件时创建的异常。在这个示例中，这个错误是函数open() 导致的，因此要处理 这个错误，必须将try 语句放在包含open() 的代码行之前： 

In [5]:
filename = 'alice.txt'
try:
    with open(filename)as f_obj:
        contents = f_obj.read()
except FileNotFoundError:
    msg = "对不起，您拨打的电话已关机"
    print(msg)

对不起，您拨打的电话已关机


如果文件不存在，这个程序什么都不做，因此错误处理代码的意义不大。下面来扩展这个示例，看看在你使用多个文件时，异常处理可提供什么样的帮助。 

#### 分析文本

你可以分析包含整本书的文本文件。很多经典文学作品都是以简单文本文件的方式提供的，因为它们不受版权限制。本节使用的文本来自项目Gutenberg（http://gutenberg.org/ ）， 这个项目提供了一系列不受版权限制的文学作品，如果你要在编程项目中使用文学文本，这是一个很不错的资源。 下面来提取童话 Alice in Wonderland 的文本，并尝试计算它包含多少个单词。我们将使用方法split() ，它根据一个字符串创建一个单词列表。下面是对只包含童话名"Alice in Wonderland" 的字符串调用方法split() 的结果： 

In [7]:
title = "Alice in Wonderland"
title.split()

['Alice', 'in', 'Wonderland']

方法split() 以空格为分隔符将字符串分拆成多个部分，并将这些部分都存储到一个列表中。结果是一个包含字符串中所有单词的列表，虽然有些单词可能包含标点。为计算 Alice in Wonderland 包含多少个单词，我们将对整篇小说调用split() ，再计算得到的列表包含多少个元素，从而确定整篇童话大致包含多少个单词： 

In [8]:
filename = 'alice.txt'
try:
    with open(filename)as f_obj:
        contents = f_obj.read()
except FileNotFoundError:
    msg = "对不起，您拨打的电话已关机"
    print(msg)
else:
    #计算文本中大概包含多少单词
    words = contents.split()
    num_words = len(words)
    print("这个文件" + filename + "大概有" + str(num_words) + "个单词")

对不起，您拨打的电话已关机
