### 文件和异常
---
在实际开发中，常常需要对程序中的数据进行持久化操作，而现实数据持久化最简单的方式就是将数据保存在文件中。

In [None]:
def main():
    f = open('致橡树.txt', 'r', encoding='utf-8')
    print(f.read())
    f.close()


if __name__ == '__main__':
    main()

#### 捕获异常

In [1]:
def main():
    f = None
    try:
        f = open('test.txt', 'r', encoding='utf-8')
        print(f.read)
    except FileNotFoundError:
        print('无法打开指定的文件！')
    except LookupError:
        print('指定了未知的编码！')
    except UnicodeDecodeError:
        print('读取文件时解码错误！')
    finally:
        if f:
            f.close()
            
if __name__ == '__main__':
    main()

无法打开指定的文件！


#### 使用with open() as f

In [3]:
def main():
    try:
        with open('test.txt', 'r', encoding='utf-8') as f:
            print(f.read())
    except FileNotFoundError:
        print('无法打开指定的文件！')
    except LookupError:
        print('指定了未知的编码！')
    except UnicodeDecodeError:
        print('读取文件时解码错误！')
        
if __name__ == '__main__':
    main()

无法打开指定的文件！


In [None]:
"""

@Author:jyang
@Date:5/17/2019
"""

import time


def main():
    with open('test.txt', 'r', encoding='utf-8') as f:
        print(f.read())

    with open('test.txt', mode='r') as f:
        for line in f:
            print(line, end='')
            time.sleep(0.5)
    print()

    with open('test.txt') as f:
        lines = f.readlines()
    print(lines)


if __name__ == '__main__':
    main()

将文本信息写入文件也非常简单，在使用open函数时指定好文件名并将文件模式设置为'w'即可。注意如果要将文件内容进行追加式写入，应该将模式设置为'a'。如果要写入的文件不存在会自动创建文件而不是引发异常。假面的例子将1-9999的素数分别写入三个文件中。（1-99之间的素数保存在a.txt中，100-999之间的素数保存在b.txt中，1000-9999之间的素数保存在c.txt中）。

In [None]:
"""

@Author:jyang
@Date:5/18/2019
"""

from math import sqrt


def is_prime(n):
    assert n>0
    flag = True
    for i in range(2, int(sqrt(n))+1):
        if n%i == 0:
            flag = not flag
            return flag
    return flag if n!=1 else False


def main():
    filenames = ('a.txt', 'b.txt', 'c.txt')
    fs_list = []

    try:
        for filename in filenames:
            fs_list.append(open(filename, 'w', encoding='utf-8'))
        for n in range(1, 10000):
            if is_prime(n):
                if n < 100:
                    fs_list[0].write(str(n) + '\n')
                elif n < 1000:
                    fs_list[1].write(str(n) + '\n')
                else:
                    fs_list[2].write(str(n) + '\n')
    except IOError as e:
        print(e)
        print('写文件时发生错误')
    finally:
        for f in fs_list:
            f.close()
    print('Done!')


if __name__ == '__main__':
    main()

### 读写二进制文件
知道了如何读写文本文件，要读写二进制文件也就很简单了，下面的代码实现了复制图片文件的功能。

In [None]:
def main():
    try:
        with open('guido.jpg', 'rb') as fs1:
            data = fs1.read()
            print(type(data))       # <class 'bytes'>
        with open('guido-copy.jpg', 'wb') as fs2:
            fs2.write(data)

    except FileNotFoundError as e:
        print('Cannot open the file')
    except IOError as e:
        print('Error occurred when w/r file')
    print('Done')


if __name__ == '__main__':
    main()

### 读写JSON文件
如果希望吧一个列表或者一个字典中的数据保存到文件中该怎么做？答案是将数据已JSON格式进行保存。JSON是“JavaScript Object Notation”的缩写，它本来是JavaScript语言中创建对象的一种字面量语法，现在已经被广泛的应用于跨平台跨语言的数据交换，原因很简单，因为JSON也是纯文本，任何系统任何编程语言处理纯文本都是没有问题的。目前JSON基本上已经取代了XML作为异构系统间交换数据的事实标准。
事实上JSON的数据类型和Python的数据类型是很容易找到对应关系的。

JSON | Python
---|---
object | dict
array | list
string | str
number(int/rel) | int/float
true/false | True/False
null | None


Python | JSON
---|---
dict | object
list, tuple | array
str | string
int,float,int-&float-derived Enums | number
True/False | true/false
None | null



In [None]:
import json


def main():
    mydict = {
        'name': 'Phoebe',
        'age': 18,
        'qq': 233333,
        'friends': ['Joe', 'Rachel'],
        'cars': [
            {'brand': 'BYD', 'max_speed': 180},
            {'brand': 'Audi', 'max_speed': 280},
            {'brand': 'Benz', 'max_speed': 320}
        ]
    }
    try:
        with open('data.json', 'w', encoding='utf-8') as f:
            json.dump(mydict, f)
    except IOError as e:
        print(e)
    print('Data is saved.')


if __name__ == '__main__':
    main()

json模块主要有四个比较重要的函数，分别是：
- dump - 将Python对象按照JSON格式，序列化到文件中
- dumps - 将Python对象处理成JSON格式的字符串
- load - 将文件中的JSON数据反序列化为对象
- loads - 将字符串的内容反序列化成Python对象

这里出现了两个概念，一个叫序列化，一个叫反序列化。自由的百科全书维基百科上对这两个概念是这样解释的：“序列化（serialization）在计算机科学的数据处理中，是指将数据结构或对象状态转换为可以存储或传输的形式，这样在需要的时候能够恢复到原先的状态，而且通过序列化的数据重新获取字节时，可以利用这些字节来产生原始对象的副本（拷贝）。与这个过程相反的动作，即从一系列字节中提取数据结构的操作，就是反序列化（deserialization）”。

In [None]:
def main():
    my_key = 'yourkey' # need to sign in the website, then you'll get your key
    resp = requests.get('http://api.tianapi.com/txapi/joke/?&key=%s&num=10' % (my_key))
    data_model = json.loads(resp.text) # 字符串反序列化为Python对象
    newslist = data_model['newslist']

    try:
        f = open('jokes.txt', 'w+', encoding='utf-8')
        for news in newslist:
            title = news['title'] + '\n'
            content = news['content'] + '\n'
            f.write(title)
            f.write(content)
    except IOError as e:
        print(e)
    finally:
        f.close()



if __name__ == '__main__':
    main()