# 文件

大量数据的保存、读取、读取、写入，需要的就是文件（files）。本章只介绍最简单的文本文件。

## 创建文件

创建一个文件最简单的方法，用 python 的内建函数 `open()`。
[官方文档](https://docs.python.org/3/library/functions.html#open)略长。

In [10]:
import locale
locale.getpreferredencoding(True)

'cp936'

`open(file, mode='r')`

第二个参数，`mode` 默认值是 `r`，可用的 `mode` 有以下几种：

| 参数字符 | 意义                            |
| -------- | ------------------------------- |
| `'r'`    | 只读模式                        |
| `'w'`    | 写入模式（重建）                |
| `'x'`    | 排他模式 —— 如果文件已存在则打开失败 |
| `'a'`    | 追加模式 —— 在已有文件末尾追加      |
| `'b'`    | 二进制文件模式                  |
| `'t'`    | 文本文件模式 (默认)             |
| `'+'`    | 读写模式（更新） |

创建一个新文件：

In [12]:
open('test_1.txt', 'w')

TypeError: an integer is required (got type _io.TextIOWrapper)

这个函数的返回值是一个所谓的 [file object](https://docs.python.org/3/glossary.html#term-file-object)。更多时候，我们会把这个函数的返回值保存到一个变量中，以便后面调用这个 file object 的各种 Methods，比如获取文件名 `file.name`，比如关闭文件 `file.close()`：

In [8]:
f = open('test_1.txt', 'w')
print(f.name)
f.close()

test_1.txt


## 删除文件

删除文件需要调用 `os` 模块。删除文件之前，需要先确认文件是否存在，否则删除命令会失败。 

In [6]:
import os

f = open('test_1.txt', 'w')
print(f.name)
f.close()

if os.path.exists(f.name):
    os.remove(f.name)
    print(f'{f.name} deleted.')
else:
    print(f'{f.name} does not exist')

test_1.txt
test_1.txt deleted.


In [5]:
os.remove('test_1.txt')

FileNotFoundError: [WinError 2] 系统找不到指定的文件。: 'test_1.txt'

## 读写文件

创建文件之后，我们可以用 `f.write()` 方式把数据写入文件，也可以用 `f.read()` 来读取文件。

In [10]:
f = open('test_1.txt', 'w')
f.write('first line\nsecond line\nthrid line\n')
f.close()

f = open('test_1.txt', 'r')
s = f.read()
print(s)
f.close()

first line
second line
thrid line



文件有很多行的时候，我们可以用 `filereadline()` 操作。这个 Method 每次调用，都会返回文件中的新一行。

In [8]:
f = open('test_1.txt', 'r')
s = f.readline()    # 返回的是 'first line\n'
print(s)
s = f.readline()    # 返回的是 'second line\n'
print(s)
f.close()

first line

second line



关于上面两个代码片段执行后输出的差别。第一段执行后，first line 与 second line 之间没有空行，直接换行。这是因为值调用了一次 `readling()`，这时起作用的是文件中的换行符，一个换行符换一行。而第二段代码调用两次 readling()，这样，每调用一次，都会在文件末尾自动再加上一个换行符，类似于 print() 函数。

这个时候， `str.strip()` 就派上用场了。

In [12]:
f = open('test_1.txt', 'w')
f.write('first line\nsecond line\nthrid line\n')
f.close()

f = open('test_1.txt', 'r')
s = f.readline().strip()    # 返回的是 'first line'，'\n' 被去掉了……
print(s)
s = f.readline().strip()    # 返回的是 'second line'，'\n' 被去掉了……
print(s)
f.close()

first line
second line


**`f.readlines()`** 读取文件的所有行，得到一个列表，其中每一行作为列表的一个元素：

In [13]:
f = open('test_1.txt', 'w')
f.write('first line\nsecond line\nthrid line\n')
f.close()

f = open('test_1.txt', 'r')
s = f.readlines()    # 返回的是一个列表，注意，readlines，最后的 's'
print(s)
f.close()

['first line\n', 'second line\n', 'thrid line\n']


既然是列表，就是可迭代对象，可以逐一访问每一行：

In [14]:
f = open('test_1.txt', 'r')
for line in f.readlines():
    print(line)
f.close()

first line

second line

thrid line



`readlines()` 可以将文件读取到列表；相对地，`writelines()` 可以将一个列表写入文件，按顺序（从 0 开始）每一行写入列表中的对应元素：

In [15]:
a_list = ['first line\n', 'second line\n', 'third line\n']

f = open('test_2.txt', 'w')
f.writelines(sorted(a_list, reverse=True))
f.close()

f = open('test_2.txt', 'r')
for line in f.readlines():
    print(line)
f.close()

third line

second line

first line



## with 语句块

针对文件操作，python 有另外的语句块写法，更便于阅读：

```
with open(...) as f:
    f.write(...)
    ...
```

这样，就可以把针对当前以特定模式打开的某个文件的各种操作都写入同一个语句块了。

上面这段话有点绕口，简单意思就是，把对某个文件的操作放在一起执行。这个语句块的好处在于，可以及时地关闭文件，节约计算机资源。忘记这个说法是在哪里看的了。

In [16]:
import os

with open('test_1.txt', 'w') as f:
    f.write('first line\nsecond line\nthrid line\n')
    
with open('test_1.txt', 'r') as f:
    for line in f.readlines():
        print(line)

if os.path.exists(f.name):
    os.remove(f.name)
    print(f'{f.name} deleted.')
else:
    print(f'{f.name} does not exist') 

first line

second line

thrid line

test_1.txt deleted.


上面的代码就不会出现 `PermissionError` 的错误，因为 `with` 语句块的作用就是在**恰当的时候**关闭文件。所以，用过以后，文件就被关闭了。

即，`with` 语句块的另一个好处——不用写 `file.close()` 了。

## 另一个完整的程序

证明
> 即便结论是正确的，论证过程乱七八糟也不行！

这个论证应该来自于**把时间当做朋友**这本书。

In [None]:
with open('.english-words-master\words_alpha.txt', 'r') as file:
    for word in file.readlines():
        pass # 先用 pass 占个位，一会儿再写计算过程

In [18]:
ord('a')

97

In [19]:
word = 'knowledge'
sum = 0
for char in word:
    sum += ord(char) - 96
print(sum)

96


In [20]:
def sum_of_word(word):
    sum = 0
    for char in word:
        sum += ord(char) - 96
    return sum

sum_of_word('attitude')

100

In [22]:
ord('\n')

10

In [35]:
def sum_of_word(word):
    sum = 0
    for char in word:
        sum += ord(char) - 96
    return sum

with open('results.txt', 'w') as result:
    with open('english-words-master\words_alpha.txt', 'r') as file:
        for word in file.readlines():
            if sum_of_word(word.strip()) == 100:
                result.write(word)

In [33]:
os.path.exists('english-words-master\\words_alpha.txt')

True

In [34]:
os.getcwd()

'E:\\lessons\\block_chain\\self_teaching\\xu-practice'

## 总结

这一章介绍了文本文件的基本操作：

> * 打开文件 `open()`，基本模式有 `r` 和 `w`；
> * 删除文件，需要调用 `os` 模块，使用 `os.remove()`，删除文件前需要确认文件确实存在，还要确认文件当前没有被其他进程访问。。
> * 读写文件的 Methods：`f.read()`, `f.write()`, `f.readling()`, `f.readlines()`, `f.writelines()`；
> * `with` 语句块把文件都放入同一个语句块中。