### 1. 使用Python读文本文件

文件路径可以是绝对路径，也可以是相对路径。如果是绝对路径，Linux和Mac OS不能直接使用“～”表示“home目录”，因为Python不认识“～”这个符号。如果非要使用这个符号，需要使用Python的“os”模块，代码如下：

In [1]:
import os
real_path = os.path.expanduser('~/project/xxx')

相对路径是文本文件相对于现在的**工作区**而言的路径，并不总是相对于当前正在运行的这个Python文件的路径。

In [2]:
with open('文件操作读文件.txt', encoding='utf-8') as f:
    content_list = f.readlines()
    print(content_list)

['Python\n', '爬虫从入门到实践\n', '网页内容提取仅仅是爬虫的一小部分\n', '真正有技术含量和考验能力的是突破各种反爬虫策略\n', '以及应用一些反常态的技术获得数据']


In [3]:
# 直接把文件里面的全部内容用一个字符串返回
with open('文件操作读文件.txt', encoding='utf-8') as f:
    content_list = f.read()
    print(content_list)

Python
爬虫从入门到实践
网页内容提取仅仅是爬虫的一小部分
真正有技术含量和考验能力的是突破各种反爬虫策略
以及应用一些反常态的技术获得数据


### 2. 使用Python写文本文件

In [5]:
# 直接写一大段文字
with open('文件操作写文件.txt', 'w', encoding='utf-8') as f:
    f.write("一大段文字")

这里多出来一个参数“w”, w是英文write的首字母，意思是以写的方式打开文件。这个参数除了为“w”外，还可以为“a”。

它们的区别在于，如果原来已经有一个new.txt文件了，使用“w”会覆盖原来的文件，导致原来的内容丢失；而使用“a”，则会把新的内容写到原来的文件末尾。

In [7]:
# 把列表里面的所有字符串写入到文本中
with open('文件操作写文件.txt', 'w', encoding='utf-8') as f:
    f.writelines(['第一段话', '第二段话', '第三段话'])

- 需要特别注意，写列表的时候，Python写到文本中的文字是不会自动换行的，需要人工输入换行符才可以。

In [1]:
with open('文件操作写文件.txt', 'w', encoding='utf-8') as f:
    f.write('你好')
    f.write('\n========\n')
    f.writelines(['嘿嘿', '跟我学爬虫'])
    f.write('\n========\n')
    f.writelines(['爬虫开发\n', '看这本书就够了\n'])

### 3. 使用Python读/写CSV文件

In [3]:
import csv

#### (1) Python写CSV文件

Python可以把一个字典写成CSV文件，或者把一个包含字典的列表写成CSV文件。

In [5]:
data = [{'name': 'kingname', 'age': 24, 'salary': 99999},
       {'name': 'jonas', 'age': 20, 'salary': 1000000},
       {'name': '小明', 'age': 10, 'salary': 'N/A'}]
with open('文件操作csv文件.csv', 'w', encoding='utf-8') as f:
    writer = csv.DictWriter(f, fieldnames=['name', 'age', 'salary'])
    writer.writeheader()
    writer.writerows(data)
    writer.writerow({'name': '超人', 'age': 100, 'salary': 0})

#### (2) Python读CSV文件

In [7]:
with open('文件操作csv文件.csv', encoding='utf-8') as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row)
        print('姓名：{}，年龄：{}, 薪水：{}'.format(row['name'], row['age'], row['salary']))

{'name': 'kingname', 'age': '24', 'salary': '99999'}
姓名：kingname，年龄：24, 薪水：99999
{'name': 'jonas', 'age': '20', 'salary': '1000000'}
姓名：jonas，年龄：20, 薪水：1000000
{'name': '小明', 'age': '10', 'salary': 'N/A'}
姓名：小明，年龄：10, 薪水：N/A
{'name': '超人', 'age': '100', 'salary': '0'}
姓名：超人，年龄：100, 薪水：0


#### 使用列表推导式读取文本内容

In [8]:
with open('文件操作csv文件.csv', encoding='utf-8') as f:
    reader = [x for x in csv.DictReader(f)]
    
for row in reader:
    print(row)
    print('姓名：{}，年龄：{}, 薪水：{}'.format(row['name'], row['age'], row['salary']))

{'name': 'kingname', 'age': '24', 'salary': '99999'}
姓名：kingname，年龄：24, 薪水：99999
{'name': 'jonas', 'age': '20', 'salary': '1000000'}
姓名：jonas，年龄：20, 薪水：1000000
{'name': '小明', 'age': '10', 'salary': 'N/A'}
姓名：小明，年龄：10, 薪水：N/A
{'name': '超人', 'age': '100', 'salary': '0'}
姓名：超人，年龄：100, 薪水：0
