# 持久化-file
- 长久保存信息的一种数据集合
- 常用操作
    - 打开文件(文件打开后需要手动关闭)
    - 读写内容
    - 查找

# open函数
- open函数负责打开文件，带有很多参数
- 第一个参数：文件的路径和名称
- mode：表明文件用什么方式打开
    - r：以只读方式打开
    - w：写方式打开，会覆盖以前的内容（把原来的直接删掉了）
    - x：创建方式打开，如果文件已经存在，报错。
    - a：append方式，以追加的方式对文件内容及逆行写入
    - b：binary方式，二进制写入
    - t：文本方式打开
    - +：可读写

In [2]:
# 打开文件，用写的方式
# 
# f称之为文件句柄
f = open(r"C:\Users\Administrator\Desktop\test\1.txt", "w")  # 原来没有文件，则会创建一个文件
# 文件打开后必须关闭

# with语句（推荐）
- with语句使用的技术是称为上下文管理协议的技术
- 自动判断文件的作用域，自动关闭不再使用的打开的文件句柄

In [5]:
# with案例

with open(r"C:\Users\Administrator\Desktop\test\1.txt", 'r') as f:
    pass
    # 下面语句块开始对文件f进行操作
    # 在本模块中不需要使用close关闭文件

In [13]:
# with 案例 按行读取
with open(r"C:\Users\Administrator\Desktop\test\1.txt", 'r') as f:
    # 按行读取内容
    strline = f.readline()
    # 此结构保证能够读取文件直到结束
    while strline:
        print(strline,end = '') # 会读取文件中的换行符。
        strline = f.readline()

123
321
1234567


In [17]:
# list 能用打开的文件作为参数，把文件内每一行内容作为一个元素
with open(r"C:\Users\Administrator\Desktop\test\1.txt", 'r') as f:
    l = list(f)
    print(l)
    for i in l:
        print(i, end = '')

['123\n', '321\n', '1234567\n']
123
321
1234567


In [26]:
# read 是按字符读取文件内容
# 允许输入参数决定读取几个字符，如果没有指定，则从当前位置读取到结尾
# 否则，从当前位置读取到指定个数字符

with open(r"C:\Users\Administrator\Desktop\test\1.txt", 'r') as f:
    strchar = f.read(100)  # 100 表示读取字符个数 
    print(len(strchar))  # 输出字符个数 
    print(strchar)

16
123
321
1234567



In [31]:
# 每次读取两个字符 
with open(r"C:\Users\Administrator\Desktop\test\1.txt", 'r') as f:
    twochar = f.read(2)
    while twochar:
        print(twochar, end=' ')
        twochar = f.read(2)

12 3
 32 1
 12 34 56 7
 

# seek（offset，from）
- 移动文件的读取位置，也叫读取指针
- from的取值范围
    - 0：从文件头开始偏移
    - 1：从文件当前位置开始偏移
    - 2：从文件末尾开始偏移
- **移动的单位是字节**
- 一个汉字由若干个字节构成
- 返回文件只针对当前位置

In [33]:
# seek案例
# 打开文件后，从第五个字节处开始读取
with open(r"C:\Users\Administrator\Desktop\test\1.txt", 'r') as f:
    # 打开文件后，读写指针在0处，即文件的开头
    f.seek(4, 0)
    strchar = f.read()
    print(strchar)


321
1234567



In [10]:
with open(r"C:\Users\Administrator\Desktop\test\1.txt", 'r') as f:
    pos = f.tell()
    strchar = f.read(3)
    while strchar:
        print('pos:{}'.format(pos))
        print(strchar)
        strchar = f.read(3)
        pos = f.tell()
        
# 以下结果说明：
# tell返回的数字的单位是字节
# read 是以字符为单位

pos:0
123
pos:7

32
pos:11
1
1
pos:14
234
pos:17
567
pos:19




 # 文件的写操作-write
 - write(str):把字符串写入文件
 - writeline(str):把字符串按行写入文件
 - 区别：
     - write参数只能是一个字符串
     - writelines参数可以是字符串，也可以是字符序列(多为字符序列，可迭代对象，**不会自动换行**)

In [17]:
# write 案例
# 向文件追加一句话
with open(r"C:\Users\Administrator\Desktop\test\2.txt", 'a') as f:  # a表示追加
    f.write("万事开头难。\n中间难，\n结尾更难")

In [28]:
# writelines 案例
with open(r"C:\Users\Administrator\Desktop\test\3.txt", 'w') as f:  # a表示追加
    f.writelines(["万事开头难\n","中间难\n","结尾更难\n"])

# 持久化-pickle
- 序列化（持久化，落地）：把程序中的信息保存在磁盘上
- 反序列化：序列化的逆过程
- pickle：python提供的序列化模块
- pickle.dump:序列化
- pickle.load:反序列化

In [36]:
# 序列化案例
import pickle
age = 19
with open(r"C:\Users\Administrator\Desktop\test\4.txt", 'wb') as f:
    pickle.dump(age,f)

In [38]:
# 反序列化案例
with open(r"C:\Users\Administrator\Desktop\test\4.txt", 'rb') as f:
    age = pickle.load(f)
    print(age)

19


In [45]:
# pickle 可以保存一些结构化的东西 
a = ["徐孟楠",21,"计算机科学与技术学院","python"]
with open(r"C:\Users\Administrator\Desktop\test\5.txt", 'wb') as f:
    pickle.dump(a,f)

In [46]:
with open(r"C:\Users\Administrator\Desktop\test\5.txt", 'rb') as f:
    b = pickle.load(f)
print(b)

['徐孟楠', 21, '计算机科学与技术学院', 'python']


# 持久化-shelve
- 持久化工具
- 类似字典，用kb对保存数据，存取方式和字典类似
- open ，close

In [62]:
# 使用shelve创建文件并使用
import shelve
shv = shelve.open(r"C:\Users\Administrator\Desktop\test\1.db")
shv["a"] = {'aa':1,'bb':2,'cc':3}
shv["b"] = 2
shv["c"] = 3

shv.close()
# 不仅仅只会创建一个.db文件，还有其他文件

In [68]:
# 读取案例
shv = shelve.open(r"C:\Users\Administrator\Desktop\test\1.db", flag="r") # 只读方式打开
try:
    print(shv["asdf"])  # 未找到键值会报错，用try仍能够正确关闭文件。
except Exception as e:
    print("出错了！")
finally:
    shv.close() # 无论是否出错都会执行

出错了！


# shelve特性
- 不支持多个应用并行写入，
    - 为了解决这个问题，open的时候可以使用flag = r
- 写回问题
    - shelve默认情况下不会等待持久化对象进行任何修改
    - 解决方法：强制写会：writeback=True

In [71]:
# 不强制写回
shv = shelve.open(r"C:\Users\Administrator\Desktop\test\1.db")
shv["a"] = {'aa':1,'bb':2,'cc':3}
shv["b"] = 2
shv["c"] = 3

shv.close()
shv = shelve.open(r"C:\Users\Administrator\Desktop\test\1.db")
dd = shv["a"]
print(dd)
dd['aa'] = 100
shv.close()

shv = shelve.open(r"C:\Users\Administrator\Desktop\test\1.db")
print(shv["a"])

{'aa': 1, 'bb': 2, 'cc': 3}
{'aa': 1, 'bb': 2, 'cc': 3}


In [73]:
# 强制写回案例
shv = shelve.open(r"C:\Users\Administrator\Desktop\test\1.db")
shv["a"] = {'aa':1,'bb':2,'cc':3}
shv["b"] = 2
shv["c"] = 3

shv.close()

shv = shelve.open(r"C:\Users\Administrator\Desktop\test\1.db", writeback=True)
dd = shv["a"]
print(dd)
dd['aa'] = 100
shv.close()

shv = shelve.open(r"C:\Users\Administrator\Desktop\test\1.db")
print(shv["a"])

{'aa': 1, 'bb': 2, 'cc': 3}
{'aa': 100, 'bb': 2, 'cc': 3}


In [74]:
# shelve 使用with管理上下文环境,自动关闭，推荐使用。
with shelve.open(r"C:\Users\Administrator\Desktop\test\1.db") as shv:
    print(shv["a"])

{'aa': 100, 'bb': 2, 'cc': 3}
