# 读文件

In [2]:
f = open('./见与不见.txt')

In [3]:
f.read()

'你见，或者不见我\n我就在那里\n不悲不喜\n你念，或者不念我\n情就在那里\n不来不去\n你爱或者不爱我\n爱就在那里\n不增不减\n你跟，或者不跟我\n我的手就在你的手里\n不舍不弃\n来我怀里\n或者\n让我住进你的心里\n默然相爱\n寂静喜欢'

In [4]:
f.close()

In [5]:
f.read()

ValueError: I/O operation on closed file.

In [6]:
try:
    f = open('./见与不见.txt')
    print(f.read())
finally:
    if f:
        f.close()

你见，或者不见我
我就在那里
不悲不喜
你念，或者不念我
情就在那里
不来不去
你爱或者不爱我
爱就在那里
不增不减
你跟，或者不跟我
我的手就在你的手里
不舍不弃
来我怀里
或者
让我住进你的心里
默然相爱
寂静喜欢


以上等价于如下：

In [8]:
with open('./见与不见.txt') as f:
    print(f.read())


你见，或者不见我
我就在那里
不悲不喜
你念，或者不念我
情就在那里
不来不去
你爱或者不爱我
爱就在那里
不增不减
你跟，或者不跟我
我的手就在你的手里
不舍不弃
来我怀里
或者
让我住进你的心里
默然相爱
寂静喜欢


调用read()会一次性读取文件的全部内容，如果文件有10G，内存就爆了，所以，要保险起见，可以反复调用read(size)方法，每次最多读取size个字节的内容。另外，调用readline()可以每次读取一行内容，调用readlines()一次读取所有内容并按行返回list。因此，要根据需要决定怎么调用。

In [16]:
with open('./见与不见.txt') as f:
    print(f.read(10))
    print('*'*20)
    print(f.readline())
    print('*'*20)
    print(f.readlines())

你见，或者不见我
我
********************
就在那里

********************
['不悲不喜\n', '你念，或者不念我\n', '情就在那里\n', '不来不去\n', '你爱或者不爱我\n', '爱就在那里\n', '不增不减\n', '你跟，或者不跟我\n', '我的手就在你的手里\n', '不舍不弃\n', '来我怀里\n', '或者\n', '让我住进你的心里\n', '默然相爱\n', '寂静喜欢']


## file-like Object

像open()函数返回的这种有个read()方法的对象，在Python中统称为file-like Object。除了file外，还可以是内存的字节流，网络流，自定义流等等。file-like Object不要求从特定类继承，只要写个read()方法就行。

## 二进制文件

前面讲的默认都是读取文本文件，并且是UTF-8编码的文本文件。要读取二进制文件，比如图片、视频等等，用'rb'模式打开文件即可

In [19]:
with open('./sublime.jpg','rb') as f:
    print(f.read())

b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x01\x00H\x00H\x00\x00\xff\xdb\x00C\x00\t\x06\x07\x08\x07\x06\t\x08\x07\x08\n\n\t\x0b\r\x16\x0f\r\x0c\x0c\r\x1b\x14\x15\x10\x16 \x1d"" \x1d\x1f\x1f$(4,$&1\'\x1f\x1f-=-157:::#+?D?8C49:7\xff\xdb\x00C\x01\n\n\n\r\x0c\r\x1a\x0f\x0f\x1a7%\x1f%77777777777777777777777777777777777777777777777777\xff\xc0\x00\x11\x08\x00\xf5\x02\x08\x03\x01"\x00\x02\x11\x01\x03\x11\x01\xff\xc4\x00\x1c\x00\x01\x00\x02\x03\x01\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x01\x04\x03\x05\x07\x06\x02\x08\xff\xc4\x00K\x10\x00\x01\x02\x04\x05\x00\x05\x07\x08\x03\x0f\x05\x01\x00\x00\x00\x00\x01!\x02\x03\x11A\x04\x05\x121Q\x06\x13\x93\xa1\xd1\x14\x15"2Ua\x81\x07\x17RSq\x91\xc1\xe1#BV\x16$456CFbr\x82\x83\x92\xa3\xb1\xf03DEcs\xa2\xff\xc4\x00\x1a\x01\x01\x00\x02\x03\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x04\x05\x01\x02\x03\x06\xff\xc4\x00"\x11\x01\x00\x02\x02\x01\x04\x03\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x01\x02\x03\x11\x04\x05\x12!1\x13"A2Q\xff\xda\x00\x0c\x

## 字符编码

要读取非UTF-8编码的文本文件，需要给open()函数传入encoding参数；遇到有些编码不规范的文件，你可能会遇到UnicodeDecodeError，因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况，open()函数还接收一个errors参数，表示如果遇到编码错误后如何处理。最简单的方式是直接忽略

In [21]:
f = open('./见与不见.txt', 'r', encoding='gbk', errors='ignore')
print(f.read())
f.close()

你见，或者不见我
我就在那里
不悲不喜
你念，或者不念我
情就在那里
不来不去
你爱或者不爱我
爱就在那里
不增不减
你跟，或者不跟我
我的手就在你的手里
不舍不弃
来我怀里
或者
让我住进你的心里
默然相爱
寂静喜欢


# 写文件

In [30]:
with open('./见与不见.txt','a') as f:
    f.write('\nby 仓央嘉措\n')

In [31]:
with open('./见与不见.txt','r') as f:
    print(f.read())

你见，或者不见我
我就在那里
不悲不喜
你念，或者不念我
情就在那里
不来不去
你爱或者不爱我
爱就在那里
不增不减
你跟，或者不跟我
我的手就在你的手里
不舍不弃
来我怀里
或者
让我住进你的心里
默然相爱
寂静喜欢

by 仓央嘉措



# StringIO

StringIO顾名思义就是在内存中读写str

In [36]:
from io import StringIO
f = StringIO("hello\nmike\nmoring!")
while True:
    s = f.readline()
    if s =='':
        break
    print(s)

hello

mike

moring!


# BytesIO

StringIO操作的只能是str，如果要操作二进制数据，就需要使用BytesIO

In [8]:
from io import BytesIO
f = BytesIO()
f.write('hello,我的朋友'.encode('utf-8'))


18

In [9]:
print(f.getvalue())

b'hello,\xe6\x88\x91\xe7\x9a\x84\xe6\x9c\x8b\xe5\x8f\x8b'


In [10]:
f.read()

b''

# OS模块

In [1]:
import os

In [2]:
os.name

'nt'

In [4]:
os.environ

environ({'#ENVTSLOGSSS3088': '3451936', '1830B7BD-F7A3-4C4D-989B-C004DE465EDE': 'c10:4a246a0', 'ALLUSERSPROFILE': 'C:\\ProgramData', 'APPDATA': 'C:\\Users\\admin\\AppData\\Roaming', 'ASL.LOG': 'Destination=file', 'COMMONPROGRAMFILES': 'C:\\Program Files\\Common Files', 'COMMONPROGRAMFILES(X86)': 'C:\\Program Files (x86)\\Common Files', 'COMMONPROGRAMW6432': 'C:\\Program Files\\Common Files', 'COMPUTERNAME': 'ADMIN-PC', 'COMSPEC': 'C:\\windows\\system32\\cmd.exe', 'FP_NO_HOST_CHECK': 'NO', 'HOMEDRIVE': 'C:', 'HOMEPATH': '\\Users\\admin', 'LOCALAPPDATA': 'C:\\Users\\admin\\AppData\\Local', 'LOGONSERVER': '\\\\ADMIN-PC', 'NUMBER_OF_PROCESSORS': '4', 'OS': 'Windows_NT', 'PATH': 'C:\\Users\\admin\\Anaconda3\\Library\\bin;C:\\Users\\admin\\Anaconda3\\Library\\bin;C:\\Users\\admin\\Anaconda3\\Scripts;C:\\Users\\admin\\Anaconda3\\Library\\bin;C:\\ProgramData\\Oracle\\Java\\javapath;C:\\windows\\system32;C:\\windows;C:\\windows\\System32\\Wbem;C:\\windows\\System32\\WindowsPowerShell\\v1.0\\;D:

In [6]:
os.environ.get('PATH')

'C:\\Users\\admin\\Anaconda3\\Library\\bin;C:\\Users\\admin\\Anaconda3\\Library\\bin;C:\\Users\\admin\\Anaconda3\\Scripts;C:\\Users\\admin\\Anaconda3\\Library\\bin;C:\\ProgramData\\Oracle\\Java\\javapath;C:\\windows\\system32;C:\\windows;C:\\windows\\System32\\Wbem;C:\\windows\\System32\\WindowsPowerShell\\v1.0\\;D:\\Program Files\\TortoiseSVN\\bin;C:\\Users\\admin\\Anaconda3;C:\\Users\\admin\\Anaconda3\\Scripts;C:\\Users\\admin\\Anaconda3\\Library\\bin;C:\\Users\\admin\\Anaconda2;C:\\Users\\admin\\Anaconda2\\Scripts;C:\\Users\\admin\\Anaconda2\\Library\\bin;C:\\program files (x86)\\common files\\apple\\apple application support\\'

In [11]:
# 查看当前目录的绝对路径:
os.path.abspath('.')

'D:\\python'

In [12]:
os.mkdir('./testdir')

In [13]:
[x for x in os.listdir('.') if os.path.isdir(x)]

['.ipynb_checkpoints', 'testdir']

合并、拆分路径的函数并不要求目录和文件要真实存在，它们只对字符串进行操作

In [14]:
os.path.join('/smps/lib','mylib')

'/smps/lib\\mylib'

In [15]:
os.path.split('/smps/text/file.txt')

('/smps/text', 'file.txt')

In [16]:
os.path.splitext('/smps/text/file.txt')

('/smps/text/file', '.txt')

In [17]:
[x for x in os.listdir('.') if os.path.isfile(x) and os.path.splitext(x)[1]=='.py']

['hello.py']

# JSON

In [19]:
import json
d = dict(name='Mike',age=22,score=99)
json.dumps(d)

'{"name": "Mike", "age": 22, "score": 99}'

In [36]:
import json,os
d = dict(name='Mike jackson',age=22,score=99)
f = open('./json.txt','w+')
json.dump(d,f)
print( '文件指针位置:%d'%f.tell())
f.seek(0,os.SEEK_SET)
print( '文件指针位置:%d'%f.tell())
print(f.read())
f.close()

文件指针位置:48
文件指针位置:0
{"name": "Mike jackson", "age": 22, "score": 99}


In [37]:
json_str = '{"age": 20, "score": 88, "name": "Bob"}'
json.loads(json_str)

{'age': 20, 'name': 'Bob', 'score': 88}

In [41]:
f = open('./json.txt','r')
json_str = json.load(f)
print(json_str)
f.close()

{'name': 'Mike jackson', 'age': 22, 'score': 99}
