# 问题

- 你想读写二进制文件，比如图片，声音文件等等。

## 解决方案

- 使用模式为rb 或wb 的open() 函数来读取或写入二进制数据。比如：

In [4]:
with open('bin.bin', 'rb') as f:
    data = f.read()
    
print(data)

with open('bin.bin', 'ab') as f:
    f.write(b'Hello World')
    
with open('bin.bin', 'rb') as f:
    data = f.read()
    
print(data)

b'1111111111000000222222220aaa\r\nHello WorldHello World'
b'1111111111000000222222220aaa\r\nHello WorldHello WorldHello World'


- 在读取二进制数据时，需要指明的是所有返回的数据都是字节字符串格式的，而不是文本字符串。类似的，在写入的时候，必须保证参数是以字节形式对外暴露数据的对象(比如字节字符串，字节数组对象等)。

## 讨论

- 在读取二进制数据的时候，字节字符串和文本字符串的语义差异可能会导致一个潜在的陷阱。特别需要注意的是，索引和迭代动作返回的是字节的值而不是字节字符串。比如：

In [9]:
str1 = 'Hello World'
print(str1[0])

str2 = b'Hello World'
print(str2[0])

for i in str2:
    print(i, end=" ")

H
72
72 101 108 108 111 32 87 111 114 108 100 

- 如果你想从二进制模式的文件中读取或写入文本数据，必须确保要进行解码和编码操作。

- 二进制I/O 还有一个鲜为人知的特性就是数组和C 结构体类型能直接被写入，而不需要中间转换为自己对象。比如：

In [11]:
import array

nums = array.array('i', [1, 2, 3, 4])

with open('bin.bin', 'wb') as f:
    f.write(nums)

- 这个适用于任何实现了被称之为”缓冲接口”的对象，这种对象会直接暴露其底层的内存缓冲区给能处理它的操作。二进制数据的写入就是这类操作之一。
- 很多对象还允许通过使用文件对象的readinto() 方法直接读取二进制数据到其底层的内存中去。比如：

In [14]:
import array

a = array.array('i', [0, 0, 0, 0, 0])

with open('bin.bin', 'rb') as f:
    f.readinto(a)
    
print(a)

with open('bin.bin', 'rb') as f:
    data = f.read()
    
print(data)

array('i', [1, 2, 3, 4, 0])
b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00\x04\x00\x00\x00'
