# 读写二进制数据

- 我们需要读写二进制数据，比如图像、声音文件等

## 使用open()函数的rb或者wb模式就可以实现二进制数据的读或者写。

In [1]:
%%writefile test.bin 
Hello
World
!

Overwriting test.bin


In [2]:
with open('test.bin', 'rb') as f:
    data = f.read()
    print(data)

b'Hello\r\nWorld\r\n!'


In [3]:
with open('test.bin', 'wb') as f:
    f.write(b'Hello World!')

## 注意点

## 字节串和文本字符串之间存在着微妙的语义差异

- 在做索引和迭代操作时，字节串会返回代表该字节的整数值而不是字符串

In [4]:
t = 'Hello'
for c in t:
    print(c)

H
e
l
l
o


In [5]:
t = b'Hello'
for c in t:
    print(c)

72
101
108
108
111


In [6]:
with open('test.bin', 'rb') as f:
    data = f.read(16)
    text = data.decode('utf-8')
    print(text)

Hello World!


In [7]:
with open('test.bin', 'wb') as f:
    text = 'Hello World'
    f.write(text.encode('utf-8'))

## 二进制I/O对于像C结构体这样的对象可以直接用来进行写操作，不必先将其转换为byte对象

In [8]:
import array
nums = array.array('i', [1, 2, 3, 4])
with open('data.bin', 'wb') as f:
    f.write(nums)

In [9]:
a = array.array('i', [0, 0, 0, 0, 0, 0, 0, 0])
with open('data.bin', 'rb') as f:
    f.readinto(a)

In [10]:
a

array('i', [1, 2, 3, 4, 0, 0, 0, 0])

- 这种行为可适用于任何实现了所谓的“缓冲区接口”的对象，该对象直接将底层的缓冲区暴露给可以在其上进行的操作。
- 有许多对象还支持直接将二进制数据读入到底层的内存中，只要使用文件对象的readinto()方法就可以了。
- 使用这项技术时需要特别小心，因为这常常是与平台特性相关的。