# 数组读写

## 从文本中读取数组

In [2]:
import numpy as np

## Numpy 二进制格式

数组可以储存成二进制格式，单个的数组保存为 `.npy` 格式，多个数组保存为多个`.npy`文件组成的 `.npz` 格式，每个 `.npy` 文件包含一个数组。

与文本格式不同，二进制格式保存了数组的 `shape, dtype` 信息，以便完全重构出保存的数组。

保存的方法：

- `save(file, arr)` 保存单个数组，`.npy` 格式
- `savez(file, *args, **kwds)` 保存多个数组，无压缩的 `.npz` 格式
- `savez_compressed(file, *args, **kwds)` 保存多个数组，有压缩的 `.npz` 格式

读取的方法：

- `load(file, mmap_mode=None)` 对于 `.npy`，返回保存的数组，对于 `.npz`，返回一个名称-数组对组成的字典。

### 单个数组的读写

In [2]:
a = np.array([[1.0,2.0], [3.0,4.0]])

fname = 'afile.npy'
np.save(fname, a)

In [3]:
aa = np.load(fname)
aa

array([[1., 2.],
       [3., 4.]])

### 保存多个数组

In [7]:
a = np.array([[1.0,2.0], 
              [3.0,4.0]])
b = np.arange(1000)

保存多个数组：

In [8]:
np.savez('data.npz', a=a, b=b)

载入数据：

In [7]:
data = np.load('data.npz')

载入后可以像字典一样进行操作：

In [8]:
data.keys()

KeysView(<numpy.lib.npyio.NpzFile object at 0x0000021262CD76D8>)

In [9]:
data['a']

array([[1., 2.],
       [3., 4.]])

In [10]:
data['b'].shape

(1000,)

### *压缩文件

当数据比较整齐时：

In [11]:
a = np.arange(20000.)

无压缩大小：

In [12]:
np.savez('a.npz', a=a)
import os
os.stat('a.npz').st_size

160256

有压缩大小：

In [13]:
np.savez_compressed('a2.npz', a=a)
os.stat('a2.npz').st_size

26908

大约有 6x 的压缩效果。

当数据比较混乱时：

In [14]:
a = np.random.rand(20000)

无压缩大小：

In [15]:
np.savez('a.npz', a=a)
os.stat('a.npz').st_size

160256

有压缩大小：

In [16]:
np.savez_compressed('a2.npz', a=a)
os.stat('a2.npz').st_size

151123

只有大约 1.06x 的压缩效果。

In [17]:
os.remove('a.npz')
os.remove('a2.npz')