22-Input and Output 之三
====

Raw binary files
---


| Raw   binary files                  |                                                          |
| ----------------------------------- | -------------------------------------------------------- |
| fromfile(file[, dtype, count, sep]) | Construct   an array from data in a text or binary file. |
| ndarray.tofile(fid[, sep, format])  | Write   array to a file as text or binary (default).     |

# numpy.fromfile
`numpy.fromfile(file, dtype=float, count=-1, sep='')`

根据文本或二进制文件中的数据构造数组。

一种使用已知数据类型读取二进制数据的高效方法，以及解析简单格式化的文本文件。使用tofile方法写入的数据 可以使用此函数读取。

## Parameters:	
**file** : file or str

打开文件对象或文件名。

**dtype** : data-type

返回数组的数据类型。对于二进制文件，它用于确定文件中项目的大小和字节顺序。

**count** : int

要读取的项目数。-1表示所有项目（即完整文件）。

**sep** : str

如果文件是文本文件，则在项目之间分隔。空（“”）分隔符表示该文件应被视为二进制文件。分隔符中的空格（“”）匹配零个或多个空格字符。仅包含空格的分隔符必须至少匹配一个空格。

**注意：**

不要依赖于tofile和fromfile数据存储的组合，因为生成的二进制文件不是平台无关的。特别是，不保存字节顺序或数据类型信息。可以用save和load替代，使数据以独立于平台的.npy格式存储。

## 示例

构建一个ndarray：

In [120]:
import numpy as np
dt = np.dtype([('time', [('min', int), ('sec', int)]),
               ('temp', float)])
x = np.zeros((1,), dtype=dt)
x['time']['min'] = 10; x['temp'] = 98.25
x

array([((10, 0), 98.25)],
      dtype=[('time', [('min', '<i4'), ('sec', '<i4')]), ('temp', '<f8')])

将原始数据保存到磁盘：

In [121]:
from tempfile import TemporaryFile
import os
fname = TemporaryFile()
x.tofile(fname)
fname.name

'C:\\Users\\Fan\\AppData\\Local\\Temp\\tmpejbttsbf'

In [122]:
np.fromfile(fname, dtype=dt)

array([],
      dtype=[('time', [('min', '<i4'), ('sec', '<i4')]), ('temp', '<f8')])

建议的存储和加载数据的方法：

In [123]:
>>> np.save(fname, x)
>>> np.load(fname + '.npy')

TypeError: unsupported operand type(s) for +: '_TemporaryFileWrapper' and 'str'

# umpy.ndarray.tofile
`ndarray.tofile(fid, sep="", format="%s")`

将数组作为文本或二进制写入文件（默认）。

数据始终以“C”顺序写入，与a的顺序无关。可以使用fromfile（）函数恢复此方法生成的数据。

## Parameters:	
**fid** : file or str

打开的文件对象或包含文件名的字符串。

**sep** : str

用于文本输出的数组项之间的分隔符。如果“”（空），则写入二进制文件，相当于 `file.write(a.tobytes())`。

**format** : str

文本文件输出的格式字符串。通过首先将数组转换为最接近的Python类型，然后使用“format”％item，将数组中的每个条目格式化为文本。

**注意：**

这是一种便于快速存储阵列数据的功能。字节顺序和精度的信息会丢失，因此对于要在具有不同字节顺序的计算机之间存档数据或传输数据文件，此方法不是一个好的选择。通过以速度和文件大小为代价输出数据作为文本文件，可以克服其中一些问题。

当fid是文件对象时，数组内容将直接写入文件，绕过文件对象的write方法。因此，tofile不能与支持压缩的文件对象（例如，GzipFile）或不支持的文件类对象`fileno()`（例如，BytesIO）一起使用。