# Чтение данных с помощью numpy

* [Numpy IO](https://numpy.org/doc/stable/reference/routines.io.html)
* `np.loadtxt`/`np.savetxt` --- чтение/запись текстовых данных (альтернатива модулю [csv](https://docs.python.org/3/library/csv.html) и [pandas](https://pandas.pydata.org/))
    * Читает данные сразу в ndarray
    * Настройка конверсии
    * Обрабатывает "плохие" данные
    * Может работать медленнее наивного чтения, проводя лишние проверки хороших данных
* `np.fromfile`/`ndarray.tofile` ---  чтение/запись из текстового/бинарного файла
* `np.load`/`np.save`/`np.savez`/`np.savez_compressed` --- сериализация/десериализация в собственный [NPY формат](https://numpy.org/doc/stable/reference/generated/numpy.lib.format.html#module-numpy.lib.format) (Файлы с расширение `.npy`/`.npz`

In [7]:
import numpy as np

data = np.loadtxt("device_table.csv", skiprows=1, delimiter=",", usecols=[1,2,3,4,5,6,8,9,10,11])

In [8]:
data

array([[4.0000e+03, 6.4000e+04, 2.0000e+03, 1.0000e+01, 1.0000e+00,
        1.0000e+00, 5.0000e+00, 1.0000e+02, 5.0000e+00, 8.0000e+02],
       [4.0000e+03, 6.4000e+04, 2.0000e+03, 1.0000e+01, 1.0000e+00,
        1.0000e+00, 5.0000e+00, 1.0000e+02, 5.0000e+00, 8.0000e+02],
       [3.7200e+03, 5.9519e+04, 6.0000e+03, 2.0000e+01, 1.0000e+00,
        1.0000e+00, 1.0000e+01, 1.0000e+02, 1.0000e+01, 1.5000e+02],
       [3.7200e+03, 5.9519e+04, 6.0000e+03, 2.0000e+01, 1.0000e+00,
        1.0000e+00, 1.0000e+01, 1.0000e+02, 1.0000e+01, 1.5000e+02],
       [4.0000e+03, 6.4000e+04, 2.0000e+03, 1.0000e+01, 1.0000e+00,
        1.0000e+00, 5.0000e+00, 1.0000e+02, 5.0000e+00, 3.0000e+03],
       [4.0000e+03, 6.4000e+04, 2.0000e+03, 1.0000e+01, 1.0000e+00,
        1.0000e+00, 5.0000e+00, 1.0000e+02, 5.0000e+00, 3.0000e+03],
       [4.0000e+03, 6.4000e+04, 2.0000e+03, 5.0000e+00, 1.0000e+00,
        1.0000e+01, 5.3600e-01, 1.0000e+02, 3.0000e+01, 7.5000e+03],
       [4.0000e+03, 6.4000e+04, 2.0000e+0

In [9]:
np.savetxt("numpy.txt", data)

In [17]:
%%time
data = np.loadtxt("numpy.txt")

CPU times: user 1.04 ms, sys: 128 µs, total: 1.16 ms
Wall time: 924 µs


In [18]:
%%time
with open("numpy.txt") as fin:
    result = []
    for line in fin.readlines():
        result.append([float(it) for it in line.split()])

CPU times: user 943 µs, sys: 116 µs, total: 1.06 ms
Wall time: 724 µs


In [15]:
%%timeit
with open("numpy.txt") as fin:
    result = []
    for line in fin.readlines():
        result.append([float(it) for it in line.split()])

60.9 µs ± 267 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


In [16]:
%%timeit
data = np.loadtxt("numpy.txt")

109 µs ± 1.68 µs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)
