# Как открыть и прочитать данные из бинарных файлов?

Иногда приходится работать с бинарными или двоичными файлами. В файле могут содержаться данные как одной так и нескольких переменных, которые зависят от широты, долготы, высоты и времени. 
Их отличие от nc файлов, что в файле не хранится дополнительная информация о форме массива. В этом случае нужно уточнять у создателя данного файла в какой форме сохранялись данные. 

Например - 'phi.dx' - в файле хранятся данные о геопотенциальной высоте
- разрешение по долготе - 5.625 (Nlon = 64)
- разрешение по широте - 5 (Nlat = 36)
- разрешение по высоте - 2.8 (Nlev = 56)
- по времени - 2 часа (Ntime = 1200)

По этой ссылке можно получить дополнительную информацию о примерах работы с бинарными файлами.
https://www.bestprog.net/ru/2020/04/30/python-binary-files-examples-of-working-with-binary-files-ru/#q01

Моя задача, показать как работать с многомерными массивами, с которыми нам часто приходится иметь дело при анализе и визуализации. 


In [2]:
import numpy as np

#импортируем модуль array для работы с массивами
import array

# Открыть бинарный файл для чтения
fileobj = open('phi.dx', mode='rb')

# Параметры пространственной сетки
Nlon = 64
Nlat = 36
Nlev = 56

# Количество точек по времени
Ntime = 1200

# Создаем пустой массив с определенным типом данных 'f'- вещественное число, выделено 4 байта для записи числа
binvalues = array.array('f')

# Читаем Nlon*Nlat*Nlev*Ntime количество значений из файла 'fileobj'
# и добавляем их в конец пустого массива binvalues. Если  в файле хранится меньше чем Nlon*Nlat*Nlev*Ntime
# значений, то возникнет ошибка EOFError, но при этом в массив запишется распологаемое количество элементов.
binvalues.fromfile(fileobj, Nlon*Nlat*Nlev*Ntime)

# binvalues представляет собой список значений длинной Nlon*Nlat*Nlev*Ntime
# создадим numpy array из этого списка 
var_array_flat = np.array(binvalues, float)

# преобразуем его в 4-х мерный массив
# ФОРМА var_array_4d будет зависеть от ФОРМЫ записи сохраненных данных в файле phi.dx 
# Я знаю, что данные были записаны в такой форме (Nlon,Nlat,Nlev) в цикле по времени.
# Чтобы корректно их преобразовать нужно передать размерности в следующей последовательности (Ntime, Nlev, Nlat, Nlon)
var_array_4d = np.reshape(var_array_flat, (Ntime, Nlev, Nlat, Nlon))

#закрываем файл
fileobj.close()
print(var_array_4d.shape)


(1200, 56, 36, 64)
