# バイナリデータの取り扱い
参考：  
* https://izadori.net/python-binaryfile/
* https://tabinou.com/archives/1511
* https://atmarkit.itmedia.co.jp/ait/articles/2105/18/news019.html

## 整数だけの場合

In [100]:
# バイナリデータの書き込み
f = open('input/myfile.dat',mode="wb")
for i in range(32):
    f.write(i.to_bytes(1,"big"))
f.close()

In [101]:
#バイナリデータをテキストデータに変換して書き込み
with open('input/myfile.dat', 'rb') as f:
    binary_data = f.read()

# 1バイトごとにデータを読み取る
integers = [int.from_bytes(binary_data[i:i+1], byteorder='big') for i in range(0, len(binary_data), 1)]

# テキストファイルに書き出す
with open('output.txt', 'w') as f:
    for integer in integers:
        f.write(f"{integer}\n")


### 補足

In [98]:
#  整数を表すバイト列を5バイトで返す。指定するバイト数は元の整数より大きくてもよい。
# little,bigはバイト列の順序。
print((100).to_bytes(5, byteorder='little'))
print((100).to_bytes(5, byteorder='big'))

b'd\x00\x00\x00\x00'
b'\x00\x00\x00\x00d'


In [97]:
# int.from_bytesで指定したバイト列の整数表現を返す。byteorderを間違えないように注意
print(int.from_bytes(b'd\x00\x00\x00\x00', byteorder= 'little'))
print(int.from_bytes(b'\x00\x00\x00\x00d', byteorder= 'big'))

100
100


## 数字の羅列の場合

In [51]:
('aa').encode('utf-8')

b'aa'

In [46]:
# 書き込む元の文字列
numbers = ['10000000000', '2000       ', '300001     ']

In [54]:
# バイナリデータの書き込み
f = open('input/myfile2.dat',"wb")
for number in numbers:
    encode_data = number.encode('utf-8')
    encode_data = number.encode()
    print(encode_data)
    f.write(encode_data)
f.close()

b'10000000000'
b'2000       '
b'300001     '


メモ：  
テキストエディタで文字列を開いて文字化けしているということは、  
元々エンコーディングに指定した文字コードとデコードに使用する文字コードが合っていない可能性がある。

In [53]:
# バイナリデータの読み込み
with open('input/myfile2.dat', 'rb') as f:
    binary_data = f.read()
    # バイナリデータを文字列にデコード
    decoded_string = binary_data.decode('utf-8')  


# テキストファイルに書き出す
with open('output2.txt', 'w') as f:
    f.write(decoded_string)