In [1]:
###########################################
# バイナリ
###########################################

In [2]:
# バイト列
# Python3は0 - 255までの値を取る8ビットの整数(16進数)の2種類のシーケンスが存在する
# 1) bytes : イミュータブルで、バイトのタプルのようなデータ型
# 2) bytearray : ミュータブルで、バイトのリストのようなデータ型

In [5]:
# bytes
# バイト列は「\x00」という形で表す。(00は16進数)
blist = [1,2,3,255]
the_bytes = bytes(blist)
print(the_bytes)

# bytesはイミュータブルなシーケンスなので値を書き換えることはできない
the_bytes[1] = 127

b'\x01\x02\x03\xff'


TypeError: 'bytes' object does not support item assignment

In [6]:
# bytearray
the_byte_array = bytearray(blist)
print(the_byte_array)

# bytearrayはミュータブルなシーケンスなので書き換え可能
the_byte_array[1] = 127
print(the_byte_array)

bytearray(b'\x01\x02\x03\xff')
bytearray(b'\x01\x7f\x03\xff')


In [9]:
### bytes, bytearrayデータの表示
# 印字不可能なバイトについては\x00形式を使い、印字可能なバイトについてはASCII文字を表示する。
# ASCII文字が表示されるからと言っても、これらは文字ではなく、8ビットの数字である
the_bytes = bytes(range(0, 256))
the_byte_array = bytearray(range(0, 256))

print(the_bytes, end="\n\n")
print(the_byte_array)

b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`abcdefghijklmnopqrstuvwxyz{|}~\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff'

bytearray(b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`abcdefghijklmnopqrstuvwxyz{|}~\x7f\x80\x81\x82\x83\x84\x85\

In [12]:
### バイナリデータの変換
# =========================================
# struct.unpack(書式指定, binary_data)
# バイナリデータを指定された書式指定にしたがって変換する
# param : 書式指定 - 後述, binary_data - bytes型のデータ
# return : int
import struct
data = b"\x00\x00\x00\x9a\x00\x00\x00\x8d"
width, height = struct.unpack(">LL", data)
print(width, height)

154 141


In [15]:
# struct.pack(書式指定, int)
# 整数を指定された書式指定にしたがってバイナリデータに変換する
# param : 書式指定 - 後述, int - int型
# return : bytes型
data = 1234
print(struct.pack(">L", data))
print(struct.pack("<L", data))

b'\x00\x00\x04\xd2'
b'\xd2\x04\x00\x00'


### エンディアン指定子
|指定子|バイト順|
|:--|:--|
|<|リトルエンディアン|
|>|ビッグエンディアン|

### 書式指定子
|指定子|説明|バイト数|
|:--|:--|:--|
|x|1バイト読み飛ばし|1|
|b|符号付きバイト|1|
|B|符号なしバイト|1|
|h|符号付き短整数|2|
|H|符号なし短整数|2|
|i|符号付き整数|4|
|I|符号なし整数|4|
|l|符号付き長整数|4|
|L|符号なし長整数|4|
|Q|符号なし長長整数|8|
|f|単精度浮動小数点数|4|
|d|倍精度浮動小数点数|8|
|p|countと文字シーケンス|1 + count|
|s|文字シーケンス|count|

In [24]:
print(struct.unpack(">5s", b"\x70\x71\x72\x73\x74"))
data = b"\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR\x00\x00\x00\x9a\x00\x00\x00\x8d\08\02\x00\x00\x00"
print(struct.unpack(">16x2L6x", data))

(b'pqrst',)
(154, 141)


In [28]:
# binascii.hexlify(bytes) binascii.unhexlify(bytes)
# text : pythonのbytesの表示(\x00とASCIIの混合)を16進値のシーケンスに変換する。また、その逆
# param : bytes型
# return : bytes型
import binascii
print(binascii.hexlify(b"\x89PNG\r\n\x1a\n"))

# 逆
print(binascii.unhexlify(b'89504e470d0a1a0a'))

b'89504e470d0a1a0a'
b'\x89PNG\r\n\x1a\n'


In [44]:
# ビット演算子
# =======================
# a & b : aとb両方にセットされているビットを返す(AND)
# a | b : aとbどちらかにセットされているビットを返す(OR)
# a ^ b : aとbどちらかひとつだけにのみセットされているビットを返す(XOR)
# ~a : ビット反転
# a << num : 左にnumビットシフト(1ビット左にシフトは、掛ける2と同じ)
# a >> num : 右にnumビットシフト(1ビット右にシフトは、小数点なしの割り算と同じ)
print("5 = {}\n1 = {}".format(bin(5), bin(1)), end="\n\n")
a = 5
b = 1
print(a & b, bin(a&b))
print(a | b, bin(a|b))
print(a ^ b, bin(a^b))
print(~a, bin(~a))
print(a << 1, bin(a << 1))
print(a >> 1, bin(a >> 1))

5 = 0b101
1 = 0b1

1 0b1
5 0b101
4 0b100
-6 -0b110
10 0b1010
2 0b10


2