# ビット演算及び bit全探索

# はじめに

この文書では、基本的なビット演算と、bit全探索 (brute force with bitmask) と呼ばれる手法について解説する。

ビット演算というと身構えてしまうが、その内容自体は非常に簡単なものだ。もっとも、簡単といっても、その利用法は非常に奥深い。考えてみれば、コンピュータ内の演算は、全てこのビット演算を元にしているわけでもあるから、奥深いのは当たり前ではある。

とはいえ、競技プログラミング、特に初級においてはそこまで難しいものは必要ない。ごく基礎的な話と、よく使う演算をいくつか紹介するに留める。

ビット演算の基礎が終わったところで、次に bit全探索と呼ばれる全探索の手法を説明する。この手法は、必須というわけではないが、知っていると非常に楽に書ける。初めて見る人にとっては何が起こってるかよく分からないと思うので、なるべく順を追って平易に書いてみようと思う。

# ビット演算

## そもそもビットって何？

コンピュータが、内部的には 0 と 1 で全てを表しているという話は、どこかで聞いたことがあるだろう。その最小単位、つまり 0 もしくは 1 となる一つ分の場所のことを、```ビット``` (bit) と呼ぶ。また、このビットの並びのことを ```ビット列``` と呼ぶ。

1ビットで表すことができる状態は、当然 1 or 0 の二通りである。2ビットになると 00, 01, 10, 11 の四通りの状態を表せる。  
このように、一般的に $n$ビットのビット列が表すことができるのは、$2^n$ 通りの状態ということになる。

ビットの情報を書き起こすときには、いちいち 1001101 ……などと書くのが面倒なので、通常は 4ビット、あるいは8ビットごとにまとめて書くことが多い。4 ビットの情報では、$2^4=16$ 通りの状態を表すことができる。そこで用いられるのが、16進数というわけだ。

4ビットの情報を、順に書くと 0000 / 0001 / 0010 / 0011 / 0100 / 0101 / 0110 / 0111 / 1000 / 1001 / 1010 / 1011 / 1100 / 1101 / 1110 / 1111 の16種類だ。これを二進数としてみた時、それぞれの（十進数としての）値は 0 ～ 15 となる。16進数表記では、10 ～ 15 の数は A ～ F のアルファベットとして表される。つまり、それぞれが 16進数が 0 ～ F となる。

仮に 8ビット分の情報が FF だとしたとき、これはビットで書き下すと 11111111 であり、十進数としての解釈は 255 ということになる。

これらの数値の混同を避けるため、一般的に二進数なら頭に ```0b``` 、16進数なら頭に ```0x``` とつけて数値を書く。2021年現在、僕のTwitterプロフィールには「0x20代」と書いてあるが、これは十進数でいうところの「32～47歳」の意味になる。自分で書いてて少し虚しくなってきた。

ちなみに、8ビットのことを 1バイト (byte) と呼ぶ。メモリ容量などで使われる単位は、ここから来ている。

## プログラム上のビット表現

プログラム上は、ビット列は整数によって表現する。例えば数値で 42 と書けば、これは二進数では 0b101010 となるので、```101010``` というビット列と同じとみなされる。もっと言うと、プログラム上ではビット列と整数とは同値であり、基本的には区別されない。

整数からビット列を取得するためには、```bin()``` を用いるのが簡単だろう。```bin()``` は、与えられた整数を二進数表現にした文字列を返す関数だ。

In [2]:
print(bin(42))

0b101010


逆にビット列から整数を得るには、頭に ```0b``` をつけた数値表現を使用するか、```int()``` の引数に二進数の文字列を引き渡し、2つ目の引数（何進数なのかを指定できる）に ```2``` を指定してやるといい。与えられた文字列を二進数として解釈して、数値を戻してくれる。

In [4]:
print(0b101010)
print(int('101010', 2))

42
42


少しややこしいというか、Pythonにおいて独特の表現になっているのが、負数の表現である。

これには、まずは C / C++ などにおける、つまり一般的な負数の表現方法を知る必要がある。

一般的には、整数の値を保持するときには、その保存できるサイズが決まっている。現在では多くが 32ビット、もしくは 64ビットとなっている。ここでは、仮に 8ビットとしておく。

8ビットの表現は、00000000 ～ 11111111 の256通りとなる。

さて、ここで少し考えてみてほしいのだが、十進数の 0 は、```00000000``` となるわけだが、-1 はどのように表現すればいいだろうか？  
実は、一般的には ```11111111``` と表現される。つまり、存在しない桁の数字 ```100000000``` から引くようなイメージである。これは $2^n$ から引いた数（補数）になるわけで、「2の補数表現」とも呼ばれる。

そして -2 は 11111110、-3 は 11111101 という具合に減っていくのだが、どこかに正負の数の境目を作る必要がある。これを、一番最初のビットで表すことになっている。一番最初のビットが 1 なら負数、0 なら正数の扱いということになる。

よって、8ビット整数の表現範囲は、実際には 10000000 (-128) ～ 01111111 (127) ということになる。

ちなみに、これはいわゆる符号付き整数 (signed int) と呼ばれる表現であって、符号なし整数 (unsigned int) と呼ばれる表現もある。これは負数を表すことはできない整数で、8ビット符号なし整数の範囲なら 00000000 (0) ～ 11111111 (255) となる。

以上を踏まえると、負数をビット表現に変換した場合は、最初の方のビットが 1 で埋まった表現となる……のだが、Python においては少し勝手が違う。

なぜなら、Python の整数は標準で上限が無いようになっているからだ。厳密には、内部的な上限は存在はしているのだが、演算結果に応じて動的に上限を変化させる仕組みとなっている。よって、正確な負数のビット表現を行えない。実際に負数を ```bin()``` で見てみよう。

In [7]:
print(bin(-42))

-0b101010


と、このように正数の表現の前に ```-``` がついたような表現となる。ただ、これは上記理由から生じる便宜的なものであって、実際に演算で使用されるビット列は、2の補数表現となっている。内部的な表現を、16ビット上限として確認してみると、以下のようになる。

In [16]:
print(bin(0xFFFF & -42))

0b1111111111010110


この ```0xFFFF``` は 16進数表現で、二進数なら 0b1111111111111111 のことである。  
```0xFFFF``` と ```-42``` が二項演算子 ```&``` で演算された結果、共通で 1 を持っている部分だけが取り出される。その結果が、ご覧の表現というわけだ。

……分かるような分からないような……？
ここでは、とりあえず負数も内部的には C / C++ と同じような 2の補数表現を勝手にサイズを合わせて使ってくれている、とだけ理解しておけばOKだ。

では、改めてこの ```&``` も含めた、ビット演算の話を始めよう。

## ビット演算とは

ビット演算とは、ビット列同士の演算のことである。

少し上の方で、プログラム上は整数値とビット列とは区別されないと述べた。よって、ビット列をビット列として演算を行う時は、専用の演算子を用いることで、それを示すことになる。

ビット演算子は以下の 6種類ある。

- ```&``` 論理積 (and)
- ```|``` 論理和 (or)
- ```^``` 排他的論理和 (xor)
- ```~``` 否定 (not)
- ```>>``` 右シフト
- ```<<``` 左シフト

最初の三つ、```&``` ```|``` ```^``` については二項演算子なので、実際に動作を確認してみよう。  
以下、ビット列 ```0011``` と ```0101``` に対して演算した結果を示すプログラムを実行してみた。

In [29]:
a = 0b0011
b = 0b0101
# :04b により、二進数 4桁 0埋め で出力
print(f'{a:04b} :a')
print(f'{b:04b} :b')
print()
print(f'{a & b:04b} - a & b (and)')
print(f'{a | b:04b} - a | b (or)')
print(f'{a ^ b:04b} - a ^ b (xor)')

0011 :a
0101 :b

0001 - a & b (and)
0111 - a | b (or)
0110 - a ^ b (xor)


ビット演算において最も重要なのは、各桁独立で演算が行われるということだ。繰り上がりや繰り下がりなど、隣の桁に影響が及ぶことは無い。  
従って、縦方向に見てもらうと、下の桁からそれぞれ (1, 1), (1, 0), (0, 1), (0, 0) の演算となっている。

```&``` (and) と ```|``` (or) については、論理演算と同じ動きなので、直感的に分かりやすい。

初心者が悩みがちなのが ```^``` (xor) の動作だ。