# I04 Bit và tính toán theo bit (bitwise)

## Mục đích

Trong bài này mình sẽ giới thiệu khái niệm tin học **bit** và việc tính toán theo bit trong Python.


## Bit

Bit là đơn vị thông tin nhỏ nhất được chuyển đi trong máy tính, với chỉ hai giá trị `0` và `1` hay `True` và `False`. Do vậy, chỉ cần một bit để đại diện cho kiểu dữ liệu `bool`, trong khi các dữ liệu số và kí tự sẽ cần nhiều bit hơn. Đơn vị lưu trữ nhỏ nhất trong máy tính là byte (1 byte = 8 bit).

Do lưu trữ chỉ với hai giá trị `0` và `1`, dữ liệu trong máy tính đều số nhị phân (binary). Chẳng hạn, con số 52 trong bộ nhớ thực chất được lưu trữ dưới dạng nhị phân là `110100` ($2^5 \times 1 + 2^4 \times 1 + 2^3 \times 0 + 2^2 \times 1 + 2^1 \times 0 + 2^0 \times 0 = 52$). Python có thể giúp bạn chuyển một giá trị số thập phân về dạng nhị phân bằng hàm `bin()`.

In [1]:
bin(52)

'0b110100'

## Phép toán với bit

Ngoài các phép cộng trừ nhân chia tương đối vô nghĩa khi sử dụng trên bit, có một vài phép toán đặc biệt với bit có ích hơn cho máy tính. Hai nhóm phép toán này bao gồm phép toán luân lý (logical operation) và phép toán dịch bit (bit shifting).

### Phép toán luân lý

#### Toán tử AND (`&`)

Bảng chân lý (truth table) của toán tử này như sau:

`A` | `B` | `A AND B`
----|-----|--------
0 | 0 | 0
0 | 1 | 0
1 | 0 | 0
1 | 1 | 1

Nói cách khác, khi cả A và B đều đúng thì A & B mới đúng.

Trong Python, chúng ta sử dụng toán tử `&` để "AND" hai giá trị luân lý.

In [2]:
a = 1
b = 0

a & b

0

Nếu áp dụng trên các con số, chúng sẽ được thực hiện theo từng bit (bitwise). Hãy xem ví dụ.

In [3]:
a = 53
b = 23

print("{} & {} = {}".format(a, b, a & b))
print("{:08b}\n{:08b}\n{:08b}".format(a, b, a & b))

53 & 23 = 21
00110101
00010111
00010101


Việc tính toán theo bit giúp cho chúng ta có thể lọc bỏ một số bit và giữ lại chỉ một số bit. Chẳng hạn nếu muốn lấy phần dư của phép chia cho 16 (các giá trị từ `0000` (=0) đến `1111` (=15)), chúng ta có thể "tắt" tất cả các bit từ bit 5 trở đi bằng việc "AND" chúng với 0. Kĩ thuật này trong xử lí tín hiệu số gọi là bitmasking.

In [4]:
a = 131004183
a_bin = f"{a:b}"
print(a_bin)
print(f"{15:0{len(a_bin)}b}")
print(f"{a & 15:0{len(a_bin)}b}")
print(a & 15)

111110011101111011100010111
000000000000000000000001111
000000000000000000000000111
7


#### Toán tử OR (`|`)

Bảng chân lý (truth table) của toán tử này như sau:

`A` | `B` | `A OR B`
----|-----|--------
0 | 0 | 0
0 | 1 | 1
1 | 0 | 1
1 | 1 | 1

Nói cách khác, khi cả A và B đều sai thì A & B mới sai.

Trong Python, chúng ta sử dụng toán tử `|` để "OR" hai giá trị luân lý.

In [5]:
a = 1
b = 0

a | b

1

Toán tử `|` cũng thực hiện bitwise, và chúng ta có thể dùng chúng để bitmasking. Chẳng hạn chúng ta có thể "bật" tất cả các bit dưới bit 5 bằng cách "OR" chúng với bit 1.

In [6]:
a = 215
a_bin = f"{a:b}"
print(a_bin)
print(f"{15:0{len(a_bin)}b}")
print(f"{a|15:0{len(a_bin)}b}")
print(a | 15)

11010111
00001111
11011111
223


#### Toán tử XOR (`^`)

Bảng chân lý (truth table) của toán tử này như sau:

`A` | `B` | `A XOR B`
----|-----|--------
0 | 0 | 0
0 | 1 | 1
1 | 0 | 1
1 | 1 | 0

Nói cách khác, khi cả A và B giống nhau thì A & B sẽ sai.

Trong Python, chúng ta sử dụng toán tử `^` để "XOR" hai giá trị luân lý.

In [7]:
a = 1
b = 0

a ^ b

1

Toán tử `^` cũng thực hiện bitwise, và chúng ta có thể dùng chúng để đảo ngược các bit bằng cách "XOR" chúng với bit 1.

In [8]:
a = 215
a_bin = f"{a:b}"
print(a_bin)
print(f"{15:0{len(a_bin)}b}")
print(f"{a^15:0{len(a_bin)}b}")
print(a ^ 15)

11010111
00001111
11011000
216


Ngoài ra, Python còn toán tử NOT (`~`) dùng để đảo ngược toàn bộ các bit nhưng chúng ta sẽ không sử dụng ở đây.

### Phép toán dịch bit

Python có hai phép toán để dịch sang phải k bit (dịch 1 bit tương đương chia 2 lấy phần nguyên) và dịch sang trái k bit (dịch 1 bit tương đương nhân với 2).

In [9]:
a = 19
print(a, a >> 1, a << 1)
print(f"{a:6b}\n{a >> 1:6b}\n{a << 1:6b}")

19 9 38
 10011
  1001
100110


## Luyện tập

*Binary gap*: Cho một số tự nhiên N viết dưới dạng nhị phân. Tìm độ dài lớn nhất của binary gap (chuỗi chữ số 0 liên tiếp nằm giữa hai chữ số 1) của số này.

Ví dụ: Số 0b100010010000 (N = 2192) thì gap có độ dài lớn nhất là 3 (mặc dù ở cuối có 4 chữ số liên tiếp nhưng chúng không nằm giữa hai chữ số 1).

Bạn hãy suy nghĩ trước khi xem code và giải thích nhé.

In [10]:
def max_binary_gap(N):
    print(N, f"{N:b}")

    while N & 1 == 0:
        N = N >> 1
    
    max_gap = 0
    cur_gap = 0

    while N > 0:
        if N & 1 == 1:
            if cur_gap > 0:
                max_gap = max(cur_gap, max_gap)
                cur_gap = 0
        else:
            cur_gap += 1
        N = N >> 1
    
    return max_gap

max_binary_gap(2192)

2192 100010010000


3

Trong hàm `max_binary_gap()` ở trên, chúng ta thực hiện các công việc sau:

Loại bỏ những chữ số 0 ở cuối chuỗi nhị phân. Cách làm đơn giản là dịch bit sang phải cho đến khi chữ số cuối cùng là chữ số 1. Để kiểm tra điều kiện chữ số cuối cùng là chữ số 1, chúng ta sẽ dùng bitmasking với toán tử "AND" để mask tất cả các chữ số khác.

```python
    while N & 1 == 0:
        N = N >> 1
```

Sau đó, chúng ta tiến hành đếm số chữ số 0 nằm giữa các chữ số 1. Thuật toán của vòng lặp như sau:

1. Nếu chữ số cuối cùng là 1: nếu số chữ số 0 đang đếm hiện tại (`cur_gap`) lớn hơn 0 (nghĩa là trước đó đã gặp một chữ số 1 và bắt đầu đếm các chữ số 0) thì binary gap kết thúc, do đó chúng ta dừng đếm chữ số 0, so sánh với `max_gap`, nếu lớn hơn `max_gap` thì cập nhật giá trị trong `max_gap`.

```python
        if N & 1 == 1:
            if cur_gap > 0:
                max_gap = max(cur_gap, max_gap)
                cur_gap = 0
```

2. Nếu chữ số cuối cùng là 0: tăng số chữ số 0 trong binary gap hiện tại (`cur_gap`) lên 1.

```python
        else:
            cur_gap += 1
```

3. Dịch sang phải 1 bit. Lặp cho đến khi N = 0 (đã dịch hết các bit).

```python
    while N > 0:
        # ...
        N = N >> 1
```

Một giải pháp khác không dùng xử lí bit.

In [11]:
def max_binary_gap(N):
    print(N, f"{N:b}")

    while N % 2 == 0:
        N = N // 2
    
    max_gap = 0
    cur_gap = 0

    while N > 0:
        if N % 2 == 1:
            if cur_gap > 0:
                max_gap = max(cur_gap, max_gap)
                cur_gap = 0
        else:
            cur_gap += 1
        N = N // 2
    
    return max_gap

max_binary_gap(2192)

2192 100010010000


3

---

[Bài trước](./03_yield.ipynb) - [Danh sách bài](../README.md) - [Bài sau]()