# 컴퓨터는 실수를 어떻게 다루는가?<br>How computers handle real numbers?

## 컴퓨터는 자연수를 어떻게 다루는가?<br>How computers handle natural numbers?

* 컴퓨터는 기본적으로 0 또는 1만 다룰 수 있음.<br>Basically, computers are able to handle 0 or 1 only.

* 여기서 **다룰 수 있다**는 것은 기억장치에 저장, 연산, 출력 등을 뜻함.<br>Here, to **handle** means to store in memory, to operate, and to output.

* 0 또는 1 을 다루는 최소 단위는 **비트**라고 함.<br>We call the smallest unit that can handle 0 or 1 a **bit**.

* 어떤 컴퓨터가 예를 들어 32 비트, 64 비트 라고 할 때 이를 기억하기 바람.<br>When we hear about a personal computer is for example 32 bit or 64 bit, please recall this.

* 해당 컴퓨터가 한번에 처리할 수 있는 비트의 수를 뜻함.<br>It means the number of bits that the computer can process at once.

* 더 큰 (자연)수를 다루려면 비트 수가 커야 함.<br>To handle larger (natural) numbers, we need more number of bits.

* 다음 표는 10진수 0 부터 20 까지의 숫자를 2진수와 16진수로 보임.<br>Following table shows decimal numbers from 0 to 20 in binary and hexadecimal.

| 10진수 Decimal | 2진수 Binary | 비트수 no. bits | 바이트수 no. bytes | 16진수 Hexadecimal |
|:--------------:|:------------:|:------------:|:------------:|:-------------------:|
|0|0|1|1|0|
|1|1|1|1|1|
|2|10|2|1|2|
|3|11|2|1|3|
|4|100|3|1|4|
|5|101|3|1|5|
|6|110|3|1|6|
|7|111|3|1|7|
|8|1000|4|1|8|
|9|1001|4|1|9|
|10|1010|4|1|A|
|11|1011|4|1|B|
|12|1100|4|1|C|
|13|1101|4|1|D|
|14|1110|4|1|E|
|15|1111|4|1|F|
|16|10000|5|1|10|
|17|10001|5|1|11|
|18|10010|5|1|12|
|19|10011|5|1|13|
|20|10100|5|1|14|
|127|1111111|7|1|7F|
|128|10000000|8|1|80|
|255|11111111|8|1|FF|
|256|100000000|9|2|100|
|32767|111111111111111|15|2|7FFF|
|32768|1000000000000000|16|2|8000|
|65535|1111111111111111|16|2|FFFF|
|65536|10000000000000000|17|3|10000|
|4294967295|11111111111111111111111111111111|32|4|FFFFFFFF|
|4294967296|100000000000000000000000000000000|33|5|100000000|
|9223372036854775807|111111111111111111111111111111111111111111111111111111111111111|63|8|7FFFFFFFFFFFFFFF|
|9223372036854775808|1000000000000000000000000000000000000000000000000000000000000000|64|8|8000000000000000|
|18446744073709551615|1111111111111111111111111111111111111111111111111111111111111111|64|8|FFFFFFFFFFFFFFFF|
|18446744073709551616|10000000000000000000000000000000000000000000000000000000000000000|65|9|10000000000000000|

(위 표를 만들기 위해 아래 코드를 이용할 수 있음.)<br>(To make the table above, we can use the following code.)

In [None]:
import math

for i in list(range(0, 21)) + [127, 128, 255, 256, 32767, 32768, 65535, 65536, 2**32-1, 2**32, 2**63-1, 2**63, 2**64-1, 2**64, ]:
    d_str = str(i)
    b_str = f"{i:b}"
    n_bits = len(b_str)
    n_bits_str = str(len(b_str))
    h_str = f"{i:X}"
    n_bytes = math.ceil(len(h_str) * 0.5)
    n_bytes_str = str(n_bytes)
    print('|'.join(['', d_str, b_str, n_bits_str, n_bytes_str, h_str, '']))

* 위에서 이진수 4자리가 16진수 한자리에 해당됨을 알 수 있음<br>We can see that one digit of hexadecimal represents four digits of binary.

* 이러한 이유로 흔히 이진수를 예를 들어 `1101 0101`과 같이 4자리씩 표시함.<br>Because of this, frequently we group four digits of a binary number; for example `1101 0101`.

* 이러한 비트를 8개씩 모은 것을 **바이트**라고 함.<br>We call a collection of 8 bits a **byte**.

## 컴퓨터는 음의 정수를 어떻게 다루는가?<br>How computers handle negative integers?

* 기본적으로 컴퓨터는 0과 양의 정수를 다루도록 만들어져 있음.<br>Basically computers are designed to handle 0 and positive integers.

* 음의 정수를 표현하고 다루기 위해 컴퓨터는 음의 정수를 **2의 보수**로 변환함.<br>To represent and handle negative integers, computers convert a negative integer to **2's complement**.

* 두 수 $a$와 $b$가 있을 때, $a+b=2$ 이면 $b$ 는 $a$의 **2의 보수**임.<br>If there are two numbers of $a$ and $b$, and $a+b=2$, $b$ is **2's complement** of $a$.

* 설명을 간단히 하기 위해 8bit 의 경우를 살펴 보겠음.<br>To simplify, we will look at the 8bit case.

* 양의 정수 7은 8bit 이진수로 00000111 로 표시할 수 있음.<br>Positive integer 7 is 00000111 in an 8 bit binary number.

* 2진수 00000111의 2의 보수를 구하기 위해 우선 0을 1로 바꾼 후 1을 더함.<br>To find 2's complement of binary number 00000111, change 0's to 1's and add 1.

* 2진수 00000111 의 2 의 보수는 11111001 이 될 것임.<br>2's complement of binary number 00000111 would be 11111001.

* 두 수를 더하면 다음과 같음.<br>Adding these two numbers would be follows.

In [None]:
a = int('00000111', base=2)
b = int('11111001', base=2)

c = a+b
print(f'c = {c:b}(binary)')
print(f'c = {c:d}(decimal)')
print(f'c = {c:x}(hexadecimal)')


* 위 결과는 10진수로는 256 이지만 2진수로는 `1 0000 0000` 으로, 아래 8 비트는 모두 0임. 8비트 연산의 경우, 이 덧셈의 결과는 0으로 간주함.<br>The result above is 256 in decimal, however, in binary `1 0000 0000` whose lower 8 bits are all zeros. In case of the 8 bit operation, we regard this result as zero.

* 다음 예는 16비트의 경우를 보여줌<br>Following example shows a 16bit example.

In [None]:
a = int('0000''0000''0000''0111', base=2)
b = int('1111''1111''1111''1001', base=2)

c = a+b
print(f'c = {c:b}(binary)')
print(f'c = {c:d}(decimal)')
print(f'c = {c:x}(hexadecimal)')


* 위 결과는 10진수로는 65536 이지만 2진수로는 `1 0000 0000 0000 0000` 으로, 아래 16 비트는 모두 0임.<br>The result above is 65536 in decimal, however, in binary `1 0000 0000 0000 0000` whose lower 16 bits are all zeros.

* 요약하면, 음의 정수는 컴퓨터에서 2의 보수로 다루며, 이는 해당 정수의 절대값의 2진수에서 0과 1을 바꾼 다음 1을 더하여 구함.<br>In summary, computers handle negative intergers as 2's complementary, which we can find by exchanging 0's and 1's of the binary representation of the integer's absolute value and then adding one.

## 컴퓨터는 실수를 어떻게 다루는가?<br>How computers handle real numbers?

### 고정 소숫점<br>Fixed point

* 정수로 표시한 후 일정 값을 곱함<br>We can represent a number in an integer and multiply a fixed number.

* 예를 들어 길이를 모두 cm 단위로 표시한 후 m 단위 값을 구하려면 0.01 을 곱함.<br>For example, we can indicate all lengths in cm units and multipy 0.01 to find values in m units. 

* 그러나 위의 경우, mm 값을 표시하는 것이 곤란할 수 있음.<br>However, in this way, it may not be easy to indicate in mm units.

### 부동 (떠다니는) 소숫점<br>Floating point

* 간단히 말하면 실수는 유효숫자와 지수로 표시함.<br>In short, we can also represent a real number using significand and exponents.

* 예를 들어 $2.3456 \times 10^0$ m 는 cm 단위로는 $2.3456 \times 10^2$, mm 단위로는 $2.3456 \times 10^3$ 으로 표시될 것임.<br>For example, $2.3456 \times 10^0$ m would be $2.3456 \times 10^2$ in cm, and $2.3456 \times 10^3$ in mm.

* 공학용 계산기 가운데는 `2.3456E3` 으로 $2.3456 \times 10^3$ 을 나타내는 것도 있음. 여기서 `2.3456` 은 유효숫자, `3`은 지수임.<br>An engineering calculator may indicate $2.3456 \times 10^3$ as `2.3456E3`. Here, we can see that `2.3456` is the significand and `3` is the exponent.

* 유효숫자는 바뀌지 않더라도 지수 값이 바뀌면 소숫점의 위치가 바뀜.<br>Even if the sigtificand does not change, when the exponent changes, the location of the decimal point changes.

* 반대로 $2.3456 \times 10^0$ mm 는 cm 단위로는 $2.3456 \times 10^{-1}$, m 단위로는 $2.3456 \times 10^{-3}$ 으로 표시될 것임.<br>On the contrary, $2.3456 \times 10^0$ mm would be $2.3456 \times 10^{-1}$ in cm, and $2.3456 \times 10^{-3}$ in m.

* 컴퓨터는 2진수로 저장하며 자세한 내용은 [IEEE 754](https://ko.wikipedia.org/wiki/IEEE_754) 기술 표준을 참고하기 바람.<br>Computers store in binary numbers. For more informaiton, please refer to [IEEE 754, Wikipedia](https://en.wikipedia.org/wiki/IEEE_754).

* 일반적으로 단정도 4바이트 (32비트) 또는 배정도 8바이트 (64비트)로 다루며 $\pm$, 지수부, 유효숫자부로 나눔.<br>Usually we use 4Byte (32bit) single precision or 8Byte (64bit) double precision, which includes $\pm$, exponent, and significand.

* 단정도 32비트는 아래 표와 같이 구성됨.  여기서 `e`는 지수, `s`는 유효숫자를 뜻함.<br>Following table shows the breakout of 32 bits of single precision.  Here, `e` and `s` indicate exponent and sigdificand, respectively.

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32
:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:
$\pm$ | `e` | `e` | `e` | `e` | `e` | `e` | `e` | `e` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s` | `s`

In [None]:
# number of bits
n = 32
ne = 8
ns = n - 1 - ne

print(
    '\n'.join(
        [
            ' | '.join(str(k) for k in range(1, n+1)),
            '|'.join(':---:' for k in range(1, n+1)),
            ' | '.join(['$\pm$'] + ['`e`']*ne + ['`s`']*ns),
        ],
    )
)
