# Числовые типы

В математике существует следующие множества чисел: целые, рациональные, вещественные, комплексные числа. Каждому из типов в языке программирования Python соответствует тип данных:
* логические переменные (`bool`)
* целые (`int`)
* рациональные (`fraction.Fraction`)
* вещественные (`float`, `decimal.Decimal`)
* комплексные (`complex`)

# Целочисленный тип (int)

В отличии от многих языков, в Python в переменные типа `int` можно записывать большие числа. Их размер ограничивается доступной оперативной памяти компьютера:

In [20]:
x = 16 ** 50 # 16 в 50 степени
y = 100_000_000_000_000_000 # для лучшей читаемости можно использовать нижнее подчёркивание при написании чисел
print(x)
print(y)

1606938044258990275541962092341162602522202993782792835301376
100000000000000000


Под хранение значения может отводиться 4, 8, 12... байт. Очевидно, что если получаемое число велико, то операции над ними будут занимать больше времени.

На данный момент под хранение объекта со значением 0 требуется 24 байта памяти:

In [21]:
import sys

print(sys.getsizeof(0))

24


Откуда берётся такое значение? Всё в Python является объектами. Каждый из объектов хранит некоторую дополнительную информацию. Этим и обусловлены большие затраты даже для хранения маленьких значений.

Можно заметить, что количество памяти при увеличении размера увеличивается на 4 байта (хотя для хранения каждого последующего значения требуется на 2 байта больше памяти):

In [22]:
t = 1
for x in range(8, 100, 16):
    print(sys.getsizeof(t << x), end=' ')

28 28 32 32 36 36 

# Операции над целыми

Над целыми определены операции сложения (`+`), вычитания (`-`), умножения (`*`), деления (`/`), деления с округлением вниз (floor division) (`//`), взятия остатка от целочисленного деления (modulo) (`%`), возведение в степень (`**`). Операции интуитивно понятны. Наибольшую сложность вызывают операции, производящие деление. Отметьте для себя тот факт, что в результате деления получаются результаты разных типов:

In [23]:
v1 = 155 / 4
print(v1, type(v1))  # вещественное деление, как на калькуляторе
v2 = 155 // 4
print(v2, type(v2))  # целочисленное деление (как в начальной школе: получаем 38 и 3 в остатке)
v3 = 155 % 4
print(v3, type(v3))

38.75 <class 'float'>
38 <class 'int'>
3 <class 'int'>


Пусть рассматривается число $n$ и число $d$, на которое производится деление числа $n$. Операции деление с округлением вниз и остаток от деления связаны тождеством:
$$n = d * (n\,//\,d) + (n\,\%\,d)$$

Важно отметить, как деление с округлением вниз работает в отрицательными значениями. Будет ошибочно говорить, что это простое деление, при котором откидывается вещественная часть:

In [24]:
print(7 // 4)   # -> 1.75 -> 1   (выполнено округление вниз)
print(-7 // 4)  # -> -1.75 -> -2 (выполнено округление вниз)

1
-2


Таким образом, ошибочно говорить, что деление с округлением вниз это то же самое, что и целочисленное деление (если бы оно работало как целочисленное деление во многих языках, то в результате целочисленного деления значения -7 на 4 получалось бы значение 1).

In [25]:
for n in [13, -13]:
    for d in [4, -4]:
        print(f"{n} // {d} = {n // d}")
        print(f"{n} % {d} = {n % d}")
        print(f"n = d * (n // d) + (n % d) = "
              f"{d} * ({n} // {d}) + ({n} % {d}) = {d} * {(n // d)} + {(n % d)}")
        print()

13 // 4 = 3
13 % 4 = 1
n = d * (n // d) + (n % d) = 4 * (13 // 4) + (13 % 4) = 4 * 3 + 1

13 // -4 = -4
13 % -4 = -3
n = d * (n // d) + (n % d) = -4 * (13 // -4) + (13 % -4) = -4 * -4 + -3

-13 // 4 = -4
-13 % 4 = 3
n = d * (n // d) + (n % d) = 4 * (-13 // 4) + (-13 % 4) = 4 * -4 + 3

-13 // -4 = 3
-13 % -4 = -1
n = d * (n // d) + (n % d) = -4 * (-13 // -4) + (-13 % -4) = -4 * 3 + -1



## Конструкторы целых чисел

**Конструктор** -- специальная функция, которая требуется для того, чтобы создать объект определенного класса

In [26]:
a = int(10)
print(a)

10


In [27]:
a = int(-10.5)  # вещественная часть откидывается
print(a)

-10


Значения "истина" и "ложь" трактуются как 1 и 0:

In [28]:
print(int(True), int(False))

1 0


Eсли строка может быть преобразована в целое число, происходит такое преобразование:

In [29]:
print(int("10"))
# print(int("10.0")) -> ошибка, так как в строке записано нецелое

10


Eсли целое считывается из строки, в качестве второго параметра для конструктора целых чисел можно указать основание системы счисления:

In [30]:
print(int("101010", 2))  # 101010_2 -> 42
print(int("A1", 16))     # A1_16 -> 161

42
161


Получение строки, в которой записано число в двоичном, восьмеричном, шестнадцатеричном представлении


In [31]:
print(bin(42), oct(42), hex(42))

0b101010 0o52 0x2a


При необходимости перевода в другие системы счисления можно написать свою функцию:

In [32]:
import string


def to_base(n, base):
    if n == 0:
        return 0
    elif n < 0 or base < 2 or base > 10 + 26:  # 10 цифр + 26 букв английского алфавита
        raise ValueError

    digits = []
    while n != 0:
        digit = n % base
        digits.append(digit)
        n //= base

    digits = digits[::-1]
    digits_list = string.digits + string.ascii_uppercase

    return "".join([digits_list[x] for x in digits])


print(to_base(42, 2), to_base(42, 3), to_base(42, 16), to_base(42, 24))

101010 1120 2A 1I


# Рациональные числа

В модуле `fractions` определен класс дробь `Fraction`:

In [33]:
from fractions import Fraction

x = Fraction(1, 4)
y = Fraction(1, 3)
print(x + y)

7/12


При оперировании дробями происходит их автоматическое упрощение:

In [34]:
print(Fraction(4, 10))

2/5


In [35]:
x = Fraction(1, 4)
print(x * 2)

1/2


Знак дроби всегда хранится в числителе:

In [36]:
print(Fraction(4, -10))

-2/5


Вещественное число может быть переведено в дробь

In [37]:
print(Fraction(0.25))

1/4


Бесконечные непериодические дроби будут аппроксимированы:

In [38]:
from math import pi

print(Fraction(pi))
print(884279719003555 / 281474976710656)

884279719003555/281474976710656
3.141592653589793


В силу проблем с представлением вещественных чисел, не всегда перевод будет происходить так, как ожидалось:

In [39]:
print(Fraction(0.3))  # очевидно, что может быть представлено как 3/10

5404319552844595/18014398509481984


Можно ограничить значение знаменателя:

In [40]:
print(Fraction(pi).limit_denominator(10))
print(22 / 7)
print(Fraction(pi).limit_denominator(10000))
print(355 / 113)

22/7
3.142857142857143
355/113
3.1415929203539825


In [41]:
# Дробь может быть считана из строки
print(Fraction("1/5"), Fraction("0.125"))

1/5 1/8


In [42]:
# Над дробями определены операции +, -, *, /, //, %, **:
x = Fraction(1, 2)
y = Fraction(1, 3)
print(x + y)
print(x - y)
print(x * y)
print(x / y)
print(x // y)
print(x % y)
print(x ** y)

5/6
1/6
1/6
3/2
1
1/6
0.7937005259840998


# Вещественные числа

Вещественные числа в Python занимают 8 байт. Если более точно:
* 1 бит отводится под знак
* 11 бит под экспоненту
* 52 бита под значащие цифры (15-17 цифр)


Важно понимать, что не все значения могут быть точно представлены в памяти ЭВМ. Возможность проверки представления можно осуществить, если запросить большое количество знаков после запятой:

In [43]:
x = 0.1
print(x)
print(format(x, '.5f'))
print(format(x, '.10f'))
print(format(x, '.25f'))  # 0.1 не может быть точно представлено в памяти ЭВМ

0.1
0.10000
0.1000000000
0.1000000000000000055511151


In [44]:
x = 0.125
print(x)
print(format(x, '.5f'))
print(format(x, '.10f'))
print(format(x, '.25f'))  # 0.125 может быть точно представлено в памяти ЭВМ

0.125
0.12500
0.1250000000
0.1250000000000000000000000


В связи с этим, возникает проблема сравнения вещественных значений. Например:

In [45]:
a = 0.1 + 0.1 + 0.1
b = 0.3
print(a == b)
print(format(a, '.25f'), format(b, '.25f'))  # можно увидеть, что числа являются разными

False
0.3000000000000000444089210 0.2999999999999999888977698


Сравнивать вещественные можно используя функцию `round`. В примере ниже сравниваются вещественные, округлённые до 5 знака после запятой

In [46]:
a = 0.1 + 0.1 + 0.1
b = 0.3
print(round(a, 5) == round(b, 5))

True


Eщё один подход: вещественные равны, если модуль разности между ними не превышает некоторое tolerance

In [47]:
def is_equal(a, b, tolerance: float = 0.000000001):
    return abs(a - b) < tolerance


a = 0.1 + 0.1 + 0.1
b = 0.3
print(is_equal(a, b))
# Недостаток подхода: плохо сравнивает значения близкие к 0. Второе число в примере ниже в 10^16 раз больше, но такой алгоритм сравнения считает их равными
print(is_equal(0.000000000001, 0.0000000000000000000000000001))

True
True


Eщё один подход: найдём отклонение и вычислим какой процент оно составляет от максимального значения

In [48]:
def is_equal(a: float, b: float, rel_tolerance: float = 0.000001):
    """
    rel_tolerance: максимальное допустимое отклонение в процентах от максимума
    """
    tolerance = max(a, b) * rel_tolerance
    return abs(a - b) < tolerance


a = 0.1 + 0.1 + 0.1
b = 0.3
print(is_equal(a, b))
print(is_equal(0.000000000001, 0.0000000000000000000000000001))

True
False


В модуле `math` имеется функция для сравнения вещественных в обоих подходах, описанных выше

In [49]:
from math import isclose

a = 0.1 + 0.1 + 0.1
b = 0.3
print(isclose(a, b, rel_tol=0.00001))
print(isclose(a, b, abs_tol=0.0000001))

True
True


# Конвертация вещественных в целое

При конвертировании вещественного в целое, часть после запятой отбрасывается:

In [50]:
x = int(10.4)
y = int(-10.4)
print(x, y)

10 -10


В библиотеке `math` определены разные функции округления:

In [51]:
from math import floor, ceil

print(floor(10.4), ceil(10.4))
print(floor(-10.4), ceil(-10.4))

10 11
-11 -10


Округление вещественных до разного количества знаков после запятой:

In [52]:
x = 5412.454
print(round(x))      # без второго параметра всегда вернёт int
print(round(x, 0), round(x, 1),
      round(x, 2))   # при указании второго параметра всегда вернёт тот тип, что был у первого аргумента
print(round(x, -1))  # округление до 1 цифры до запятой
print(round(x, -2))  # округление до 2 цифры до запятой

5412
5412.0 5412.5 5412.45
5410.0
5400.0


Интересно происходит округление вещественных, когда абсолютное отклонение до тех значений, до которых они могут быть округлены одинаковое:

In [53]:
print(round(1.25, 1))  # округление вниз
print(round(1.35, 1))  # округление вверх
print(round(1.45, 1))  # округление вниз
print(round(1.55, 1))  # округление вверх
# в таком случае округление ведётся таким образом, чтобы последняя цифра округленного значения была четной

1.2
1.4
1.4
1.6


При необходимости округлять по правилам математики можно использовать подход

In [54]:
from math import copysign


def math_round(x: float):
    return int(x + 0.5 * copysign(1, x))


print(math_round(2.5), round(2.5))

3 2


## Логический тип

Логический тип `bool` является подклассом типа `int`. Переменные данного типа принимают значение истина (`True`) и ложь (`False`).

Каждому объекту в языке программирования Python может быть сопоставлено значение истина или ложь:
* Любое числовое значение, отличное от 0 трактуется как `True`
* Любая пустая коллекция (словарь, список, кортеж, множество) трактуются как `False` в противном случае -- `True`
* `None` трактуется как `False`
* Если класс имеет метод `__len__` / `__bool__` и он возвращает `0` / `False`, то объект трактуется как `False`
<p align="center">
  <img src="images/Truthiness.PNG" alt="drawing" width="600"/>
</p>


In [55]:
def isTrue(x):
    print(x, end=" is ")
    if x:
        print("True")
    else:
        print("False")

isTrue(1)
isTrue(0.0)
isTrue([])
isTrue([1, 2, 3])
isTrue(())
isTrue((1, 2, 3))
isTrue(None)

1 is True
0.0 is False
[] is False
[1, 2, 3] is True
() is False
(1, 2, 3) is True
None is False


In [56]:
issubclass(bool, int)

True

Имеется одна тонкость значения `True` и `False` являются синглтонами. Несмотря на то, что они трактуются как `0` и `1`, можно заметить, что:

In [57]:
print(True == 1, False == 0)
print(id(True), id(1))     # 0 и 1 располагаются в разных участках памяти
print(id(3 < 4), id(True)) # значение True лежит в одном и том же месте вне зависимости от того, как получен результат

True True
140718382431080 1497492095216
140718382431080 140718382431080


В силу трактования их значений как 0 и 1 корректно поведение:

In [58]:
print(True > False)
print(True * 3)

True
3


Конструкция вида:

In [59]:
my_list = [1, 2, 3]
if my_list:
    pass

неявно преобразуется в:

In [60]:
my_list = [1, 2, 3]
if my_list is not None and len(my_list) > 0:
    pass

Интересна работа операций `or` и `and`. Каждая из них возвращает значение операнда, на котором остановилось вычисление (операнд, на котором было понятно, была ли получена 'истина' или 'ложь'). `X and Y` возвращает значение `X` если оно ложно, в противном случае возвращается значение `Y`. `X or Y` возвращает значение `X` если оно истина, в противном случае возвращается значение `Y`.

In [61]:
a = 5
if a != 0 and a > 5:
    print("Good value")
else:
    print("Bad value")

Bad value


In [62]:
a = 6
if a != 0 and a > 5:
    print("Good value")
else:
    print("Bad value")

Good value


In [63]:
a = 3
if a == 3 or a != 0 and a > 5:
    print("Good value")
else:
    print("Bad value")

Good value


In [64]:
print("A B   F")
for a in [False, True]:
    for b in [False, True]:
        print(f"{int(a)} {int(b)} | {int(a and b)}")

A B   F
0 0 | 0
0 1 | 0
1 0 | 0
1 1 | 1


In [65]:
print("A B   F")
for a in [False, True]:
    for b in [False, True]:
        print(f"{int(a)} {int(b)} | {int(a or b)}")

A B   F
0 0 | 0
0 1 | 1
1 0 | 1
1 1 | 1


In [66]:
a, b = True, False
c, d = 10, 0

print(a or c)
print(c or a)
print(b or a)
print(b or d)

True
10
True
0


In [67]:
a, b = True, False
c, d = 10, 0
print(a and c)
print(c and a)
print(b and a)
print(b and d)

10
True
False
False


In [68]:
# Приём может использоваться для вычисления среднего значения
a = [1, 2, 3]
print(len(a) and sum(a) / len(a))

a = []
print(len(a) and sum(a) / len(a))

# Поиск первого символа в строке
s = "hello"
print(s and s[0])

s = ""
print(s and s[0])

2.0
0
h



### Операции сравнения
* `is`, `not is`
* `==`, `!=`
* `<`, `<=`, `>`, `>=`

In [69]:
a = 4
print(a == 4)
print(a == 5)
print(a < 10)
print(a < 10 and a > 7)
print(7 < a < 10)

True
False
True
False
False


В языке программирования Python допускаются цепочки сравнений (chained comparison):

In [70]:
# запись цепочкой
a, b, c = 1, 3, 5
if a < b < c:
    print(True)

# второй вариант:
# if a < b and b < c:
#    print(True)

True


In [71]:
# минимум можно искать более эффективно, пример представлен в ознакомительных целях:
a, b, c = map(int, input().split())
if a < b < c:  # -> a < b and b < c
    print(a)
elif b < c:
    print(b)
else:
    print(c)

1


In [72]:
a = 4
b = 4
print(a is b)
print(id(a), id(b))

True
1497492095312 1497492095312


In [73]:
a = 4
b = 4.0
print(a is b)
print(a == b)
print(id(a), id(b))

False
True
1497492095312 1497570241328
