# Погружение в Python: Простые типы данных

## Урок 2: Простые типы данных

### Оглавление

1. [Простые типы данных и коллекции](#Простые-типы-данных-и-коллекции)
2. [Аннотация типов](#Аннотация-типов)
3. [Python как объектно-ориентированный язык](#Python-как-объектно-ориентированный-язык)
4. [Простые объекты](#Простые-объекты)
5. [Математика в Python](#Математика-в-Python)

### Термины лекции

- **Коллекция**: объект, содержащий набор значений, позволяющий обращаться к ним.
- **Простой тип**: тип данных, объекты которого не включают в себя другие объекты.
- **Хеш**: криптографическая функция хеширования.
- **Атрибуты**: характеристики объекта.
- **Методы**: функции, описанные внутри объекта или класса.
- **Дандер**: методы с двойным подчеркиванием в имени (например, `__init__`).
- **ASCII**: стандарт кодировки символов.
- **Комплексные числа**: числа вида a + bi, где a и b — вещественные числа, а i — мнимая единица.


## Простые типы данных и коллекции

### Строгая динамическая типизация

Python — язык со строгой динамической типизацией, что означает, что тип объекта не может быть изменён, но переменные могут ссылаться на объекты разных типов.

In [6]:
a = 5
print(type(a), id(a))
a = "hello world"
print(type(a), id(a))
a = 42.0 * 3.141592 / 2.71828
print(type(a), id(a))

<class 'int'> 140710053385128
<class 'str'> 2037028498032
<class 'float'> 2037027739216


### Функция `type()`

Функция `type()` возвращает тип объекта:

In [1]:
a = 5
print(type(a))

<class 'int'>


### Функция `isinstance()`

Функция `isinstance()` проверяет, является ли объект экземпляром указанного класса:

In [2]:
data = 42
print(isinstance(data, int))  # True

data = True
print(isinstance(data, int))  # True, так как в Python bool является подклассом int

data = 3.14
print(isinstance(data, (int, float, complex)))  # True

True
True
True


### Оператор `is`

Оператор `is` сравнивает не значения, а сами объекты:

In [7]:
num = 2 + 2 * 2
digit = 36 / 6
print(num == digit)  # True
print(num is digit)  # False

True
False


### Изменяемые и неизменяемые типы

Примеры неизменяемых типов данных: `int`, `float`, `str`, `tuple`.

In [8]:
a = 5
print(a, id(a))
a += 1
print(a, id(a))

5 140710053385128
6 140710053385160


Изменение неизменяемого типа приводит к созданию нового объекта в памяти.

### Хеш-функция

Функция `hash()` используется для проверки неизменяемости объекта:

In [9]:
x = 42
y = 'text'
z = 3.1415
print(hash(x), hash(y), hash(z))

my_list = [x, y, z]
print(hash(my_list))  # TypeError: unhashable type: 'list'

42 -2762866936839878259 326276785803738115


TypeError: unhashable type: 'list'

### Аннотация типов

Аннотация типов в Python упрощает отладку кода и повышает читаемость.

In [10]:
a: int = 42
b: float = float(input('Введите число: '))
a = a / b

### Модуль `typing`

Для указания типа переменной можно использовать модуль `typing`. 

Модуль `typing` содержит типы данных и обобщенные типы для аннотаций:

In [11]:
from typing import List

def my_func(data: List[int]) -> float:
    res = sum(data) / len(data)
    return res

print(my_func([2, 5, 8]))

5.0


## Python как объектно-ориентированный язык

В Python всё является объектом, и у объектов есть атрибуты и методы.

### Функции `dir()` и `help()`

In [12]:
print(dir(str))  # Выводит список атрибутов и методов класса str
print(help(str))  # Выводит документацию по классу str

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'removeprefix', 'removesuffix', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']
Help on class str i

### Простые объекты

Целые числа

In [13]:
a = 42
print(type(a))  # <class 'int'>

<class 'int'>


In [1]:
x = int("42")
y = int(3.1415)
z = int("hello", base=30)
print(x, y, z, sep='\n')

42
3
14167554


In [2]:
import sys

STEP = 2 ** 16
num = 1
for _ in range(30):
    print(sys.getsizeof(num), num)
    num *= STEP

28 1
28 65536
32 4294967296
32 281474976710656
36 18446744073709551616
36 1208925819614629174706176
40 79228162514264337593543950336
40 5192296858534827628530496329220096
44 340282366920938463463374607431768211456
44 22300745198530623141535718272648361505980416
48 1461501637330902918203684832716283019655932542976
48 95780971304118053647396689196894323976171195136475136
52 6277101735386680763835789423207666416102355444464034512896
52 411376139330301510538742295639337626245683966408394965837152256
56 26959946667150639794667015087019630673637144422540572481103610249216
60 1766847064778384329583297500742918515827483896875618958121606201292619776
60 115792089237316195423570985008687907853269984665640564039457584007913129639936
64 7588550360256754183279148073529370729071901715047420004889892225542594864082845696
64 497323236409786642155382248146820840100456150797347717440463976893159497012533375533056
68 3259257562135177738029513101455005057682349429865498001017824718967010079621338729893435

Для хранения "единицы" в 64-х разрядной версии Python тратится 28(!) байт памяти.

Это объект со своей служебной информацией и несколькими байтами под само число.

При этом мы можем хранить огромные числа, превышающие long integer на много

порядков без проблем и лишних приёмов программирования. Число Гугол, т.е. 10 в

степени 100 займет всего лишь 72 байта.

In [3]:
print(sys.getsizeof(10 ** 100))

72


Вещественные числа функция `float()`

Числа с плавающей запятой представлены классом `float`. Для хранения таких чисел ПК, а не только Python используют особый формат представления числа: мантисса и порядок.

Так число 23321.345 правильнее было бы представить как 2.3321345*10**-4.

Особенности подобного формата хранения чисел могут приводить к погрешностям вычисления.


In [5]:
print(0.1 + 0.2)

0.30000000000000004


Вместо ожидаемого 0.3 получили 0.30000000000000004

In [14]:
b = 3.14
print(type(b))  # <class 'float'>

<class 'float'>


In [4]:
PI = 3.141_592_653_589_793_238_462_643_383_279_502_884_197_169_399_375
print(PI)

3.141592653589793


Логические типы функция `bool()`

С True и False мы уже знакомы. Это две неизменные константы, которые являются ответвлением числового типа. Функция bool() возвращает одно из двух значений,

в зависимости от входного значения. У "логики" есть несколько полезных особенностей, которые облегчают разработку.

Все числа преобразуются к истине, за исключением нуля. Он считается ложью.

In [7]:
DEFAULT = 42
num = int(input('Введите уровень или ноль для значения поумолчанию: '))
level = num or DEFAULT
print(level)

85


Любая строка текста также приводится к истине. Ложью является пустая строка (не путайте с пробелом), т.е. строка длиною в ноль символов.

In [10]:
name = input('Как вас зовут? ')
if name:
    print('Привет, ' + name)
else:
    print('Анонимус, приветствую')

Анонимус, приветствую


Коллекции, о которых будем подробного говорить на следующей лекции приводятся к истине, если в них есть элементы. Пустая коллекция — ложь.

In [11]:
data = [0, 1, 1, 2, 3, 5, 8, 13, 21]
while data:
    print(data.pop())

21
13
8
5
3
2
1
1
0


In [15]:
c = True
print(type(c))  # <class 'bool'>

<class 'bool'>


Строки, функция `str()`

В Python нет типа данных символ. Есть только класс str. В нём можно хранить как один символ, аналог char в си-подобных языках, так и любое большее количество

символов. Почему символы, а не буквы? Для хранения используется кодировка utf-8, т.е. в строке могут быть не только буквы, цифры, знаки препинания, но и

иероглифы, смайлики и всё то, что хранится в кодировке Unicode.

При работе со строками стоит помнить, что это неизменяемый тип данных. При этом `str` можно представить как коллекцию символов — массив. Выходит, что строка

является коллекцией? Верно.


На этой лекции рассмотрим несколько приёмов работы со строками как с неизменяемыми объектами. А на следующей поговорим о строке как о коллекции символов.

### Способы записи строк

Python допускает одинарные или двойные кавычки для записи строки. Одни кавычки могут включать другие, но они не должны смешиваться.

In [12]:
txt = 'Книга называется "Война и мир".'

Тройный двойные кавычки позволяют писать текст в несколько строк. Если такой текст не присвоить переменной, он превращается в многострочный комментарий. 

Подобные комментарии используют для создания документации к коду. Например так:


In [13]:
class str(object):
    """
    20
    str(object='') -> str
    str(bytes_or_buffer[, encoding[, errors]]) -> str
    ...
    """

Ещё один способ записать строки, перечислить их последовательно друг за другом.

In [14]:
text = 'Привет.' 'Как ты, друг?' 'Рад тебя видеть.'
print(text)

Привет.Как ты, друг?Рад тебя видеть.


Такой приём работает, но считается плохим стилем. Плюс, а точнее минус, строки соединились без пробелов.

In [15]:
d = "Hello, World!"
print(type(d))  # <class 'str'>

<class 'str'>


### Размер строки в памяти

Строки как объекты тратят память на служебную информацию, а как массивы на хранение текста. В 64-х разрядной версии Python служебная информация занимает

48 байт. Разберём пример кода:


In [18]:
empty_str = ''
en_str = 'Text'
ru_str = 'Текст'
unicode_str = '😀😍😉🙃'
print(empty_str.__sizeof__())
print(en_str.__sizeof__())
print(ru_str.__sizeof__())
print(unicode_str.__sizeof__())

49
53
84
92


Во-первых обратите внимание на магический метод `__sizeof__()`. Он работает аналогично `sys.getsizeof` и возвращает количество байт занятых объектом. 
Почему же пустая строка заняла 49 байт, если служебная информация использует 48? Один байт - символ конца строки.

Теперь посмотрим на текст. Английские буквы тратят по одному байту на символ. Если же речь идёт о русском языке или любых других символах, кодирование
занимает 2 или 4 байта. Это особенность хранения информации в кодировке UTF-8 и фишка языка Python для доступа к букве по индексу. А теперь зная, что строка тратит много памяти,
что строка неизменяемый тип данных и что при конкатенации строк создаются новые объекты, которые занимают дополнительную память вы сами можете сделать вывод почему сложение
 строк не приветствуется.


## Математика в Python

### Модуль `math`

In [21]:
import math

print(math.sqrt(16))  # 4.0

4.0


В математическом модуле содержаться константы, например число "пи", "е",

бесконечность и др.

In [23]:
print(math.pi, math.e, math.inf, math.nan, math.tau, sep='\n')

3.141592653589793
2.718281828459045
inf
nan
6.283185307179586


### Модуль `decimal`

Модуль `decimal` позволяет хранить числа с плавающей запятой и проводить с ними

математические выселения без потери точности и ошибок преобразования. Для

этого надо воспользоваться классом Decimal из модуля.

In [20]:
from decimal import Decimal

print(Decimal('0.1') + Decimal('0.2'))  # 0.3

0.3


In [24]:
import decimal


pi =decimal.Decimal('3.141_592_653_589_793_238_462_643_383_279_502_884_197_169_399_375')
print(pi)
num = decimal.Decimal(1) / decimal.Decimal(3)
print(num)


3.141592653589793238462643383279502884197169399375
0.3333333333333333333333333333


In [25]:
decimal.getcontext().prec = 120
science = 2 * pi * decimal.Decimal(23.452346) ** 2
print(science)

3455.83066550525681221255767989730747561877356795282333577813456316135465722551243973438941915628321878677792211576047521


### Модуль `fractions`

Для работы с дробями есть модуль `fractions`.

In [19]:
from fractions import Fraction

print(Fraction(1, 3))  # 1/3

1/3


In [26]:
import fractions


f1 = fractions.Fraction(1, 3)
print(f1)
f2 = fractions.Fraction(3, 5)
print(f2)
print(f1 * f2)

1/3
3/5
1/5


### Комплексные числа

Комплексный числа — числа с мнимой единицей, квадратным корнем из

минус одного.

In [22]:
e = complex(2, 3)
print(e)  # (2+3j)

(2+3j)


In [27]:
a = complex(2, 3)
b = complex('2+3j')
print(a, b, a == b, sep='\n')

(2+3j)
(2+3j)
True


### Математические функции "из коробки"

- `abs(x)` — возвращает абсолютное значение числа x, число по модулю.

- `divmod(a, b)` — функция принимает два числа в качестве аргументов и
возвращает пару чисел — частное и остаток от целочисленного деления.
Аналогично вычислению a // b и a % b.

- `pow(base, exp[, mod])` — при передаче 2-х аргументов возводит base в
степень exp. При передаче 3-х аргументов, результат возведения в степень
делится по модулю на значение mod.

- `round(number[, ndigits])` — округляет число number до ndigits цифр
после запятой. Если второй аргумент не передать, округляет до ближайшего
целого.