<a href="https://colab.research.google.com/github/mts-machines-learn/ml-course-dec2019/blob/master/2. Python и окружение/002_Data_types.ipynb"><img src="https://colab.research.google.com/assets/colab-badge.svg"/></a>

### Типы данных

Мы уже видели, что в питоне можно создавать разные объекты: например, числа и строки. Есть ещё числа с плавающей точкой, списки, словари и ещё куча других.

У любого объекта в Питоне есть **тип**. Пока можно думать про тип просто как про тэг, который прикреплён к каждому объекту в памяти.

![types](img/types.png)

*Лирическое отступление: В отличие от многих других языков вроде C и Java, в питоне тип есть только у объектов, но не у переменных. Переменная — это просто имя; в одну и ту же переменную можно в разные моменты времени положить разные объекты каких угодно типов.*

**Зачем нужны типы?** Тип объекта определяет, какие операции над этим объектом можно выполнить, и как объект себя поведёт при выполнении этих операций.

Создадим две переменные, сложим их, и положим результат в третью. Если мы пишем в Питоне числа без точки и дробной части, они порождают объекты типа `int` — целые числа.

In [1]:
a = 10
b = 5
summ = a + b

print(summ)

15


В принципе, всё работает так, как мы могли бы ожидать. Мы создали две переменные типа `int`, сложили их, получили в результате новый объект (тоже типа `int`), и положили его в переменную `summ`.

Но что будет, если мы создадим не целые числа, а строки, и тоже захотим их сложить?

In [1]:
a = 'Hello'
b = 'world!'
summ = a + b

print(summ)

Helloworld!


Здесь мы создали в памяти две строки (тип `str`), и применили к ним тот же оператор `+`. Однако для строк сложение не имеет такого же смысла, как для чисел: если мы «сложим» одну строку с другой, то получим новую строку, в которой будут лежать склеенные исходные строки! *Бонус за внимательность*: у нас в строках не было пробелов, поэтому при сложении мы получили новую строку, в которой тоже нет пробелов. Питон ничего не добавляет от себя.

Вот ещё один пример: создадим две строки с числами и сложим их.

In [6]:
a = '10'
b = '5'
summ = a + b

print(summ)
print(type(summ))

105
<class 'str'>


Несмотря на то, что строки состоят только из цифр, и в них нет букв, Питон при их сложении всё равно склеивает их именно как строки. Это логичное и ожидаемое поведение. Всё, что заключено в кавычки `''` — всегда строка, независимо от содержимого кавычек. В результате сложения мы так же получаем строку (чтобы узнать тип объекта, мы используем функцию `type()`).

#### Преобразование типов

Иногда бывает нужно преобразовать объект одного типа в объект другого типа. Пожалуй, наиболее частое применение этой операции в Питоне — это преобразование строки с цифрами в один из числовых типов.

Например, у нас есть объекты со строками `'10'` и `'5'`, но мы хотим сложить их как числа. Если мы напрямую применим оператор сложения `+`, Питон просто склеит эти строки. Чтобы сложить эти объекты как числа, нам придётся создать из них **новые объекты другого типа**.

**Это очень важно**: преобразование типов никогда не трогает существующий объект. Оно всегда создаёт **новый** объект нужного типа.

Чтобы выполнить преобразование, нужно записать название целевого типа, и в скобках передать объект для преобразования:

In [7]:
a = '10'

a_i = int(a)
b_i = int('5')

В этом кусочке кода мы использовали функцию `int()`. В первом вызове мы получили объект со строкой из переменной `a`, а во втором создали строку на лету и тут же преобразовали её к целому числу. Проверим типы объектов с помощью уже знакомой функции `type()`:

In [8]:
print(type(a))
print(type(a_i))
print(type(b_i))

<class 'str'>
<class 'int'>
<class 'int'>


Мы видим, что тип переменной `a` — строка, и он не изменился после преобразования. Функция `int()` в обоих случаях создала для нас **новые** объекты, и у них тип `int`.

Посмотрим на полный пример, который позволит нам преобразовать строки в числа и сложить их:

In [10]:
a = '10'
b = '5'

a_i = int(a)
b_i = int(b)

summ = a_i + b_i

print(summ)
print(type(summ))

15
<class 'int'>


Сначала у нас есть две строки. На их основе мы создаём новые объекты типа `int` и складываем их. Результат записываем в переменную `summ`. Так как мы сложили два целых числа, в результате у нас получилось тоже целое число.

Мы можем не использовать промежуточные переменные, а записать это в таком виде:

In [11]:
a = '10'
b = '5'

summ = int(a) + int(b)

print(summ)
print(type(summ))

15
<class 'int'>


Мы получили абсолютно такой же результат. Использовать временные переменные или нет, решаем мы сами. Если у нас небольшой кусок кода, и мы хотим использовать преобразованный объект только один раз, то и нет смысла в промежуточных переменных.

Обратный пример: иногда бывает нужно преобразовать число в строку. Для этого точно так же используем имя типа — `str` со скобками:

In [13]:
a = 5
a_s = str(a)

print(a_s)
print(type(a_s))

5
<class 'str'>


#### Типы и методы

В Питоне у каждого объекта есть методы, которые у него можно вызвать. Например, у строк есть метод `upper()`, который возвращает новую строку со всеми буквами в верхнем регистре:

In [15]:
hello = 'Hello world!'

print(hello.upper())

HELLO WORLD!


У целых чисел такого метода нет, и попытка его вызвать приведёт к ошибке:

In [16]:
a = 10

print(a.upper())

AttributeError: 'int' object has no attribute 'upper'

Из этого можно сделать вывод, что **набор методов, которые можно вызвать у объекта, определяется его типом**.

### Базовые типы Python

|Название|Описание|Пример|
|:---|:---|:---|
|int     |Целые числа|`1` <br/> `42` <br/> `-10`|
|float   |Дробные числа|`3.14` <br/> `-54.6`|
|str     |Строки|`'Hello world!'` <br/> `'Python'`|
|bool    |Булевский|Только два значения: `True` или `False`|
|None    |Специальный объект, который означает отсутствие объекта 🤔 (разберёмся с этим позже)|`None`|

Ещё есть типы-контейнеры, мы подробно посмотрим на них в отдельных ноутбуках:

|Название|Описание|Пример|
|:---|:---|:---|
|list     |**Список объектов** — упорядоченная последовательность любых объектов, можно изменять количество элементов.|`[1, 'Hello', 3.14, 1, True, True]`|
|dict   |**Словарь** — неупорядоченная последовательность, которая содержит пары объектов «ключ → значение».|`{'key1': 42, 'key2': 3.14, 'key3': True}`|
|tuple     |**Кортеж** — то же самое, что список, но после создания нельзя изменить количество элементов. У этого типа есть дополнительные интересные применения в синтаксисе.|`('Hello', True, 3.14)`|
|set    |**Множество** — неупорядоченный список, в котором каждый объект может встречаться только один раз.|`{1, 'Hello', 3.14, True}`|

С контейнерами мы подробно поработаем в следующих ноутбуках.

### Советы по работе с типами

Мы уже видели, что в Питоне в одну и ту же переменную можно в разные моементы времени положить любой объект любого типа. Это можно считать фичей, но обычно такое использование переменных приводит к проблемам. Лучше всегда следовать правилу:

**В одну переменную всегда лучше класть объекты только одного типа**. Это значит, что если мы создали переменную `a`, и положили в неё `int`, то в ходе скрипта в эту переменную стоит класть только объекты типа `int`. Таким образом, нам не придётся помнить, какой тип объекта лежит в пременной в каждом конкретном месте скрипта — мы всегда будем знать, что эта переменная предназначена только для `int`.

Это правило мы можем соблюдать только на уровне наших договорённостей, но оно сильно облегчит нам жизнь. Если мы всегда будем точно знать, какой тип объекта лежит в какой переменной, это позволит нам избежать неожиданного поведения.

Какие весёлые эффекты могут нас поджидать, если мы не будем пользоваться этим правилом? Вот пример:

In [17]:
a = 10
b = 5

print(a * b)

# Допустим, тут много разного ветвящегося когда, который привёл к тому, что в a мы положили строку.

a = '10'

print(a * b)

50
1010101010


Что здесь произошло? Сначала мы создали две целочисленные переменные, как и раньше. Мы захотели их умножить, и ожидаемо получили `50`. 

Допустим, в ходе выполнения какого-то куска скрипта мы зазевались и положили в переменную `a` строку. Допустим, мы прочитали ввод пользователя из консоли и забыли привести его к типу `int`. 

В переменной `a` у нас теперь оказалась строка, а в переменной `b` — по-прежнему `int`. Мы снова пытаемся умножить два объекта. Казалось бы, операция умножения между строкой и числом не имеет смысла, но Питон думает иначе. Если мы умножим строку на число, то в результате получим **новую строку**, в которой исходная строка повторяется [число] раз! То есть, во втором случае мы получили строку `10`, которую Питон повторил 5 раз 😱

Логично ли такое поведение? Создатель Питона решил, что да. Нам же лучше соблюдать правило, по которому в каждую переменную мы кладём объекты только одного типа, чтобы избежать подобных эффектов.