#### Типы данных и их классификация

✍ В прошлом юните мы познакомились с понятием переменная, научились их создавать и записывать в них данные.

В то же время мы практически не касались того, какие данные можно записывать в переменные и какими эти данные вообще бывают. Они могут быть разными: числа, строки, списки значений и другие. Это называется типами данных.

В работе вы будете сталкиваться с разными задачами (поскольку работа дата-сайентиста полностью основана на данных — это, собственно говоря, есть и в самом названии профессии) и разными типами данных, поэтому крайне важно научиться с ними работать.

В этом юните мы начнём знакомство с типами данных: узнаем, какие данные бывают в Python и как они классифицируются.

Типам данных будут также посвящены оставшиеся юниты этого модуля и весь следующий модуль.

Каждая единица данных в Python является объектом какого-то типа. Мы уже встречались со строками, с числами, но их, естественно, намного больше.

Типы данных бывают:

- встроенными (built-in) — такие типы не надо отдельно устанавливать, они уже идут в комплекте с интерпретатором Python;
- загружаемыми из библиотек;
- создаваемыми самостоятельно.

Основные типы, которыми пользуется практически любой программист и которые мы будет рассматривать в этом разделе, являются встроенными. 

Давайте посмотрим на иерархию встроенных типов Python:

<div align="center">
    <img src=img/dst3-u1-md1_6_1.png width="50%" height="50%">
</div>

Для удобства мы собрали информацию о встроенных типах данных и представили её в виде таблицы:

<table align="center">
    <th>ДАННЫЕ</th>
    <th>ТИП</th>
    <th>ПРИМЕРЫ</th>
    <tr>
       <td>Целые числа</td>
       <td>int</td>
       <td>730</td>
    </tr>
    <tr>
       <td>Числа с плавающей точкой</td>
       <td>float</td>
       <td>3.14</td>
    </tr>
    <tr>
       <td>Строки</td>
       <td>str</td>
       <td>'Hello world'</td>
    </tr>
    <tr>
       <td>Логические переменные</td>
       <td>bool</td>
       <td>True<br>False</td>
    </tr>
    <tr>
       <td>Списки</td>
       <td>list</td>
       <td>[1,2,3]</td>
    </tr>
    <tr>
       <td>Кортежи</td>
       <td>tuple</td>
       <td>('a','b','c')</td>
    </tr>
    <tr>
       <td>Словари</td>
       <td>dict</td>
       <td>{'a':1,'b':2,'c':3}</td>
    </tr>
    <tr>
       <td>Множества</td>
       <td>set</td>
       <td>{'a',1,'b',2}</td>
    </tr>
</table>

Можно заметить, что некоторые типы очень похожи друг на друга. Например, мы знаем, что целые числа и числа с плавающей точкой всё равно остаются числами (как минимум) с точки зрения математики. И каждое число можно записать как строку, используя специфичный для строк синтаксис (кавычки). А также списки, кортежи и множества вообще записываются практически одинаково, визуально отличаясь только скобками. По своему предназначению они также похожи — в них можно записать несколько объектов.

Несмотря на то что работа с ними всё же заметно разная, есть возможность представить список в виде множества, а, например, кортеж — в виде списка. Возможных комбинаций «перевода» одних типов в другие много, а сам этот процесс называется преобразованием, или приведением, типов.

Приведение типов подробно рассмотрим в следующем модуле.

### Как определить тип данных переменной?

**Python** — язык с **неявной сильной динамической типизацией**. Разберём это определение по частям.

<table>
    <td><b>Динамическая типизация</b> означает, что тип переменной определяется во время выполнения программы, а не во время компиляции. Поэтому справедливо говорить, что переменная — это контейнер. Во время выполнения программы в него можно положить данные одного типа, после чего заменить данными другого типа.<br><br>
    Возьмём аналогию из прошлого юнита, что переменная — это коробка. В Python мы можем положить в эту коробку всё что угодно, затем вытащить это и положить что-то другое, коробка может принять любое содержимое.</td>
    <td><b>Сильная типизация</b> говорит нам о том, что мы не можем совершать операции над объектами разного типа без приведения их к одному типу.<br><br>
    Например, Python вызовет ошибку, если мы попытаемся сложить число и строку. Однако, мы можем складывать между собой целые числа int и числа с плавающей точкой float. Это не вызовет ошибки благодаря тому, что в языке существует неявное приведение типов. Этот механизм автоматически приводит целые числа в числа с плавающей точкой в ситуациях, когда это необходимо.</td>
    <td>И, наконец, <b>неявная типизация</b> говорит о том, что тип переменной при её объявлении не нужно указывать.<br><br>
    Такой подход при грамотном использовании открывает большое количество возможностей, о которых мы постепенно узнаем.</td>
</table>

Возможности языка Python позволяют узнавать тип переменной, используя встроенную функцию **type()**.

Рассмотрим, как работает динамическая типизация и функция type(), на примере. Сначала присвоим переменной a значение 3.14 и выведем её тип на экран:

In [1]:
a = 3.14
print(type(a))
# <class 'float'>

<class 'float'>


Так как в переменную a было записано вещественное число, то, соответственно, её тип — float. Теперь в ту же самую переменную a запишем строку '3.14' и опять выведем тип переменной a на экран.

In [2]:
a = '3.14'
print(type(a))
# <class 'str'>

<class 'str'>


Как видите теперь тип переменной a — str, то есть строка. Тем самым, переменная a в разные моменты выполнения программы имела разный тип — в этом и есть суть динамической типизации.


### Дополнительно

Справочник по языку [Python](https://docs.python.org/3.3/reference/datamodel.html).

### Классификация типов данных

Все типы данных можно разделить на две группы: **изменяемые**/мутабельные и **неизменяемые**/иммутабельные.

<table align="center">
    <th>Неизменяемые типы</th>
    <th>изменяемые типы</th>
  <tr>
    <td>Целые числа (int)</td>
    <td>Списки (list)</td>
  </tr>
  <tr>
    <td>Числа с плавающей точкой (float)</td>
    <td>Словари (dict)</td>
  </tr>
  <tr>
    <td>Строки (str)</td>
    <td>Множества (set)</td>
  </tr>
  <tr>
    <td>Логические переменные (bool)</td>
    <td></td>
  </tr>
  <tr>
    <td>Кортежи (tuple)</td>
    <td></td>
  </tr>    
</table>

Особенность неизменяемых типов (immutable)  заключается в том, что такие объекты не могут быть изменены «на лету». Иными словами, если вы захотите произвести операцию, например, со строкой, то будет создана новая строка с теми изменениями, которые вы собираетесь внести.

Однако это не касается списков, словарей и множеств, в которые вы можете добавлять новые элементы, удалять старые или обновлять существующие — сам объект останется прежним. Такие типы данных называются изменяемыми (mutable).

Посмотрим, как проявляется это свойство на примере чисел.

Пусть у нас будет два числа:

In [3]:
a = 5
b = 10
#Увеличим первое число на второе:

a = a + b
print(a)
# 15

15


Может показаться, что мы к существующей переменной *a* просто прибавили значение переменной *b*, то есть модифицировали переменную *a*. Это и так, и не так одновременно.

Давайте посмотрим на эти значения немного глубже. Для этого воспользуемся встроенной функцией **id()**, которая возвращает уникальный идентификатор любого объекта.

Что такое идентификатор? В общем случае идентификатором называют уникальный признак объекта, который позволяет отличать его от других объектов, то есть идентифицировать.

В Python идентификатором объекта является уникальное число.

In [4]:
a = 5
print(id(a), a) #проверяем идентификатор переменной a
# 93869227535744 5

b = 10
print(id(b), b) #проверяем идентификатор переменной b
# 93869227535904 10

a = a + b
print(id(a), a) #проверяем идентификатор переменной a
# 93869227536064 15

140708158055464 5
140708158055624 10
140708158055784 15


Как мы видим, идентификатор переменной a после модификации изменился. Это означает, что переменная больше не указывает на старое значение 5, а вместо этого переменная a указывает теперь на значение 15.