# Самые необходимые типы данных

[К оглавлению](00_contents.ipynb)

**Тип данных** позволяет указать компьютеру, какие действия можно выполнять с этими данными и как это делать.

Наиболее часто использьуемые типы данных приведены в таблице

Тип данных | Применение
:----------|:-----------------------------------------
int        | Целые числа
float      | Действительные числа
bool       | Логические значения
str        | Строки
list       | Списки - упорядоченные последовательности значений (изменяемые)
tuple      | Кортежи - упорядоченные последовательности значений (неизменяемые)
dict       | Словари - коллекции объектов с доступом по ключу
ndarray    | Массивы numpy
Series     | Ряд pandas
DataFrame  | Таблица pandas
None       | Пустое значение

Тип объекта можно узнать с помощью функции `type()`

In [286]:
type(3)

int

In [287]:
type(3.)

float

In [288]:
type('3')

str

In [289]:
type(False)

bool

## Простые типы данных

### Числовые типы данных

Два наиболее часто используемых числовых типа данных - целые (`int`) и действительные (`float`) числа.

При необходимости, **преобразование типов** происходит автоматически. Если в выражении содержится хотя бы одно действительное число, то результат будет действительным числом.

In [290]:
2 * 2

4

In [291]:
2 * 2.

4.0

In [292]:
5 / 2 # 2.5 в Python 3, но 2 в Python 2 

2.5

#### Некоторые полезные операции c числами:

- возведение в степень:

In [293]:
2**4

16

- целочисленное деление (`a // b` - сколько раз `b` помещается в `a`)

In [294]:
5 // 2

2

- остаток от деления (`a` % `b` - сколько места в `a` останется)

In [295]:
5 % 2

1

Список всех операций, поддерживаемых Python, [здесь](http://pythonicway.com/python-operators)

Для очень больших и маленьких чисел лучше использовать научную запись:

In [296]:
1e6

1000000.0

In [297]:
6.022e23

6.022e+23

In [298]:
6.6E-34

6.6e-34

### Логический тип данных

Логический тип данных представлен двумя константами - `True` и `False`

Результат логического типа часто появляется в операциях сравнения:

In [299]:
5 >= 2

True

In [300]:
2 * 2 == 5

False

In [301]:
2 * 2 != 5

True

Действительные числа сравнивать опасно!

In [302]:
0.1 + 0.2 == 0.3

False

In [303]:
0.1 + 0.2

0.30000000000000004

Для правильного сравнения можно сделать свою функцию:

In [304]:
near = lambda a, b, eps=1e-5: abs(a - b) < eps
near(0.1 + 0.2, 0.3)

True

Или использовать функцию из пакета `numpy`:

In [305]:
from numpy import isclose

isclose(0.1 + 0.2, 0.3)

True

Можно сравнивать данные и других типов, например строки:

In [306]:
'Колбаса' > 'Бутерброд'

True

In [307]:
print(ord('К'), ord('Б')) #Коды символов К и Б

1050 1041


Можно комбинировать несколько логических выражений с помощью логических операторов: `and`, `or`, `not`

In [308]:
5 > 2 and 'a' < 'b'

True

In [309]:
not 5 > 2

False

In [310]:
(not 5 > 2) or (2 * 2 == 4)

True

Также можно комбинировать логические выражения с помощью операторов `& | ~` - этот вариант используется в `numpy` и `pandas`.

In [311]:
(5 > 2) & ('a' < 'b') # выражения обязательно надо брать в скобки

True

In [312]:
~ 5 > 2

False

In [313]:
(~5 > 2) | (2 * 2 == 4)

True

В Python логические значения `True` и `False` при необходимости автоматически преобразуются в числа:

In [314]:
True + True

2

In [315]:
True == 1

True

Также можно определить "истинность" не только логических значений, но и данных других типов

In [316]:
bool(0)

False

In [317]:
bool(-5)

True

In [318]:
bool("Привет")

True

In [319]:
bool("") #пустая строка

False

### Строки

Для записи строковых констант можно использовать парные одинарные или двойные кавычки:

In [320]:
"That's fine!"

"That's fine!"

In [321]:
'Прочитать "Войну и мир" - подвиг'

'Прочитать "Войну и мир" - подвиг'

Если внутри строки встречается кавычка того же вида, что и для записи строки, используйте `\` для **экранирования**:

In [322]:
'That\'s also fine'

"That's also fine"

Символ `\` также используется для записи специальных символов, например, конца строки или табуляции:

In [323]:
print('две\nстроки')

две
строки


In [324]:
print('\tс отступом')

	с отступом


#### Операции со строками

 ##### Cцепление (склеивание)
 
Чаще всего строки приходится сцеплять друг с другом:

In [325]:
s = 'Сочи '

In [326]:
s2 = 'Море'
s + s2

'Сочи Море'

In [327]:
y = 2014
#s + y #ошибка!

In [328]:
s + str(y) #правильно: приведение типа к строковому типу

'Сочи 2014'

##### Повторение

In [329]:
'=' * 80



##### Форматирование

Сложные строки при выводе результатов расчета удобно получать с помощью метода строк `format()` (о методах - чуть позже)

In [330]:
r = 10
from math import pi
print('Площадь круга радиусом {} равна {}'.format(r, pi * r**2)) #формат по умолчанию

Площадь круга радиусом 10 равна 314.1592653589793


In [331]:
print('Площадь круга радиусом {:.1f} равна {:.2f}'.format(r, pi * r**2)) #заданный формат

Площадь круга радиусом 10.0 равна 314.16


[Здесь](https://pythonworld.ru/osnovy/formatirovanie-strok-metod-format.html) можно почитать, как пользоваться форматированием строк более подробно.

В современных версиях Python (>= 3.6) поддерживается более удобный способ форматирования - с помощью **f-строк**. Он использует такие же спецификаторы формата, что и метод `format()`, но значения, которые нужно вставить в строку, записываются прямо по месту вставки. Прочитайте об этом способе [здесь](https://www.python.org/dev/peps/pep-0498/)



In [332]:
print(f'Площадь круга радиусом {r} равна {pi * r**2}') #формат по умолчанию
print(f'Площадь круга радиусом {r:.1f} равна {pi * r**2:.2f}') #заданный формат

Площадь круга радиусом 10 равна 314.1592653589793
Площадь круга радиусом 10.0 равна 314.16


Количество цифр после запятой при автовыводе результатов можно также задавать с помощью волшебной команды `%precision`, но это будет работать не везде.

##### Преобразование строки в число

In [333]:
int('3')

3

In [334]:
float('3.14')

3.14

In [335]:
#int('3.14') # ошибка

### Пустое значение

Чтобы показать, что имя переменной не связано ни с каким объектом, в Python используется специальное значение: `None`

In [336]:
x = None
print(x)
type(x)

None


NoneType

In [337]:
x is None #проверка на пустое значение

True

## Коллекции

Типы-коллекции позволяют хранить большое количество элементов. В Python множество инструментов для удобной обработки коллекций.

### Списки
**Список (list)** позволяет создать коллекцию объектов любого типа.

In [338]:
l = [1, 2., 'три', False]

Нумерация элементов в Python начинается от нуля.

![Индексирование элементов списка](pics/list_indexing.svg 'Индексирование элементов списка')


Диапазон значений (**срез**) можно указать с помощью двоеточия: `[a:b]`

Обратите внимание, что правая граница (`b`) не включается в диапазон!


Извлечение элементов:

In [339]:
print(l)
l[0] #нумерация элементов начинается с нуля

[1, 2.0, 'три', False]


1

In [340]:
print(l)
l[-1] #последний элемент

[1, 2.0, 'три', False]


False

In [341]:
len(l) # длина списка

4

**Срезы (slices)** позволяют извлекать сразу несколько элементов.
Синтаксис среза: `[начало:конец:шаг]`

In [342]:
print(l)
l[1:3] #элементы с индексами 1 и 2. NB: Элемент 3 не включается!

[1, 2.0, 'три', False]


[2.0, 'три']

In [343]:
print(l)
l[2:] #все элементы, начиная с индекса 2 и до конца списка

[1, 2.0, 'три', False]


['три', False]

In [344]:
print(l)
l[1:-1] # Элементы со второго до предпоследнего

[1, 2.0, 'три', False]


[2.0, 'три']

In [345]:
print(l)
l[1:-1] # Элементы со второго до предпоследнего

[1, 2.0, 'три', False]


[2.0, 'три']

In [346]:
print(l)
l[::2] # Первый элемент, далее - каждый второй

[1, 2.0, 'три', False]


[1, 'три']

In [347]:
print(l)
l[::-1] # Все элементы в обратном порядке

[1, 2.0, 'три', False]


[False, 'три', 2.0, 1]

In [348]:
print(l)
l + l #слияние списков

[1, 2.0, 'три', False]


[1, 2.0, 'три', False, 1, 2.0, 'три', False]

In [349]:
print(s)
l2 = list(s) #список из строки
print(l2)

Сочи 
['С', 'о', 'ч', 'и', ' ']


Список - **изменяемый** тип данных (**mutable**)

In [350]:
print(l)
l[2] = 3
l

[1, 2.0, 'три', False]


[1, 2.0, 3, False]

Иногда возможность изменять данные приводит к неожиданностям:

In [351]:
print(f'Список l: {l}')
b = l
b[3] = True
print(f'Список b: {b}')
print(f'Снова список l: {l}')

Список l: [1, 2.0, 3, False]
Список b: [1, 2.0, 3, True]
Снова список l: [1, 2.0, 3, True]


Чтобы избежать побочных эффектов, можно создавать копии списков с помощью среза:

In [352]:
l = [1, 2, 3, 4]
print(f'Список l: {l}')

b = l[:] # Теперь b содержит копию l
b[-1] = 5

print(f'Список b: {b}')
print(f'Снова список l: {l}')

Список l: [1, 2, 3, 4]
Список b: [1, 2, 3, 5]
Снова список l: [1, 2, 3, 4]


Для копирования можно также использовать метод `copy()`:

In [353]:
l = [1, 2, 3, 4]
print(f'Список l: {l}')

b = l.copy() # Теперь b содержит копию l
b[-1] = 5

print(f'Список b: {b}')
print(f'Снова список l: {l}')

Список l: [1, 2, 3, 4]
Список b: [1, 2, 3, 5]
Снова список l: [1, 2, 3, 4]


### Кортежи

**Кортеж** (**tuple**) позволяет создать коллекцию объектов любого вида, однако, в отличие от списка, элементы этой коллекции нельзя менять после создания. Кортеж - **неизменяемый** тип (**immutable**)

In [354]:
t = (1, 2., 'три', False)

In [355]:
t[1:2]

(2.0,)

In [356]:
#t[2] = 3 #ошибка!

In [357]:
t + t #новый кортеж, составленный из двух копий t

(1, 2.0, 'три', False, 1, 2.0, 'три', False)

Кортежи очень полезны, когда необходимо вернуть несколько значений из функции.

In [358]:
def dimensions(l, w, h):
    """
    Возвращает объем, площадь горизонтального сечения и площадь поверхности коробки
    l - длина, w - ширина, h - высота -> объем, горизонтальное сечение и площадь поверхности
    """
    
    return (l * w * h, 
           l * w,
           2 * (l * w + l * h + w * h))

In [359]:
dimensions(1,1,1)

(1, 1, 6)

Для удобства, Python может выполнить автоматическую _распаковку_ кортежа:

In [360]:
volume, crossection, area = dimensions(1, 1, 1)
print(volume, crossection, area, sep=', ')

1, 1, 6


Кстати, скобки в `return` при возвращении кортежа тоже можно было не писать:

In [361]:
def dimensions(l, w, h):
    """
    Возвращает объем, площадь горизонтального сечения и площадь поверхности коробки
    l - длина, w - ширина, h - высота -> объем, горизонтальное сечение и площадь поверхности
    """
    
    return l * w * h, l * w,  2 * (l * w + l * h + w * h)

### Словари

**Словарь** (**dict**) позволяет создавать коллекцию объектов любого вида. Однако для выбора **значений** (**values**) из коллекции используются не индексы, а **ключи** (**keys**)

![Словарь](pics/dic_indexing.svg 'Ключи и значения в словаре')

Ключом может быть любой неизменяемый объект. Значение может быть любым объектом.

In [362]:
mydict = {'звери': ['собака', 'крот', 'утконос'],
         'птицы': ['дятел', 'дрофа']}

In [363]:
mydict['птицы'] #извлечение значения по ключу

['дятел', 'дрофа']

In [364]:
mydict['деревья'] = ['дуб', 'баобаб'] # Добавление нового элемента
mydict

{'звери': ['собака', 'крот', 'утконос'],
 'птицы': ['дятел', 'дрофа'],
 'деревья': ['дуб', 'баобаб']}

In [365]:
#mydict[0] #ошибка - элементы словаря не упорядочены, поэтому нельзя использовать числовые индексы

In [366]:
#mydict['грибы'] #ошибка - такого ключа нет

Для безопасного извлечения элементов можно использовать метод `get()`:

In [367]:
print(mydict.get('грибы'))

None


## Объекты

Все типы данных в Python являются _объектными_. 
Объект скрывает (инкапсулирует) в себе сложные данные и позволяет работать с ними через свои **атрибуты**.
![](pics/object.png)




Некоторые атрибуты (**свойства**) позволяют обращаться к данным объекта - считывать или изменять их.
Другие атрибуты (**методы**) - позволяют "командовать" объектом, заставляя его выполнять некоторые нужные нам действия. Во многих случаях (например, при сравнениях, выполнении арифметических операций, при печати) нужные методы вызываются автоматически.При этом программисту не важно, как именно эти действия реализованы "внутри". Важно знать, какой эффект дает вызываемый метод. 


![](pics/remote.jpg)

В Python даже числа - объекты:

In [368]:
x = 5.0
type(x)

float

Атрибуты:

In [369]:
print(dir(x))

['__abs__', '__add__', '__bool__', '__class__', '__delattr__', '__dir__', '__divmod__', '__doc__', '__eq__', '__float__', '__floordiv__', '__format__', '__ge__', '__getattribute__', '__getformat__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__int__', '__le__', '__lt__', '__mod__', '__mul__', '__ne__', '__neg__', '__new__', '__pos__', '__pow__', '__radd__', '__rdivmod__', '__reduce__', '__reduce_ex__', '__repr__', '__rfloordiv__', '__rmod__', '__rmul__', '__round__', '__rpow__', '__rsub__', '__rtruediv__', '__set_format__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__truediv__', '__trunc__', 'as_integer_ratio', 'conjugate', 'fromhex', 'hex', 'imag', 'is_integer', 'real']


Для доступа к атрибутам - вызова методов, или просмотра/изменения свойств используется "запись с точкой":   
- `переменная.метод()` 
- `переменная.свойство`

In [370]:
x.real # Действительная часть числа

5.0

In [371]:
x.imag # Мнимая часть числа

0.0

In [372]:
x.is_integer() # Проверить, является ли число целым


True

Обратим внимание, что при вызове метода мы не задавали никаких аргументов. Метод использует данные того объекта, у которого мы его вызываем. Этим метод отличается от обычной функции, которая может получить данные только через аргументы.

In [373]:
y = 5.5
y.is_integer() # тот же метод у другого объекта выдает другой результат

False

In [374]:
print(s)
type(s)

Сочи 


str

In [375]:
print(dir(s))

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']


Если в блокноте сразу после ввода точки нажать клавишу `Tab`, то выводится подсказка по методам и атрибутам объекта, на который ссылается переменная

In [376]:
# Попробуйте здесь получить подсказку по методам объекта-строки (переменная s)



In [377]:
s.upper()

'СОЧИ '

In [378]:
s.upper().strip()

'СОЧИ'

In [379]:
print(l)
type(l)

[1, 2, 3, 4]


list

In [380]:
print(dir(l))

['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']


In [381]:
l.reverse() #список изменяется "на месте"
print(l)

[4, 3, 2, 1]


Пока мы создавали объекты простых встроенных типов, используя константы (для чисел и строк) или специальный синтаксис со скобками (для списков, кортежей и словарей). Однако чаще всего объекты создаются с помощью специальной функции - **конструктора**. Имя конструктора совпадает с именем класса этого объекта. Конструкторы позволяют создавать объекты этого класса сразу с нужными свойствами. При этом, как правило, конструкторы могут создавать объект на основе данных разного типа.

In [382]:
list?

In [383]:
l1 = list() # пустой список
l1 

[]

In [384]:
l2 = list((1, 2, 3)) # список из кортежа
l2

[1, 2, 3]

In [385]:
l3 = list(s) # список из строки
l3

['С', 'о', 'ч', 'и', ' ']

Создание словарей через конструктор часто используется при оформлении графиков в matplotlib

In [386]:
dict(color = 'red', linestyle = 'dashed', size = 0.5) # Словарь

{'color': 'red', 'linestyle': 'dashed', 'size': 0.5}