# <span style="color: blue;">Основные типы данных</span>

## None
* сертифицированное "ничто"
* синглтон
* специальный тип: `NoneType`

In [None]:
None == None

In [None]:
None is None

In [None]:
a = None
a is None

In [None]:
type(None)

## Логические

In [None]:
to_be = False
to_be or not to_be

In [None]:
True or print(None)  # ленивый оператор

In [None]:
42 + True  # т.к. тип bool наследуется от целочисленного типа

In [None]:
int(True)

In [None]:
2 / False 

#### Особое поведение операторов

In [64]:
a = 7
a or "zero"

7

In [62]:
a = 0
a or "zero"

'zero'

In [58]:
a = []
a and a[2]

[]

In [4]:
x = 1
y = 2
(x > y) and x or y

2

In [65]:
1 == True 

True

#### Логические операции:
* `>`, `<`, `>=`, `<=`
* `==`, `!=`
* `not`, `or`, `and`

## Числовые типы

In [None]:
42  # int

In [54]:
42 ** 24  # приведение к длинному числу

907784931546351634835748413459499319296

_// в Python 2.x был `long` для этого_

In [None]:
.42  # float, 64 bit (т.е. как double)

In [None]:
42j  # complex

#### Особенности деления

In [None]:
16 / 3  # приведение к float

In [None]:
16 // 3

In [None]:
16 % 3

_// в Python 2.x немного иначе_

In [11]:
%%python2

print 16 / 3

5


#### Основные операции

* Арифметические операции: `+`, `-`, `/`, `*`, `**`, `%`
* Бинарные операции: `>>`, `<<`, `&`, `|`, `^`, `~`

## Строки

In [None]:
b'foo'

In [None]:
b'foo'.decode('utf-8')

In [None]:
'bar'

In [None]:
bar = "bar"
len(bar)

In [None]:
bar[0]

In [None]:
s = '.' * 10
s

In [None]:
s += 2

In [None]:
s += str(2)
s

In [None]:
"<b>" + s + "</b>"

In [None]:
"  foo bar   ".strip()

## Контейнеры

Это объекты, содержащие ссылки на другие объекты:
* `list` -- список (динамический массив, vector)
* `tuple` -- кортеж (неизменяемый список)
* `dict` -- словарь (хеш-таблица)
* `set` -- множество (хеш-сет)
* `frozenset` -- неизменяемое множество

## Список (list)

In [33]:
[]  # или list()

[]

In [50]:
[1, "Hi", [1, 2, 3], []]

[1, 'Hi', [1, 2, 3], []]

In [109]:
[0] * 4

[0, 0, 0, 0]

In [2]:
xs = [1, 2, 3, 4]
len(xs)

4

In [3]:
xs[0]

1

In [4]:
xs[-1]

4

In [5]:
xs[0] = -1
xs

[-1, 2, 3, 4]

In [6]:
xs.append(42)
xs

[-1, 2, 3, 4, 42]

In [7]:
del xs[0]  # или xs.pop(0)
xs

[2, 3, 4, 42]

In [8]:
xs.remove(3)
xs

[2, 4, 42]

In [9]:
xs.insert(1, 'test')
xs

[2, 'test', 4, 42]

In [11]:
xs.extend([10, 11, 12])
xs

[2, 'test', 4, 42, 10, 11, 12, 10, 11, 12]

In [54]:
xs.count('test')

3

In [56]:
'test' in xs

True

In [59]:
xs *= 3
xs

[1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4]

#### Конкатенация

In [20]:
xs = [1, 2, 3, 4]
xs + [5, 6]

[1, 2, 3, 4, 5, 6]

#### Слайсы (срезы)

In [133]:
xs = [1, 2, 3, 4]

Это полуинтервалы

In [117]:
xs[:2]  # 2 элемента

[1, 2]

In [118]:
xs[2:]

[3, 4]

In [121]:
xs[:2] + xs[2:] == xs  # удобненько

True

In [23]:
xs[1:3]  # 2 элемента потому что 3-1

[2, 3]

In [129]:
xs[2:2]  # пустой срез между двумя элементами

[]

In [130]:
xs[:1000]  # тоже норм

[1, 2, 4]

In [134]:
xs[1:-1]

[2, 3]

In [123]:
xs[0:4:2]  # шаг

[1, 3]

In [139]:
xs[-1:0:-1]

[4, 3, 2]

In [140]:
xs[-1::-1]

[4, 3, 2, 1]

In [141]:
xs[::-1]

[4, 3, 2, 1]

In [124]:
xs[:]  # полная копия

[1, 2, 3, 4]

In [None]:
xs.copy()

In [127]:
xs[2:3] = [10, 11, 12]
xs

[1, 2, 10, 11, 12, 4]

In [128]:
del xs[2:5]
xs

[1, 2, 4]

#### Циклическая ссылка

In [27]:
a = []
a.append(a)
a

[[...]]

#### Копирование

In [142]:
from copy import copy
from copy import deepcopy  # копирует также и элементы

In [144]:
a = []
a.append(a)
a[0].append(a)
b = deepcopy(a)
b

[[...], [...]]

In [145]:
id(a), id(b), id(b[0]), id(b[1])  # Круто!

(3012760140, 3013001068, 3013001068, 3013001068)

#### Как растёт память под список при добавлении элементов?

In [85]:
from sys import getsizeof
getsizeof([])  # в байтах

32

In [104]:
x = 1
getsizeof(x)

14

In [98]:
lst = []
prev = 0
for i in range(100):
    curr = (getsizeof(lst) - 32)
    if curr != prev:
        prev = curr
        print(i, '\t+', prev)
    lst.append(i)

1 	+ 16
5 	+ 32
9 	+ 64
17 	+ 100
26 	+ 140
36 	+ 184
47 	+ 232
59 	+ 288
73 	+ 352
89 	+ 424


## Кортеж (tuple)
_// неизменяемая версия списка_

In [12]:
()  # или tuple()

()

In [13]:
date = ("year", 2015)
date

('year', 2015)

In [25]:
x = 1,
x

(1,)

In [29]:
x = (1)  # int
x

1

In [22]:
x = (1, )  # tuple
x

(1,)

In [17]:
x = 1, 2, 3
x

(1, 2, 3)

В списках обычно хранятся элементы одного типа

В кортеже обычно значения разных типов (или разного смысла)

#### Распаковка

In [19]:
a, b, c = x
a

1

In [20]:
(mn, tu, we, th, fr, sa, sn) = range(7)
mn, sn

(0, 6)

#### Изменять картеж нельзя

In [30]:
date[1] = 2016

TypeError: 'tuple' object does not support item assignment

In [None]:
del date[0]

Операции чтения такие же, как и у списка

#### Преобразование списков и кортежей:

In [21]:
xs = [1, 2, 3]
tpl = tuple(xs)
tpl

(1, 2, 3)

In [23]:
lst = list(tpl)
lst

[1, 2, 3]

#### Интересная особенность

`immutable container` может содержать в себе `mutable`-элементы
<br/>
(то есть он неизменяемый только до первого уровня)

In [185]:
a = (1, 2, [3, 4])
a[2].append(5)
a  # по факту изменилось содержимое

(1, 2, [3, 4, 5])

`+=` для `tuple` создаёт новый `tuple`

In [188]:
print(id(a))
a += (5, )
print(id(a))
a

3051406988
3023831324


(1, 2, [3, 4, 5], 5, 5, 5)

Однако, с изменением элементов всё немного хитрее:

In [190]:
a[2] += [6]

TypeError: 'tuple' object does not support item assignment

Но тем не менее 2-й элемент изменился :))

In [191]:
a

(1, 2, [3, 4, 5, 6], 5, 5, 5)

## Множество (set)

In [149]:
set()  # нет литерала пустого множества

set()

In [151]:
set(range(10))

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

In [152]:
set([1, 2, "test"])

{1, 2, 'test'}

In [148]:
xs = {1, 2, 3, 4}

In [147]:
42 in xs

False

In [153]:
42 not in xs  # not (42 in xs)

True

In [10]:
xs.add(42)
xs

{1, 2, 3, 4, 42}

In [11]:
xs.discard(42)
xs

{1, 2, 3, 4}

In [154]:
xs.update([2,10])
xs

{1, 2, 3, 4, 10}

#### Особенности:
* можно очень быстро проверить, есть ли что-то в set
* всё хранится в единственном экземпляре

#### `set` -- быстрый способ удалить из контейнера дубликаты:

In [156]:
lst = [1, 2, 2, 3, 4, 4, 4]
len(set(lst))  # количество уникальных элементов

4

#### Что можно класть в `set`?

Всё, у чего можно посчитать `hash`, т.е. immutable

Ведь если элемент потом изменить, то изменился бы и его `hash`, и мы бы тогда уже не смогли найти этот элемент в hash-таблицеь

In [158]:
{[]}  # в set нельзя положить list

TypeError: unhashable type: 'list'

Если создать свой **изменяемый** тип с `hash`, то такие элементы лучше не класть в `set`, иначе можно когда-нибудь "выстрелить себе в ногу"

#### "`in`" и "`not in`" работают для всех контейнеров (и строк)

In [12]:
42 in [1, 2, 3, 4]

False

In [13]:
"month" not in ("year", 2015)

True

In [14]:
not 42 in xs  # не совсем однозначно, лучше не использовать

True

#### Основные операции над множествами

In [161]:
xs = {1, 2, 3, 4}
ys = {4, 5}

In [17]:
xs.intersection(ys)
xs & ys

{4}

In [18]:
xs.union(ys)
xs | ys

{1, 2, 3, 4, 5}

In [19]:
xs.difference(ys)
xs - ys

{1, 2, 3}

In [21]:
xs.symmetric_difference(ys)
xs ^ ys

{1, 2, 3, 5}

In [164]:
a = {1, 2, 3}
b = {1, 2, 3, 4, 5}
a < b

True

In [168]:
a = {1, 2, 3}
b = {1, 2, 3}
a <= b  # a.issubset(b)

True

## Словарь (dict)

In [22]:
{}  # или dict(), хеш-таблица

{}

In [170]:
date = {"year": 2015, "month": "September"}
date = dict(year=2015, month="September")
date

{'month': 'September', 'year': 2015}

In [25]:
len(date)

2

In [26]:
date["year"]

2015

In [27]:
date.get("day", 7)

7

In [29]:
date["year"] = 2016
date

{'month': 'September', 'year': 2016}

In [171]:
date.update({'year': 2018, 'month': 'October'})
date

{'month': 'October', 'year': 2018}

In [33]:
del date["year"]  # или date.pop("year")
date

{'month': 'September'}

In [34]:
"year" in date

False

In [178]:
date.setdefault('day', 1)
date

{'day': 1, 'month': 'October', 'year': 2018}

In [179]:
date.setdefault('year', 2000)
date

{'day': 1, 'month': 'October', 'year': 2018}

In [51]:
date.keys()  # возвращается set из ключей

dict_keys(['year', 'month'])

In [40]:
date.values()

dict_values([2015, 'September'])

In [41]:
date.items()

dict_items([('year', 2015), ('month', 'September')])

In [46]:
2015 in date.values()

True

#### `.keys()` возвращает именно аналог `set`

In [174]:
other_date = {"month": "October", "day": 24}

In [173]:
date.keys() + other_date.keys()

TypeError: unsupported operand type(s) for +: 'dict_keys' and 'dict_keys'

In [50]:
date.keys() | other_date.keys()

{'day', 'month', 'year'}

#### Ключ должен быть хешируемым

In [180]:
xs = [1, 2, 3]
d = {xs: 42}

TypeError: unhashable type: 'list'

In [181]:
d = {}
d[(1, 2, 3)] = 'hello'
d

{(1, 2, 3): 'hello'}

## Преобразование между типами

In [1]:
a = '123'
int(a)

123

In [71]:
b = 123
str(b)

'123'

In [72]:
a == b

False

In [12]:
a == str(int(a))

True

## Резюме

#### Базовые типы:
* "ничто": `NoneType`
* логические: `bool`
* числовые: `int`, `float`, `complex`
* строковые: `bytes`, `str`
* изменяемые коллекции: `list`, `set`, `dict`
* неизменяемые коллекции: `tuple`, `frozenset`

Чаще всего над объектами из одной группы можно совершить конкретное действие одним очевидным способом