# Словари
Словарь (dict) — неупорядоченная изменяемая коллекция, состоящая из пар «ключ-значение», где все ключи уникальны.

В этом уроке:
- разберем финальную структуру данных — словари
- научимся пользоваться ей на Python
- рассмотрим примеры, в которых её использование необходимо.

Итак, вы работаете в стартапе junior-аналитиком. Компания только-только выпустила приложение. При этом команда маркетинга активно рекламировала запуск продукта через разные каналы: таргетированную рекламу, через facebook, обзоры приложения у известных блогеров на youtube и рекламу в поисковиках.

Когда пользователь первый раз заходит в приложение, в форме регистрации он должен указать откуда узнал о продукте:
- facebook
- youtube
- нашел в google
- сарафанное радио
- другое

Под сарафанным радио подразумевается, что кто-то из знакомых уже использовал приложение и порекомендовал его. Ваша задача — узнать количество пользователей, которое принёс каждый из каналов продвижения, и сделать выводы о целесообразности их использования. По факту задача сводится к тому, что вам нужно посчитать частотность появления каждого из каналов.

На выходе вы получите значения вида:
- facebook: 120
- youtube: 299
- нашел в google: 300
- сарафанное радио: 432
- другое: 1

Нужно решить, в какой структуре данных вы будете хранить эти значения.

Один из вариантов – это переменные: создать 5 переменных и в них записывать частоты.

![perem](https://drive.google.com/uc?id=1Enqr-fAC2BwfDRbMyeIyJmzUhjs3Mvpo)

Проблема этого подхода в том, что если у вас будет не 5 элементов а 10, то придётся создавать 10 переменных. Это неудобно.

![perem2](https://drive.google.com/uc?id=1MbgdCovAH6BgM2ks2fw3Q2R_a3x0mXAz)

Следующий вариант — взять список и заполнять его динамически. В этом случае мы должны хранить где-то в голове, что ячейка 0 в списке соответствует инстаграму, ячейка 1 – ютубу, ячейка 2 – гуглу и так далее.

![dicts](https://drive.google.com/uc?id=1Pep0ynRZsCdX-YRFW7AhHO4kiMkJ4Sau)

Проблема этого подхода в том, что индексы численные и нам нужно где-то хранить связки индексов между названиями каналов.

В идеале — сделать индексы не числами, а как раз этими текстовыми значениями канала продаж.

![dicts2](https://drive.google.com/uc?id=1Qo-tJ2Ru-SYfYUrLb10me0cPNlfe6Fo0)

Но списки так не умеют. Индексы у них всегда от нуля и всегда числа. Значит, у нас возникла потребность в новой структуре данных.  

Как вы, наверное, уже догадались, нам подойдут словари.
Слайд 30

***Словари*** – это неупорядоченные изменяемые коллекции в Python, которые состоят из пар ключ-значение, причём все ключи уникальны.

По факту это аналог словаря – книжки, где вы ищете определённое слово и по нему находите его перевод или значение.

Схематически словарь можно представить так:
![dicts3](https://drive.google.com/uc?id=1c-HQSEyjgPazr3Tj6Ubige7oPnRAIJLZ)

В нашем случае ключами будут facebook, youtube, google, radio, other. А значениями будут 120, 299, 300, 432, 1. Причём ключи уникальны. Это значит, что ещё одной пары с ключом facebook уже быть не может.

![dicts4](https://drive.google.com/uc?id=12skP9Jkkli_jVzZ3t_f7NXvJUcVtf2Jn)



Создать пустой словарь можно двумя способами
1. Указав пустые фигурные скобки:

In [None]:
test_dict = {}
print(test_dict)
print(type(test_dict))

{}
<class 'dict'>


2. Вызвав команду `dict` с пустыми круглыми скобками.



In [None]:
test_dict = dict()
print(test_dict)
print(type(test_dict))

{}
<class 'dict'>


Как положить в словарь пары ключ-значение?
1. В фигурных скобках перечислить все пары, которые должны быть в словаре. Положим туда пару: facebook – 120. Для этого на первом месте указываем ключ: в нашем случае это строка 'facebook', и через двоеточие указываем значение: 120.


In [None]:
test_dict = {'facebook': 120}
print(test_dict)

{'facebook': 120}


Чтобы положить больше, чем одну пару, просто укажем их через запятые:



In [None]:
test_dict = {'facebook': 120, 'youtube': 299}
print(test_dict)

{'facebook': 120, 'youtube': 299}


Cейчас в `test_dict` лежит две пары. Увидеть количество пар можно, применив стандартную функцию `len()`:


In [None]:
len(test_dict)

2

Чтобы получить значение по ключу, в квадратных скобках нужно указать ключ, по которому нужно получить значение.

In [None]:
test_dict['facebook']

120

Если указать ключ, которого не существует, получим ошибку:



In [None]:
test_dict['123']

KeyError: '123'

Ключами могут быть не только строки, но и числа, и кортежи. Попробуем добавить такие ключи в `test_dict`. Чтобы добавить пару ключ-значение в словарь, напишем `test_dict`, в квадратных скобках укажем новый ключ и присвоим ему соответствующее значение через знак равно:



In [None]:
test_dict[1] = 115
test_dict

{'facebook': 120, 'youtube': 299, 1: 115}

In [None]:
test_dict[(1,2)] = 115
test_dict

{'facebook': 120, 'youtube': 299, 1: 115, (1, 2): 115}

Если вы укажете ключ, который уже существует, значение по нему просто обновится.

In [None]:
test_dict[1] = -100
test_dict

{'facebook': 120, 'youtube': 299, 1: -100, (1, 2): 115}

На типы данных ключей есть ограничения: они не могут быть изменяемыми (например, списками).

Зато на типы данных значений никаких ограничений нет, они могут быть и списками, и числами, и слонами. В общем, чем угодно.

Если мы добавили лишнюю пару в словарь, удалить её всегда можно с помощью конструкции `del`:



In [None]:
del test_dict[1]
del test_dict[(1,2)]
test_dict

{'facebook': 120, 'youtube': 299}

Вернёмся к нашей задаче. Предположим, вы уже посчитали частоты по каждому каналу продвижения и получили такой словарь:




In [None]:
frequency_dict = {'facebook': 120, 'youtube': 299, 'google': 300, 'radio': 432, 'other': 1}
frequency_dict

{'facebook': 120, 'google': 300, 'other': 1, 'radio': 432, 'youtube': 299}

Частоты — это хорошо, но их трудно сравнивать, так как мы не понимаем, сколько эти значения составляют от общего числа зарегистрированных в приложении пользователей. Вычислим процентное соотношение: сколько людей зарегистрировалось через каждый канал относительно всех зарегистрированных пользователей.

Для этого достаточно пройтись по всем парам ключ-значение в словаре и каждую частоту разделить на общее количество пользователей.

Чтобы найти общее количество пользователей, нужно просуммировать все значения во всех парах словаря. Получить значения из всех пар словаря можно с помощью специального метода `.values()`.

Применим к  словарю `frequency_dict` метод `.values()`:

In [None]:
frequency_dict.values()

dict_values([120, 299, 300, 432, 1])

Получили все значения из словаря в виде списка. Если это список, то к нему можно применить встроенную функцию `sum()`. Запишем полученное значение в новую переменную `total_users`.



In [None]:
total_users = sum(frequency_dict.values())
total_users

1152

Такой метод есть не только для значений, но и для ключей. Если вызвать метод `.keys()`, то получим список всех ключей в словаре.

In [None]:
frequency_dict.keys()

dict_keys(['facebook', 'youtube', 'google', 'radio', 'other'])

Аналогично можно получить все пары словаря, вызвав метод `.items()`.

In [None]:
frequency_dict.items()

dict_items([('facebook', 120), ('youtube', 299), ('google', 300), ('radio', 432), ('other', 1)])

Заметьте, каждая пара находится в круглых скобках, это значит, что тип данных пары — tuple.


Теперь посчитаем процентное соотношение для каждого канала. Будем перебирать все пары название канала — количество пользователей из словаря с помощью цикла.

Опишем цикл `for`, который будет брать такие пары поочерёдно из  `frequency_dict.items()`. Назовём пару двумя переменными `k` и `v` (по аналогии с key — ключ, value — значение). Выведем значения `k,v` в цикле, чтобы убедиться, что все работает верно:




In [None]:
for k,v in frequency_dict.items():
    print(k,v)

facebook 120
youtube 299
google 300
radio 432
other 1


Чтобы посчитать процентное соотношение, нужно взять значение количества, которое лежит в  `v`, поделить на `total_users` — общее количество пользователей — и умножить на 100. Добавим форматированный вывод с именем ключа, чтобы было понятно, к какому каналу продвижения относится получившийся процент.

In [None]:
for k,v in frequency_dict.items():
    percent = (v/total_users)*100
    print(f'{k}: {percent}')

facebook: 10.416666666666668
youtube: 25.95486111111111
google: 26.041666666666668
radio: 37.5
other: 0.08680555555555555


Как мы видим, через Facebook пришло около 10,4166666 %, больше всего пришло через сарафанное радио — около 37,5 %.
Получившиеся числа выглядят не очень красиво, так как у нас в дробной части очень много цифр. С точки зрения аналитика, такая точность чаще всего необязательна, а значения тяжело читаемы. Поэтому округлим получившиеся дробные значения до двух знаков после запятой.

Округлять дробные значения в Python можно с помощью функции  `round()`. Если в качестве аргумента в функцию передать дробное число, то оно будет округлено до ближайшего целого числа. Например, округлим 1.5 и 1.49:



In [None]:
round(1.49)

1

In [None]:
round(1.5)

2

`round()` позволяет также округлять до определённого знака после запятой. Для этого вторым параметром передадим, сколько знаков после запятой нужно оставить. Округлим 1.2356 до 3 знаков после запятой.

In [None]:
round(1.2356, 3)

1.236

В результате после запятой получили три цифры, последняя из которых была округлена.

Вернёмся к задаче с процентами. Осталось добавить округление в вывод.

In [None]:
for k,v in frequency_dict.items():
    percent = (v/total_users)*100
    print(f'{k}: {round(percent,2)}')

facebook: 10.42
youtube: 25.95
google: 26.04
radio: 37.5
other: 0.09


Теперь результат выглядит намного приятнее, и значения воспринимаются легче.

## Итоги

В этом уроке мы:
- Изучили новую структуру данных — словари. Это изменяемая, но неупорядоченная коллекция, которая хранит в себе пары ключ-значение.
- Попрактиковались с типом `dict`, который реализует словари в Python.
- Пока решали задачу со словарями, заодно изучили как округлять дробные числа с помощью встроенной функции  `round()`.

In [None]:
# Операции над словарями:

#Создание словаря
test_dict = {}
test_dict = dict()
test_dict = {'facebook': 120, 'youtube': 299}

#Количество пар в словаре
len(test_dict)

#Работа с элементами словаря
test_dict['facebook'] #получение значения по ключу 'facebook'
test_dict[1] = 115 #создание/изменение элемента словаря (значения) по ключу 1
test_dict[(1,2)] = 115 #кортежи тоже могут быть ключами
del test_dict[1] #удаление значения по ключу 1
frequency_dict.values() #все значения словаря
frequency_dict.keys() #все ключи словаря
frequency_dict.items() #все пары ключ-значение словаря

#Перебор всех пар ключ-значение словаря
for k,v in frequency_dict.items(): #k — ключ, v — значение
   percent = (v/total_users)*100
   print(f'{k}: {round(percent,2)}')