## Об этом Jupyter Notebook
В этом notebook мы двигаемся дальше и узнаем новый тип данных - словари (dictionary). Мы уже знаем как работать со списками списков, которые могут хранить в себе наборы данных. Однако существует более привычная форма данных. Словари предлагают нам метод хранения данных **ключ: значение**. Словарь похож на список, но вместо индексов элементов в словаре используются ключи, а по ключам в словаре хранятся значения.
***

In [None]:
# Выполни прежде чем проходить Notebook
from google.colab import drive
drive.mount ('/content/gdrive', force_remount=True)

Mounted at /content/gdrive


# 1. Словари

В предыдущем notebook мы работали с данными `AppleStore.csv`. Колонка **content rating** предоставляет полезную информацию касательно возрастной категории для каждого приложения. Посмотрите ниже:

|Content rating |Number of apps|
|--|--|
|4+|4,433|
|9+|987|
|12+|1,155|
|17+|622|

Как мы можем хранить данные выше? Мы можем сделать это с помощью двух способов:
- Используя 2 отдельных списка
- Используя один список списков

In [None]:
# Два списка
content_ratings = ['4+', '9+', '12+', '17+']
numbers = [4433, 987, 1155, 622]

# Список списков
content_rating_numbers = [['4+', '9+', '12+', '17+'], [4433, 987, 1155, 622]]

Посмотрите на списки выше, вы, наверно, запутались какой рейтинг относится к какой цифре. Каждый элемент списка имеет свое значение ключа.


In [None]:
content_ratings = {'4+':4433, '9+':987, '12+':1155, '17+':622}
print(content_ratings)

{'4+': 4433, '9+': 987, '12+': 1155, '17+': 622}


Что мы создали выше:
- Каждой категории возраста соотнесли ее номер кол-ва приложений как **ключ:значение**
- Разделили каждую пару с помощью запятой
- Обернули последовательность в скобки {}

# 2. Индексирование (ВАЖНО)

Теперь вопрос, как мы можем извлечь конкретное значение из словаря **content_ratings**? Мы можем использовать значение ключа в виде **название_переменной[значение_ключа]**:

In [None]:
content_ratings = {'4+':4433, '9+':987, '12+':1155, '17+':622}
print(content_ratings['4+'])
print(content_ratings['12+'])

4433
1155


### Задание 1.5.2:
1. Извлеките значение из словаря **content_ratings**.
    - Используя ключ "9+", полученный результат запомните в переменную **over_9**
    - Используя ключ "17+", запомните в переменную **over_17**.
2. Распечатайте содержимое переменных **over_9** и **over_17**

In [None]:
# Начните писать свой код ниже:


## 3. Альтернативный способ создания словаря
Существует еще один способ создания словаря:
1. Создаем пустой словарь
2. Добавляем значения по одному в пустой словарь
    - как показано тут: **название_словаря[индекс] = значение**

Для примера допустим, что мы хотим добавить значение 4455 с ключом "+5" в словарь **content_ratings**, тогда нам нужно будет написать следующий код:
 ````python
content_ratings['5+'] = 4455
````

In [None]:
content_ratings = {}
content_ratings['5+'] = 4455

print(content_ratings)

{'5+': 4455}


In [None]:
# Чтобы продолжить добавлять больше значений, мы можем поступить следующим образом:

content_ratings = {}
content_ratings['4+'] = 4433
content_ratings['9+'] = 987
content_ratings['12'] = 1155
content_ratings['7+'] = 622

print(content_ratings)

{'4+': 4433, '9+': 987, '12': 1155, '7+': 622}


## 4. Пара ключ - значение
Ключ - это **индекс** значения в словаре. Например, по ключу "+4" мы можем из словаря извлечь значение 4433. Итого, "+4": 4433 - это пара ключ-значение.

Все типы данных как строки, целочисленные значения, дробные числа, булевы значения, списки и даже сами словари могут выступать в качестве значения в паре **ключ-значение**.

In [None]:
d_1 = { 'key_1' :'value_1',
        'key_2' :1,
        'key_3' :1.832,
        'key_4' :False,
        'key_5' :[1,2,3],
        'key_6' :{'inside key': 100}
}

print(d_1)
print(d_1['key_1'])
print(d_1['key_6'])

{'key_1': 'value_1', 'key_2': 1, 'key_3': 1.832, 'key_4': False, 'key_5': [1, 2, 3], 'key_6': {'inside key': 100}}
value_1
{'inside key': 100}


### Задание 1.5.4:

Создайте словарь **d_1**, присвоив ему следующие пары значений:
````python
{'key_1': 'first_value',
 'key_2': 2,
 'key_3': 3.14,
 'key_4': True,
 'key_5': [4,2,1],
 'key_6': {'inner_key' : 6}
 }
````

In [None]:
# Ваш код начниается здесь:


## 5. Подсчет кол-ва, используя словари

Код ниже показывает как обновлять или менять значения в рамках существующего словаря.

In [None]:
content_ratings = {'4+':4433, '9+':987, '12+':1155, '17+':622}

# Меняем значение ключа "+4" с 4433 на 1
content_ratings['4+'] = 1

# Добавляем 13 к текущему значению ключа "9+"
content_ratings['9+'] +=13

# Вычитаем 1128 к значению ключа "12+"
content_ratings['12+'] -= 1128

# Меняем значение ключа "+17" значением 511
content_ratings['17+'] = '511'

print(content_ratings)

{'4+': 1, '9+': 1000, '12+': 27, '17+': '511'}


Чтобы посчитать как часто встречается каждый рейтинг в этом ['4+', '4+', '4+', '9+', '9+', '12+', '17+'] списке нам стоит:
- создать словарь, где изначально счетчик по всем рейтингам принимает 0-ое значение
- проитерироваться по всему списку и для каждой итерации:
    - проверяйте существует ли итерируемый элемент из списка в словаре в качестве ключа
    - если существует, то прибавляйте единицу к счетчику данного ключа

In [None]:
content_ratings = {'4+':0, '9+':0, '12+':0, '17+':0}
ratings = ['4+','4+','4+','9+','9+','12+','17+']

for c_rating in ratings:
    if c_rating in content_ratings:
        content_ratings[c_rating] += 1
content_ratings

{'4+': 3, '9+': 2, '12+': 1, '17+': 1}

Для более понятного представления, мы можем распечатывать содержимое словаря **content_rating** в теле цикла **for** и увидеть какие изменения происходят при каждой итерации:

In [None]:
content_ratings = {'4+':0, '9+':0, '12+':0, '17+':0}
ratings = ['4+','4+','4+','9+','9+','12+','17+']

for c_rating in ratings:
    if c_rating in content_ratings:
        content_ratings[c_rating] += 1
    print(content_ratings)
print('Final dictionary:')
content_ratings

{'4+': 1, '9+': 0, '12+': 0, '17+': 0}
{'4+': 2, '9+': 0, '12+': 0, '17+': 0}
{'4+': 3, '9+': 0, '12+': 0, '17+': 0}
{'4+': 3, '9+': 1, '12+': 0, '17+': 0}
{'4+': 3, '9+': 2, '12+': 0, '17+': 0}
{'4+': 3, '9+': 2, '12+': 1, '17+': 0}
{'4+': 3, '9+': 2, '12+': 1, '17+': 1}
Final dictionary:


{'4+': 3, '9+': 2, '12+': 1, '17+': 1}

### Задание 1.5.5:

Посчитайте число уникально встречаемых рейтингов в нашем наборе данных.

1. Создайте словарь, назовите его как **content_ratings**, где ключи уникальны и содержат возрастной рейтинг со значением 0 в качестве счетчика.
2. Проитерируйтесь по набору данных **apps_data**. Убедительсь что не включили заголовки колонок. Для каждой итерации в цикле:
    - Запомните возрастной рейтинг в переменную **c_rating**. Возрастной рейтинг хранится 10-ым по счету индексу в списке каждый строки.
    - Проверяйте существует ли **c_rating** в качестве ключа в словаре **content_ratings**. Если существует, тогда прибавляйте к значению этого ключа +1.
3. За пределами цикла распечатайте содержимое словаря **content_ratings**, чтобы проверить правильность подсчета.

In [None]:
opened_file = open('/content/gdrive/MyDrive/01_Starting_with_Python/Data/AppleStore.csv', encoding='utf8')
from csv import reader
read_file = reader(opened_file)
apps_data = list(read_file)
# Начните писать свой код ниже:


## 6. Нахождение уникальных значений

В примере из 5 главы, мы узнали как считать уникально встречающиеся значения. Что если мы не знаем все уникальные возрастные рейтинги? Например, что нам следует сделать если у нас недостаточно информации чтобы создать словарь {'4+': 0, '9+': 0, '12+': 0, '17+': 0}.

Мы можем обновить код, как делали для списка ['4+', '4+', '4+', '9+', '9+', '12+', '17+'], с помощью условного выражения **if** и **else** следующим образом:
- если в словаре не существует ключа, то мы создаем новую пару ключ: значение со значением 1
- если же ключ уже существует, то прибавляем 1 к текущему значению.

In [None]:
content_ratings = {}
ratings = ['4+','4+','4+','9+','9+','12+','17+']

for c_rating in ratings:
    if c_rating in content_ratings:
        content_ratings[c_rating] += 1
    else:
        content_ratings[c_rating] = 1
content_ratings

{'4+': 3, '9+': 2, '12+': 1, '17+': 1}

Для того чтобы отследить что происходит внутри цикла добавим распечатку содержимого словаря после каждой итерации:

In [None]:
content_ratings = {}
ratings = ['4+','4+','4+','9+','9+','12+','17+']

for c_rating in ratings:
    if c_rating in content_ratings:
        content_ratings[c_rating] += 1
    else:
        content_ratings[c_rating] = 1
    print(content_ratings)

print('Final dictionary:')
content_ratings

{'4+': 1}
{'4+': 2}
{'4+': 3}
{'4+': 3, '9+': 1}
{'4+': 3, '9+': 2}
{'4+': 3, '9+': 2, '12+': 1}
{'4+': 3, '9+': 2, '12+': 1, '17+': 1}
Final dictionary:


{'4+': 3, '9+': 2, '12+': 1, '17+': 1}

### Задание 1.5.6:

Сейчас давайте немного попрактикуемся:

Посчитайте кол-во уникально встречаемых значений возрастного рейтинга в наборе данных.
1. Создайте пустой словарь, назвав его как **content_ratings**
2. Проитерируйте с помощью цикла for по набору данных **apps_data** (убедитесь, что строка с заголовком не включена в набор данных apps_data)
   Для каждой итерации:
      - Запоминайте значение рейтинга в переменную c_rating. Напомню, что рейтинг хранится под 10 индексом.
      - Проверьте существует ли **c_rating** в качестве ключа в словаре **content_ratings**
         - Если существует, то добавляйте значение +1 к значению найденной пары ключ: значение
         - Если не существует, то создайте новую пару ключ: значение, где в качестве ключа будет переменную **c_rating**, а в качестве значения цифра 3. За пределами тела цикла распечатайте содержимое словаря **content_ratings** для проверки насколько правильно реализован подсчет уникальных значений.

In [None]:
opened_file = open('/content/gdrive/MyDrive/01_Starting_with_Python/Data/AppleStore.csv', encoding='utf8')
from csv import reader
read_file = reader(opened_file)
apps_data = list(read_file)

# Ваш код начинается здесь:


## 7. Словари и цикл for
Мы можем узнать долю того или иного рейтинга, разделив кол-во определенного рейтинга на общее кол-во всех приложений:

In [None]:
content_ratings = {'4+':4433, '9+':987, '12+':1155, '17+':622}
total_number_of_apps = 7197

content_ratings['4+']/=total_number_of_apps
content_ratings['9+']/=total_number_of_apps
content_ratings['12+']/=total_number_of_apps
content_ratings['17+']/=total_number_of_apps

print(content_ratings)

{'4+': 0.6159510907322495, '9+': 0.13714047519799916, '12+': 0.16048353480616923, '17+': 0.08642489926358204}


Это будет сильно затратно по ресурсам обновлять каждый возрастной рейтинг словаря вручную. Следовательно мы можем воспользоваться циклом **for** для итерации по словарю.

In [None]:
content_ratings = {'4+':4433, '9+':987, '12+':1155, '17+':622}

for iteration_variable in content_ratings:
    print(iteration_variable)

4+
9+
12+
17+


Мы также можем использовать ключи словарей, чтобы получить доступ к значению словаря в цикле:

In [None]:
content_ratings = {'4+':4433, '9+':987, '12+':1155, '17+':622}

for iteration_variable in content_ratings:
    print(iteration_variable)
    print(content_ratings[iteration_variable])

4+
4433
9+
987
12+
1155
17+
622


Используя механизм выше, мы можем обновлять значения словаря с помощью циклов:

In [None]:
content_ratings = {'4+':4433, '9+':987, '12+':1155, '17+':622}
total_number_of_apps = 7197

for iteration_variable in content_ratings:
    content_ratings[iteration_variable] /= total_number_of_apps
print(content_ratings)

{'4+': 0.6159510907322495, '9+': 0.13714047519799916, '12+': 0.16048353480616923, '17+': 0.08642489926358204}


## 8. Небольшой бонус (ОПЦИОНАЛЬНО)

Использование циклов для итерации по словарям, которое мы демонстрировали в предыдущей главе, необходимы только для учебных целей. В PRODUCTION среде вы не будете этого использовать.

Вот одна из рекомендаций, которой следует пользоваться:
> Словарь имеет один из самых важных и полезных функций для проверки ``существования`` ключа. Эта функция называется ``get()``.

У функции ``get()`` есть полезная опция, которая позволяет вернуть конкретное значение в случае, если ключа в словаре нет. Если проверять существование ключа не используя функцию ``get()``, то Python бы ругался ошибкой KeyError.  По умолчанию функция ``get()`` при отсутствии ключа в словаре возвращает значение ``None``.

In [None]:
test_dict = {'A':1,'B':2}
print(test_dict.get('A'))
print(test_dict.get('C'))
print(test_dict.get('C','KEY DO NOT EXISTS'))

1
None
KEY DO NOT EXISTS


> Вот еще один способ проитерироваться по значениям словаря. Можем воспользоваться функцией ``items()``

In [None]:
test_dict = {'A':1,'B':2}
for key,value in test_dict.items():
    print(key,value)

A 1
B 2
