# Семинар 7: cловари


Множества $-$ это достаточно удобная коллекция, чтобы хранить неповторяющиеся значения, однако иногда бывают случаи, когда хранить нужно не просто значение, а маппинг `key` -> `value`.

> **Cловарь (или ассоциативный массив)** $-$ это неупорядоченная структура данных, позволяющая идентифицировать ее элементы не по числовому индексу, а по произвольному.

### *Как создать пустой словарь?*

1. через `{}` (не путаем с множеством!)
2. через `dict()`

In [1]:
dictionary_one = {}
dictionary_two = dict()

In [2]:
print(type(dictionary_one), dictionary_two)

<class 'dict'> {}


Общее устройство словаря:
```python
{ключ_1: значение_1, ключ_2: значение_2, ..., ключ_n: значение_n}
```

**NB!** ключи повторяться **НЕ** могут, а значения могут!


### *Как создать непустой словарь?*

1. через `{}`<br>`{key: item}`

In [78]:
dictionary_three = {'a': 8.17, 'b': 1.49, 'c': 2.78}

In [79]:
print(dictionary_three)

{'a': 8.17, 'b': 1.49, 'c': 2.78}


2. через `dict()`:
- `dict(key=item)` $-$ только для **строковых** ключей

In [5]:
dictionary_four = dict(a=8.17, b=1.49, c=2.78) # но вообще лучше не пользоваться таким :)

In [6]:
print(dictionary_four)

{'a': 8.17, 'b': 1.49, 'c': 2.78}


- `dict([(key, item)])` $-$ список кортежей!

In [7]:
dictionary_five = dict([('a', 8.17), ('b', 1.49), ('c', 2.78)])

In [8]:
print(dictionary_five)

{'a': 8.17, 'b': 1.49, 'c': 2.78}


3. через `dict.fromkeys()`

`dict.fromkeys([keys], values)` $-$ словарь из ключей с одним значением (дефолтно `None`).

In [26]:
dict_six = dict.fromkeys(['a', 'b', 'c'])

In [27]:
print(dict_six)

{'a': None, 'b': None, 'c': None}


In [28]:
dict_six = dict.fromkeys(["one", "two", "three"], 3)
dict_six["one"] = 1

print(dict_six)

{'one': 1, 'two': 3, 'three': 3}


4. через соответствия, как в списках
`{key: item for ... in ...}`

In [11]:
dictionary_seven = {a: str(a) + '-й раз' for a in range(1, 7)}

In [12]:
print(dictionary_seven)

{1: '1-й раз', 2: '2-й раз', 3: '3-й раз', 4: '4-й раз', 5: '5-й раз', 6: '6-й раз'}


**NB!** В качестве значения словарю можно указать что угодно, а вот в качестве ключа $-$ только hashable:

In [14]:
d = {"values": [1, 2, 3]}
print(d)

{'values': [1, 2, 3]}


In [15]:
d = {[1, 2, 3]: "values"}

TypeError: unhashable type: 'list'

### *Как добавить элемент в существующий словарь?*

Как в список: `dictionary[key] = item`

In [80]:
print(dictionary_three)

dictionary_three['e'] = 12.70

print(dictionary_three)

{'a': 8.17, 'b': 1.49, 'c': 2.78}
{'a': 8.17, 'b': 1.49, 'c': 2.78, 'e': 12.7}


Так же можно его и поменять: `dictionary[key] = new_item`

**NB!** все ключи в словаре уникальны, поэтому, если вы не хотите менять ключ, когда он уже существует, проверяйте!

In [82]:
new_key = input()
new_item = float(input())

if new_key not in dictionary_three:
    dictionary_three[new_key] = new_item

In [83]:
print(dictionary_three)

{'a': 8.17, 'b': 1.49, 'c': 2.78, 'e': 12.7, 'd': 4.26}


Еще есть `.update`: позволяет обновлять словарь, добавив новые key-value пары.

In [84]:
dictionary_three.update({'f': 2.23, 'g': 2.02})

print(dictionary_three)

{'a': 8.17, 'b': 1.49, 'c': 2.78, 'e': 12.7, 'd': 4.26, 'f': 2.23, 'g': 2.02}


In [85]:
dictionary_three = {**dictionary_three, **{'f': 2.23, 'g': 2.02}}  

print(dictionary_three)

{'a': 8.17, 'b': 1.49, 'c': 2.78, 'e': 12.7, 'd': 4.26, 'f': 2.23, 'g': 2.02}


In [49]:
params = {"sep": ", ", "end": "!"}  # а вот для чего эти ** еще нужны
words = ["one", "two", "three"]
print(*words, **params)  # советую запомнить, такая конструкция очень часто встречается

one, two, three!

#### Задание 1

Создайте свой словарь, в котором ключи $-$ названия шести фильмов, а значения $-$ ваша целочисленная оценка этих фильмов от 1 до 10. 

Дайте пользователю возможность добавить информацию о каком-то одном фильме в получившийся словарь. Пользователь вводит в первой строчке название фильма, во второй $-$ свою целочисленную оценку этого фильма. Однако вам надо проверить, что этого фильма в словаре до этого не было.

In [None]:
# место для вашего кода

### *Как сослаться на элемент в существующем словаре?*

`dictionary[key] -> item`

In [86]:
print(dictionary_three['d'])

4.26


In [87]:
print(dictionary_three['p'])

KeyError: 'p'

Ой, у нас нет такого ключа, поэтому *KeyError* ошибка. **А как ее избежать?**

1. Можно проверять его наличие в словаре:

In [88]:
existed_key = input()

if existed_key in dictionary_three:
    print(dictionary_three[existed_key])

4.26


2. А еще есть метод `dictionary.get(key)`, который возвращает соответствующее значение или, если нет ключа, `None` или заданное значение.

In [89]:
print(dictionary_three.get('a'), dictionary_three.get('n'))

8.17 None


In [90]:
print(dictionary_three.get('n', 'Нет такого элемента'))

Нет такого элемента


3. `dictionary.pop(key, value)`: аналогично `.get`, только с удалением ключа. Если ключа нет, все так же вернется то, что записано вторым аргументом (или дефолтное `None`).

In [91]:
print(dictionary_three.pop('e', -1))
print(dictionary_three.pop('n', -1))

print(dictionary_three)

12.7
-1
{'a': 8.17, 'b': 1.49, 'c': 2.78, 'd': 4.26, 'f': 2.23, 'g': 2.02}


4. `dict.setdefault(key[, default])` возвращает значение по ключу, либо default (если не прописан, то `None`). Если ключ отсутствует, то в словарь добавляется пара key-default.

In [101]:
my_dict = {'red': 1}

print(my_dict.setdefault('red', 2))
print(my_dict)

1
{'red': 1}


In [102]:
my_dict = {'red': 1}

print(my_dict.setdefault('red', 2))
print(my_dict)

1
{'red': 1}


In [103]:
print(my_dict.setdefault('orange', 2))
print(my_dict)

2
{'red': 1, 'orange': 2}


In [104]:
print(my_dict.setdefault('black'))
print(my_dict)

None
{'red': 1, 'orange': 2, 'black': None}


### *Как пройтись по словарю?*

1. через цикл:

In [92]:
for letter in dictionary_three:
    print(f'Буква {letter} встречается в английских текстах в {dictionary_three[letter]}% случаев')

Буква a встречается в английских текстах в 8.17% случаев
Буква b встречается в английских текстах в 1.49% случаев
Буква c встречается в английских текстах в 2.78% случаев
Буква d встречается в английских текстах в 4.26% случаев
Буква f встречается в английских текстах в 2.23% случаев
Буква g встречается в английских текстах в 2.02% случаев


2. через `dictionary.items()` - возвращает пары ключ-значение

In [93]:
print(dictionary_three.items())

dict_items([('a', 8.17), ('b', 1.49), ('c', 2.78), ('d', 4.26), ('f', 2.23), ('g', 2.02)])


In [94]:
for letter, percent in dictionary_three.items():
    print(f'Буква {letter} встречается в английских текстах в {percent}% случаев')

Буква a встречается в английских текстах в 8.17% случаев
Буква b встречается в английских текстах в 1.49% случаев
Буква c встречается в английских текстах в 2.78% случаев
Буква d встречается в английских текстах в 4.26% случаев
Буква f встречается в английских текстах в 2.23% случаев
Буква g встречается в английских текстах в 2.02% случаев


In [95]:
print(type(dictionary_three.items()))

<class 'dict_items'>


#### Задание 2

Некая учительница К любит храни
ть оценки своих учеников в формате словаря `{Ученик: Оценка}`. Чтобы проверить, не слишком ли сложные были задания контрольной, К решила посчитать статистику $-$ сколько учеников получило каждую оценку и сохранить её в форме словаря. Помогите R написать такую программу, которая считала бы статистику по данному словарю оценок.

In [None]:
# место для вашего кода

### *Как получить все ключи / значения словаря?*

`dictionary.keys()` $-$ "список" всех ключей

`dictionary.values()` $-$ "список" всех значений

In [96]:
print(dictionary_three.keys())

dict_keys(['a', 'b', 'c', 'd', 'f', 'g'])


In [97]:
print(dictionary_three.values())

dict_values([8.17, 1.49, 2.78, 4.26, 2.23, 2.02])


In [None]:
print(sum(dictionary_three.values()))

20.95


### *Как сортировать словарь*

1. по ключу

In [66]:
rooms = {"Pink": "#403", "Space": "#201", "Quail": "#500", "Lime": "#503"}

print(dict(sorted(rooms.items())))

{'Lime': '#503', 'Pink': '#403', 'Quail': '#500', 'Space': '#201'}


2. по значению

In [67]:
from operator import itemgetter

print(dict(sorted(rooms.items(), key=itemgetter(1))))

{'Space': '#201', 'Pink': '#403', 'Quail': '#500', 'Lime': '#503'}


Еще есть некоторая особенность, связанная со сравнением словарей. Со множествами это, кстати, работает так же: сравнение происходит без учета порядка.

In [73]:
d = {"name": "Kate", "surname": "Kozlova"}

print(d == {"surname": "Kozlova", "name": "Kate"})

True


### *Частотные словари*

#### Задание 3

Пусть нам дан список с цветами шариков в коробке, а мы хотим для каждого цвета подсчитать, сколько шариков данного цвета содержится в коробке.

```python
list_of_colors = ['blue', 'red', 'blue', 'green', 'yellow', 'pink', 'black', 'black', 'red', 'black', 'blue']
```

In [71]:
# место для вашего кода

А еще проще через `defaultdict`. По сути, это словарь, у которого на все ключи задан `setdefault`.

In [None]:
from collections import defaultdict

list_of_colors = ['blue', 'red', 'blue', 'green', 'yellow', 'pink', 'black', 'black', 'red', 'black', 'blue']
dict_of_colors_easy = defaultdict(int) # можно передать тип данных, по которому берется дефолтное значение
# для int это 0, для str -- пустая строка, для dict это {} и тд

In [107]:
for color in list_of_colors:
    dict_of_colors_easy[color] += 1

In [109]:
print(dict_of_colors_easy)

defaultdict(<class 'int'>, {'blue': 3, 'red': 2, 'green': 1, 'yellow': 1, 'pink': 1, 'black': 3})


А еще есть `Counter`!

In [110]:
from collections import Counter


words = "what a life what a night what a beautiful beautiful ride".split()
print(words)

counter = Counter(words)
print(counter)

['what', 'a', 'life', 'what', 'a', 'night', 'what', 'a', 'beautiful', 'beautiful', 'ride']
Counter({'what': 3, 'a': 3, 'beautiful': 2, 'life': 1, 'night': 1, 'ride': 1})


Возвращает список кортежей самых часто встречаемых элементов и их значений. Ели таких несколько, то приоритет у тех, которые встретились раньше:

In [111]:
print(counter.most_common(1))

[('what', 3)]


In [113]:
print(counter.most_common(2))

[('what', 3), ('a', 3)]


In [115]:
for word in counter.elements():  # выводятся слова с повторениями в порядке, в котором впервые встретились
    print(word)


what
what
what
a
a
a
life
night
beautiful
beautiful
ride


In [116]:
words = "but i crumble completely when you cry".split()
another_words = "when you look at me like that my darling what did you expect".split()

counter = Counter(words)
another_counter = Counter(another_words)

counter.subtract(another_counter)  # можно по-честному вычесть из одного каунтера другой

print(counter)

Counter({'but': 1, 'i': 1, 'crumble': 1, 'completely': 1, 'cry': 1, 'when': 0, 'you': -1, 'look': -1, 'at': -1, 'me': -1, 'like': -1, 'that': -1, 'my': -1, 'darling': -1, 'what': -1, 'did': -1, 'expect': -1})


#### Задание 4

Однажды во время написания программы для учета заказов разработчик забыл добавить функцию, которая приводит имена пользователей к одинаковому виду (все имена должны быть с маленькой буквы). Из-за этого в базе данных заказов вида: `{имя_пользователя : [заказ1, заказ2, ...]}` появились двойники, e.g. *Андрей* / *андрей*. При этом заказы оказались разделены по двойникам. Помогите разработчику починить словарь $-$ собрать всех двойников воедино.

Изначальный словарь:
```python
{'андрей': [1202, 1203], 'Алексей': [2101, 2811], 'Андрей': [505], 'петр': [219, 303]}
```
Починенный словарь:
```python
{'андрей': [1202, 1203, 505], 'алексей': [2101, 2811], 'петр': [219, 303]}
```



In [None]:
# место для вашего кода