# Семинар 8

## Словари

**Словари** — последний базовый тип данных в питоне, который мы изучим. Словари — это такие списки, у которых в качестве «индексов» можно задавать разные неупорядоченные объекты. Такие «индексы» у словарей называются **ключами**. Если у списков конкретный элемент можно достать по индексу, то **значения** словаря можно достать по ключу. Таким образом, словари состоят не просто из элементов (как списки), а из пар «*ключ*»–«*значение*». Это делает работу с разными структурами данных значительно проще и интуитивнее.

В питоне словари называются `dict`. Объявляются они так: между ключом и значением пишется двоеточие, а между парами «ключ»–«значение» — запятые (как между элементами списка). Обрамляется всё это содержимое фигурными скобками:

```
slovar = {КЛЮЧ1: ЗНАЧЕНИЕ1, КЛЮЧ2: ЗНАЧЕНИЕ2, …}
```

Например, сделаем словарь, в котором будет содержаться, буквально, словарь! Вот так:

In [1]:
slovar = {
    "lời": "слово",
    "sông": "река",
    "núi": "гора"
}
print(slovar)
print(type(slovar))

{'lời': 'слово', 'sông': 'река', 'núi': 'гора'}
<class 'dict'>


Теперь для каждого из вьетнамских слов в словаре мы можем получить его значение. Для этого нужно обратиться к ключу (вьетнамскому слову) как к индексу списка:

In [2]:
print(slovar["lời"])
print(slovar["núi"])

слово
гора


Как и с индексами, если обратиться к несуществующему ключу, то получится ошибка — только уже не `IndexError`, а `KeyError`:

In [3]:
print(slovar["chân"])

KeyError: 'chân'

Если вдруг нужно создать пустой словарь, для этого есть два способа: (1) пустые фигурные скобки `{}` (обратите внимание, что так создаются словари, а *не множества*!) или (2) функция `dict()`:

In [4]:
empty_slovar = {}
print(empty_slovar)
print(type(empty_slovar))

{}
<class 'dict'>


In [5]:
empty_slovar = dict()
print(empty_slovar)
print(type(empty_slovar))

{}
<class 'dict'>


### Ключи и значения

И ключи, и значения могут быть объектами самых разных типов. У значений нет вообще никаких ограничений — они могут быть числами, строками, логическими выражениями, списками, кортежами, множествами или словарями. Например, можно сделать словарь, в котором будут храниться обозначения чисел на разных языках. Его ключами будут числа, а значениями — другие словари (в которых, в свою очередь, ключами будут разные языки, а значениями — числительные):

In [6]:
numerals = {
    1: {"Russian": ["один", "одна", "одно", "одни"], "English": "one", "German": ["ein", "eine", "eins"]},
    2: {"Russian": ["два", "две"], "English": "two", "German": "zwei"},
    3: {"Russian": "три", "English": "three", "German": "drei"},
    4: {"Russian": "четыре", "English": "four", "German": "vier"}
}

print(numerals[2])
print(numerals[2]["Russian"])
print(numerals[2]["German"])

{'Russian': ['два', 'две'], 'English': 'two', 'German': 'zwei'}
['два', 'две']
zwei


А вот у ключей есть некоторые ограничения. Ключами могут быть только неизменяемые типы данных. Это значит, что списки, множества и словари не могут быть ключами словарей. Если ключом нужно сделать последовательность, то придётся использовать кортеж:

In [7]:
print({0: "значение"})            # <-- int
print({0.0: "значение"})          # <-- float
print({"null": "значение"})       # <-- str
print({True: "значение"})         # <-- bool
print({("a", "b"): "значение"})   # <-- tuple

{0: 'значение'}
{0.0: 'значение'}
{'null': 'значение'}
{True: 'значение'}
{('a', 'b'): 'значение'}


In [8]:
print({["a", "b"]: "значение"})   # <-- list нельзя

TypeError: unhashable type: 'list'

In [9]:
print({ {"a", "b"}: "значение"})  # <-- set нельзя

TypeError: unhashable type: 'set'

In [10]:
print({ {"a": "b"}: "значение"})  # <-- dict нельзя

TypeError: unhashable type: 'dict'

### Работа с элементами словаря

Итак, к элементу можно обратиться по ключу. Так же по ключу можно и присвоить ключу другое значение. Например, заменим значение какому-нибудь вьетнамскому слову на другое:

In [11]:
print(slovar)
slovar["lời"] = "выгода"
print(slovar)

{'lời': 'слово', 'sông': 'река', 'núi': 'гора'}
{'lời': 'выгода', 'sông': 'река', 'núi': 'гора'}


Однако есть также и отличие от списков. Чтобы добавить в список новый элемент, надо воспользоваться методом `.append`. Если вместо этого попробовать просто присвоить новое значение индексу, которого пока нет в списке, то ничего не получится:

In [12]:
spisok = [13, 5.6, -20]
print(spisok)

[13, 5.6, -20]


In [13]:
spisok[2] = "novoe znachenie"       # <-- работает, потому что индекс 2 есть
spisok[3] = "eshe odno znachenie"   # <-- не работает, так как индекса 3 ещё нет

IndexError: list assignment index out of range

Словари работают иначе. В словаре можно добавить новое значение по ключу, которого в словаре ещё нет:

In [14]:
slovar["cổ"] = "шея"       # <-- работает несмотря на то, что ключа "xat" раньше не было
print(slovar)

{'lời': 'выгода', 'sông': 'река', 'núi': 'гора', 'cổ': 'шея'}


Чтобы удалить элементы из словаря, потребуется специальная конструкция с командой `del`. Сначала нужно написать `del`, а затем — словарь и в квадратных скобках ключ, который вы хотите удалить. Обратите внимание на то, что эта команда — не функция, так что с ней не используются скобки:

In [15]:
print(slovar)
del slovar["núi"]
print(slovar)

{'lời': 'выгода', 'sông': 'река', 'núi': 'гора', 'cổ': 'шея'}
{'lời': 'выгода', 'sông': 'река', 'cổ': 'шея'}


**Внимание!** Словарь является **упорядоченным** типом данных. Это значит, что ключи (и значения) сохраняются в том порядке, в котором вы их объявляете. А если в словарь добавляются новые элементы, они оказываются в конце.

### Итерация по словарям

Словарь — итерируемый объект. Однако если пройтись по нему циклом `for`, то «элементами» итерации окажутся только ключи:

In [16]:
for kluch in slovar:
    print(kluch)

lời
sông
cổ


Вывести значения в цикле тоже можно — для этого надо внутри цикла достать значение по ключу (в квадратных скобках):

In [17]:
for kluch in slovar:
    print(kluch, slovar[kluch])

lời выгода
sông река
cổ шея


Так же и если попытаться узнать, есть ли в словаре какой-то объект, с помощью оператора `in`, питон будет искать этот объект только в ключах. Например, и `"sông"`, и `"шея"` есть в словаре, но первое слово — ключ, а второе — значение:

In [18]:
print("sông" in slovar)
print("шея" in slovar)

True
False


Наконец, если сделать из словаря список, кортеж или множество, то в нём сохранятся только ключи:

In [20]:
print(list(slovar))

['lời', 'sông', 'cổ']


Как же делать все эти операции не с ключами, а со значениями? У словаря есть специальные методы, которые помогут вычленить:
- все ключи (`dict.keys()`)
- все значения (`dict.values()`)
- все пары «ключ»–«значение» в виде кортежей (`dict.items()`)

In [19]:
print(slovar)
print(slovar.keys())
print(slovar.values())
print(slovar.items())

{'lời': 'выгода', 'sông': 'река', 'cổ': 'шея'}
dict_keys(['lời', 'sông', 'cổ'])
dict_values(['выгода', 'река', 'шея'])
dict_items([('lời', 'выгода'), ('sông', 'река'), ('cổ', 'шея')])


Получившиеся в результате этих методов объекты — специальных типов (`dict_keys`, `dict_values`, `dict_items`). Ничего сложного в этих типах нет, главное — что по ним можно итерировать (или при необходимости превратить в список):

In [21]:
for item in slovar.items():
    print(item)

('lời', 'выгода')
('sông', 'река')
('cổ', 'шея')


In [23]:
print("река" in slovar)
print("река" in slovar.values())

False
True


К словарю и к его ключам и значениям также можно применить, например, функцию `len()`. Так как каждому ключу соответствует одно значение, число ключей и число значений в словаре всегда будет одно и то же:

In [24]:
print(len(slovar))
print(len(slovar.keys()))
print(len(slovar.values()))
print(len(slovar.items()))

3
3
3
3


## Сортировки

Иногда нам нужно отсортировать содержимое списка определённым способом. Например, отсортировать числа по их значению:

In [25]:
spisok = [400, -400, -3.5, 0.07, 12, 0.0001, 34, 12.0]

Для этого пригодится функция **`sorted()`**. Эта функция — основной способ **сортировать итерируемые объекты** в питоне. Она сравнивает все объекты между собой уже известными нам операторами (`>`, `<`, `==`) и расставляет их по порядку, от наименьшего к наибольшему:

In [26]:
print(spisok)
print(sorted(spisok))

[400, -400, -3.5, 0.07, 12, 0.0001, 34, 12.0]
[-400, -3.5, 0.0001, 0.07, 12, 12.0, 34, 400]


Сравнивать между собой можно не только числа, но и строки. При сравнении двух символов учитывается их номер в Юникоде (большой таблице символов, которая встроена в наши компьютеры и телефоны — каждому символу приписан уникальный номер). (Рекомендую прочитать [небольшую статью про Юникод](https://habr.com/ru/companies/vk/articles/547084), чтобы лучше понимать, что это.) В таком случае «больше» оказывается тот символ, у которого больше номер по Юникоду. Например, все буквы латинского алфавита идут по алфавиту, поэтому, конечно же, буква `"b"` «меньше» `"q"`. Но при этом важно, что заглавные и строчные буквы в Юникоде — разные символы, и заглавные идут до строчных, поэтому `"B"` «больше» `"b"`. Кириллические буквы в Юникоде расположены после латинских и поэтому всегда «больше» латинских, а арабские буквы — ещё дальше (и поэтому ещё «больше»):

In [27]:
print("b" > "q")
print("b" > "B")  # верно, потому что все заглавные буквы имеют меньший номер в Юникоде → «меньше», чем строчные
print("b" > "Q")  # верно, потому что все заглавные буквы имеют меньший номер в Юникоде → «меньше», чем строчные

False
True
True


In [28]:
print("ы" > "q")  # верно, потому что все кириллические буквы имеют больший номер в Юникоде → «больше», чем латинские
print("ق" > "q")  # верно, потому что все арабские буквы имеют больший номер в Юникоде → «больше», чем латинские

True
True


В таком случае легко предсказать, как рассортируются разные символы:

In [29]:
bukvar = ["d", "D", "ص", "s", "ж", "ظ", "Q",  "Ю"]
print(bukvar)
print(sorted(bukvar))

['d', 'D', 'ص', 's', 'ж', 'ظ', 'Q', 'Ю']
['D', 'Q', 'd', 's', 'Ю', 'ж', 'ص', 'ظ']


Сравнивать можно не только строки, состоящие из одного символа, но и целые последовательности символов. Для этого питон сравнивает первые символы двух строк, а если они одинаковые, сравнивает вторые, и так далее:

In [30]:
print("axyz" < "bxyz")  # сравнение первой пары символов ("a" и "b")
print("axyz" < "bcde")  # сравнение первой пары символов ("a" и "b")

True
True


In [31]:
print("abcd" < "axyz")  # первые символы двух строк одинаковые → сравнение второго символа ("b" и "x")
print("abcd" < "abcq")  # первые три символа одинаковые → сравнение четвёртого симвоа ("d" и "q")

True
True


Если можно сравнивать, значит, можно и сортировать:

In [32]:
spistrok = ["AB", "ab", "bc", "ac", "aac", "aa", "b", "AAA", "abc"]
print(spistrok)
print(sorted(spistrok))

['AB', 'ab', 'bc', 'ac', 'aac', 'aa', 'b', 'AAA', 'abc']
['AAA', 'AB', 'aa', 'aac', 'ab', 'abc', 'ac', 'b', 'bc']


### Аргументы `sorted()`

В функцию `sorted()` можно подать ещё два именованных аргумента: `reverse` и `key`.

Аргумент **`reverse`** указывает, будет ли сортировка проводиться от наименьшего к наибольшему или наоборот (`reverse=True`). Этим аргументом должно быть логическое значение (`True` или `False`). По умолчанию (если не подавать этот аргумент) оно равно `False`, поэтому по умолчанию список сортируется от наименьшего к наибольшему:

In [33]:
print(sorted(spistrok))
print(sorted(spistrok, reverse=False))
print(sorted(spistrok, reverse=True))

['AAA', 'AB', 'aa', 'aac', 'ab', 'abc', 'ac', 'b', 'bc']
['AAA', 'AB', 'aa', 'aac', 'ab', 'abc', 'ac', 'b', 'bc']
['bc', 'b', 'ac', 'abc', 'ab', 'aac', 'aa', 'AB', 'AAA']


Ещё один аргумент, **`key`**, позволяет эксплицитно указать, по какому *параметру* будет идти сортировка. В качестве аргумента `key` подаётся функция. Питон создаёт копию сортируемого списка и применяет к нему эту функцию, а потом сортирует исходный список по изменённому. Это звучит сложно, так что проще показать на примере. Например, если подать функцию `len`, то сортировка будет идти как бы по длине элементов. Обратите внимание, что функция подаётся без скобок:

In [34]:
print(sorted(spistrok))
print(sorted(spistrok, key=len))   # сначала строки из одного символа, потом двух, потом трёх

['AAA', 'AB', 'aa', 'aac', 'ab', 'abc', 'ac', 'b', 'bc']
['b', 'AB', 'ab', 'bc', 'ac', 'aa', 'aac', 'AAA', 'abc']


Например, аргумент `key` поможет нам отсортировать строки по алфавиту без учёта регистра — для этого подадим в него метод строк `.lower()` (все буквы станут строчными):

In [35]:
print(sorted(spistrok, key=str.lower))

['aa', 'AAA', 'aac', 'AB', 'ab', 'abc', 'ac', 'b', 'bc']


Также можно сортировать, например, списки списков или кортежей. Возьмём список, в котором хранятся кортежи, и попробуем отсортировать этот список по размеру вложенных кортежей:

In [36]:
spisok = [
    (0, 1, 2, 3, 4),
    (0, 1, 2),
    (0, 1, 2, 555),
    (100,)
]
print(sorted(spisok, key=len))

[(100,), (0, 1, 2), (0, 1, 2, 555), (0, 1, 2, 3, 4)]


Но что делать, если нужно отсортировать словарь?

In [37]:
slovar = {"a": "яблоко", "c": "корица", "b": "банан"}

In [38]:
print(slovar)
print(sorted(slovar))
print(type(sorted(slovar)))

{'a': 'яблоко', 'c': 'корица', 'b': 'банан'}
['a', 'b', 'c']
<class 'list'>


Как видите, мы получили отсортированные ключи словаря — в формате списка. То есть отсортировать сам словарь (поменять порядок пар «ключ»–«значение» внутри словаря) таким образом мы не можем. Зато можно, например, отсортировать все значения:

In [39]:
print(slovar)
print(sorted(slovar.values()))

{'a': 'яблоко', 'c': 'корица', 'b': 'банан'}
['банан', 'корица', 'яблоко']


Отсортировать словарь, конечно, в питоне можно — просто одно функцией `sorted()` не обойтись, придётся «поработать руками», написать свой код. Больше про сортировки можно узнать [здесь](https://docs.python.org/3/howto/sorting.html) — кое-что из этого мы ещё изучим во второй половине курса!

## Задачи

### Словарь наизнанку

Вам дан словарь `slovar`, в котором ключами являются русские глаголы, а значениями — вложенные словари, в которых ключи — названия языков, а значения — переводы соответствующего глагола на эти языки.

Создайте новый словарь, который был бы «вывернутой наизнанку» копией этого — пусть в нём ключами будут названия языков, а значениями — вложенные словари, в которых ключи — русские глаголы, а значения — переводы глаголов на этот язык.

In [None]:
slovar = {
    "говорить": {
        "English": "speak",
        "Deutsch": "sprechen"
    },
    "спать": {
        "English": "sleep",
        "Deutsch": "schlaufen"
    },
    "играть": {
        "English": "play",
        "Deutsch": "spielen"
    }
}

In [None]:
# ваше решение



### Алфавиты

Дан словарь `alphabets`, в котором ключи — названия языков, а значения — множества, элементами которых являются алфавиты этих языков.

In [None]:
alphabets = {
    "english": set("abcdefghijklmnopqrstuvwxyz"),
    "vietnamese": set("abcdefghijklmnopqrstuvwxyzàảãáạâầấậăằắặêềếệôồốộơờớợùủũúụýỳỹ"),
    "czech": set("abcdefghijklmnopqrstuvwxyzáčďéěíňóřšťúůýž"),
    "yoruba": set("abcdefghijklmnopqrstuvwxyzẹọṣ")
}
for lang in alphabets:
    print(lang, alphabets[lang])

Применив операции над множествами, узнайте:

1. Какие буквы есть одновременно и во вьетнамском, и в чешском алфавитах, но отсутствуют в английском?
2. Какие буквы есть в английском, но отсутствуют одновременно и во вьетнамском, и в чешском?
3. Какие буквы уникальны (среди представленных в задаче) для языка йоруба? А для чешского?

In [None]:
# ваше решение



### Правители

> Это усложнённая версия задачи №7 из демоверсии контрольной работы №1.

Вам дан словарь, ключами которого являются исторические правители разных стран, а значениями — соответствующие страны, которыми они правили.
Пользователь вводит название какой-то из стран (которая, возможно, есть среди значений словаря, а возможно, и отсутствует).
Программа должна вывести в алфавитном порядке всех правителей, которые правили этой страной (каждого на отдельной строке).

In [None]:
rulers = {'Ленин' : 'СССР', 'Брежнев' : 'СССР',
          'Сёва' : 'Япония', 'Хэйсэй' : 'Япония',
          'Мэйдзи': 'Япония', 'Пу И' : 'Китай', 
          'Гуансюй' : 'Китай', 'Умберто II' : 'Италия'}

In [None]:
# ваше решение

