# Знакомство со словарями

## Знакомство со словарями

Списки — удобный и самый популярный способ сохранить большое количество данных в одной переменной. Списки индексируют все хранящиеся в них элементы. Первый элемент, как мы помним, лежит по индексу 0, второй — по индексу 1 и т. д. Такой способ хранения позволяет быстро обращаться к элементу списка, зная его индекс.

In [1]:
actors = ['Джонни Депп', 'Эмма Уотсон', 'Билли Пайпер']
print(actors[1])

Эмма Уотсон


Представим, что мы делаем свою онлайн-энциклопедию об актерах мирового кино (наподобие Википедии). Для каждого актера нужно сохранить текст статьи о нем. Ее название — строка, состоящая из фамилии и имени актера. Как правильно хранить такие данные?

Можно создать список кортежей. Каждый кортеж будет состоять из двух строк — названия и текста статьи.

In [3]:
actors = [('Джонни Депп', 'Джон Кристофер Депп Второй родился '
                          '9 июня 1963 года в Овенсборо, Кентукки...'),
 ('Сильвестр Сталлоне', 'Сильвестр Гарденцио Сталлоне родился в Нью-Йорке. '
                        'Его отец, парикмахер Фрэнк Сталлоне — иммигрант из Сицилии...'),
 ('Эмма Уотсон', 'Эмма Шарлотта Дуерр Уотсон родилась в семье английских адвокатов. '
                 'В пять лет переехала вместе с семьей из Парижа в Англию...'),
 # ...
 ]

Со временем количество статей значительно вырастет. Чтобы найти нужную статью по названию, нам придется написать цикл for, который пройдет по всем элементам списка actors и найдет в нем кортеж, первый элемент которого равен искомому названию. В приведенном выше примере, чтобы найти статью об Эмме Уотсон, нам придется в цикле пройти мимо Джонни Деппа и Сильвестра Сталлоне. Угадать заранее, что статья об Эмме Уотсон лежит после них, не получится.

Корень этой проблемы в том, что списки индексируются целыми числами. Мы же хотим находить информацию не по числу, а по строке — названию статьи. Было бы здорово, если бы индексами могли быть не числа, а строки. В списках это невозможно, однако возможно в словарях!

> ### Словарь
Словарь (в Python он называется dict) — тип данных, позволяющий, как и список, хранить много данных. В отличие от списка, в словаре для каждого элемента можно самому определить «индекс», по которому он будет доступен. Этот индекс называется ключом.


## Создание словаря

Вот пример создания словаря для энциклопедии об актерах мирового кино:

In [4]:
actors = {
 'Джонни Депп': 'Джон Кристофер Депп Второй родился 9 июня 1963 года '
                'в Овенсборо, Кентукки...',
 'Сильвестр Сталлоне': 'Сильвестр Гарденцио Сталлоне родился в Нью-Йорке. '
                       'Его отец, парикмахер Фрэнк Сталлоне — иммигрант из Сицилии...',
 'Эмма Уотсон': 'Эмма Шарлотта Дуерр Уотсон родилась в семье английских адвокатов. '
                'В пять лет переехала вместе с семьей из Парижа в Англию...',
 # ...
 }

> ### Создание словаря
Элементы словаря перечисляются в фигурных скобках (как и элементы множества!) и разделяются запятой. До двоеточия указывается ключ, а после двоеточия — значение, доступное в словаре по этому ключу.


Пустой словарь можно создать двумя способами:

In [5]:
d = dict()
# или так
d = {}

Вспомните, что создать пустое множество можно, только используя функцию set(). Теперь понятно, почему это так — пустые фигурные скобки зарезервированы для создания словаря.

## Обращение к элементу словаря

После инициализации словаря мы можем быстро получать статью про конкретного актера:

In [6]:
print(actors['Эмма Уотсон'])

Эмма Шарлотта Дуерр Уотсон родилась в семье английских адвокатов. В пять лет переехала вместе с семьей из Парижа в Англию...


> ### Важно!
Обращение к элементу словаря выглядит как обращение к элементу списка, только вместо целочисленного индекса используется ключ. В качестве ключа можно указать выражение: Python вычислит его значение, прежде чем обратится к искомому элементу.


In [7]:
first_name = 'Сильвестр'
last_name = 'Сталлоне'
print(actors[first_name + ' ' + last_name])

Сильвестр Гарденцио Сталлоне родился в Нью-Йорке. Его отец, парикмахер Фрэнк Сталлоне — иммигрант из Сицилии...


Если ключа в словаре нет, возникнет ошибка:

In [8]:
print(actors['Несуществующий ключ'])

KeyError: 'Несуществующий ключ'

## Добавление и удаление элементов

Важная особенность словаря — его динамичность. Мы можем добавлять новые элементы, изменять их или удалять. Изменяются элементы точно так же, как в списках, только вместо целочисленного индекса в квадратных скобках указывается ключ:

In [9]:
actors['Эмма Уотсон'] = 'Новый текст статьи об Эмме Уотсон'

Также в словари можно добавлять новые элементы и удалять существующие.

### Добавление элемента
Добавление синтаксически выглядит так же, как и изменение:

In [10]:
actors['Брэд Питт'] = 'Уильям Брэдли Питт, более известный как Брэд Питт — ' \
                      'американский актёр и продюсер. ' \
                      'Лауреат премии «Золотой глобус» за 1995 год, ...'

### Удаление элемента

Для удаления можно использовать инструкцию del (как и в списках):

In [11]:
actors['Джонни Депп'] = 'актер'
del actors['Джонни Депп']
# больше в словаре нет ни ключа 'Джонни Депп', 
# ни соответствующего ему значения

print(actors['Джонни Депп'])

KeyError: 'Джонни Депп'

### Удаление элемента
Удалять элемент можно и по-другому:

In [12]:
actors['Джонни Депп'] = 'актер'
actors.pop('Джонни Депп') 

'актер'

Единственное отличие этого способа от вызова del — он возвращает удаленное значение. Можно написать так:

In [13]:
actors['Джонни Депп'] = 'актер'
deleted_value = actors.pop('Джонни Депп')
print(deleted_value)

актер


В переменную deleted_value положится значение, которое хранилось в словаре по ключу 'Джонни Депп'. В остальном этот способ идентичен оператору del. В частности, если ключа 'Джонни Депп' в словаре нет, возникнет ошибка KeyError.

### Важно!

Чтобы ошибка не появлялась, этому методу можно передать второй аргумент. Он будет возвращен, если указанного ключа в словаре нет. Это позволяет реализовать безопасное удаление элемента из словаря:

In [14]:
deleted_value = actors.pop('Джонни Депп', None)
print(deleted_value)

None


Если ключа 'Джонни Депп' в словаре нет, в deleted_value попадет None.

## Проверка наличия элемента в словаре

Оператор in позволяет проверить, есть ли ключ в словаре:

In [15]:
if 'Джонни Депп' in actors:
    print('У нас есть статья про Джонни Деппа')

Проверить, что ключа нет, можно с помощью аналогичного оператора not in:

In [16]:
if 'Сергей Безруков' not in actors:
    print('У нас нет статьи о Сергее Безрукове')

У нас нет статьи о Сергее Безрукове


## Нестроковые ключи

Решим следующую задачу. Пусть дан длинный список целых чисел numbers. Мы знаем, что некоторые числа встречаются в этом списке несколько раз. Нужно узнать, сколько именно раз встречается каждое из чисел.

In [17]:
numbers = [1, 10, 1, 6, 4, 10, 4, 2, 2, 1, 10, 1]
counts = {}
for number in numbers:
    if number not in counts:
        counts[number] = 1
    else:
        counts[number] += 1
counts

{1: 4, 10: 3, 6: 1, 4: 2, 2: 2}

Просто так сделать counts[number] += 1 нельзя: если ключа number в словаре нет, возникнет ошибка KeyError.

В результате работы этой программы все элементы из списка numbers окажутся ключами словаря counts. Значением counts[x] будет количество раз, которое число x встретилось в списке numbers. Как это работает?

Цикл for перебирает все элементы списка numbers и для каждого проверяет, присутствует ли он уже в качестве ключа в counts. Если нет — значит, число встретилось нам впервые и мы инициализируем значение counts[numbers] = 1. Иначе увеличим counts[number] на единицу, поскольку число number встретилось нам повторно.

Почему для этой задачи не стоит использовать список, хотя ключи — обычные целые числа? Потому что, используя словарь, мы можем решить эту задачу и для вещественных чисел, и для очень больших целых чисел, и вообще для любых объектов, которые можно сравнивать.

## Методы словарей

Взять значение в словаре можно не только с помощью квадратных скобок, но и с помощью метода get:

In [18]:
article = actors.get('Джонни Депп')
article

Преимущество метода в том, что, кроме ключа, он может принимать и второй аргумент — значение, которое вернется, если заданного ключа нет:

In [19]:
article = actors.get('Джонни Депп', 'Статья о Джонни Деппа не найдена')
article

'Статья о Джонни Деппа не найдена'

Воспользуемся этим приемом для улучшения нашей программы в задаче о повторяющихся числах:

In [20]:
numbers = [1, 10, 1, 6, 4, 10, 4, 2, 2, 1, 10, 1]
counts = {}
for number in numbers:
    counts[number] = counts.get(number, 0) + 1
counts

{1: 4, 10: 3, 6: 1, 4: 2, 2: 2}

Попробуйте понять, почему это работает верно.

Все ключи словаря можно перебрать циклом for:

In [21]:
for actor_name in actors:
    print(actor_name, actors[actor_name])

Сильвестр Сталлоне Сильвестр Гарденцио Сталлоне родился в Нью-Йорке. Его отец, парикмахер Фрэнк Сталлоне — иммигрант из Сицилии...
Эмма Уотсон Новый текст статьи об Эмме Уотсон
Брэд Питт Уильям Брэдли Питт, более известный как Брэд Питт — американский актёр и продюсер. Лауреат премии «Золотой глобус» за 1995 год, ...


Другой способ сделать то же самое — вызвать метод .keys():

In [22]:
for actor_name in actors.keys():
    print(actor_name, actors[actor_name])

Сильвестр Сталлоне Сильвестр Гарденцио Сталлоне родился в Нью-Йорке. Его отец, парикмахер Фрэнк Сталлоне — иммигрант из Сицилии...
Эмма Уотсон Новый текст статьи об Эмме Уотсон
Брэд Питт Уильям Брэдли Питт, более известный как Брэд Питт — американский актёр и продюсер. Лауреат премии «Золотой глобус» за 1995 год, ...


### Метод .keys()

С помощью метода .keys() можно получить список всех ключей словаря:

In [23]:
actors_names = list(actors.keys())
actors_names

['Сильвестр Сталлоне', 'Эмма Уотсон', 'Брэд Питт']

### Метод .values()

Есть и парный метод .values(), возвращающий все значения словаря:

In [24]:
all_articles = list(actors.values())
all_articles

['Сильвестр Гарденцио Сталлоне родился в Нью-Йорке. Его отец, парикмахер Фрэнк Сталлоне — иммигрант из Сицилии...',
 'Новый текст статьи об Эмме Уотсон',
 'Уильям Брэдли Питт, более известный как Брэд Питт — американский актёр и продюсер. Лауреат премии «Золотой глобус» за 1995 год, ...']

Он позволяет, например, проверить, есть ли какое-нибудь значение value среди значений словаря:

In [25]:
'Адриано Челентано' in actors.values()

False

### Метод .items()

Если вы хотите перебрать элементы словаря d так, чтобы в переменной key оказывался ключ, а в value — соответствующее ему значение, это можно сделать с помощью метода .items() и цикла for.

`for key, val in d.items():`

Например:

In [26]:
for actor_name, article in actors.items():
    print(actor_name, article)

Сильвестр Сталлоне Сильвестр Гарденцио Сталлоне родился в Нью-Йорке. Его отец, парикмахер Фрэнк Сталлоне — иммигрант из Сицилии...
Эмма Уотсон Новый текст статьи об Эмме Уотсон
Брэд Питт Уильям Брэдли Питт, более известный как Брэд Питт — американский актёр и продюсер. Лауреат премии «Золотой глобус» за 1995 год, ...


## Допустимые типы ключей

Мы уже выяснили, что ключами в словарях могут быть строки и целые числа. Кроме этого, ключами могут быть вещественные числа и кортежи.

> ### Ключи в словаре
Ключами в словаре не могут быть другие словари. В принципе в одном словаре могут быть ключи разных типов, однако обычно принято использовать однотипные ключи.
Вообще, есть строгий способ определить, может ли объект быть ключом в словаре. Для этого объект должен быть неизменяемым. Неизменяемые объекты не могут поменять значение в себе во время выполнения программы. Неизменяемыми в Python являются числа, строки и кортежи. Именно их обычно и используют в качестве ключей словарей.


Вот как может выглядеть словарь с ключами-кортежами. В качестве ключа используются координаты, а в качестве значения — название города.

In [27]:
cities = {
    (55.75, 37.5): 'Москва', 
    (59.8, 30.3): 'Санкт-Петербург', 
    (54.32, 48.39): 'Ульяновск'
}
print(cities[(55.75, 37.5)])
cities[(53.2, 50.15)] = 'Самара'

Москва


Возможно, нам захочется развернуть этот словарь, то есть построить такой, в котором ключами будут города, а значениями — их координаты.

In [28]:
coordinates = {}
for coordinate, city in cities.items():
    coordinates[city] = coordinate

Если в исходном словаре были повторяющиеся значения, некоторые из них потеряются при разворачивании словаря. Это объясняется тем, что значения в словаре могут повторяться, а вот ключи обязаны быть уникальными.

Значениями в словаре, в отличие от ключей, могут быть объекты любого типа — числа, строки, кортежи, списки и даже другие словари. Вот, например, как можно сохранить список фильмов для каждого из актеров:

In [29]:
films = {
  'Джонни Депп': [
      'Эдвард Руки-Ножницы', 
      'Одинокий рейнджер', 
      'Чарли и шоколадная фабрика'],
  'Эмма Уотсон': [
      'Гарри Поттер и философский камень', 
      'Красавица и Чудовище'],
  # ...
}

# Вывести список фильмов, в которых снималась Эмма Уотсон
print(films['Эмма Уотсон'])

# Проверить, снимался ли Джонни Депп в фильме «Чарли и шоколадная фабрика»
if 'Чарли и шоколадная фабрика' in films['Джонни Депп']:
    print('Снимался!')

['Гарри Поттер и философский камень', 'Красавица и Чудовище']
Снимался!


Создавать словари можно с помощью генератора словарей. Синтаксис данной конструкции очень похож на списочные выражения. 

In [30]:
a = ['One', 'Two', 'Three']
b = [1, 2, 3]
d = {a[i]: b[i] for i in range(len(a))}
print(d)

{'One': 1, 'Two': 2, 'Three': 3}


## Упражнения

### Упражнение 1



Нобелевская премия по литературе вручается с 1901 года. Согласно Википедии, за это время было присуждено 107 премий. Семь раз — в 1914, 1918, 1935, 1940—1943 годах — награждение не проводилось. Четырежды — в 1904, 1917, 1966 и 1974 годах — премия была разделена между двумя авторами. По заданному имени нобелевского лауреата по литературе выведите год присуждения ему премии. Список лауреатов возьмите со страницы http://noblit.ru/Laureates.
#### Формат ввода

В единственной строке задано имя и фамилия (иногда с отчеством или вторым именем) нобелевского лауреата. Гарантируется, что введённая строка в точности содержится в первом столбце таблицы на странице http://noblit.ru/Laureates.
#### Формат вывода

Выведите одно число — год присуждения премии заданному лауреату.


![title](img/ex1.png)

In [34]:
# код решения

nobel_laureates = {
    "Эйвинд Йонсон": 1974,
    "Харри Мартинсон": 1974,
    "Патрик Виктор Мартиндейл Уайт": 1973,
    "Генрих Белль": 1972,
    "Пабло Неруда": 1971,
    "Александр Исаевич Солженицын": 1970,
    "Сэмюэл Беккет": 1969,
    "Ясунари Кавабата": 1968,
    "Мигель Астуриас": 1967,
    "Шмуэль Йозеф Агнон": 1966,
    "Нелли Закс": 1966,
    "Михаил Александрович Шолохов": 1965,
    "Жан-Поль Сартр": 1964,
    "Георгос Сеферис": 1963,
    "Джон Стейнбек": 1962,
    "Иво Андрич": 1961,
    "Сен-Жон Перс": 1960,
    "Сальваторе Квазимодо": 1959,
    "Борис Леонидович Пастернак": 1958,
    "Альбер Камю": 1957,
    "Хуан Рамон Хименес": 1956,
    "Хальдоур Кильян Лакснесс": 1955,
    "Эрнест Миллер Хемингуэй": 1954,
    "Уинстон Леонард Спенсер Черчилль": 1953,
    "Франсуа Мориак": 1952,
    "Пер Фабиан Лагерквист": 1951,
    "Бертран Рассел": 1950,
    "Уильям Фолкнер": 1949,
    "Томас Стернз Элиот": 1948,
    "Андре Жид": 1947,
    "Герман Гессе": 1946,
    "Габриела Мистраль": 1945,
    "Йоханнес Йенсен": 1944,
    "Франс Эмиль Силланпя": 1939,
    "Перл Бак": 1938,
    "Роже Мартен Дю Гар": 1937,
    "Юджин О'Нил": 1936,
    "Луиджи Пиранделло": 1934,
    "Иван Алексеевич Бунин": 1933,
    "Джон Голсуорси": 1932,
    "Эрик Карлфельдт": 1931,
    "Синклер Льюис": 1930,
    "Томас Манн": 1929,
    "Сигрид Унсет": 1928,
    "Анри Бергсон": 1927,
    "Грация Деледда": 1926,
    "Джордж Бернард Шоу": 1925,
    "Владислав Станислав Реймонт": 1924,
    "Уильям Батлер Йитс": 1923,
    "Хасинто Бенавенте - И - Мартинес": 1922,
    "Анатоль Франс": 1921,
    "Кнут Гамсун": 1920,
    "Карл Фридрих Георг Шпиттелер": 1919,
    "Карл Адольф Гьеллеруп": 1917,
    "Хенрик Понтоппидан": 1917,
    "Карл Густав Вернер фон Хейденстам": 1916,
    "Ромен Роллан": 1915,
    "Рабиндранат Тагор": 1913,
    "Герхардт Гауптман": 1912,
    "Морис Метерлинк": 1911,
    "Пауль Йоханн Людвиг фон Хейзе": 1910,
    "Сельма Лагерлеф": 1909,
    "Рудольф Кристоф Эйкен": 1908,
    "Джозеф Редьярд Киплинг": 1907,
    "Джозуэ Кардуччи": 1906,
    "Генрик Сенкевич": 1905,
    "Фредерик Мистраль": 1904,
    "Хосе Мария Вальдо Эчегарай - И - Эйсагирре": 1904,
    "Бьернстерне Мартиниус Бьернсон": 1903,
    "Теодор Моммзен": 1902,
    "Рене Сюлли-Прюдом": 1901,
}

print('Введите имя лауреата: ')
name = input()

print(nobel_laureates[name])

Введите имя лауреата: 
1966


### Упражнение 2



Вася учит новые слова. Для этого он пользуется небольшим толковым словарём. Каждая запись в словаре — это слово и текстовое описание его значения.

Для проверки мама называет Васе слова из словаря — а он должен воспроизводить их описания.

Помогите Васе справиться с проверкой.
#### Формат ввода

В первой строке задаётся целое число N (1 ≤ N ≤ 1000) — количество записей в толковом словаре Васи. В каждой из следующих N строк дано по одной записи: сначала идёт слово, а затем через пробел непустое описание его значения. Все слова, значение которых записано в словаре, различны.

В следующей строчке после толкового словаря записано целое число M (1 ≤ M ≤ 100) — количество слов, которое проверит мама. В следующих M строках перечислены слова для проверки, по одному на строке. Слова записаны в точности так, как они представлены в словаре.
#### Формат вывода

Для каждого слова из маминого списка проверки выведите описание его значения из словаря или фразу «Нет в словаре» (без кавычек), если такого слова нет в словаре.


![title](img/ex2.png)

In [35]:
# код решения

print('Введите количество записей в словаре: ')
N = int(input())

dictionary = {}

for _ in range(N):
    entry = input().strip().split(' ', 1)  
    word = entry[0]
    description = entry[1]
    dictionary[word] = description

print('Введите количество слов для проверки: ')
M = int(input())

for _ in range(M):
    check_word = input().strip()
    if check_word in dictionary:
        print(dictionary[check_word])  
    else:
        print('Нет в словаре') 

Введите количество записей в словаре: 
Введите количество слов для проверки: 
значение слова2
значение слова6
значение слова8


### Упражнение 3



Дана строчка русского текста, состоящая из слов и пробелов. Словом считается последовательность русских букв, слова разделены одним или большим числом пробелов.

Для каждого слова этого текста узнайте порядковый номер его вхождения в текст именно в той форме, в которой указано слово. Для первого вхождения слова выведите «1», для второго вхождения того же слова выведите «2» и так далее.
#### Формат ввода

В единственной строчке записан русский текст. Длина текста не превышает 100 000 символов. Текст состоит только из русских букв и символов пробела.
#### Формат вывода

Для каждого слова исходного текста выведите одно целое число — номер вхождения этого слова в текст. Числа выведите через пробел. Количество чисел должно совпадать с количеством слов в исходном тексте.


![title](img/ex3.png)

In [38]:
# код решения

print('Введите текст: ')
text = input().strip()

words = text.split()

word_count = {}

result = []

for word in words:
    if word in word_count:
        word_count[word] += 1
    else:
        word_count[word] = 1
    result.append(word_count[word])
    
print(text)
print(' '.join(map(str, result)))

Введите текст: 
один два три два три три
1 1 1 2 2 3


### Упражнение 4



У Васи N одноклассников. Вася не смог запомнить их дни рождения и решил составить календарь дней рождений класса. По известному списку всех дней рождения научитесь определять, у кого день рождения в заданном месяце.
#### Формат ввода

В первой строчке записано целое число N (1 ≤ N ≤ 1000) — количество Васиных одноклассников. В следующих N строчках записана информация об их днях рождения. Каждая строчка состоит из трёх частей, разделённых пробелом — имени одноклассника, дня и месяца его рождения. Имя — это строка из русских букв, день — число от 1 до 31, а месяц — строка из набора «янв», «фев», «мар», «апр», «май», «июн», «июл», «авг», «сен», «окт», «ноя», «дек».

Имена всех одноклассников Васи различны.

В следующей строчке записано целое число M (1 ≤ M ≤ 100) — количество вопросов, на которое надо ответить. В следующих M строках содержатся сами вопросы. Вопрос — это название месяца в том же формате, в котором они задаются выше.
#### Формат вывода

Для каждого вопроса в отдельной строчке через пробел выведите имена всех одноклассников, которые родились в указанном месяце. Имена упорядочьте в лексикографическом порядке.

Если в заданном месяце никто не родился, оставьте соответствующую строку ответа пустой.

![title](img/ex4.png)

In [39]:
# код решения

N = int(input("Введите количество одноклассников: "))

birthdays = {}

for _ in range(N):
    entry = input().strip().split()
    name = entry[0]
    day = entry[1]
    month = entry[2]
    
    if month not in birthdays:
        birthdays[month] = []
    birthdays[month].append(name)

print('Введите количество вопросов: ')
M = int(input())

for _ in range(M):
    query_month = input().strip()
    if query_month in birthdays:
        names = sorted(birthdays[query_month])
        print(" ".join(names)) 
    else:
        print("") 

Введите количество вопросов: 
Однокл2
Однокл6
Однокл8
