# Практика 03. Базовые конструкции языка Python. Коллекции данных: строки, списки, кортежи, множества, словари. Решение прикладных задач

**Списки**: содержат значения.<br>
Ими могут быть числа, строки, имена и так далее:<br>
Модели автомобилей;<br>
Имена собак;<br>
Посещенные страны;<br>
Посетители магазина и так далее.<br>

**Кортежи**: этот тип данных очень похож на список, но с одним исключением.<br>
**После создания кортежа его значения нельзя менять**. Списки — изменяемые, а кортежи — нет.<br>
Это может понадобиться в определенных случаях для достижения безопасности или просто удобства.<br>
В кортежах могут, например, храниться:<br>
Все месяцы года;<br>
Дисциплины Олимпийских игр;<br>
Штаты США.<br>
Важно только отметить, что кортежи не являются вообще неизменяемыми, ведь вы всегда можете переписать код, поменяв или удалив определенные значения. Речь идет о том, что значения не могут быть изменены после создания — во время работы программы.

**Словари** — это пары из ключа и значения.<br>
Словари также являются изменяемыми.<br>
Это удобная структура данных, которая подходит для сохранения значения с определенными дополнительными параметрами, например:<br>
Данные клиента включая список его покупок<br>
Названия стран + их количество олимпийских медалей<br>
Автомобильные бренды и их модели<br>
Страны с количеством ДТП с летальным исходом<br><br>

Функции **list()** и **dict()** очень простые. Они помогают создавать соответствующие структуры данных.<br>
List(), dict() и float() используют круглые скобки, потому что они являются функциями.<br>
Скобки сами по себе представляют кортеж, и их не стоит путать со скобками в функциях, например, list().

**Инициализировать список, кортеж и словарь** можно несколькими способами.<br>
Один из наиболее распространенных — присвоить соответствующие символы переменной.<br>
Для списка эти символы — [], для кортежа — (), а для словаря — {}.<br>
Если присвоить эти символы без значений внутри, то будут созданы соответствующие пустые структуры данных.

In [None]:
import numpy as np
import pandas as pd

## Часть 1. Списки

### Основы работы со списками

In [None]:
# пустой список можно создать (инициализировать) через [] или функцию list()

some_list_1 = []
some_list_2 = list()

In [None]:
print(some_list_1, some_list_2)

[] []


In [None]:
# элементами списка могут, в частности, быть числа, строки, другие списки и словари

number_three = [3, 'число три', ['число', 'три'], {'число': 3}]
number_three

[3, 'число три', ['число', 'три'], {'число': 3}]

In [None]:
# длина списка рассчитывается через функцию len()

len(number_three)

4

### Индекс и срез списка

In [None]:
# у списка есть положительный и отрицательный индексы

abc_list = ['a', 'b', 'c', 'd', 'e']

In [None]:
# воспользуемся ими для вывода первого и последнего элементов

print(abc_list[0], abc_list[-1])

a e


In [None]:
# при работе с вложенным списком

salary_list = [['Анна', 90000], ['Игорь', 85000], ['Алексей', 95000]]

In [None]:
# вначале указываем индекс вложенного списка, а затем индекс элемента в нем

salary_list[1][0]

'Игорь'

In [None]:
# индекс элемента в списке можно узнать с помощью метода .index()

abc_list.index('c')

2

In [None]:
# метод .index() можно применить и ко вложенному списку

salary_list[0].index(90000)

1

В случае если необходимо получить **срез списка**, то так же как и в случае строк, указывается начало среза и элемент, до которого (но не включая который) нужно сделать срез.

In [None]:
# создадим список с днями недели

days_list = ['Пн', 'Вт', 'Ср', 'Чт', 'Пт', 'Сб', 'Вс']

In [None]:
# и выведем со второго по пятый элемент включительно

days_list[1:5]

['Вт', 'Ср', 'Чт', 'Пт']

У среза есть третий параметр — **шаг**. Он позволяет пропускать заданное количество элементов.

In [None]:
# выведем каждый второй элемент в срезе с первого по пятый

days_list[:5:2]

['Пн', 'Ср', 'Пт']

Можно проверить, содержится ли элемент в списке, с помощью ключевого слова `in`.

In [None]:
# проверим есть ли "Пн" в списке

'Пн' in days_list

True

In [None]:
# если "Вт" есть в списке

if 'Вт' in days_list:

  # выведем сообщение

  print('Такой день недели есть')

Такой день недели есть


### Добавление, замена и удаление элементов списка

In [None]:
# создадим список

weekdays = ['Понедельник', 'Вторник']

In [None]:
# добавим один элемент в конец списка с помощью метода .append()

weekdays.append('Четверг')
weekdays

['Понедельник', 'Вторник', 'Четверг']

Метод `.insert()` позволяет добавить элемент в середину списка, при этом индекс последующих элементов сдвигается.

In [None]:
# добавим элемент в определенное место в списке через желаемый индекс этого элемента

weekdays.insert(2, 'Среда')
weekdays

['Понедельник', 'Вторник', 'Среда', 'Четверг']

In [None]:
# изменим четвертый элемент в списке

weekdays[3] = 'Пятница'
weekdays

['Понедельник', 'Вторник', 'Среда', 'Пятница']

Элемент можно **удалить**, указав либо его название, либо индекс.

In [None]:
# удалим элемент по его значению

weekdays.remove('Пятница')
weekdays

['Понедельник', 'Вторник', 'Среда']

In [None]:
# удалим элемент по его индексу через ключевое слово del

del(weekdays[2])
weekdays

['Понедельник', 'Вторник']

In [None]:
# сделаем то же самое с помощью метода .pop()
# этот метод выводит удаляемый элемент

weekdays.pop(1)

'Вторник'

Все эти операции возможны благодаря тому, что **списки** (1) **упорядочены** и (2) **изменяемы**.

In [None]:
# посмотрим, что осталось в списке

weekdays

['Понедельник']

### Сложение списков

Добавить к списку еще один список можно с помощью метода `.extend()`.

In [None]:
more_weekdays = ['Вторник', 'Среда', 'Четверг', 'Пятница']

In [None]:
# соединить два списка можно с помощью метода .extend()

weekdays.extend(more_weekdays)
weekdays

['Понедельник', 'Вторник', 'Среда', 'Четверг', 'Пятница']

Кроме того, два списка можно просто сложить (**concatenate**).

In [None]:
weekend = ['Суббота', 'Воскресенье']

In [None]:
# или просто сложив два списка

print(weekdays + weekend)

['Понедельник', 'Вторник', 'Среда', 'Четверг', 'Пятница', 'Суббота', 'Воскресенье']


In [None]:
# иногда бывает полезно "размножить" элементы списка

['Понедельник'] * 2

['Понедельник', 'Понедельник']

In [None]:
# такие "произведения" также можно складывать

['Понедельник'] * 2 + ['Вторник'] * 2

['Понедельник', 'Понедельник', 'Вторник', 'Вторник']

### Сортировка списков

Для сортировки списка можно использовать функцию `sorted()` и метод `.sort()`. Функция `sorted()` не изменяет объект и сразу выводит результат сортировки.

In [None]:
# возьмем список чисел

nums = [25, 10, 30, 20, 5, 15]

In [None]:
# и отсортируем с помощью функции sorted(), результат выводится сразу

sorted(nums)

[5, 10, 15, 20, 25, 30]

In [None]:
# исходный список при этом не изменился

nums

[25, 10, 30, 20, 5, 15]

In [None]:
# если поместить результат в переменную, изменения сохранятся

sorted_nums = sorted(nums)
sorted_nums

[5, 10, 15, 20, 25, 30]

In [None]:
# метод .sort() сохраняет результат, но не выводит его сразу
# reverse = True задает сортировку по убыванию

nums.sort(reverse = True)

In [None]:
# выведем результат

nums

[30, 25, 20, 15, 10, 5]

Метод `.reverse()` задает обратный порядок элементов списка (объект также изменяется, результат по умолчанию не выводится).

In [None]:
# метод .reverse() задает обратный порядок, сохраняет, но не выводит результат

nums.reverse()

In [None]:
# его также нужно вывести отдельно

nums

[5, 10, 15, 20, 25, 30]

# Задание
1. Есть список имен `girls`:<br>
girls = ['Иветта', 'Виолетта', 'Кассандра', 'Вирджиния', 'Амелия', 'Розамунда', 'Янина', 'Беатриса'].<br>
Используя список `girls` и срезы, выведите на экран следующие списки:

    ['Виолетта', 'Кассандра', 'Вирджиния", 'Амелия']<br>
    ['Вирджиния', 'Амелия', 'Розамунда", 'Янина', 'Беатриса']<br>
    ['Иветта', 'Виолетта", 'Вирджиния', 'Амелия']<br>
    ['Кассандра', 'Амелия', 'Розамунда']<br>
*Подсказка:* для списков 3, 4 используйте срезы и сложение списков.<br>

2. Даны два списка `a` и `b`:<br>
   a = [1, 0, 9, 12, 18, 34, 89, 91, 33, 127]<br>
   b = [2, 8, 9, 11, 76, 25, 44]<br>
    
* Выведите на экран первый элемент списка `a`, третий элемент списка `a`, последний элемент списка `a`.
* Добавьте в список `b` элемент 7 (просто допишите в конец).
* Замените пятый элемент списка `a` на число 8.
* Создайте список `merged`, который включает в себя все элементы списка `a` и списка `b`.
* Создайте новый список `с`, который получается заменой последнего элемента списка `a` на число 100. Сам список `a` измениться не должен!<br>
  *Подсказка:* вспомните про метод `.copy()`.<br>

3. Дан список `d`: d = [12, 3, 8, 125, 10, 98, 54, 199]. Используя цикл выведите на экран (последовательно, с новой строчки):

* все элементы списка `d`;
* логарифмированные значения элементов списка `d` (потребуется функция `log()` из библиотеки `math`);
* замените пятый элемент списка `d` на 0. Проделайте те же операции, что и выше. Объясните, почему получаются такие результаты.

In [None]:
girls = ['Иветта', 'Виолетта', 'Кассандра', 'Вирджиния', 'Амелия', 'Розамунда', 'Янина', 'Беатриса']
print(girls[1:5])
print(girls[3:8])
print(girls[:2]+girls[3:5])
print(girls[2:3]+girls[4:6])


In [None]:
a = [1, 0, 9, 12, 18, 34, 89, 91, 33, 127]
b = [2, 8, 9, 11, 76, 25, 44]
print(a[0], a[2], a[-1])
b.append(7)
print(b)
a[4] = 8
print(a)
merget = [a + b]
print(merget)
c = a
c[-1] = 100
print(c)


1 9 127
[2, 8, 9, 11, 76, 25, 44, 7]
[1, 0, 9, 12, 8, 34, 89, 91, 33, 127]
[[1, 0, 9, 12, 8, 34, 89, 91, 33, 127, 2, 8, 9, 11, 76, 25, 44, 7]]
[1, 0, 9, 12, 8, 34, 89, 91, 33, 100]


In [None]:
d = [12, 3, 8, 125, 10, 98, 54, 199]
for i in range(0, len(d)):
  print(d[i])

12
3
8
125
10
98
54
199


In [None]:
import math
for i in range(0, len(d)):
  print(math.log(d[i]))


2.4849066497880004
1.0986122886681098
2.0794415416798357
4.8283137373023015
2.302585092994046
4.584967478670572
3.9889840465642745
5.293304824724492


In [None]:
d[4]=0
for i in range(0, len(d)):
  print(d[i])
for i in range(0, len(d)):
  print(math.log(d[i]))
  # ошибка т.к нет логарифма нуля


12
3
8
125
0
98
54
199
2.4849066497880004
1.0986122886681098
2.0794415416798357
4.8283137373023015


ValueError: math domain error

### Преобразование списка в строку

In [None]:
# дан список из строковых элементов

str_list = ['P', 'y', 't', 'h', 'o', 'n']

Преобразуем список в строку с помощью метода `.join()`. Обратите внимание, пространство между элементами списка мы ничем не заполняем и для этого оставляем кавычки пустыми ''.

In [None]:
# с помощью метода .join() можно соединить все элементы

joined_str = ''.join(str_list)
joined_str

'Python'

In [None]:
# если в кавычках ничего не указывать, элементы просто соединятся, но можно указать любой другой элемент

joined_str_ = '_'.join(str_list)
joined_str_

'P_y_t_h_o_n'

### Арифметика в списках

In [None]:
# дан список чисел

nums_ = [3, 2, 1, 4, 5, 12, 3, 3, 7, 9, 11, 15]

С помощью метода `.count()` можно посчитать частоту вхождения элемента в список.

In [None]:
# с помощью метода .count() мы можем посчитать частоту вхождения элемента в список

nums_.count(3)

3

In [None]:
# кроме того можно найти минимальное и максимальное значения и сумму элементов

print(min(nums_), max(nums_), sum(nums_))

1 15 75


## Часть 2. Кортежи

### Основы работы с кортежами

Кортеж (`tuple`) инициализируется при помощи круглых скобок () или функции `tuple()`.

In [None]:
# пустой кортеж можно создать с помощью пустых круглых скобок () или функции tuple()

tuple_1, tuple_2 = (), tuple()

print(tuple_1, tuple_2)

() ()


Во многом **кортеж** похож на список. Это также **упорядоченный** набор элементов с индексом, начинающимся с нуля.

In [None]:
# в кортеже элементы упорядочены, а значит есть индекс

letters = ('a', 'b', 'c')
letters[0]

'a'

Основное отличие от списка — **кортеж неизменяем**. После того как кортеж создан, добавлять или удалять элементы нельзя.<br>

Например, заменить элемент по его индексу нельзя.

In [None]:
# но изменить элемент, как мы это делали в списке, нельзя

letters[0] = 'd'

TypeError: 'tuple' object does not support item assignment

Для этого придется вначале преобразовать кортеж в список.

In [None]:
# для изменения элемента кортеж вначале нужно преобразовать в список

letters = list(letters)
letters[0] = 'd'
letters

['d', 'b', 'c']

In [None]:
# кортеж из одного элемента можно создать с помощью запятой

let_a = ('a', )

type(let_a)

tuple

In [None]:
# если запятую не указывать, получится строка

let_a = ('a')

type(let_a)

str

## Часть 3. Множества

Про множества важно запомнить три факта:

- Элементы множества **изменять нельзя**
- Множество — это набор **уникальных** элементов, а значит повторы в нем удаляются
- У множества нет индекса, элементы **не упорядочены**

### Создание множества

Множество можно создать с помощью функции `set()` или перечислив элементы в фигурных скобках `{}`.

In [None]:
# пустое множество задается через функцию set()

set_1 = set()

In [None]:
# непустое множество задается через функцию set() и список элементов

set_2 = set(['a', 'b', 'c', 'c'])

In [None]:
# или путем перечисления элементов в фигурных скобках {}

set_3 = {'a', 'b', 'c', 'c'}

In [None]:
# множество содержит только уникальные элементы, поэтому дубликаты удаляются

print(set_1, set_2, set_3)

set() {'a', 'b', 'c'} {'a', 'b', 'c'}


**!Обратите внимание**, Python вывел элементы множества не в том порядке, в котором они были изначально записаны, и кроме того удалил повторяющийся элемент 'c'.

In [None]:
# создать множество через пустые фигурные скобки нельзя

not_a_set = {}

# так создается словарь

type(not_a_set)

dict

### Добавление и удаление элементов

Изменять элементы множества нельзя. При этом ничто не мешает их добавлять или удалять. Предположим, мы начали создавать множество гласных букв в русском языке.

In [None]:
# предположим, что мы хотим создать множество гласных букв в русском языке

vowels = {'а', 'о', 'э', 'е', 'у', 'ё', 'ю'}

Метод `.add()` позволяет добавить элемент во множество. Например, букву «я».

In [None]:
# добавим одну букву "я" методом .add()

vowels.add('я')
vowels

{'а', 'е', 'о', 'у', 'э', 'ю', 'я', 'ё'}

Несколько элементов можно добавить с помощью метода `.update()`.

In [None]:
# добавим две буквы "и" и "ы" методом .update()

vowels.update(['и', 'ы'])
vowels

{'а', 'е', 'и', 'о', 'у', 'ы', 'э', 'ю', 'я', 'ё'}

In [None]:
# если по ошибке добавим согласную букву

vowels.add('щ')
vowels

{'а', 'е', 'и', 'о', 'у', 'щ', 'ы', 'э', 'ю', 'я', 'ё'}

Ее можно удалить с помощью метода `.remove()`.

In [None]:
# ее можно удалить методом .remove()

vowels.remove('щ')
vowels

{'а', 'е', 'и', 'о', 'у', 'ы', 'э', 'ю', 'я', 'ё'}

### Теория множеств в Python

Разумеется, объект множества в Python согласуется с математической теорией множеств (set theory).

В частности, **равные множества** — это множества, состоящие из одних и тех же элементов (при этом порядок элементов не важен). Python позволяет это проверить.

In [None]:
# два множества равны, если содержат одинаковые элементы, при этом порядок элементов не важен

{'a', 'b', 'c'} == {'c', 'b', 'a'}

True

Мощность множества или его кардинальное число отражает количество элементов множества и рассчитывается с помощью функции `len()`.

In [None]:
# выведем мощность множества с помощью функции len()

len({'a', 'b', 'c'})

3

In [None]:
# проверим, содержится ли элемент во множестве

'a' in {'a', 'b', 'c'}

True

In [None]:
# возможна и обратная операция

'a' not in {'a', 'b', 'c'}

False

### Подмножество и надмножество

Одно множество, назовем его A, называется **подмножеством (subset)** другого множества B, если все элементы множества A также принадлежат и множеству B. Python позволяет это проверить с помощью метода `.issubset()`.

In [None]:
# проверим является ли А подмножеством В

set_A = {'a', 'b', 'c'}
set_B = {'a', 'b', 'c', 'd', 'e', 'f'}

In [None]:
set_A.issubset(set_B)

True

Множество B называется **надмножеством (superset)** A, если A является подмножеством B. По сути, это обратная логическая операция, для которой есть метод `.issuperset()`.

In [None]:
# проверим является ли B надмножеством А

set_B.issuperset(set_A)

True

### Объединение, пересечение и разность множеств

Предположим, есть две команды инженеров машинного обучения, одна занимается обработкой естественного языка (nlp), другая — компьютерным зрением (cv). Некоторые занимаются и тем, и другим.

In [None]:
# даны участники команд по обработке естественного языка (nlp) и компьютерному зрению (cv)

nlp = set(['Анна', 'Николай', 'Павел', 'Оксана'])
cv = set(['Николай', 'Евгений', 'Ольга', 'Оксана'])

**Объединение множеств (union)** отражает логическую операцию ИЛИ. Выберем тех специалистов, которые состоят хотя бы в одной команде. Другими словами, принадлежат или одному, или другому множеству, или обоим сразу.

In [None]:
# найдем тех, кто работает или в nlp, или в cv, или в обеих командах

# можно использовать метод .union()

print(nlp.union(cv))

# или символ |

print(nlp | cv)

{'Ольга', 'Анна', 'Николай', 'Павел', 'Оксана', 'Евгений'}
{'Ольга', 'Анна', 'Николай', 'Павел', 'Оксана', 'Евгений'}


Есть два способа задать объединение множеств: через метод `.union()` или с помощью символа `|`. Аналогичные возможности есть и для других операций с множествами.

При **пересечении множеств (intersection)** осуществляется логическая операция И. Выбираем только тех людей, которые работают в обеих командах, т.е. принадлежат обоим множествам.

In [None]:
# найдем пересечение множеств, то есть тех, кто работает и в nlp, и в cv

print(nlp.intersection(cv))
print(nlp & cv)

{'Оксана', 'Николай'}
{'Оксана', 'Николай'}


**Разность множеств (difference)** nlp и cv позволяет увидеть, кто в команде по обработке естественного языка занимается только этой областью, и не учавствует в проектах по компьютерному зрению.

In [None]:
# выведем тех, кто работает только в nlp, но не в cv или cv и nlp одновременно

print(nlp.difference(cv))
print(nlp - cv)

{'Павел', 'Анна'}
{'Павел', 'Анна'}


In [None]:
# выведем тех, кто работает только в cv, но не в nlp или nlp и cv одновременно

print(cv.difference(nlp))
print(cv - nlp)

{'Евгений', 'Ольга'}
{'Евгений', 'Ольга'}


**Симметричная разность (symmetric difference)** множеств объединяет обе предыдущие операции разности.

In [None]:
# найдем тех, кто работает или в cv, или в nlp, но не в обеих областях одновременно

print(nlp.symmetric_difference(cv))
print(nlp ^ cv)

{'Ольга', 'Анна', 'Евгений', 'Павел'}
{'Ольга', 'Анна', 'Евгений', 'Павел'}


# Задание

- Даны два множества людей, посетивших Францию и Испанию. С помощью Python найдите тех, кто был и во Франции, и в Испании.
- Воспользуйтесь этими же множествами и найдите тех, кто был только в Испании, но не заезжал еще и во Францию.
- И наоборот, найдите тех, кто был только во Франции, но не в Испании.

In [None]:
france = {'Михаил', 'Евгений', 'Екатерина', 'Николай'}
spain = {'Татьяна', 'Василий', 'Екатерина', 'Николай'}

In [None]:
print(france & spain)
print(spain - france)
print(france - spain)

{'Екатерина', 'Николай'}
{'Василий', 'Татьяна'}
{'Евгений', 'Михаил'}


## Часть 4. Понятие словаря

**Словари**, наряду со списками, кортежами и множествами, также входят в состав **коллекций** (collections), т.е. структур данных, содержащих несколько элементов.

**Словарь** — неупорядоченный набор элементов с доступом по ключу.

Словарь состоит из **ключей** и **значений**. По ключу (key) всегда можно найти соответствующее ему значение (value).

*Например*, словарь для списка покупок: `shopping_dict` = {'огурцы': 2, 'помидоры': 3, 'лук': 1, 'картофель': 2}<br>
Ключи - овощи, значения - килограммы.

Для **создания словаря** используются фигурные скобки, в которые через запятую записываются ключи и значения, разделенные двоеточием:<br>
{ключ: значение, ключ: значение}

### Создание словаря

In [None]:
# пустой словарь можно создать с помощью {} или функции dict()

dict_1, dict_2 = {}, dict()

print(dict_1, dict_2)

{} {}


In [None]:
#списки

veg_list, quantity_list = ['огурцы', 'помидоры', 'лук', 'картофель'], [2, 3, 1, 2]
print(veg_list, quantity_list)

['огурцы', 'помидоры', 'лук', 'картофель'] [2, 3, 1, 2]


In [None]:
#словарь

shopping_dict = {'огурцы': 2, 'помидоры': 3, 'лук': 1, 'картофель': 2}
shopping_dict

{'огурцы': 2, 'помидоры': 3, 'лук': 1, 'картофель': 2}

In [None]:
# словарь можно сразу заполнить ключами и значениями

company = {'name': 'Toyota', 'founded' : 1937, 'founder': 'Kiichiro Toyoda'}
company

{'name': 'Toyota', 'founded': 1937, 'founder': 'Kiichiro Toyoda'}

In [None]:
# словарь можно создать из вложенных списков

tickers = dict([['TYO', 'Toyota'], ['TSLA', 'Tesla'], ['F', 'Ford']])
tickers

{'TYO': 'Toyota', 'TSLA': 'Tesla', 'F': 'Ford'}

Иногда бывает полезно создать словарь с заранее известными ключами и заданным значением.

In [None]:
# если поместить ключи в кортеж
keys = ('k1', 'k2', 'k3')

# и задать значение
value = 0

In [None]:
# то с помощью метода .fromkeys() можно создать словарь
# с этими ключами и заданным значением для каждого из них

empty_values = dict.fromkeys(keys, value)
empty_values

{'k1': 0, 'k2': 0, 'k3': 0}

### Ключи и значения словаря

Как и списки, **словари хранят значения любых типов**. Но **у ключей есть ограничения**: ключами словаря могут быть только неизменяемые типы данных. Например, строки, числа, кортежи или логические значения (Boolean). Кроме того, ключи должны быть уникальными и соответственно не могут повторяться.

Значения словаря, наоборот, могут состоять из чисел, строк, пропущенных (NaN) и логических значений, значения типа None, списков, массивов Numpy и вложенных словарей.

#### Виды значений словаря

In [None]:
# приведем пример того, какими могут быть значения словаря

value_types = {'k1' : 123,
               'k2' : 'string',
               'k3' : np.NaN, # тип "Пропущенное значение"
               'k4' : True, # логическое значение
               'k5' : None,
               'k6' : [1, 2, 3],
               'k7' : np.array([1, 2, 3]),
               'k8' : {1 : 'v1', 2 : 'v2', 3 : 'v3'}}

value_types

{'k1': 123,
 'k2': 'string',
 'k3': nan,
 'k4': True,
 'k5': None,
 'k6': [1, 2, 3],
 'k7': array([1, 2, 3]),
 'k8': {1: 'v1', 2: 'v2', 3: 'v3'}}

Что будет, если в словаре есть одинаковые ключи.

In [None]:
{'k1' : 1, 'k1' : 2, 'k1' : 3}

{'k1': 3}

#### Методы `.keys()`, `.values()` и `.items()`

In [None]:
# создадим словарь с информацией о сотруднике

person = {'first name' : 'Иван',
          'last name' : 'Иванов',
          'born' : 1980,
          'dept' : 'IT'}

In [None]:
# посмотрим на ключи и

person.keys()

dict_keys(['first name', 'last name', 'born', 'dept'])

In [None]:
# значения

person.values()

dict_values(['Иван', 'Иванов', 1980, 'IT'])

In [None]:
# а также на пары ключ-значение в виде списка из кортежей

person.items()

dict_items([('first name', 'Иван'), ('last name', 'Иванов'), ('born', 1980), ('dept', 'IT')])

#### Использование цикла for

Ключи и значения словаря удобно просматривать с помощью цикла for и метода .items().

In [None]:
# ключи и значения можно вывести в цикле for

for k, v in person.items():
    print(k, v)

first name Иван
last name Иванов
born 1980
dept IT


Если записать результат метода `.items()` в одну переменную, будут выведены кортежи из ключа и значения.<br>
Использование в цикле for методов `.keys()` и `.values()` выводит только ключи или только значения соответственно.

In [None]:
# одна переменная

for i in person.items():
    print(i)

('first name', 'Иван')
('last name', 'Иванов')
('born', 1980)
('dept', 'IT')


In [None]:
#ключи

for k in person.keys():
    print(k)

first name
last name
born
dept


In [None]:
#значения

for v in person.values():
    print(v)

Иван
Иванов
1980
IT


#### Доступ по ключу и метод .get()

**Небезопасный способ.**<br>
**Конкретное значение** в словаре можно получить, введя название словаря и затем название ключа в квадратных скобках.

In [None]:
# значение можно посмотреть по ключу

person['last name']

'Иванов'

In [None]:
# если такого ключа нет, Python выдаст ошибку

person['education']

KeyError: 'education'

**Безопасный способ.**<br>
Чтобы избежать ошибки, небезопасный способ иногда сочетают с конструкцией `try...except`:

In [None]:
try:
    value = person['last name'] # ищем ключ в словаре
    print(value) # если ключ найден — выводим значение

except:
    print('Ключ не найден!') # иначе выводим сообщение

In [None]:
try:
    value = person['education'] # ищем ключ в словаре
    print(value) # если ключ найден — выводим значение

except:
    print('Ключ не найден!') # иначе выводим сообщение

**Предпочтительный безопасный способ.** Метод словаря `.get()`.

In [None]:
# чтобы этого не произошло, можно использовать метод .get()
# по умолчанию, при отсутствии ключа, он выводит значение None

print(person.get('education'))

In [None]:
print(person.get('education', 'Ключ не найден!'))

In [None]:
# если ключ все-таки есть, .get() выведет соответствующее значение

person.get('born')

#### Проверка вхождения (наличия) ключа и значения в словарь

С помощью оператора `in` можно проверить наличие определенного ключа в словаре.<br>
Важно сказать, что оператор `in` работает быстрее метода `.get()`.

In [None]:
# проверим, есть ли такой ключ

'born' in person

Метод `.values()` поможет проверить наличие определенного значения.

In [None]:
# и такое значение

1980 in person.values()

Метод `.items()` поможет проверить наличие пары ключ : значение. Обратите внимание, эту пару следует записать в форме кортежа.

In [None]:
# можно также проверить наличие и ключа, и значения одновременно

('born', 1980) in person.items()

### Операции со словарями

#### Добавление и изменение элементов

In [None]:
# добавить элемент можно, передав новому ключу новое значение

person['pay'] = 45_000
person

In [None]:
# добавить элемент можно, передав новому ключу новое значение
# обратите внимание, в данном случае новое значение - это список

person['languages'] = ['Python', 'C++']
person

In [None]:
# изменить элемент можно, передав существующему ключу новое значение,
# значение - это по-прежнему список, но из одного элемента

person['languages'] = ['Python']
person

Метод `.update()` позволяет соединить два словаря.

In [None]:
# возьмем еще один словарь

new_elements = {'job' : 'программист', 'experience' : 7}

In [None]:
# и присоединим его к существующему словарю с помощью метода .update()

person.update(new_elements)
person

In [None]:
new_elements = {'job' : 'web-программист'}

In [None]:
person.update(new_elements)
person

Метод `.setdefault()` не изменяет значение, если указанный ключ уже содержится в словаре.

In [None]:
# метод .setdefault() проверит есть ли ключ в словаре,
# если "да", значение не изменится

person.setdefault('last name', 'Петров')
person

In [None]:
# если нет, будет добавлен новый ключ и соответствующее значение

person.setdefault('f_languages', ['русский', 'английский'])
person

#### Удаление элементов

Метод `.pop()` удаляет элемент по ключу и выводит удаляемое значение.

In [None]:
# метод .pop() удаляет элемент по ключу и выводит удаляемое значение

person.pop('dept')

In [None]:
# мы видим, что пары 'dept' : 'IT' больше нет

person

Ключевое слово `del` также удаляет элемент по ключу.

In [None]:
# ключевое слово del также удаляет элемент по ключу
# удаляемое значение не выводится

del(person['born'])

In [None]:
person

Метод `.popitem()` удаляет и выводит последний добавленный в словарь элемент.

In [None]:
# метод .popitem() удаляет последний добавленный элемент и выводит его

person.popitem()

In [None]:
person

Метод `.clear()` удаляет все ключи и значения и возвращает пустой словарь.

In [None]:
# метод .clear() удаляет все элементы словаря

person.clear()
person

In [None]:
# ключевое слово del также позволяет удалить словарь целиком

del person

In [None]:
# убедимся, что такого словаря больше нет

person

#### Сортировка словарей

Для сортировки словарей можно использовать функцию `sorted()`.

In [None]:
# возьмем словарь

dict_to_sort = {'k2' : 30, 'k1' : 20, 'k3' : 10}

In [None]:
# отсортируем ключи

sorted(dict_to_sort)

In [None]:
# и значения

sorted(dict_to_sort.values())

Если нужно отсортировать пары ключ : значение по ключу или по значению, вначале используют метод `.items()` для извлечения этих пар (кортежей) из словаря.

In [None]:
# посмотрим на пары ключ : значение

dict_to_sort.items()

Затем указывают эти кортежи в качестве первого аргумента функции `sorted()`. Параметру `key` этой же функции передают `lambda-функцию`, которая вернет либо ключ lambda x : x[0] каждого кортежа, либо его значение lambda x : x[1]. Именно по ним и будет произведена сортировка.

In [None]:
# для их сортировки по ключу (индекс [0])
# воспользуемся методом .items() и lambda-функцией

sorted(dict_to_sort.items(), key = lambda x : x[0])

In [None]:
# сортировка по значению выполняется так же, однако
# lambda-функции мы передаем индекс [1]

sorted(dict_to_sort.items(), key = lambda x : x[1])

#### Копирование словарей

In [None]:
# создадим исходный словарь с количеством студентов на первом и втором курсах университета

original = {'Первый курс' : 174, 'Второй курс' : 131}

Копирование с помощью метода `.copy()`.

In [None]:
# создадим копию этого словаря с помощью метода .copy()

new_1 = original.copy()

In [None]:
# добавим информацию о третьем курсе в новый словарь

new_1['Третий курс'] = 117

# исходный словарь не изменился

print(original)
print(new_1)

Копирование через оператор присваивания `=` (так делать не стоит!)

In [None]:
# передадим исходный словарь в новую переменную

new_2 = original

In [None]:
# удалим элементы нового словаря

new_2.clear()

# из исходного словаря данные также удалились

print(original)
print(new_2)

Данные были удалены из обоих словарей. Так быть не должно и поэтому такой метод копирования использовать не стоит.

### Списки и словари

Из словарей и списков создают `сложные структуры данных`:
- список списков, где одни списки становятся элементами другого;
- словарь словарей — значениями одного словаря становятся другие словари;
- словарь списков — списки выступают значениями словаря;
- списки словарей — словари становятся элементами списка.

К значениям в списке словаря обращаются по двум «координатам»:
- индексу списка,
- имени ключа.

In [None]:
# пример списка словарей

movies_table = [
    {'movie_name':'Побег из Шоушенка', 'country':'США', 'genre':'драма', 'year':1994, 'duration':142, 'rating':9.111},
    {'movie_name':'Крёстный отец', 'country':'США', 'genre':'драма, криминал', 'year':1972, 'duration':175, 'rating':8.730},
    {'movie_name':'Тёмный рыцарь', 'country':'США', 'genre':'фантастика, боевик, триллер', 'year':2008, 'duration':152, 'rating':8.499}
]

movies_table

Поэтому список словарей более всего напоминает таблицы `pandas`, где к данным обращаются по номеру строки и имени колонки:

In [None]:
df = pd.DataFrame(movies_table)
df

Циклы могут обойти список словарей как обычный список. Например, так можно отфильтровать данные или посчитать сумму значений любой «колонки».

In [None]:
total_duration = 0 # присваиваем переменной с общей длительностью стартовое значение

for movie in movies_table: # перебираем каждый словарь в списке
    total_duration += movie['duration'] # добавляем к переменной длительность фильма

print(total_duration)

### Вывод словаря на экран

Чтобы список словаря было удобно прочитать, можно подготовить его к печати функцией `dumps()` из библиотеки `json`. Она добавит отступы, которые разделят две «оси координат» в списке словарей:
- индексы списка,
- ключи словаря.

In [None]:
from json import dumps # подключение dumps() для красивого вывода словаря

In [None]:
movies_table = [
    {'movie_name':'Побег из Шоушенка', 'country':'США', 'genre':'драма', 'year':1994, 'duration':142, 'rating':9.111},
    {'movie_name':'Крёстный отец', 'country':'США', 'genre':'драма, криминал', 'year':1972, 'duration':175, 'rating':8.730},
    {'movie_name':'Тёмный рыцарь', 'country':'США', 'genre':'фантастика, боевик, триллер', 'year':2008, 'duration':152, 'rating':8.499}
]

print(dumps(movies_table, indent=4, ensure_ascii=False))

Функцией `dumps()` управляют два параметра:
- indent=4 — настроит отступ;
- ensure_ascii=False — обработает кириллические символы.

#### Вложенные словари

In [None]:
# возьмем словарь, ключами которого будут id сотрудников

employees = {
    'id1': {
        'first name': 'Александр',
        'last name' : 'Иванов',
        'age': 30,
        'job':'программист'
    },
    'id2': {
        'first name': 'Ольга',
        'last name' : 'Петрова',
        'age': 35,
        'job':'ML-engineer'
    }
}

In [None]:
# а значениями - вложенные словари с информацией о них

for v in employees.values():
    print(v)

##### Базовый операции

In [None]:
# для того чтобы вывести значение элемента вложенного словаря,
# воспользуемся двойным ключом

employees['id1']['age']

In [None]:
# импортируем функцию pprint() из модуля pprint
# некоторые структуры данных она выводит лучше, чем обычная print()

from pprint import pprint

In [None]:
# добавим информацию о новом сотруднике

employees['id3'] = {'first name': 'Дарья', 'last name' : 'Некрасова', 'age': 27, 'job' : 'веб-дизайнер' }

# и выведем обновленный словарь с помощью функции pprint()

pprint(employees)

In [None]:
# изменить значение вложенного словаря можно также с помощью двойного ключа

employees['id3']['age'] = 26
pprint(employees)

##### Циклы `for`

In [None]:
# заменим тип данных в информации о возрасте с int на float

# для этого вначале пройдемся по вложенным словарям,
# т.е. по значениям info внешнего словаря employees

for info in employees.values():

  # затем по ключам и значениям вложенного словаря info
  for k, v in info.items():

    # если ключ совпадет со словом 'age'
    if k == 'age':

      # преобразуем значение в тип float
      info[k] = float(v)

pprint(employees)

# Задание

1. Запишите в словарь `movies` четыре фильма. Название послужит ключом, а год выхода — значением.

* Измените словарь таким образом, чтобы ключами стали порядковые числа, а название - значением.
* Для словаря `movies` выведите ключи, значения и пары ключ-значение.
* Добавьте еще один фильм.
* Используя цикл `for` выведите ключи, значения и пары ключ-значение.
* Используя небезопасный способ выведите информацию о фильме, ключа для которого нет в словаре.
* Повторите операцию пункта 4, используя безопасный способ.
* Проверьте наличие в словаре конкретного (имеющегося) фильма по его ключу, по его наименованию, по паре ключ-значение.
* Проверьте наличие в словаре конкретного (отсутствующего) фильма по его ключу, по его наименованию, по паре ключ-значение.

2. Создайте карточку студента в формате словаря Python.<br>
Укажите следующие ключи: `first name`, `last name`, `gender`, `age` (значения могут быть произвольными).

* К созданной карточке студента добавьте ключ `year` (курс) и значение 3.
* Предположим студент перешел на четвертый курс. Обновите данные в словаре.
* Проверьте, есть ли в словаре ключ `major` (основная специальность), но так, чтобы при этом не возникло ошибки.
* Соедините ранее созданный словарь с новым. В новом словаре должны быть следующие ключи: `major` и `sports`. Значения могут быть произвольными.
* Удалите данные о поле студента (ключ `gender`).
* Создайте копию получившегося словаря. Измените любое значение в копии словаря. Убедитесь, что исходный словарь не изменился.

3. Создайте `список словарей`, состоящий из 5 сериалов с указанием наименования сериала, страны, жанра, канала (шоураннера) и количества серий.
* Сформируйте `датафрейм` на основе созданного списка словарей и выведите его на экран.
* Рассчитайте общее количество серий, используя цикл `for`.
* Выведите список словарей на экран, используя функцию `dumps()`.

In [None]:
muvies = {"Ярость":2004, "Джанго":2014, "Аватар":2009, "Гарри Поттер":2005}

In [None]:
muvies = {1:"Ярость", 2:"Джанго", 3:"Аватар", 4:"Гарри Поттер"}
print(muvies.keys())
print(muvies.values())
print(muvies.items())
muvies[5] = "Крёстный отец"


In [None]:
for k in muvies.keys():
  print(k)
for v in muvies.values():
  print(v)
for i in muvies.items():
  print(i)

1
2
3
4
5
Ярость
Джанго
Аватар
Гари Потер
Крёстный отец
(1, 'Ярость')
(2, 'Джанго')
(3, 'Аватар')
(4, 'Гари Потер')
(5, 'Крёстный отец')


In [None]:
print(muvies['education'])

KeyError: 'Ярость'

In [None]:
print(muvies.get('education', 'Ключ не найден!'))

Ключ не найден!


In [None]:
print(1 in muvies)
print("Аватар" in muvies.values())
print((1, "Ярость") in muvies.items())

True
True
True


In [None]:
print(10 in muvies)
print("dfgdfg" in muvies.values())
print((21, "sdfsdfc") in muvies.items())

False
False
False


In [None]:
card = {"first name":"Илья","last name":"Елистратов","gender":"м","age":19}
card["year"] = 3
card["year"] = 4
print(card.get('major', 'Ключ не найден!'))
new_card = {"major":"Инормационные системы и технологии","sports":"качалка"}
card.update(new_card)
del(card['gender'])
copy_card = card.copy()
copy_card['year'] = 2
print(card)
print(copy_card)



Ключ не найден!
{'first name': 'Илья', 'last name': 'Елистратов', 'age': 19, 'year': 4, 'major': 'Инормационные системы и технологии', 'sports': 'качалка'}
{'first name': 'Илья', 'last name': 'Елистратов', 'age': 19, 'year': 2, 'major': 'Инормационные системы и технологии', 'sports': 'качалка'}


In [None]:
import numpy as np
from json import dumps
import pandas as pd
import matplotlib.pyplot as plt

series = [
    {"name": "Breaking Bad", "country": "USA", "genre": "Crime", "channel": "AMC", "episodes": 62},
    {"name": "Sherlock", "country": "UK", "genre": "Crime", "channel": "BBC", "episodes": 13},
    {"name": "Friends", "country": "USA", "genre": "Comedy", "channel": "NBC", "episodes": 236},
    {"name": "Narcos", "country": "USA", "genre": "Biograph", "channel": "Netflix", "episodes": 30},
    {"name": "Stranger Things", "country": "USA", "genre": "Horror", "channel": "Netflix", "episodes": 34}
]


data_series = pd.DataFrame(series)
print(data_series)

shet = 0
for i in series:
  shet+=i["episodes"]
print("Общее кол-во серий:",shet)

from json import dumps
print(dumps(series, indent=4, ensure_ascii=False))



              name country     genre  channel  episodes
0     Breaking Bad     USA     Crime      AMC        62
1         Sherlock      UK     Crime      BBC        13
2          Friends     USA    Comedy      NBC       236
3           Narcos     USA  Biograph  Netflix        30
4  Stranger Things     USA    Horror  Netflix        34
Общее кол-во серий: 375
[
    {
        "name": "Breaking Bad",
        "country": "USA",
        "genre": "Crime",
        "channel": "AMC",
        "episodes": 62
    },
    {
        "name": "Sherlock",
        "country": "UK",
        "genre": "Crime",
        "channel": "BBC",
        "episodes": 13
    },
    {
        "name": "Friends",
        "country": "USA",
        "genre": "Comedy",
        "channel": "NBC",
        "episodes": 236
    },
    {
        "name": "Narcos",
        "country": "USA",
        "genre": "Biograph",
        "channel": "Netflix",
        "episodes": 30
    },
    {
        "name": "Stranger Things",
        "country": "

# Задание

Дан вложенный словарь.

In [None]:
writers = {
    'Shakespeare' : {
        'works' : ['Hamlet', 'Romeo and Juliet', 'Othello', 'King Lear'],
        'born' : 1564,
        'language' : 'English'
    },
    'Dumas' : {
        'works' : ['Les Trois Mousquetaires', 'Le Comte de Monte-Cristo'],
        'born': 1802,
        'language' : 'French'
    },
    'Tolstoy' : {
        'works' : ['Война и мир', 'Анна Каренина', 'Воскресение'],
        'born' : 1908,
        'language' : 'Russian'
    }
}

Выведите словарь с помощью функции `pprint()`.

In [None]:
from pprint import pprint
pprint(writers)

{'Dumas': {'born': 1802,
           'language': 'French',
           'works': ['Les Trois Mousquetaires', 'Le Comte de Monte-Cristo']},
 'Shakespeare': {'born': 1564,
                 'language': 'English',
                 'works': ['Hamlet',
                           'Romeo and Juliet',
                           'Othello',
                           'King Lear']},
 'Tolstoy': {'born': 1908,
             'language': 'Russian',
             'works': ['Война и мир', 'Анна Каренина', 'Воскресение']}}


Выведите год рождения Дюма.

In [None]:
pprint(writers['Dumas']['born'])

1802


Добавьте пьесу Macbeth (Макбет) в перечень произведений Шекпира.

In [None]:
writers['Shakespeare']['works'] = 'Hamlet','Romeo and Juliet','Othello','King Lear', 'Macbeth'
pprint(writers)


{'Dumas': {'born': 1802,
           'language': 'French',
           'works': ['Les Trois Mousquetaires', 'Le Comte de Monte-Cristo']},
 'Shakespeare': {'Shakespeare': 'Macbeth',
                 'born': 1564,
                 'language': 'English',
                 'works': ('Hamlet',
                           'Romeo and Juliet',
                           'Othello',
                           'King Lear',
                           'Macbeth')},
 'Tolstoy': {'born': 1908,
             'language': 'Russian',
             'works': ['Война и мир', 'Анна Каренина', 'Воскресение']}}


Создайте список языков, на которых писали авторы.

Подсказка: используйте два цикла `for` или вложенные dict comprehension.

In [None]:
languages = []
for writer in writers.values():
    if writer['language'] not in languages:
        languages.append(writer['language'])

print(languages)

['English', 'French', 'Russian']
