# Погружение в типы (структуры) данных

Спикер: Андрей Рысистов

Контакты(телеграм): @Rysistov

Слак: @Андрей Рысистов (эксперт)

## 1. План занятия

План занятия
1. Поговорим о том, что вообще такое структуры данных и зачем они нам нужны
2. Разберем структуру данных - список, его возможности и задачи, которые можно решить с помощью него
3. Разберем структуру данных - словарь, его возможности и задачи, которые можно решить с помощью него
4. Поговорим о том, как работать с комбинациями из этих структур

## 2. Структуры данных


Структуры данных - это общий термин для различных методов хранения информации. 

Как только мы начинаем выходить за рамки написания простейших программ у нас возниает потребность в хранении коллекций или наборов данных. Для этого в языке Python предусмотрены 2 очень мощных по своим возможностям типа данных: списки и словари.

## 3. Список

### 3.0 Определение списка











**Список** в Python — это упорядоченная изменяемая коллекция объектов произвольных типов.




В этом определении важна каждое слово. Мы будем к нему возвращаться по мере иллюстрации возможностей и свойств списков.



* Когда мы называем список коллекцией, мы имеем в виду, что в одном списке может храниться множество объектов (например, чисел или строковых величин) 


* Говоря о том, что списки представляют собой упорядоченные коллекции, мы обращаем внимание на то, что каждый элемент в списке имеет свой порядковый номер.


* Упоминание об изменяемости списков означает, что в процессе исполнения кода можно изменять состав элементов списка и последовательность их расположения.


* Выражение «произвольных типов» означает, что в списке могут храниться данные, относящиеся к любым типам из тех, с которыми работает Python. *То есть это могут быть также другие списки и словари*





### 3.1 Создание списков

In [None]:
my_list = list() #первый способ создания пустого списка
my_list

[]

In [None]:
my_list1 = [] #второй способ создания пустого списка
my_list1

[]

In [None]:
spisok = ['лебедь', 'рак', 'щука'] # в списке хранится 3 объекта 
spisok

['лебедь', 'рак', 'щука']

In [None]:
languages = ['Java', 'C', 'Python', 'C++', 'Visual Basic.NET']
languages

['Java', 'C', 'Python', 'C++', 'Visual Basic.NET']

In [None]:
range_list = list(range(-1, 3))
range_list

[-1, 0, 1, 2]

### 3.2 Список - последовательность

Списки, кортежи и строки являются примерами последовательностей. Но что такое последовательности и что в них такого особенного?

Основные возможности – это проверка принадлежности (т.е. выражения **“in”** и **“not in”**) и оператор индексирования, позволяющий получить напрямую некоторый элемент последовательности. 

**Индексация в Python начинается с 0**

In [None]:
spisok

['лебедь', 'рак', 'щука']

In [None]:
print(spisok[2]) # так мы обратились к третьему элементу списка

щука


In [None]:
spisok[1] = 'форель' # 3аменили второй элемент списка. 
print(spisok) # В отличие от строк нам не нужно перезаписывать весь объект, мы можем поменять часть списка

['лебедь', 'форель', 'щука']


In [None]:
len(spisok) #получение длины списка

3

In [None]:
'щука' in spisok

True

In [None]:
if 'щука' in spisok: #проверка на принадлежность строки списку
  print('Варим уху')
else:
  print('Сегодня без ухи')

Варим уху


### 3.3 Срезы

Также последовательности предоставляют операцию получения вырезки, которая позволяет получить вырезку последовательности, т.е. её фрагмент.

list[START:STOP:STEP] - берёт срез от номера START, до STOP **не включая его**, с шагом STEP. По умолчанию START = 0, STOP = длине объекта, STEP = 1. Соответственно, какие-нибудь (а возможно, и все) параметры могут быть опущены.





Срезы позволяют выбрать часть списка, а не один отдельный элемент. 



In [None]:
vowels = ['а', 'е', 'ё', 'и', 'о', 'у', 'ы', 'э', 'ю', 'я']
print(vowels[0:3])
print(vowels[5:])
print(vowels[4::2])
print(vowels[:5])

['а', 'е', 'ё']
['у', 'ы', 'э', 'ю', 'я']
['о', 'ы', 'ю']
['а', 'е', 'ё', 'и', 'о']


**Задача**: 

Выберите с помощью индексов элементы **о** & **у**

In [None]:
print(vowels[4:5])

['о']


Отрицательные индексы

In [None]:
vowels[-1: -5]

[]

**Задача**

Создайте список из чисел от -1 до 25. Затем сделайте срез, чтобы в ответе был следующий список: [-1, 1, 3, 5, 7]. В качестве ответа напишите через запятую два числа, являющихся границами среза.


In [None]:
range_list = list(range(-1, 26))
print(range_list[:9:2])

[-1, 1, 3, 5, 7]


### 3.4 Операции со списками

В список можно добавлять элементы

Давайте вернем щуку в наш список, но не заменим ей форель, а как бы добавим скраю. 

Для этой операции у нас есть метод `append()`. Он добавляет элемент справа (что делает эту операцию достаточно быстрой, в отличие от добавления элемента, например, с левого края) 

In [None]:
spisok = ['лебедь', 'рак', 'форель']
spisok.append('щука') 
spisok

['лебедь', 'рак', 'форель', 'щука']

**Задача:** 

Даны 3 переменные, содержащие в себе информацию о заказах, составьте пустой список orders и добавьте в него все заказы

In [None]:
order1 = 'Заказ: рыба, молоко, яйца'
order2 = 'Заказ: молоко, хлебцы, буженина'
order3 = 'Заказ: батон, вода'
orders = []
orders.append(order1)
orders.append(order2)
orders.append(order3)
print(orders)

['Заказ: рыба, молоко, яйца', 'Заказ: молоко, хлебцы, буженина', 'Заказ: батон, вода']


Список можно расширять значениями из другого списка. Для этого используется метод `extend()`:

In [None]:
a = ["Красноярский край", "Саратовская область", "Якутия"]
b = ["Республика Крым", "Калининградская область"]
a.extend(b)
print(a)

['Красноярский край', 'Саратовская область', 'Якутия', 'Республика Крым', 'Калининградская область']


**Задача:** 

Вам даны наблюдения температуры воздуха за определенный период. К вам приходят новые наблюдения. Объедините данные в единый список


In [None]:
temp_old = [23.3, 24.1, 26.4, 24.2, 20.3]
temp_new = [19.8, 15.3, 18.4, 10.4, 8.1, 5.0]
temp_old.extend(temp_new)
temp_old

[23.3, 24.1, 26.4, 24.2, 20.3, 19.8, 15.3, 18.4, 10.4, 8.1, 5.0]

Итак, мы разобрались с добавлением элементов и его расширением, теперь давайте узнаем как удалять элементы списка

Для этого у нас есть метод `revome()`, который принимает в качестве аргумента элемент, который мы хотим удалить



In [None]:
spisok = ['лебедь', 'рак', 'форель', 'лебедь']
spisok.remove('лебедь')
spisok

['рак', 'форель', 'лебедь']

Для удаления элементов по индексу используется метод `pop()`:

In [None]:
languages = ['Java', 'C', 'Python', 'C++', 'Visual Basic.NET']
languages.pop(3)
#print(pop_item)
print(languages)

['Java', 'C', 'Python', 'Visual Basic.NET']


Отсортируем наш список с помощью метода `sort()`. Параметр reverse обозначает сортировку по убыванию (в порядке, обратному алфавитному)

In [None]:
spisok.sort(reverse=False)
spisok

['лебедь', 'рак', 'форель']

In [None]:
languages = ['Java', 'C', 'Python', 'C++', 'Visual Basic.NET']
languages[::-1]

['Visual Basic.NET', 'C++', 'Python', 'C', 'Java']

Помимо перечисленных выше методов у списка есть еще огромный арсенал возможностей. Подробнее со всеми ними вы можете познакомиться по ссылочке:https://pythonworld.ru/tipy-dannyx-v-python/spiski-list-funkcii-i-metody-spiskov.html

Рассмотрим еще несколько фишечек со списками:

In [None]:
a = [5, '1', '124', 'hello'] + [14, 141, 5] #конкатенация списков
a

[5, '1', '124', 'hello', 14, 141, 5]

In [None]:
[14, 141] * 5 #умножение списка

[14, 141, 14, 141, 14, 141, 14, 141, 14, 141]

Агрегирующие методы для списков


In [None]:
temp_new = [19.8, 15.3, 18.4, 10.4, 8.1, 5.0]
sum(temp_new)

77.0

In [None]:
temp_new = [19.8, 15.3, 18.4, 10.4, 8.1, 5.0]
sum(temp_new)/len(temp_new)

12.833333333333334

In [None]:
temp_new = [19.8, 15.3, 18.4, 10.4, 8.1, 5.0]
max(temp_new)

19.8

In [None]:
temp_new = [19.8, 15.3, 18.4, 10.4, 8.1, 5.0]
min(temp_new)

5.0

In [None]:
temp_new[::-1]

[5.0, 8.1, 10.4, 18.4, 15.3, 19.8]

In [None]:
temp_new.reverse()
temp_new

[5.0, 8.1, 10.4, 18.4, 15.3, 19.8]

In [None]:
temp_new.index(18.4)

2

In [None]:
t = temp_new.pop(2)
temp_new

[5.0, 8.1, 18.4, 15.3, 19.8]

In [None]:
t

10.4

In [None]:
sex_feature = ['men', 'women', 'women',
              'men', 'women', 'women',
              'men', 'women', 'men', 'men']
sex_feature.count('women')                     

5

### 3.6. Вложенные списки



Элементом списка может быть любой объект в питоне, в том числе и другой список. Порой встречаются такие структуры как списки в списках, или "вложенный список". 

In [None]:
array_of_arrays = [
                   [1, 2, 3],
                   [4, 5, 3],
                   [7, 2, 5]
                   ]
# у нас есть список array_of_arrays, который состоит из трех элементов 
# мы можем получить каждый из этих трех элементов с помощью индекса
array_of_arrays[1][2]

3

Задача: 
Cоздайте матрицу 3х3 у которой на диагонали будут стоять значение корня из 2

In [None]:
array = [
         [0]*3,
         [0]*3 ,
         [0]*3
         ]
print(array)
array[0][0] = 2**0.5
array[1][1] = 2**0.5
array[2][2] = 2**0.5
array

[[0, 0, 0], [0, 0, 0], [0, 0, 0]]


[[1.4142135623730951, 0, 0],
 [0, 1.4142135623730951, 0],
 [0, 0, 1.4142135623730951]]

### 3.7 Практический кейс на списки

В вашем распоряжении есть некоторая информация о пользователях банка и их статусе: ушли ли они от нас или нет. Необходимо организовать программу, которая:
  * Расчитает среднее по признаку кредитного рейтинга для ушедших клиентов
  * Средний возраст всех клиентов
  * Долю ушедших клиентов
  * Выведет идентификаторы клиентов, которые ушли от банка

In [None]:
users = [
         [15634602, 15647311, 15619304, 15701354],#'CustomerId'
         ['Hargrave', 'Hill', 'Onio', 'Boni'],#'Surname'
         [ 619, 608, 502, 699], #'CreditScore'
         ['Female', 'Female', 'Female', 'Female'], #'Gender'
         [ 42, 41, 42, 39], #'Age'
         [1, 0, 1, 0] #Exited
         ]

## 4. Словарь

### 4.0 Определение словаря

Список хорош, когда он один. Но зачастую у нас возникает необходимость хранить несколько связанных списков. 
Например, номера телефонов и имена покупателей. Или название продуктов и их стоимость. В python есть особый тип данных для хранения такой информации в удобной форме - словарь

Словарь в Python - неупорядоченная ассоциативная изменяемая коллекция произвольных типов 
Снова разбираем по словам:
  1. Неупорядоченная структура означает, что элементы в словаре хранятся в произвольном порядке и не имеют номера
  2. В отличие от последовательностей, которые индексируются диапазоном чисел, словари индексируются по ключам, которые могут быть любым **неизменяемым** типом; строки и числа всегда могут быть ключами.
  3. Изменяемая - словари можно изменять: добавлять, удалять и заменять элементы и ключи
  4. Произвольных типов означает, что в словаре, как и в списке хранятся элементы любой природы: числа, строки, списки, словари и.т.д.


### 4.1 Создание словаря и получение его элементов

In [None]:
my_dict = {}#создание пустого словаря

In [None]:
my_dict = dict() #другой способ создания пустого словаря

Создадим словарь продуктов и их цен


In [None]:
fruit_dict = {
    'Банан': '16 рублей',
    'Яблоко': '28 рублей', 
    'Персик': '37 рублей', 
    'Манго': '100 рублей', 
    'Апельсин': '30 рублей'
    }
fruit_dict

{'Апельсин': '30 рублей',
 'Банан': '16 рублей',
 'Манго': '100 рублей',
 'Персик': '37 рублей',
 'Яблоко': '28 рублей'}

Создание словарей из двух списков можно осуществить с помощью функции `zip`:


In [None]:
fruits = ['Банан', 'Яблоко', 'Персик', 'Манго', 'Апельсин']
prices = ['16 рублей','28 рублей','37 рублей','100 рублей','30 рублей']
fruit_dict = dict(zip(fruits, prices))
fruit_dict

{'Банан': '16 рублей',
 'Манго': '100 рублей',
 'Персик': '37 рублей',
 'Яблоко': '28 рублей'}

In [None]:
#Обращаемся к элементу с помощью ключа
print(fruit_dict['Банан'])
print(fruit_dict['Апельсин'])

16 рублей
30 рублей


In [None]:
fruit_dict['Вишня']

KeyError: ignored

In [None]:
if 'Банан' not in fruit_dict: 
    print('Нет в словаре') 
else: 
    print(fruit_dict['Банан']) 

16 рублей


### 4.2 Ключи и значения словаря 

Получить ключи и значения словарей можно с помощью методов: keys(), values() и items()

In [None]:
user_dict = {
    'id': 532, 
    'name': 'Ксения',
    'surmame': 'Собчак',
    'age': 40,
    'gender': 'female',
    'mail': 'sobchak@yandex.ru',
    'count_orders': 1402
}

items = list(user_dict.values())
items

[532, 'Ксения', 'Собчак', 40, 'female', 'sobchak@yandex.ru', 1402]

In [None]:
features = list(user_dict.keys())
features

['id', 'name', 'surmame', 'age', 'gender', 'mail', 'count_orders']

In [None]:
features_items = list(user_dict.items())
features_items

[('id', 532),
 ('name', 'Ксения'),
 ('surmame', 'Собчак'),
 ('age', 40),
 ('gender', 'female'),
 ('mail', 'sobchak@yandex.ru'),
 ('count_orders', 1402)]

### 4.3 Операции со словарями

In [None]:
employee_base = {
    'Мария Никитина': 'менеджер', 
    'Егор Савичев': 'разработчик',
    'Александр Пахомов': 'дизайнер',
    'Алина Егорова': 'разработчик',
    'Руслан Башаров': 'верстальщик'}

Рассмотрим самый базовый синтаксис добавления нового ключа и значения в словарь. Заметьте, что такой же синтаксис работает и на замену существующего значения на новое по ключу

In [None]:
employee_base['Егор Зимин'] = 'разработчик' #добавление в словарь
employee_base['Мария Никитина'] = 'старший менеджер' #замена значения по ключу
employee_base

{'Александр Пахомов': 'дизайнер',
 'Алина Егорова': 'разработчик',
 'Егор Зимин': 'разработчик',
 'Егор Савичев': 'разработчик',
 'Мария Никитина': 'старший менеджер',
 'Руслан Башаров': 'верстальщик'}

**Задача:**

Напишите код, который бы увеличил число заказов в словаре user_dict на 10, а также заменил почту на ksobchak@mail.ru

In [None]:
user_dict = {
    'id': 532, 
    'name': 'Ксения',
    'surmame': 'Собчак',
    'age': 39,
    'gender': 'female',
    'mail': 'sobchak@yandex.ru',
    'count_orders': 1402
}
user_dict['count_orders'] += 10
user_dict['mail'] = 'ksobchak@mail.ru'
user_dict

{'age': 39,
 'count_orders': 1412,
 'gender': 'female',
 'id': 532,
 'mail': 'ksobchak@mail.ru',
 'name': 'Ксения',
 'surmame': 'Собчак'}

Получить данные из словаря можно с помощью метода `get()`. Он позволяет установить значение по умолчанию, если элемент не был найдет

In [None]:
employee_base

{'Александр Пахомов': 'дизайнер',
 'Алина Егорова': 'разработчик',
 'Егор Зимин': 'разработчик',
 'Егор Савичев': 'разработчик',
 'Мария Никитина': 'старший менеджер',
 'Руслан Башаров': 'верстальщик'}

In [None]:
employee_base.get("Мария Лобанова", "Такого сотрудника не было найдено") 

'Такого сотрудника не было найдено'

In [None]:
error = employee_base.get("Митрофан Смирнов", -1) 
error == -1

True

Часто бывает ситуация, что словарь необходимо дополнить. Тогда вам поможет метод `update()`

In [None]:
employee_base = {
    'Мария Никитина': 'менеджер', 
    'Егор Савичев': 'разработчик',
    'Александр Пахомов': 'дизайнер',
    'Алина Егорова': 'разработчик',
    'Руслан Башаров': 'верстальщик'}
new_base = {
    'Роман Родимов': 'HR менеджер',
    'Ксения Колесниченко': 'data scientist',
    'Андрей Рысистов': 'уборщик'
}
employee_base.update(new_base)
employee_base

{'Александр Пахомов': 'дизайнер',
 'Алина Егорова': 'разработчик',
 'Андрей Рысистов': 'уборщик',
 'Егор Савичев': 'разработчик',
 'Ксения Колесниченко': 'data scientist',
 'Мария Никитина': 'менеджер',
 'Роман Родимов': 'HR менеджер',
 'Руслан Башаров': 'верстальщик'}

In [None]:
employee_base.update({'Андрей Рысистов': 'data scientist'})
employee_base

{'Александр Пахомов': 'дизайнер',
 'Алина Егорова': 'разработчик',
 'Андрей Рысистов': 'data scientist',
 'Егор Савичев': 'разработчик',
 'Ксения Колесниченко': 'data scientist',
 'Мария Никитина': 'менеджер',
 'Роман Родимов': 'HR менеджер',
 'Руслан Башаров': 'верстальщик'}

Задача:

Добавьте в наш словарь `user_dict` логин и пароль от личного кабинета, а также обновите имя и фамилию с помощью метода update 

In [None]:
user_dict = {
    'id': 532, 
    'name': 'Ксения',
    'surname': 'Собчак',
    'age': 39,
    'gender': 'female',
    'mail': 'sobchak@yandex.ru',
    'count_orders': 1402
}

new_name = 'Виктория'
new_surname = 'Боня'
login = '5GisEVIL'
password = 'BillGatesEVIL'
user_dict.update({'login': login, 'password': password, 'name': new_name, 'surname': new_surname})
user_dict

{'age': 39,
 'count_orders': 1402,
 'gender': 'female',
 'id': 532,
 'login': '5GisEVIL',
 'mail': 'sobchak@yandex.ru',
 'name': 'Виктория',
 'password': 'BillGatesEVIL',
 'surname': 'Боня'}

Удаление по ключу из словаря осуществляется с помощью метода `pop()`

In [None]:
deleted = employee_base.pop('Егор Савичев')
deleted

'разработчик'

In [None]:
{0, 12, 4, 21, 12}

{0, 4, 12, 21}

**Вопрос**: как вы думаете, имеет ли словарь метод sort()? 

Помимо перечисленных методов словари так же обладают большим количеством других возможностей. Их основной список можно найти по ссылочке: https://pythonworld.ru/tipy-dannyx-v-python/slovari-dict-funkcii-i-metody-slovarej.html

### 4.5 Вложенные словари

Как вы уже поняли, сложные вещи в этом мире тяжело описать простыми структурами, поэтому ровно так же как существуют вложенные списки, существуют и вложенные словари.

Рассмотрим такую структуру на примере конфигурации сервера

In [None]:
# Часто встречается при работе с конфигурационными файлами, JSON схемами и не только
config = {
    "server": {
        "host": "127.0.0.1",
        "port": "22"
    },
    "configuration": {
        "ssh": {
            "access": True,
            "login": "some",
            "password": "some"
        },
        "name": "2491Oaaf1414"
    }
}

In [None]:
config['server']['host']

'127.0.0.1'

In [None]:
config['configuration']['ssh']['password']

'some'

Задача: напишите код для получения логина от ssh соединения

А теперь совместим две изученные нами структуры

### 4.6 Практический кейс на словари 



Пусть у нас есть некоторая информация о пабликах в сети ВКонтакте. Необходимо организовать код для получения ссылок на аватарки данных пабликов. Все ссылки необходимо оформить во вложенный список

In [None]:
response = {'response': [{'id': 42565717,
   'name': 'Python',
   'screen_name': 'club42565717',
   'is_closed': 0,
   'type': 'group',
   'members_count': 37319,
   'activity': 'Открытая группа',
   'photo_50': 'https://sun9-127.userapi.com/c845524/v845524906/1a71c2/A2r_4JtmiLQ.jpg?ava=1',
   'photo_100': 'https://sun9-58.userapi.com/c845524/v845524906/1a71c1/2fBtsS0k8XY.jpg?ava=1',
   'photo_200': 'https://sun9-50.userapi.com/c845524/v845524906/1a71c0/Kfo-eQIn0DU.jpg?ava=1'},
                         
  {'id': 3183750,
   'name': 'Веб программист - PHP, JS, Python, Java, HTML 5',
   'screen_name': 'php2all',
   'is_closed': 0,
   'type': 'page',
   'members_count': 117833,
   'activity': 'Программирование',
   'photo_50': 'https://sun9-54.userapi.com/c626421/v626421613/941/HSj4ylRsk8k.jpg?ava=1',
   'photo_100': 'https://sun9-5.userapi.com/c626421/v626421613/940/yKaZLxGShkY.jpg?ava=1',
   'photo_200': 'https://sun9-49.userapi.com/c626421/v626421613/93f/2EygT_FJKWg.jpg?ava=1'}]}

In [None]:
response['response'][0]['photo_100']

'https://sun9-58.userapi.com/c845524/v845524906/1a71c1/2fBtsS0k8XY.jpg?ava=1'

In [None]:
[[photo_50, photo_100, photo_200], [photo_50, photo_100, photo_200]]

## 5. Спасибо за внимание! Буду рад ответиить на ваши вопросы

Форма ОС:
https://forms.gle/TAeFKkTMpJCT5zc88  

