# Встроенные стуктуры данных II: словарь & list comprehensions

**Лекция**

1. Классификация встроенных стуктур данных (data structures) в Python
2. Словарь
3. Задание интервалов чисел (range)
4. Основы рефакторинга кода

**Практика** 

1.	Словарь:
    * Создание
    * Изменение с помощью вcтроенных методов
    * Манипуляции с элементами
2.	Проверка вхождения элемента в словарь с помощью `in`
3.	Итерирование по словарю
4.	Преобразование типов
5. list comprehension и dict comprehension


**Результаты обучения:**

* Знание основных методов базовой структуры словарь
* Понимание способов рефакторинга списков и словарей list comprehension
* Применение оптимальных структур для работы с данными
* Знание методов обработки вложенных списков
* Преобразования данных между структурами данных
* Применение диапазонов чисел (range)

**Вопросы:**

1. Какие структуры данных вы знаете?
2. Приведите примеры данных и оптимальных структур для них. 
3. В чём их преимущество по сравнению с имеющимися (строки, числа)
4. Что такое вложенность и как с ней работать ?

### **Классификация встроенных стуктур данных (data structures) в Python**


Структура | Когда использовать | Пример
--- | --- | --- 
Cписок ( list )   | изменяемый упорядоченный набор элементов | [ 1, 2, 3 ]
Кортеж ( tuple )  | неизменяемый и упорядоченный набор | ( 'a', 'b',  'c' )
Множество ( set ) | хранить уникальные элементы без порядка| { 'a', 1, 'b', 2 }
<mark>Dictioary (словарь) </mark>| хранить пары ключ-значение| { '3' **:** 'a', 4 **:** 'b'}</mark>

[Официальная документация по струкурам данных](https://docs.python.org/3/tutorial/datastructures.html), включая списки, кортежи, словари, и другие.

Проверка типа данных структуры 'x' возможна с помоью команды type(x)

# Словарь

**Словарь** (Dictionary) – это структура данных, которая позволяет хранить пары "ключ: значение". 

Начиная с версии Python 3.7 ключи словаря возвращаются в порядке вставки.

**Назначение:** Словари используются когда нужно быстро найти или изменить данные по определённому ключу, как, например, по имени пользователя, идентификатору или названию.

## Обозначение: 


```Python
# в простых фигурных скобках
my_dict = {1:'a', 2:'b'}

# или с явным обозначением класса
my_dict = dict([(1,'a'), (2,'b')]) # по кортежам
my_dict = dict(a=1, b=2, c=3)
```

Класс объекта: dict

In [17]:
my_dict = {1:'a', 2:'b'}
print(type(my_dict)) # <class 'dict'>

<class 'dict'>


## Методы словарей

Словари в Python поставляются с множеством встроенных методов:
* `d.items()` - Пары (ключ, значение) словаря
* `d.keys()` - Ключи словаря
* `d.values()` - Значения словаря

* `d.clear()` - Удалить все элементы из d
* `d.copy()` - Неглубокая копия словаря
* `d.get(key[, def])` - Получить значение иначе по умолчанию 
* `d.pop(key[, def])` - Получить значение иначе по умолчанию; удалить ключ из словаря
* `d.popitem()` - Удалить и вернуть последнюю пару (k,v) из словаря
* `d.setdefault(k[,def]))` - Если k в dict, вернуть его значение иначе установить def
* `d.update(other_d)` - Обновить d парами key:val из других

In [20]:
# Создание словаря
person = {'name': 'Иван', 'age': 30, 'city': 'Москва'}

# Получить значение по ключу
print(person['name'])  # Иван

Иван


Взать значение по ключу

In [None]:
# Если ключа не существует в словаре, то метод вернёт ошибку
person['xyz']  

Важно ли это ?

In [23]:
# Безопасное получение (если ключа нет — вернёт None)
print(person.get('email'))  # None

None


In [24]:
print(person)

# Добавить или изменить значение
person['age'] = 31
print(person)

{'name': 'Иван', 'age': 30, 'city': 'Москва'}
{'name': 'Иван', 'age': 31, 'city': 'Москва'}


In [25]:
# Удаление по ключу
person.pop('city')
print(person)

{'name': 'Иван', 'age': 31}


In [51]:
# Объединение словарей
other = {'email': 'ivan@mail.ru'}
person.update(other)

print(person)

{'name': 'Иван', 'age': 30, 'city': 'Москва', 'email': 'ivan@mail.ru'}


### Вхождение в словарь

In [53]:
# вхождение ключа в словарь
'email' in person.keys()

True

## Итерирование

### Итерирование по словарю

In [28]:
person = {'name': 'Иван', 'age': 30, 'city': 'Москва'}

# Перебор ключей
for key in person:
    print(key)

name
age
city


In [29]:
# Перебор значений
for value in person.values():
    print(value)

Иван
30
Москва


In [33]:
# Перебор пар (ключ, значение)
for key, value in person.items():
    print(f'{key}: {value}')


name:Иван
age:30
city:Москва


### Как итерироваться по спискам, кортежам и множествам?

In [34]:
fruits = ['apple', 'banana', 'cherry']
for fruit in fruits:
    print(fruit)

apple
banana
cherry


## Преимущества словарей

* Мгновенный доступ к значению по ключу (O(1))

* Гибкая структура: значения могут быть любого типа
* Поддерживает изменяемость
* Ключи уникальны

## Применение словарей практике DS:

* Перебор значений для последующего преобразования данных в другой формат (быстрее Pandas DataFrame)

* Чтение серийных файлов, моделей

# Хеш-таблица 




[Хеш-таблица](https://en.wikipedia.org/wiki/Hash_table) — структура данных, реализующая интерфейс ассоциативного массива, а именно, она позволяет хранить пары (ключ, значение) и выполнять три операции: операцию добавления новой пары, операцию удаления и операцию поиска пары по ключу.

Иными словами словарь - Хеш-таблица  (hash-map).


<p align="center"> <img src="../figures/7.hash map.jpg" width="600" > </p>


# Дипазоны

[Официальная документация по диапазонам](https://docs.python.org/3/library/stdtypes.html#range)

Объявление класса: ***range(start, stop[, step])***

In [39]:
# диапазон
range(3)

range(0, 3)

In [49]:
type(range(3))

range

In [40]:
# Создание списка из 10 целых чисел
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [48]:
# диапазон с шагом
list(range(0, 10, 2))

[0, 2, 4, 6, 8]

In [45]:
# диапазон с умньшением
list(range(0, -10, -1))

[0, -1, -2, -3, -4, -5, -6, -7, -8, -9]

# Основы рефакторинга 


Рефакторинг (англ. refactoring) — процесс изменения внутренней структуры программы, не затрагивающий её внешнего поведения и имеющий целью облегчить понимание её работы. 

В основе рефакторинга лежит последовательность небольших эквивалентных (то есть сохраняющих поведение) преобразований. Поскольку каждое преобразование маленькое, программисту легче проследить за его правильностью, и в то же время вся последовательность может привести к существенной перестройке программы и улучшению её согласованности и чёткости.

## List comprehesions

In [37]:
# диапазон
range(3)

range(0, 3)

In [41]:
# list comprehension
[i for i in range(3)]

[0, 1, 2]

In [42]:
# list comprehension + conditionals
[i if i < 5 else str(i) for i in range(10)]

[0, 1, 2, 3, 4, '5', '6', '7', '8', '9']

####  Как преобразовать матрицу в строку через генератор списков? (flatten)

Матрица — это список списков. "Расплющивание" превращает её в один длинный список.

In [None]:
matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

# Расплющивание (flatten)
flattened = [element for row in matrix for element in row]
print(flattened)  # [1, 2, 3, 4, 5, 6, 7, 8, 9]

## Dict comprehesions

In [38]:
my_dict = dict() # пустой словарь

for x in (2, 4, 6):
    my_dict[x] = x**2  
    
my_dict

{2: 4, 4: 16, 6: 36}

In [None]:
{x: x**2 for x in (2, 4, 6)}

{2: 4, 4: 16, 6: 36}

# Сравнительный анализ базовых структур данных

Характеристика      |	Список <br>List | Кортеж <br>Tuple | Множество<br>Set | Словарь <br>Dictionary
:--- | :---: |:---: |:---:  |:---: 
Изменяемость	    |✅ | ❌ | ✅ | ✅ 
Упорядоченность	    |✅ | ✅ | ❌ | ❌
Уникальность	    |❌ | ❌ | ✅ | ✅ 
Доступ по индексу	|✅ | ✅ | ❌ | ✅ 
Использование	|Универсальные списки |	Фиксированные наборы |	Уникальные элементы | Быстрый доступ по ключу