## Словники (dict)

Словник – це приклад сховища значень ключів, також відомого як Mapping у Python.
Він дозволяє зберігати та витягувати елементи, посилаючись на ключ. Так як словники посилаються на ключ, у них швидко працює пошук, оскільки вони в основному використовуються для посилання на елементи по ключу і вони не сортуються.

**Створення порожнього словника**

In [1]:
d1 = dict()
print(type(d1))

d2 = {}
print(type(d2))

<class 'dict'>
<class 'dict'>


**Створення словника з початковими значеннями**

In [2]:
d1 = dict(Ivan="manager", Mark="worker")
print(d1)

d2 = {"A1": "123", "A2": "456"}
print(d2)

gender_dict = {0: 'муж', 1: 'жен'}
print(gender_dict)

dict_one = {1: "one", 5: "five"}
print(dict_one)

{'Ivan': 'manager', 'Mark': 'worker'}
{'A1': '123', 'A2': '456'}
{0: 'муж', 1: 'жен'}
{1: 'one', 5: 'five'}


In [None]:
dct = {1.0: 'One'}
print(dct)

In [None]:
dct[1] = "hy" 
print(dct) # 1.0 і 1 як ключ, мають однакове значення

In [None]:
s1 = dict(1="manager", 0="worker") # SyntaxError функція dict не працює з ключами, які є числами

### В якості ключа можуть бути значення тільки типу, що хешується (незмінний тип даних).
Хеш (він же хеш-код) — це зазвичай число, яке генерується на підставі вмісту об'єкта за допомогою функції згортки.

In [4]:
print(hash(10)) #Хеш від числа, зазвичай повертає те саме число
print(hash('10'))
print(hash('Hello world'))
print(hash('Hello World'))
print(hash((1, 5))) # Хеш для кортежу також доступний

10
1342391470759067059
1046969245407843938
7490111571214081513
173794974761290439


In [None]:
print(hash([1, 5])) # Хеш недоступний для типу даних, що змінюється

In [7]:
# Доступ до значення за ключем
a = dict_one[1]
print(a)

print(d2["A2"])

one
456


In [8]:
a = dict_one[2] # Якщо такого ключа немає, то буде помилка

KeyError: 2

#### Важливою особливістю кортежу є те, що він відноситься до типу даних, що кешується, тобто, на відміну від списку, кортеж може використовуватися як ключі у словнику.

In [None]:
dct = {}
dct[(1, 2)] = 'Hello World'
dct[('one', 'two')] = 'Python is the best of the best!'
print(dct)

In [None]:
# RGB -> {(255, 255, 255): 'white', (0, 0, 0): 'black'}

#### Створення словника, із заздалегідь заданого набору ключ-значення

In [3]:
pairs = [('IBM', 125), ('ACME', 50), ('PHP', 40)]
d = dict(pairs)
print(d)

{'IBM': 125, 'ACME': 50, 'PHP': 40}


### Вкладені структури
Це коли як значення, використовується також словник

In [13]:
human = {"name": "Alexander",
        "lastname": "Block",
        "age": 36,
        "address":
             {"street": "Lomonosova",
              "house": 87,
              "flat": 705}
}

house = human["address"]["house"]
print(house)



87


In [14]:
# Міняємо значення для квартири
human["address"]["flat"] = 700
print(human)

{'name': 'Alexander', 'lastname': 'Block', 'age': 36, 'address': {'street': 'Lomonosova', 'house': 87, 'flat': 700}}


In [15]:
# Список словників, це можливість обробляти кілька подібних даних
a = [
    {"name": "Alexander", "lastname": "Block", "age": 36}, 
    {"name": "Bob", "lastname": "Young",  "age": 25}
]

In [16]:
a[1]['name']

'Bob'

#### Додавання та оновлення елемента

In [None]:
print(dict_one)
dict_one[1] = 'ONE'
print(dict_one)

dict_one[2] = 'Two'
print(dict_one)

In [None]:
# Видалення елемента за ключом
print(d2)
del d2["A1"]
print(d2)

#### Перевірка наявності ключа у словнику

In [None]:
# На відміну від списку, оператор ін перевіряє наявність ключа, а не значення! Це важливо!
print(d1)
print("Ivan" in d1)
print("Iva" in d1)

## Методи словників

#### *clear()* - очищує словник.

In [4]:
d2 = {"A1":"123", "A2":"456"}
print(d2)

d2.clear()
print( d2)

# d2 = {}

{'A1': '123', 'A2': '456'}
{}


#### *copy()* - повертає копію словника.

In [5]:
d2 = {"A1":"123", "A2":"456"}
d3 = d2.copy()
print(d3)
# Якщо значення словника, це незмінний тип даних, то копія не впливатиме на оригінал.
d3["A1"] = "789"
print(d2)
print(d3)


{'A1': '123', 'A2': '456'}
{'A1': '123', 'A2': '456'}
{'A1': '789', 'A2': '456'}


In [None]:
# Але проблеми виникають, коли значення - це тип даних, що змінюється
d2 = {"A1": {1: "one", 5: "five"}, "A2":"456"}
d3 = d2.copy()
print('d2 ->', id(d2))
print('d3 ->', id(d3))
print(d3)


In [None]:
d3["A1"][1] = "789"
print('d2 ->', d2)
print('d3 ->', d3)


In [None]:
# Обидва елементи різних словників, посилаються на ту саму адресу пам'яті
print(id(d2["A1"]) == id(d3["A1"])) 

In [None]:
# Щоб уникнути подібних проблем, потрібно щоб між копіями був повний розрив, у тому числі і по елементах
import copy

d2 = {"A1":{1: "one", 5: "five"}, "A2":"456"}
d3 = copy.deepcopy(d2)
print('d3 ->', d3)

d3["A1"][1] = "789"
print('d2 ->', d2)
print('d3 ->', d3)

In [6]:
print(id(d2["A1"]) == id(d3["A1"]))

False


#### *fromkeys(seq[, value])* - створює словник з ключами seq і значенням value (за замовчуванням None).

In [None]:
my_new_dict = dict.fromkeys(['one', 'two', 3]) 
print(my_new_dict) # значення None


In [None]:
my_new_dict = dict.fromkeys(['one', 'two', 3], 10)
print(my_new_dict) # значення за замовчуванням 10

In [None]:
# Небезпечний варіант ініціалізувати всі елементи пустими списками.
my_new_dict = dict.fromkeys([1, 2, 3], [])
print(my_new_dict)


In [None]:
my_new_dict[1].append('add')
print(my_new_dict)

In [None]:
print('1 ->', id(my_new_dict[1]))
print('2 ->', id(my_new_dict[2]))
print('3 ->', id(my_new_dict[3]))

In [None]:
# Правильний варіант, але без fromkeys:
my_new_dict = {}
for key in [1, 2, 3]:
    my_new_dict[key] =  []

my_new_dict[1].append('add')
print(my_new_dict)


In [None]:
# Створення словника за допомогою генераторного виразу
my_new_dict = {key: [] for key in [1, 2, 3] }

my_new_dict[1].append('added')
print(my_new_dict)

#### *get(key)* - повертає значення ключа, але якщо його немає, не кидає виняток, а повертає default (за замовчуванням None).

In [7]:
d2 = {"A1":{1: "one", 5: "five"}, "A2":"456"}
d2[4] # Помилка, якщо немає такого ключа

KeyError: 4

In [None]:
print(d2.get('A2'))

print(d2.get(4)) #Помилки немає, для відсутнього ключа


In [None]:
print(d2.get('address', {})) # Можна встановити значення за замовчуванням для ключа, який відсутній

print(d2)

In [None]:
# Доступ до елемента вкладеної структури
x = d2["A1"][1]
print(x)

In [None]:
y = d2.get('A5') # Такого ключа немає, але й помилки немає


In [None]:
z = y[1] #До об'єкта None не можна звертатися за індексом

In [10]:
y = d2.get('A5', {}) # Порожній словник, як значення за замовчуванням
z = y[1] #У порожньому словнику немає такого ключа

KeyError: 1

##### За допомогою методу get, ми можемо погасити всі помилки

In [11]:

y = d2.get('A5', {})
z = y.get(1)
print(z)

None


In [12]:
print(d2)

{'A1': {1: 'one', 5: 'five'}, 'A2': '456'}


In [13]:
z = d2.get('address', {}).get('home', 0)
print(z)

0


**Еквівалент рядка вище**

In [14]:
if 'address' in d2:
    if 'home' in d2['address']:
        z = d2["address"]['home']
    else:
        z = 0
else:
   z = 0
print(z)

0


In [15]:
dct = {2: [1]}
if dct.get(4, []):
    print('OK')
if dct.get(3):
    print(3)

In [16]:
res = dct.get(3)
if res is not None:
    pass

#### *items()* - повертає пари (ключ, значення).

In [17]:
student = {"name": "Alexander", "lastname": "Tsin", "age": 36, "group": "PN121"}
print(student.items()) # Результат роботи цього методу схожий на список, але таким не є


dict_items([('name', 'Alexander'), ('lastname', 'Tsin'), ('age', 36), ('group', 'PN121')])


In [18]:
lst = student.items()
lst[0] # У цього типу даних немає можливості звертатися до елементів за індексом

TypeError: 'dict_items' object is not subscriptable

In [19]:
# Щоб мати змогу працювати з цим об'єктом, як зі списком, його необхідно перетворити до списку у явному вигляді
lst = list(student.items())
lst[0]

('name', 'Alexander')

In [20]:
a = student.get('address', {})
print(a.items()) # Порожній об'єкт

dict_items([])


In [21]:
# Найчастіше, результат цього методу використовується як об'єкт для ітерації в циклі
for key, val in student.items(): 
    print(f'Key: {key}, value: {val}')

Key: name, value: Alexander
Key: lastname, value: Tsin
Key: age, value: 36
Key: group, value: PN121


In [22]:
# При кожній ітерації, ми отримуємо кортеж з кількох значень. Тому далі ми працюємо з індексами
for pair in student.items(): 
    print(f'Key: {pair[0]}, value: {pair[1]}')

Key: name, value: Alexander
Key: lastname, value: Tsin
Key: age, value: 36
Key: group, value: PN121


#### *keys()* - повертає ключі у словнику.

In [None]:
# Це теж спископодібний об'єкт
print(student.keys())


In [None]:
lst = student.keys()
print(lst[0]) # error

In [None]:
print(list(lst)[0])

In [None]:
# Коли ми передаємо словник у цикл, то ітерація йде за ключами, а не за значеннями, як це було зі списком
for key in student: # student.keys()
    print(f'Key: {key}')

#### *values()* - повертає набір значень словника.

In [None]:
print(student.values())
# Це теж список подібний об'єкт, як і для keys(). Дії аналогічні

In [None]:
#У такий спосіб можна перевірити наявність елемента серед значень словника
print('Alexander' in student.values())

#### *pop(key[, default])* - видаляє пару ключ/значення зі словника і повертає значення як результат своєї роботи

In [None]:
d = {"A1":"123", "A2":"456"}
a = d.pop("A1")

print(d)
print(a)

In [None]:
a = d.pop("A1") # Якщо такого ключа немає, то буде помилка


In [None]:
# Щоб не було помилки для відсутнього ключа, можна вказати значення за замовчуванням
a = d.pop("A1", [])
print(a)

In [None]:
#Для методу pop у списку, такої можливості немає
[].pop(0, None) # TypeError:

#### *popitem()* - видаляє та повертає пару (ключ, значення). Якщо словник порожній, викидає KeyError.

In [None]:
d = {"A1":"123", "A2":"456"}
k, v = d.popitem()
print(k, v)
print(d)

In [None]:

k, v = d.popitem()
print(d)

In [None]:
k, v = d.popitem() # Помилка KeyError, коли словник вже порожній

In [None]:
k, v = d.popitem(None) # TypeError: popitem() takes no arguments (1 given)

#### *setdefault(key[, default])* - створює у словнику ключ із переданим значенням default (за замовчуванням None), якщо такого ключа у словнику немає. Якщо такий ключ є – нічого не робить.

**Завдання. Необхідно порахувати кількість повторень кожного числа у списку**

In [None]:
# Найпростіший, але не оптимальний варіант рішення
dict_one = {}
lst = [1, 2, 3, 6, 3, 1, 7]
for i in lst:
    # пробуємо отримати значення для ключа
    count = dict_one.get(i) # повертає або число, або None
    if count:
        # якщо значення є, збільшуємо на 1
        dict_one[i] = count + 1
    else:
        # якщо значення немає, встановлюємо початкове
        dict_one[i] = 1
#словник, у якому ключами є елементи списку, а значеннями те, скільки разів вони зустрічалися у списку
print(dict_one)

In [None]:
# Більш оптимальний варіант рішення
dict_one = {}
l = [1, 2, 3, 6, 3, 1, 7]
for i in l:
    # для заданого ключа, встановлюємо значення 0
    dict_one.setdefault(i, 0) # спрацює у разі, якщо такого ключа ще немає
    # тепер можемо змінювати значення за ключом, оскільки у словнику він вже точно є
    dict_one[i] += 1 # dict_one[i] = dict_one[i] + 1

print(dict_one)

In [None]:
# Пояснення, чому необхідно встановлювати початкові значення у словнику
dict_one = {}
l = [1, 2, 3, 6, 3, 1, 7]
for i in l:
    # dict_one.setdefault(i, 0)
    dict_one[i] = dict_one[i] + 1 # KeyError

print(dict_one)

In [None]:
# Варіант рішення, з використанням методу get
dict_one = {}
l = [1, 2, 3, 6, 3, 1, 7]
for i in l:
    # dict_one.setdefault(i, 0)
    dict_one[i] = dict_one.get(i, 0) + 1

print(dict_one)

#### *update([other])* оновлює словник, додаючи пари (ключ, значення) з other. Існуючі ключі перезаписуються. Цей метод повертає None, тобто він модифікує існуючий словник на місці.

In [None]:
student = {"name": "Alexander", "lastname": "Ts", "age": 36, "group": "PN121"}
address = {"address":
             {"street": "Lomonosova",
              "house": 87,
              "flat": 705}
          }
student.update(address)
#У словнику student не було ключа address, а тепер є
print(student)

In [None]:
student = {"name": "Alexander", "lastname": "Ts", "age": 36, "group": "PN121"}
address = {"address":
             {"street": "Lomonosova",
              "house": 87,
              "flat": 705}
          }
student.update(address)
#Оновлення вкладеного словника
student['address'].update({"house": 86, "flat": 76})
print(student)

In [None]:
# Значення по існуючим ключам було перезаписано
student.update({"name": "Bob", "lastname": "Nolan", "address": ''})
print(student)

In [None]:
# Починаючи з версії 3.5, можна сподіватися на порядок додавання ключів
dct = {}
dct['a'] = 1
dct['b'] = 2
dct['c'] = 3
dct['d'] = 4
for k in dct:
    print(k)

## OrderedDict
#### ще один схожий на словник об'єкт, але він пам'ятає порядок, в якому йому було дано ключі.

#### Методи в основному як і у звичайного словника, але є кілька особливих

**popitem**(last=True) - видаляє останній елемент якщо `last=True`, і перший,
якщо `last = False`.

In [None]:
from   collections import OrderedDict
d = OrderedDict({'apple': 4, 'banana': 3, 'orange': 2, 'pear': 1})
print(d)
print(len(d)) # виведе: 4
# Варіанти створення словника із сортуванням за ключами або значеннями
dct = OrderedDict(sorted(d.items(), key=lambda t: t[1]))
print(dct)
dct = OrderedDict(sorted(d.items(), key=lambda t: t[0]))
print(dct)

In [None]:
print(dct.popitem())

In [None]:
print(dct.popitem(last=False))

In [None]:
print(dct)

**move_to_end**(key, last=True) - переміщає ключ у кінець якщо last=True, і початок, якщо last=False.

In [None]:
dct['apple'] = 4
print(dct)

In [None]:
dct.move_to_end('banana')
# ключ banana став останнім
print(dct)

In [None]:
# ключ apple став першим
dct.move_to_end('apple', last=False)
print(dct)

## defaultdict
нічим не відрізняється від звичайного словника за винятком того, що за умовчанням завжди викликається функція, що повертає значення

In [None]:
from collections import defaultdict
defdict = defaultdict(list)
#тепер при додаванні будь-якого ключа до словника, значення цього ключа буде порожній список
print(defdict)

In [None]:
# Отримуємо значення за відсутнім ключем
print(defdict["d"]) # виведе: []

In [None]:
# Оскільки ми знаємо, що за будь-яким ключем буде список, ми можемо використовувати методи властиві спискам
for i in range(5):
    defdict[i].append(i * 5)

print(defdict)


In [None]:
#Той самий результат, але з використанням методу setdefault
dict_one = {}

for i in range(5):
    dict_one.setdefault(i, [])
    dict_one[i].append(i * 5)
print(dict_one)

In [None]:
# Створюємо defaultdict, який повертає 0 для будь-якого ключа
dct = defaultdict(lambda: 0)
print(dct["d"]) # виведе: 0

## namedtuple
Іменований кортеж namedtuple() - це об'єкт, якому характерні всі властивості звичайного кортежу, але при цьому є можливість дати індексам назви

In [None]:
from collections import namedtuple
fields = ('color', 'engine') #Створюємо набір іменованих індексів
car = namedtuple('Car', fields) #Створюємо шаблон іменованого кортежу
car1 = car('red', 2000) #Створюємо кортеж


In [None]:
# У іменованого кортежу є можливість звертатися до елементів як по індексу, так і по імені цього індексу
print(car1[0])
print(car1.color)

In [None]:
car3 = car(engine=5000, color='red')

In [None]:
print(car3)

In [None]:
car2 = car('black', 3000)
print(car2)

In [None]:
print(car2.engine)
print(car2[1])

**Не можна змінювати значення в кортежі**

In [None]:
car2[1] = 3500  # error

In [None]:
car1.color = 'blue'  # error

In [None]:
# Розпакування кортежу
color1, engine1 = car1
print(color1, engine1)

In [None]:
# Створення звичайного кортежу, з іменованого
print(tuple(car2))

In [None]:
# Створення словника з іменованого кортежу
car1._asdict()

In [None]:
import json
json.dumps(car2._asdict()) # Перетворити на json