# Тема 6: Структури даних у Python

## Тип даних list

    Структура даних (англ. data structure) — програмна одиниця, яка дозволяє зберігати та обробляти множину однотипних та/або логічно зв'язаних даних.

Структуру даних можна представити як складну одиницю, котра об'єднує у собі групу інших, дуже часто більш простих. Кожен різновид структур даних має свої особливості.

`Список` (англ. `list`) в Python — це послідовність елементів. Елементами списку є значення, причому значення можуть бути різних типів.

Створити список дуже просто — перерахуйте значення, розділені комою, у квадратних дужках:

In [1]:
my_list = [1, 'два', 3, 4.4, 55555, True]

In [2]:
my_list

[1, 'два', 3, 4.4, 55555, True]

In [3]:
type(my_list)

list

А як щодо створити список у якому не міститиметься жодного елементу?

In [4]:
empty_list = []

In [5]:
empty_list

[]

або

In [6]:
empty_list_2 = list()

In [7]:
empty_list_2

[]

До окремих елементів списка можна дістатись вказавши його індекс:

In [8]:
my_list[0]

1

In [9]:
my_list[1]

'два'

За допомогою індексації у символьних рядків ми могли дістатись до окремих символів, а у списків — до окремих його елементів.

Виходити за межі списку не дозволяється:

In [10]:
my_list[6]

IndexError: list index out of range

Від’ємні індекси у спискові задають відповідні за порядком елементи, якщо рахувати справа наліво.

Останнім елементом непорожнього списку `a_list` завжди є `a_list[-1]`.

In [11]:
my_list[-3]

4.4

Використовуючи індексацію можна змінити певний елемент списку:

In [12]:
my_list[0] = -1

In [13]:
my_list

[-1, 'два', 3, 4.4, 55555, True]

Списки — дуже потужний і гнучкий інструмент. Детальніше робота зі списками буде розглянута у наступних розділах.

## Тип даних tuple

Ще одна структура даних в Python — кортеж.

`Кортеж` (англ. `tuple`) в Python — це послідовність елементів будь-яких типів.

Кортеж записується майже так само, як список, але замість квадратних дужок використовуються круглі.

In [None]:
my_tuple = (1, 'two', 3, '4', 55555, True)

In [None]:
my_tuple

Пустий кортеж:

In [14]:
t = ()

In [20]:
t

()

In [15]:
type(t)

tuple

або ж

In [17]:
t1 = tuple()

In [19]:
t1

()

In [18]:
type(t1)

tuple

Кортеж з одним елементом:

In [21]:
t = (1,)

In [22]:
t

(1,)

Дужки можна опускати:

In [23]:
t = 1, 2, 'three'

In [24]:
t

(1, 2, 'three')

In [25]:
type(t)

tuple

In [26]:
t = 'element',

In [27]:
t

('element',)

Елементи кортежу мають визначений порядок, так само, як і в списку. Так само індексація починається з нуля.

In [28]:
(1, 2, 3)[1]

2

Від'ємні індекси діють так само, як у списків.

In [29]:
(1, 2, 3, 'last')[-1]

'last'

Здається що кортежі — це ті ж списки, тільки чомусь записані трохи по-іншому. Для чого ж тоді два окремих типи даних?

Основна відмінність між списками та кортежами: кортежі не можна змінювати.

Технічно — вони незмінні.

Практично — вони не мають засобів, які б дозволили вам змінити їх.

In [30]:
t = (1, 2, 3)

In [31]:
t[0] = 7

TypeError: 'tuple' object does not support item assignment

Навіщо так зроблено? Деколи є необхідність об'єднати якісь дані в одну структуру, і треба щоб ця структура даних ніколи не могла би бути зміненою. Тоді дані об'єднують у кортеж. В інших випадках є необхідність при потребі змінити дані у структурі, і тоді використовують списки.

Якщо у одну структуру необхідно об'єднати елементи, кожен з яких можна визначити як окрему сутність, тоді швидше за все варто використовувати кортеж. Наприклад, об'єднаємо в одну структуру дані про людину: ім'я, призвіще і вік.

In [32]:
person = ('Петр', 'Петренко', 23)

До кожного елемента створеної структури можна "дістатись" за допомогою індексації, і кожен елемент є окремою сутністю:

In [33]:
first_name = person[0]

In [34]:
first_name

'Петр'

In [35]:
last_name = person[1]

In [36]:
last_name + ' ' + first_name[0] + '.'

'Петренко П.'

Якщо ж необхідно об'єднати в одну структуру однаманітні дані, тоді, швидше за все, варто використовувати список. Наприклад список чисел, список книг, список адрес електроної пошти, список контактів.

## Вкладені структури даних

Оскільки списки і кортежі можуть містити елементи будь-яких типів, то в них можна включити і самі ж списки і кортежі також.

Створимо список людей, наприклад студентів:

In [37]:
person1 = ('Петро', 'Петренко', 23)
person2 = ('Даринка', 'Пилипчук', 19)
students = [person1, person2]

In [38]:
students

[('Петро', 'Петренко', 23), ('Даринка', 'Пилипчук', 19)]

In [39]:
students[1]

('Даринка', 'Пилипчук', 19)

In [40]:
students[1][0]

'Даринка'

In [41]:
students[1][2]

19

Вище було створено список елементиами якого є кортежі. Списки у свою чергу можуть бути елементами кортежа. Давайте разом із даними про кожного студента зберігати і отримані оцінки:

In [42]:
person = ('Юля', 'Хоменко', [5, 4, 5, 5])

In [43]:
person

('Юля', 'Хоменко', [5, 4, 5, 5])

In [44]:
marks = person[2]

In [45]:
marks

[5, 4, 5, 5]

In [46]:
marks.append(4)

In [47]:
person

('Юля', 'Хоменко', [5, 4, 5, 5, 4])

А як щодо створити список списків?

In [48]:
matrix = [[1, 2, 3],
          [4, 5, 6],
          [7, 8, 9]]

In [49]:
matrix

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [50]:
matrix[0]

[1, 2, 3]

In [51]:
matrix[0][2]

3

In [52]:
matrix[2][0]

7

In [53]:
matrix[2][2]

9

## Послідовності в Python

Що є спільного у списку та символьного рядка? Коли ми описували списки й рядки ми згадували що це "впорядкована послідовність". Для рядків це впорядкована послідовність символів, для списків — впорядкована послідовність елементів певних типів. Кортеж також є впорядкованою послідовністю.

До окремих символів рядків ми можемо "дістатись" за допомогою індексів. Так само можна зробити та зі списками чи кортежами з тою лише різницею, що в останніх ми вилучаємо не символи, а елементи довільних типів.

Якщо у цих трьох типів даних вже є немало спільного, то чи не можна їх якось об'єднати? Можна.

Символьні рядки, списки та кортежі в Python є послідовностями.

Перетворення послідовностей
Використовуючи приведення типів можна привести послідовність одного типу до послідовності іншого:

In [1]:
tuple([1, 2])

(1, 2)

In [2]:
list((1,2))

[1, 2]

In [3]:
list('hello')

['h', 'e', 'l', 'l', 'o']

Приведення послідовностей до `str` дає символьний рядок з "читабельним" відображенням даної послідовності:

In [4]:
str([11, 22])

'[11, 22]'

Використання `list()` і `tuple()` без аргументів повертає порожню послідовність:

In [5]:
list()

[]

In [6]:
tuple()

()

### Операції з послідовностями

Те, що властиве для послідовностей одного типу є справедливим для послідовностей інших типів.

Оскільки списки і кортежі як і рядки теж є послідовностями, то зрізання можна застосовувати і до них:

In [7]:
l = ['Alice', 'Romeo', 'Jane', "Juliette", 'John']

In [8]:
l[1::2]

['Romeo', 'Juliette']

In [9]:
(1, True, 3, False)[::2]

(1, 3)

Зауважте: за допомогою зрізань ми завжди отримуємо нову послідовність, але того ж самого типу як і початкова послідовність.

Конкатенація, як і для символьних рядків, працює і для списків і кортежів.

In [10]:
l = [1, 2, 3, 4, 5]

In [11]:
l + l[::-1]

[1, 2, 3, 4, 5, 5, 4, 3, 2, 1]

Конкатенувати можна послідовності однакових типів:

In [12]:
(1, 2) + [3, 4]

TypeError: can only concatenate tuple (not "list") to tuple

In [13]:
(1, 2) + tuple( [3, 4] )

(1, 2, 3, 4)

In [14]:
[1, 2, 3] + list( 'abc' )

[1, 2, 3, 'a', 'b', 'c']

Мультиплікація:

In [15]:
[1, 2, 3] * 2

[1, 2, 3, 1, 2, 3]

In [16]:
4 * (1,)

(1, 1, 1, 1)

In [17]:
[] * 99

[]

Можна перевірити чи є певне значення у спискові чи кортежі:

In [18]:
'Alice' in ['Bob', 'Alice', 'Eve']

True

In [19]:
'Alice' not in ['Bob', 'Alice', 'Eve']

False

In [20]:
True in ('Alice', 7, True)

True

---

В Python є вбудовані функції для роботи з послідовностями. Розглянемо деякі з них.

### len()
Щоб дізнатись довжину списку чи кортежу, тобто кількість елементів яку вони містять, використовують вже знайому нам вбудовану у Python функцію `len()`:

In [21]:
len((1, 2))

2

In [22]:
len([])

0

Так що, виходить що функція `len()` може приймати аргументи різних типів? Саме так. Але зауважте, що повертає вона завжди значення типу `int`.

### min() та max()
Щоб визначити мінімальний і максимальний по значенню елемент послідовності використовують відповідні функції `min()` та `max()`:

In [23]:
min([1, 2, 999, -999])

-999

In [24]:
max((3, 2, 1))

3

Функції вимагають, щоб передані їм послідовності не були пустими:

In [25]:
min([])

ValueError: min() iterable argument is empty

Зауважте: функції `min()` та `max()` повертають один з елементів переданої їм послідовності.

### sum()
Функція `sum()` приймає як аргумент послідовність чисел і повертає суму усіх елементів аргументу.

In [26]:
sum([1,2,3,4,5,6,7,8,9,10])

55

### sorted()
Функція `sorted()` як аргумент приймає послідовність, а повертає список з вже відсортованими елементами цієї послідовності. Сортування відбувається за зростанням, тобто спочатку будуть йти елементи з меншим значенням:

In [27]:
sorted([3, 1, 2])

[1, 2, 3]

In [28]:
sorted('hello')

['e', 'h', 'l', 'l', 'o']

Зауважте: функція завжди повертає список.

---

 У вищенаведених функцій є додаткові можливості, про них ми дізнаємось у подальшому.

## Об'єкти в Python
Об'єкт в Python — це певна вже створена структура даних. Коли ми говоримо, наприклад, про список, то це тип даних (клас) `list`. Але якщо ми говоримо про

    [1, 2, 3]
    
— це вже конкретний список, або ж об'єкт типу список (класу `list`).

Кожен об'єкт в Python має такі атрибути (характеристики):

* значення (дані, стан об'єкта)
* тип даних
* ідентифікатор
  
Створімо об'єкт:

In [29]:
[1, 2, 3]

[1, 2, 3]

Як це працює:

* інтерпретатор виділяє пам'ять під об'єкт типу `list`
* створює в виділеній ділянці пам'яті об'єкт типу `list`
* присвоює створеному об'єкту унікальний ідентифікатор
* розміщує у цьому об'єкті значення `[1, 2, 3]` типу `list`
  
При створенні кожен об'єкт отримує ідентифікатор — унікальне серед інших об'єктів ціле число. В Python є вбудована функція `id()` яка повертає ідентифікатор переданого їй об'єкта:

In [30]:
id([1, 2, 3])

2264196599424

Для інтерпретатора `CPython` ідентифікатором об'єкта є адреса у пам'яті комп'ютера. Отже, результат функції `id()` практично завжди буде різним.

Змінні в Python — це посилання на об'єкти. Розглянемо на прикладі:

In [31]:
l = [1, 2, 3]

Як це працює:

* інтерпретатор виділяє пам'ять під об'єкт типу `list`
* створює в виділеній ділянці пам'яті об'єкт типу `list`
* присвоює створеному об'єкту унікальний ідентифікатор
* розміщує у цьому об'єкті значення `[1, 2, 3]` типу `list`
* створює змінну `l` і пов'язує її посиланням з новоствореним об'єктом
  
Два різних об'єкти можуть містити однакові значення:

In [32]:
a = [1, 2, 3]
b = [1, 2, 3]  # a і b посилаються на два різних об'єкти

In [33]:
a == b # значення однакові

True

In [34]:
id(a)

2264190212352

In [35]:
id(b)

2264196095424

In [36]:
id(a) == id(b) # об'єкти різні

False

В Python є спеціальний оператор порівняння: `is`. Повертає `True`, якщо обидва операнди вказують на один об'єкт, `False` в іншому випадку.

In [37]:
a is b

False

На один об'єкт може посилатись декілька змінних.

In [38]:
x = [3, 4, 5]
y = x    # x та y посилаються на один об'єкт

In [39]:
x is y

True

Є і "протилежний" оператор `is not`:

In [40]:
a is not b

True

In [41]:
x is not b

True

---

Об'єкти в Python — це дуже важлива концепція. Кажуть що:

`В Python усе є об'єкт`

Зараз просто запам'ятайте це ствердження. Надалі ми будемо згадувати його не один раз і, власне, з'ясуємо що воно означає.

## Мутабельні та немутабельні об'єкти
У списку можна поміняти елемент знаючи його індекс:

In [1]:
l = [1,2,3]

In [2]:
l[0] = 7

In [3]:
l

[7, 2, 3]

Символьні рядки теж можна індексувати. А чи можна у символьному рядку поміняти символ?

In [4]:
s = 'Ганна'

In [5]:
s[0] = 'П'

TypeError: 'str' object does not support item assignment

Отримали помилку:

`Об'єкти типу 'str' не підтримують присвоєння елементам`

У кортежі також неможливо поміняти елемент, нам вже про це відомо. Виходить що у списках поміняти елемент можна, а у символьному рядку і кортежі — ні. Чому так?

Об'єкти в Python поділяються на два типи:

* значення (стан) яких можна змінити після їх створення, будемо називати їх `мутабельними` (від англ. `mutable`)
* значення яких змінити неможливо, будемо називати їх `немутабельними` (`immutable`)
  
Об'єкти одних типів даних є мутабельними, об'єкти інших — немутабельними. Тому можна говорити про мутабельні і немутабельні типи даних. До мутабельних типів даних з вже знайомих нам відноситься `list`, до немутабельних — `int`, `float`, `str`, `bool`, `tuple`.

Якщо нам необхідно отримати нове значення змінивши дані немутабельного типу, ми просто створюємо новий об'єкт:

In [6]:
s = 'Ганна'

In [7]:
id(s)

2652309533872

In [8]:
s = 'П' + s[1:]

In [9]:
s

'Панна'

In [10]:
id(s)

2652309534752

Дані об'єктів мутабельних типів ми можемо модифікувати прямо у вже існуючому об'єкті:

In [12]:
a = [1,2,3]

In [13]:
b = a # a і b посилаються на один список [1,2,3]

In [19]:
id(a)

2652309514496

In [20]:
id(b)

2652309514496

In [14]:
a == b # рівні по значенню

True

In [15]:
a is b # вказують на один об'єкт

True

In [16]:
b[0] = 777 # змінюємо список на який посилаються a і b

In [17]:
a

[777, 2, 3]

In [18]:
b

[777, 2, 3]

In [21]:
id(a)

2652309514496

In [22]:
id(b)

2652309514496

In [23]:
a[0] = b

In [24]:
a

[[...], 2, 3]

In [25]:
b

[[...], 2, 3]

In [26]:
a[0]

[[...], 2, 3]

In [27]:
a[0][0]

[[...], 2, 3]

In [28]:
b[0][0][0][0][0]

[[...], 2, 3]

А як же бути, якщо ми хочемо створити новий мутабельний об'єкт, але дані взяти з іншого? У такому разі при створенні нового мутабельного об'єкта нам необхідно скопіювати дані з іншого. Зрізання завжди створює і повертає новий об'єкт. Скористаємось цим:

In [29]:
a = [1, 2, 3]

In [30]:
b = a[:]

In [36]:
id(a)

2652309252352

In [37]:
id(b)

2652309365120

In [31]:
a == b # рівні значення

True

In [32]:
a is b # різні об'єкти

False

In [33]:
a[0] = 777

In [34]:
a

[777, 2, 3]

In [35]:
b

[1, 2, 3]

## Немутабельні винятки
Для деяких об'єктів немутабельних типів існують певні "тонкощі". Розглянемо їх.

### Кешування об'єктів
Python кешує деякі значення немутабельних типів. Що це означає?

Деякі значення використовуються розробниками дуже часто, наприклад цілі числа 0 та 1. І з метою оптимізації швидкодії при кожному запуску інтерпретатор автоматично створює об'єкти з цими значеннями. У подальшому кожного разу, коли ми використовуємо такі значення, вже непотрібно створювати нові об'єкти. Будуть використовуватись вже існуючі.

In [38]:
a = 1

In [39]:
b = 1

In [40]:
a is b

True

Python кешує цілі числа від -5 до 256 включно.

Кешуються ще деякі немутабельні значення:

In [42]:
a = 'hello'

In [43]:
b = 'hello'

In [44]:
a is b

True

In [45]:
a = 'hello world'

In [46]:
b = 'hello world'

In [47]:
a is b

False

Для об'єктів мутабельних типів гарантується що інтерпретатор завжди створює новий об'єкт. Тут не буде "сюрпризів" як з деякими значеннями немутабельних типів.

Зауважте: усе сказане вище справедливо для реалізації інтерпретатора `CPython`. Для інших реалізацій інтерпретатора мови Python поведінка може бути іншою.

In [48]:
import platform
print(platform.python_implementation())

CPython


In [49]:
import sys
print(f"Реалізація: {platform.python_implementation()}")
print(f"Версія Python: {sys.version}")
print(f"Компілятор: {platform.python_compiler()}")

Реалізація: CPython
Версія Python: 3.13.5 (tags/v3.13.5:6cb20a2, Jun 11 2025, 16:15:46) [MSC v.1943 64 bit (AMD64)]
Компілятор: MSC v.1943 64 bit (AMD64)


In [50]:
print(sys.implementation.name)

cpython


### Унікальний None
Тип `NoneType` має лише одне значення — `None`. І створюється лише один об'єкт зі значенням `None`. Ось тут такий крок зроблено "свідомо", не для оптимізації. Є навіть окрема назва для типів даних, для яких може бути створено лише один об'єкт: `сінглтон`. І якщо необхідно порівняти щось з `None`, замість

```python
if something == None:
```
можна (і треба) використовувати:

```python
if something is None:
```

## Посилання у контейнерах
У списках і кортежах містяться не об'єкти, як може здатись на перший погяд, а посилання на об'єкти. Давайте переконаємось у цьому.

Створимо немутабельний кортеж, який буде містити у собі мутабельний список:

In [51]:
t = ([1, 1], )

In [52]:
l = t[0]

In [53]:
l is t[0]

True

І тепер змінюємо список, який міститься у кортежі:

In [55]:
l[0] = 7

In [56]:
t

([7, 1],)

Так виходить що ми змінили незмінюваний кортеж? Ні, кортеж залишився таким як і був. Значенням кортежа є послідовність посилань на об'єкти, і ці посилання ніяк не змінились. Змінився об'єкт, на який вказує одне з посилань, яке міститься в кортежі.

Ще приклад. Створимо список, який містить у собі ще один список з трьох об'єктів:

In [59]:
l = [[0, 0, 0]]

In [60]:
inner_list = l[0]

In [61]:
inner_list

[0, 0, 0]

In [62]:
inner_list is l[0]

True

А тепер спробуємо зі списка l зробити матрицю три на три. Для цього скористаємось мультиплікацією послідовностей:

In [63]:
matrix = l * 3

In [64]:
matrix

[[0, 0, 0], [0, 0, 0], [0, 0, 0]]

Начебто отримали те, що хотіли. Спробуємо змінити елемент матриці у першому стовпчику першого ряда:

In [65]:
matrix[0][0] = 7

In [66]:
matrix

[[7, 0, 0], [7, 0, 0], [7, 0, 0]]

Не зовсім те, на що очікували... Що не так?

Уся справа у тому, що операція мультиплікації "розмножує" не самі об'єкти у послідовності, а посилання на них.

Стовримо список l трошки інакше:

In [67]:
inner_list = [0, 0, 0]

In [68]:
l = [inner_list]

In [69]:
l

[[0, 0, 0]]

In [70]:
l[0] is inner_list

True

І коли ми використовуємо мультиплікацію, то вираз:

```python
matrix = l * 3
```
фактично означає:

```python
matrix = [inner_list] * 3
```
В результаті отримуємо список у якому тричі повторюється посилання inner_list на один і той самий об'єкт:

```python
[inner_list, inner_list, inner_list]
```
Отже вираз:

```python
matrix[0][0] = 7
```
фактично означає:

```python
inner_list[0] = 7
```
Так що створити матрицю використовуючи мультиплікацію послідовностей як наведено у прикладі нижче на жаль не вийде:

In [71]:
n = 5
matrix = [[0] * n] * n # так повноцінної матриці не отримати!

In [72]:
matrix

[[0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0]]

## Методи списків
Оскільки `list` — мутабельний тип даних, методи списків можуть змінювати сам список, до якого вони були використані.

### append()
```python
lst.append(x)
```

Додає об'єкт "x" в кінець списку "lst"

In [73]:
l = [1,2,3]

In [74]:
l.append('add me!')

In [75]:
l

[1, 2, 3, 'add me!']

In [76]:
l.append([4,5,6])

In [77]:
l

[1, 2, 3, 'add me!', [4, 5, 6]]

### extend()

```python
lst.extend(x)
```
Додає усі елементи послідовності "x" в кінець списку "lst"

In [79]:
l = [1,2,3]

In [80]:
l.extend((4, 5, 6))

In [81]:
l

[1, 2, 3, 4, 5, 6]

In [82]:
l = [1]

In [83]:
l.extend('add')

In [84]:
l

[1, 'a', 'd', 'd']

### insert()

```python
lst.remove(i, x)
```

Вставляє у список у позицію з індексом "i" об'єкт "x".

In [85]:
l = [1, 2, 3, 2, 4]

In [86]:
l.insert(0, 'begin')

In [87]:
l

['begin', 1, 2, 3, 2, 4]

In [88]:
l.insert(-1, 'end')

In [89]:
l

['begin', 1, 2, 3, 2, 'end', 4]

In [90]:
l.insert(1000, 'nothing')

In [91]:
l

['begin', 1, 2, 3, 2, 'end', 4, 'nothing']

In [92]:
l.insert(-1000, 'so far')

In [93]:
l

['so far', 'begin', 1, 2, 3, 2, 'end', 4, 'nothing']

### remove()

```python
lst.remove(x)
```

Видаляє зі списку "lst" перший елемент зі значенням "x".

In [94]:
l = [1, 2, 3, 2, 4]

In [95]:
l.remove(2)

In [96]:
l

[1, 3, 2, 4]

In [97]:
l.remove(777)

ValueError: list.remove(x): x not in list

### pop()

```python
lst.pop(i)
```

Видаляє зі списку "lst" елемент з індексом "i" і повертає його. Якщо "i" не вказано — видаляє і повертає останній елемент.

In [98]:
l = [1, 2, 3, 4, 5]

In [99]:
l.pop(3)

4

In [100]:
l

[1, 2, 3, 5]

In [101]:
l.pop()

5

In [102]:
l

[1, 2, 3]

In [103]:
l.pop(3)

IndexError: pop index out of range

### index()

```python
lst.index(x)
```

Повертає індекс першого входження елемента зі значенням "x" у списку "lst".

In [104]:
 l = [1, 2, 3]

In [105]:
l.index(2)

1

In [106]:
l.index(777)

ValueError: 777 is not in list

### count()

```python
lst.count(x)
```

Повертає кількість елементів зі значенням "x" у списку "lst".

In [107]:
l = [1, 2, 3, 2, 3, 3, 1, 3]

In [108]:
l.count(1)

2

In [109]:
l.count(2)

2

In [110]:
l.count(3)

4

In [111]:
l.count(4)

0

### sort()

```python
lst.sort()
```

Сортування списку "lst".

In [112]:
l = [1, 7, 2, 6, 3, 5, 4]

In [113]:
l.sort()

In [114]:
l

[1, 2, 3, 4, 5, 6, 7]

### clear()

```python
lst.clear()
```

Видаляє усі елементи зі списку "lst".

In [115]:
l = [1, 7, 2, 6, 3, 5, 4]

In [116]:
l.clear()

In [117]:
l

[]

## Тип даних dict
`Словники` — це невпорядковані набори пар "ключ - значення". Коли ви додаєте до словника новий ключ, завжди також повинні додати туди і значення (яке можна буде змінити пізніше). Словники оптимізовані для отримання значення, якщо ви знаєте відповідний ключ, але ніяк не навпаки.

Щоб створити словник, треба у фігурних дужках перерахувати пари "ключ - значення". У парі ключ від значення відділяють двокрапкою. Якщо таких пар більше однієї, їх розділяють комою.

In [118]:
person = {'name': 'Сидоренко', 'age': 21}

In [119]:
person

{'name': 'Сидоренко', 'age': 21}

`age` — це ключ, а пов'язане з цим ключем значення буде 21.

Щоб отримати зі словника значення по його ключу вказують словник і у квадратних дужках ключ:

In [120]:
person['age']

21

Можна використовувати тільки ті ключі, які вже містяться у словнику:

In [123]:
person['address']

KeyError: 'address'

In [124]:
person.get('address', 'Немає такого ключа')

'Немає такого ключа'

In [125]:
person.get('name', 'Немає такого ключа')

'Сидоренко'

Словник не може містити дублікатів ключів. Присвоєння значення чинному ключу затре старе значення.

Словники не мають попередньо заданого обмеження в розмірі. Ви в будь-який час можете додавати до словника нові пари "ключ-значення" чи змінювати значення чинної пари. Розвиваючи попередній приклад:

In [126]:
person

{'name': 'Сидоренко', 'age': 21}

In [127]:
person['age'] = 31

In [128]:
person['phone'] = '+380971234567'

In [129]:
person

{'name': 'Сидоренко', 'age': 31, 'phone': '+380971234567'}

Ключами словника можуть бути лише об'єкти немутабельних типів:

In [130]:
floors_heights = {[0, 1]:145 }

TypeError: unhashable type: 'list'

In [131]:
floors_heights = {(0, 1):145 }

In [132]:
floors_heights

{(0, 1): 145}

Значеннями можуть бути будь-які об'єкти:

In [133]:
marks = {'Сидоренко': [3, 4, 5], 'Петренко': None}

In [134]:
marks

{'Сидоренко': [3, 4, 5], 'Петренко': None}

З'ясувати наявність ключа у словнику можна за допомогою операторів `in`, `not in`:

In [135]:
d = {1:11, 'str': 'Скоро Новий рік!'}

In [136]:
1 in d

True

In [137]:
'int' not in d

True

In [138]:
'str' in d

True

Дізнатись кількість пар ключ-значення у словнику:

In [139]:
d={1:None, None:1}

In [140]:
len(d)

2

Отримати список з відсортованими ключами словнка:

In [141]:
d = {2:22, 3:33, 1:11}

In [142]:
sorted(d)

[1, 2, 3]

Створити пустий словник:

In [146]:
d1 = {}

In [147]:
d1

{}

In [148]:
d2 = dict()

In [149]:
d2

{}

## Методи словників
Оскільки словник — тип даних мутабельний, його методи можуть змінювати об'єкт, до якого їх було застосовано.

### get()

```python
d.get(key, default)
```

Повертає зі словника об'єкт з ключем "key". Якщо вказаного ключа немає у словнику, повертає "default" (необов'язковий аргумент, за замовчуванням повертає None)

In [150]:
d = {1:11, 2:22}

In [151]:
d.get(1)

11

In [153]:
print(d.get(3)) # поверне None

None


In [156]:
d.get(3, 'відсунтій ключ')

'відсунтій ключ'

In [155]:
d[3]  # а так отримаємо вийняток

KeyError: 3

### pop()

```python
d.pop(key, default)
```

Повертає значення по ключу 'key' зі словника 'd' і потім видаляє цей ключ. Якщо вказаного ключа немає у словнику, повертає 'defalt' (необов'язковий аргумент, за замовчуванням виникає виняткова ситуація 'KeyError').

In [157]:
d = {1:11, 2:22}

In [158]:
d.pop(1)

11

In [159]:
d

{2: 22}

In [161]:
d.pop(3,'відсунтій ключ')

'відсунтій ключ'

In [162]:
d

{2: 22}

In [163]:
d.pop(3)

KeyError: 3

### update()

```python
d.update(other)
```

Поновлює словник 'd' додаючи пари "ключ-значення" зі словника 'other'. Наявні ключі перезаписуються.

In [166]:
d1 = {1:11, 2:22, 3:33}

In [167]:
d2 = {1:'foo', 333:'bar'}

In [168]:
d1.update(d2)

In [169]:
d1

{1: 'foo', 2: 22, 3: 33, 333: 'bar'}

### clear()

```python
d.clear()
```

Видаляє усі елементи зі словника "d".

In [170]:
d1 = {1:11, 2:22}

In [171]:
d2 = d1 # d1 і d2 вказують на один і той самий об'єкт

In [172]:
d1

{1: 11, 2: 22}

In [173]:
d2

{1: 11, 2: 22}

In [174]:
d1.clear()

In [175]:
d1

{}

In [176]:
d2

{}

Порівняйте вищенаведене з наступним:

In [177]:
d1 = {1:11, 2:22}

In [178]:
d2 = d1 # d1 і d2 вказують на один і той самий об'єкт

In [179]:
d1

{1: 11, 2: 22}

In [180]:
d2

{1: 11, 2: 22}

In [181]:
d1 = {} # буде створено новий об'єкт

In [182]:
d1

{}

In [183]:
d2

{1: 11, 2: 22}

---
До практики!

Реалізуємо функцію `count_letters(string)`, яка буде підраховувати скільки раз зустрічається кожна буква у символьному рядку `string`.

In [184]:
def count_letters(string):
    '''
    Функція підраховує частоту букв у символьному рядку string.
    Повертає словник {буква:скільки раз зустрілась}
    '''
    letters_counter = {}
    for char in string.lower(): # 'Б' і 'б' — це одна і таж сама буква
        if char.isalpha(): # підраховуємо тільки букви
            letters_counter[char] = letters_counter.get(char, 0) + 1 # якщо буква зістрілась перший раз, її ьчастота є 0
    return letters_counter

In [None]:
Протестуємо:

In [185]:
print(count_letters('Абабагаламага'))

{'а': 7, 'б': 2, 'г': 2, 'л': 1, 'м': 1}


In [186]:
print(count_letters('100500 котиків'))

{'к': 2, 'о': 1, 'т': 1, 'и': 1, 'і': 1, 'в': 1}


## Обхід словників
Словники можна обходити циклом `for`. Відбувається перебір ключів словника, отже циклом `for` фактично ми ітеруємось саме по ключах словника.

In [188]:
d = {1:11, '2':'двадцять два', None: None}

In [191]:
for key in d:
    print(key, d[key])

1 11
2 двадцять два
None None


### keys()
Словник має метод `keys()`, за допомогою якого можна отримати усі ключі словника. Метод повертає об'єкт спеціального типу (класу) `dict_keys` який містить усі ключі словника.

In [192]:
d = {1:11, 2:22}

In [193]:
keys = d.keys()

In [194]:
keys

dict_keys([1, 2])

In [197]:
type(keys)

dict_keys

In [196]:
print(type(keys))

<class 'dict_keys'>


In [198]:
str(type(keys))

"<class 'dict_keys'>"

Здається що `dict_keys` — це послідовність. Але це не так. Ми не можемо отримати доступ до довільного елемента за допомогою індексації:

In [199]:
keys

dict_keys([1, 2])

In [200]:
keys[0]

TypeError: 'dict_keys' object is not subscriptable

Але `dict_keys` можна привести до послідовності, наприклад до списку:

In [202]:
keys_list = list(keys)

In [203]:
keys_list

[1, 2]

Також по dict_keys можна ітеруватись циклом `for`:

In [204]:
for key in keys:
    print(key)

1
2


### values()

Ще один метод словника — `values()`. Повертає об'єкт класу `dict_values` який містить усі значення словника.

In [205]:
d

{1: 11, 2: 22}

In [206]:
values = d.values()

In [207]:
values

dict_values([11, 22])

In [208]:
type(values)

dict_values

Щоб отримати послідовність усіх значень словника — можна привести наприклад до списку:

In [209]:
values_list = list(values)

In [210]:
values_list

[11, 22]

По об'єкту типу `dict_values` можна ітеруватись:

In [211]:
for value in d.values():
    print(value)

11
22


### items()

Ще один метод словника — `items()`. Повертає об'єкт класу `dict_items` який містить пари `ключ-значення`. Кожна пара "ключ-значення" представлена кортежем, перший елемент кортежу — це ключ, другий — відповідне йому значення зі словника:

In [212]:
d

{1: 11, 2: 22}

In [213]:
items = d.items()

In [214]:
items

dict_items([(1, 11), (2, 22)])

In [216]:
type(items)

dict_items

Отримаємо список усіх пар словника:

In [217]:
list(d.items())

[(1, 11), (2, 22)]

In [218]:
list(d.items())[-1]

(2, 22)

Ітеруватись циклом `for` по елементах (парам) словника теж можна:

In [219]:
for item in d.items():
    print(item)

(1, 11)
(2, 22)


**Зауважте**: у змінну циклу `for` при черговій ітерації циклу попадає кортеж — ключ і відповідне значення словника.

In [220]:
for item in d.items():
    print(item[0], '-', item[1])

1 - 11
2 - 22


Перебір елементів словника циклом `for` — відносно часта операція. Але отримувати з кортежу ключ і відповідне значення за допомогою індексації — не дуже зрозуміло і зручно. Тому ми можемо якби "розкласти" кортеж на окремі складники прямо у заголовку циклу for. Просто замість однієї змінної циклу достатньо вказати дві. І тоді у першу змінну при черговій ітерації циклу буде попадати елемент кортежу з індексом 0, у другу — відповідно елемент кортежу з індексом 1.

In [221]:
d

{1: 11, 2: 22}

In [222]:
for key, value in d.items():
    print(key, '-', value)

1 - 11
2 - 22
