У Python list, set, та tuple є трема основними структурами даних для зберігання колекцій об'єктів. Вони мають різні характеристики та призначення:

### list

* Тип: Змінюваний (mutable)
* Приклад: [1, 2, 3, 4]
* Особливості:
    * Зберігає елементи у впорядкованому вигляді
    * Може містити дублікати
    * Елементи можуть додаватися, видалятися або модифікуватися
   
### set

* Тип: Змінюваний (mutable)
* Приклад: {1, 2, 3, 4}
* Особливості:
    * Не зберігає елементи у впорядкованому вигляді
    * Не містить дублікатів (унікальні значення)
    * Підтримує операції множин, такі як об'єднання, перетин та ін.

### tuple

* Тип: Незмінюваний (immutable)
* Приклад: (1, 2, 3, 4)
* Особливості:
    * Зберігає елементи у впорядкованому вигляді
    * Може містити дублікати
    * Елементи не можна змінювати після створення кортежу
    
### dict
* Тип: Змінюваний (Mutable)
* Приклад: {'a': 1, 'b': 2}
* Особливості:
    * Словники містять пари ключ-значення.
    * Ключі у словнику повинні бути унікальними.
    * Ключі у словнику можуть бути будь-якого імутабельного типу, наприклад, числа, рядки, кортежі.
    * Значення у словнику можуть належати будь-якому типу: імутабельному та змінюваному.
    * Починаючи з Python 3.7, словники зберігають порядок вставки елементів.
    * Оскільки словники є змінювані, їх можна модифікувати на місці.
    * Словники використовують хеш-таблиці, тому доступ до значень за ключами є дуже швидким.


## Порівняння:

Щодо зміни: Лише списки та множини можна змінювати. Кортежі - ні.

Щодо порядку: Списки та кортежі зберігають порядок елементів, а множини - ні.

Щодо дублікатів: Списки та кортежі можуть містити дублікати, а множини - ні.

Щодо використання: Коли вам потрібно зберігати незмінну послідовність, використовуйте кортежі. Якщо вам потрібна змінна послідовність, використовуйте списки. І коли вам потрібно зберігати унікальні значення без конкретного порядку, використовуйте множини.

# list

In [2]:
some_list = ["some text", 1.23, True]
some_list

['some text', 1.23, True]

In [3]:
names = []  # пустий список
print(names)

[]


In [4]:
names.append('Shannon')  # Додавання одного елемента в кінець списку
print(names)

['Shannon']


In [5]:
# Доступ до імен за допомогою нарізки:
print(names[0])  # Shannon

Shannon


In [6]:
# Вставлення елемента (а не просто додавання його в кінець):
names.insert(0, 'Finn')
print(names)

['Finn', 'Shannon']


0 – номер фрагмента, куди потрібно вставити елемент ПЕРЕД
Іншими словами, це вставить 'Finn' просто *до* індексу 0

In [7]:
many_more = ['Jake', 'Princess Bubblegum', 'Marceline the Vampire Queen', 'Peppermint Butler']

In [8]:
# Тепер ми можемо додати всі імена many_more кінця списку
names.extend(many_more)
print(names)

['Finn', 'Shannon', 'Jake', 'Princess Bubblegum', 'Marceline the Vampire Queen', 'Peppermint Butler']


Тепер ми збираємося піти без цукру, тому всі з цукеркового королівства повинні піти.
Давайте видалимо з нашого списку м'яту дворецьку та принцесу Бубблегум.

In [9]:
names.pop()  # це видалить останній елемент зі списку, яким виявляється Peppermint Butler
print(names)

['Finn', 'Shannon', 'Jake', 'Princess Bubblegum', 'Marceline the Vampire Queen']


In [10]:
names.pop(3)  # це видалить елемент під номером нарізки / індексом 3, який є Princess Bubblegum
print(names)

['Finn', 'Shannon', 'Jake', 'Marceline the Vampire Queen']


In [11]:
# Тепер ми збираємося шукати елемент і видаляти його.
remove_this = names.index('Jake')
print("I found Jake at slicing number / index #{0}".format(remove_this))
print("Now I can use .pop() to remove that item.")
names.pop(remove_this)
print(names)

I found Jake at slicing number / index #2
Now I can use .pop() to remove that item.
['Finn', 'Shannon', 'Marceline the Vampire Queen']


In [13]:
# Ми також можемо використовувати .remove(), щоб скоротити це.
names.remove('Finn')
print(names)

['Shannon', 'Marceline the Vampire Queen']


In [8]:
# Інші методи list

In [14]:
# count(): Повертає кількість входжень заданого елемента в список.
lst = [1, 2, 3, 2, 2]
cnt = lst.count(2)
print(cnt)  # Виведе: 3

3


In [15]:
# sort(): Сортує список на місці.
lst = [3, 1, 2]
lst.sort()
print(lst)  # Виведе: [1, 2, 3]

[1, 2, 3]


In [16]:
# sort(): reverse
lst = [3, 1, 2]
lst.sort(reverse=True)
print(lst)

[3, 2, 1]


In [17]:
# reverse(): Обертає список.
lst = [1, 3, 2]
lst.reverse()
print(lst)  # Виведе: [3, 2, 1]

[2, 3, 1]


In [18]:
# clear(): Видаляє всі елементи зі списку.
lst = [1, 2, 3]
lst.clear()
print(lst)  # Виведе: []

[]


In [19]:
# len(): Цей метод повертає кількість елементів у списку. Функція len() використовує цей метод під капотом.
lst = [1, 2, 3]
print(len(lst))  # Виведе: 3

3


In [21]:
# getitem() та setitem(): Ці "магічні" методи використовуються для доступу та зміни 

In [22]:
lst = [1, 2, 3]
print(lst[1])  # Використовує __getitem__ і виведе: 2

lst[1] = 4     # Використовує __setitem__
print(lst)  # Виведе: [1, 4, 3]

2
[1, 4, 3]


In [23]:
# slice
lst = [1, 2, 3]
print(lst[1:3])  # Використовує __getitem__ і виведе: 2

lst[1:3] = [4, 5]
print(lst)

[2, 3]
[1, 4, 5]


In [25]:
# sort(): by key
lst = [1, 2, 3, "as"]
lst.sort()
print(lst)

lst.sort()
print(lst)

TypeError: '<' not supported between instances of 'str' and 'int'

In [26]:
# sort(): by key
lst = [[3, "a"], [2, "c"], [1, "b"]]
lst.sort()
print(lst)

lst.sort(key=lambda item: item[1])
print(lst)

[[1, 'b'], [2, 'c'], [3, 'a']]
[[3, 'a'], [1, 'b'], [2, 'c']]


In [29]:
# sort(): by key
lst = [{"name": "Fin",
        "surname": "Ajksdf"
       },
      {"name": "Fin2",
        "surname": "Ajksdf"
       }]

lst.sort(key=lambda item: item["name"])
print(lst)

[{'name': 'Fin', 'surname': 'Ajksdf'}, {'name': 'Fin2', 'surname': 'Ajksdf'}]


також можна використовувати sort

In [30]:
# конкатенація списків
[1, 2, 3] + [3, 5]

[1, 2, 3, 3, 5]

In [31]:
# дублювання списків
[1, 2, 3] * 3

[1, 2, 3, 1, 2, 3, 1, 2, 3]

# set

In [32]:
# Створення множини:
fruits = {"apple", "banana", "cherry", "apple"}
print(fruits)  # {'banana', 'cherry', 'apple'}

{'cherry', 'apple', 'banana'}


In [33]:
# Додавання елемента до множини:
fruits = {"apple", "banana", "cherry"}
fruits.add("orange")
print(fruits)  # {'banana', 'orange', 'cherry', 'apple'}

{'cherry', 'apple', 'orange', 'banana'}


In [38]:
# Видалення елемента з множини:
fruits = {"apple", "banana", "cherry"}
fruits.remove("banana")
print(fruits)  # {'orange', 'cherry', 'apple'}

{'cherry', 'apple'}


In [39]:
# discard(): Видаляє елемент з множини, якщо він існує, ігноруючи помилки.
s = {1, 2, 3}
s.discard(2)
s.discard(4)  # Не викличе помилку, незважаючи на те, що 4 відсутнє
print(s)  # Виведе: {1, 3}

{1, 3}


In [40]:
# pop(): Видаляє і повертає довільний елемент з множини. Викликає KeyError, якщо множина порожня.
s = {1, 2, 3}
x = s.pop()
print(x)  # Виведе один з елементів множини, наприклад, 1

1


In [41]:
# clear(): Видаляє всі елементи з множини.
s = {1, 2, 3}
s.clear()
print(s)  # Виведе: set()

set()


In [44]:
# Перевірка наявності елемента в множині:
fruits = {"apple", "banana", "cherry"}
if "apple" in fruits:
    print("Apple is in the set")

Apple is in the set


In [45]:
# Перевірка наявності елемента в множині:
fruits = ["apple", "banana", "cherry"]
if "apple" in fruits:
    print("Apple is in the list")

Apple is in the list


In [36]:
# Операції над множинами:
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}

# Об'єднання
union_set = set1 | set2 # union
print(union_set)  # {1, 2, 3, 4, 5, 6}

# Перетин
intersection_set = set1 & set2 # intersection
print(intersection_set)  # {3, 4}

# Різниця
difference_set = set1 - set2 # difference
print(difference_set)  # {1, 2}

symmetric_difference_set = set1 ^ set2 # symmetric_difference
print(symmetric_difference_set) # {1, 2, 5, 6}

{1, 2, 3, 4, 5, 6}
{3, 4}
{1, 2}
{1, 2, 5, 6}


In [46]:
# Створення множини зі списку:
numbers = [1, 1, 2, 3, 4, 4, 5]
unique_numbers = set(numbers)
print(unique_numbers)  # {1, 2, 3, 4, 5}

{1, 2, 3, 4, 5}


In [47]:
# issubset(): Перевіряє, чи є одна множина підмножиною іншої.
s1 = {1, 2}
s2 = {1, 2, 3, 4}
print(s1.issubset(s2))  # Виведе: True

True


In [48]:
# issuperset(): Перевіряє, чи є одна множина надмножиною для іншої.
s1 = {1, 2, 3, 4}
s2 = {2, 3}
print(s1.issuperset(s2))  # Виведе: True

True


In [49]:
# isdisjoint(): Перевіряє, чи немає спільних елементів у двох множинах.
s1 = {1, 2}
s2 = {3, 4}
print(s1.isdisjoint(s2))  # Виведе: True

True


# tuple

Кортежі (tuple) в Python є незмінюваними впорядкованими колекціями. Це означає, що ви не можете змінити, додати або видалити елементи після створення кортежу. Ось декілька прикладів використання кортежів:

In [50]:
# Створення кортежу:
colors = ("red", "green", "blue")
print(colors)  # ('red', 'green', 'blue')

('red', 'green', 'blue')


In [51]:
# Отримання значення за індексом:
first_color = colors[0]
print(first_color)  # 'red'

red


In [52]:
# Намагаємося змінити значення кортежу (викличе помилку):
colors[0] = "yellow"  # TypeError: 'tuple' object does not support item assignment

TypeError: 'tuple' object does not support item assignment

In [53]:
# Вкладені кортежі:
point = (3, 4, ("red", "green"))
print(point[2][1])  # 'green'

green


In [56]:
# Пакування та розпакування кортежів:
x, y, z = colors  # розпакування кортежу
print(x)  # 'red'
print(y)  # 'green'

red
green


In [25]:
# Кортежі в якості ключів словників:
# Так як кортежі є незмінюваними, вони можуть використовуватися як ключі для словників
coordinate_map = {
    (0, 0): "origin",
    (0, 1): "point at y-axis",
    (1, 0): "point at x-axis"
}
print(coordinate_map[(0, 1)])  # 'point at y-axis'

point at y-axis


In [58]:
colors

('red', 'green', 'blue')

In [57]:
# використання методів з кортежами:
count_of_red = colors.count("red")
print(count_of_red)  # 1

index_of_blue = colors.index("blue")
print(index_of_blue)  # 2

1
2


Кортежі корисні, коли вам потрібно зберігати впорядковану колекцію, яка не змінюється протягом часу, або коли вам потрібна гарантія того, що дані не будуть модифіковані.

In [59]:
# len() (хоча це і не метод кортежу, але корисна функція для роботи з ним): Повертає кількість елементів у кортежі.
t = (1, 2, 3, 4, 5)
print(len(t))  # Виведе: 5

5


In [60]:
# Також, кортежі підтримують всі стандартні операції для послідовностей, такі як індексація, розрізання (slicing) і т. д.:
t = (1, 2, 3, 4, 5)
print(t[1])       # Виведе: 2
print(t[1:4])     # Виведе: (2, 3, 4)

2
(2, 3, 4)


# dict

In [62]:
# обьявлення
a = {"a": 1, 
     1: [3, 4], 
     (2, 3): "a"}
a

{'a': 1, 1: [3, 4], (2, 3): 'a'}

In [63]:
dict(a=1, b=2, c=3)

{'a': 1, 'b': 2, 'c': 3}

In [64]:
# get(): Повертає значення для зазначеного ключа, якщо ключ існує у словнику; 
# інакше повертає задане значення (або None, якщо значення не вказано).
d = {'a': 1, 'b': 2}
print(d.get('a'))  # Виведе: 1
print(d.get('c'))  # Виведе: None
print(d.get('c', 3))  # Виведе: 3

1
None
3


In [66]:
# keys(): Повертає список усіх ключів у словнику.
d = {'a': 1, 'b': 2}
print(d.keys())  # Виведе: dict_keys(['a', 'b'])

dict_keys(['a', 'b'])


In [67]:
# values(): Повертає список усіх значень у словнику.
d = {'a': 1, 'b': 2}
print(d.values())  # Виведе: dict_values([1, 2])

dict_values([1, 2])


In [68]:
# items(): Повертає список пар (ключ, значення) у словнику.
d = {'a': 1, 'b': 2}
print(d.items())  # Виведе: dict_items([('a', 1), ('b', 2)])

dict_items([('a', 1), ('b', 2)])


In [69]:
# pop(): Видаляє зі словника елемент з заданим ключем і повертає його значення.
d = {'a': 1, 'b': 2}
print(d.pop('a'))  # Виведе: 1
print(d)  # Виведе: {'b': 2}

1
{'b': 2}


In [71]:
# popitem(): Видаляє та повертає пару (ключ, значення) з словника. 
# Починаючи з версії Python 3.7, цей метод видаляє останню додану пару.
d = {'a': 1, 'b': 2, 'c': 3}
print(d.popitem())  # Виведе: ('c', 3)

('c', 3)


In [62]:
# setdefault(): Повертає значення ключа, якщо ключ існує у словнику. 
# Якщо ключу немає, додає ключ з заданим значенням.
d = {'a': 1, 'b': 2}
print(d.setdefault('a', 3))  # Виведе: 1
print(d.setdefault('c', 3))  # Виведе: 3
print(d)  # Виведе: {'a': 1, 'b': 2, 'c': 3}

1
3
{'a': 1, 'b': 2, 'c': 3}


In [63]:
# update(): Додає ключі та значення до словника з іншого словника або ітерабельного об'єкта.
d1 = {'a': 1, 'b': 2}
d2 = {'b': 3, 'c': 4}
d1.update(d2)
print(d1)  # Виведе: {'a': 1, 'b': 3, 'c': 4}

{'a': 1, 'b': 3, 'c': 4}


In [64]:
# clear(): Видаляє всі елементи зі словника.
d = {'a': 1, 'b': 2}
d.clear()
print(d)  # Виведе: {}

{}


# Приклад
Давайте розглянемо реальний кейс у сфері машинного навчання, де можуть бути використані set, tuple, dict, і list.

Задача: Побудова системи рекомендацій фільмів для користувача.

list: Застосування: Зберігання списку фільмів, які користувач подивився.



In [65]:
watched_movies = ['Інтерстеллар', 'Начало', 'Хороший рік']

set: Застосування: Видалення дублікатів. Якщо система збирає дані з різних джерел, можуть виникнути дублікати в назвах фільмів.

In [66]:
all_movies = ['Інтерстеллар', 'Хороший рік', 'Інтерстеллар', 'Начало']
unique_movies = set(all_movies)

tuple: Застосування: Зберігання інформації про фільм, яка не змінюється, наприклад, (назва, рік виходу, режисер).

In [67]:
movie_info = ('Інтерстеллар', 2014, 'Крістофер Нолан')

dict: Застосування: Зберігання рейтингів, які користувач виставив фільмам. Ключем є назва фільму, а значенням - виставлений рейтинг.

In [68]:
user_ratings = {
    'Інтерстеллар': 5.0,
    'Начало': 4.8,
    'Хороший рік': 3.9
}

У процесі побудови системи рекомендацій, ці структури даних можуть бути використані для збору, обробки та аналізу даних про перегляди та вподобання користувача. Крім того, вони можуть бути використані у більш складних алгоритмах, таких як колаборативна фільтрація, для визначення схожості між користувачами та рекомендації відповідних фільмів.