<a href="https://colab.research.google.com/github/Alexandre77777/python_programming/blob/main/4.%20%D0%9A%D0%BE%D0%B4%20%D1%81%20%D0%B7%D0%B0%D0%BD%D1%8F%D1%82%D0%B8%D0%B9/2.%20%D0%9A%D0%BE%D0%B4_%D1%81_%D0%BF%D0%B0%D1%80%D1%8B_22_09_2023.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Циклы и структуры данных**

## **Структуры данных**

**Структуры данных** - это способы организации и хранения данных в компьютерных системах, которые позволяют эффективно обрабатывать и управлять информацией. Давайте рассмотрим это определение подробнее:

#### Основные характеристики структур данных:

1. **Организация данных**: Структуры данных определяют, как элементы информации связаны друг с другом и как они располагаются в памяти компьютера.

2. **Эффективность обработки**: Правильно выбранная структура данных позволяет оптимизировать алгоритмы и повысить производительность программ

3. **Управление информацией**: Они предоставляют методы для хранения, доступа и манипулирования данными

4. **Абстракция**: Структуры данных позволяют абстрагироваться от конкретной реализации и работать с данными на более высоком уровне.

#### Важность структур данных:

- **Оптимизация ресурсов**: Правильный выбор структуры данных может значительно сократить использование памяти и времени выполнения программы

- **Решение сложных задач**: Некоторые задачи становятся гораздо проще при использовании подходящей структуры данных

- **Основа алгоритмов**: Многие алгоритмы тесно связаны с определенными структурами данных и опираются на их свойства.

#### Примеры структур данных:

- списки
- Связанные списки
- Стеки и очереди
- Деревья и графы
- Хеш-таблицы

**В Python есть несколько встроенных структур данных, каждая из которых имеет свои особенности и применения:**
#### 1. Списки (Lists)
- **Определение**: Упорядоченные изменяемые последовательности элементов
- **Синтаксис**: `my_list = [1, 2, 3, 'a', 'b']`
- **Особенности**: Позволяют хранить элементы разных типов, легко изменяются

#### 2. Кортежи (Tuples)
- **Определение**: Упорядоченные неизменяемые последовательности
- **Синтаксис**: `my_tuple = (1, 2, 3, 'a', 'b')`
- **Особенности**: Неизменяемы после создания, что делает их более эффективными по памяти

#### 3. Словари (Dictionaries)
- **Определение**: Неупорядоченные коллекции пар ключ-значение
- **Синтаксис**: `my_dict = {'key1': 'value1', 'key2': 'value2'}`
- **Особенности**: Обеспечивают быстрый доступ к данным по ключу

#### 4. Множества (Sets)
- **Определение**: Неупорядоченные коллекции уникальных элементов
- **Синтаксис**: `my_set = {1, 2, 3, 4}`
- **Особенности**: Удобны для удаления дубликатов и выполнения теоретико-множественных операций

**Рассмотрим более подробно каждую из них:**

### **Список (list)**

**Список** (`list`) — это упорядоченная коллекция элементов, сгруппированных под одним именем. Это контейнер, в который можно поместить любое количество значений, и эти значения могут быть разными по типу, включая другие списки.

Чтобы задать список, нужно заключить нужные элементы в квадратные скобки `[]`, разделив их запятыми. Пустые скобки обозначают пустой список. Пустой список также можно создать, написав `list()`.

In [1]:
a = list()
b = []

# убедимся, что два варианта создания пустого списка эквивалентны:
print(a == b)

True


In [2]:
# можно хранить разные типы данных!
c = [2, 'a', [4, 'stroka', 6.56]]

Что можно делать с list:

Можно поместить элемент в конец списка:

In [3]:
c.append(4.67)
c

[2, 'a', [4, 'stroka', 6.56], 4.67]

можно удалить элемент с конца списка:

In [4]:
c.pop()
c

[2, 'a', [4, 'stroka', 6.56]]

**Методы list, которые мы рассмотрим ниже, будут работать для всех iterable контейнеров**

(что значит iterabel, можно прочитать тут: https://pyneng.readthedocs.io/ru/latest/book/13_iterator_generator/iterable.html

кратко -- это структуры данных, поддерживающие поочередный проход по своим элементам)

По индексам можно получить доступ к элементам списка (индексация, как обычно, с 0):

In [5]:
print(c[0])
print(c[2])
# да, индексы могут быть отрицательные: -i есть i-ый с конца элемент списка (в нумерации с 1)
print(c[-1])

2
[4, 'stroka', 6.56]
[4, 'stroka', 6.56]


Можно не только получать по одному элементу списка, но и *срез* -- элементы списка с индексами между i (включительно) и j (не включительно):

In [6]:
# в d будет записан новый список, в котором будут 1 и 2 элементы списка c
d = c[1:3]
print(d)

['a', [4, 'stroka', 6.56]]


А еще можно сделать операцию наоборот -- не по индексу получить элемент списка, а по элементу списка получить его индекс.

`L.index(element)` - возвращает индекс элемента `element` в списке `L`, если он там присутствует, `None` иначе (вот еще один пример использования None)

In [7]:
c.index('a')

1

Можно проверять принадлежность элемента списку:

In [8]:
5 in c

False

In [9]:
if 'a' in c:
    print("element \'a\' in c")

element 'a' in c


Можно еще сложнее: получить каждый k-й элемент списка c, начиная с элемента с индексом i (включительно) и заканчивая элементом с индексом j (не включительно):

In [10]:
c = [1, 2, 3, 4, 5, 6, 7, 8, 9]
d = c[1:7:2]

# в языке С (Си) это выглядело бы как-то так:   for(int i = 1; i < 7; i += 2) {}
# в питоне это компактное название_списка[с какого считаем : по какой считаем : с каким шагом]

print(d)

[2, 4, 6]


С помощью срезовов можно перевернуть список, например:

In [11]:
print(c)
# получим каждый минус первый элемент списка начиная с 0 индекса и заканчивая последним
d = c[::-1]
print(d)

[1, 2, 3, 4, 5, 6, 7, 8, 9]
[9, 8, 7, 6, 5, 4, 3, 2, 1]


Элементы списка также можно изменять, обращаясь к ним по индексу или срезу:

In [12]:
print(c)
c[0] = 100500
print(c)

[1, 2, 3, 4, 5, 6, 7, 8, 9]
[100500, 2, 3, 4, 5, 6, 7, 8, 9]


In [13]:
# вместо 2, 3 и 4 элементов списка запишем  число 80
c[2:5] = [80]
print(c)
# вместо 2, 3 и 4 элементов списка запишем  числа 80, 90
c[2:5] = [80, 90]
print(c)

[100500, 2, 80, 6, 7, 8, 9]
[100500, 2, 80, 90, 8, 9]


Также списки можно складывать. Результатом сложения двух списков будет новый список, в котором сначала будут записаны элементы первого списка, затем -- второго:

In [14]:
d = [9, 0]
c+d

[100500, 2, 80, 90, 8, 9, 9, 0]

А вот вычитать нельзя:

In [15]:
c-d

TypeError: unsupported operand type(s) for -: 'list' and 'list'

С помощью `len()` можно получить размер листа (и вообще любого iterable объекта):

In [16]:
len(c)

6

можно отсортировать элементы списка, вызвав метод .sort():

In [17]:
# вызов метода sort изменяет сам объект c, а не возвращает копию:
c.sort()
c

[2, 8, 9, 80, 90, 100500]

#### **Основные методы объектов класса List:**

In [96]:
l = ['12', 34, 'Hi', '12']
print(f'Список {l}')
l2 = list([1,5,9])
print(f'Список {l2}')

Список ['12', 34, 'Hi', '12']
Список [1, 5, 9]


In [98]:
a = range(0,14,2)
list(a) # Преобразует объект range (диапазон) a в список.
print("Преобразует объект a в список", list(a))

Преобразует объект a в список [0, 2, 4, 6, 8, 10, 12]


In [99]:
l.append(x) # Добавляет новый элемент x в конец списка l.
print('Добавляет новый элемент x в конец списка l.', l)

Добавляет новый элемент x в конец списка l. ['12', 34, 'Hi', '12', 15]


In [100]:
l.extend(l2) # Добавляет новый список l2 в конец списка l.
print('Добавляет новый список l2 в конец списка l.', l)

Добавляет новый список l2 в конец списка l. ['12', 34, 'Hi', '12', 15, 1, 5, 9]


In [101]:
l.insert(1,66) # Вставляет x в элемент с индексом i.
print('Вставляет x в элемент с индексом i.', l)

Вставляет x в элемент с индексом i. ['12', 66, 34, 'Hi', '12', 15, 1, 5, 9]


In [102]:
l2 = l.copy() # Создаёт поверхностную копию списка l
print('Создаёт поверхностную копию списка l', l2)

Создаёт поверхностную копию списка l ['12', 66, 34, 'Hi', '12', 15, 1, 5, 9]


In [103]:
# Поиск значений в списке
l.count(x) # Определяет количество вхождений x в список l.
print('Определяет количество вхождений x в список l.', l.count(4))

Определяет количество вхождений x в список l. 0


In [104]:
l.index(x, 0, -1) # Возвращает наименьшее значение индекса i, где s[i] == x.
                            # Необязательные значения start и stop определяют индексы начального и конечного
                            # элементов диапазона, где выполняется поиск.
print('Возвращает наименьшее значение индекса i, где s[i] == x.', l.index(x, 0, -1))

Возвращает наименьшее значение индекса i, где s[i] == x. 5


In [105]:
# Удаление элементов списка
l.pop(-2) # Возвращает i-й элемент и удаляет его из списка. Если индекс i не указан,возвращается последний элемент.
print('Возвращает i-й элемент и удаляет его из списка', l)
l.remove('Hi') # Отыскивает в списке l элемент со значением Hi и удаляет его.
print('Отыскивает в списке l элемент со значением x и удаляет его.', l)
l2.clear() # Очищает список
print('Очищает список', l2)

Возвращает i-й элемент и удаляет его из списка ['12', 66, 34, 'Hi', '12', 15, 1, 9]
Отыскивает в списке l элемент со значением x и удаляет его. ['12', 66, 34, '12', 15, 1, 9]
Очищает список []


In [106]:
del l[1:3]  # удаление элемента по индексу или нескольких элементов по срезу
            # del не удаляет объекты в буквальном смысле,
            # она лишь открепляет ссылки, разрывая связь между именем
            # и объектом. Удаление объекта произойдет как следствие работы
            # сборщика мусора в отношении объектов, на которые больше
            # не ссылается ни один другой объект.
            # Изменение порядка элементов в списке
print('Удаление элемента по индексу или нескольких элементов по срезу', l)

Удаление элемента по индексу или нескольких элементов по срезу ['12', '12', 15, 1, 9]


In [107]:
l.reverse() # Изменяет порядок следования элементов в списке l на обратный.
print('Изменяет порядок следования элементов в списке l на обратный', l)

Изменяет порядок следования элементов в списке l на обратный [9, 1, 15, '12', '12']


In [108]:
l = [9, 56, 32, 1, 4]
l.sort() # Сортирует элементы списка l. key – это функция, которая вычисляет значение
                         # ключа. reverse – признак сортировки в обратном порядке. Аргументы key и reverse
                         # всегда должны передаваться как именованные аргументы.
print('Сортирует элементы списка', l)

Сортирует элементы списка [1, 4, 9, 32, 56]


### **Кортеж (tuple)**

**Кортеж** (`tuple`) — это упорядоченная неизменяемая коллекция элементов. Кортежи очень похожи на списки (`list`) по структуре и могут содержать элементы любых типов данных, включая числа, строки, списки и даже другие кортежи. Однако главное отличие кортежей от списков заключается в их неизменяемости: после создания кортежа его содержимое нельзя изменить — нельзя добавлять, удалять или изменять элементы.

Неизменяемость кортежей делает их хэшируемыми (при условии, что все их элементы также хэшируемы), что позволяет использовать их в качестве ключей словарей (`dict`) и элементов множеств (`set`). Списки, будучи изменяемыми, не являются хэшируемыми и поэтому не могут выступать в качестве ключей словаря или элементов множества.

Кортежи создаются с помощью круглых скобок `()`, перечисляя элементы через запятую. Примеры создания кортежей:

In [19]:
t = 'a', 5, 12.345, (2, 'b')
t

('a', 5, 12.345, (2, 'b'))

Tuple нельзя изменять. Давайте в этом убедимся:

In [20]:
t.append(5)

AttributeError: 'tuple' object has no attribute 'append'

In [22]:
t[0] = 9

TypeError: 'tuple' object does not support item assignment

Но получать элементы по индексу и срезам, конечно, можно (tuple же iterable):

In [23]:
print(t[2])
print(t.index(5))
print(t[:2])

12.345
1
('a', 5)


Как и list, кортежи можно складывать и работает сложение так же, как в list

(вообще, с кортежами можно делать все, что можно делать с list, если это не изменяет кортеж)

In [24]:
m = (1, 2, 3)
# складывать (возвращается новый кортеж, исходный естественно не изменяется)
print(t + m)
# узнать размер
print(len(t))
# проверить наличие элемента
print(5 in t)

('a', 5, 12.345, (2, 'b'), 1, 2, 3)
4
True


In [25]:
a = [1, 2, 3]
b = a
b[0] = 49
print(a)

[49, 2, 3]


### **Множество (set)**

**Множество** (`set`) — это неупорядоченная коллекция уникальных элементов. В отличие от списка (`list`), множество не допускает повторяющихся элементов и не сохраняет порядок элементов. Элементы множества хранятся таким образом, что доступ к ним осуществляется очень быстро, но они не имеют определённого индекса, поэтому обращаться к элементам по индексу невозможно.

Множества используются для хранения уникальных элементов и позволяют эффективно выполнять операции проверки принадлежности, удаления дубликатов из последовательностей и выполнять математические операции над множествами, такие как объединение, пересечение, разность и симметрическая разность.

Пустое множество создаётся с помощью функции `set()`. Обратите внимание, что использование пустых фигурных скобок `{}` создаст пустой словарь, а не множество.

Примеры создания множества:

In [26]:
s = set()

print(s, '|', type(s))

set() | <class 'set'>


А можно привести список к множеству:

Обратите внимание, что элементы сета (множества) выводятся в отсортированном порядке!

In [27]:
s = set([5, 2, 3, 2])
s

{2, 3, 5}

Можно добавлять элементы в множество с помощью метода `.add()`:

In [28]:
s.add(1)
s.add('a')
# None тоже можно добавить
s.add(None)
s.add('bullet')
print(s)

{1, 2, 3, 5, 'bullet', 'a', None}


Метод .difference() позволяет получить элементы, которые есть в одном сете, но нет в другом:

In [29]:
s1 = set(range(0, 10))
s2 = set(range(5, 15))

print('s1: ', s1, '\ns2: ', s2)

s1:  {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} 
s2:  {5, 6, 7, 8, 9, 10, 11, 12, 13, 14}


In [30]:
# элементы, которые есть в s1, но нет в s2
print(s1.difference(s2))
print()
# элементы, которые есть в s2, но нет в s1
print(s2.difference(s1))

{0, 1, 2, 3, 4}

{10, 11, 12, 13, 14}


In [31]:
# пересечение множеств s1 и s2 можно записать двумя способами:
print(s1.intersection(s2))
print(s1 & s2)

{5, 6, 7, 8, 9}
{5, 6, 7, 8, 9}


In [32]:
# объединение множеств s1 и s2 тоже можно записать двумя способами:
print(s1.union(s2))
print(s1 | s2)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14}
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14}


Из сета можно удалить элемент по значению:

In [33]:
s1.discard(0)
s1

{1, 2, 3, 4, 5, 6, 7, 8, 9}

In [34]:
l = [1, 2, 3]
if 4 in l:
    # pass - ничего не делать, иначе получим ошибку, что нету кода
    pass

s = set(l)
if 4 in s:
    pass

**Еще о свойствах множеств:**

- **Неоднородность**.

Множество может быть неоднородным — действительно, множество может содержать элементы разных типов, при условии, что эти элементы являются хэшируемыми. Это означает, что элементы должны быть неизменяемыми объектами, такими как числа (`int`, `float`), строки (`str`), кортежи (`tuple`), содержащие хэшируемые элементы, и т.д.

- **Уникальность**

Множество всегда состоит только из уникальных элементов (дубли запрещены). При попытке добавить в множество элемент, который уже присутствует, никаких изменений не произойдет. Это отличает множества от списков и кортежей, которые могут содержать повторяющиеся элементы.

- **Хэшируемость**

Объект `set` — это коллекция уникальных хэшируемых объектов. Объект называется хэшируемым, если на протяжении его жизни значение хэша остаётся неизменным. Это достигается тем, что объект неизменяем. Хэшируемость важна для множеств, поскольку они используют хэш-значения элементов для организации внутренней структуры данных (обычно хеш-таблицы). Это же требование хэшируемости распространяется на ключи словарей.

- **Применение**

Множества используются для проверки принадлежности, удаления повторов и выполнения математических операций — абсолютно верно. Множества предоставляют эффективные методы для операций объединения (`union`), пересечения (`intersection`), разности (`difference`) и симметричной разности (`symmetric_difference`). Кроме того, они полезны для удаления дубликатов из последовательностей и быстрой проверки наличия элемента.

#### **Основные методы объектов класса Set:**

In [51]:
a = set() # создаём пустое множество a

print(a)
print(type(a))

set()
<class 'set'>


In [52]:
b = {} # используя пустые фигурные скобки по умолчанию создается словарь, не множество !
print(type(b))

<class 'dict'>


In [53]:
b = {"self", 1, (1,2, 3)} # объявляем и инициализируем множество b. Способ 1
print(b)
print(type(b))

{1, 'self', (1, 2, 3)}
<class 'set'>


In [54]:
b = set(("self", 1, (1,2, 3))) # объявляем и инициализируем множество b. Способ 2
print(b)
print(type(b))

{1, 'self', (1, 2, 3)}
<class 'set'>


In [55]:
a.add(2) # добавление одного элемента во множество a
print(a)

{2}


In [56]:
a.update((3,4,5,6)) # добавление нескольких элементов во множество a
print(a)

{2, 3, 4, 5, 6}


In [57]:
# запрещено добавлять элементы изменяемых типов, такие как список или словарь

dict = {"one": 1}

a.add(dict)
print(a)

TypeError: unhashable type: 'dict'

In [58]:
# но с помощью функции set() можно преобразовать любой контейнер в множество
list_1 = [1,2,3]

print(set(list_1))
print(set(dict))

{1, 2, 3}
{'one'}


In [59]:
# Удаление элементов из множества

set1 = {1, 2, 3, 4, 'a', 'p'}
print(set1)

{1, 2, 3, 4, 'a', 'p'}


In [60]:
set1.remove(2) #Метод remove() удаляет из множества конкретный элемент и возвращает ошибку в том случае, если его нет во множестве.
print(set1)
#set1.remove(5) # возникает ошибка

{1, 3, 4, 'a', 'p'}


In [62]:
set1 = {1, 3, 4, 'a', 'p'}
print(set1)

set1.discard('a') # Метод discard() удаляет конкретный элемент и НЕ возвращает ошибку, если тот не был найден во множестве.
print(set1)

set1.discard(6)
print(set1) # ошибки не возникает

{1, 3, 4, 'a', 'p'}
{1, 3, 4, 'p'}
{1, 3, 4, 'p'}


In [None]:
set1 = {1, 2, 3, 4}
set1.pop() #Метод pop() удаляет и возвращает по одному элементу за раз в случайном порядке. Set — это неупорядоченная коллекция, поэтому pop() не требует аргументов (индексов в этом случае). Метод pop() можно воспринимать как неконтролируемый способ удаления элементов по одному из множеств в Python.
a = set1.pop()
print(set1, a)

In [63]:
#Проверка вхождения объекта во множество

num_set = {1 ,3, 5, 7, 9, 10}
print(num_set)

print(7 in num_set)
print(1 not in num_set)

{1, 3, 5, 7, 9, 10}
True
False


In [64]:
# Количество элементов во множестве num_set
print(len(num_set))

6


In [65]:
new_set = num_set.copy() # метод copy() — создает копию существующего множества и сохраняет ее в новом объекте.
print(len(new_set))

6


In [66]:
num_set.clear() # метод clear() —очищает множество (удаляет все элементы за раз)
print(num_set)

set()


In [67]:
del num_set # del — удаляет множество целиком

In [69]:
#Операции множеств в Python

# Объединение множеств
#При использовании на двух множествах вы получаете новый объект, содержащий элементы обоих (без повторов). Операция объединения в Python выполняется двумя способам: с помощью символа | или метода union().

A = {1, 2, 3}
B = {2, 3, 4, 5}
C = A | B  # используя символьный метод
C = A.union(B) # используя метод union
print(C)

{1, 2, 3, 4, 5}


In [70]:
# Пересечение множеств
# При использовании на двух множествах вы получаете новый объект, содержащий общие элементы обоих (без повторов). Операция пересечения выполняется двумя способами: с помощью символа & или метода intersection().

A = {1, 2, 3, 4}
B = {3,4,5,6}
C = A & B  # используя символьный метод
C = A.intersection(B)  # используя метод intersection
print(C)

{3, 4}


In [71]:
# Разность множеств
#При использовании на двух множествах вы получаете новый объект, содержащий элементы, которые есть в первом, но не втором (в данном случае — в множестве “A”). Операция разности выполняется двумя способами: с помощью символа - или метода difference().

A = {1, 2, 3, 4}
B = {3,4,5,6}
C = A - B # используя символьный метод
C = A.difference(B) # используя метод difference
print(C)

{1, 2}


In [72]:
#Симметричная разность множеств
#При использовании на двух множествах вы получаете новый объект, содержащий все элементы, кроме тех, что есть в обоих. Симметрическая разность выполняется двумя способами: с помощью символа ^ или метода symmetric_difference().

C = A ^ B  # используя символьный метод
C = A.symmetric_difference(B)  # используя метод symmetric_difference
print(C)

{1, 2, 5, 6}


In [73]:
#Подмножество и надмножество в Python
#Множество B (SetB) называется подмножеством множества A (SetA), если все элементы SetB есть в SetA. Проверить на подмножество в Python можно двумя способами: с помощью символа <= или метода issubset(). Он возвращает True или False в зависимости от результата.

A = {1, 2, 3, 4, 5}
B = {2,3,4}
print(B <= A)  # используя символьный метод
print(B.issubset(A)) # используя метод issubset


True
True


In [74]:
# Множество A (SetA) называется надмножеством множества B (SetB), если все элементы SetB есть в SetA. Проверить на надмножество в Python можно двумя способами: с помощью символа >= или метода issuperset(). Он возвращает True или False в зависимости от результата.

A = {1, 2, 3, 4, 5}
B = {2,3,4}
print(A >= B)  # используя символьный метод
print (A.issuperset(B)) # используя метод issubset

True
True


In [75]:
# Удаление дубликатов из списка путём преобразования его во множество и обратно

List1 = [1, 2, 3, 5, 3, 2, 4, 7]
print(List1)

List_without_duplicate = set(List1)
List1 = list(List_without_duplicate)
print(List1)

[1, 2, 3, 5, 3, 2, 4, 7]
[1, 2, 3, 4, 5, 7]


In [76]:
# В одну строку:

List1 = list(set(List1))
print(List1)

[1, 2, 3, 4, 5, 7]


### **Словарь (dict)**

**Словарь** (также известный как ассоциативный список) — это структура данных, которая хранит набор пар «ключ-значение», где каждый ключ уникален и связан с определённым значением. Основное свойство словаря — быстрый доступ к значениям по их ключам.

В Python ключами в словаре могут быть любые объекты, которые являются неизменяемыми и хэшируемыми. К таким типам данных относятся:

- **Числовые типы**: `int`, `float`, `complex`
- **Логический тип**: `bool`
- **Строки**: `str`
- **Кортежи**: `tuple` (если все элементы внутри кортежа также неизменяемы и хэшируемы)
- **Байтовые строки**: `bytes`
- **Неизменяемые множества**: `frozenset`
- **NoneType**: объект `None`
- **Объекты пользовательских классов**, если они неизменяемы и реализуют методы `__hash__()` и `__eq__()`, обеспечивая корректное поведение при хешировании.

Важно отметить, что изменяемые типы данных, такие как списки `list`, множества `set`, словари `dict`, и пользовательские объекты, которые могут менять свое состояние после создания, **не могут** быть ключами в словаре, так как они не являются хэшируемыми.

Структуры данных `str`, `tuple`, `list`, которые мы ранее рассматривали, представляют собой упорядоченные коллекции элементов, доступ к которым осуществляется по целочисленным индексам из непрерывного диапазона `[0, n)`. В отличие от списков, словари позволяют использовать в качестве ключей более широкий спектр типов данных и не требуют, чтобы ключи были последовательными числами. Это особенно удобно, когда:

- Необходимо использовать в качестве ключа другой тип данных (например, сопоставить именам людей (`str`) их даты рождения).
- В качестве ключей нужно использовать числа, но не все значения из некоторого диапазона полезны (например, сопоставить определённым годам рождения великих писателей их имена, без необходимости создавать записи для всех возможных годов).

Таким образом, словари являются гибким и эффективным средством для организации данных, где связь между ключами и значениями играет ключевую роль.

Пустой словарь можно создать либо с помощью `{}`, либо с `dict()`:

In [79]:
d = {}
dd = dict()

print(d == dd, '|', type(d))

True | <class 'dict'>


Добавим значение value по ключу key в словарь:

In [80]:
key = 'b'
value = 100

d[key] = value
d

{'b': 100}

Непустой словарь можно создать несколькими способами:

In [81]:
{
    'зарплаты':{
        'Петя':100000,
        'Аня':100000,
    },
    'проекты':['']
}

{'зарплаты': {'Петя': 100000, 'Аня': 100000}, 'проекты': ['']}

In [82]:
d = {
    'short': ['dict'],
    'long': 'dictionary'
}
d

{'short': ['dict'], 'long': 'dictionary'}

In [83]:
d = dict(short='dict', long='dictionary')
d

{'short': 'dict', 'long': 'dictionary'}

In [84]:
d = dict([(1, 1), (2, 4)])
d

{1: 1, 2: 4}

Создать дефолтный (со значениями по умолчанию) словарь с ключами из списка, значениями None:

In [85]:
d = dict.fromkeys(['a', 'b'])
d

{'a': None, 'b': None}

Создать дефолтный словарь с ключами из списка, всеми значениями по умолчанию 100:

In [86]:
d = dict.fromkeys(['a', 'b'], 100)
d

{'a': 100, 'b': 100}

In [87]:
100 in d

False

**dict comprehensions**

Еще один способ объявления словаря: создадим словарь, где каждому целому числу от 0 до 6 поставим в соответствие квадрат этого числа:

In [88]:
d = {a: a ** 2 for a in range(7)}
d

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36}

Будьте осторожны, если ключа, по которому поступил запрос, нет в словаре, то выбросит исключение:

In [89]:
d = {1: 100, 2: 200, 3: 300}
d['a']

KeyError: 'a'

Поэтому безопаснее использовать **get(key)**. Тогда, если нужно, можно проверить на **None**:

In [90]:
d.get(123)

In [91]:
d.get('a') == None

True

Самое часто используемое - получение ключей, получение значений и получение всего вместе:

In [92]:
# получить список ключей
print(d.keys(), '|', type(d.keys()))

# чтобы вывести ключи, нужно привести d.keys() к списку
print(list(d.keys()))

dict_keys([1, 2, 3]) | <class 'dict_keys'>
[1, 2, 3]


In [93]:
# получить список значений
print(d.values(), '|', type(d.values()))

# то же самое -- чтобы вывести значения, нужно привести d.values() к списку
print(list(d.values()))

dict_values([100, 200, 300]) | <class 'dict_values'>
[100, 200, 300]


In [94]:
# получить список пар ключ-значение
print(d.items(), '|', type(d.items()))

# то же самое -- чтобы вывести пары ключ-значения, нужно привести d.items() к списку
print(list(d.items()))

dict_items([(1, 100), (2, 200), (3, 300)]) | <class 'dict_items'>
[(1, 100), (2, 200), (3, 300)]


#### Основные методы объектов класса Dict:

Словари (dict) в Python - неупорядоченные коллекции произвольных объектов с доступом по ключу. Их иногда ещё называют ассоциативными списками или хеш-таблицами.

In [109]:
d = {}
d = dict()

d = {
	"Vasya":777,
	"Petya":328,
	"Vanya":543
}


print("Исходный словарь:", d, "\n")

Исходный словарь: {'Vasya': 777, 'Petya': 328, 'Vanya': 543} 



In [110]:
len(d) # Возвращает количество элементов в словаре d.
print(len(d), "\n")

3 



In [111]:
d["Vasya"] # Возвращает элемент словаря d с ключом k.
print(d["Vasya"] , "\n")

777 



In [112]:
d["Vitya"] = 178 # Записывает в элемент d[k] значение x.
print(d , "\n")

{'Vasya': 777, 'Petya': 328, 'Vanya': 543, 'Vitya': 178} 



In [113]:
del d["Petya"] # Удаляет элемент d[k] (по ключу).
print(d , "\n")

{'Vasya': 777, 'Vanya': 543, 'Vitya': 178} 



In [114]:
print("Petya" in d) # Возвращает True, если ключ k присутствует в словаре d.
print()

False



In [115]:
k = d.copy() # Создает копию словаря d.
print(k , "\n")

{'Vasya': 777, 'Vanya': 543, 'Vitya': 178} 



In [116]:
k.clear() # Удаляет все элементы из словаря k.
print(k , "\n")

{} 



In [117]:
c = dict.fromkeys([23, 34, "Qwer"], "True") # Создает новый словарь с ключами, перечисленными в последовательности s, а все значения устанавливает равными value.
print(c , "\n")

{23: 'True', 34: 'True', 'Qwer': 'True'} 



In [118]:
d.get("Petya", "Элемента не существует!") # Возвращает элемент d[k], если таковой имеется, в противном случае возвращает v.
print(d.get("Petya", "Элемента не существует!") , "\n")

Элемента не существует! 



In [119]:
d.items() # Возвращает последовательность пар (key, value).
print(d.items() , "\n")

dict_items([('Vasya', 777), ('Vanya', 543), ('Vitya', 178)]) 



In [120]:
d.keys() # Возвращает последовательность ключей.
print(d.keys() , "\n")

dict_keys(['Vasya', 'Vanya', 'Vitya']) 



In [121]:
d.values() # Возвращает последовательность всех значений в словаре d.
print(d.values(), "\n")

dict_values([777, 543, 178]) 



In [122]:
d.pop("Vasya" ,"default") # Возвращает элемент d[k], если таковой имеется, и удаляет его из словаря; в противном случае возвращает default, если этот аргумент указан, или возбуждает исключение KeyError.
print(d , "\n")

{'Vanya': 543, 'Vitya': 178} 



In [123]:
d.popitem() # Удаляет из словаря случайную пару (key, value) и возвращает ее в виде кортежа.
print(d , "\n")

{'Vanya': 543} 



In [124]:
d.setdefault("Ibrahim", 198) # Возвращает элемент d[k], если таковой имеется, в противном случае возвращает значение v и создает новый элемент словаря d[k] = v.
print(d , "\n")

{'Vanya': 543, 'Ibrahim': 198} 



In [125]:
b = {'Ahmed': 800, 'Shapi': 398}
d.update(b) # Добавляет все объекты из b в словарь d.
print(d , "\n")

{'Vanya': 543, 'Ibrahim': 198, 'Ahmed': 800, 'Shapi': 398} 



## **Циклы - for и while**



Итерируемые (iterable) стректуры данных так называются, потому что по ним можно *итерироваться* -- последовательно получать значения последовательных элементов этой структуры данных. Итерироваться можно с помощью циклов `for` или `while`.

Синтаксис следующий:

```
for element in iterable:
    <code>
```

В каждой новой итерации цикла в переменную *element* будет записываться очередное значение из контейнера *iterable*, и с ним можно будет работать внутри тела цикла (код). Когда код внутри тела цикла отработает, начнется новая итерация — в переменную element запишется следующее значение из *iterable*, и снова будет выполняться код.

Код, который будет выполняться на каждой итерации цикла, записывается после двоеточия с отступом в 4 пробела от строки с for.

Рассмотрим на примере:

In [126]:
# создадим list элементов
models = ['decision tree', 'linear model', 'svm', 'ensemble']

# итерируемся по названиям модели: каждую итерацию цикла в переменную model будет
# записываться новое значение из models и оно будет использоваться для print(model)
for model in models:
    # тело цикла. Здесь с отступом в 4 пробела нужно описать код, который будет выполняться на каждой итерации цикла.
    print(model)

# этот код уже будет выполняться ПОСЛЕ цикла, потому что он записан без отступа в 4 пробела после for:
print("Done")
print(model)

decision tree
linear model
svm
ensemble
Done
ensemble


**P.S.** Зметим, что каждую итерацию цикла в переменную model **копируется** очередное значение из models. Это значит, что если вы внутри цикла измените переменную model, соответствующее значение в списке models изменено **не будет**

Синтаксис `while`:

```
while <условие (булевское выражение)>:
    <code>
```

Здесь код, написанный вместо `code` будет выполняться каждую итерацию цикла, пока условие после `while` будет выполняться.

Посмотрим на примере: Напишем цикл, в котором будем выводить переменную x и увеличивать x на 1, пока x не станет больше 10:

In [131]:
x = 1

while x <= 10:
    print(x)
    # более удобный способ записи x = x + 1
    x += 1

1
2
3
4
5
6
7
8
9
10


Иногда бывает нужно прервать выполнение цикла при выполнении какого-то условия

Например, мы хотим итерироваться по списку строк, на каждой итерации выводить строку на экран и прервать цико (перестать выводить строки), если мы встретили строку stop.

Это делается с помощью ключевого слова `break`:

In [132]:
mas = ['stroka1', 'stroka2', 'stroka3', 'stop', 'stroka4']

for s in mas:
    if s == 'stop':
        break
    print(s)

stroka1
stroka2
stroka3


Иногда же хочется не прервать выполнение всего цикла, а прервать выполнение именно одной итерации цикла и продолжить цикл со следующей итерации.

Например, мы так же, как в предыдущем примере, хотим итерироваться по списку строк и выводить строку на каждой итерации на экран, но не хотим выводить строку на экран, если эта строка равна 'null'.

Это делается с помощью ключевого слова `continue`:

In [133]:
mas = ['stroka1', 'null', 'stroka3', 'stop', 'null']

for s in mas:
    if s == 'null':
        continue
    print(s)

stroka1
stroka3
stop


### Объекты класса **range**

Функция `range()` в Python — это встроенный инструмент для создания последовательности чисел, часто используемый в циклах. Она генерирует итерируемый объект, который можно использовать в цикле `for` для выполнения определенного количества итераций или для создания числовых последовательностей.

Синтаксис `range()`:

```python
range(start, stop, step)
```

- `start` (необязательный): начальное значение последовательности (по умолчанию 0).
- `stop` (обязательный): конечное значение последовательности (не включается в результат).
- `step` (необязательный): шаг между числами в последовательности (по умолчанию 1).

`range()` может принимать от одного до трех аргументов:

1. `range(stop)`: создает последовательность от 0 до `stop - 1`.
2. `range(start, stop)`: создает последовательность от `start` до `stop - 1`.
3. `range(start, stop, step)`: создает последовательность от `start` до `stop - 1` с шагом `step`.

`range()` особенно полезен, когда нужно выполнить цикл определенное количество раз или создать последовательность чисел. Он эффективен с точки зрения памяти, так как не создает список всех чисел сразу, а генерирует их по мере необходимости.

In [127]:
r = range(1, 100, 10)
#приведем возвращаемый iterable объект (range) к списку (list) и выведем на экран:
print(list(r))

[1, 11, 21, 31, 41, 51, 61, 71, 81, 91]


Теперь легко записать цикл:

In [128]:
for i in range(1, 10, 1):
    print(i)
# for(int i = 1; i < 10; i += 1){cout << i;}

1
2
3
4
5
6
7
8
9


Если у range не указывать последний алгумент step, он по умолчанию будет 1.

А если указать всего один аргумент, то range выдаст iterable с началом в 0 и концом в этом аргументе:

In [129]:
list(range(4, 8))

[4, 5, 6, 7]

In [130]:
list(range(8))

[0, 1, 2, 3, 4, 5, 6, 7]

С помощью range нетрудно переписать цикл, который мы писали выше, где итерировались по названиям моделей, так, чтобы элементы списка models  можно было изменять внутри цикла:

In [134]:
# создадим list элементов
models = ['decision tree', 'linear model', 'svm', 'ensemble']

# итерируемся по индексам списка models
for i in range(len(models)):
    # тут если вы поменяете models[i], то значение в models тоже изменится
    print(models[i])

# этот код уже будет выполняться ПОСЛЕ цикла, потому что он записан без отступа в 4 пробела после for:
print("Done")

decision tree
linear model
svm
ensemble
Done


## **Генераторы списков (List comprehension)**

List comprehension - это компактный способ создания нового списка на основе существующего итерируемого объекта. Общий синтаксис:

```python
[expression for item in iterable if condition]
```

где:

- `expression` - выражение, определяющее элементы нового списка. Это может быть простая переменная, преобразование исходного элемента или более сложное вычисление.
- `item` - переменная-заполнитель, представляющая каждый элемент в исходном итерируемом объекте.
- `iterable` - существующий итерируемый объект (например, список, кортеж, строка), по которому выполняется итерация.
- `condition` - необязательное условие, позволяющее фильтровать элементы. Если условие указано, в новый список попадут только те элементы, для которых оно истинно.

List comprehension позволяет создавать новые списки, применяя выражение к каждому элементу исходного итерируемого объекта, с возможностью дополнительной фильтрации по условию. Это более краткий и часто более читаемый способ по сравнению с традиционными циклами for.

#### Примеры:



##### **1. Простое преобразование:**

In [140]:
squares = [x**2 for x in range(10)]
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

Давайте подробно разберем выражение:

1. `range(10)`:
   - Это функция, которая создает последовательность чисел от 0 до 9 (10 не включается).
   - Таким образом, `range(10)` генерирует числа: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.

2. `for x in range(10)`:
   - Это часть синтаксиса list comprehension, которая указывает, что мы будем итерироваться по всем числам, сгенерированным `range(10)`.
   - Переменная `x` будет принимать значения от 0 до 9 последовательно.

3. `x**2`:
   - Это выражение, которое будет применяться к каждому `x`.
   - Оператор `**` в Python означает возведение в степень.
   - Таким образом, `x**2` возводит каждое число `x` в квадрат.

4. `[x**2 for x in range(10)]`:
   - Это полное выражение list comprehension.
   - Оно создает новый список, где каждый элемент является квадратом соответствующего числа из `range(10)`.

5. `squares =`:
   - Результат list comprehension присваивается переменной `squares`.

В итоге, `squares` будет содержать список квадратов чисел от 0 до 9:
`[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]`

Это выражение эквивалентно следующему традиционному циклу:

```python
squares = []
for x in range(10):
    squares.append(x**2)
```

Но list comprehension делает код более компактным и часто более читаемым.

##### **2. С условием:**

In [None]:
evens = [x for x in range(20) if x % 2 == 0]
evens

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

Разберем это выражение по частям:

1. `range(20)`:
   - Это функция, которая создает последовательность чисел от 0 до 19 (20 не включается).

2. `for x in range(20)`:
   - Эта часть указывает, что мы будем итерироваться по всем числам, сгенерированным `range(20)`.
   - Переменная `x` будет принимать значения от 0 до 19 последовательно.

3. `if x % 2 == 0`:
   - Это условие фильтрации.
   - Оператор `%` в Python - это остаток от деления.
   - `x % 2 == 0` проверяет, делится ли `x` на 2 без остатка, то есть является ли число четным.

4. `x for x in range(20) if x % 2 == 0`:
   - Это полное выражение list comprehension.
   - Оно создает новый список, включая только те значения `x`, которые удовлетворяют условию (то есть четные числа).

5. `evens =`:
   - Результат list comprehension присваивается переменной `evens`.

В итоге, `evens` будет содержать список четных чисел от 0 до 18:
`[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]`

Это выражение эквивалентно следующему традиционному циклу:

```python
evens = []
for x in range(20):
    if x % 2 == 0:
        evens.append(x)
```

List comprehension в данном случае позволяет объединить создание списка, итерацию и фильтрацию в одну компактную строку кода.

##### **3. Вложенные циклы:**

In [139]:
matrix = [[i*j for j in range(3)] for i in range(3)]
matrix

[[0, 0, 0], [0, 1, 2], [0, 2, 4]]

Это пример использования вложенного list comprehension в Python для создания двумерного списка (матрицы). Разберем его по частям:

1. Внешний list comprehension:
   `[... for i in range(3)]`
   - Создает внешний список, где `i` принимает значения 0, 1, 2.
   - Каждый элемент этого списка будет результатом внутреннего list comprehension.

2. Внутренний list comprehension:
   `[i*j for j in range(3)]`
   - Для каждого значения `i` создается новый список.
   - `j` также принимает значения 0, 1, 2.
   - Каждый элемент этого внутреннего списка - результат умножения `i` на `j`.

3. Результат:
   - Создается матрица 3x3, где каждый элемент - произведение его индексов строки и столбца.

Итоговая матрица будет выглядеть так:
```python
[
  [0, 0, 0],  # i=0: 0*0, 0*1, 0*2
  [0, 1, 2],  # i=1: 1*0, 1*1, 1*2
  [0, 2, 4]   # i=2: 2*0, 2*1, 2*2
]
```

Это выражение эквивалентно следующему традиционному вложенному циклу:

```python
matrix = []
for i in range(3):
    row = []
    for j in range(3):
        row.append(i*j)
    matrix.append(row)
```

##### 4. С функциями:

In [141]:
names = ['alice', 'bob', 'charlie']
capitalized = [name.capitalize() for name in names]
capitalized

['Alice', 'Bob', 'Charlie']

Это пример использования list comprehension в Python для применения метода строки к каждому элементу списка.

Разберем его по частям:

1. `names = ['alice', 'bob', 'charlie']`:
   - Создается исходный список `names`, содержащий три строки с именами в нижнем регистре.

2. `[name.capitalize() for name in names]`:
   - Это list comprehension, который создает новый список.
   - `for name in names`: итерация по каждому элементу списка `names`.
   - `name.capitalize()`: для каждого имени вызывается метод `capitalize()`.

3. `name.capitalize()`:
   - Метод `capitalize()` возвращает копию строки, где первый символ преобразован в верхний регистр, а остальные - в нижний.

4. `capitalized =`:
   - Результат list comprehension присваивается переменной `capitalized`.

В итоге, `capitalized` будет содержать новый список, где каждое имя начинается с заглавной буквы:
`['Alice', 'Bob', 'Charlie']`

Это выражение эквивалентно следующему традиционному циклу:

```python
capitalized = []
for name in names:
    capitalized.append(name.capitalize())
```