# Структуры данных

## Списки

Список, или массив (list) -- это такая структура данных, где все элементы имеют порядковый номер (индекс), по которому их можно вызвать. Элементы могут повторяться (т.е. в ячейках с разными индексами могут быть записаны переменные с одинаковым значением / одинаковые константы). В списке могут храниться данные разных типов. Записывается в [ ].

In [3]:
a = 5
b = "hello"

some_list = [4.89, a, "spam", True, "spam", b]
print(some_list)

[4.89, 5, 'spam', True, 'spam', 'hello']


In [6]:
sentence = "Из этого предложения получится список"
letters = list(sentence)  # разбивает строку на минимальные элементы, т.е. посимвольно
words = sentence.split() # разбивает строку на слова по пробелам

print(words)
print(letters)

['Из', 'этого', 'предложения', 'получится', 'список']
['И', 'з', ' ', 'э', 'т', 'о', 'г', 'о', ' ', 'п', 'р', 'е', 'д', 'л', 'о', 'ж', 'е', 'н', 'и', 'я', ' ', 'п', 'о', 'л', 'у', 'ч', 'и', 'т', 'с', 'я', ' ', 'с', 'п', 'и', 'с', 'о', 'к']


К элементам массива можно обращаться как по ключу от 0 до длины - 1, так и по отрицательному ключу, где -1 - это последний элемент, -2 - предпоследний и так далее

In [20]:
a = ['first', 'second', 'third']
print(a[0])
print(a[-1])
print(a[-2])

first
third
second


list() принимает на вход только один аргумент. Этот аргумент должен быть итерируемым (по нему можно пройти циклом for, например, строка)! Из числа сделать список не получится

In [8]:
numbers = list(123)

TypeError: 'int' object is not iterable

Список может быть пустым

In [9]:
new_list = []
print(new_list)

[]


**Основные методы list**

1. \+ : простое сложение
2. append : добавить элемент в конец
3. extend : расширить список (то же, что и +)

In [11]:
a = [1, 2, 3]
a.append(5)
print(a)
a.append([6,7,8])
print(a)

[1, 2, 3, 5]
[1, 2, 3, 5, [6, 7, 8]]


In [13]:
a = [1, 2, 3]
a.extend([6,7,8])
print(a)

[1, 2, 3, 6, 7, 8]


In [15]:
a = [1, 2, 3]
a = a + [7, 8, 9]
print(a)

[1, 2, 3, 7, 8, 9]


In [16]:
# это же можно записать по-другому
a = [1, 2, 3]
a += [7, 8, 9]
print(a)

[1, 2, 3, 7, 8, 9]


Можно удалить элемент по ключу

In [21]:
a = ['this', 'is', 'some', 'list']
del a[2]
print(a)

['this', 'is', 'list']


Срез - это копия части массива. Параметры задаются в квадратных скобках после имени списка

In [36]:
a = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
print(a[4:])  # элементы, начиная с индекса 4
print(a[:6])  # элементы, до индекса 6 (не включительно)
print(a[4:6])  # элементы, с индекса 4 по 6 (не включительно)
print(a[2:8:2])  # элементы, с индекса 2 по 8 (не включительно) с шагом 2
print(a[8:2:-1])  # элементы, с индекса 2 (не включительно) по 8 (включительно) с шагом -1 (в обратном порядке)
print(a[::-1])  # элементы в обратном порядке

[50, 60, 70, 80, 90, 100]
[10, 20, 30, 40, 50, 60]
[50, 60]
[30, 50, 70]
[90, 80, 70, 60, 50, 40]
[100, 90, 80, 70, 60, 50, 40, 30, 20, 10]


## Кортежи

Кортеж (tuple) - это тип неизменяемых данных, если элемент списка можно поменять, то у tuple такой возможности нет

In [22]:
# пустой кортеж
new_tuple = ()
print(new_tuple)

# непустой кортеж
siblings = ('brother', 'sister')
print(siblings)

# кортеж из списка
words = tuple(words)
print(words)

# кортеж из строки
letters = tuple(sentence) # строка разбивается на минимальные единицы, т.е. посимвольно
print(letters)

()
('brother', 'sister')
('Из', 'этого', 'предложения', 'получится', 'список')
('И', 'з', ' ', 'э', 'т', 'о', 'г', 'о', ' ', 'п', 'р', 'е', 'д', 'л', 'о', 'ж', 'е', 'н', 'и', 'я', ' ', 'п', 'о', 'л', 'у', 'ч', 'и', 'т', 'с', 'я', ' ', 'с', 'п', 'и', 'с', 'о', 'к')


In [23]:
words += siblings # прибавляем siblings к words и записываем результат в words
print(words)

big_family = siblings * 3
print(big_family)

('Из', 'этого', 'предложения', 'получится', 'список', 'brother', 'sister')
('brother', 'sister', 'brother', 'sister', 'brother', 'sister')


In [24]:
print(words[0])   # первый элемент кортежа
print(words[-1])  # последний элемент кортежа
print(words[2:5]) # элементы кортежа со 2 по 5 (включая 2 и не включая 5)

Из
sister
('предложения', 'получится', 'список')


## Множества

Множество (set) - это структура данных, чем-то похожая и на массив, и на словарь, но от них отличающаяся.

Как и массивы, множества содержат элементы. Но в отличие от массивов, где элементы упорядочены, в множестве они идут в "произвольном" порядке.

На словари множества похожи тем, что, как и ключи в словарях, элементы множеств неупорядочены и поэтому должны быть уникальны.

Поиск в множестве происходит быстрее, чем в массиве. Если вам нужно собрать какие-то данные, а потом проверять, есть ли в этих данных что-то, то целесообразно использовать именно множества. Во-вторых, преобразование в множества помогают быстро превратить набор данных в набор уникальных элементов.

In [38]:
# создаем множество из списка (массива)

sentence = "the cat is on the mat"
words = set(sentence.split())  # превращаем список, который возвращает split(), в массив
animals = set(['cat', 'dog', 'elephant', 'crocodile', 'fox', 'cat', 'elephant'])

print(words)
print(animals)

{'the', 'on', 'is', 'mat', 'cat'}
{'dog', 'crocodile', 'fox', 'elephant', 'cat'}


In [39]:
# создаем множество из строки

letters = set(sentence)  # разбивает строку на минимальные элементы, т.е. посимвольно
print(letters)

{'s', 'o', 'h', 't', 'i', 'e', 'n', 'a', 'm', 'c', ' '}


Обратите внимание, что все элементы получившихся множеств уникальны! Если вам нужно избавиться от повторов в данных, то самое простое решение -- это превратить их в множество.

Множества нельзя складывать, зато можно добавлять в них элементы -- это делается функцией add(), которая тоже пишется через точку после названия множества.

In [40]:
animals.add('tiger')
print(animals)

{'dog', 'crocodile', 'fox', 'elephant', 'tiger', 'cat'}


In [41]:
# пустое множество
new_set = set() # обратите внимание, что просто скобочек в данном случае недостаточно!
print(new_set)

set()


In [42]:
a = set([1, 2, 3, 4, 5, 6])
b = set([4, 5, 6, 7, 8, 9])

# объединение
c = a | b
print(c)

# пересечение
c = a & b
print(c)

# разность
c = a - b
print(c)

# симметрическая разность, то есть элементы, входящие в a или в b, но не в оба множества одновременно
c = a ^ b
print(c)

{1, 2, 3, 4, 5, 6, 7, 8, 9}
{4, 5, 6}
{1, 2, 3}
{1, 2, 3, 7, 8, 9}


**Основные функции**

1. sum