# 6. Структуры данных
**Структура данных** — программная единица, позволяющая хранить и обрабатывать множество однотипных и/или логически связанных данных в вычислительной технике. Для добавления, поиска, изменения и удаления данных структура данных предоставляет некоторый набор функций, составляющих её интерфейс.

В Python существуют четыре встроенных структуры данных: **список, кортеж, словарь и множество**.

## 6.1 Списки (list)

**Список** – это структура данных, которая содержит упорядоченный набор элементов, т.е. хранит последовательность элементов.

**Основные операции**

<table style="width: 500px;">
 <thead style="background: #e7e7e7; font-weight: bold;">
    <tr >
        <td style="text-align: center;">Операция</td>
        <td style="text-align: center;">Интерпретация</td>
    </tr>
  </thead>
   <tbody >
    <tr>
        <td style="text-align: center;">L = []</td>
        <td style="text-align: center;">Пустой список</td>
    </tr>
    <tr>
        <td style="text-align: center;">L = [0, 1, 2, 3]</td>
        <td style="text-align: center;">Четыре элемента с индексами 0..3</td>
    </tr>
    <tr>
        <td style="text-align: center;">L = [‘abc’, [‘def’, ghi’]]</td>
        <td style="text-align: center;">Вложенные списки</td>
    </tr>
    <tr>
        <td style="text-align: center;">L = list(‘spam’)</td>
        <td style="text-align: center;">Создание списка из итерируемого объекта.</td>
    </tr>
    <tr>
        <td style="text-align: center;">L = list(range(-4, 4))</td>
        <td style="text-align: center;">Создание списка из непрерывной последовательности целых чисел</td>
    </tr>
    <tr>
        <td style="text-align: center;">L[i]<br/>L[i][j]<br/> L[i:j]<br/> len(L)</td>
        <td style="text-align: center;">Индекс, индекс индекса, срез, длина</td>
    </tr>
    <tr>
        <td style="text-align: center;">L1 + L2; L * 3</td>
        <td style="text-align: center;">Конкатенация, дублирование</td>
    </tr>
    <tr>
        <td style="text-align: center;">for x in L: print(x)<br/> 3 in L</td>
        <td style="text-align: center;">Конкатенация, дублирование</td>
    </tr>
    <tr>
        <td style="text-align: center;">L.append(4)<br/> L.extend([5,6,7])<br/> L.insert(I, X)</td>
        <td style="text-align: center;">Методы: добавление элементов в список</td>
    </tr>
    <tr>
        <td style="text-align: center;">L.index(1)<br/> L.count()</td>
        <td style="text-align: center;">Методы: поиск</td>
    </tr>
    <tr>
        <td style="text-align: center;">L.sort()<br/> L.reverse()</td>
        <td style="text-align: center;">Методы: сортировка, изменение порядка сле- дования элементов на обратный</td>
    </tr>
    <tr>
        <td style="text-align: center;">del L[k]<br/> del L[i:j]<br/> L.pop()<br/> L.remove(2)<br/> L[i:j] = []</td>
        <td style="text-align: center;">Уменьшение списка</td>
    </tr>
    <tr>
        <td style="text-align: center;">L[i] = 1<br/> L[i:j] = [4,5,6]</td>
        <td style="text-align: center;">Присваивание по индексу, присваивание срезу</td>
    </tr>
    <tr>
        <td style="text-align: center;">L = [x**2 for x in range(5)]<br/> list(map(ord, ‘spam’))</td>
        <td style="text-align: center;">Генераторы списков и отображение (главы 14 и 20)</td>
    </tr>
  </tbody>
</table>

In [2]:
length = len([1, 2, 3])
concatination = [1, 2, 3] + [4, 5, 6]
repeat = ['Ni!', 'Hi'] * 4

print(concatination[2])
print(length, concatination, repeat, sep='\n')
print(length, end='|')
print(concatination)



3
3
[1, 2, 3, 4, 5, 6]
['Ni!', 'Hi', 'Ni!', 'Hi', 'Ni!', 'Hi', 'Ni!', 'Hi']
3|[1, 2, 3, 4, 5, 6]


In [3]:
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



In [4]:
shoplist = ['яблоки', 'манго', 'морковь', 'бананы']

print('Я должен сделать ', len(shoplist), 'покупок.')
print('Покупки:', end=' ')

for item in shoplist:
    print(item, end=' ')

print('\nТакже нужно купить риса.') 
shoplist.append('рис')

print('Теперь мой список покупок таков:', shoplist)
print("shoplist.index('бананы')", shoplist.index('бананы'))
print('Отсортирую-ка я свой список')
shoplist.sort()
print('Отсортированный список покупок выглядит так:', shoplist)
print('Первое, что мне нужно купить, это', shoplist[0])

olditem = shoplist[0]
del shoplist[0]
print('Я купил', olditem)
print('Теперь мой список покупок:', shoplist)

Я должен сделать  4 покупок.
Покупки: яблоки манго морковь бананы 
Также нужно купить риса.
Теперь мой список покупок таков: ['яблоки', 'манго', 'морковь', 'бананы', 'рис']
shoplist.index('бананы') 3
Отсортирую-ка я свой список
Отсортированный список покупок выглядит так: ['бананы', 'манго', 'морковь', 'рис', 'яблоки']
Первое, что мне нужно купить, это бананы
Я купил бананы
Теперь мой список покупок: ['манго', 'морковь', 'рис', 'яблоки']


### Индексы, срезы и матрицы


In [5]:
spam = 'spam'
elements = [spam, spam.capitalize(), spam.upper()]

# bad names
copy_elements = elements[:]
dubl_elements = elements[:]

# good names
elements_copy = elements[:]
elements_clone = elements[:]
elements_duplicate = elements[:]

print(elements)

# индексация начинается с 0: [0, 1, 2]
# обратная индексация начинается с -1: [-3, -2, -1]
print(elements[2])
print('elements[len(elements)-1]:', elements[len(elements)-1])
print('elements[-1]:', elements[-1])
print('elements[-2]:', elements[-2])

start = 1
end = 2
print('elements[start:end] -> [start, end):', elements[start:end])
print('elements[2:2] -> [2, 2):', elements[2:2])
print('elements[0:2] -> [0, 2):', elements[0:2])
print('elements[:2] -> [0, 2):', elements[:2])
print('elements[1:3] -> [1, 3):', elements[1:3])
print('elements[1:] -> [1, 3):', elements[1:])
print('elements[0:3] -> [0, 3):', elements[0:3])
print('COPY -- elements[:] -> [1, 3):', elements[:])

# [start:end:step] -> [start, end) with step
numbers = [1, 2, 5, 2, 7, 8, 9]
print('numbers[0:7:1]', numbers[0:7:1])
print('numbers[0:7:2]', numbers[0:7:2])
print('numbers[0:71:1]', numbers[0:71:1])
print('numbers[::]', numbers[::])
print('numbers[::2]', numbers[::2])
print('numbers[1::2]', numbers[1::2])
print('numbers[71::2]', numbers[71::2])
print('numbers[::-1]', numbers[::-1])
print('reversed(numbers)', list(reversed(numbers)))
# print('numbers.reverse()', numbers.reverse(), numbers)

print('id(numbers):', id(numbers))
reversed_numbers = list(reversed(numbers))
print('id(reversed_numbers):', id(reversed_numbers))

numbers.reverse()
print('id(numbers):', id(numbers))

# аналогично
numbers.sort() # меняет текущий список in-place
sorted(numbers) # создает новый список

['spam', 'Spam', 'SPAM']
SPAM
elements[len(elements)-1]: SPAM
elements[-1]: SPAM
elements[-2]: Spam
elements[start:end] -> [start, end): ['Spam']
elements[2:2] -> [2, 2): []
elements[0:2] -> [0, 2): ['spam', 'Spam']
elements[:2] -> [0, 2): ['spam', 'Spam']
elements[1:3] -> [1, 3): ['Spam', 'SPAM']
elements[1:] -> [1, 3): ['Spam', 'SPAM']
elements[0:3] -> [0, 3): ['spam', 'Spam', 'SPAM']
COPY -- elements[:] -> [1, 3): ['spam', 'Spam', 'SPAM']
numbers[0:7:1] [1, 2, 5, 2, 7, 8, 9]
numbers[0:7:2] [1, 5, 7, 9]
numbers[0:71:1] [1, 2, 5, 2, 7, 8, 9]
numbers[::] [1, 2, 5, 2, 7, 8, 9]
numbers[::2] [1, 5, 7, 9]
numbers[1::2] [2, 2, 8]
numbers[71::2] []
numbers[::-1] [9, 8, 7, 2, 5, 2, 1]
reversed(numbers) [9, 8, 7, 2, 5, 2, 1]
id(numbers): 4465186432
id(reversed_numbers): 4465229120
id(numbers): 4465186432


[1, 2, 2, 5, 7, 8, 9]

In [1]:
from copy import copy
x = [1, 2, 3]
y = x[:]
y = copy(x)
y = x.copy()

x.append(4)
print(x)
print(y)

[1, 2, 3, 4]
[1, 2, 3]


In [8]:
x = [1, 2, 3]
y = x[:]
print(f'x is y -> {x is y}')
print(f'x == y -> {x == y}')
print(f'id(x) == id(y) -> {id(x) == id(y)}')

x.append(777)
print(f'x = {x}')
print(f'y = {y}')


x is y -> False
x == y -> True
id(x) == id(y) -> False
x = [1, 2, 3, 777]
y = [1, 2, 3]


In [9]:
# Список списков
matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
matrix = [[1, 2, 3], 
          [4, 5, 6], 
          [7, 8, 9]]

print(matrix[1])
print(matrix[1][1])
print(matrix[2][0])

[4, 5, 6]
5
7


### Изменение списка

In [19]:
spam = 'spam'
elements = [spam, spam.capitalize(), spam.upper()]

elements[1] = 'filter'
print(elements)

elements[0:2] = ['people', 'need']
print(elements)

elements[1:2] = ['love', 'Python', 'language',  'and']
print(elements)

elements[4:6] = []
print(elements)

['spam', 'filter', 'SPAM']
['people', 'need', 'SPAM']
['people', 'love', 'Python', 'language', 'and', 'SPAM']
['people', 'love', 'Python', 'language']


### Методы списков

In [15]:
elements = ['abc', 'ABD', 'aBe']
print('Before:', elements, id(elements))
elements.sort()
print('After:', elements, id(elements))

elements = ['abc', 'ABD', 'aBe']
print('Before:', elements, id(elements))
sorted_elements = sorted(elements)
print('After:', elements, id(sorted_elements))

elements = ['abc', 'ABD', 'aBe']
elements_caseinsensetive = []
for element in elements:
    elements_caseinsensetive.append(element.lower())

sorted_elements_caseinsensetive = sorted(elements_caseinsensetive)
print(f'sorted_elements_caseinsensetive = {sorted_elements_caseinsensetive}')

# ? 'abc' < 'ABD' if key is None
# ? str.lower('abc') < str.lower('ABD') if key is str.lower
print('str.lower = ', str.lower('ABD'))
print('str.lower = ', 'ABD'.lower())

print(sorted(elements, key=str.lower))
print(sorted(elements, key=str.lower, reverse=True))

# alternative
def lower_function(value):
    return value.lower()
print(sorted(elements, key=lower_function))


Before: ['abc', 'ABD', 'aBe'] 4356665856
After: ['ABD', 'aBe', 'abc'] 4356665856
Before: ['abc', 'ABD', 'aBe'] 4378923456
After: ['abc', 'ABD', 'aBe'] 4356665600
sorted_elements_caseinsensetive = ['abc', 'abd', 'abe']
str.lower =  abd
str.lower =  abd
['abc', 'ABD', 'aBe']
['aBe', 'ABD', 'abc']
['abc', 'ABD', 'aBe']


In [68]:
elements = []

elements.append(1)
elements.append(2)
print(elements)

element = elements.pop()
print(f'element={element}', elements)

elements = ['1', '2', '3']
element = elements.pop(2)
print(f'element={element}', elements)

[1, 2]
element=2 [1]
element=3 ['1', '2']


In [16]:
elements = 'I love Python'.split()
print(1, elements, sep=' -> ')

print(2, elements.index('love'), sep=' -> ')

elements.insert(1, 'do')
print(3, elements, sep=' -> ')

elements.remove('do')
print(4, elements, sep=' -> ')

elements.insert(2, 'super')
print(5.1, elements, sep=' -> ')
del elements[2]
print(5.2, elements, sep=' -> ')

elements = ['Already', 'got', 'one']
elements[1:] = []
print(6, elements, sep=' -> ')

elements[0] = []
print(7, elements, sep=' -> ')

# alternative
# help('I love Python'.split)
# help(''.split)
help(str.split)

1 -> ['I', 'love', 'Python']
2 -> 1
3 -> ['I', 'do', 'love', 'Python']
4 -> ['I', 'love', 'Python']
5.1 -> ['I', 'love', 'super', 'Python']
5.2 -> ['I', 'love', 'Python']
6 -> ['Already']
7 -> [[]]
Help on method_descriptor:

split(self, /, sep=None, maxsplit=-1)
    Return a list of the substrings in the string, using sep as the separator string.
    
      sep
        The separator used to split the string.
    
        When set to None (the default value), will split on any whitespace
        character (including \\n \\r \\t \\f and spaces) and will discard
        empty strings from the result.
      maxsplit
        Maximum number of splits (starting from the left).
        -1 (the default value) means no limit.
    
    Note, str.split() is mainly useful for data that has been intentionally
    delimited.  With natural text that includes punctuation, consider using
    the regular expression module.



## 6.2 Кортежи (tuple)

Кортежи служат для хранения нескольких объектов вместе. Их можно рассматривать как аналог списков, но без такой обширной функциональности, которую предоставляет **класс списка**. Одна из важнейших особенностей кортежей заключается в том, что они **неизменяемы**, так же, как и строки.

Кортежи обозначаются указанием элементов, разделённых запятыми; по желанию их можно ещё заключить в круглые скобки.

In [79]:
zoo = ('питон', 'слон', 'пингвин')
zoo = 'питон', 'слон', 'пингвин'
print('Количество животных в зоопарке =', len(zoo))

name, surname = ('Ivan', 'Ivanov')
name, surname = 'Ivan', 'Ivanov'

name, surname = ['Ivan', 'Ivanov']
name, surname = 'Ivan', 'Ivanov'

# Preferred
name = 'Ivan'
surname = 'Ivanov'

print(name, surname)

x = 1
y = 3

# v1
tmp = x
x = y
y = tmp
print(x, y)

# v2 -- preferred
x, y = y, x
print(x, y)


new_zoo = ('обезьяна', 'верблюд', zoo)
new_zoo = 'обезьяна', 'верблюд', zoo
print('Количество клеток в зоопарке -', len(new_zoo))
print('Все животные в новом зоопарке:', new_zoo)
print('Животные, привезённые из старого зоопарка:', new_zoo[2]) 
print('Последнее животное, привезённое из старого зоопарка -', new_zoo[2][2])

Количество животных в зоопарке = 3
Ivan Ivanov
3 1
1 3
Количество клеток в зоопарке - 3
Все животные в новом зоопарке: ('обезьяна', 'верблюд', ('питон', 'слон', 'пингвин'))
Животные, привезённые из старого зоопарка: ('питон', 'слон', 'пингвин')
Последнее животное, привезённое из старого зоопарка - пингвин


In [83]:
elements = [1]

elements = 1
elements = (1)
elements = tuple([1])
print(elements)
elements = (1, )
print(elements)

print(1, 2, 3)
print((1, 2, 3))

(1,)
(1,)
1 2 3
(1, 2, 3)


## 6.3 Enumerate


In [89]:
# enumerate(['Hello', 'mega', 'Python']) ->
# (0, 'Hello'), 
# (1, 'mega'), 
# (2, 'Python')
#
# good
elements = ['Hello', 'mega', 'Python']
for i, x in enumerate(elements):
    print(i, x, sep=' -> ')

# bad
for i in range(len(elements)):
    x = elements[i]
    print(i, x, sep=' -> ')

    
print(elements)

0 -> Hello1
1 -> mega1
2 -> Python1
['Hello', 'mega', 'Python']


## 6.4 Max, min, sum, all, any

In [103]:
print('Max',  max([1, 2, 3]), sep=': ')
print('Min',  min([1, 2, 3]), sep=': ')
print('Sum',  sum([1, 2, 3]), sep=': ')
print('All',  all([0, 1, 2, 3]), sep=': ')
print('Any',  any([0, 1, 2, 3]), sep=': ')

print('All []:',  all([]), sep=': ')
print('Any []:',  any([]), sep=': ')

values = [1, 2, 3]
reversed_values = reversed(values)
print('Min',  reversed_values, min(reversed_values), sep=': ')


print(bool(0))
print(bool(2))

Max: 3
Min: 1
Sum: 6
All: False
Any: True
All []:: True
Any []:: False
Min: <list_reverseiterator object at 0x1073cf580>: 1
False
True


## 6.5 Zip

In [129]:
x = (1, 2, 3)
y = ('a', 'b', 'c')
z = list(zip(x, y))
print(z)

names = ('Ivan', 'Petr', 'Fedr')
surnames = ('Ivanov', 'Petrov', 'Fedrov')

# v1
n = len(names)
for i in range(0, n, 1): # [start, end) -> if start = 0, step=1 -> range(n)
    print(names[i], surnames[i])

# v2
# [('Ivan', 'Ivanov'), ('Petr', 'Petrov')..]
for name, surname in zip(names, surnames):
    print(name, surname)

numbers = list(range(10))
print(numbers)
print(list(range(1, 10, 2)))
print(list(range(10, 0, -1)))

# different sizes
x = (1, 2, 3, 4)
y = ('a', 'b', 'c')
list(zip(x, y))

x = (1, 2)
y = ('a', 'b', 'c')
list(zip(x, y))

# zip_longest
from itertools import zip_longest

x = (1, 2, 3, 4)
y = ('a', 'b', 'c')
list(zip_longest(x, y))

x = (1, 2, 3, 4)
y = ('a', 'b', 'c')
list(zip_longest(x, y, fillvalue='blank'))


[(1, 'a'), (2, 'b'), (3, 'c')]
Ivan Ivanov
Petr Petrov
Fedr Fedrov
Ivan Ivanov
Petr Petrov
Fedr Fedrov
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 3, 5, 7, 9]
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]


[(1, 'a'), (2, 'b'), (3, 'c'), (4, 'blank')]

## 6.6 Itertools 
https://docs.python.org/3/library/itertools.html

# Задачи

# 1. Последний с четными
 **Дано:** список (list) целых чисел (int).
 
 **Задание:** нужно найти сумму элементов с четными индексами (0-й, 2-й, 4-й итд), затем перемножить эту сумму и последний элемент исходного массива. 

     
 **Пример:**
 
     elements = [0, 1, 2, 3, 4, 5], результат: 30
     
     elements = [1, 3, 5], результат: 30
 
     elements = [] , результат: 0
 
 # 2. Max-min
 **Дано:**  массив чисел (float или/и int).
 
 **Задание:**  нужно найти разницу между самым большим (максимум) и самым малым (минимум) элементом. Если список пуст, то результат равен 0 (ноль).
 
 Числа с плавающей точкой представлены в компьютерах как двоичная дробь. Результат проверяется с точностью до третьего знака, как ±0.001

     
 **Пример:**
 
     elements = [1, 2, 3], результат: 2
     
     elements = [5, -5], результат: 30
 
     elements = [10.2, -2.2, 0, 1.1, 0.5], результат: 12.4
 
     elements = [] , результат: 0
     
 
 # 3. Умная сортировка
 **Дано:**  кортеж (tuple) чисел.
 
 **Задание:**  необходимо отсортировать их, но отсортировать на основе абсолютных значений в возрастающем порядке. Для примера, последовательность (-20, -5, 10, 15) будет отсортирована следующим образом (-5, 10, 15, -20). Ваша функция должна возвращать список (list) или кортеж (tuple).

     
 **Пример:**
 
     elements = (-20, -5, 10, 15), результат: [-5, 10, 15, -20]
     
     elements = (1, 2, 3, 0), результат: [0, 1, 2, 3]
 
     elements = (-1, -2, -3, 0), результат: [0, -1, -2, -3]
 
 # 4. [Junior] Медиана
 **Дано:**  кортеж или список чисел.
 
 **Задание:**  Медиана - это числовое значение, которое делит сортированый массив чисел на большую и меньшую половины. В сортированом массиве с нечетным числом элементов медиана - это число в середине массива. Для массива с четным числом элементов, где нет одного элемента точно посередине, медиана - это среднее значение двух чисел, находящихся в середине массива. В этой задаче дан непустой массив натуральных чисел. Вам необходимо найти медиану данного массива.

     
 **Пример:**
 
     elements = [1, 2, 3, 4, 5], результат: 3
     
     elements = [3, 1, 2, 5, 3], результат: 3
 
     elements = [1, 300, 2, 200, 1], результат: 2
     
     elements = [3, 6, 20, 99, 10, 15], результат: 12.5
 
 # [Junior+] 5. Полосатые слова
 **Дано:**  текст, как строка (str).
 
 **Задание:**  Наши Роботы никогда не упускают возможности, чтобы улучшить свои навыки в лингвистике. Сейчас они изучают английский алфавит и что с этим делать.

Алфавит разделен на гласные и согласные буквы (да, мы разделили буквы, а не звуки).

Гласные -- A E I O U Y

Согласные -- B C D F G H J K L M N P Q R S T V W X Z

Дан текст с разными словами и/или числами, которые разделены пробелами и знаками пунктуации. Числа не считаются за слова (также как и смесь букв и цифр). Необходимо подсчитать слова, в которых гласные буквы чередуются с согласными (полосатые слова), то есть в таких словах нет двух гласных или двух согласных букв подряд. Слова состоящие из одной буквы - не "полосатые" (не считайте их). Регистр букв не имеет значения.

     
 **Пример:**
 
     text = "My name is ...", результат: 3
     
     text = "Hello world", результат: 0
     
     text = "A quantity of striped words.", результат: 1
     
     text = "Dog,cat,mouse,bird.Human.", результат: 3
