# Python — структура данных

На основание учебника: https://coderlessons.com/tutorials/python-technologies/izuchite-strukturu-dannykh-python/python-struktura-dannykh от Январь 10, 2019.

**Внимание**: _первая версия данного документы, будет по большей части "копи-паста", в дальнейшем я надеюсь она будет немного переработана и расширена_.

Компьютеры хранят и обрабатывают данные с необычайной скоростью и точностью. Поэтому крайне важно, чтобы данные хранились эффективно и к ним можно было быстро получить доступ. Также обработка данных должна происходить в наименьшее возможное время, но без потери точности.

Структуры данных имеют дело с тем, как данные организованы и хранятся в памяти, когда программа обрабатывает их. Важно отметить, что данные, которые хранятся на диске как часть постоянных хранилищ (например, реляционные таблицы), не упоминаются здесь как структура данных.

**Структуры данных** — это фундаментальные понятия информатики, которые помогают писать эффективные программы на любом языке. Python — это высокоуровневый, интерпретируемый, интерактивный и объектно-ориентированный язык сценариев, с помощью которого мы можем изучать основы структуры данных более простым способом по сравнению с другими языками программирования.

## Общие структуры данных

Различные структуры данных в информатике в целом разделены на две категории, показанные ниже. Мы обсудим каждую из следующих структур данных подробно в последующих главах.

### Линейные Структуры Данных

Это структуры данных, которые последовательно хранят элементы данных.

- [**Массив**](#Массивы): это последовательное расположение элементов данных в сочетании с индексом элемента данных.
- [**Связанный список**](#Связанные-списки): каждый элемент данных содержит ссылку на другой элемент вместе с данными, присутствующими в нем.
- [**Стек**](#Стек): это структура данных, которая соответствует только определенному порядку работы. LIFO (*последний в очереди*) или FILO (*первый в очереди*).
- [**Очередь**](#Очередь): это похоже на стек, но порядок операций только FIFO (первый вошел, первый вышел).
- [**Матрица**](#Матрица): это двумерная структура данных, в которой элемент данных обозначается парой индексов.

### Нелинейные структуры данных

Это структуры данных, в которых отсутствует последовательное связывание элементов данных. Любая пара или группа элементов данных могут быть связаны друг с другом и доступны без строгой последовательности.

- **Двоичное дерево**: это структура данных, в которой каждый элемент данных может быть связан максимум с двумя другими элементами данных и начинается с корневого узла.
- **Куча**: это особый случай структуры данных дерева, когда данные в родительском узле либо строго больше или равны дочерним узлам, либо строго меньше его дочерних узлов.
- **Хеш-таблица**: это структура данных, которая состоит из массивов, связанных друг с другом с использованием хеш-функции. Он извлекает значения, используя ключи, а не индекс из элемента данных.
- **Граф**: Это расположение вершин и узлов, где некоторые узлы связаны друг с другом через ссылки.

### Специфические структуры данных Python

Эти структуры данных специфичны для языка Python и обеспечивают большую гибкость в хранении различных типов данных и более быструю обработку в среде Python.

- **Список**: это похоже на массив, за исключением того, что элементы данных могут быть разных типов данных. Вы можете иметь как числовые, так и строковые данные в списке Python.
- **Кортеж**: кортежи похожи на списки, но они неизменны, что означает, что значения в кортеже нельзя изменить, их можно только прочитать.
- **Словарь**: словарь содержит пары ключ-значение в качестве элементов данных.


## Массивы

**Массив** — это контейнер, который может содержать фиксированное количество элементов, и эти элементы должны быть одного типа. Большинство структур данных используют массивы для реализации своих алгоритмов. Ниже приведены важные термины для понимания концепции массива.

- **Элемент** — каждый элемент, хранящийся в массиве, называется элементом.
- **Индекс** — каждое местоположение элемента в массиве имеет числовой индекс, который используется для идентификации элемента.

### Представление массива

Массивы могут быть объявлены различными способами на разных языках. Ниже приведена иллюстрация.

![image.png](attachment:image.png)

Согласно приведенной выше иллюстрации, ниже приведены важные моменты, которые необходимо учитывать.

- Индекс начинается с 0.

- Длина массива равна 10, что означает, что он может хранить 10 элементов.

- Каждый элемент может быть доступен через его индекс. Например, мы можем получить элемент с индексом 6 как 9.

### Основные операции

Ниже приведены основные операции, поддерживаемые массивом.

- **Прохождение** — печатать все элементы массива один за другим.
- **Вставка** — добавляет элемент по указанному индексу.
- **Удаление** — удаляет элемент по указанному индексу.
- **Поиск** — поиск элемента по заданному индексу или по значению.
- **Обновить** — обновляет элемент по указанному индексу.

Массив создается в Python путем импорта модуля массива в программу python. Затем массив объявляется как показано:

```python
from array import *
array_name = array(typecode, [Initializers])
```
**Typecode** — это коды, которые используются для определения типа значения, которое будет содержать массив. Некоторые типичные используемые типы:

| Type code |      C Type       | size in bytes |
|:---------:|:-----------------:|:-------------:|
|    'b'    | signed integer    | 1             |
|    'B'    | unsigned integer  | 1             |
|    'u'    | Unicode character | 2 *           |
|    'h'    | signed integer    | 2             |
|    'H'    | unsigned integer  | 2             |
|    'i'    | signed integer    | 2             |
|    'I'    | unsigned integer  | 2             |
|    'l'    | signed integer    | 4             |
|    'L'    | unsigned integer  | 4             |
|    'q'    | signed integer    | 8 **          |
|    'Q'    | unsigned integer  | 8 **          |
|    'f'    | floating point    | 4             |
|    'd'    | floating point    | 8             |

- `*` — The 'u' typecode corresponds to Python's unicode character. On narrow builds this is 2-bytes on wide builds this is 4-bytes.
- `**` — The 'q' and 'Q' type codes are only available if the platform C compiler used to build Python supports 'long long', or, on Windows, '__int64'.

Прежде чем взглянуть на различные операции с массивами, давайте создадим и распечатаем массив, используя python.

In [1]:
from array import *
array_1 = array('i', [10,20,30,40,50])

print(f"Тип данных: {type(array_1)} содержимое: {array_1}")

Тип данных: <class 'array.array'> содержимое: array('i', [10, 20, 30, 40, 50])


### Доступ к элементу массива

Мы можем получить доступ к каждому элементу массива, используя индекс элемента. 

In [2]:
print(array_1[0])
print(array_1[2])

10
30


### Операция вставки

Операция вставки заключается в вставке одного или нескольких элементов данных в массив. В зависимости от требования, новый элемент может быть добавлен в начале, конце или любом заданном индексе массива.

Здесь мы добавляем элемент данных в середине массива, используя метод `insert()`.
```python
insert(i, v)```

Insert a new item `v` into the array before position `i`.

In [3]:
array_1.insert(2,60)

print(array_1[2])

60


### Операция удаления

Удаление существующего элемента из массива (первое вхождение) и реорганизации всех элементов массива. Удаление элемент данных в середине массива с помощью встроенного в метода `remove()`.
```python
remove(v)
```
Remove the first occurrence of `v` in the array.

In [4]:
array_1.remove(40)
print(array_1)

array('i', [10, 20, 60, 30, 50])


### Операция поиска

Вы можете выполнить поиск элемента массива по его значению (первое вхождение) используя метод `index()`.
```python
index(v)
```
Return index of first occurrence of `v` in the array.

In [5]:
print(array_1.index(30))

3


### Операция обновления

Операция обновления относится к обновлению существующего элемента из массива по заданному индексу.

In [6]:
array_1[2] = 80
print(array_1)

array('i', [10, 20, 80, 30, 50])


## Связанные списки

**Связанный список** — это последовательность элементов данных, которые связаны между собой ссылками. Каждый элемент данных содержит соединение с другим элементом данных в виде указателя. Python не имеет связанных списков в своей стандартной библиотеке. Мы реализуем концепцию связанных списков, используя концепцию узлов, как обсуждалось в предыдущей главе. Мы уже видели, как мы создаем класс узла и как пройти элементы узла. В этой главе мы собираемся изучить типы связанных списков, известных как односвязные списки. В этом типе структуры данных существует только одна связь между любыми двумя элементами данных. Мы создаем такой список и создаем дополнительные методы для вставки, обновления и удаления элементов из списка.

### Создание связанного списка

Связанный список создается с использованием класса узла, который мы изучали в предыдущей главе. Мы создаем объект Node и создаем другой класс для использования этого объекта ode. Мы передаем соответствующие значения через объект узла, чтобы указать на следующие элементы данных. Приведенная ниже программа создает связанный список с тремя элементами данных. В следующем разделе мы увидим, как пройти по связанному списку.

In [7]:
class Node:
    def __init__(self, dataval=None):
        self.dataval = dataval
        self.nextval = None

In [8]:
class SLinkedList:
    def __init__(self):
        self.headval = None

In [9]:
llist = SLinkedList()
llist.headval = Node("Mon")
e2 = Node("Tue")
e3 = Node("Wed")
# Link first Node to second node
llist.headval.nextval = e2

# Link second Node to third node
e2.nextval = e3

In [10]:
print(llist)

<__main__.SLinkedList object at 0x0000019DE6E80E50>


### Обход связанного списка

Односвязные списки могут просматриваться только в прямом направлении, начиная с первого элемента данных. Мы просто печатаем значение следующего элемента данных, назначая указатель следующего узла текущему элементу данных.

In [11]:
class Node:
    def __init__(self, dataval=None):
        self.dataval = dataval
        self.nextval = None

In [12]:
class SLinkedList:
    def __init__(self):
        self.headval = None

    def listprint(self):
        printval = self.headval
        while printval is not None:
            print (printval.dataval)
            printval = printval.nextval

In [13]:
llist = SLinkedList()
llist.headval = Node("Mon")
e2 = Node("Tue")
e3 = Node("Wed")

# Link first Node to second node
llist.headval.nextval = e2

# Link second Node to third node
e2.nextval = e3

llist.listprint()

Mon
Tue
Wed


### Вставка в связанный список

Вставка элемента в связанный список включает переназначение указателей от существующих узлов на вновь вставленный узел. В зависимости от того, вставляется ли новый элемент данных в начале, в середине или в конце связанного списка, у нас есть следующие сценарии.

#### Вставка в начале связанного списка

Это включает указание следующего указателя нового узла данных на текущий заголовок связанного списка. Таким образом, текущий заголовок связанного списка становится вторым элементом данных, а новый узел становится заголовком связанного списка.

In [14]:
class Node:
    def __init__(self, dataval=None):
        self.dataval = dataval
        self.nextval = None

In [15]:
class SLinkedList:
    def __init__(self):
        self.headval = None

    def listprint(self):
        """Print the linked list"""
        printval = self.headval
        while printval is not None:
            print (printval.dataval)
            printval = printval.nextval
    
    def AtBegining(self,newdata):
        NewNode = Node(newdata)
        # Update the new nodes next val to existing node
        NewNode.nextval = self.headval
        self.headval = NewNode

In [16]:
llist = SLinkedList()
llist.headval = Node("Mon")
e2 = Node("Tue")
e3 = Node("Wed")

llist.headval.nextval = e2
e2.nextval = e3

llist.AtBegining("Sun")

llist.listprint()

Sun
Mon
Tue
Wed


#### Вставка в конце связанного списка

Это включает указание следующего указателя текущего последнего узла связанного списка на новый узел данных. Таким образом, текущий последний узел связанного списка становится вторым последним узлом данных, а новый узел становится последним узлом связанного списка.

In [17]:
class SLinkedList:
    def __init__(self):
        self.headval = None

    def AtEnd(self, newdata):
        """Function to add newnode"""
        NewNode = Node(newdata)
        if self.headval is None:
            self.headval = NewNode
            return
        laste = self.headval
        while(laste.nextval):
            laste = laste.nextval
        laste.nextval=NewNode

    def listprint(self):
        """Print the linked list"""
        printval = self.headval
        while printval is not None:
            print (printval.dataval)
            printval = printval.nextval

In [18]:
llist = SLinkedList()
llist.headval = Node("Mon")
e2 = Node("Tue")
e3 = Node("Wed")

llist.headval.nextval = e2
e2.nextval = e3

llist.AtEnd("Thu")

llist.listprint()

Mon
Tue
Wed
Thu


#### Вставка между двумя узлами данных

Это включает в себя изменение указателя определенного узла, чтобы он указывал на новый узел. Это возможно, передавая как новый узел, так и существующий узел, после чего новый узел будет вставлен. Таким образом, мы определяем дополнительный класс, который изменит следующий указатель нового узла на следующий указатель среднего узла. Затем назначьте новый узел следующему указателю среднего узла.

In [19]:
class SLinkedList:
    def __init__(self):
        self.headval = None

    def Inbetween(self,middle_node,newdata):
        """Function to add node"""
        if middle_node is None:
            print("The mentioned node is absent")
            return

        NewNode = Node(newdata)
        NewNode.nextval = middle_node.nextval
        middle_node.nextval = NewNode

    def listprint(self):
        """Print the linked list"""
        printval = self.headval
        while printval is not None:
            print (printval.dataval)
            printval = printval.nextval

In [20]:
llist = SLinkedList()
llist.headval = Node("Mon")
e2 = Node("Tue")
e3 = Node("Thu")

llist.headval.nextval = e2
e2.nextval = e3

llist.Inbetween(llist.headval.nextval,"Fri")

llist.listprint()

Mon
Tue
Fri
Thu


#### Удаление элемента из списка понравившихся

Мы можем удалить существующий узел, используя ключ для этого узла. В приведенной ниже программе мы находим предыдущий узел узла, который должен быть удален. Затем укажите следующий указатель этого узла на следующий узел удаляемого узла.

In [21]:
class SLinkedList:
    def __init__(self):
        self.head = None

    def Atbegining(self, data_in):
        NewNode = Node(data_in)
        NewNode.next = self.head
        self.head = NewNode

    def RemoveNode(self, Removekey):
        """Function to remove node"""
        HeadVal = self.head

        if (HeadVal is not None):
            if (HeadVal.dataval == Removekey):
                self.head = HeadVal.next
                HeadVal = None
                return

        while (HeadVal is not None):
            if HeadVal.dataval == Removekey:
                break
            prev = HeadVal
            HeadVal = HeadVal.next

        if (HeadVal == None):
            return

        prev.next = HeadVal.next

        HeadVal = None

    def LListprint(self):
        """Print the linked list"""
        printval = self.head
        while (printval):
            print(printval.dataval),
            printval = printval.next

In [22]:
llist = SLinkedList()
llist.Atbegining("Mon")
llist.Atbegining("Tue")
llist.Atbegining("Wed")
llist.Atbegining("Thu")
llist.RemoveNode("Tue")
llist.LListprint()

Thu
Wed
Mon


P.S. _В оригинальном коде был косяк_

## Стек

В словаре английского языка стек слов означает расположение объектов поверх другого. Таким же образом выделяется память в этой структуре данных. Он хранит элементы данных таким же образом, как куча тарелок хранятся одна над другой на кухне. Таким образом, стек данных позволяет выполнять операции на одном конце, которые можно назвать вершиной стека. Мы можем добавлять элементы или удалять элементы только из этого стека.

В стеке элемент, вставленный последним в последовательности, выйдет первым, так как мы можем удалить его только из верхней части стека. Такая функция известна как функция «*Последний пришел первым вышел*» (*LIFO*). Операции добавления и удаления элементов известны как `PUSH` и `POP`. В следующей программе мы реализуем его как функции добавления и удаления. Мы объявляем пустой список и используем методы `push()` и `pop()` для добавления и удаления элементов данных.

In [23]:
class Stack:

    def __init__(self):
        self.stack = []

    def push(self, dataval):
        """Use list append method to add element"""
        if dataval not in self.stack:
            self.stack.append(dataval)
            return True
        else:
            return False
        
    def peek(self):
        """Use peek to look at the top of the stack"""
        return self.stack[-1]
    
    def pop(self):
        """Use list pop method to remove element"""
        if len(self.stack) <= 0:
            return ("No element in the Stack")
        else:
            return self.stack.pop()

In [24]:
AStack = Stack()
AStack.push("Mon")
AStack.push("Tue")
print(AStack.peek())
AStack.push("Wed")
AStack.push("Thu")
print(AStack.peek())

Tue
Thu


In [25]:
print(AStack.pop())
print(AStack.pop())
print(AStack.pop())
print(AStack.pop())
print(AStack.pop())

Thu
Wed
Tue
Mon
No element in the Stack


**Комментарий:** пришлось изменить исходный код, что бы он работал и отражал суть действий. Так же мне не нравиться реализация через `list`, так как до определённой версии `Python` лист не гарантировал последовательность элеметов в нём. 

## Очередь

Мы знакомы с очередью в нашей повседневной жизни, поскольку мы ожидаем обслуживания. Структура данных очереди также означает то же самое, где элементы данных расположены в очереди. Уникальность очереди заключается в том, как элементы добавляются и удаляются. Элементы разрешены в конце, но удалены с другого конца. Так что это метод First-in-First out. Очередь может быть реализована с использованием списка python, где мы можем использовать методы `push()` и `pop()` для добавления и удаления элементов. Они не вставляются, так как элементы данных всегда добавляются в конец очереди.

### Добавление элементов в очередь
В приведенном ниже примере мы создаем класс очереди, в котором мы реализуем метод First-in-First-Out. Мы используем встроенный метод вставки для добавления элементов данных.

In [26]:
class Queue:

    def __init__(self):
        self.queue = []
        
    def size(self):
        return len(self.queue)
    
    def push(self, dataval):
        """# Insert method to add element"""
        if dataval not in self.queue:
            self.queue.insert(0, dataval)
            return True
        return False

    def pop(self):
        """Pop method to remove element"""
        if len(self.queue) > 0:
            return self.queue.pop()
        return ("No elements in Queue!")

In [27]:
TheQueue = Queue()
TheQueue.push("Mon")
TheQueue.push("Tue")
TheQueue.push("Wed")
print(TheQueue.size())

3


In [28]:
print(TheQueue.pop())
print(TheQueue.pop())
print(TheQueue.pop())
print(TheQueue.pop())

Mon
Tue
Wed
No elements in Queue!


## Матрица

**Матрица** — это особый случай двумерного массива, где каждый элемент данных имеет строго одинаковый размер. Таким образом, каждая матрица также является двумерным массивом, но не наоборот. Матрицы являются очень важными структурами данных для многих математических и научных расчетов. Как мы уже обсуждали структуру данных двухмерного массива в предыдущей главе, мы сосредоточимся на операциях структуры данных, специфичных для матриц в этой главе.

Мы также используем пакет numpy для манипулирования матричными данными.

### Пример матрицы

Рассмотрим случай записи температуры в течение 1 недели, измеренной утром, в полдень, вечером и в полночь. Он может быть представлен в виде матрицы 7X5 с использованием массива.

In [29]:
from numpy import * 
a = array([['Mon',18,20,22,17],
           ['Tue',11,18,21,18],
           ['Wed',15,21,20,19],
           ['Thu',11,20,22,21],
           ['Fri',18,17,23,22],
           ['Sat',12,22,20,18],
           ['Sun',13,15,19,16]])

print(a)

[['Mon' '18' '20' '22' '17']
 ['Tue' '11' '18' '21' '18']
 ['Wed' '15' '21' '20' '19']
 ['Thu' '11' '20' '22' '21']
 ['Fri' '18' '17' '23' '22']
 ['Sat' '12' '22' '20' '18']
 ['Sun' '13' '15' '19' '16']]


### Доступ к значениям в матрице

Доступ к элементам данных в матрице можно получить с помощью индексов. Методы доступа аналогичны способам доступа к данным в двумерном массиве.

In [30]:
# Print data for Wednesday
print(a[2])

# Print data for friday evening
print(a[4][3])

['Wed' '15' '21' '20' '19']
23


### Добавление строки

In [31]:
m_r = append(a, [['Avg',12,15,13,11]], axis = 0)

In [32]:
print(m_r)

[['Mon' '18' '20' '22' '17']
 ['Tue' '11' '18' '21' '18']
 ['Wed' '15' '21' '20' '19']
 ['Thu' '11' '20' '22' '21']
 ['Fri' '18' '17' '23' '22']
 ['Sat' '12' '22' '20' '18']
 ['Sun' '13' '15' '19' '16']
 ['Avg' '12' '15' '13' '11']]


### Добавление столбца

Мы можем добавить столбец в матрицу, используя метод `insert()`. здесь мы должны упомянуть индекс, в который мы хотим добавить столбец, и массив, содержащий новые значения добавленных столбцов. В приведенном ниже примере мы добавляем новый столбец на пятой позиции с начала.

In [33]:
m_c = insert(a,[5],[[1],[2],[3],[4],[5],[6],[7]],1)

In [34]:
print(m_c)

[['Mon' '18' '20' '22' '17' '1']
 ['Tue' '11' '18' '21' '18' '2']
 ['Wed' '15' '21' '20' '19' '3']
 ['Thu' '11' '20' '22' '21' '4']
 ['Fri' '18' '17' '23' '22' '5']
 ['Sat' '12' '22' '20' '18' '6']
 ['Sun' '13' '15' '19' '16' '7']]


### Удалить строку из матрицы

Мы можем удалить строку из матрицы, используя метод `delete()`. Мы должны указать индекс строки, а также значение оси, которое равно 0 для строки и 1 для столбца.

In [35]:
m = delete(a, [2], 0)

print(m)

[['Mon' '18' '20' '22' '17']
 ['Tue' '11' '18' '21' '18']
 ['Thu' '11' '20' '22' '21']
 ['Fri' '18' '17' '23' '22']
 ['Sat' '12' '22' '20' '18']
 ['Sun' '13' '15' '19' '16']]


### Удалить столбец из матрицы

Мы можем удалить столбец из матрицы, используя метод `delete()`. Мы должны указать индекс столбца, а также значение оси, которое равно 0 для строки и 1 для столбца.

In [36]:
m = delete(a, s_[2], 1)

print(m)

[['Mon' '18' '22' '17']
 ['Tue' '11' '21' '18']
 ['Wed' '15' '20' '19']
 ['Thu' '11' '22' '21']
 ['Fri' '18' '23' '22']
 ['Sat' '12' '20' '18']
 ['Sun' '13' '19' '16']]



### Обновить строку в матрице
Чтобы обновить значения в строке матрицы, мы просто переназначаем значения в индексе строки. В приведенном ниже примере все значения для данных четверга отмечены как ноль. Индекс для этой строки 3.

In [37]:
m[3] = ['Thu',0,0,0]

print(m)

[['Mon' '18' '22' '17']
 ['Tue' '11' '21' '18']
 ['Wed' '15' '20' '19']
 ['Thu' '0' '0' '0']
 ['Fri' '18' '23' '22']
 ['Sat' '12' '20' '18']
 ['Sun' '13' '19' '16']]


/// TBD