# Баланс скобок

### Постановка задачи
Имеется строка в которой встречаются скобки нескольких видов, например, круглые, квадратные и фигурные. 

#### Задание:

1. Ознакомиться с теоретическим содержанием задачи(историей возникновения, существующими методами решения, практической значимостью и т.д.).
2. Написать программу, которая 
  - проверяет корректность расстановки скобок;
  - указывает некорректно поставленную(ые) скобку(и);
  - предлагает вариант(ы) правильной расстановки.
3. Протестировать программу
4. Провести анализ эффективности используемых структур данных и алгоритмов.
5. Подготовить отчет о проделанной работе. 

## Теоретическая часть

Сбалансированные скобки являются распространенной проблемой программирования. 

Задача баланса скобок возникла с появлением языков программирования, где скобки используются для обозначения блоков кода, функций, условий и т.д. Некорректное использование скобок может привести к ошибкам компиляции или выполнения программы. Одним из способов предотвращения таких ошибок является проверка баланса скобок.

#### Практическая значимость задачи

Задача баланса скобок имеет важную практическую значимость в программировании. Некорректное использование скобок может привести к ошибкам компиляции, а в некоторых случаях может даже привести к уязвимостям в проекте. Проверка баланса скобок является одним из способов предотвращения таких ошибок. Проверка баланса скобок также может использоваться при разработке текстовых редакторов, выделении блоков кода и других подобных целях.

Считается, что скобкой является любой из следующих символов

- ' __**{**__ '  ' __**}**__ '
- __**' ( '**__ __**' ) '**__ 
- __**' < '  ' > '**__
- ' __**|**__ '  ' __**|**__ '
- ' __**[**__ '  ' __**]**__ ' 
- ' __**{**__ '  ' __**}**__ '
- ' __**"**__ '  ' __**"**__ '
- ' __**\'**__ ' ' __**\'**__ ' 

Набор скобок считается согласованной парой, если открывающая скобка , __“(“__, __“[“__, и __“{“__, и т.д. находится слева от соответствующей закрывающей скобки , __“)”__, __“]”__, и __“}”__, и т.д. соответственно.

Однако строка, содержащая пары скобок, не сбалансирована, если набор скобок, в которые она заключена, не согласован.

Аналогично, строка, содержащая символы, не заключенные в скобки, такие как **a-z**, **A-Z**, **0-9** или другие специальные символы, такие как **#**, **$**, **@** , также считается несбалансированной.

Например, если входные данные __“{[(])}"__, пара квадратных скобок __“[]”__ заключает в себя единственную несбалансированную открывающую круглую скобку __“(“__. Аналогично, пара круглых скобок __“()”__ заключает в себя единственную несбалансированную закрывающую квадратную скобку __“]”__. Таким образом, входная строка __“{[(])}”__ является несбалансированной.

Следовательно, строка, содержащая символы скобок, называется сбалансированной, если:

- Соответствующая открывающая скобка находится слева от каждой соответствующей закрывающей скобки
- Скобки, заключенные в сбалансированные скобки, также сбалансированы
- Он не содержит никаких символов, отличных от скобок
- Следует иметь в виду пару особых случаев: null считается несбалансированным, в то время как пустая строка считается сбалансированной.



 Чтобы дополнительно проиллюстрировать определение сбалансированных скобок, рассмотрим несколько примеров сбалансированных скобок:

#### -  ()
#### -  [()]
#### -  {[()]}
#### -  ([{{[(())]}}])


И несколько несбалансированных:

#### -  abc[](){}
#### -  {{[]()}}}}
#### -  {[(])}
#### -  ((((([[]{}])()())))

### Язык правильных скобочных последовательностей для нескольких типов скобок

Если скобки только одного вида, то нужно воспользоваться теоремой о скобочном балансе: последовательность правильная тогда и только тогда, когда в любом начальном отрезке открывающих скобок не меньше, чем закрывающих, а во всей последовательности их поровну. Нужно пройти один раз по последовательности, подсчитывая скобочный баланс и следя за выполнением условия. 
- На подсчёт баланса требуется логарифмическое число битов. 

Для нескольких видов такой алгоритм уже не пройдёт. 

Например, последовательность  __“([)]”__ неправильная, но со скобочным балансом всё хорошо. Выход состоит в том, чтобы проверять баланс скобок не только во всей последовательности, но и внутри каждой пары соответствующих друг другу скобок. 

Для этого нужно по каждой открывающей скобке найти соответствующую ей закрывающую. Для этого нужна идти вправо по последовательности, подсчитывая баланс только по скобкам этого вида. Скобка, на которой он обнулился, и будет соответствующей. (Если такой не нашлось, то последовательность точно неправильная). Далее нужно проверить баланс скобок между найденными (можно проверить по каждому виду в отдельности, но достаточно по всем сразу). 

- Для реализации этого алгоритма требуется небольшое число счётчиков логарифмического размера.

Существует несколько методов решения задачи баланса скобок, наиболее распространенными из которых являются стеки и рекурсия.



| Стеки | Рекурсия |
|:---|:---|
|  Метод стеков заключается в том, что скобки кладутся на стек в порядке их появления. Если перед закрывающей скобкой на вершине стека находится соответствующая открывающая скобка, то они удаляются со стека. Если стек пустой после обработки всех скобок, то баланс скобок соблюден. Если стек не пустой, то баланс скобок нарушен. | Метод рекурсии используется для проверки баланса скобок в строке. В этом методе удаляются все пары скобок в строке, пока все пары не будут удалены или будет найдена непарная скобка. Если все пары скобок удалены, то баланс скобок соблюден. Если найдена непарная скобка, то баланс скобок нарушен. |


- Для алгоритма с использованием стеков сложность времени __O(n)__, где __n__ - длина строки. Это объясняется тем, что мы проходим по строке только один раз, добавляя и удаляя элементы из стека только по мере необходимости.
- Сложность времени алгоритма с рекурсией - __O(n^2)__, где __n__ - длина строки. Это связано с тем, что, хотя мы удаляем парные скобки из строки рекурсивно, мы должны пройти через всю строку каждый раз, когда мы удаляем парные скобки.

Также стоит отметить, что метод с использованием рекурсии может выполнится не стабильно на очень больших строках, так как функция рекурсии может вызвать переполнение стека.
 
Таким образом, алгоритм со стеком является более эффективным с точки зрения времени выполнения и использует меньше памяти, чем алгоритм с использованием рекурсии.



**Мы будем использовать метод стеков.**


### Стеки

Будем каждую встретившуюся открывающую скобку добавлять в конец некоторого списка (изначально пустого). Если же встретится закрывающая, мы попытаемся удалить из конца этого списка последнюю добавленную туда открывающую скобку. Мы пишем «попытаемся», так как список может оказаться пустым. Это означало бы, что к только что найденной закрывающей скобке не нашлось соответствующей открывающей, и сбалансированности уже не будет. Обработку можно на этом прекратить с формулировкой «непарная закрывающая скобка». Если же список был не пуст, проверяем, образуют ли пару найденная закрывающая и удалённая из конца списка открывающая скобки. Если да, то продолжаем обработку. Если нет, прекращаем процесс всё с той же формулировкой «непарная закрывающая скобка». Если в конце работы список открывающих скобок будет непуст, сообщаем о непарной открывающей скобке.

Таким образом, со списком открывающих скобок совершаются только два вида операций: что-то добавляется в его конец, и что-то удаляется с конца. Всё это должно напомнить нам о процедурах __push__ и __pop__, которые именно так и поступают с массивом.

Такие списочные структуры, в которые можно добавлять элементы в конец, и удалять их тоже с конца, очень важны в информатике. Они называются стеками (__stack__ — стопка каких-либо предметов, сложенных один на другой, например, тарелок). Обычно из стопки берут самую верхнюю тарелку, ту, которую положили туда последней. По аналогии со стопкой тарелок начало списка называют основанием стека, а его конец — вершиной.

Стек устроен как несправедливая очередь, в которой первым обслуживается и уходит тот, кто пришёл самым последним. Другое название стека — **LIFO** (Last In, First Out — последним пришёл, первым ушёл).

## Практическая часть

In [6]:
from collections import deque

class Balancer:
    def __init__(self):
        self.bracket_list = {
            ord('('): ord(')'),
            ord('<'): ord('>'),
            ord('|'): ord('|'),
            ord('['): ord(']'),
            ord('{'): ord('}'),
            ord('"'): ord('"'),
            ord('\''): ord('\'')
        }

    def print_error(self, inspected, pos=None, error_text=""):
        print("\033[1m\033[31m", error_text, "\033[0m", sep="")
        print(inspected)
        res_str = "_" * pos + "^" + "_" * (len(inspected) - pos - 1)
        print(res_str)

    def check_for_correctness(self, inspected, print_errors=True):
        my_stack = deque()
        for i in range(len(inspected)):
            if ord(inspected[i]) in self.bracket_list.keys():
                my_stack.append((ord(inspected[i]), i))
            elif ord(inspected[i]) in self.bracket_list.values():
                if len(my_stack) == 0:
                    if print_errors:
                        self.print_error(inspected, pos=i, error_text="ERROR too many closing brackets")
                    self.predict_positions(inspected, error_type="close", pos=i)
                    return False
                last, ind = my_stack.pop()
                if self.bracket_list[last] != ord(inspected[i]):
                    # TODO
                    my_stack.append((last, ind))
                    if print_errors:
                        self.print_error(inspected, pos=i, error_text="ERROR smth going wrong here")
                    self.predict_positions(inspected, error_type="type error", pos=i, stack=my_stack)
                    return False
        if len(my_stack) != 0:
            if print_errors:
                self.print_error(inspected, pos=len(inspected), error_text="ERROR the closing bracket is lost")
            self.predict_positions(inspected, error_type="lost", pos=len(inspected), stack=my_stack)
            return False
        return True

    def predict_positions(self, inspected, error_type: str, pos=None, stack=None):
        if error_type == "close":
            true_str = inspected[:pos] + inspected[pos + 1:]
            if self.check_for_correctness(true_str, print_errors=False):
                print("may be you mean smth like this:\n", true_str)
        elif error_type == "type error":
            true_str = inspected[:pos] + chr(self.bracket_list[stack.pop()[0]]) + inspected[pos + 1:]
            if self.check_for_correctness(true_str, print_errors=False):
                print("may be you mean smth like this:\n", true_str)
        elif error_type == "lost":
            true_str = inspected
            while True:

                if len(stack) != 0:
                    b = stack.pop()[0]
                    true_str += chr(self.bracket_list[b])
                    if self.check_for_correctness(true_str, print_errors=False):
                        print("may be you mean smth like this:\n", true_str)
                    else:
                        break
                else:
                    break



## Тестирование

In [7]:
bln = Balancer()

asd = "5 + 3(1 - 4) + 17 / <<3-{(12* 33))-(3 + 1)"
bln.check_for_correctness(asd)

lost = "(34 * 15) + 3 * (2 + 4"
bln.check_for_correctness(lost)

type_err = "{4 - 3} * [ 0 + 7 } = 5"
bln.check_for_correctness(type_err)

close = "<3 + 7> * (9 / 15)) - 17"
bln.check_for_correctness(close)

[1m[31mERROR smth going wrong here[0m
5 + 3(1 - 4) + 17 / <<3-{(12* 33))-(3 + 1)
_________________________________^________
may be you mean smth like this:
 5 + 3(1 - 4) + 17 / <<3-{(12* 33)}-(3 + 1)>>
[1m[31mERROR the closing bracket is lost[0m
(34 * 15) + 3 * (2 + 4
______________________^
may be you mean smth like this:
 (34 * 15) + 3 * (2 + 4)
[1m[31mERROR smth going wrong here[0m
{4 - 3} * [ 0 + 7 } = 5
__________________^____
may be you mean smth like this:
 {4 - 3} * [ 0 + 7 ] = 5
[1m[31mERROR too many closing brackets[0m
<3 + 7> * (9 / 15)) - 17
__________________^_____
may be you mean smth like this:
 <3 + 7> * (9 / 15) - 17


False

# <font color='red'>Тут надо написать какие сложности были при решении</font>

#### Литература

http://mech.math.msu.su/~shvetz/54/inf/perl-examples/PerlExamples_Balance.xhtml

https://pro-prof.com/forums/topic/acmp_899

https://aliev.me/runestone/BasicDS/SimpleBalancedParentheses.html

http://ru.discrete-mathematics.org/fall2017/3/complexity/compl-book.pdf