# Семинар: строки

## Разминка

Реализовать две функции: первая удаляет все цифры в строке, вторая - все буквы.

In [1]:
def delete_digits(string: str) -> str:
    return ''.join([x for x in string if x.isalpha()])


def delete_letters(string: str) -> str:
    return ''.join([x for x in string if x.isdigit()])

**Тесты**:

In [2]:
assert delete_digits('123abnd4FDhj32') == 'abndFDhj'
assert delete_letters('123abnd4FDhj32') == '123432'

## Задача 1: Наивный Шифр

**Условие**:

Мы решили зашифровать слово, состоящее из букв английского алфавита в нижнем регистре. Но поскольку наши познания в криптографии невелики для шифрования решено было использовать один из самых простых шифров: перестановка над английским алфавитом. Перестановка записывается следующим образом: заполняется список из 26 элементов; номер ячейки соответствует номеру буквы в полученной перестановке; содержимое ячейки - ASCII код буквы. Ваша задача - реализовать алгоритм, который будет шифровывать заданное слово по заданной перестановке.

**Вход**:
- word - строка, состоящая только из букв англиского алфавита в нижнем регистре;  
- permutation - список, состоящий из 26 элементов; содержимое списка - ASCII-коды букв английского алфавита в нижнем регистре;

**Выход**:

- зашифрованное слово - строка;

**Решение:**

In [1]:
from string import ascii_lowercase
def encode(word: str, permutation: list[int]) -> str:
    d = {ascii_lowercase[i]: permutation[i] for i in range(len(permutation))}
    return ''.join([chr(d[x]) for x in word])

**Тесты**:

In [22]:
permutation = [
    122, 108, 99, 100, 101, 102, 103, 104, 105,
    106, 107, 108, 109, 110, 108, 112, 113, 114,
    115, 116, 117, 118, 119, 120, 121, 97
]

word = 'aboba'

encode(word, permutation)

'zlllz'

**Объяснение:** в перестановке мы переставили буквы 'a' и 'z' местами.

## Задача 2: Переставь слова

**Условие**:

Дана последовательность символов: строка, состоящая из заглавных и строчных букв английского алфавита, знаков препинания и пробелов. Причем, строка составлена не самым грамотным пользователем, а потому количество пробелов между непробельными символами может быть произвольным. Также неисключено наличие пробелов в начале и в конце строки. Необходимо найти самое длинное слово в строке, самое короткое слово в строке и поменять их местами. В качестве ответа вернуть строку с переставленными словами. Пробелы между словами, а также в начале и конце строки необходимо оставить нетронутыми.

Если слов одинковой длины несколько, необходимо взять первое встретевшееся.

*Примечание*: словом считается любая последовательность символов, не содержащая пробелов.

**Вход**:

- строка, состоящая из букв английского алфавита, знаков препинания и пробелов;  

**Выход:**

- строка, в которой самое длинное слово и самое короткое слово переставлены;  

**Решение**:

In [42]:
def swap_words(sentence: str) -> str:
    words = sentence.split()
    max_word, min_word = max(words, key=len), min(words, key=len)
    sentence = sentence.replace(max_word, min_word, 1)
    sentence = sentence.replace(min_word, max_word, 1)
    return sentence

**Тесты:**

In [43]:
assert ' dd b  c   a  ' == swap_words(' a b  c   dd  ')
swap_words(' a b  c   dd  bbbbbb')

' bbbbbb b  c   dd  a'

## Задача 3: Правильная скобочная последовательность

**Условие**:

Правильная скобочная последовательность определяется следующим образом:

- пустая строка - правильная скобочная последовательность;  
- правильная скобочная последовательность, взятая в круглые скобки - правильная скобочная последовательность;  
- правильная скобочная последовательность, к которой приписана слева или справа правильная скобочная последовательность — правильная скобочная последовательность;

Итак, на вход подается строка, состоящая только из символов "(", ")". Ваша задача - определить является ли поданная строка правильной скобочной последовательностью или нет.

**Вход**:

- sequence - строка, состоящая из круглых скобок;

**Выход**:

- булево значение, True, если строка - правильная скобочная последовательность, False - иначе;

**Решение**:

In [26]:
def is_correct_bracket_seq(sequence: str) -> bool:
    res = 0
    if sequence.count('(') != sequence.count(')'): return False
    for a in sequence:
        if a == '(':
            res += 1
        else:
            res -= 1
            if res < 0:
                return False
    return True

**Тесты**:

In [28]:
assert is_correct_bracket_seq('')
assert is_correct_bracket_seq('((((())())))')
assert not is_correct_bracket_seq(')(')

## Задача 4: Странный калькулятор

**Условие**:

Назовем странным калькулятором калькулятор, который работает следующим образом:

- на вход калькулятору подается строка, в которой описано некоторое алгебраическое выражение;  
- операндами этого выражения являются исключительно целые числа, записанные в следующей форме: каждая цифра числа записана английским словом, обозначающим эту цифру; сами цифры, составляющие запись числа, записаны подряд. Например число десять будет иметь запись `onezero`;  
- в состав строки входят только операторы сложения и умножения;  
- операнды и операторы разделены пробелами;  
- калькулятор вычисляет описанное таким образом выражение и вызвращает результат - целое число;   

Ваша задача реализовать такой калькулятор.

**Вход**:

- строка, состоящая из слов 'zero', 'one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', символов '+' и '-' и пробелов;  

**Выход**:

- целое число - результат выполнения выражения;

**Решение**:

In [29]:
from string import digits
def calculate(expression: str) -> int:
    nums = ['zero', 'one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine']
    ops = {'+': True, '-': False}
    d = {nums[i]: digits[i] for i in range(10)}
    expression = expression.split()
    res = 0
    flag = True
    for leksem in expression:
        if len(leksem) == 1:
            flag = ops[leksem]
        else:
            word = ''
            num = ''
            for a in leksem:
                word += a
                if word in d or word[1:] in d:
                    if word[0] == '-':
                        num += '-' + d[word[1:]]
                    else:
                        num += d[word]
                    word = ''
            if flag:
                res += int(num)
            else:
                res -= int(num)
    return res

**Тесты**:

In [31]:
assert calculate('-one + two + threefive - -onezero') == 46

## Задача 5: Парсер

Необходимо реализовать следующий алгоритм парсинга документов:

- на вход алгоритму подается строка, которую необходимо распарсить, и пары специальных символов, которые поддерживаются парсером; например: \</a>, \<a>;  
- строка состоит из специальных символов и строк, окруженных специальными символами;  
- валидными считаются слова, которые заключены в правильную пару служебных символов, и служебные символы этой пары входят в список символов, поддерживаемых парсером; например, слово, заключенное в служебные символы: \</a>word\<a>, будет валидным, если \</a> и \<a> поддерживаются парсером - а слово, заключенное в служебные символы: \</b>word\<a> - не будет валидным ни в каком случае;  
- парсер выделяет валидные слова, и сохраняет уникальные валидные слова в список;  

Ваша задача - реализовать описанный алгоритм парсинга.

**Вход:** 

- строка, состоящая из специальных символов следующего формата: \<[ / ]english_letter>, - и из букв английского алфавита;  
- список пар(кортежей) - валидных служебных конструкций;  

**Выход**:

- список уникальных валидных слов;  

**Решение:**

In [44]:
def parse(
    string: str, valid_pairs: list[tuple[str, str]]
) -> list[str]:
    res = []
    for valid_pair in valid_pairs:
        string = string.replace(valid_pair[0][1:], f'{valid_pair[0][1:]} ')
        string = string.replace(valid_pair[1][:-1], f' {valid_pair[1][:-1]}')
    string = string.replace('><', '> <')
    string = string.split()
    for i in range(1, len(string)-1):
        for valid_pair in valid_pairs:
            if valid_pair[0] == string[i-1] and valid_pair[1] == string[i+1]:
                if string[i] not in res:
                    res.append(string[i])
    return res
    return res

**Тесты:**

In [45]:
string = (
    "</p><p><a>float</b></p><p><b>frozenset</b><c><C></c>"
    "</p><p><c>list</c></p><p><b>list</b>"
)
valid_pairs = [("<a>", "</a>"), ("<b>", "</b>"), ("<c>", "</c>")]

parse(string, valid_pairs)

['frozenset', '<C>', 'list']

## Задача 6: Умная консоль

**Условие**:

Вы работаете с консолью, которая имеет некий набор команд. Консоль достаточно умная и умеет исправлять ошибки пользователя, если ошибка незначительная. Незначительными считаются ошибки одного из трёх типов:

- ввод одного лишнего символа;  
- пропуск одного символа;  
- один неправильно введенный символ; 

Притом описанные ошибки не должны вызывать неоднозначность. Так, например комманда "gt" с набором команд [cd, ls, git] будет восстановлена до команды git, но та же команда с набором команд [cd, ls, git, get] может соответствовать как команде "get", так и команде "git" и восстановлена не будет.

Если команда написана с незначительной ошибкой, то консоль её автоматически исправляет и выполняет. Реализуйте алгоритм check_comand, который проверяет, выполнит ли консоль с заданным набором команд команду пользователя или нет.

**Вход**:

- user_comand - строка, команда, введенная пользователем;  
- comands - список строк, команды, поддерживаемые консолью;  

**Выход**:

- булево значение: True, если команда будет выполнена, False - иначе;

**Решение:**

In [46]:
def check_comand(user_comand: str, comands: list[str]) -> bool:
    flag = 0
    for comand in comands:
        f = False
        for a in comand:
            for i in range(len(user_comand)):
                uc = list(user_comand)
                uc[i] = a
                if ''.join(uc) == comand:
                    f = True
                    break
            for i in range(len(user_comand)+1):
                uc = list(user_comand)
                uc.insert(i, a)
                if ''.join(uc) == comand:
                    f = True
                    break
            for i in range(len(user_comand)):
                uc = list(user_comand)
                del uc[i]
                if ''.join(uc) == comand:
                    f = True
                    break
        flag += f
    if flag == 1:
        return True
    return False

**Тесты:**

In [47]:
assert check_comand('gt', ['cd', 'ls', 'git']) 
assert not check_comand('gt', ['cd', 'ls', 'git', 'get'])