# Семинар: строки

## Разминка

Реализовать две функции: первая удаляет все цифры в строке, вторая - все буквы.

In [4]:
def delete_digits(string: str) -> str:
    for i in '0123456789':
        string = string.replace(i, '')
    return string


def delete_letters(string: str) -> str:
    for i in 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ':
        string = string.replace(i, '')
    return string

**Тесты**:

In [5]:
assert delete_digits('123abnd4FDhj32') == 'abndFDhj'
assert delete_letters('123abnd4FDhj32') == '123432'

## Задача 1: Наивный Шифр

**Условие**:

Мы решили зашифровать слово, состоящее из букв английского алфавита в нижнем регистре. Но поскольку наши познания в криптографии невелики для шифрования решено было использовать один из самых простых шифров: перестановка над английским алфавитом. Перестановка записывается следующим образом: заполняется список из 26 элементов; номер ячейки соответствует номеру буквы в полученной перестановке; содержимое ячейки - ASCII код буквы. Ваша задача - реализовать алгоритм, который будет шифровывать заданное слово по заданной перестановке.

**Вход**:
- word - строка, состоящая только из букв англиского алфавита в нижнем регистре;  
- permutation - список, состоящий из 26 элементов; содержимое списка - ASCII-коды букв английского алфавита в нижнем регистре;

**Выход**:

- зашифрованное слово - строка;

**Решение:**

In [4]:
def encode(word: str, permutation: list[int]) -> str:
    alphabet = 'abcdefghijklmnopqrstuvwxyz'
    for i in word:
        word = word.replace(i, alphabet[permutation[ord(i) - 97] - 97], 1)
    return word


permutation = [
    122, 98, 99, 100, 101, 102, 103, 104, 105,
    106, 107, 108, 109, 110, 111, 112, 113, 114,
    115, 116, 117, 118, 119, 120, 121, 97
]

word = 'asd'

print(encode(word, permutation))

zsd


**Тесты**:

In [3]:
permutation = [
    122, 98, 99, 100, 101, 102, 103, 104, 105,
    106, 107, 108, 109, 110, 111, 112, 113, 114,
    115, 116, 117, 118, 119, 120, 121, 97
]

word = 'aboba'

assert 'zbobz' == encode(word, permutation)

**Объяснение:** в перестановке мы переставили буквы 'a' и 'z' местами.

## Задача 2: Переставь слова

**Условие**:

Дана последовательность символов: строка, состоящая из заглавных и строчных букв английского алфавита, знаков препинания и пробелов. Причем, строка составлена не самым грамотным пользователем, а потому количество пробелов между непробельными символами может быть произвольным. Также неисключено наличие пробелов в начале и в конце строки. Необходимо найти самое длинное слово в строке, самое короткое слово в строке и поменять их местами. В качестве ответа вернуть строку с переставленными словами. Пробелы между словами, а также в начале и конце строки необходимо оставить нетронутыми.

Если слов одинковой длины несколько, необходимо взять первое встретевшееся.

*Примечание*: словом считается любая последовательность символов, не содержащая пробелов.

**Вход**:

- строка, состоящая из букв английского алфавита, знаков препинания и пробелов;  

**Выход:**

- строка, в которой самое длинное слово и самое короткое слово переставлены;  

**Решение**:

In [74]:
def swap_words(sentence: str) -> str:
    words = sentence.split()
    longest = words[0]
    shortest = words[0]

    for word in words:
        if len(word) > len(longest):
            longest = word
        if len(word) < len(shortest):
            shortest = word
    sentence = sentence.replace(longest, '9', 1)
    sentence = sentence.replace(shortest, '0', 1)
    sentence = sentence.replace('9', shortest, 1)
    sentence = sentence.replace('0', longest, 1)
    return sentence

print(swap_words(' a b  c   dd  '))

 dd b  c   a  


**Тесты:**

In [75]:
assert ' dd b  c   a  ' == swap_words(' a b  c   dd  ')

## Задача 3: Правильная скобочная последовательность

**Условие**:

Правильная скобочная последовательность определяется следующим образом:

- пустая строка - правильная скобочная последовательность;  
- правильная скобочная последовательность, взятая в круглые скобки - правильная скобочная последовательность;  
- правильная скобочная последовательность, к которой приписана слева или справа правильная скобочная последовательность — правильная скобочная последовательность;

Итак, на вход подается строка, состоящая только из символов "(", ")". Ваша задача - определить является ли поданная строка правильной скобочной последовательностью или нет.

**Вход**:

- sequence - строка, состоящая из круглых скобок;

**Выход**:

- булево значение, True, если строка - правильная скобочная последовательность, False - иначе;

**Решение**:

In [16]:
def is_correct_bracket_seq(sequence: str) -> bool:
    amount = 0
    for i in sequence:
        if i == "(":
            amount += 1
        else:
            amount -= 1

        if amount < 0:
            return False
        
    return True

**Тесты**:

In [15]:
assert is_correct_bracket_seq('')
assert is_correct_bracket_seq('()()')
assert not is_correct_bracket_seq(')(')

## Задача 4: Странный калькулятор

**Условие**:

Назовем странным калькулятором калькулятор, который работает следующим образом:

- на вход калькулятору подается строка, в которой описано некоторое алгебраическое выражение;  
- операндами этого выражения являются исключительно целые числа, записанные в следующей форме: каждая цифра числа записана английским словом, обозначающим эту цифру; сами цифры, составляющие запись числа, записаны подряд. Например число десять будет иметь запись `onezero`;  
- в состав строки входят только операторы сложения и умножения;  
- операнды и операторы разделены пробелами;  
- калькулятор вычисляет описанное таким образом выражение и вызвращает результат - целое число;   

Ваша задача реализовать такой калькулятор.

**Вход**:

- строка, состоящая из слов 'zero', 'one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', символов '+' и '-' и пробелов;  

**Выход**:

- целое число - результат выполнения выражения;

**Решение**:

In [37]:
def calculate(expression: str) -> int:
    for j in [("one", "1"), ("two", "2"), ("three", "3"), ("four", "4"), ("five", "5"), ("six", "6"), ("seven", "7"), ("eight", "8"), ("nine", "9"), ("zero", "0")]:
        expression = expression.replace(j[0], j[1])

    l1 = expression.split(" ")
    answer = 0
    is_first = True
    for i in l1:
        if is_first:
            answer += int(i)
            is_first = False
            continue

        if i == "+":
            prefix = 1
        elif i == "-":
            prefix = -1
        else:
            answer += prefix * int(i)

    return answer

calculate('-one + two + threefive - onezero')

26

**Тесты**:

In [38]:
assert calculate('-one + two + threefive - onezero') == 26

## Задача 5: Парсер

Необходимо реализовать следующий алгоритм парсинга документов:

- на вход алгоритму подается строка, которую необходимо распарсить, и пары специальных символов, которые поддерживаются парсером; например: \</a>, \<a>;  
- строка состоит из специальных символов и строк, окруженных специальными символами;  
- валидными считаются слова, которые заключены в правильную пару служебных символов, и служебные символы этой пары входят в список символов, поддерживаемых парсером; например, слово, заключенное в служебные символы: \</a>word\<a>, будет валидным, если \</a> и \<a> поддерживаются парсером - а слово, заключенное в служебные символы: \</b>word\<a> - не будет валидным ни в каком случае;  
- парсер выделяет валидные слова, и сохраняет уникальные валидные слова в список;  

Ваша задача - реализовать описанный алгоритм парсинга.

**Вход:** 

- строка, состоящая из специальных символов следующего формата: \<[ / ]english_letter>, - и из букв английского алфавита;  
- список пар(кортежей) - валидных служебных конструкций;  

**Выход**:

- список уникальных валидных слов;  

**Решение:**

In [26]:
def parse(
    string: str, valid_pairs: list[tuple[str, str]]
) -> list[str]:
    correct_words = []
    i = 0

    while i < len(string):
        if string[i] == "<":
            open_pair = ""
            while string[i] != ">":
                open_pair += string[i]
                i += 1
            open_pair += ">"
            i += 1
        

        if i >= len(string):
            break
        if string[i] != "<":
            word = ""
            while string[i] != "<":
                word += string[i]
                i += 1
        else:
            continue
        
        
        if string[i] == "<":
            close_pair = ""
            while string[i] != ">":
                close_pair += string[i]
                i += 1
            close_pair += ">"
            i += 1
        
        for j in range(len(valid_pairs)):
            if open_pair in valid_pairs[j][0] and close_pair in valid_pairs[j][1]:
                if word not in correct_words:
                    correct_words.append(word)
        
        open_pair = close_pair
        word = ""
        
    return correct_words
    

parse("<\\a>float<\\b>double<\\c>complex<c><b><a>", [('<a>', '</a>'), ('<b>', '</b>'), ('<c>', '</c>')])

[]

**Тесты:**

In [27]:
string = (
    "</p><p><a>float</b></p><p><b>frozenset</b>"
    "</p><p><c>list</c></p><p><b>list</b>"
)
valid_pairs = [("<a>", "</a>"), ("<b>", "</b>"), ("<c>", "</c>")]

assert parse(string, valid_pairs) == ["frozenset", "list"]

## Задача 6: Умная консоль

**Условие**:

Вы работаете с консолью, которая имеет некий набор команд. Консоль достаточно умная и умеет исправлять ошибки пользователя, если ошибка незначительная. Незначительными считаются ошибки одного из трёх типов:

- ввод одного лишнего символа;  
- пропуск одного символа;  
- один неправильно введенный символ; 

Притом описанные ошибки не должны вызывать неоднозначность. Так, например комманда "gt" с набором команд [cd, ls, git] будет восстановлена до команды git, но та же команда с набором команд [cd, ls, git, get] может соответствовать как команде "get", так и команде "git" и восстановлена не будет.

Если команда написана с незначительной ошибкой, то консоль её автоматически исправляет и выполняет. Реализуйте алгоритм check_comand, который проверяет, выполнит ли консоль с заданным набором команд команду пользователя или нет.

**Вход**:

- user_comand - строка, команда, введенная пользователем;  
- comands - список строк, команды, поддерживаемые консолью;  

**Выход**:

- булево значение: True, если команда будет выполнена, False - иначе;

**Решение:**

In [29]:
def extra_symbol(user_comand, comand):
    amount = 0
    for k in range(len(comand)):
        for j in range(k + amount, len(user_comand)):
            if comand[k] == user_comand[j]:
                break
            else:
                amount += 1
            if amount > 1:
                return 0
    return 1

def less_symbol(user_comand, comand):
    amount = 0
    for j in range(len(user_comand)):
        for k in range(j + amount, len(comand)):
            user_symbol = user_comand[j]
            symbol = comand[k]
            if user_symbol == symbol:
                break
            else:
                amount += 1
            if amount > 1:
                return 0
    return 1

def wrong_symbol(user_comand, comand):
    amount = 0
    for i in range(len(comand)):
        if user_comand[i] != comand[i]:
            amount += 1
        if amount > 1:
            return 0
    return 1

def check_comand(user_comand: str, comands: list[str]) -> bool:
    if user_comand in comands:
        return 1
    amount_of_suitable = 0
    for comand in comands:
        if len(user_comand) - len(comand) == 1:
            amount_of_suitable += extra_symbol(user_comand, comand)
        elif len(comand) - len(user_comand) == 1:
            amount_of_suitable += less_symbol(user_comand, comand)
        elif len(comand) == len(user_comand):
            amount_of_suitable += wrong_symbol(user_comand, comand)
        else:
            continue
    
    if amount_of_suitable != 1:
        return 0
    return 1

check_comand('cls', ['cd', 'ls', 'git']) 

1

**Тесты:**

In [32]:
assert check_comand("get", ['cd', 'get', 'git', 'ls']) 
assert check_comand("wget", ['cd', 'get', 'ls', 'wget'])