## Поиск подстроки

Дана строка s. Дана подстрока subs. Нужно найти индекс первого вхождения subs в s.

_brutto force алгоритм:_

In [38]:
def findBF(s: str, subs: str) -> int:
    """
    Находит индекс первого вхождения подстроки subs в строку s
    методом грубой силы.
    Алгоритм работает за O(len(s) * len(subs)).
    """

    #Прикладываем начало подстроки к индексам от 0 до len(s) - len(subs) + 1
    for i in range(len(s) - len(subs) + 1):
        count = 0
        for j in range(len(subs)):
            if s[i + j] == subs[j]:
                count += 1
                # Если кол-во совпавших символов равно len(subs),
                #  то нашли и и возвращаем i
                if (count == len(subs)):
                    return i
    return None

In [42]:
findBF('avada kedavara', 'ara')

11

_Алгоритм Бойера-Мура-Хорспула:_

In [52]:
def printNeon(s, i):
    print(s[:i].lower() + s[i].upper() + s[i+1:].lower())

def findBMH(s: str, subs: str) -> int:
    """
    Находит индекс первого вхождения подстроки subs в строку s
    методом Бойера-Мура-Хорспула.
    Алгоритм работает за O(len(s) * len(subs)).
    """

    #Считаем таблицу смещений для подстроки
    d = {}
    for i in range(len(subs) - 2, -1, -1):
        if not subs[i] in d:
            d[subs[i]] = len(subs) - i - 1

    # добавляем * для всех других символов
    d['*'] = len(subs)

    # Если размер подстроки больше подстроки, то индекса нет
    if len(subs) > len(s):
        return None

    for i in range(len(subs) - 1, len(s)):
        k = 0
        j = 0
        for j in range(len(subs) - 1, -1, -1):
            if s[i-k] != subs[j]:

                # Если не совпали на первом символе с конца, то проверяем по символу из s
                if (j == len(subs) - 1):
                    i += d[s[i - k]] - 1 if s[i] in d else d['*']

                # Если не совпали на другом символе, то проверяем по символу из subs
                else:
                    i += d[subs[j]]
                break

            k += 1

        # Если число совпавших символов равно длине строки, то возвращаем
        if (j == 0):
            return i - k + 1

    return None

In [53]:
findBMH('meteodata', 'data')

5

_Алгоритм Рабина-Карпа_

Использует хэширование подстроки и подстрок строки такого же размера, что и искомая подстрока.

Позволяет быстро находить несколько вхождений подстроки в строку.

Тут применяется хэш-функция вида: 
$h(s[1..m]) = (\sum_{i=1}^m s[i]*x^{m-1}) mod(q)$

In [116]:
def hash(s:str, x:int=31, q:int=2**31-1) -> int:
    res = ord(s[0])
    for i in range(1, len(s)):
        res = res*x + ord(s[i])
    return res % q

В алгоритме Рабина-Карпа также применяется методика упрощенного счёта хэшей последующих подстрок на основе хэшей предыдущих подстрок, а именно:
1. Из старого хеша вычитаем $s[i]*x^{(m-1)}$
2. Оставшуюся часть умножаем на $x$
3. Результат суммируем с кодом символа $s[i+m]$

In [138]:
def findRK(s:str, subs:str) -> int:

    # Для более высокой надежности работы хэш-функции в качестве x
    # берутся простые числа, а в качестве q большие простые числа,
    # например, некоторые из чисел Мерсенна, т.е. 2^n - 1
    x = 31
    q = 2**31 - 1

    def hash(s:str, x:int=31, q:int=2**31-1) -> int:
        res = ord(s[0])
        for i in range(1, len(s)):
            res = res*x + ord(s[i])
        return res % q

    m = len(subs)

    # Вычисляем хэши
    subs_hash = hash(subs)
    cur_hash = hash(s[:m])

    # Ищем одинаковые хэши
    for i in range(len(s) - m + 1):
        if (cur_hash == subs_hash):
            k = 0
            # Сравниваем строки, раз хэши одинаковые
            for j in range(m):
                if (s[i+j] == subs[j]):
                    k += 1
                    # Строки совпали, поэтому возвращаем индекс начала подстроки в s
                    if (k == m):
                        return i
        #Подсчет нового хэша
        cur_hash = ((cur_hash - ord(s[i]) * (x ** (m - 1))) * x + ord(s[i + m])) %q
    return None

In [139]:
findRK('meteodata', 'data')

5

In [2]:
n = int(input())

pairs= set()
list_Q = []

def gcd(a, b):
    while b:
        a, b = b, a%b
    return a

for i in range(n):
    coefs = list(map(int, input().split()))
    a = coefs[0]
    b = coefs[1]
    g = gcd(a,b)
    a /= g
    b /= g

    if (a * b < 0):
        a = - abs(a)
        b = abs(b)
    else:
        a = abs(a)
        b = abs(b)
    pairs.add((a,b))

q = int(input())

for i in range(q):
    coefs = list(map(int, input().split()))
    a = coefs[0]
    b = coefs[1]
    g = gcd(a,b)
    a /= g
    b /= g

    if (a * b < 0):
        a = - abs(a)
        b = abs(b)
    else:
        a = abs(a)
        b = abs(b)

    print('YES' if ((a,b) in pairs) else 'NO')

YES
NO
YES
NO


In [28]:
n = int(input())

a = list(map(int, input().split()))

def shell_sort(a):
    n = len(a)
    gap = n // 2
    while gap > 0:
        for cur in range(gap, n):
            m_gap = cur
            while m_gap - gap >= 0  and a[m_gap] < a[m_gap - gap]:
                a[m_gap - gap], a[m_gap] = a[m_gap], a[m_gap - gap]
                m_gap -= m_gap
        gap //= 2

    return a

a = shell_sort(a)

m = -1
gap = len(a)//2
im = -1
for i in range(1, gap):
    if (a[i+gap-1] - a[i] < m or m == -1):
        m = a[i+gap-1] - a[i]
        im = i

l = m / (a[-1] - a[0])

if (m * (a[-1] - a[-gap]) > (a[-1] - a[0]) * (a[gap-1] - a[0])):
    l = (a[gap-1] - a[0]) / (a[-1] - a[-gap])
    im = 0


if (l > ((a[-1] - a[-gap]) / (a[gap-1] - a[0]))):
    l = (a[-1] - a[-gap]) / (a[gap-1] - a[0])
    im = gap

print(l)
for num in a[im:im+gap]:
    print(num, end = ' ')

0.18181818181818182
79 81 

In [45]:
N, M = 4, 7
k = 1
a = [[0] * M for _ in range(N)]

for sum in range(0, N+M-2):
    for diff in range(max(-(N-1), -sum), min(sum, M-1)):
        i = (sum - diff) // 2
        j = (sum + diff) // 2
        print(sum, diff, i, j)

        a[i][j] = k
        k += 1

for s in a:
    print(s)

1 -1 1 0
1 0 0 0
2 -2 2 0
2 -1 1 0
2 0 1 1
2 1 0 1
3 -3 3 0
3 -2 2 0
3 -1 2 1
3 0 1 1
3 1 1 2
3 2 0 2
4 -3 3 0
4 -2 3 1
4 -1 2 1
4 0 2 2
4 1 1 2
4 2 1 3
4 3 0 3
5 -3 4 1


IndexError: list index out of range

In [70]:
n, m = map(int, input().split())

a = []
for i in range(n):
    a.append(list(input()))



max_count = -1
for i in range(n):
    for j in range(m):
        if a[i][j] == 1:
            count = 1
            #left up
            k = 1
            while(i - k >= 0 and j - k >= 0):
                if a[i-k][j-k] == 1:
                    count += 1
                k += 1
            #right up
            k = 1
            while(i - k >= 0 and j + k < M):
                if a[i-k][j+k] == 1:
                    count += 1
                k += 1
            #left down
            k = 1
            while(i + k < N  and j - k >= 0):
                if a[i+k][j-k] == 1:
                    count += 1
                k += 1
            #right down
            k = 1
            while(i + k < N  and j + k < M):
                if a[i+k][j+k] == 1:
                    count += 1
                k += 1

            max_count = max(max_count, count)

print(max_count)


SyntaxError: invalid syntax (962720677.py, line 20)