In [35]:
from collections import defaultdict
import math
from CryptoSystems.CryptoWrapper import CryptoWrapper

def find_repeated_sequences(text : str, min_length = 3) -> dict:
    sequence_positions = defaultdict(list)
    for i in range(len(text) - min_length + 1):
        sequence = text[i:i + min_length]
        sequence_positions[sequence].append(i)
    # end for
    
    return {seq: pos for seq, pos in sequence_positions.items() if len(pos) > 1}
# end def

def calculate_distances(sequence_positions) -> dict:
    distances = defaultdict(list)
    for seq, positions in sequence_positions.items():
        for i in range(len(positions) - 1):
            for j in range(i + 1, len(positions)):
                distance = positions[j] - positions[i]
                distances[seq].append(distance)
            # end for
        # end for
    # end for
    return distances
# end def

def kasiski_examination(ciphertext : str, num_keys : int = 10) -> list:
    repeated_sequences = find_repeated_sequences(ciphertext)
    distances = calculate_distances(repeated_sequences)
    
    factors = []
    for seq, dists in distances.items():
        for dist in dists:
            factors.extend(factorize(dist))
        # end def
    # end def

    factor_count = defaultdict(int)
    for factor in factors:
        factor_count[factor] += 1
    # end def
    
    most_common_factors = sorted(factor_count.items(), key = lambda x: -x[1])[:num_keys]
    return [factor for factor, count in most_common_factors]
# end def

def factorize(n):
    factors = set()
    for i in range(1, int(math.sqrt(n)) + 1):
        if n % i == 0:
            factors.add(i)
            factors.add(n // i)
        # end if
    # end for
    return list(factors)
# end def

def frequency_analysis(text):
    frequency = defaultdict(int)
    for char in text:
        frequency[char] += 1
    # end for
    return frequency
# end def

def decrypt_vigenere(ciphertext : str, key_length : int):
    with open('./Data/alphabet', 'r') as f:
        alphabet = f.readline()
    # end with

    alphabet_size = len(alphabet)
    key = ""

    for i in range(key_length):
        substring = ciphertext[i::key_length]
        freq = frequency_analysis(substring)
        
        most_common_char = max(freq, key = freq.get)
        shift = (alphabet.index(most_common_char) - alphabet.index(' ')) % alphabet_size
        key += alphabet[shift]
    # end for

    plaintext = ''
    for i, char in enumerate(ciphertext):
        key_pos = i % key_length
        shift = alphabet.index(key[key_pos])
        decrypted_char = alphabet[(alphabet.index(char) - shift) % alphabet_size]
        plaintext += decrypted_char
    # end for

    return plaintext, key
# end def

wrapper = CryptoWrapper(method = 'Vigenere',
                        key_path = './Data/key_Vigenere_short',
                        do_encrypt = 'enc')


original_texts = wrapper.crypter.input_str

ciphertext = wrapper.encrypt()
possible_lengths = kasiski_examination(ciphertext, num_keys = 15)

for length in possible_lengths:
    plaintext, key = decrypt_vigenere(ciphertext, length)
    print(f'length={length}, key={key}, accuracy={sum(1 for i, j in zip(original_texts, plaintext) if i == j) / len(original_texts)}')
    print(f'plaintext={plaintext}\n')
# end for


length=1, key=О, accuracy=0.42882882882882883
plaintext=НШБР ОЕСЕОЕОЯЗВШТВ МТСТПРЖЗВАШТБЛЗГТБПВДЯСИДХРДЯЫЗТСНЕОАГБ НЕСТ Ь ДСКЧДТПРГН ЯТНВУВТДТ МИОЫТТКРЛНЭОЯЬПЫИСЛШПЖТЯЦЫ ЯФ ЖТБНТЭЕЯФОЭСМАЯСАТВЁРТХ ХСЗ СА ЙТР ЗКЕ  БОАВЕЕАЖТРР ВРК БГКГЫФИЗС ЕЕНЕР ОЦОБРНЦНБГР ГАРБГРГНССШБА ЯС ХСЖЛД СЮАА ААЛОШВЯЯЮЮФОДЬЯСВДЕНЕМГКУЯББНЮЬКАА КПББВЮ ЯФСШЛЖНРЭАС ГОКНШУЯБЛЭУОХЬБ ЯСМБЯББДЪДБНПАЮСКБПКЛЙТ Х СУРДОЕЕБ ЯССАЕЕАЯБРБВРЖ ПТТДККЗЬ Ь НИФАРУДРЧММЙТПРХНЦ ТВЖЧДВНЬЕБГТГТНЕБЛЗЭИТБЖЗНГТУНРВНИННЙБН ВОЧ ББДГС ЕТТММЕТИБЖЗФЫШ Д НЦНБЙБОРЭАЯЕПННЬ ИЕСИЯСАТВЁРТХ ХСЗ СА ЙТР ЗКЕ  Б ГТЛШКР ЖТ ЦОТИЖАНЕОО Я АТСОЕПДЕЯЬПОИСИДТТЕАЫТШЛЮННЬ ЧОТОВЧ ХСЗ МТ ДЕДЕПС Т ДСДЮЕАСМАЮСББЛЮШ Р ЯЮГОБН ТВУЕКЧНДКВЯЯУОЯЬЪАЮСЛРБРВЫС ХСЖЛД СЮАА ААЛОШВЯЯЮЮФОДЬЯС ТМРЯЯГЕЮРЖТМТЯТКВЛЗДКУ Д ОЕСЕОФЕЯС ТЗВШЗДЬТЛЖДЮ УР ТАМЕ Ь ДППЧДО ЁАБЫТОСА КЧДШНШОЛС КАЕАСН ЕЯИЕКА ЁПТЯЛА ЬЛК ЙТТЬТЮСЮСКБЛЖСНЯ ТЗВГКРДНВВТЫСВТЧХЖЗЧ БКПАЯБЫЕАФЬЯГЧУСФЛЗФЫШ ЁОЛТ Т В БЦРЁГБВРШ ЕОБЧСА ЬЩЖМЯСПГЯООЯХДШТР ЖЦЕДЬБСЛЧЁЕСА Я АВРКМДВ ТВПУСВИТЗЖРЙТЛОНРННФОЦОЁНДХОТФРН ВИЮАБ ЯСВДЕНЕМГКУЯББН