# Vigenere tores

## Egy elképzelt nyelvben csak az angol ábécé nagybetűi szerepelnek. A nyelv minden szövege úgy épül fel, hogy blokkokból áll: minden blokk egymástól függetlenül

#### 80% valószínűséggel egy olyan 5 hosszú blokk, melyben csak magánhangzók szerepelnek (A, E, I, O, U) 
#### 15% valószínűséggel egy olyan 7 hosszú blokk, melyben csak mássalhangzók szerepelnek,
#### 5% valószínűséggel a következő sztring: "KORE".
#### Valósítsunk meg egy olyan törő algoritmust, mely a fenti nyelvnek egy legalább 200 hosszú szövegének Vigenere-titkosítását vissza tudja fejteni (jó eséllyel). Használhatjuk a 2-3. órán tekintett módszert, ahol a titkos szöveg ismétléseit kellett detekálni. A Vigenere-kulcs  egy 3 és 15 közti hosszúságú lista véletlen shiftekkel.

In [1]:
import random
import math
import copy 

In [2]:
# karakterek kodolasa
def indexOfLetter(c):
    return ord(c) - 65
def letterWithIndex(i):
    return chr(i+65)
def shiftChar(c, shift):
    i = indexOfLetter(c)
    new = (i + shift) % 26
    return letterWithIndex(new)

In [3]:
# kulcs eloallitasa
def generateKey():
    L = []
    random_number = random.randint(3, 15)
    for i in range (0,random_number):
        shift_number = random.randint(0, 26)
        L.append(shift_number)
    return L

In [4]:
# Vigenere titkosítás -> orai kod
def vigenere(s, shiftList):
    ret = ""
    # Current position in the shiftList
    pos = 0
    n = len(shiftList)
    for c in s:
        new = shiftChar(c, shiftList[pos])
        ret += new
        # Add one, restart if list is over
        pos = (pos + 1) % n
    return ret

In [5]:
# Valoszinuseghez szamgenerator
# Egy random szam generatorral szimulalom a nyelvben valo elofordulasi valoszinuseget
# 1 es 100 kozott generalok random szamot, es a hatarok reprezentaljak az elofordulasi valoszinuseget 100 esetet tekintve
def blockProbability():
    L = ""
    rand_prob = random.randint(1, 100)
    if ((rand_prob > -1) and (rand_prob < 81)):
        for i in range (0,5):
            rand_char = random.randint(0,4)
            m = ['A', 'E', 'I', 'O', 'U']
            L += m[rand_char]
    elif ((rand_prob > 80) and (rand_prob < 96)):
        for i in range (0,7):
            m = ['B', 'C', 'D', 'F', 'G', 'H', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'V', 'W', 'X', 'Y', 'Z']
            rand_char = random.randint(0, len(m)-1)
            L += m[rand_char]
    else:
        L += "KORE"
    return L

In [6]:
# Titkos szoveg eloallitasa
def encodingText (s, L):
    for i in range (0, len(s)):
        s[i] = vigenere(s[i], L)
        print(s[i])

In [7]:
# Ismetlodesek kiszurese
def repetitionsInString(s, length = 3):
    n = len(s)
    ret = [(i,j) for i in range(0, n-length) for j in range(i+1, n-length+1) if s[i:(i+length)] == s[j:(j+length)] ]
    return ret

In [8]:
s = []
for i in range (0,100):
    s.append(blockProbability())
L = generateKey()

In [9]:
# egy hosszu stringet keszitek a szoveg blokkokbol
complete = ""
for i in range (0, len(s)):
    complete += s[i]
print(complete)

EUOOUIAOAEOIAAOUUUIULGGBBQHAIEOEIEEUOAIAAEAEOIEOOOOEIEUEIAIUAIEIIEUAIEIOEEIAIUOUOAIUEEUEOAUOIUOIIIEUAUKOREUUOAUEOUEAUUEUIOIIIAOUAIOEEAEITJPJWWSKOREKOREIOOUOBJWBTHRXKFDSMRCJDHBBPAIAEAIUOUUEIUOOEEAOEIIIEIUIAAOKOREUOEUAIUAUUUUOAAAOEUAAAUOEOUUEAEOEOIEAOEUAAUOIEEAUAUUAUEIOOUUEUAIEOOAAIOEOUAUEEOAIAUAEEIEAUOEIAACXWFLLGEUUEUAOAUIIOEEUCSWXYFFUAEIOUOOEEOOAUEEAOOAIEAIEUOAIUOAOAOEOAOIEAUAUOAIUIOIOOUAUAOOAOUEUFFLWGSCAIUEIIUEEUEIEUOJFLCTSTIAAEUAAOEIOAOIEOEEUUUEOAOOAUOEJXPFDKROIEOOAUOIAKOREEOOUOEAEUAZNNCXZBIOIAAEUIUEFHHVLPXAAUEO


In [10]:
# titkositas ket fele modon

# 1 - blokkonkent titkositom a szoveget -> minden blokk karaktereihez adott shiftet hasznalok
r = copy.deepcopy(s)
encodingText(r, L)

YHJJU
CNJVE
IVVVO
OHPDU
FTBWBQR
UVZJE
CRZPO
UVVVE
URJDE
IBJJE
CRPZI
UVPVI
YVDZU
UVZDO
YRDVI
OBPJA
CHZZU
YBVPO
CHJDI
CRPVU
EBMZ
OHJVU
YBPZA
OHZPI
IVDDA
IHVDO
YRVZI
NWKEWWC
EBMZ
EBMZ
CBJPO
VWRWTHB
RXAYSMB
WWYCBBZ
UVVZA
CHJPU
YVPJO
YRVJE
CVDZI
OVVVO
EBMZ
OBZPA
CHVPU
OHJVA
UBZPA
UNPJE
IHPZA
YBZJI
YNJZU
UNPJI
YRVPA
OHVPE
CBJPU
YHVDE
IBVVI
IRJPA
ORZJA
CNPVE
YVZVU
IRDVA
WKRALLQ
YHPZU
UBVPI
CBZZU
WFRSYFP
ONZDO
OBJZE
IBVPE
YNJJA
CRVDE
OBVDU
INJVO
YBVJI
YNPVU
INDPI
IVJJU
UHVJO
UBPZU
ZSGRGSM
UVPZI
CHZZU
YVZPO
DSGXTSD
CNVZU
UNJZI
INJDE
IRZPU
ORJVO
INPJE
DKKADKB
IVZJO
UHJDA
EBMZ
YBJPO
YNZPA
TAIXXZL
CBDVA
YHDPE
ZUCQLPH
UNPZO


In [11]:
# 2 - az egesz szovegen egyben vegig megyek, es karakterenkent kodolok
complete_text = copy.deepcopy(complete)
vigenere(complete_text, L)

'YHJJUIKHEYBDVAOENYCHGBGBLJLUVZJEIOXYINDVAEKXSCRJJOOOBIORDVIUKBICVZPAIOBSYRDVIUYNSUVPZEUOHEOBDPOISBIONPFORONYINPZOUOTYORPDOISBEIHVDOEOTICGEKJWGLOIEZFOROBSIHJWJWLMLLKFADSWKGDQCWBPKBEYNDPOUEXMOBJZEAYXMCVZDUIKTSEBMZUOONECHVPUUEHEUNJZUAKTYIRJPUEKXSYBDZAOONEUHJDEEKNEOHVPEIYHYORPVIEYHEUVJZOUKNIYBVDAUKXICRVPOESTEWKRALLQXYORPVOAEBMIRZPCSGQCZSPVEIYNSIRZJOAEXIUBJVIEKBIOBVDUOKHEIRJVOIOTYUHJVIUSHMIBPVUAYHEIHZPFFVPKMPVDUESBYYRPZIEEHNZYXOSTSTEYHVVOESHEIVZJEEENYYBVJOAEHIDKKADKBHMYBJVUOSTOIEZZOOEHIURPVZNXVBTODJIAKXYCHZAHHFETRNVPEO'

In [12]:
# ismerem a nyelvet, igy tudom, hogy vannak benne 4 hosszu KORE stringek, eloszor ezekkel kezdem
# a 4 hosszu stringeknel pontosan vissza tudom fejteni, hogy az elso 4 karakter mennyivel van eltolva

four_char = repetitionsInString(complete_text, 7)
print(four_char)

[]


In [13]:
def guessedKeyLength(ciphertext, length = 3):
    differences = [j-i for (i,j) in repetitionsInString(ciphertext, length)]
    return gcd(differences)

In [14]:
# megprobalom a 4 hosszu ismetlodesekbol az eltolasokat meghatarozni
def KeyLengths(ciphertext, length = 3):
    differences = [j-i for (i,j) in repetitionsInString(ciphertext, length)]
    return differences

In [15]:
differences = KeyLengths(complete_text, 5)
print(differences)

def gcdOfKeys(array):
    if len(array) > 0:
        b=array[0]
        for i in range (0, len(array)):
            s=math.gcd(b,array[i])
            b=s
        return b
print(gcdOfKeys(differences))

[325, 422, 18, 7, 33, 206, 106, 281, 300, 330, 330, 382, 105, 115, 151, 21, 21, 118, 45, 193, 124, 19, 68, 70, 16]
1


In [16]:
# az alabbi levezetesen lathato, hogy a kulcsmeret meghatarozasa sikeres volt L 9 hosszuagu kulcsra
# ha a 5-es ismetlodeseket keressuk a szovegben, ugy tobb esetet is talalunk, igy megkaphatjuk a 9-es periodicitast
# a 9-es periodicitas pedig ebben az esetben a kulcsunk hossza

In [22]:
m = ['A', 'E', 'I', 'O', 'U']
L2 = [3,2,1]
complete2 = copy.deepcopy(complete)
print(complete2)
complete2
complete2 = vigenere(complete2, L)

print(L)
print(complete2)
print(repetitionsInString(complete2, 5))
diff = KeyLengths(complete2, 4)
gcd_needed = gcdOfKeys(diff)

print(gcd_needed)

# adott szovegben valo ismetlesek kiiratasa
print(complete2[28:32])
print(complete2[442:446])
print(complete[28:32])
print(complete[442:446])
print()
print(complete2[55:60])
print(complete2[73:78])
print(complete[55:60])
print(complete[73:78])

EUOOUIAOAEOIAAOUUUIULGGBBQHAIEOEIEEUOAIAAEAEOIEOOOOEIEUEIAIUAIEIIEUAIEIOEEIAIUOUOAIUEEUEOAUOIUOIIIEUAUKOREUUOAUEOUEAUUEUIOIIIAOUAIOEEAEITJPJWWSKOREKOREIOOUOBJWBTHRXKFDSMRCJDHBBPAIAEAIUOUUEIUOOEEAOEIIIEIUIAAOKOREUOEUAIUAUUUUOAAAOEUAAAUOEOUUEAEOEOIEAOEUAAUOIEEAUAUUAUEIOOUUEUAIEOOAAIOEOUAUEEOAIAUAEEIEAUOEIAACXWFLLGEUUEUAOAUIIOEEUCSWXYFFUAEIOUOOEEOOAUEEAOOAIEAIEUOAIUOAOAOEOAOIEAUAUOAIUIOIOOUAUAOOAOUEUFFLWGSCAIUEIIUEEUEIEUOJFLCTSTIAAEUAAOEIOAOIEOEEUUUEOAOOAUOEJXPFDKROIEOOAUOIAKOREEOOUOEAEUAZNNCXZBIOIAAEUIUEFHHVLPXAAUEO
[20, 13, 21, 21, 26, 26, 10, 19, 4]
YHJJUIKHEYBDVAOENYCHGBGBLJLUVZJEIOXYINDVAEKXSCRJJOOOBIORDVIUKBICVZPAIOBSYRDVIUYNSUVPZEUOHEOBDPOISBIONPFORONYINPZOUOTYORPDOISBEIHVDOEOTICGEKJWGLOIEZFOROBSIHJWJWLMLLKFADSWKGDQCWBPKBEYNDPOUEXMOBJZEAYXMCVZDUIKTSEBMZUOONECHVPUUEHEUNJZUAKTYIRJPUEKXSYBDZAOONEUHJDEEKNEOHVPEIYHYORPVIEYHEUVJZOUKNIYBVDAUKXICRVPOESTEWKRALLQXYORPVOAEBMIRZPCSGQCZSPVEIYNSIRZJOAEXIUBJVIEKBIOBVDUOKHEIRJVOIOTYUHJVIUSHMIBPVUAYHEIHZPFFVPKMPVDUESBYYRPZIEEHNZYXOSTSTEYHVVOESHEIVZ

In [23]:
# statisztikai elofordulasok
m1 = ['A', 'E', 'I', 'O', 'U']
m2 = ['B', 'C', 'D', 'F', 'G', 'H', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'V', 'W', 'X', 'Y', 'Z']
m3 = ["KORE"]
language = [m1, m2, m3]
LP = [0.8, 0.15, 0.05]

X = GeneralDiscreteDistribution()
textL = [alphabet[dist.get_random_element()] for _ in range(300)]
text = "".join(textL)

print(language)

[['A', 'E', 'I', 'O', 'U'], ['B', 'C', 'D', 'F', 'G', 'H', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'V', 'W', 'X', 'Y', 'Z'], ['KORE']]
