# El Xifrat del Cèsar

Recordem el funcionament del xifrat del Cèsar. Identificarem les lletres de l'alfabet català amb els nombres del 0 al 25:

    a --> 0
    b --> 1
    c --> 2
    d --> 3
    e --> 4
    f --> 5
    g --> 6
    h --> 7
    i --> 8
    j --> 9
    k --> 10
    l --> 11
    m --> 12
    n --> 13
    o --> 14
    p --> 15
    q --> 16
    r --> 17
    s --> 18
    t --> 19
    u --> 20
    v --> 21
    w --> 22
    x --> 23
    y --> 24
    z --> 25

Només farem servir lletres <b>minúscules sense accents</b> i mantindrem els espais entre paraules i els signes de puntuació, però no els considerarem part del missatge (per a nosaltres el missatge seran només les lletres).

La clau secreta $k$ és un nombre enter entre $0$ i $25$; per a cada lletra del missatge mirem a quin nombre correspon, diguem-li $c$, i substituïm la lletra per la que correspon al nombre $$ c+k \pmod{26}.$$ 

Recordem que la notació $c+k\pmod{26}$ vol dir el residu de dividir $c+k$ per $26$.

La rutina següent realitza el xifrat del Cèsar. Tot seguit hi ha alguns exemples de com s'utilitza; familiatzeu-vos-hi tot canviant els exemples i xifrant altres missatges amb altres claus.

In [1]:
alfabet = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']

def xifrat_cesar(s, k): # s és una cadena de caràcters i k és la clau
    S = '' # S és un string buit, sense cap caràcter
    for c in s: # c recorre els elements de v
        if c in [' ', ',', '.', ';','\'','-']:
            S = S + c
            continue
        try:
            i = alfabet.index(c) # busquem quin índex correspon al caràcter c
        except ValueError:
            print 'El missatge només pot contenir lletres minúscules sense accents.' 
            break
        new_i = (i + k)%26 # sumem la clau mòdul 26
        S = S + alfabet[new_i]
    return S


### Exemples de xifrat

In [2]:
# Exemple 1
criptograma1 = xifrat_cesar('ens proposem iniciar el primer de febrer la guerra submarina sense restriccio', 5)
print criptograma1

jsx uwtutxjr nsnhnfw jq uwnrjw ij kjgwjw qf lzjwwf xzgrfwnsf xjsxj wjxywnhhnt


In [3]:
# Exemple 2
missatge2 = 'af tenia poca aigua'
clau = 16
criptograma2 = xifrat_cesar(missatge2, clau)
print criptograma2

qv judyq fesq qywkq


### Exercici 1

Xifra el missatge 'la criptografia es util' emprant la clau $k=15$

In [4]:
# Solució
xifrat_cesar('la criptografia es util', 15)

'ap rgxeidvgpuxp th jixa'

### Exemples de desxifrat

Fixeu-vos que per a desxifrar el missatge es pot fer amb la mateixa rutina que per a xifrar, però amb la clau canviada de signe:

In [5]:
# Desxifrem el criptograma de l'exemple 1
xifrat_cesar(criptograma1, -5)

'ens proposem iniciar el primer de febrer la guerra submarina sense restriccio'

In [6]:
# Desxifrem el criptograma de l'exemple 2
xifrat_cesar(criptograma2, -clau)

'af tenia poca aigua'

In [7]:
# Exemple 3
# xifrem un missatge
missatge3 = 'vinyes verdes vora el mar, ara que el vent no remuga, us feu mes verdes i encar teniu la fulla poruga'
clau = 24
criptograma3 = xifrat_cesar(missatge3, clau)
print criptograma3

tglwcq tcpbcq tmpy cj kyp, ypy osc cj tclr lm pcksey, sq dcs kcq tcpbcq g clayp rclgs jy dsjjy nmpsey


In [8]:
# el desxifrem
xifrat_cesar(criptograma3, -clau)

'vinyes verdes vora el mar, ara que el vent no remuga, us feu mes verdes i encar teniu la fulla poruga'

### Exercici 2

Hem rebut el missatge següent, i sabem que ha estat xifrat amb la clau $k=24$. Esbrina el significat del missatge

In [9]:
criptograma4 = 'cjckclryj, cqrgkyr uyrqml'


In [10]:
# Solució
xifrat_cesar(criptograma4, -24)

'elemental, estimat watson'

### Exercici 3

Xifra el missatge el missatge que vulguis amb la clau $k=26$. Com expliques el resultat?

In [11]:
# Solució
xifrat_cesar('bon dia son les vuit', 26)
# El missatge és el mateix, ja que desplaçant cada lletra 26 posicions a la dreta obtenim la mateixa lletra

'bon dia son les vuit'

## Trencant el xifrat del Cèsar

Imagineu que intercepteu el missatge següent. Sabem que ha estat xifrat amb el mètode del Cèsar, però no sabem amb quina clau.

In [12]:
criptograma5 = 'ler ezk uv ccler gcver kirdlekrivd cr triver, cvekrdvek, jvejv uzi iv...jz cr ccler wvzr vc gcv krdsv vc wvl cr efjkir gver.'

### Exercici 4

Desxifra el missatge anterior. Per a trobar la clau, pots ajudar-te de la rutina següent, que et dóna la freqüència relativa amb què apareix cada lletra al text interceptat. Recorda també que en català no totes les lletres apareixen amb la mateixa freqüència en textos llargs. En aquest enllaç pots consultar quines són les freqüències relatives:

https://ca.wikipedia.org/wiki/Freq%C3%BC%C3%A8ncia_de_les_lletres

In [13]:
def frequencies_relatives(S):
    new_S = ''
    for c in S:
        if c in [' ', ',', '.', ';','\'','-']:
            continue
        new_S = new_S + c
    F=frequency_distribution(new_S) # retorna un objecte que es un espai de probabilitat discret
    D = F.function() # aixo és un diccionari
    DL = zip(D.keys(),D.values())# això és una llista que conté parelles (lletra, freqüència de la lletra en S)
    DL = sorted(DL,reverse = True,key=lambda a: a[1]) #ordenem la llista, fent servir la posició 1 cada parella per a ordenar
    new_DL = [(a[0],(RealField(8)(a[1])*100).str()+' %') for a in DL]
    return new_DL


In [14]:
# Exemple d'ús de la rutina frequencies_relatives:
m = 'comptarem amb quina frequencia apareix cada lletra en aquest missatge'
frequencies_relatives(m)

[('a', '18.38 %'),
 ('e', '13.38 %'),
 ('i', '6.688 %'),
 ('m', '6.688 %'),
 ('r', '6.688 %'),
 ('t', '6.688 %'),
 ('c', '5.000 %'),
 ('n', '5.000 %'),
 ('q', '5.000 %'),
 ('s', '5.000 %'),
 ('u', '5.000 %'),
 ('l', '3.344 %'),
 ('p', '3.344 %'),
 ('b', '1.672 %'),
 ('d', '1.672 %'),
 ('g', '1.672 %'),
 ('f', '1.672 %'),
 ('o', '1.672 %'),
 ('x', '1.672 %')]

In [15]:
# Solució de l'Exercici 4
# Mirem les freqüències relatives del criptograma
frequencies_relatives(criptograma5)


[('r', '16.75 %'),
 ('v', '16.75 %'),
 ('c', '12.50 %'),
 ('e', '12.50 %'),
 ('k', '7.281 %'),
 ('i', '6.250 %'),
 ('l', '5.188 %'),
 ('d', '4.188 %'),
 ('j', '4.188 %'),
 ('z', '4.188 %'),
 ('g', '3.125 %'),
 ('u', '2.094 %'),
 ('w', '2.094 %'),
 ('f', '1.047 %'),
 ('s', '1.047 %'),
 ('t', '1.047 %')]

In [16]:
# Veiem que les lletres que apareixen més són la 'r' i la 'v'. Podem pensar que la 'r' es correspon a la 'e'. 
#Com que r = 17 i e = 4, això voldria dir que la clau és 17 - 4 = 13. Si desxifrem el missatge amb la clau 13 obtenim
xifrat_cesar(criptograma5, -13)

'yre rmx hi ppyre tpire xveqyrxeviq pe gevire, pirxeqirx, wirwi hmv vi...wm pe ppyre jime ip tpi xeqfi ip jiy pe rswxve tire.'

In [17]:
# Veiem que no té sentit, sembla que no l'hem encertada.

# Ara podem pensar que la 'v' es correspon a la 'e'. Com que v = 21 i e = 4 això voldria dir que la clau seria 17
# comprovem si té sentit

xifrat_cesar(criptograma5, -17)


'una nit de lluna plena tramuntarem la carena, lentament, sense dir re...si la lluna feia el ple tambe el feu la nostra pena.'

# El xifrat de Vigenere

Recordem que el xifrat de Vigenere és semblant al del Cèsar, però cada lletra del missatge es veu afectat per una clau diferent segons la seva posició. Podem pensar que la clau és una paraula, en què cada lletra de la paraula es correspon a una clau de substitució. Per exemple, si la paraula clau és 'cop', com que la 'c' es correspon al nombre 3, la 'o' al nombre 14 i la p al 15, per a xifrar un missatge la primera lletra la desplaçarem 3 posicions, la segona 14, la tercera 15, i així successivament: la quarta lletra 3 posicions, la cinquena 14, etc...

La rutina següent realitza el xifrat de Vigenere. Tot seguit veurem alguns exemples de com emparar-la.

In [18]:
def xifra_vigenere(s, clau): # s és una cadena de caràcters i k és la clau
    clau = [alfabet.index(c) for c in clau]
    j = 0
    S = '' # S és un string buit, sense cap caràcter
    for c in s: # c recorre els elements de v
        if c in [' ', ',', '.', ';','\'', '-']:
            S = S + c
            continue
        try:
            i = alfabet.index(c) # busquem quin índex correspon al caràcter c
        except ValueError:
            print 'El missatge només pot contenir lletres majúscules sense accents' 
        new_i = (i + clau[j])%26 # sumem la clau mòdul 26
        S = S + alfabet[new_i]
        j = (j + 1)%len(clau)
    return S

### Exemples

In [19]:
# Exemple 4
M = 'les matematiques son divertides'
C = xifra_vigenere(M, 'cop')
print C

nsh ooigapvwfwsh ucc fwkgfikrtu


### Exercici 5

Escull una paraula clau i empra-la per a xifrar el missatge 'i avui torna a ser dissabte'

In [20]:
m = 'i avui torna a ser dissabte'

In [21]:
# Solució: utilizarem la paraula clau 'marc'
xifra_vigenere(m, 'marc')

'u amwu tftza r uqr ukesrdfe'

Per a desxifrar, igual que en el cas del xifrat del Cèsar, podem emprar la mateixa rutina canviant la clau de signe. Per a simplificar, hem fet una rutina que ho fa directament. En aquest cas, cal passar-li la mateixa paraula clau que hem fet servir per a xifrar.

In [22]:
def desxifra_vigenere(s, clau): # s és una cadena de caràcters i k és la clau
    clau = [alfabet[-alfabet.index(c)] for c in clau]
    return xifra_vigenere(s, clau)

In [23]:
# Exemple
# desxifrem el missatge C d'abans
desxifra_vigenere(C,'cop')

'les matematiques son divertides'

### Exercici 6

Desxifra el missatge següent, sabent que ha esta xifrat amb la paraula clau 'cosa'.

In [24]:
missatge = 'pc ws kuman eme czlrgg neioveu, odgw onuk bg sgfs a vomlc, dwrq hgtjce hk dwnuo ve voft gb laph'

In [25]:
# Solució

desxifra_vigenere(missatge, 'cosa')

'no es igual que altres vegades, algu avui no sera a taula, pero tothom hi pensa de tant en tant'

## Trencant el xifrat de Vigenere

Hem interceptat el missatge següent, del qual sabem que es correspon a un text en <b> anglès </b>.



In [26]:
C = 'szy zizsb owwayg njs ogfa xfrw oav sdmoy ab qauaahl sbq jwtzhf; lvrq oew savcjwr jahu jsnkca sbq ucakqvwbpw oav gugiyv opl hbooevg bfs nfcgzse ab n kdvjwg gt ojcgzsezcbv; siwflgbr ag rfhvlzrv hb szy lvr jwtzhf sbq xfrwrbeg fwh sgfgz wa lvvk rruznjogaca; wjrjmbfs usg gzs eauul hb dwsw, zvtselm nfr fwqhjwgq cs hsekca; fc bfs fzoyd pr zsyv wa kznnseq ce ksenwgmrr; kznnseq oav huw gysjr lfnvs fzoyd pr hfbzwoahrv wa szy lvraf sgfzk.'

La rutina següent serveix per a separar un text (oblidant-nos dels espais i signes de puntuació). Fixa't en els exemples per a esbrinar el seu funcionament.

In [27]:
def separar(S, pas):
    T = ''
    for c in S:
        if c in [' ', ',', '.', ';','\'', '-']:
            continue
        T = T + c
    r = []
    i = 0; j = 0
    count = 0
    S1 = ''
    while(count < len(T)+1):
        try:
            S1 = S1 + T[i + j*pas]
            j += 1
            count += 1
        except IndexError:
            r.append(S1)
            S1 = ''
            i += 1
            j = 0
    return r

### Exemples

In [28]:
M = 'avui es un dia especial'
separar(M, 2)

['aueudaseil', 'visniepca']

In [29]:
separar(M,3)


['aiuiscl', 'venapi', 'usdeea']

In [30]:
# Podem desar cadascuna de les cadenes de caràcters que retorna la rutina

M1, M2 = separar(M,2)
print M1
print M2


aueudaseil
visniepca


### Exercici 7

Se t'acudeix alguna manera de desxifrar el missatge C, sabent que s'ha xifrat amb una clau de longitud 3?

In [31]:
# Solució
C1, C2, C3 = separar(C,3)
print frequencies_relatives(C1)
print frequencies_relatives(C2)
print frequencies_relatives(C3)


[('w', '11.12 %'), ('z', '10.25 %'), ('v', '9.438 %'), ('a', '8.562 %'), ('k', '7.719 %'), ('j', '7.719 %'), ('l', '7.719 %'), ('s', '7.719 %'), ('f', '5.969 %'), ('g', '5.125 %'), ('q', '3.422 %'), ('d', '2.562 %'), ('n', '2.562 %'), ('h', '1.711 %'), ('m', '1.711 %'), ('u', '1.711 %'), ('x', '1.711 %'), ('e', '0.8555 %'), ('o', '0.8555 %'), ('t', '0.8555 %'), ('y', '0.8555 %')]
[('s', '15.50 %'), ('c', '9.500 %'), ('h', '9.500 %'), ('w', '9.500 %'), ('o', '8.625 %'), ('f', '7.750 %'), ('b', '6.875 %'), ('z', '6.875 %'), ('g', '6.031 %'), ('r', '4.312 %'), ('v', '3.438 %'), ('i', '1.719 %'), ('j', '1.719 %'), ('m', '1.719 %'), ('q', '1.719 %'), ('p', '1.719 %'), ('u', '1.719 %'), ('d', '0.8594 %'), ('t', '0.8594 %')]
[('r', '12.88 %'), ('a', '12.06 %'), ('e', '9.500 %'), ('b', '7.750 %'), ('n', '7.750 %'), ('y', '7.750 %'), ('g', '6.875 %'), ('f', '5.188 %'), ('u', '4.312 %'), ('v', '4.312 %'), ('o', '3.438 %'), ('q', '3.438 %'), ('s', '3.438 %'), ('j', '1.719 %'), ('l', '1.719 %'), (

In [37]:
# Solució
# En anglès la lletra més freqüent també és la 'e'. Podem conjecturar doncs que:
# e --> w, en la primera posició (e = 4, w = 22, la primera clau seria k1 = 18)
# e --> s, en la segona posició (e = 4, s = 18, la segona clau k2 = 14)
# e --> r, en la tercera posició (e = 4, r = 17, la tercera k3 = 13)
# Això ens faria conjecturar que la paraula clau és 'son'. Si desxifrem amb aquesta paraula clau
desxifra_vigenere(C, 'son')

'all human beings are born free and equal in dignity and rights; they are endowed with reason and conscience and should act towards one another in a spirit of brotherhood; everyone is entitled to all the rights and freedoms set forth in this declaration; everyone has the right to life, liberty and security of person; no one shall be held in slavery or servitude; slavery and the slave trade shall be prohibited in all their forms.'

### Exercici 8

A l'exercici anterior hem utilitzat que sabíem la longitud de la clau, però aquesta informació no sempre es té. Se t'acudeix alguna manera per a esbrinar la longitud de la clau que s'ha utilitzat per a xifrar un text amb Vigenere?

(Pista: si vols ajuda, prova de googlejar 'mètode de Kasiski')

# Per a continuar a casa (o a classe):

Pots obrir aquest fitxer i seguir executant comandes de Sage amb CoCalC:

https://cocalc.com/app

Només cal que et creïs un compte d'usuari i que obris el fitxer cripto_per_secundaria.ipynb amb un notebook de jupyter (no cal instal·lar cap programa, tot s'executa al núvol).