# üìò Tema 3 ‚Äî Algorismes num√®rics i complexitat - Maria Farelo Iglesias

## üß† Escenari: CityAI ‚Äî Encriptar un missatge
Aquest notebook treballa temes d'aritm√®tica modular que s'han vist o es veuran a laboratori i a teoria per consolidar-los.

Es treballa la identificaci√≥ de nombres primers i l'enviament i recepci√≥ de missatges encriptats.

Part del codi es correspon al codi ja vist a teoria i s'aprofita aquesta sessi√≥ per entrendre'l i treballar la complexitat.

### üß† Objectius:

- Practicar les operacions d'aritm√®tica modular i calcular-ne la complexitat.
- Aplicar el pensament algor√≠tmic a problemes reals i raonar a partir de l'ordre de complexitat dels problemes.

## ‚úçÔ∏è Problema 1: Observa el codi d'Erat√≤stenes donat a classe i de la versi√≥ m√©s curta. Reflexiona sobre la seva complexitat.

El [sed√†s d'Erat√≤stenes](https://ca.wikipedia.org/wiki/Sed%C3%A0s_d%27Erat%C3%B2stenes) √©s un algorisme per cercar tots els nombres primers fins un determinat enter. Aquest algorisme te la forma seg√ºent:

- Escriu una llista ``llista1`` amb els nombres del $2$ fins a l'enter $N$ que vulguis calcular.
- El primer nombre de la llista √©s un nombre primer. Anota'l en una llista de nombres primers, ``llista2``.
- Esborra de la llista ``llista1`` el primer nombre i els seus m√∫ltiples.
- Si el primer nombre de la llista ``llista1`` √©s m√©s petit que $\sqrt{N}$ torna al punt $2$.
- Els nombres de la llista ``llista2`` i els que queden a la llista ``llista1`` s√≥n tots els nombres primers cercats.

Implementa la funci√≥ ``eratostenes`` implementat l'algorisme d'Erat√≤stenes. A m√©s a m√©s, implementa la funci√≥ ``primer`` que retorna l'ennessim primer.

A continuaci√≥ es mostra un codi optimitzat del sed√†s d'Erat√≥stenes. La complexitat a continuaci√≥

In [16]:
from math import sqrt
from random import randint  

def eratostenes(n) :
    """
    Aquesta funci√≥ implementa l'algorisme d'Erat√≤stenes per cercar tots els nombres primers fins a n.
    
    Parameters
    ----------
    n: int
    
    Returns
    -------
    ret: list
    """
    sieve: list[bool] = [True for j in range(2, n+1)]
    for j in range(2, int(sqrt(n))+1) :
        i: int = j-2
        if sieve[i]:
            for k in range(j*j, n+1, j) :
                sieve[k-2] = False
    ret: list[int] = [j for j in range(2, n+1) if sieve[j-2]]
    return ret

def primer(n):
    """
    Aquesta funci√≥ retorna l'ennessim primer.
    
    Parameters
    ----------
    n: int
    
    Returns
    -------
    primer: int
    """
    sol: list[int] = []
    x: int = 1
    while len(sol) < n:
        x *= n * 50 # Given bound. x/log(x) approximates the number of primes less or equal to x. With the Lambert W function a better bound can be found
        sol = eratostenes(x)
    return(sol[n-1])

### Complexitat d'Erat√≥stenes


       def eratostenes(n:int) :
            sieve:list[bool] = [True for j in range(2,n+1)] ---------- O(n)
            for j in range(2,int(sqrt(n))+1) : ------------------------ el de dintre del bucle x sqrt(n)    O(n*sqrt(n))
               i:int = j-2 -------------------------------------------- O(1)
                if sieve[i]: ------------------------------------------ O(1)
                    for k in range(j*j,n+1,j) : ----------------------- el de dintre del bucle x n    O(n) (NOTA: no √©s una aproximaci√≥ molt exacta)
                       sieve[k-2] = False ----------------------------- O(1)
            ret:list[int] = [j for j in range(2,n+1) if sieve[j-2]] --- O(n)
            return ret ------------------------------------------------ O(1)

Una primera aproximaci√≥ a la complexitat de l'algorisme √©s $O(n\sqrt{n})$.

No obstant aix√≤, la complexitat es pot calcular m√©s exactament obtenint la quantitat de nombres que s'han d'eliminar per als diferents nombres primers:

$(n/2 + n/3 + n/5 + n/7 ...)=n(1/2+1/3+1/5+1/7 ...)$. 

Es pot demostrar que $(1/2+1/3+1/5+1/7 ...)=log(log(n))$. Per tant, la complexitat que s'obt√© √©s $O(n\cdot log log(n))$.

A continuaci√≥ el codi donat a teoria

In [29]:
def crea_llista_N (n:int) -> list[tuple]:        # Crea la llista de nombres candidats, tots vius
    llista:list[tuple] = []
    for i in range(2, n+1):
        llista.append((i,True))
    return llista

def primer_viu(A: list[tuple]) -> int:         # Recorre la llista fins a trobar el primer nombre viu
    for i,(num, es_viu) in enumerate(A):
        if es_viu:
            return i
    return len(A)+100                          # valor comod√≠ per saber que no hi √©s

def restants(A: list[tuple]) -> list[tuple]:    # Retorna tots els valors vius de la llista
    llista:list[tuple] = []
    for i,(num, es_viu) in enumerate(A):
        if es_viu:
            llista.append(num)
    return llista


def sedas_eratostenes(n: int) -> list[int]:    # Implementaci√≥ b√†sica de l'algorisme del sed√†s
    if n < 2:
        return []
    A: list[tuple] = crea_llista_N(n)          # pas 1 de l'algorisme
    B: list[int] = []
    arrel: int = n ** 0.5                      # quan el num sigui superior a l'arrel aturarem la cerca
    acabat:bool = False
    
    while (not acabat):
        i = primer_viu(A)
        if i > len(A):
            acabat = True
        
        valor_actual, estat = A[i]
        B.append(valor_actual)                 # pas 2 de l'algorisme  
        A[i]= (valor_actual, False)

        if valor_actual > arrel:               # pas 4 de l'algorisme
            acabat = True
        
        for j in range(i+1,len(A)):            # pas 3 de l'algorisme
            v,viu = A[j]
            if viu and (v % valor_actual == 0):
                A[j] = (v, False)

    return B + restants(A)                      # pas 5 de l'algorisme 

In [28]:
assert primer(6) == 13
assert primer(10001) == 104743

## ‚úçÔ∏è Problema 2: Observa els seg√ºents asserts i crea'n alguns de nous amb altres valors

In [19]:
assert eratostenes(1) == [], "eratostenes(1) != []: No hi ha nombres primers fins a 1."
assert eratostenes(48) == [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47], "La funci√≥ no retorna correctament tots els primers fins N quan N √©s compost"
assert eratostenes(47) == [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47], "La funci√≥ no retorna correctament tots els primers fins N quan N √©s primer"
#-----
# Casos b√†sics
assert eratostenes(0) == [], "eratostenes(0) != []: No hi ha nombres primers fins a 0."
assert eratostenes(2) == [2], "eratostenes(2) hauria de retornar [2]."
assert eratostenes(3) == [2, 3], "eratostenes(3) hauria de retornar [2, 3]."
assert eratostenes(4) == [2, 3], "eratostenes(4) hauria de retornar [2, 3]."

# Casos amb primers petits
assert eratostenes(10) == [2, 3, 5, 7], "eratostenes(10) hauria de retornar [2, 3, 5, 7]."
assert eratostenes(20) == [2, 3, 5, 7, 11, 13, 17, 19], "eratostenes(20) incorrecte."

# Casos l√≠mit i compostos grans
assert eratostenes(49) == [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47], "eratostenes(49) no hauria d'incloure 49 (no √©s primer)."
assert eratostenes(50) == [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47], "eratostenes(50) incorrecte."



## ‚úçÔ∏è Problema 3: Implementa ara l'algorisme d'Erat√≤stenes a la funci√≥ ``eratostenes_IO`` utilitzant m√®todes d'entrada i sortida. 

In [20]:
def eratostenes_IO(input_file, output_file):
    """
    Aquesta funci√≥ implementa l'algorisme d'Erat√≤stenes per generar tots els nombres primers 
    fins a un nombre n, definit a un fitxer de text input_file, i guarda el resultat a un 
    fitxer de text output_file on estan escrits els primers ordenats i separats per coma.
    Exemples de fitxers d'entrada i sortida s√≥n 'example_input_file.txt' i 
    'example_output_file.txt'. Assumim que el fitxer de sortida no existeix i que el fitxer
    d'entrada existeix i est√† ben formatejat.
    
    Parameters
    ----------
    input_file: str 
    output_file: str

    Returns
    -------
    Aquesta funci√≥ no retorna.
    """
      # Llegir el nombre N del fitxer d‚Äôentrada
    with open(input_file, "r", encoding="utf-8") as f_in:
        contingut = f_in.read().strip()
        n = int(contingut)

    # Calcular els primers
    primers = eratostenes(n)

    # Escriure'ls al fitxer de sortida, separats per coma
    with open(output_file, "w", encoding="utf-8") as f_out:
        f_out.write(",".join(map(str, primers)))

In [21]:
eratostenes_IO('./example_input_file.txt', './example_output_file.txt')

In [22]:
assert(all(map(lambda num_idx: primer(num_idx[0]+1)==num_idx[1], enumerate([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]))))

## ‚úçÔ∏è Problema 4: Encriptaci√≥ de missatges

Observa els codis donats a teoria i la seva complexitat. 

In [23]:
import math
import random


def fermat(num:int, test_count:int) -> bool:
    if num == 1:
        return False
    for x in range(test_count):             # el de dintre per test_count
        val:int = random.randint(1, num-1)     
        if pow(val, num-1) % num != 1:      # n^3 on n = num
            return False                   
    return True

# La complexitat √©s test_count x num^3

def generar_primer(n:int)->int:
    # print("Entrem a generar primer")
    trobat:bool = False              # 1 pas
    valor_minim:int = 2**(n-1)       # O(1)
    valor_maxim:int = 2**n           # O(1)
    while not trobat:                # el cas pitjor: falla 1/2 de les vegades, el de dintre x2. Per Lagrange amb n intents el trobem
        p:int = random.randint(valor_minim, valor_maxim)   # 1 pas
        # print("generar_primer",p)
        trobat = fermat(p, 30)                             # 30^3 x 30 passos, pero no varia amb la n
    return p

# La complexitat √©s O(n) per Lagrange, on n √©s l'entrada. Validar si √©s primer est√† acotat. 


def trobar_e_d(m:int)->list[int]:
    # e √©s un coprimer de m, √©s a dir si e √©s primer, m no √©s multiple de e
    # d √©s l'invers modular de e (d*e mod M √©s congruent amb 1)
    # aix√≤ fa que elevar a e i despr√©s elevar a d recuperi l'M original
    # print("Entrem a trobar e-d")
    trobat:bool = False                                # 1 pas0
    while (not trobat):                                # Per lagrange sabem que amb n intents podem trobar e co-primer
        e:int  = random.randint(1031,int(sqrt(m)+1))   # O(1)
        # print("e",e)
        if  math.gcd(e,m)== 1:                         # O(n^2) pel gcd + 1 per la comparaci√≥
            d:int = pow(e, -1, m)                      # O(n^2) perqu√® internament fa servir gcd
            if d > 1:                                  # 1 pas
                trobat = True                          # 1 pas
    return [e,d]                                       # 1 pas

# O(n^3) on la n √©s el n√∫mero de d√≠gits de la m (log2(m))


def generar_claus(dificultat:int)->list[int]:
    """
    Aquest funci√≥ genera les claus p√∫bliques i les claus privades per encriptar un missatge.

    Parameters
    ----------
    dificultat: el nombre de bits de la clau n

    Returns
    -------
    Retorna la clau publica [n,e] i la clau privada [n,d]
    """   
    # print("Entrem a generar_claus")
    p:int = generar_primer(dificultat)     # O(n)
    # print("p",p)                     
    q:int = generar_primer(dificultat)    # O(n)
    # print("q",q)                      
    n:int = p * q
    m:int = (p-1)*(q-1)
    l:list[int] = trobar_e_d(m)           # O(log n)
    e = l[0]
    d = l[1]
    return [[n,e],[n,d]]

# Aquest algorisme t√© un ordre de complexitat d'O(n), on n √©s el valor de l'entrada.



def encriptar_missatge(clau_publica:list[int],missatge:int)->int:
    if missatge < 0 or missatge >= clau_publica[0]:
        print("El missatge ha de tenir un valor entre 0 i n-1")
        return None
    return pow(missatge,clau_publica[1],clau_publica[0])

# O(n^3) on la n √©s el nombre de bits del missatge.


def desencriptar_missatge(clau_privada:list[int],missatge_encriptat:int)->int:
    return pow(missatge_encriptat,clau_privada[1],clau_privada[0])

# O(n^3) on la n √©s el nombre de bits del missatge.

In [24]:
claus:list[any] = generar_claus(16)   # canviar 16 per altres valors si es vol m√©s complex
print(claus)              # llista de clau publica, clau privada
M = 454588                # el missatge abans d'encriptar
n = claus[0][0]
e = claus[0][1]
C = encriptar_missatge(claus[0], M)
print(C)                  # el missatge encriptat

[[2497105063, 49043], [2497105063, 1381516907]]
1172253827


## ‚úçÔ∏è Problema 5: Escriu l'algorisme per desencriptar el missatge amb factoritzaci√≥ i calcula'n la complexitat.

Disposes de la clau p√∫blica (n, e), i del missatge encriptat (C).

Has de provar de trobar la clau privada i desencriptar el missatge. Si ho has fet b√© obtindr√†s m



In [25]:
from math import isqrt

def factoritzar(num: int) -> list[int]:
    """
    Aquesta funci√≥ troba dos nombres primers p i q tals que p * q = num.
    Funciona assumint que num √©s producte de dos primers petits o moderats.

    Parameters
    ----------
    num : int
        El nombre a factoritzar.

    Returns
    -------
    list[int]
        Una llista [p, q] amb p * q = num
    """
    for i in range(2, isqrt(num) + 1):
        if num % i == 0:
            return [i, num // i]
    return [num, 1]  # Si √©s primer, retorna [num, 1]

def trobar_m(p: int, q: int) -> int:
    """
    Aquesta funci√≥ calcula m tal que m = (p - 1) * (q - 1).
    Normalment s'usa en RSA per calcular la funci√≥ d'Euler de n = p*q.

    Parameters
    ----------
    p : int
    q : int

    Returns
    -------
    int
        m = (p - 1) * (q - 1)
    """
    return (p - 1) * (q - 1)

def trobar_d(e: int, m: int) -> int:
    """
    Aquesta funci√≥ retorna l'invers multiplicatiu d'e m√≤dul m.
    √âs a dir, troba d tal que (d * e) % m == 1

    Parameters
    ----------
    e : int
        El nombre del que busquem l'invers
    m : int
        El m√≤dul

    Returns
    -------
    int
        L'invers multiplicatiu de e m√≤dul m
    """
    # Algorisme d'Euclides est√®s
    def extended_gcd(a, b):
        if b == 0:
            return (a, 1, 0)
        else:
            g, x1, y1 = extended_gcd(b, a % b)
            x = y1
            y = x1 - (a // b) * y1
            return (g, x, y)

    g, x, y = extended_gcd(e, m)
    if g != 1:
        raise ValueError(f"No existeix invers multiplicatiu per e={e} m√≤dul m={m}")
    return x % m





In [26]:
# atenci√≥ executar aquesta cel.la  pot tardar molt de temps
factoritzar(980985098032414123478974982374)

[2, 490492549016207061739487491187]