# üìò Tema 3 ‚Äî Algorismes num√®rics i complexitat

In [None]:
from IPython.core.display import display, HTML
display(HTML('<style>.container { width:100% !important; }</style>'))

## üß† Escenari: CityAI ‚Äî Renda per barris
Aquest notebook treballa temes d'aritm√®tica b√†sica i modular mitjan√ßant reptes contextualitzats en una ciutat intel¬∑ligent.

L'ajuntament de Barcelona monitoritza diverses variables de la poblaci√≥ i de la distribuci√≥ per barris. Una d'elles √©s la renda disponible per c√†pita per barris i districtes, que es fa en base a una estimaci√≥ a partir de dades de l'Idescat i de l'INE. 

A algor√≠smica hem descarregat les dades de 2020, 2021 i 2022 i d'aquesta darrera n'hem fet una versi√≥ m√©s reduida encara, 'sense_comes_renda_reduit.csv', sense cap√ßaleres, per a que hi puguis jugar inicialment. 

En aquest fixer es dona el codi i nom de districte i barri, i per cadascun d'ells l'estimaci√≥ en euros de renda per c√†pita anual.

Tots els fitxers de dades que es treballen en aquest notebook han estat tractats d'antuvi i les dades se separen per ;. Aix√≠ hem evitat problemes amb noms llargs de barris que tenien cometes entremig.

### üß† Objectius:

- Practicar les operacions d'aritm√®tica b√†sica i modular i calcular-ne la complexitat.
- Treballar amb col.leccions
- Experimentar amb un √∫s real de l'aritm√®tica modular, la validaci√≥ dels codis bancaris.
- Aplicar el pensament algor√≠tmic a problemes reals i raonar a partir de l'ordre de complexitat dels problemes.

## ‚úçÔ∏è Problema 1: Relacionar barris i districtes

A partir de les dades de renda_reduit, fes un diccionari en el que donat un barri de Barcelona et retorni el districte.
Pots comen√ßar amb una aproximaci√≥ manual, per√≤ l'objectiu √©s que omplis el diccionari de manera autom√†tica.

In [13]:
def districte_barri() -> dict[str,str]:
    '''
    Retorna un diccionari amb els districtes i barris de Barcelona.
    
    La clau del diccionari √©s el nom del barri i el valor √©s el nom del districte.

    :param: None
    :return: diccionari amb els barris de Barcelona i el seu districte corresponent.   
    '''
    with open("sense_comes_renda_reduit.csv", "r", encoding = "utf-8") as file:
        # format:  year; num_distrito; distrito; num_barrio; barrio; rent
        l: list[str] = file.readline().split(";")
        year_lastline = l[0]
        d: dict[str, str] = {l[4]:l[2]}

        l = file.readline().split(";")
        while year_lastline == l[0]:
            d[l[4]] = l[2]
            l = file.readline().split(";")

        return d

In [14]:
districte_barri()

{'el Raval': 'Ciutat Vella',
 'el Barri G√≤tic': 'Ciutat Vella',
 'la Barceloneta': 'Ciutat Vella',
 'Sant Pere, Santa Caterina i la Ribera': 'Ciutat Vella'}

Calcula el cost i l'ordre de complexitat de l'algorisme, a qu√® correspon la $n$ en aquest cas?

La n correspon al nombre de l√≠nies del fitxer. La complexitat √©s O(n)

## ‚úçÔ∏è Problema 2: Calcular la mitjana de la renda per persona per districte

Comen√ßant amb el fitxer reduit per√≤ despr√©s ja agafant totes les dades del 2022, calcula la mitjana de les rendes per persona a cada districte de barcelona. 

In [None]:
# Si et resulta √∫til, pots utilitzar aquest diccionari: 

districte = {'Ciutat Vella':1, 'Eixample':2, 'Sants-Montju√Øc':3, 'Les Corts':4, 'Sarri√†-St. Gervasi':5, 
             'Gr√†cia':6, 'Horta-Guinard√≥':7, 'Nou Barris':8, 'Sant Andreu':9, 'Sant Mart√≠':10}

In [48]:
def mitjana_districte() -> list[int]:
    '''  
    Retorna una llista amb la mitjana de renda per barri de Barcelona.
    
    :param: None
    :return: llista amb la mitjana de renda per barri de Barcelona.
    '''
    with open("04-2021_sense_comes_renda_disponible_llars_per_persona.csv", "r", encoding = "utf-8") as file:
        l_renda: list[int] = [0] * 10

        # format:  year; num_distrito; distrito; num_barrio; barrio; num_rent; rent
        #           [0];          [1];      [2];        [3];    [4];      [5];  [6]
        l: list[str] = file.readline().split(";")
        if not l[0][0].isdigit(): l = file.readline().split(";")  # skip line 1 if it's a header
        count: int = 1
        sum_rent: int = int(l[6])
        num_distrito: str = l[1]
    
        for line in file:
            l = line.strip().split(";")
            if (num_distrito != l[1]):  # enter this branch once found a different distrito
                l_renda[int(num_distrito) - 1] = sum_rent // count
                # initialize for the new distrito
                count = 0
                sum_rent = 0
                num_distrito = l[1]
            
            sum_rent += int(l[6])
            count += 1

        # the iteration ends when the rent of the last distrito is NOT applied to l_renda
        l_renda[int(num_distrito) - 1] = sum_rent // count
            
        return l_renda 

In [49]:
print(mitjana_districte())

[15639, 24740, 19584, 28140, 33016, 24223, 20040, 16463, 20144, 20445]


Calcula la complexitat d'aquest algorisme i calcula la complexitat per als fitxers de 2020 i 2021, en funci√≥ de la n que has definit.

In [None]:
O n

## ‚úçÔ∏è Problema 3: Negoci piramidal

Sembla ser que a Barcelona el 2022 es va posar de moda un negoci pir√†midal de venda de les rajoles t√≠piques amb la flor, i que a qui s'hi apunta li prometien uns guanys exponencials. (La realitat va ser un bluf i molta gent hi va perdre diners)

Concretament si invertien 1000 ‚Ç¨ i reclutaven 1000 persones, el guany prometia ser de $1000^1000$.

Segurament s'hi van apuntar les persones del barri amb una renda m√©s baixa.

Crea una funci√≥ que estimi quin √©s el barri que s'apuntr√† a aquesta iniciativa.

Crea una segona funci√≥ que calculi els guanys en funci√≥ dels diners invertits i de les persones reclutades. El c√†lcul ha de ser √≤ptim i pots usar l'algorisme d'exponenciaci√≥ que s'ha vist a teoria.

In [None]:
# Pots utilitzar aquest diccionari:
barris = {'el Raval': 1, 'el Barri G√≤tic': 2, 'la Barceloneta': 3, 'Sant Pere': 4, 'el Fort Pienc': 5, 'la Sagrada Fam√≠lia': 6,
          "la Dreta de l'Eixample": 7, "l'Antiga Esquerra de l'Eixample": 8, "la Nova Esquerra de l'Eixample": 9, 'Sant Antoni': 10,
          'el Poble Sec - AEI Parc Montju√Øc': 11, 'la Marina del Prat Vermell - AEI Zona Franca': 12, 'la Marina de Port': 13,
          'la Font de la Guatlla': 14, 'Hostafrancs': 15, 'la Bordeta': 16, 'Sants - Badal': 17, 'Sants': 18, 'les Corts': 19,
          'la Maternitat i Sant Ramon': 20, 'Pedralbes': 21, 'Vallvidrera': 22, 'Sarri√†': 23, 'les Tres Torres': 24,
          'Sant Gervasi - la Bonanova': 25, 'Sant Gervasi - Galvany': 26, 'el Putxet i el Farr√≥': 27, 'Vallcarca i els Penitents': 28,
          'el Coll': 29, 'la Salut': 30, 'la Vila de Gr√†cia': 31, "el Camp d'en Grassot i Gr√†cia Nova": 32, 'el Baix Guinard√≥': 33,
          'Can Bar√≥': 34, 'el Guinard√≥': 35, "la Font d'en Fargues": 36, 'el Carmel': 37, 'la Teixonera': 38,
          'Sant Gen√≠s dels Agudells': 39, 'Montbau': 40, "la Vall d'Hebron": 41, 'la Clota': 42, 'Horta': 43,
          'Vilapicina i la Torre Llobeta': 44, 'Porta': 45, 'el Tur√≥ de la Peira': 46, 'Can Peguera': 47, 'la Guineueta': 48,
          'Canyelles': 49, 'les Roquetes': 50, 'Verdun': 51, 'la Prosperitat': 52, 'la Trinitat Nova': 53, 'Torre Bar√≥': 54,
          'Ciutat Meridiana': 55, 'Vallbona': 56, 'la Trinitat Vella': 57, 'Bar√≥ de Viver': 58, 'el Bon Pastor': 59, 'Sant Andreu': 60,
          'la Sagrera': 61, 'el Congr√©s i els Indians': 62, 'Navas': 63, "el Camp de l'Arpa del Clot": 64, 'el Clot': 65,
          'el Parc i la Llacuna del Poblenou': 66, 'la Vila Ol√≠mpica del Poblenou': 67, 'el Poblenou': 68,
          'Diagonal Mar i el Front Mar√≠tim del Poblenou': 69, 'el Bes√≤s i el Maresme': 70, 'Proven√ßals del Poblenou': 71,
          'Sant Mart√≠ de Proven√ßals': 72, 'Sant Pere,  Santa Caterina i la Ribera':73, 'la Verneda i la Pau': 74, 'Vallvidrera, el Tibidabo i les Planes':75}

In [116]:
def barri_menor_renda() -> str:
    '''Retorna el barri amb la renda m√©s baixa.

    :param: None
    :return: nom del barri amb la renda m√©s baixa.
    '''
    with open("04-2022_sense_comes_renda_disponible_llars_per_persona.csv", "r", encoding = "utf-8") as file:        
        # format:  year; num_distrito; distrito; num_barrio; barrio; num_rent; rent
        #           [0];          [1];      [2];        [3];    [4];      [5];  [6]
        l: list[int] = file.readline().strip().split(";")
        last_barrio: str = l[4]
        sum_renda: int = int(l[6])
        count: int = 1

        renda_minim: int = 99999999  # un valor enorme
        barrio_minim: str = ""
        for line in file:
            l = line.strip().split(";")
            if (l[4] != last_barrio):
                if (sum_renda // count < renda_minim):
                    renda_minim = sum_renda // count
                    barrio_minim = last_barrio
                # initialize to calculate the new barrio
                last_barrio = l[4]
                sum_renda = 0
                count = 0

            sum_renda += int(l[6])
            count += 1

        if (sum_renda // count < renda_minim):
                    renda_minim = sum_renda // count
                    barrio_minim = last_barrio
        
    return barrio_minim

In [117]:
print(barri_menor_renda())

Ciutat Meridiana


In [105]:
def calcul_piramidal(base:int, exponent:int) -> int:
    '''
    Exponenciaci√≥ per quadrats.

    :param base: nombre base
    :param exponent: exponent (‚â• 0)
    :return: base^exponent 
    '''


## ‚úçÔ∏è Problema 4: Validaci√≥ del codi bancari

L'ajuntament ha decidit que no nom√©s vol estimar la renda per c√†pita sin√≥ que vol calcular la renda real en una mostra de la poblaci√≥. 

Per aix√≤ ha demanat voluntaris i el primer que els ha dit √©s que validin el seu compte bancari.

En un compte bancari real, hi ha 20 xifres en total. Les 4 primeres corresponen al banc, les 4 seg√ºents a l'oficina. Tot seguit, hi ha 2 xifres de control. Finalment 10 xifres m√©s que representen el compte.

        BBBB-FFFF-CD-XXXXXXXXXX

Per calcular el primer d√≠git de control, s'utilitzen els n√∫meros corresponents al banc i l'oficina. Aix√≤ correspon al 9√® nombre de l'IBAN i l'anomenarem `digit1`. Tot seguit ve el segon d√≠git de control que es calcula amb les 10 √∫ltimes xifres, i anomenarem aquest nombre `digit2`.

        BBBB-FFFF -> C (digit1)
        XXXXXXXXXX -> D (digit2)

## D√≠git 1

Calcula el primer d√≠git de control d'un compte bancari, sabent que aquest es calcula de la seg√ºent manera:
Es multipliquen les xifres de l'entitat bancaria i l'oficina per $2^2$, $2^3$, ..., $2^{10}$ i se sumen els resultats (totes les operacions m√≤dul 11). Si anomenem aquesta suma $S$, seguidament es calcula $11-S$ i aix√≤ correspon a `digit1`, a excepci√≥ de si es tracta d'un 10 o un 11, que llavors s'agafa 1 i 0 respectivament.


Exemple: **BBBB-FFFF = 0004-3006**    

\begin{equation}
    \begin{cases}
      0 \cdot (2^2 \% 11) + 0 \cdot (2^3 \% 11) + 0 \cdot (2^4 \% 11) + 4 \cdot (2^5 \% 11) = 40\\
      3 \cdot (2^6 \% 11) + 0 \cdot (2^7 \% 11) + 0 \cdot (2^8 \% 11) + 6 \cdot (2^9 \% 11) = 27 + 36 = 63\\
    \end{cases}
    \quad \rightarrow \quad  (40 + 63) \% 11 = 4  \quad \rightarrow \quad  11 - 4 = 7  
\end{equation}
             
√âs a dir, el primer d√≠git de control √©s $C = 7$.

Escriu una funci√≥ `digit_control_1` que donada una string amb 8 xifres, retorni el primer d√≠git de control. Intenta fer en tots els passos les operacions amb els nombres m√©s petits possibles i sense fer servir l'operaci√≥ m√≤dul quan no sigui necessari. Per fer-ho, recorda que pots utilitzar aquesta propietat del m√≤dul:

\begin{equation}
    (n \cdot m + k \cdot l )(\mod a) = 
    \left [ (n \mod a) \cdot (m \mod a) + (k \mod a) \cdot (l \mod a) 
    \right ] (\mod a)
\end{equation}

In [83]:
def digit_control_1(num: str) -> int:
    '''
    Aquesta funci√≥ calcula el d√≠git de control corresponent a una entitat i oficina.

    Parameters
    ----------
    num: string amb 8 car√†cters corresponents a 8 enters

    Returns
    -------
    digit1: int
    '''
    s1 = 0; s2 = 0
    for i in range(0, 4):
        s1 += int(num[i]) * (2 ** (i + 2))
        s2 += int(num[i + 4]) * (2 ** (i + 6))

    digit: int = 11 - (s1 + s2) % 11
    if digit == 11: return 0
    elif digit == 10: return 1
    return digit

In [84]:
assert digit_control_1('00043006')==7
assert digit_control_1('21000813')==6
assert digit_control_1('21000014')==1
assert digit_control_1('30250014')==0

## D√≠git 2

Calcula el segon d√≠git de control, sabent que es fa de la seg√ºent manera:

Es multipliquen en ordre les 10 primeres xifres per $2^0, 2^1, 2^2, ..., 2^9$. Seguidament es calcula la seva suma m√≤dul 11. Finalment, aquest valor es resta d'onze i √©s el resultat. Tret si es tracta d'un 10 o un 11, en aquests casos es retorna 1 i 0 respectivament.

Exemple: **XXXXXXXXXX = 2100081367**

\begin{equation}
    2 \cdot (1 \% 11) + 1 \cdot (2 \% 11) + 0 \cdot (2^2 \% 11) + 0 \cdot (2^3 \% 11) + 0 \cdot (2^4 \% 11) 
    + 8 \cdot (2^5 \% 11) + 1 \cdot (2^6 \% 11) + 3 \cdot (2^7 \% 11) + 6 \cdot (2^8 \% 11) + 7 \cdot (2^9 \% 11) \\
     2 + 2 + 0 + 0 + 0 + 6 + 2 + 9 + 6 + 4 = 31  \quad \rightarrow \quad   31 \% 11 = 9 \quad \rightarrow \quad  11 - 9 = 2
\end{equation}

√âs a dir, el segon d√≠git de control √©s $D = 2$.

Escriu una funci√≥ `digit_control_2` que donada una string amb 10 xifres, retorni el segon d√≠git de control. Intenta fer en tots els passos les operacions amb els nombres m√©s petits possibles i sense fer servir l'operaci√≥ m√≤dul quan no sigui necessari.

In [93]:
def digit_control_2(num: str) -> int:
    '''
    Aquesta funci√≥ calcula el segon d√≠git de control corresponent a un n√∫mero de compte.

    Parameters
    ----------
    num: string amb 10 car√†cters corresponents a 10 enters

    Returns
    -------
    digit2: int
    '''
    s: int = 0
    for i in range(0, 10):
        s += int(num[i]) * (2 ** i)

    digit: int = 11 - s % 11
    if digit == 10: return 1
    elif digit == 11: return 0
    return digit

El raonament del cost seria similar a la funci√≥ anterior.

In [86]:
assert digit_control_2('2100081367') == 2
assert digit_control_2('0004300672') == 1
assert digit_control_2('2100001410') == 0
assert digit_control_2('3025001403') == 4

## Validesa
Ara fes una funci√≥ que donada una string corresponent a un IBAN (que pot venir amb espais per separar grups de xifres o no) retorni si el n√∫mero de compte √©s v√†lid o no.

In [94]:
def valid_IBAN(num):
    """
    Funci√≥ que donada una cadena amb un IBAN comprova si els d√≠gits de control s√≥n v√†lids.

    Parameters
    ----------
    num: cadena amb un n√∫mero de 20 d√≠gits corresponent a un IBAN

    Returns
    -------
    valid: boolean
    """
    num = num.replace(" ", "")
    return ((digit_control_1(num[:8]) == int(num[8])) and (digit_control_2(num[10:]) == int(num[9])))

Calcula la complexitat d'aquesta funci√≥.

In [None]:
Complexity of digit_control_1() = O(n)
Complexity of digit_control_2() = O(n)
Complexity total = O(n) + O(n) + O(n) = O(n)

In [95]:
assert valid_IBAN('0019 0020 9612 3456 7890') == True
assert valid_IBAN('3025 0001 15 1433277525') == True
assert valid_IBAN('2100 0813 6712 3456 7890') == False
assert valid_IBAN('2100 0813 67 1234567891') == False
assert valid_IBAN('2100 0813 6712 3456 7891') == False
assert valid_IBAN('00043006 72 2100081367') == True