# 📘 CityAI – Cerca de textos a les subvencions públiques

Aquest notebook utilitza dades obertes de l’Ajuntament de Barcelona per practicar conceptes d’algorísmica. En concret es treballaran els algorismes de cerca de text exacte i altres algorismes de manipulació de cadenes.

## 🧠 Objectius

Aprofundir en els algorismes vistos a teoria, i veure la seva aplicació en un cas real.

## ✍️ Exercici 1: LLegir les dades del fitxer i guardar-les en una llista

L'Ajuntament de Barcelona guarda i publica les dades de les subvencions que concedeix en un fitxer públic. Aquest fitxer té les següents dades:
+ L'entitat municipal que ha concedit la subvenció
+ L'any en què s'ha concedit la subvenció
+ La tipologia de subvenció
+ L'objecte de la subvenció
+ L'import sol.licitat

*Nota*: Hem reduit el fitxer i simplificat les dades per facilitar  treballar-hi. Per aixo treballarem amb el fitxer SubvencionsReduitNetejat.csv

Escriu una funció que llegeixi les dades de SubvencionsReduitNetejat.csv i les guardi en una llista de llistes.

In [None]:
# dades = [[Ajunta,any, tipo de subvenció,descripcion, subvencion],[],[]]

In [19]:
def llegir_dades(nom_fitxer:str)->list[list[any]]:
    """
    Aquesta funció llegeix les dades dels fitxers de subvencions de l'Ajuntament 
    de Barcelona i retorna una llista de llistes
    
    Parameters
    ----------
    nom_fitxer:str
    
    Returns
    -------
    dades: list[list[any]]
    """

In [21]:
# ✅ Asserts públics
dades = llegir_dades("SubvencionsReduitNetejat.csv")
assert(dades[5]==['Ajuntament de Barcelona', 2022, 'Convocatoria 2022 Impuls socioeconomic del territori IMPULSEM', 'L estiu Cooperatiu de Sant Marti', 400000])
assert(dades[159]==['Ajuntament de Barcelona', 2017, 'CONVOCATORIA GENERAL DE SUBVENCIONS 2017  SANT ANDREU', 'CULTURA INTERBARRIAL', 12000])

## ✍️ Exercici 2 – Subvencions d'un tema.

Hi ha alguna subvenció relacionada amb els gegants? (cerca exacta per Horspool)

Aplica l'algorisme de Horspool de teoria per buscar alguns temes específics dins dels objectes de  les subvencions. Els temes s'han de trobar tant si estan en majúscula com en minúscula.

Prova de trobar "gegant", "salud", "cultura", "teatre", "infancia"

Si els trobes retorna la fila de dades que els conté i destaca la seva aparació amb ** davant i ** darrera del text trobat.

Per ex. buscar_patro(dades,"gegant") ha de retornar (mira codi Markdown)
[['Ajuntament de Barcelona',
  2019,
  'CONVOCATORIA GENERAL DE SUBVENCIONS 2019. HORTA GUINARDO',
  'Una **gegant**a  Carmela  i els seus cap grossos.',
  46700]]

Pots trobar una explicació detallada de l'algoritme de Hoorspol en aquest vídeo:  
https://www.youtube.com/watch?v=PHXAOKQk2dw  
(també anomenat algoritme de Boyer–Moore–Horspool, ja que és una simplificació de l'algoritme de Boyer-Moore).

In [22]:
def BoyerMooreHorspool(patro:str, text:str)->int:
      

In [26]:
buscar_patro(dades,"gegant")

[['Ajuntament de Barcelona',
  2019,
  'CONVOCATORIA GENERAL DE SUBVENCIONS 2019  HORTA GUINARDO',
  'Una **gegant**a  Carmela  i els seus cap grossos ',
  46700]]

In [27]:
# ✅ Asserts públics
assert(buscar_patro(dades,"infancia")) == [['Ajuntament de Barcelona',
  2017,
  'AJUTS',
  'Ajut del programa Promocio i participacio **infancia**',
  52290],
 ['Ajuntament de Barcelona',
  2017,
  'AJUTS',
  'Ajut del programa Promocio i participacio **infancia**',
  53070],
 ['Ajuntament de Barcelona',
  2018,
  'AJUTS',
  'Ajut del programa Promocio i participacio **infancia**',
  47850],
 ['Ajuntament de Barcelona',
  2017,
  'AJUTS',
  'Ajut del programa Promocio i participacio **infancia**',
  3960]]

## ✍️ Exercici 3 – Abreviació d'entitats.

Hi ha tantes subvencions que l'ajuntament ha decidit guardar els noms de les entitats que concedeixen els ajuts de forma abreujada, guardant només les seves inicials. Per exemple: Institut Municipal Barcelona Esports es guardarà com IMBE

Escriu una funció que a partir d'una frase sense punts, comes, accents, números ni cap signe de puntuació, imprimeixi l'acrònim corresponent.

In [31]:
def acronim(frase):
    """
    Aquesta funció retorna l'acrònim d'una frase.
    
    Parameters
    ----------
    frase: string
    
    Returns
    -------
    acronim: string
    """
    return acronim

In [33]:
# ✅ Asserts públics
assert(acronim("Institut Municipal Barcelona Esports")) == "IMBE"
assert(acronim2("Institut Municipal Barcelona Esports")) == "IMBE"

## ✍️ Exercici 4 – Alfabet d'aviació

Com que ara hi ha tantes sigles, sovint hi ha confusions per telèfon, i els responsables de l'ajuntament han adoptat l'alfabet de l'aviació per a comunicar-se.

Alfabet d'aviació:
|   |   |   |   |   |
|---|---|---|---|---|
| A | B | C | D | E |
| Alpha | Bravo | Charlie | Delta | Echo |
| F | G | H | I | J |
| Foxtrot | Golf | Hotel | India | Juliet |
| K | L | M | N | O |
| Kilo | Lima | Mike | November | Oscar |
| P | Q | R | S | T |
| Papa | Quebec | Romeo | Sierra | Tango |
| U | V | W | X | Y |
| Uniform | Victor | Whiskey | X-ray | Yankee |
| Z |   |   |   |   |
| Zulu |   |   |   |   |

Escriu una funció que, usant un diccionari, converteixi una cadena de lletres a l'alfabet d'aviació, generant una llista de sortida.

Per exemple: IMBE generarà la llista [India, Mike, Bravo, Echo]

In [None]:
def aviacio(cadena):
    """
    Aquesta funció converteix una cadena d'entrada a l'alfabet fonètic.
    
    Parameters
    ----------
    cadena: string
    
    Returns
    -------
    traduccio: string
    """
    alfabet_fonetica = {
        'A': 'Alfa', 'B': 'Bravo', 'C': 'Charlie', 'D': 'Delta',
        'E': 'Echo', 'F': 'Foxtrot', 'G': 'Golf', 'H': 'Hotel',
        'I': 'India', 'J': 'Juliett', 'K': 'Kilo', 'L': 'Lima',
        'M': 'Mike', 'N': 'November', 'O': 'Oscar', 'P': 'Papa',
        'Q': 'Quebec', 'R': 'Romeo', 'S': 'Sierra', 'T': 'Tango',
        'U': 'Uniform', 'V': 'Victor', 'W': 'Whiskey', 'X': 'X-ray',
        'Y': 'Yankee', 'Z': 'Zulu',
        '0': 'Zero', '1': 'One', '2': 'Two', '3': 'Three',
        '4': 'Four', '5': 'Five', '6': 'Six', '7': 'Seven', '8': 'Eight', '9': 'Nine',
        ' ': 'Space', '.': 'Stop', ',': 'Comma'
    }   

    traduccio = ""
    for lletra in cadena:
        if lletra in alfabet_fonetica:
            traduccio += alfabet_fonetica[lletra] + " "
        else:
            traduccio += lletra + " "
    return traduccio

In [37]:
# ✅ Asserts públics
assert aviacio('YtH') == ['Yankee', 'Tango', 'Hotel']