# Ejercicio

El fichero [bank-loans.csv](https://aprendeconalf.es/docencia/python/examenes/inteligencia-negocios/soluciones/examen-2022-06-24/bank-loans.csv) contiene información sobre los préstamos de los clientes de un banco. Utilizando ficheros (sin usar la librería Pandas), crear una función que tenga como parámetros la url del fichero, el nombre de una columna cualitativa y un booleano para los porcentajes (False por defecto), que devuelva un diccionario con las frecuencias absolutas de las categorías de la columna indicada. Si se pasa True como argumento del parámetro para el porcentaje, la función debe devolver el diccionario de porcentajes de las categorías. 


**Ejemplo de ejecución**

Salida de la llamada a la función con la columna "education".

```sh
{'basic.4y': 1299, 'high.school': 2382, 'basic.6y': 761, 'basic.9y': 1820, 'professional.course': 1142, 'unknown': 485, 'university.degree': 2109, 'illiterate': 2}
```

Salida de la llamada a la función con la columna "housing" y porcentaje = `True`.

```sh
{'no': 51.88, 'yes': 45.24, 'unknown': 2.88}
```

# Solución

In [1]:
# Importamos las librerías
from urllib import request
from urllib.error import URLError

def frecuencias(url, columna, porcentaje = False):
    '''
    Función que calcula la tabla de frecuencias absoluta o relativa de una columna de un fichero csv.
    
    Parámetros:
        - url: Es una cadena con la url del fichero csv.
        - columna: Es una cadena con el nombre de la columna.
        - porcentaje: Es un booleano (False por defecto) que indica si las frecuencias son relativas o no.
    
    Salida:
        Un diccionario con las categorías de la columna y sus frecuencias.
    '''
    try:
        # Intentamos abrir el fichero a partir de su url.
        with request.urlopen(url) as f:
            # Leemos el contenido del fichero, lo decodificamos y creamos una lista partiendo el contenido por el carácter de cambio de linea.
            contenido = f.read().decode().split("\n")
    except URLError:
        # Si no existe el fichero en la url indicada controlamos el error y avisamos al usuario.
        print("La url", url, "no existe")
    else:
        # Creamos una lista con los encabezados dividiendo la primera línea por la coma. 
        encabezado = contenido.pop(0).split(",")
        # Obtenemos la posición de la columna indicada en la lista de encabezados.
        numcol = encabezado.index(columna)
        # Inicializamos un diccionario vacío para ir guardando los pares con las categorías y sus frecuencias.
        dic_frec = {}
        # Bucle iterativo para recorrer por valor las líneas del fichero.
        # i toma como valores las líneas del fichero.
        for i in contenido:
            # Obtenemos la clave dividiendo la línea por la coma y accediendo a la posición de la columna indicada.
            clave = i.split(",")[numcol]
            # Condicional para ver si la clave está ya en el diccionario.
            if clave in dic_frec:
                # Si la clave está ya en el diccionario incrementamos la frecuencia en 1.
                dic_frec[clave] += 1
            else:
                # Si la clave no está en el diccionario, añadimos un nuevo par con la clave y frecuencia 1.
                dic_frec[clave] = 1
        # Condicional para ver si se quieren relativas (porcentajes)
        if porcentaje:
            # Si se quieren porcentajes.
            # Calculamos el número de filas del fichero.
            total = len(contenido)
            # Bucle iterativo para recorrer el diccionario por clave y valor.
            for clave, valor in dic_frec.items():
                # Actualizamos la frecuencia del par dividiendo la frecuencia absoluta por el tamaño de la muestra y multiplicando por 100.
                dic_frec[clave] = dic_frec[clave] / total * 100
        # Devolvemos el diccionario con las frecuencias.
        return dic_frec

# Ejemplos      
print(frecuencias("https://aprendeconalf.es/docencia/python/examenes/inteligencia-negocios/soluciones/examen-2022-06-24/bank-loans.csv", "education"))
print(frecuencias("https://aprendeconalf.es/docencia/python/examenes/inteligencia-negocios/soluciones/examen-2022-06-24/bank-loans.csv", "housing", porcentaje = True))

{'basic.4y': 1299, 'high.school': 2382, 'basic.6y': 761, 'basic.9y': 1820, 'professional.course': 1142, 'unknown': 485, 'university.degree': 2109, 'illiterate': 2}
{'no': 51.88, 'yes': 45.24, 'unknown': 2.88}
