## **S5 Ejercicios: Ficheros**

# Ejercicio 3

El fichero cotizacion.csv contiene las cotizaciones de las empresas del IBEX35 con las siguientes columnas: Nombre (nombre de la empresa), Final (precio de la acción al cierre de bolsa), Máximo (precio máximo de la acción durante la jornada), Mínimo (precio mínimo de la acción durante la jornada), Volumen (Volumen al cierre de bolsa), Efectivo (capitalización al cierre en miles de euros).

Construir una función reciba el fichero de cotizaciones y devuelva un diccionario con los datos del fichero por columnas.

Construir una función que reciba el diccionario devuelto por la función anterior y cree un fichero en formato csv con el mínimo, el máximo y la media de cada columna.



In [3]:
import csv
import json
import re

In [25]:
def read_csv(path:str) -> list:
    """
        Lectura de un archivo con formato CSV, retorna los valores en forma de lista
    """
    f = open(path)
    data = f.readlines()
    f.close()
    
    return data
    
    
def preprocess(row:str) -> list: 
    """
        Preprocesamiento, tratamiento y limpieza de los datos
    """
    preprocess = row.replace("\n", "").split(";")
    new_data = []
    
    for line in preprocess:
        
        if re.match(r"\d+,\d+", line):
            new_data.append( float( line.replace(",", ".") ) )
        elif re.match(r"\d+.\d+", line):
            new_data.append( int( line.replace(".", "") ) )
        else: 
            new_data.append(line)
            
    return new_data


def mean(values:list) -> float:
    """
        Cálculo de la media de una lista de números
    """
    return round(sum(values)/len(values), 2)


def list_to_dict(data_csv:list) -> dict:
    """
        Convierte una lista en un diccionario
    """
    
    new_json = []
    
    for row in data_csv:
        
        data = {}
        
        data["minimo"] = row[3]
        data["maximo"] = row[2]
        data["media"] = mean([ data["minimo"], data["maximo"] ])
        
        new_json.append(data)
    
    return json.dumps(new_json)


def json_to_csv(data_json:list, path:str) -> None:
    """
        A partir de un arreglo de dirccionario, almacena los valores ne un archivo .csv
    """
    
    f = open(path, mode="w")
    writer = csv.writer(f)
    writer.writerow(["Mínimo", "Máximo", "Media"])
    
    data_json = json.loads(data_json)
    
    for line in data_json:
        writer.writerow([ line["minimo"], line["maximo"], line["media"] ])
        
    f.close()
    
    return True

In [26]:
if __name__ == "__main__":
    path = "dataset/cotizacion.csv"
    new_path = "dataset/nueva_cotizacion.csv"
    
    data_csv = [ preprocess(row) for row in read_csv(path)]
    data_csv.pop(0)
    
    data_json = list_to_dict(data_csv)
    json_to_csv(data_json, new_path)

In [18]:
data_csv

[['ACCIONA', 95.95, 96.75, 94.4, 84962, 8166.11],
 ['ACERINOX', 8668, 8672, 8468, 88599, 7633.81],
 ['ACS', 37.28, 37.66, 37.22, 655982, 24517.29],
 ['AENA', 167.1, 167.5, 166.1, 133738, 22336.1],
 ['AMADEUS', 69.96, 70.64, 69.56, 640476, 44795.47],
 ['ARCELORMIT.', 14152, 14318, 14.08, 702841, 9989.65],
 ['BA.SABADELL', 1.0165, 1033, 1.0165, 12358512, 12637.65],
 ['BA.SANTANDER', 4.02, 4.0675, 4.01, 36129692, 145765.44],
 ['BANKIA', 2249, 2262, 2224, 3024454, 6803.54],
 ['BANKINTER', 6.56, 6604, 6522, 1375976, 9030.2],
 ['BBVA', 5024, 5.05, 4969, 26447612, 132560.15],
 ['CAIXABANK', 2763, 2806, 2762, 13031097, 36239.22],
 ['CELLNEX', 30.17, 30.7, 30.17, 857237, 25965.29],
 ['CIE AUTOMOT.', 23.44, 23.74, 23.4, 99506, 2343.09],
 ['ENAGAS', 25.6, 25.66, 25.07, 84254, 21524.77],
 ['ENCE', 3882, 3974, 3846, 2099698, 8219.83],
 ['ENDESA', 22.95, 23.03, 22.62, 1236799, 28233.46],
 ['FERROVIAL', 21.61, 21.72, 21.38, 2065931, 44656.05],
 ['GRIFOLS CL.A', 23.3, 23.6, 23.27, 719503, 16787.55],
 

In [20]:
data_json

'[{"minimo": 94.4, "maximo": 96.75, "media": 95.58}, {"minimo": 8468, "maximo": 8672, "media": 8570.0}, {"minimo": 37.22, "maximo": 37.66, "media": 37.44}, {"minimo": 166.1, "maximo": 167.5, "media": 166.8}, {"minimo": 69.56, "maximo": 70.64, "media": 70.1}, {"minimo": 14.08, "maximo": 14318, "media": 7166.04}, {"minimo": 1.0165, "maximo": 1033, "media": 517.01}, {"minimo": 4.01, "maximo": 4.0675, "media": 4.04}, {"minimo": 2224, "maximo": 2262, "media": 2243.0}, {"minimo": 6522, "maximo": 6604, "media": 6563.0}, {"minimo": 4969, "maximo": 5.05, "media": 2487.03}, {"minimo": 2762, "maximo": 2806, "media": 2784.0}, {"minimo": 30.17, "maximo": 30.7, "media": 30.44}, {"minimo": 23.4, "maximo": 23.74, "media": 23.57}, {"minimo": 25.07, "maximo": 25.66, "media": 25.37}, {"minimo": 3846, "maximo": 3974, "media": 3910.0}, {"minimo": 22.62, "maximo": 23.03, "media": 22.83}, {"minimo": 21.38, "maximo": 21.72, "media": 21.55}, {"minimo": 23.27, "maximo": 23.6, "media": 23.44}, {"minimo": 5292, "