# Exercici

El fitxer [`cotizacion.csv`](cotizacion.csv) conté les cotitzacions de les empreses de l’IBEX35 amb les columnes següents: `nom` (nom de l’empresa), `Final` (preu de l’acció al tancament de la borsa), `Màxim` (preu màxim de l’acció durant la jornada), `Mínim` (preu mínim de l’acció durant la jornada), `volum` (volum al tancament de la borsa) i `Efectiu` (capitalització al tancament en milers d’euros). Construeix una funció que construeixi un DataFrame a partir d’un fitxer amb el format anterior i retorni un altre DataFrame amb el mínim, el màxim i la mitjana de cada columna.

In [23]:
import pandas as pd
import numpy as np
# Leer el archivo CSV con los datos del IBEX 35 
ibex_35 = pd.read_csv("cotizacion.csv", sep=";", header=0, names=["Nombre", "Final", "Maximo", "Minimo", "Volumen", "Efectivo"])

ibex_35.dropna(inplace=True)


# Convertir las columnas numéricas a tipo float (excepto Volumen que requiere un tratamiento especial)
for col in ["Final", "Maximo", "Minimo", "Efectivo"]:
    # elimina separadores de miles representados con '.' y convierte decimales con ',' a '.'
    ibex_35[col] = ibex_35[col].astype(str).str.replace('.', '', regex=False)
    ibex_35[col] = ibex_35[col].str.replace(',', '.', regex=False)
    ibex_35[col] = pd.to_numeric(ibex_35[col], errors='coerce')

# Volumen: puede usar '.' tanto como separador de miles como separador decimal.
# Regla aplicada:
# - Si hay más de un punto, se consideran separadores de miles y se eliminan todos.
# - Si hay un solo punto y hay exactamente 3 dígitos a la derecha: tratamos el punto como separador de miles y lo eliminamos.
# - En otro caso, consideramos el punto como separador decimal y lo mantenemos.
# También manejamos comas por si aparecen como separador decimal en algún registro.

def parse_volumen(s):
    # contar puntos
    contador_puntos = s.count('.')
    if contador_puntos > 1:
        # múltiples puntos -> son separadores de miles
        s = s.replace('.', '')
        return pd.to_numeric(s, errors='coerce')
    elif contador_puntos == 1:
        izquierda, derecha = s.split('.')
        # si hay exactamente 3 dígitos a la derecha, es muy probable que sea separador de miles (ej: '1.054')
        if len(derecha) == 3:
            s = s.replace('.', '')
            return pd.to_numeric(s, errors='coerce')
        else:
            # tratamos el punto como decimal
            return pd.to_numeric(s, errors='coerce')
    else:
        return pd.to_numeric(s, errors='coerce')

ibex_35['Volumen'] = ibex_35['Volumen'].apply(parse_volumen)

ibex_35

# crear el nuevo dataframe con los datos procesados

def ibex_35_procesado(df = ibex_35):
    df_procesado = pd.DataFrame()
    df_procesado["med_final"] = [df["Final"].mean()]
    df_procesado["med_maximo"] = [df["Maximo"].mean()]
    df_procesado["med_minimo"] = [df["Minimo"].mean()]
    df_procesado["med_volumen"] = [df["Volumen"].mean()]
    df_procesado["med_efectivo"] = [df["Efectivo"].mean()]
    df_procesado["min_final"] = [df["Final"].min()]
    df_procesado["min_maximo"] = [df["Maximo"].min()]
    df_procesado["min_minimo"] = [df["Minimo"].min()]
    df_procesado["min_volumen"] = [df["Volumen"].min()]
    df_procesado["min_efectivo"] = [df["Efectivo"].min()]
    df_procesado["max_final"] = [df["Final"].max()]
    df_procesado["max_maximo"] = [df["Maximo"].max()]
    df_procesado["max_minimo"] = [df["Minimo"].max()]
    df_procesado["max_volumen"] = [df["Volumen"].max()]
    df_procesado["max_efectivo"] = [df["Efectivo"].max()]
    return df_procesado

# ejecutar la función para mostrar el resultado

df_procesado = ibex_35_procesado()
df_procesado

Unnamed: 0,med_final,med_maximo,med_minimo,med_volumen,med_efectivo,min_final,min_maximo,min_minimo,min_volumen,min_efectivo,max_final,max_maximo,max_minimo,max_volumen,max_efectivo
0,2796.768757,3170.113357,3136.510471,4244699.046,31767.778,1.0165,4.0675,1.0165,67.71,2343.09,19705.0,19875.0,19675.0,36129692.0,145765.44
