In [None]:
import pandas as pd
import os

In [None]:
# Funcion encargada de abrir y guardar cada hoja en una columna de dataframe
def load_excel_sheets(file_path, sheet_names):
    dataframes = {}
    for sheet_name in sheet_names:
        dataframes[sheet_name] = pd.read_excel(file_path, sheet_name=sheet_name)
    return dataframes

In [None]:
# Datos para implementacion de funcion load_excel_sheets
file_path = '../data/raw/Internet.xlsx'
sheet_names = [
    'Acc_vel_loc_sinrangos',
    'Velocidad_sin_Rangos',
    'Accesos_tecnologia_localidad',
    'Velocidad % por prov',
    'Totales VMD',
    'Totales Accesos Por Tecnología',
    'Accesos Por Tecnología',
    'Penetración-poblacion',
    'Penetracion-hogares',
    'Penetracion-totales',
    'Totales Accesos por velocidad',
    'Accesos por velocidad',
    'Dial-BAf',
    'Totales Dial-BAf',
    'Ingresos '
]

In [None]:
# Carga de DataFrames
dataframes = load_excel_sheets(file_path, sheet_names)

In [None]:
def save_dataframes(dataframes, output_folder, file_format='xlsx'):
    # Veo si la carpeta existe sino la creo 
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)
    
    for name, df in dataframes.items():
        # Define la ruta completa del archivo con la extensión apropiada
        file_path = f'{output_folder}/{name}.{file_format}'
        
        # Guarda en formato Excel o CSV según la extensión
        if file_format == 'xlsx':
            df.to_excel(file_path, index=False)
        elif file_format == 'csv':
            df.to_csv(file_path, index=False)
        else:
            print(f'Formato no soportado: {file_format}')
            continue
        
        print(f'Archivo {name} creado exitosamente')

save_dataframes(dataframes,'../data/raw/',file_format='csv')

# Limpiando Dataframes a Implementar

In [None]:
acc_tecno_df = pd.read_csv('../data/raw/Accesos por Tecnología.csv')
poblacion_df = pd.read_csv('../data/raw/Penetración-poblacion.csv')
hogares_df = pd.read_csv('../data/raw/Penetracion-hogares.csv')

In [None]:
acc_tecno_df.head()

In [None]:
acc_tecno_df.tail()

In [None]:
acc_tecno_df = acc_tecno_df[:-2]
acc_tecno_df

In [None]:
acc_tecno_df.iloc[:, 3:] = acc_tecno_df.iloc[:, 3:].applymap(lambda x: str(x).replace('.0', ''))
acc_tecno_df

In [None]:
acc_tecno_df.dtypes

In [None]:
columns_to_convert_accesos = acc_tecno_df.columns[3:]
acc_tecno_df[columns_to_convert_accesos] = acc_tecno_df[columns_to_convert_accesos].apply(pd.to_numeric, errors='coerce').astype('Int64')

In [None]:
acc_tecno_df

In [None]:
hogares_df.head(10)

In [None]:
hogares_df.tail(10)

In [None]:
hogares_df["Accesos por cada 100 hogares"] = hogares_df["Accesos por cada 100 hogares"].round(3)

In [None]:
hogares_df.tail()

In [None]:
hogares_df["Provincia"].unique()     

In [None]:
hogares_df[(hogares_df["Accesos por cada 100 hogares"] <= 120) & (hogares_df["Provincia"] == "Capital Federal")]

In [None]:
hogares_df[(hogares_df["Accesos por cada 100 hogares"] < 100)]["Accesos por cada 100 hogares"].quantile(0.25)

In [None]:
hogares_df.loc[hogares_df["Accesos por cada 100 hogares"] > 100, "Accesos por cada 100 hogares"] -= 32.58
hogares_df[hogares_df["Accesos por cada 100 hogares"] > 100]


In [None]:
poblacion_df.head()

In [None]:
poblacion_df.tail()

In [None]:
poblacion_df["Accesos por cada 100 hab"] = poblacion_df["Accesos por cada 100 hab"].round(2)
poblacion_df

In [None]:
poblacion_df.isnull().sum()

In [None]:
penetracion_total_df = pd.read_csv('../data/raw/Penetracion-totales.csv')

In [None]:
penetracion_total_df.head(10)

In [None]:
penetracion_total_df.tail(10)

In [None]:
penetracion_total_df[["Accesos por cada 100 hogares","Accesos por cada 100 hab"]] = penetracion_total_df[["Accesos por cada 100 hogares","Accesos por cada 100 hab"]] / 100
penetracion_total_df[["Accesos por cada 100 hogares","Accesos por cada 100 hab"]] = penetracion_total_df[["Accesos por cada 100 hogares","Accesos por cada 100 hab"]].round(3)

In [None]:
acc_tecno_df.to_csv('../data/processed/accesos_por_tecnologia_limpio.csv', index=False)
hogares_df.to_csv('../data/processed/penetracion-hogares-limpio.csv', index=False)
poblacion_df.to_csv('../data/processed/Penetración-poblacion-limpio.csv', index=False)
penetracion_total_df.to_csv('../data/processed/Penetracion-totales.csv',index=False)