In [1]:
import os
import pandas as pd

In [2]:
# Especificar la ruta del archivo Excel
ruta_excel = '../data/Internet.xlsx'

# Función para convertir cada hoja del Excel a CSV sin modificar
def convertir_excel_a_csv(ruta_excel):
    hojas = pd.ExcelFile(ruta_excel)
    directorio = os.path.dirname(ruta_excel)

    # Recorrer cada hoja del Excel
    for hoja in hojas.sheet_names:
        dataframe = hojas.parse(hoja)
        ruta_csv = os.path.join(directorio, f"{hoja}.csv")

        # Guardar la hoja como CSV
        dataframe.to_csv(ruta_csv, index=False, encoding='utf-8')
        print(f"Hoja convertida a CSV sin modificar: {ruta_csv}")


In [3]:
# Función para limpiar los datos y sobrescribir los CSV iniciales
def limpiar_y_guardar_datos(ruta_excel):
    hojas = pd.ExcelFile(ruta_excel)
    directorio = os.path.dirname(ruta_excel)

    # Recorrer cada hoja del Excel
    for hoja in hojas.sheet_names:
        dataframe = hojas.parse(hoja)

        # Procesamiento específico (limpieza de datos)
        if 'Año' in dataframe.columns:
            dataframe['Año'] = (
                dataframe['Año']
                .astype(str)
                .str.replace('*', '', regex=False)
                .str.strip()
            )
        if 'Trimestre' in dataframe.columns:
            dataframe['Trimestre'] = (
                dataframe['Trimestre']
                .astype(str)
                .str.replace('*', '', regex=False)
                .str.strip()
            )
        # Eliminar filas con más del 80% de columnas nulas
        threshold = len(dataframe.columns) * 0.8
        dataframe = dataframe.dropna(thresh=threshold)

        # Convertir la columna 'Año' a enteros si no tiene valores NaN
        if 'Año' in dataframe.columns:
            dataframe.loc[:, 'Año'] = dataframe['Año'].dropna().astype(int)

        # Procesar DataFrame según nombres específicos
        if hoja == 'dial_BAf':
            dataframe = dataframe[dataframe['Trimestre'] == 1]

        # Sobrescribir el archivo CSV inicial con los datos procesados
        ruta_csv = os.path.join(directorio, f"{hoja}.csv")
        dataframe.to_csv(ruta_csv, index=False, encoding='utf-8')
        print(f"Datos procesados y sobrescritos en: {ruta_csv}")

In [4]:
# Paso 1: Convertir Excel a CSV sin modificaciones
convertir_excel_a_csv(ruta_excel)


Hoja convertida a CSV sin modificar: ../data\Acc_vel_loc_sinrangos.csv
Hoja convertida a CSV sin modificar: ../data\Velocidad_sin_Rangos.csv
Hoja convertida a CSV sin modificar: ../data\Accesos_tecnologia_localidad.csv
Hoja convertida a CSV sin modificar: ../data\Velocidad % por prov.csv
Hoja convertida a CSV sin modificar: ../data\Totales VMD.csv
Hoja convertida a CSV sin modificar: ../data\Totales Accesos Por Tecnología.csv
Hoja convertida a CSV sin modificar: ../data\Accesos Por Tecnología.csv
Hoja convertida a CSV sin modificar: ../data\Penetración-poblacion.csv
Hoja convertida a CSV sin modificar: ../data\Penetracion-hogares.csv
Hoja convertida a CSV sin modificar: ../data\Penetracion-totales.csv
Hoja convertida a CSV sin modificar: ../data\Totales Accesos por rango.csv
Hoja convertida a CSV sin modificar: ../data\Accesos por rangos.csv
Hoja convertida a CSV sin modificar: ../data\Dial-BAf.csv
Hoja convertida a CSV sin modificar: ../data\Totales Dial-BAf.csv
Hoja convertida a CSV 

In [5]:
# Paso 2: Limpiar datos y sobrescribir los CSV iniciales
limpiar_y_guardar_datos(ruta_excel)

Datos procesados y sobrescritos en: ../data\Acc_vel_loc_sinrangos.csv
Datos procesados y sobrescritos en: ../data\Velocidad_sin_Rangos.csv
Datos procesados y sobrescritos en: ../data\Accesos_tecnologia_localidad.csv
Datos procesados y sobrescritos en: ../data\Velocidad % por prov.csv
Datos procesados y sobrescritos en: ../data\Totales VMD.csv
Datos procesados y sobrescritos en: ../data\Totales Accesos Por Tecnología.csv
Datos procesados y sobrescritos en: ../data\Accesos Por Tecnología.csv
Datos procesados y sobrescritos en: ../data\Penetración-poblacion.csv
Datos procesados y sobrescritos en: ../data\Penetracion-hogares.csv
Datos procesados y sobrescritos en: ../data\Penetracion-totales.csv
Datos procesados y sobrescritos en: ../data\Totales Accesos por rango.csv
Datos procesados y sobrescritos en: ../data\Accesos por rangos.csv
Datos procesados y sobrescritos en: ../data\Dial-BAf.csv
Datos procesados y sobrescritos en: ../data\Totales Dial-BAf.csv
Datos procesados y sobrescritos en: 