## Resumen de las acciones realizadas

1. **Verificación de archivos defectuosos**: Creamos una función en Python que exploró una carpeta con archivos CSV en busca de la columna "total" llena de ceros. Los nombres de los archivos defectuosos se guardaron en un archivo CSV llamado 'defectuosos.csv'.

2. **Edición de archivos defectuosos**: Desarrollamos una segunda función que leyó 'defectuosos.csv' y reemplazó los valores de la columna 'total' con los valores de la antepenúltima columna en los archivos defectuosos. Luego, los archivos editados se guardaron en la misma carpeta de destino.

3. **Resultados de la verificación**: Las siguientes tablas estaban completamente vacías, llenas de ceros:
   - 2008_diagnostic-suspicion_diphtheria.csv
   - 2009_diagnostic-suspicion_diphtheria.csv
   - 2015_diagnostic-suspicion_bolivian-hemorrhagic-fever.csv
   - 2020_diagnostic-suspicion_diphtheria.csv

Estas tablas vacías se eliminaron del conjunto de tablas finales, ya que así se descargaron originalmente.


In [1]:
import os
import pandas as pd


In [11]:
def verificar_defectuosos(carpeta_origen, carpeta_destino):
    archivos_defectuosos = []

    # Obtener la lista de archivos en la carpeta de origen
    archivos_en_carpeta = os.listdir(carpeta_origen)

    for archivo in archivos_en_carpeta:
        if archivo.endswith('.csv'):
            ruta_archivo = os.path.join(carpeta_origen, archivo)
            
            # Leer el archivo CSV
            df = pd.read_csv(ruta_archivo)
            
            # Verificar si la columna "total" está llena de ceros
            if (df['total'] == 0).all():
                archivos_defectuosos.append(archivo)

    # Guardar los nombres de los archivos defectuosos en un CSV
    if archivos_defectuosos:
        df_defectuosos = pd.DataFrame({'archivos_defectuosos': archivos_defectuosos})
        df_defectuosos.to_csv(os.path.join(carpeta_destino, 'defectuosos.csv'), index=False)
    else:
        print("No se encontraron archivos con la columna 'total' llena de ceros.")

# Llamamos a la función con las carpetas de origen y destino
carpeta_origen = 'C:/Users/USER/Documents/falta_2001_2004/esp_datostablas_0104'
carpeta_destino = 'C:/Users/USER/Documents/table_year/tab_cero'


In [12]:
verificar_defectuosos(carpeta_origen, carpeta_destino)


No se encontraron archivos con la columna 'total' llena de ceros.


In [4]:
muestra= pd.read_csv('C:/Users/USER/Documents/table_year/esp_data_comp/2005_tuberculosis-y-lepra_tuberculosis-pulmonar-baar-negativo-nuevos.csv')
muestra

Unnamed: 0,DEPARTAMENTO,codigo_municipio,municipio,grupo,variable,year,hombres menores a 1 año,mujeres menores a 1 año,hombres de 1 a 4 años,mujeres de 1 a 4 años,hombres de 5 a 14 años,mujeres de 5 a 14 años,hombres de 15 a 59 años,mujeres de 15 a 59 años,hombres de 60 y más años,mujeres de 60 y más años,hombres total,mujeres total,total
0,CHUQUISACA,10101,SUCRE,tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,9,0,50,0,35,0,18,0,1,0,113,0,0
1,CHUQUISACA,10102,YOTALA,tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,0,0,0,0,1,0,0,0,0,0,1,0,0
2,CHUQUISACA,10103,POROMA,tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,0,0,0,0,0,0,0,0,0,0,0,0,0
3,CHUQUISACA,10201,AZURDUY,tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,0,0,0,0,0,0,0,0,0,0,0,0,0
4,CHUQUISACA,10202,TARVITA,tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,0,0,0,0,0,0,0,0,0,0,0,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
338,PANDO,90401,NACEBE (SANTA ROSA DEL ABUNA),tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,0,0,0,0,0,0,0,0,0,0,0,0,0
339,PANDO,90402,INGAVI (HUMAITA),tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,0,0,0,0,0,0,0,0,0,0,0,0,0
340,PANDO,90501,NUEVO MANOA (NUEVA ESPERANZA),tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,0,0,0,0,0,0,0,0,0,0,0,0,0
341,PANDO,90502,VILLA NUEVA (LOMA ALTA),tuberculosis y lepra,tuberculosis pulmonar baar negativo nuevos,2005,0,0,0,0,0,0,0,0,0,0,0,0,0


In [5]:


def editar_csv_defectuosos(carpeta_origen, carpeta_destino):
    # Leer el archivo 'defectuosos.csv' para obtener los nombres de los archivos defectuosos
    defectuosos_csv = os.path.join(carpeta_destino, 'defectuosos.csv')
    df_defectuosos = pd.read_csv(defectuosos_csv)
    
    # Iterar a través de los archivos defectuosos y editarlos
    for archivo_defectuoso in df_defectuosos['archivos_defectuosos']:
        ruta_archivo = os.path.join(carpeta_origen, archivo_defectuoso)
        
        # Leer el archivo CSV
        df = pd.read_csv(ruta_archivo)
        
        # Reemplazar los valores de la columna 'total' con los de la antepenúltima columna
        antepenultima_columna = df.iloc[:, -3]
        df['total'] = antepenultima_columna
        
        # Guardar el archivo editado en la carpeta de destino
        ruta_archivo_destino = os.path.join(carpeta_destino, archivo_defectuoso)
        df.to_csv(ruta_archivo_destino, index=False)



In [6]:
editar_csv_defectuosos(carpeta_origen, carpeta_destino)


In [7]:
corregido= pd.read_csv('C:/Users/USER/Documents/table_year/tab_cero/2005_otras-infecciones_malaria.csv')
corregido

Unnamed: 0,DEPARTAMENTO,codigo_municipio,municipio,grupo,variable,year,hombres menores a 1 año,mujeres menores a 1 año,hombres de 1 a 4 años,mujeres de 1 a 4 años,hombres de 5 a 14 años,mujeres de 5 a 14 años,hombres de 15 a 59 años,mujeres de 15 a 59 años,hombres de 60 y más años,mujeres de 60 y más años,hombres total,mujeres total,total
0,CHUQUISACA,10101,SUCRE,otras infecciones,malaria,2005,0,0,1,0,2,0,25,0,0,0,28,0,28
1,CHUQUISACA,10102,YOTALA,otras infecciones,malaria,2005,0,0,0,0,1,0,0,0,0,0,1,0,1
2,CHUQUISACA,10103,POROMA,otras infecciones,malaria,2005,1,0,3,0,16,0,58,0,8,0,86,0,86
3,CHUQUISACA,10201,AZURDUY,otras infecciones,malaria,2005,8,0,26,0,80,0,107,0,7,0,228,0,228
4,CHUQUISACA,10202,TARVITA,otras infecciones,malaria,2005,0,0,4,0,27,0,81,0,12,0,124,0,124
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
338,PANDO,90401,NACEBE (SANTA ROSA DEL ABUNA),otras infecciones,malaria,2005,2,0,6,0,19,0,101,0,1,0,129,0,129
339,PANDO,90402,INGAVI (HUMAITA),otras infecciones,malaria,2005,10,0,41,0,76,0,76,0,4,0,207,0,207
340,PANDO,90501,NUEVO MANOA (NUEVA ESPERANZA),otras infecciones,malaria,2005,5,0,20,0,97,0,215,0,13,0,350,0,350
341,PANDO,90502,VILLA NUEVA (LOMA ALTA),otras infecciones,malaria,2005,3,0,15,0,44,0,132,0,2,0,196,0,196
