# Análisis de Datos para Tablero de Power BI - Valle del Cauca

Este notebook analiza los datos de proyecciones de población e indicadores de pobreza para el departamento del Valle del Cauca, preparando la información necesaria para un tablero en Power BI.

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os
import numpy as np

# Configurar visualización
plt.style.use('seaborn-v0_8-whitegrid')
sns.set(font_scale=1.2)
pd.set_option('display.max_columns', None)

## 1. Definir el Departamento a Analizar

Para este proyecto, nos enfocaremos específicamente en el departamento del Valle del Cauca.

In [2]:
# Definir el departamento a analizar
assigned_department = "Valle del Cauca"
print(f"Preparando análisis para el departamento: {assigned_department}")

# Crear directorio para almacenar los datos procesados si no existe
current_dir = os.getcwd()
output_dir = os.path.join(current_dir, 'datos_valle')
if not os.path.exists(output_dir):
    os.makedirs(output_dir)
    print(f"Directorio creado: {output_dir}")

# Crear directorio para visualizaciones
vis_dir = os.path.join(current_dir, 'visualizaciones_valle')
if not os.path.exists(vis_dir):
    os.makedirs(vis_dir)
    print(f"Directorio creado: {vis_dir}")

Preparando análisis para el departamento: Valle del Cauca
Directorio creado: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle
Directorio creado: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\visualizaciones_valle


## 2. Cargar los Datos

Cargaremos los tres archivos de Excel disponibles para su análisis.

In [3]:
# Definir rutas a los archivos
file_pob = os.path.join(current_dir, 'anex-DCD-Proypoblacion-PerteneniaEtnicoRacialmun.xlsx')
file_pm = os.path.join(current_dir, 'anex-PM-Departamental-2023.xlsx')
file_pmd = os.path.join(current_dir, 'anex-PMultidimensional-Departamental-2024.xlsx')

print(f"Archivos a cargar:\n{file_pob}\n{file_pm}\n{file_pmd}")

Archivos a cargar:
C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\anex-DCD-Proypoblacion-PerteneniaEtnicoRacialmun.xlsx
C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\anex-PM-Departamental-2023.xlsx
C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\anex-PMultidimensional-Departamental-2024.xlsx


In [4]:
# Función auxiliar para mostrar las hojas de un archivo Excel
def show_excel_sheets(file_path):
    try:
        xl = pd.ExcelFile(file_path)
        print(f"Hojas en {os.path.basename(file_path)}:")
        for sheet in xl.sheet_names:
            print(f"  - {sheet}")
        return xl.sheet_names
    except Exception as e:
        print(f"Error al leer {file_path}: {e}")
        return None

# Ver hojas disponibles en cada archivo
sheets_pob = show_excel_sheets(file_pob)
sheets_pm = show_excel_sheets(file_pm)
sheets_pmd = show_excel_sheets(file_pmd)

Hojas en anex-DCD-Proypoblacion-PerteneniaEtnicoRacialmun.xlsx:
  - Municipal
Hojas en anex-PM-Departamental-2023.xlsx:
  - Índice
  - IP Act.Met.
  - IPE Act.Met.
  - IC_IP Act.Met.
  - IC_IPE Act.Met.
  - AP Act.Met.
  - APE Act.Met.
  - Gini
  - IPUG
  - LP Act.Met.
  - LPE Act.Met.
  - BP Act.Met.
  - BPE Act.Met.
  - SP Act.Met.
  - SPE Act.Met.
  - IP_Sexo Act.Met.
  - IPE_Sexo Act.Met.


Hojas en anex-PMultidimensional-Departamental-2024.xlsx:
  - Índice
  - IPM_Regiones
  - IPM_Departamentos
  - IPM_Variables_Región
  - IPM_Variables_Departamento 
  - IC_IPM
  - Intensidad_IPM
  - Incidencia_Ajustada_IPM
  - Contribuciones IA_IPM
  - IPM_Sexo
  - IC_IPM_Sexo
  - IPM_Sexo Jefe
  - IC_IPM_Sexo Jefe 


## 3. Procesamiento de Datos de Pobreza Monetaria

In [5]:
# Función para cargar los indicadores
def load_poverty_indicators(file_path, sheet_names):
    indicators = {}
    for sheet in sheet_names:
        if sheet != 'Índice':  # Omitir la hoja de índice
            try:
                # Cargar cada hoja y guardarla en un diccionario
                df = pd.read_excel(file_path, sheet_name=sheet, skiprows=5)
                # Limpiar el dataframe
                df = df.dropna(how='all').dropna(how='all', axis=1)
                indicators[sheet] = df
                print(f"Cargado {sheet} con forma {df.shape}")
            except Exception as e:
                print(f"Error al cargar {sheet}: {e}")
    return indicators

# Cargar indicadores de pobreza monetaria
pm_indicators = load_poverty_indicators(file_pm, sheets_pm)

# Mostrar un ejemplo para verificar
if pm_indicators and len(pm_indicators) > 0:
    example_key = list(pm_indicators.keys())[0]
    print(f"\nEjemplo de datos para {example_key}:")
    display(pm_indicators[example_key].head())

Cargado IP Act.Met. con forma (35, 4)


Cargado IPE Act.Met. con forma (35, 4)


Cargado IC_IP Act.Met. con forma (36, 16)


Cargado IC_IPE Act.Met. con forma (36, 16)


Cargado AP Act.Met. con forma (35, 4)


Cargado APE Act.Met. con forma (35, 4)


Cargado Gini con forma (34, 4)


Cargado IPUG con forma (35, 4)


Cargado LP Act.Met. con forma (35, 4)


Cargado LPE Act.Met. con forma (35, 4)


Cargado BP Act.Met. con forma (35, 4)
Cargado BPE Act.Met. con forma (35, 4)


Cargado SP Act.Met. con forma (35, 4)
Cargado SPE Act.Met. con forma (35, 4)


Cargado IP_Sexo Act.Met. con forma (35, 7)
Cargado IPE_Sexo Act.Met. con forma (35, 7)

Ejemplo de datos para IP Act.Met.:


Unnamed: 0,Incidencia de la Pobreza Monetaria,Unnamed: 1,Unnamed: 2,Unnamed: 3
0,Incidencia de la Pobreza Monetaria\n23 Departa...,,,
6,Cifras en Porcentaje,,,
7,Departamento,Año,,
8,,2021,2022.0,2023.0
9,Antioquia,32.8,28.8,26.4


In [6]:
# Cargar indicadores de pobreza multidimensional
pmd_indicators = load_poverty_indicators(file_pmd, sheets_pmd)

# Mostrar un ejemplo para verificar
if pmd_indicators and len(pmd_indicators) > 0:
    example_key = list(pmd_indicators.keys())[0]
    print(f"\nEjemplo de datos para {example_key}:")
    display(pmd_indicators[example_key].head())

Cargado IPM_Regiones con forma (16, 22)
Cargado IPM_Departamentos con forma (42, 22)


Cargado IPM_Variables_Región con forma (115, 9)


Cargado IPM_Variables_Departamento  con forma (633, 23)


Cargado IC_IPM con forma (740, 31)


Cargado Intensidad_IPM con forma (41, 8)


Cargado Incidencia_Ajustada_IPM con forma (41, 8)


Cargado Contribuciones IA_IPM con forma (269, 8)


Cargado IPM_Sexo con forma (42, 15)


Cargado IC_IPM_Sexo con forma (44, 71)
Cargado IPM_Sexo Jefe con forma (42, 15)


Cargado IC_IPM_Sexo Jefe  con forma (45, 71)

Ejemplo de datos para IPM_Regiones:


Unnamed: 0,Incidencia de Pobreza Multidimensional\nRegiones\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14,Unnamed: 15,Unnamed: 16,Unnamed: 17,Unnamed: 18,Unnamed: 19,Unnamed: 20,Unnamed: 21
4,Cifras en porcentaje,,,,,,,,,,,,,,,,,,,,,
5,Región,2018,,,2019,,,2020**,,,2021***,,,2022,,,2023,,,2024,,
6,,Total,Cabeceras,Centros poblados \ny rural disperso,Total,Cabeceras,Centros poblados \ny rural disperso,Total,Cabeceras,Centros poblados \ny rural disperso,Total,Cabeceras,Centros poblados \ny rural disperso,Total,Cabeceras,Centros poblados \ny rural disperso,Total,Cabeceras,Centros poblados \ny rural disperso,Total,Cabeceras,Centros poblados \ny rural disperso
7,Caribe,32.9,24.9,53.292182,28.1,20.1,48.7,28.7,20.6,49.8,26.8,19.6,45.3,21.4,14.1,39.9,20.1,14,35.5,18.5,11.9,35
8,Oriental,15.7,11.3,27.338821,15.2,11.6,25.2,14.5,10.7,25.2,13.7,10.5,23,10.7,8,18.5,11.1,9.1,17.3,8.8,6.4,16.1


## 4. Procesamiento de Datos de Población

In [7]:
# Cargar datos de población
try:
    # Intentar cargar los datos de población ajustando skiprows para encontrar la estructura correcta
    df_pob = pd.read_excel(file_pob, skiprows=10)
    
    # Renombrar columnas si es necesario
    if 'Unnamed: 0' in df_pob.columns:
        column_mapping = {
            'Unnamed: 0': 'COD_DPTO',
            'Unnamed: 1': 'DEPARTAMENTO',
            'Unnamed: 2': 'COD_MPIO',
            'Unnamed: 3': 'MUNICIPIO',
            'Unnamed: 4': 'AÑO',
            'Unnamed: 5': 'ÁREA GEOGRÁFICA',
            'Unnamed: 6': 'Total',
            'Unnamed: 7': 'Indígena',
            'Unnamed: 8': 'Gitano(a) o Rrom',
            'Unnamed: 9': 'Raizal del Archipiélago de San Andrés, Providencia y Santa Catalina',
            'Unnamed: 10': 'Palenquero(a) de San Basilio',
            'Unnamed: 11': 'Negro(a), mulato(a), afrodescendiente, afrocolombiano(a)',
            'Unnamed: 12': 'Ningún grupo étnico-racial'
        }
        df_pob = df_pob.rename(columns=column_mapping)
    
    # Mostrar las primeras filas
    print("Datos de población:")
    display(df_pob.head())
    
    # Buscar el Valle del Cauca en los datos
    dept_columns = [col for col in df_pob.columns if 'DEPART' in str(col).upper()]
    if dept_columns:
        dept_col = dept_columns[0]
        # Mostrar valores únicos
        unique_depts = df_pob[dept_col].dropna().unique()
        print(f"\nDepartamentos en datos de población: {len(unique_depts)}")
        for dept in sorted(unique_depts)[:10]:  # Mostrar solo los primeros 10
            print(f"- {dept}")
        print("...")
        
        # Buscar específicamente Valle del Cauca
        valle_options = [dept for dept in unique_depts if 'VALLE' in str(dept).upper()]
        if valle_options:
            print(f"\nOpciones para Valle del Cauca: {valle_options}")
except Exception as e:
    print(f"Error al cargar datos de población: {e}")

Datos de población:


Unnamed: 0,05,Antioquia,05001,Medellín,2020,Total,2519592,2228,52,338,68,63549,2453357
0,5,Antioquia,5001,Medellín,2021,Cabecera Municipal,2506656,2216,52,341,68,64053,2439926
1,5,Antioquia,5001,Medellín,2021,Centros Poblados y Rural Disperso,42352,39,0,1,1,261,42050
2,5,Antioquia,5001,Medellín,2021,Total,2549008,2255,52,342,69,64314,2481976
3,5,Antioquia,5001,Medellín,2022,Cabecera Municipal,2530398,2237,53,344,68,64660,2463036
4,5,Antioquia,5001,Medellín,2022,Centros Poblados y Rural Disperso,41952,39,0,1,1,259,41652


## 5. Generar Datos para Valle del Cauca

In [8]:
# Función para filtrar datos por departamento con coincidencia flexible
def filter_by_department_flexible(df, dept_column, department):
    """Filtra un dataframe buscando coincidencias que contengan el departamento"""
    if dept_column in df.columns:
        filtered = df[df[dept_column].str.contains(department, case=False, na=False)]
        if filtered.empty:
            print(f"No se encontraron coincidencias exactas para '{department}' en {dept_column}")
            # Probar con coincidencias parciales
            for term in department.split():
                if len(term) > 3:  # Ignorar palabras cortas como "del", "de", etc.
                    partial_match = df[df[dept_column].str.contains(term, case=False, na=False)]
                    if not partial_match.empty:
                        print(f"Se encontraron coincidencias parciales con '{term}': {partial_match[dept_column].unique()}")
                        return partial_match
            return pd.DataFrame()  # Devolver DataFrame vacío si no hay coincidencias
        return filtered
    else:
        print(f"Columna {dept_column} no encontrada. Columnas disponibles: {df.columns.tolist()}")
        return df

In [9]:
# Procesar datos de población para Valle del Cauca
try:
    if 'df_pob' in locals() and not df_pob.empty:
        # Encontrar la columna de departamento
        dept_col = [col for col in df_pob.columns if 'DEPART' in str(col).upper()]
        if dept_col:
            dept_col = dept_col[0]
            # Buscar Valle del Cauca (probando diferentes variantes)
            valle_variants = ['VALLE DEL CAUCA', 'Valle del Cauca', 'VALLE']
            
            for variant in valle_variants:
                print(f"\nBuscando '{variant}' en datos de población...")
                valle_pop = filter_by_department_flexible(df_pob, dept_col, variant)
                if not valle_pop.empty:
                    print(f"Encontrados {valle_pop.shape[0]} registros para {variant}")
                    # Guardar para Power BI
                    pop_output_file = os.path.join(output_dir, f'poblacion_valle_del_cauca.csv')
                    valle_pop.to_csv(pop_output_file, index=False)
                    print(f"Datos guardados en: {pop_output_file}")
                    break
        else:
            print("No se pudo identificar la columna de departamento en los datos de población")
    else:
        print("No se pudieron cargar correctamente los datos de proyección de población")
except Exception as e:
    print(f"Error al procesar datos de población: {e}")

No se pudo identificar la columna de departamento en los datos de población


In [10]:
# Procesar indicadores de pobreza monetaria para Valle del Cauca
try:
    if 'pm_indicators' in locals() and pm_indicators:
        # Crear un dataframe consolidado para Power BI
        pm_consolidated = pd.DataFrame()
        
        for indicator_name, df in pm_indicators.items():
            # Buscar columna de departamento
            potential_dept_cols = [col for col in df.columns if any(term in str(col).lower() for term in ['depart', 'dpto', 'entidad'])]
            
            if potential_dept_cols:
                dept_col = potential_dept_cols[0]
                print(f"\nProcesando {indicator_name} - Buscando 'Valle del Cauca'...")
                
                # Buscar Valle del Cauca (probando variantes)
                valle_variants = ['Valle del Cauca', 'VALLE DEL CAUCA', 'Valle', 'VALLE']
                filtered_df = pd.DataFrame()
                
                for variant in valle_variants:
                    temp_df = filter_by_department_flexible(df, dept_col, variant)
                    if not temp_df.empty:
                        filtered_df = temp_df
                        print(f"Encontrado con la variante '{variant}'")
                        break
                
                if not filtered_df.empty:
                    # Mostrar una muestra
                    print(f"Datos encontrados para {indicator_name}:")
                    display(filtered_df.head(1))
                    
                    # Renombrar columnas para claridad
                    filtered_df = filtered_df.rename(columns={col: f"{indicator_name}_{col}" 
                                                            for col in filtered_df.columns 
                                                            if col != dept_col})
                    
                    # Guardar individualmente
                    indicator_file = os.path.join(output_dir, f'{indicator_name}_valle_del_cauca.csv')
                    filtered_df.to_csv(indicator_file, index=False)
                    print(f"Indicador {indicator_name} guardado en: {indicator_file}")
                    
                    # Si es el primer indicador, inicializar el dataframe consolidado
                    if pm_consolidated.empty:
                        pm_consolidated = filtered_df
                    else:
                        # Intentar unir con el dataframe consolidado
                        try:
                            pm_consolidated = pd.merge(pm_consolidated, filtered_df, on=dept_col, how='outer')
                        except Exception as merge_error:
                            print(f"No se pudo unir {indicator_name}: {merge_error}")
                else:
                    print(f"No se encontraron datos para {indicator_name} para Valle del Cauca")
            else:
                print(f"No se pudo identificar columna de departamento en {indicator_name}")
        
        # Guardar el dataframe consolidado
        if not pm_consolidated.empty:
            consolidated_file = os.path.join(output_dir, f'pobreza_monetaria_consolidado_valle_del_cauca.csv')
            pm_consolidated.to_csv(consolidated_file, index=False)
            print(f"Datos consolidados de pobreza monetaria guardados en: {consolidated_file}")
    else:
        print("No se pudieron cargar correctamente los indicadores de pobreza monetaria")
except Exception as e:
    print(f"Error al procesar indicadores de pobreza monetaria: {e}")

No se pudo identificar columna de departamento en IP Act.Met.
No se pudo identificar columna de departamento en IPE Act.Met.
No se pudo identificar columna de departamento en IC_IP Act.Met.
No se pudo identificar columna de departamento en IC_IPE Act.Met.
No se pudo identificar columna de departamento en AP Act.Met.
No se pudo identificar columna de departamento en APE Act.Met.
No se pudo identificar columna de departamento en Gini
No se pudo identificar columna de departamento en IPUG
No se pudo identificar columna de departamento en LP Act.Met.
No se pudo identificar columna de departamento en LPE Act.Met.
No se pudo identificar columna de departamento en BP Act.Met.
No se pudo identificar columna de departamento en BPE Act.Met.
No se pudo identificar columna de departamento en SP Act.Met.
No se pudo identificar columna de departamento en SPE Act.Met.
No se pudo identificar columna de departamento en IP_Sexo Act.Met.
No se pudo identificar columna de departamento en IPE_Sexo Act.Met.

In [11]:
# Procesar indicadores de pobreza multidimensional para Valle del Cauca
try:
    if 'pmd_indicators' in locals() and pmd_indicators:
        # Crear un dataframe consolidado para Power BI
        pmd_consolidated = pd.DataFrame()
        
        for indicator_name, df in pmd_indicators.items():
            # Buscar columna de departamento
            potential_dept_cols = [col for col in df.columns if any(term in str(col).lower() for term in ['depart', 'dpto', 'entidad'])]
            
            if potential_dept_cols:
                dept_col = potential_dept_cols[0]
                print(f"\nProcesando {indicator_name} - Buscando 'Valle del Cauca'...")
                
                # Buscar Valle del Cauca (probando variantes)
                valle_variants = ['Valle del Cauca', 'VALLE DEL CAUCA', 'Valle', 'VALLE']
                filtered_df = pd.DataFrame()
                
                for variant in valle_variants:
                    temp_df = filter_by_department_flexible(df, dept_col, variant)
                    if not temp_df.empty:
                        filtered_df = temp_df
                        print(f"Encontrado con la variante '{variant}'")
                        break
                
                if not filtered_df.empty:
                    # Mostrar una muestra
                    print(f"Datos encontrados para {indicator_name}:")
                    display(filtered_df.head(1))
                    
                    # Renombrar columnas para claridad
                    filtered_df = filtered_df.rename(columns={col: f"{indicator_name}_{col}" 
                                                            for col in filtered_df.columns 
                                                            if col != dept_col})
                    
                    # Guardar individualmente
                    indicator_file = os.path.join(output_dir, f'{indicator_name}_valle_del_cauca.csv')
                    filtered_df.to_csv(indicator_file, index=False)
                    print(f"Indicador {indicator_name} guardado en: {indicator_file}")
                    
                    # Si es el primer indicador, inicializar el dataframe consolidado
                    if pmd_consolidated.empty:
                        pmd_consolidated = filtered_df
                    else:
                        # Intentar unir con el dataframe consolidado
                        try:
                            pmd_consolidated = pd.merge(pmd_consolidated, filtered_df, on=dept_col, how='outer')
                        except Exception as merge_error:
                            print(f"No se pudo unir {indicator_name}: {merge_error}")
                else:
                    print(f"No se encontraron datos para {indicator_name} para Valle del Cauca")
            else:
                print(f"No se pudo identificar columna de departamento en {indicator_name}")
        
        # Guardar el dataframe consolidado
        if not pmd_consolidated.empty:
            consolidated_file = os.path.join(output_dir, f'pobreza_multidimensional_consolidado_valle_del_cauca.csv')
            pmd_consolidated.to_csv(consolidated_file, index=False)
            print(f"Datos consolidados de pobreza multidimensional guardados en: {consolidated_file}")
    else:
        print("No se pudieron cargar correctamente los indicadores de pobreza multidimensional")
except Exception as e:
    print(f"Error al procesar indicadores de pobreza multidimensional: {e}")

No se pudo identificar columna de departamento en IPM_Regiones

Procesando IPM_Departamentos - Buscando 'Valle del Cauca'...
Encontrado con la variante 'Valle del Cauca'
Datos encontrados para IPM_Departamentos:


Unnamed: 0,Incidencia de Pobreza Multidimensional\nDepartamentos\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14,Unnamed: 15,Unnamed: 16,Unnamed: 17,Unnamed: 18,Unnamed: 19,Unnamed: 20,Unnamed: 21
30,Valle del Cauca,14.1,12.5,23.2,10.8,9.3,19.4,11.1,8.9,24.1,8.6,6.9,18.6,9.7,8,19.4,7.2,5.8,15.8,6.2,4.6,15.9


Indicador IPM_Departamentos guardado en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\IPM_Departamentos_valle_del_cauca.csv
No se pudo identificar columna de departamento en IPM_Variables_Región

Procesando IPM_Variables_Departamento  - Buscando 'Valle del Cauca'...
Encontrado con la variante 'Valle del Cauca'
Datos encontrados para IPM_Variables_Departamento :


Unnamed: 0,Privaciones por hogar según variable\nDepartamentos\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14,Unnamed: 15,Unnamed: 16,Unnamed: 17,Unnamed: 18,Unnamed: 19,Unnamed: 20,Unnamed: 21,Unnamed: 22
605,Valle del Cauca,Analfabetismo,6.6,5.3,14.2,7.1,6.2,12.5,6,4.5,14.8,5.9,5.2,10.2,6.2,5.5,9.8,5.1,4.3,9.9,4.5,3.7,9.8


Indicador IPM_Variables_Departamento  guardado en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\IPM_Variables_Departamento _valle_del_cauca.csv
No se pudo unir IPM_Variables_Departamento : 'Privaciones por hogar según variable\nDepartamentos\n2018-2024'
No se pudo identificar columna de departamento en IC_IPM

Procesando Intensidad_IPM - Buscando 'Valle del Cauca'...
Encontrado con la variante 'Valle del Cauca'
Datos encontrados para Intensidad_IPM:


Unnamed: 0,Proporción de privaciones entre las personas en situación de pobreza multidimensional\nDepartamentos\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
29,Valle del Cauca,40.7,40.0,39.9,39.8,39.2,39.6,39.0


Indicador Intensidad_IPM guardado en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\Intensidad_IPM_valle_del_cauca.csv
No se pudo unir Intensidad_IPM: 'Proporción de privaciones entre las personas en situación de pobreza multidimensional\nDepartamentos\n2018-2024'

Procesando Incidencia_Ajustada_IPM - Buscando 'Valle del Cauca'...
Encontrado con la variante 'Valle del Cauca'
Datos encontrados para Incidencia_Ajustada_IPM:


Unnamed: 0,Incidencia Ajustada\nDepartamentos\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
29,Valle del Cauca,0.057,0.043,0.044,0.034,0.038,0.028,0.024


Indicador Incidencia_Ajustada_IPM guardado en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\Incidencia_Ajustada_IPM_valle_del_cauca.csv
No se pudo unir Incidencia_Ajustada_IPM: 'Incidencia Ajustada\nDepartamentos\n2018-2024'
No se pudo identificar columna de departamento en Contribuciones IA_IPM

Procesando IPM_Sexo - Buscando 'Valle del Cauca'...
Encontrado con la variante 'Valle del Cauca'
Datos encontrados para IPM_Sexo:


Unnamed: 0,Incidencia de Pobreza Multidimensional según sexo de la persona\nDepartamentos\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14
30,Valle del Cauca,13.8,14.4,10.3,11.2,11,11.2,8.8,8.4,9.8,9.6,7,7.3,5.8,6.5


Indicador IPM_Sexo guardado en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\IPM_Sexo_valle_del_cauca.csv
No se pudo unir IPM_Sexo: 'Incidencia de Pobreza Multidimensional según sexo de la persona\nDepartamentos\n2018-2024                                                                                                                                                                                                                                         '

Procesando IC_IPM_Sexo - Buscando 'Valle del Cauca'...
Encontrado con la variante 'Valle del Cauca'
Datos encontrados para IC_IPM_Sexo:


Unnamed: 0,IC. Incidencia de Pobreza Multidimensional según sexo de la persona\nDepartamentos\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14,Unnamed: 15,Unnamed: 16,Unnamed: 17,Unnamed: 18,Unnamed: 19,Unnamed: 20,Unnamed: 21,Unnamed: 22,Unnamed: 23,Unnamed: 24,Unnamed: 25,Unnamed: 26,Unnamed: 27,Unnamed: 28,Unnamed: 29,Unnamed: 30,Unnamed: 31,Unnamed: 32,Unnamed: 33,Unnamed: 34,Unnamed: 35,Unnamed: 36,Unnamed: 37,Unnamed: 38,Unnamed: 39,Unnamed: 40,Unnamed: 41,Unnamed: 42,Unnamed: 43,Unnamed: 44,Unnamed: 45,Unnamed: 46,Unnamed: 47,Unnamed: 48,Unnamed: 49,Unnamed: 50,Unnamed: 51,Unnamed: 52,Unnamed: 53,Unnamed: 54,Unnamed: 55,Unnamed: 56,Unnamed: 57,Unnamed: 58,Unnamed: 59,Unnamed: 60,Unnamed: 61,Unnamed: 62,Unnamed: 63,Unnamed: 64,Unnamed: 65,Unnamed: 66,Unnamed: 67,Unnamed: 68,Unnamed: 69,Unnamed: 70
30,Valle del Cauca,13.8,1.32,11.2,16.4,9.5,14.4,1.29,11.8,16.9,9,10.3,1.46,7.4,13.2,14.2,11.2,1.42,8.47,14.02,12.59,11,1.08,8.9,13.1,9.8,11.2,1.15,9,13.5,10.2,8.8,0.95,6.9,10.7,10.8,8.4,0.84,6.7,10,10,9.8,1.03,7.8,11.8,10.6,9.6,1.06,7.5,11.6,11.1,7,0.81,5.4,8.6,11.5,7.3,0.83,5.7,9,11.2,5.8,0.77,4.3,7.3,13.2,6.5,0.95,4.7,8.4,14.5


Indicador IC_IPM_Sexo guardado en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\IC_IPM_Sexo_valle_del_cauca.csv
No se pudo unir IC_IPM_Sexo: 'IC. Incidencia de Pobreza Multidimensional según sexo de la persona\nDepartamentos\n2018-2024'

Procesando IPM_Sexo Jefe - Buscando 'Valle del Cauca'...
Encontrado con la variante 'Valle del Cauca'
Datos encontrados para IPM_Sexo Jefe:


Unnamed: 0,Incidencia de Pobreza Multidimensional según sexo del jefe de hogar\nDepartamentos\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14
30,Valle del Cauca,11,19.1,8.3,15.3,10.3,12.4,7,10.5,9,10.5,6.1,8.4,4.7,7.8


Indicador IPM_Sexo Jefe guardado en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\IPM_Sexo Jefe_valle_del_cauca.csv


No se pudo unir IPM_Sexo Jefe: 'Incidencia de Pobreza Multidimensional según sexo del jefe de hogar\nDepartamentos\n2018-2024                                                                                                                                                   '

Procesando IC_IPM_Sexo Jefe  - Buscando 'Valle del Cauca'...
Encontrado con la variante 'Valle del Cauca'
Datos encontrados para IC_IPM_Sexo Jefe :


Unnamed: 0,IC. Incidencia de Pobreza Multidimensional según sexo del jefe de hogar\nDepartamentos\n2018-2024,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14,Unnamed: 15,Unnamed: 16,Unnamed: 17,Unnamed: 18,Unnamed: 19,Unnamed: 20,Unnamed: 21,Unnamed: 22,Unnamed: 23,Unnamed: 24,Unnamed: 25,Unnamed: 26,Unnamed: 27,Unnamed: 28,Unnamed: 29,Unnamed: 30,Unnamed: 31,Unnamed: 32,Unnamed: 33,Unnamed: 34,Unnamed: 35,Unnamed: 36,Unnamed: 37,Unnamed: 38,Unnamed: 39,Unnamed: 40,Unnamed: 41,Unnamed: 42,Unnamed: 43,Unnamed: 44,Unnamed: 45,Unnamed: 46,Unnamed: 47,Unnamed: 48,Unnamed: 49,Unnamed: 50,Unnamed: 51,Unnamed: 52,Unnamed: 53,Unnamed: 54,Unnamed: 55,Unnamed: 56,Unnamed: 57,Unnamed: 58,Unnamed: 59,Unnamed: 60,Unnamed: 61,Unnamed: 62,Unnamed: 63,Unnamed: 64,Unnamed: 65,Unnamed: 66,Unnamed: 67,Unnamed: 68,Unnamed: 69,Unnamed: 70
30,Valle del Cauca,11,1.21,8.6,13.4,11,19.1,2.47,14.3,24,12.9,8.3,1.14,6,10.5,13.8,15.3,2.6,10.2,20.4,17,10.3,1.33,7.7,12.9,12.9,12.4,1.39,9.7,15.1,11.2,7,1.13,4.8,9.3,16.1,10.5,1.28,8,13,12.1,9,1.19,6.7,11.4,13.2,10.5,1.49,7.6,13.5,14.1,6.1,1.05,4,8.1,17.2,8.4,1.12,6.2,10.6,13.4,4.7,0.9,3,6.4,18.8,7.8,1.4,5,10.6,18.2


Indicador IC_IPM_Sexo Jefe  guardado en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\IC_IPM_Sexo Jefe _valle_del_cauca.csv
No se pudo unir IC_IPM_Sexo Jefe : 'IC. Incidencia de Pobreza Multidimensional según sexo del jefe de hogar\nDepartamentos\n2018-2024'
Datos consolidados de pobreza multidimensional guardados en: C:\Users\junio\OneDrive\Escritorio\Inge\Universidad\5 Semestre\Fundamentos de economia\Actividad Población y Pobreza\datos_valle\pobreza_multidimensional_consolidado_valle_del_cauca.csv


## 6. Visualizaciones para Valle del Cauca

In [12]:
# Crear visualizaciones específicas para Valle del Cauca
try:
    # Definir una paleta de colores para consistencia visual
    colors = sns.color_palette("viridis", 10)
    
    # 1. Gráfico de Incidencia de Pobreza Monetaria
    if 'pm_indicators' in locals() and 'IP Act.Met.' in pm_indicators:
        ip_df = pm_indicators['IP Act.Met.']
        
        # Buscar columnas relevantes
        year_cols = [col for col in ip_df.columns if str(col).isdigit()]
        dept_cols = [col for col in ip_df.columns if any(term in str(col).lower() for term in ['depart', 'dpto', 'entidad'])]
        
        if dept_cols and year_cols:
            dept_col = dept_cols[0]
            
            # Buscar Valle del Cauca (probando variantes)
            valle_variants = ['Valle del Cauca', 'VALLE DEL CAUCA', 'Valle', 'VALLE']
            ip_valle = pd.DataFrame()
            
            for variant in valle_variants:
                temp_df = filter_by_department_flexible(ip_df, dept_col, variant)
                if not temp_df.empty:
                    ip_valle = temp_df
                    break
            
            if not ip_valle.empty:
                print("Generando gráfico de pobreza monetaria para Valle del Cauca")
                
                # Crear gráfico de tendencia
                plt.figure(figsize=(12, 7))
                plt.title('Incidencia de Pobreza Monetaria - Valle del Cauca', fontsize=16)
                
                # Datos para gráfico
                years = [int(col) for col in year_cols]
                values = ip_valle[year_cols].values[0]
                
                plt.plot(years, values, marker='o', linestyle='-', color=colors[0], linewidth=3, markersize=10)
                plt.grid(True, linestyle='--', alpha=0.7)
                plt.xlabel('Año', fontsize=14)
                plt.ylabel('Incidencia (%)', fontsize=14)
                plt.xticks(years, fontsize=12)
                plt.yticks(fontsize=12)
                
                # Añadir valores en los puntos
                for i, value in enumerate(values):
                    plt.text(years[i], value + 0.5, f"{value:.1f}%", ha='center', fontsize=11)
                
                # Guardar gráfico
                plt.savefig(os.path.join(vis_dir, 'incidencia_pobreza_valle_del_cauca.png'), bbox_inches='tight', dpi=300)
                plt.close()
                print(f"Gráfico de incidencia de pobreza guardado")
    
    # 2. Gráfico de Coeficiente de Gini
    if 'pm_indicators' in locals() and 'Gini' in pm_indicators:
        gini_df = pm_indicators['Gini']
        
        # Buscar columnas relevantes
        year_cols = [col for col in gini_df.columns if str(col).isdigit()]
        dept_cols = [col for col in gini_df.columns if any(term in str(col).lower() for term in ['depart', 'dpto', 'entidad'])]
        
        if dept_cols and year_cols:
            dept_col = dept_cols[0]
            
            # Buscar Valle del Cauca
            valle_variants = ['Valle del Cauca', 'VALLE DEL CAUCA', 'Valle', 'VALLE']
            gini_valle = pd.DataFrame()
            
            for variant in valle_variants:
                temp_df = filter_by_department_flexible(gini_df, dept_col, variant)
                if not temp_df.empty:
                    gini_valle = temp_df
                    break
            
            if not gini_valle.empty:
                print("Generando gráfico de Gini para Valle del Cauca")
                
                # Crear gráfico de barras
                plt.figure(figsize=(12, 7))
                plt.title('Coeficiente de Gini - Valle del Cauca', fontsize=16)
                
                # Datos para gráfico
                years = [int(col) for col in year_cols]
                values = gini_valle[year_cols].values[0]
                
                bars = plt.bar(years, values, color=colors)
                plt.grid(True, linestyle='--', alpha=0.7, axis='y')
                plt.xlabel('Año', fontsize=14)
                plt.ylabel('Coeficiente de Gini', fontsize=14)
                plt.xticks(years, fontsize=12)
                plt.yticks(fontsize=12)
                
                # Añadir valores sobre las barras
                for bar, value in zip(bars, values):
                    height = bar.get_height()
                    plt.text(bar.get_x() + bar.get_width()/2., height + 0.01,
                            f'{value:.3f}', ha='center', fontsize=11)
                
                # Guardar gráfico
                plt.savefig(os.path.join(vis_dir, 'gini_valle_del_cauca.png'), bbox_inches='tight', dpi=300)
                plt.close()
                print(f"Gráfico de Gini guardado")
    
    # 3. Gráfico para Pobreza Multidimensional
    if 'pmd_indicators' in locals() and 'IPM_Departamentos' in pmd_indicators:
        ipm_df = pmd_indicators['IPM_Departamentos']
        
        # Buscar columnas relevantes
        year_cols = [col for col in ipm_df.columns if str(col).isdigit()]
        dept_cols = [col for col in ipm_df.columns if any(term in str(col).lower() for term in ['depart', 'dpto', 'entidad'])]
        
        if dept_cols and year_cols:
            dept_col = dept_cols[0]
            
            # Buscar Valle del Cauca
            valle_variants = ['Valle del Cauca', 'VALLE DEL CAUCA', 'Valle', 'VALLE']
            ipm_valle = pd.DataFrame()
            
            for variant in valle_variants:
                temp_df = filter_by_department_flexible(ipm_df, dept_col, variant)
                if not temp_df.empty:
                    ipm_valle = temp_df
                    break
            
            if not ipm_valle.empty:
                print("Generando gráfico de pobreza multidimensional para Valle del Cauca")
                
                # Crear gráfico de línea
                plt.figure(figsize=(12, 7))
                plt.title('Incidencia de Pobreza Multidimensional - Valle del Cauca', fontsize=16)
                
                # Datos para gráfico
                years = [int(col) for col in year_cols]
                values = ipm_valle[year_cols].values[0]
                
                plt.plot(years, values, marker='s', linestyle='-', color=colors[2], linewidth=3, markersize=10)
                plt.grid(True, linestyle='--', alpha=0.7)
                plt.xlabel('Año', fontsize=14)
                plt.ylabel('Incidencia (%)', fontsize=14)
                plt.xticks(years, fontsize=12)
                plt.yticks(fontsize=12)
                
                # Añadir valores en los puntos
                for i, value in enumerate(values):
                    plt.text(years[i], value + 0.5, f"{value:.1f}%", ha='center', fontsize=11)
                
                # Guardar gráfico
                plt.savefig(os.path.join(vis_dir, 'incidencia_pobreza_multidimensional_valle_del_cauca.png'), bbox_inches='tight', dpi=300)
                plt.close()
                print(f"Gráfico de pobreza multidimensional guardado")
                
    # 4. Comparación entre Pobreza Monetaria y Multidimensional
    if ('pm_indicators' in locals() and 'pmd_indicators' in locals() and 
        'IP Act.Met.' in pm_indicators and 'IPM_Departamentos' in pmd_indicators):
        # Recopilar datos
        ip_df = pm_indicators['IP Act.Met.']
        ipm_df = pmd_indicators['IPM_Departamentos']
        
        # Encontrar columnas de departamento
        ip_dept_cols = [col for col in ip_df.columns if any(term in str(col).lower() for term in ['depart', 'dpto', 'entidad'])]
        ipm_dept_cols = [col for col in ipm_df.columns if any(term in str(col).lower() for term in ['depart', 'dpto', 'entidad'])]
        
        if ip_dept_cols and ipm_dept_cols:
            ip_dept_col = ip_dept_cols[0]
            ipm_dept_col = ipm_dept_cols[0]
            
            # Buscar Valle del Cauca
            valle_variants = ['Valle del Cauca', 'VALLE DEL CAUCA', 'Valle', 'VALLE']
            ip_valle = pd.DataFrame()
            ipm_valle = pd.DataFrame()
            
            for variant in valle_variants:
                # Buscar en pobreza monetaria
                temp_ip = filter_by_department_flexible(ip_df, ip_dept_col, variant)
                if not temp_ip.empty:
                    ip_valle = temp_ip
                
                # Buscar en pobreza multidimensional
                temp_ipm = filter_by_department_flexible(ipm_df, ipm_dept_col, variant)
                if not temp_ipm.empty:
                    ipm_valle = temp_ipm
                
                if not ip_valle.empty and not ipm_valle.empty:
                    break
            
            if not ip_valle.empty and not ipm_valle.empty:
                print("Generando gráfico comparativo de pobreza para Valle del Cauca")
                
                # Encontrar años comunes
                ip_years = [col for col in ip_df.columns if str(col).isdigit()]
                ipm_years = [col for col in ipm_df.columns if str(col).isdigit()]
                common_years = sorted(list(set([int(year) for year in ip_years]) & set([int(year) for year in ipm_years])))
                
                if common_years:
                    # Preparar datos para gráfico
                    ip_values = [float(ip_valle[str(year)].values[0]) for year in common_years if str(year) in ip_valle.columns]
                    ipm_values = [float(ipm_valle[str(year)].values[0]) for year in common_years if str(year) in ipm_valle.columns]
                    
                    # Crear gráfico
                    plt.figure(figsize=(14, 8))
                    plt.title('Comparación de Pobreza Monetaria vs Multidimensional - Valle del Cauca', fontsize=16)
                    
                    # Trazar líneas
                    plt.plot(common_years, ip_values, marker='o', linestyle='-', color=colors[0], linewidth=3, label='Pobreza Monetaria', markersize=10)
                    plt.plot(common_years, ipm_values, marker='s', linestyle='-', color=colors[2], linewidth=3, label='Pobreza Multidimensional', markersize=10)
                    
                    plt.grid(True, linestyle='--', alpha=0.7)
                    plt.xlabel('Año', fontsize=14)
                    plt.ylabel('Incidencia (%)', fontsize=14)
                    plt.xticks(common_years, fontsize=12)
                    plt.yticks(fontsize=12)
                    plt.legend(fontsize=12)
                    
                    # Añadir valores
                    for i, value in enumerate(ip_values):
                        plt.text(common_years[i], value + 0.7, f"{value:.1f}%", ha='center', fontsize=11)
                    
                    for i, value in enumerate(ipm_values):
                        plt.text(common_years[i], value - 1.5, f"{value:.1f}%", ha='center', fontsize=11)
                    
                    # Guardar gráfico
                    plt.savefig(os.path.join(vis_dir, 'comparativa_pobreza_valle_del_cauca.png'), bbox_inches='tight', dpi=300)
                    plt.close()
                    print(f"Gráfico comparativo guardado")
except Exception as e:
    print(f"Error al generar visualizaciones: {e}")

## 7. Recomendaciones para Power BI

Con los datos procesados en el directorio 'datos_valle', ahora puede importarlos a Power BI para crear su tablero. Aquí hay algunas recomendaciones específicas para el Valle del Cauca:

1. **Estructura sugerida para su tablero**:
   - Página 1: Resumen de indicadores clave del Valle del Cauca
   - Página 2: Análisis de tendencias de pobreza monetaria
   - Página 3: Análisis de pobreza multidimensional
   - Página 4: Análisis por características demográficas (género, área, etc.)
   - Página 5: Proyecciones de población por municipio y grupo étnico

2. **Aspectos destacados para el Valle del Cauca**:
   - Comparación de la incidencia de pobreza del Valle del Cauca con el promedio nacional
   - Análisis de la distribución étnico-racial considerando la importante población afrocolombiana del departamento
   - Evolución temporal de los indicadores de pobreza desde 2018 hasta la actualidad
   - Análisis de tendencias por área geográfica (urbana/rural)

3. **Consideraciones técnicas**:
   - Utilice las visualizaciones generadas como referencia para su tablero
   - Incorpore filtros interactivos para permitir análisis por año, área y municipio
   - Cree medidas calculadas en Power BI para análisis más profundos
   - Utilice una paleta de colores consistente a lo largo del tablero