# Notebook 3: Población de la Base de Datos de Víctimas

En este notebook, vamos a conectarnos a una base de datos MySQL y poblarla con datos de víctimas de violencia.

## 0. Instalación de la Librería mysql-connector-python

Antes de conectarnos a MySQL, necesitamos instalar la librería mysql-connector-python si no la tienes instalada.

In [1]:
pip install mysql-connector-python




[notice] A new release of pip is available: 25.0.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip





In [6]:
import pandas as pd
import mysql.connector as sql # Importar el conector de MySQL
import csv
import os

# Carga dinamica de los csv en data/data_split

In [31]:
# Rutas de los archivos CSV
paths = {
    # 'main_data': '../data/processed/victimas_por_hechos_departamental_20250416.csv'
    'hecho_victimizante': '../data/data_split/hecho_victimizante.csv',
    # 'departamento': '../data/data_split/departamento.csv',
    # 'reporte_hecho': '../data/data_split/reporte_hecho.csv',
    # 'grupo_poblacional': '../data/data_split/grupo_poblacional.csv',
    # 'reporte_grupo': 'reporte_hecho y grupo_poblacional misma PK',
}

# Diccionario para guardar los DataFrames cargados
dfs = {}

for name, path in paths.items():
    try:
        # Intentar cargar con UTF-8
        df = pd.read_csv(path, encoding='utf-8')
    except UnicodeDecodeError:
        try:
            # Intentar cargar con Latin1 si falla UTF-8
            df = pd.read_csv(path, encoding='latin1')
        except Exception as e:
            print(f"❌ Error cargando '{name}' desde '{path}': {e}")
            df = None
    dfs[name] = df

# Mostrar resumen de la carga
print("\n📦 Resumen de archivos cargados:")
for name, df in dfs.items():
    if df is not None:
        print(f"✅ '{name}' cargado con éxito. Filas: {df.shape[0]}, Columnas: {df.shape[1]}")
    else:
        print(f"⚠️ '{name}' no se cargó correctamente.")



📦 Resumen de archivos cargados:
✅ 'hecho_victimizante' cargado con éxito. Filas: 16, Columnas: 2


## Accediendo a df cargados en el notebook anterior
Los dataframes se encuentran guardados en el diccionario `dfs` el siguiente codigo es un ejemplo basico para acceder a cada contenido para ejecutar cualquier comando de pandas con normalidad.

In [30]:
dfs['hecho_victimizante'][['PARAM_HECHO', 'HECHO']].head()

Unnamed: 0,PARAM_HECHO,HECHO
0,1,Acto terrorista / Atentados / Combates / Enfre...
1,2,Amenaza
2,3,Delitos contra la libertad y la integridad sex...
3,4,Desaparición forzada
4,5,Desplazamiento forzado


## Establecer la Conexión con MySQL

Para conectarnos a un servidor MySQL, necesitamos las credenciales de acceso (host, usuario, contraseña y base de datos). Utilizamos el método mysql.connector.connect() para establecer la conexión.

In [32]:
# Conectar a la base de datos
conexion = sql.connect(
    host="localhost", # Cambiar por el host de la base de datos 
    port=3306, # Cambiar por el puerto de la base de datos 
    user="root", # Cambiar por el usuario de la base de datos
    password="evamaria", # Cambiar por la contraseña del usuario
    database="conflicto_armado" # Cambiar por el nombre de la base de datos
)

if conexion.is_connected():
    print("Conexión exitosa a la base de datos")

# conexion.close()

Conexión exitosa a la base de datos


## Poblacion de la base de datos de conflicto_armado
En las siguientes celdas se realiza la carga de los datos desde sus respectivos dataframes.

### Tabla: HechoVictimizante

In [37]:
cursor = conexion.cursor()

df_hecho = dfs['hecho_victimizante']

# Iterar sobre las filas del DataFrame
for _, row in df_hecho.iterrows():
    try:
        query = """
            INSERT INTO HechoVictimizante (id_hecho, nombre_hecho)
            VALUES (%s, %s)
        """
        values = (int(row['PARAM_HECHO']), row['HECHO'])  # Asegurar el tipo entero
        cursor.execute(query, values)
    except Exception as e:
        print(f"❌ Error insertando el hecho con ID {row['PARAM_HECHO']}: {e}")

# Confirmar los cambios
conexion.commit()
print("✅ Inserción completada en HechoVictimizante.")

cursor.close()

❌ Error insertando el hecho con ID 1: 1062 (23000): Duplicate entry '1' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho con ID 2: 1062 (23000): Duplicate entry '2' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho con ID 3: 1062 (23000): Duplicate entry '3' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho con ID 4: 1062 (23000): Duplicate entry '4' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho con ID 5: 1062 (23000): Duplicate entry '5' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho con ID 6: 1062 (23000): Duplicate entry '6' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho con ID 7: 1062 (23000): Duplicate entry '7' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho con ID 8: 1062 (23000): Duplicate entry '8' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho con ID 9: 1062 (23000): Duplicate entry '9' for key 'hechovictimizante.PRIMARY'
❌ Error insertando el hecho 

True

### Tabla: Departamento

In [None]:
cursor = conexion.cursor()

df_hecho = dfs['departamento']

# Iterar sobre las filas del DataFrame
for _, row in df_hecho.iterrows():
    try:
        query = """
            INSERT INTO Departamento (id_departamento, nombre_departamento)
            VALUES (%s, %s)
        """
        values = (int(row['COD_ESTADO_DEPTO']), row['ESTADO_DEPTO'])  # Asegurar el tipo entero
        cursor.execute(query, values)
    except Exception as e:
        print(f"❌ Error insertando el hecho con ID {row['COD_ESTADO_DEPTO']}: {e}")

# Confirmar los cambios
conexion.commit()
print("✅ Inserción completada en Departamento.")

cursor.close()