<a href="https://colab.research.google.com/github/oviedokaren19/bc_G3_analisis_victimas/blob/main/PFBC_Victimas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Presentación

# Justificación

En Colombia, a causa del conflicto armado, se han registrado aproximadamente 10 millones de personas víctimas según el Registro Único de Víctimas (RUV) de la entidad pública Unidad de Atención y Reparación Integral a Víctimas UARIV. De estos, alrededor de 7.7 millones son sujetos de atención, es decir, pueden acceder a medidas de reparación y asistencia. El conflicto ha generado múltiples formas de victimización. Las más frecuentes son:

Hecho victimizante

·          Desplazamiento forzado

·          Homicidio

·          Amenazas

·          Desaparición forzada

·          Abandono o despojo forzado de tierras

·          Lesiones fisicas y psicologicas

·          Tortura

·          Reclutamiento de menores

·          Violencia sexual en el marco del conflicto

·          Minas antipersonales y artefactos explosivos

·          Secuestro

Nota: Una persona puede haber sufrido más de un hecho victimizante.

El Estado ha implementado varias acciones para atender y reparar a las víctimas:

Ley 1448 de 2011: Reconoce los derechos de las víctimas y establece medidas de reparación integral, verdad, justicia y no repetición.
Unidad para las Víctimas: Entrega de indemnizaciones económicas, ofrece acompañamiento psicosocial y promueve proyectos productivos.
Justicia transicional: A través de la JEP (Jurisdicción Especial para la Paz), se investiga y sanciona crímenes cometidos por actores armados y agentes del Estado.
Programas de retorno y reubicación: Para comunidades desplazadas, especialmente indígenas y campesinas.
Reconocimiento simbólico y actos de dignificación: Eventos públicos, memoriales y participación en procesos de verdad.
Es de nuestro interés, conocer como el conflicto armado genera afectaciones en los territorios, durante el año 2024, y como este impactó a los grupos poblacionales de manera particular. Para ello usaremos las siguientes preguntas problematizadoras:

**Preguntas de negocio**


·          ¿Cuáles han sido los 5 departamentos del país, donde más registros por ocurrencias de hechos victimizantes se presentaron durante ese período de análisis?

·          ¿Cuáles son los hechos victimizantes que más se presentan en esos cinco departamentos?

·          ¿Cómo ha impactado a las comunidades étnicas (Indígenas, NARP, ROM) según los registros de las UARIV?

·          ¿Qué afectación específica tuvieron las mujeres?

·          ¿Cuál es el grupo etario más afectado por el conflicto?

# Ingestión de Datos

Para realizar el análisis, se recurrirá a los datos abiertos sobre las personas registradas por la ocurrencia de hechos victimizantes que tiene dispuesta la UARIV, en su página web.

Exploración y Limpieza de Datos:

Se van a cargar los datos en Python utilizando bibliotecas como Pandas y Numpy por medio de Colaboratory.

Se realizará una exploración inicial para entender la estructura y el contenido de los datos. Además de Identificar y manejar valores faltantes, datos atípicos y errores en los datos. Para finalmente aplicar técnicas de limpieza para asegurar la calidad de los datos antes de proceder al análisis.

Posteriormente se hará el análisis descriptivo, la interpretación de resultados y se hará un informe que detalle todo el proceso, desde la identificación de la problemática hasta la interpretación de los resultados.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns


In [31]:
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Diciembre_2024.csv')

df
+++

Unnamed: 0,FECHA_CORTE,NOM_RPT,COD_PAIS,PAIS,COD_ESTADO_DEPTO,ESTADO_DEPTO,VIGENCIA,PARAM_HECHO,HECHO,SEXO,ETNIA,DISCAPACIDAD,CICLO_VITAL,PER_OCU,PER_DECLA,EVENTOS
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Fisica,entre 60 y 110,0,0,0,
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Ninguna,entre 12 y 17,0,0,0,
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Ninguna,entre 18 y 28,0,0,0,
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Ninguna,entre 29 y 59,0,0,0,
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Ninguna,entre 60 y 110,0,0,0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,99,Vichada,2024,12,Perdida de Bienes Muebles o Inmuebles,Mujer,Indigena (Acreditado RA),Ninguna,entre 29 y 59,1,0,1,
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,99,Vichada,2024,12,Perdida de Bienes Muebles o Inmuebles,Mujer,Ninguna,Ninguna,entre 29 y 59,1,0,1,
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,99,Vichada,2024,15,Confinamiento,Hombre,Ninguna,Ninguna,entre 18 y 28,0,0,0,
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,99,Vichada,2024,15,Confinamiento,Hombre,Ninguna,Ninguna,entre 29 y 59,0,0,0,


In [21]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 529878 entries, 31/12/2024 12:00:00 a. m. to 31/12/2024 12:00:00 a. m.
Data columns (total 15 columns):
 #   Column            Non-Null Count   Dtype 
---  ------            --------------   ----- 
 0   FECHA_CORTE       529878 non-null  object
 1   NOM_RPT           529878 non-null  int64 
 2   COD_PAIS          529878 non-null  object
 3   PAIS              529878 non-null  int64 
 4   COD_ESTADO_DEPTO  529878 non-null  object
 5   ESTADO_DEPTO      529878 non-null  int64 
 6   VIGENCIA          529878 non-null  int64 
 7   PARAM_HECHO       529878 non-null  object
 8   HECHO             529878 non-null  object
 9   SEXO              529878 non-null  object
 10  ETNIA             529878 non-null  object
 11  DISCAPACIDAD      529878 non-null  object
 12  CICLO_VITAL       529878 non-null  int64 
 13  PER_OCU           529878 non-null  int64 
 14  PER_DECLA         529878 non-null  int64 
dtypes: int64(7), object(8)
memory usage: 80.8+ MB


In [17]:
df.describe()

Unnamed: 0,NOM_RPT,PAIS,ESTADO_DEPTO,VIGENCIA,CICLO_VITAL,PER_OCU,PER_DECLA
count,529878.0,529878.0,529878.0,529878.0,529878.0,529878.0,529878.0
mean,48.0,38.084606,2006.707625,5.797253,24.51758,24.794728,25.083368
std,0.0,30.133328,10.408664,3.752572,247.703496,237.870861,255.648983
min,48.0,0.0,1985.0,1.0,0.0,0.0,0.0
25%,48.0,11.0,1999.0,4.0,0.0,0.0,0.0
50%,48.0,27.0,2007.0,5.0,1.0,1.0,1.0
75%,48.0,68.0,2015.0,6.0,3.0,3.0,3.0
max,48.0,99.0,2024.0,20.0,32658.0,29204.0,34232.0


# Preparación y Limpieza

In [18]:
df.isnull().sum()

Unnamed: 0,0
FECHA_CORTE,0
NOM_RPT,0
COD_PAIS,0
PAIS,0
COD_ESTADO_DEPTO,0
ESTADO_DEPTO,0
VIGENCIA,0
PARAM_HECHO,0
HECHO,0
SEXO,0


In [20]:
missing_percentages = (df.isnull().sum() / len(df)) * 100
display(missing_percentages)

Unnamed: 0,0
FECHA_CORTE,0.0
NOM_RPT,0.0
COD_PAIS,0.0
PAIS,0.0
COD_ESTADO_DEPTO,0.0
ESTADO_DEPTO,0.0
VIGENCIA,0.0
PARAM_HECHO,0.0
HECHO,0.0
SEXO,0.0


In [22]:
df

Unnamed: 0,FECHA_CORTE,NOM_RPT,COD_PAIS,PAIS,COD_ESTADO_DEPTO,ESTADO_DEPTO,VIGENCIA,PARAM_HECHO,HECHO,SEXO,ETNIA,DISCAPACIDAD,CICLO_VITAL,PER_OCU,PER_DECLA
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Fisica,entre 60 y 110,0,0,0
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Ninguna,entre 12 y 17,0,0,0
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Ninguna,entre 18 y 28,0,0,0
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Ninguna,entre 29 y 59,0,0,0
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,0,SIN DEFINIR,1985,1,Acto terrorista / Atentados / Combates / Enfre...,Hombre,Indigena (Acreditado RA),Ninguna,entre 60 y 110,0,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,99,Vichada,2024,12,Perdida de Bienes Muebles o Inmuebles,Mujer,Indigena (Acreditado RA),Ninguna,entre 29 y 59,1,0,1
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,99,Vichada,2024,12,Perdida de Bienes Muebles o Inmuebles,Mujer,Ninguna,Ninguna,entre 29 y 59,1,0,1
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,99,Vichada,2024,15,Confinamiento,Hombre,Ninguna,Ninguna,entre 18 y 28,0,0,0
31/12/2024 12:00:00 a. m.,"REPORTE VICTIMAS ANUALIZADO POR HECHO, CIFRA D...",48,COLOMBIA,99,Vichada,2024,15,Confinamiento,Hombre,Ninguna,Ninguna,entre 29 y 59,0,0,0


# Analítica descriptiva

In [25]:
print(df.columns.tolist())

['FECHA_CORTE', 'NOM_RPT', 'COD_PAIS', 'PAIS', 'COD_ESTADO_DEPTO', 'ESTADO_DEPTO', 'VIGENCIA', 'PARAM_HECHO', 'HECHO', 'SEXO', 'ETNIA', 'DISCAPACIDAD', 'CICLO_VITAL', 'PER_OCU', 'PER_DECLA', 'EVENTOS']
