# üìä An√°lisis Exploratorio de Datos
## V√≠ctimas de Esterilizaciones Forzadas ‚Äì Per√∫

### Proyecto de An√°lisis Exploratorio de Datos (EDA)

El objetivo de este proyecto es realizar un an√°lisis exploratorio de datos sobre los casos registrados de v√≠ctimas de esterilizaciones forzadas,
con el fin de comprender la distribuci√≥n de los casos en el tiempo,
por regi√≥n y por g√©nero.

Este an√°lisis busca transformar un conjunto de datos crudos en informaci√≥n clara, comprensible y √∫til para la toma de decisiones, lo que permitir√° elaborar un informe ejecutivo fundamentado en datos verificables.

## üóÇÔ∏è Contexto del Dataset

El dataset utilizado proviene de los registros oficiales del **Ministerio de la Mujer y Poblaciones Vulnerables (MIMP)** del Per√∫, disponibles en la plataforma de Datos Abiertos del gobierno peruano.

### üìä Contenido del Dataset

El conjunto de datos incluye informaci√≥n sobre:

- **Temporalidad:** A√±o del reporte de los casos
- **Ubicaci√≥n geogr√°fica:** Distribuci√≥n por departamento, provincia y distrito donde operan los Centros de Emergencia Mujer (CEM)
- **Casos reportados:** N√∫mero de v√≠ctimas de esterilizaciones forzadas
- **Segmentaci√≥n demogr√°fica:** Distribuci√≥n por g√©nero (hombres/mujeres) y grupos etarios (18-29, 30-64, 65+ a√±os)

### üéØ Objetivo del An√°lisis

Este an√°lisis exploratorio busca identificar:
- Patrones temporales en el reporte de casos
- Concentraciones geogr√°ficas de mayor incidencia
- Diferencias significativas entre grupos demogr√°ficos
- Tendencias relevantes para la comprensi√≥n del fen√≥meno

---

### üìã Ficha T√©cnica

| Campo | Detalle |
|-------|---------|
| **Fuente de datos** | Ministerio de la Mujer y Poblaciones Vulnerables (MIMP) |
| **Plataforma** | Datos Abiertos Per√∫ |
| **URL** | https://www.datosabiertos.gob.pe/ |
| **Formato** | CSV (delimitado por punto y coma) |
| **Analista** | Maryori Cruz |
| **Fecha de an√°lisis** | Febrero 2026 |
| **Herramientas** | Python 3.13, Pandas, Matplotlib, Seaborn, Jupyter Notebook |

---

## üõ†Ô∏è Importaci√≥n de librer√≠as

A continuaci√≥n se importan las librer√≠as necesarias para el an√°lisis de datos, visualizaci√≥n y manejo de advertencias.


In [4]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings

Matplotlib is building the font cache; this may take a moment.


- **pandas**: manipulaci√≥n y an√°lisis de datos en tablas
- **numpy**: operaciones num√©ricas
- **matplotlib / seaborn**: visualizaci√≥n de datos
- **warnings**: ocultar advertencias que no afectan el an√°lisis


## ‚öôÔ∏è Configuraci√≥n del entorno de an√°lisis

Se ajustan algunas configuraciones para mejorar la visualizaci√≥n de tablas y gr√°ficos durante el an√°lisis.


In [5]:
warnings.filterwarnings('ignore')
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)
pd.set_option('display.max_columns', None)

Estas configuraciones permiten:
- Evitar mensajes de advertencia innecesarios
- Usar un estilo visual limpio
- Mostrar todas las columnas del DataFrame


## üì• Carga del dataset

Se procede a cargar el archivo CSV que contiene la informaci√≥n del proyecto.


In [6]:
df = pd.read_csv("data/mimp_esterilizaciones.csv", encoding="latin-1", sep=";")

Se utiliza el encoding `latin-1` y el separador `;` debido al formato del archivo, lo cual es com√∫n en datasets provenientes de entidades p√∫blicas.


## üëÄ Inspecci√≥n inicial de los datos

Antes de realizar cualquier transformaci√≥n, es fundamental observar
la estructura general del dataset.


In [7]:
df.head()

Unnamed: 0,A√ëO DEL REPORTE DE INFORMACION,PERIODO DE LA INFORMACION REMITIDA,FECHA DE REPORTE DE LA INFORMACI√ìN,CODIGO DE LA ENTIDAD (ENT001),PROGRAMA NACIONAL CONTRA LA VIOLENCIA FAMILIAR Y SEXUAL,CODIGO DE LA LINEA DE INTERVENCION (LIN001),NOMBRE DE LA LINEA DE INTERVENCI√ìN (ATENCI√ìN INTEGRAL Y MULTIDISCIPLINARIA PARA VICTIMAS DE VIOLENCIA),CODIGO DEL SERVICIO (SER001),NOMBRE DEL SERVICIO (CENTRO DE EMERGENCIA MUJER),UBIGEO DE LA UBICACI√ìN GEOGR√ÅFICA DEL CEM - SEG√öN EL INEI,DEPARTAMENTO DEL CEM,PROVINCIA DEL CEM,DISTRITO DEL CEM,CENTRO POBLADO DEL CEM,√ÅREA DE RESIDENCIA DEL CEM,CODIGO DEL CEM,NOMBRE DEL CEM,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS -TOTAL,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - HOMBRES,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - MUJERES,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 18_29 - TOTAL,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 18_29 - HOMBRES,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 18_29 - MUJERES,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 30_59 - TOTAL,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 30_59 - HOMBRES,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 30_59 - MUJERES,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 60_M√ÅS - TOTAL,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 60_M√ÅS - HOMBRES,N¬∞ CASOS DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS - 60_M√ÅS - MUJERES,N¬∞ DE ACTIVIDADES EN LA ATENCI√ìN - TOTAL,Unnamed: 30,Unnamed: 31,Unnamed: 32,Unnamed: 33,Unnamed: 34,Unnamed: 35,Unnamed: 36,Unnamed: 37,Unnamed: 38,Unnamed: 39,Unnamed: 40,Unnamed: 41,Unnamed: 42,Unnamed: 43,Unnamed: 44,Unnamed: 45,Unnamed: 46,Unnamed: 47,Unnamed: 48,Unnamed: 49,Unnamed: 50
0,2016,ENE - DIC,31/12/2016,ENT001,PROGRAMA NACIONAL CONTRA LA VIOLENCIA FAMILIAR...,LIN001,ATENCI√ìN DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS,SER001,CENTRO EMERGENCIA MUJER,90201,HUANCAVELICA,ACOBAMBA,ACOBAMBA,ACOBAMBA,URBANO,CEM002,ACOBAMBA,79,3,76,0,0,0,74,2,72.0,5,1,4,448,,,,,,,,,,,,,,,,,,,,,
1,2016,ENE - DIC,31/12/2016,ENT001,PROGRAMA NACIONAL CONTRA LA VIOLENCIA FAMILIAR...,LIN001,ATENCI√ìN DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS,SER001,CENTRO EMERGENCIA MUJER,90301,HUANCAVELICA,ANGARAES,LIRCAY,LIRCAY,URBANO,CEM135,ANGARAES,9,0,9,0,0,0,9,0,9.0,0,0,0,52,,,,,,,,,,,,,,,,,,,,,
2,2016,ENE - DIC,31/12/2016,ENT001,PROGRAMA NACIONAL CONTRA LA VIOLENCIA FAMILIAR...,LIN001,ATENCI√ìN DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS,SER001,CENTRO EMERGENCIA MUJER,80301,CUSCO,ANTA,ANTA,ANTA,URBANO,CEM146,ANTA,412,2,410,0,0,0,384,2,382.0,28,0,28,2 729,,,,,,,,,,,,,,,,,,,,,
3,2016,ENE - DIC,31/12/2016,ENT001,PROGRAMA NACIONAL CONTRA LA VIOLENCIA FAMILIAR...,LIN001,ATENCI√ìN DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS,SER001,CENTRO EMERGENCIA MUJER,220201,SAN MART√çN,BELLAVISTA,BELLAVISTA,BELLAVISTA,URBANO,CEM167,BELLAVISTA - SAN MARTIN,25,1,24,0,0,0,21,0,21.0,4,1,3,101,,,,,,,,,,,,,,,,,,,,,
4,2016,ENE - DIC,31/12/2016,ENT001,PROGRAMA NACIONAL CONTRA LA VIOLENCIA FAMILIAR...,LIN001,ATENCI√ìN DE V√çCTIMAS DE ESTERILIZACIONES FORZADAS,SER001,CENTRO EMERGENCIA MUJER,60101,CAJAMARCA,CAJAMARCA,CAJAMARCA,CAJAMARCA,URBANO,CEM009,CAJAMARCA,41,0,41,0,0,0,39,0,39.0,2,0,2,264,,,,,,,,,,,,,,,,,,,,,


In [8]:
df.info()

<class 'pandas.DataFrame'>
RangeIndex: 138 entries, 0 to 137
Data columns (total 51 columns):
 #   Column                                                                                                  Non-Null Count  Dtype  
---  ------                                                                                                  --------------  -----  
 0   A√ëO DEL REPORTE DE INFORMACION                                                                          138 non-null    int64  
 1   PERIODO DE LA INFORMACION REMITIDA                                                                      138 non-null    str    
 2   FECHA DE REPORTE DE LA INFORMACI√ìN                                                                      138 non-null    str    
 3   CODIGO DE LA ENTIDAD (ENT001)                                                                           138 non-null    str    
 4   PROGRAMA NACIONAL CONTRA LA VIOLENCIA FAMILIAR Y SEXUAL                                              

Esta inspecci√≥n inicial nos permite:
- Ver el n√∫mero de filas y columnas
- Identificar tipos de datos
- Detectar columnas con valores nulos
- Evaluar posibles problemas de limpieza
