## Personas Desaparecidas

Los datos se obtuvieron del sitio web https://versionpublicarnpdno.segob.gob.mx/Dashboard/Sociodemografico el 19 de Abril del 2022.
Se utilizaron los siguientes filtros para obtener los datos:

*   Fecha Inicial - Fecha Final: 19/04/2017 - 19/04/2022.
*   Entidad Federativa: Sonora.
*   Rango de edad: 0 - 14 años.


### Librerías a utilizar


In [121]:
#Importando librerias necesarias
import pandas as pd
import pathlib

#Todo lo relacionado a graficar
import plotly.express as px


### Personas de 0 - 14 años desaparecidas en Sonora, por municipio y sexo.

In [122]:
# Definiendo el path del archivo
path = pathlib.Path('..', 'data/raw/personas_desaparecidas/personas-desaparecidas-n.csv')


In [123]:
# Leyendo los datos
personas_desaparecidas = pd.read_csv(path)

# Leyendo los primeros 5 registros
personas_desaparecidas.head()

Unnamed: 0,Category,Hombre,Mujer,Indeterminado
0,HERMOSILLO,22,31,0
1,NOGALES,7,17,0
2,CAJEME,6,9,0
3,GUAYMAS,6,2,0
4,CABORCA,4,4,0


In [124]:
# Confirmando que el tipo de datos sea el correcto y observamos el número de registros
personas_desaparecidas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 21 entries, 0 to 20
Data columns (total 4 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   Category       21 non-null     object
 1   Hombre         21 non-null     int64 
 2   Mujer          21 non-null     int64 
 3   Indeterminado  21 non-null     int64 
dtypes: int64(3), object(1)
memory usage: 800.0+ bytes


In [125]:
# Renombrando la columna Category
personas_desaparecidas.rename({'Category': 'Municipio'}, axis=1, inplace=True)

In [126]:
# Confirmaremos los diferentes valores en la columna indeterminado para ver si eliminamos la columna
personas_desaparecidas['Indeterminado'].unique()

array([0])

In [127]:
personas_desaparecidas.drop('Indeterminado', axis=1, inplace=True)

In [128]:
personas_desaparecidas.set_index('Municipio', inplace=True)

In [129]:
# Ya tenemos el Dataset para comenzar a explorar
personas_desaparecidas.head()

Unnamed: 0_level_0,Hombre,Mujer
Municipio,Unnamed: 1_level_1,Unnamed: 2_level_1
HERMOSILLO,22,31
NOGALES,7,17
CAJEME,6,9
GUAYMAS,6,2
CABORCA,4,4


In [130]:
# Calcularemos el número de personas desaparecidas (de 0-14) años en Sonora del 2017-2022
total_sonora = personas_desaparecidas.sum(axis=1).sum()
print(f'El número de personas desaparecidas (de 0-14) años en Sonora del 2017-2022 es de {total_sonora}')

El número de personas desaparecidas (de 0-14) años en Sonora del 2017-2022 es de 142


In [131]:
# Veremos cuantas de las personas desaparecidas son Hombres y cuantas mujeres
hombres_desaparecidos = personas_desaparecidas.sum()[0]
mujeres_desaparecidas = personas_desaparecidas.sum()[1]
hombres_porcentaje = (hombres_desaparecidos / total_sonora) * 100
mujeres_porcentaje = (mujeres_desaparecidas / total_sonora) * 100

print(f'El número de Hombres desaparecidos (de 0-14 años) en Sonora del 2017-2022 es de {hombres_desaparecidos} y representa el {round(hombres_porcentaje)}% aprox.')
print(f'El número de Mujeres desaparecidas (de 0-14 años) en Sonora del 2017-2022 es de {mujeres_desaparecidas} y representa el {round(mujeres_porcentaje)}% aprox.')

El número de Hombres desaparecidos (de 0-14 años) en Sonora del 2017-2022 es de 57 y representa el 40% aprox.
El número de Mujeres desaparecidas (de 0-14 años) en Sonora del 2017-2022 es de 85 y representa el 60% aprox.


In [132]:
# Visto graficamente
dff = personas_desaparecidas.sum()
fig = px.bar(dff, x=dff.values, y=dff.index, orientation='h',
            title = 'Personas desaparecidas (de 0-14) años en Sonora del 2017-2022',
            labels = {'index':"",
                        "x": "Número de personas" })
fig.show()

In [133]:
# Número de personas desaparecidas por Municipio
dff = personas_desaparecidas.sum(axis=1).sort_values(ascending=True)
fig = px.bar(dff, x=dff.values, y=dff.index, orientation='h',
            title = 'Personas desaparecidas (de 0-14) años en Sonora del 2017-2022, por Municipio',
            labels = {'index':"",
                        "x": "Número de personas" },
                        width=800, height=800)
fig.show()


In [134]:
# Número de personas desaparecidas por Municipio y sexo
dff = pd.melt(personas_desaparecidas,ignore_index=False, var_name = 'sexo',value_vars=['Hombre', 'Mujer'], value_name='personas_desaparecidas')


fig = px.bar(dff, y=dff.index, x='personas_desaparecidas', color='sexo',orientation='h',barmode='group',
            title = 'Personas desaparecidas (de 0-14) años en Sonora del 2017-2022, por Municipio',
            labels = {'index':"",
                        "x": "Número de personas" },
                        width=800, height=800,
                        template='ggplot2')
fig.show()

### Personas de 0 - 14 años desaparecidas en Sonora, por año y sexo.

In [135]:
# Definiendo el path del archivo
path = pathlib.Path('..', 'data/raw/personas_desaparecidas/personas-desaparecidas-segundo.csv')

In [136]:
# Leyendo los datos
personas_desaparecidas_year = pd.read_csv(path)

# Leyendo los primeros 5 registros
personas_desaparecidas_year.head()

Unnamed: 0,Category,Hombre,Mujer,Indeterminado
0,2017,35,59,0
1,2018,4,5,0
2,2019,7,7,0
3,2020,10,10,0
4,2021,1,3,0


In [137]:
# Confirmando que el tipo de datos sea el correcto y observamos el número de registros
personas_desaparecidas_year.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6 entries, 0 to 5
Data columns (total 4 columns):
 #   Column         Non-Null Count  Dtype
---  ------         --------------  -----
 0   Category       6 non-null      int64
 1   Hombre         6 non-null      int64
 2   Mujer          6 non-null      int64
 3   Indeterminado  6 non-null      int64
dtypes: int64(4)
memory usage: 320.0 bytes


In [138]:
# Renombrando la columna Category
personas_desaparecidas_year.rename({'Category': 'Año'}, axis=1, inplace=True)

In [139]:
# Confirmaremos los diferentes valores en la columna indeterminado para ver si eliminamos la columna
personas_desaparecidas_year['Indeterminado'].unique()

array([0])

In [140]:
personas_desaparecidas_year

Unnamed: 0,Año,Hombre,Mujer,Indeterminado
0,2017,35,59,0
1,2018,4,5,0
2,2019,7,7,0
3,2020,10,10,0
4,2021,1,3,0
5,2022,0,1,0


In [141]:
personas_desaparecidas_year.set_index('Año', inplace=True)

In [142]:
personas_desaparecidas_year.drop('Indeterminado', axis= 1, inplace=True)

In [143]:
# Ya tenemos el Dataset para comenzar a explorar
personas_desaparecidas_year.head()

Unnamed: 0_level_0,Hombre,Mujer
Año,Unnamed: 1_level_1,Unnamed: 2_level_1
2017,35,59
2018,4,5
2019,7,7
2020,10,10
2021,1,3


In [144]:
personas_desaparecidas_year.sum(axis=1)

Año
2017    94
2018     9
2019    14
2020    20
2021     4
2022     1
dtype: int64

In [145]:
dff = personas_desaparecidas_year.sum(axis=1)
fig = px.line(dff, x=dff.index, y=dff.values,
                labels = {'y':'Personas desaparecidas'},
                title='Personas desaparecidas (de 0-14) años en Sonora del 2017-2022',
                template='ggplot2')
fig.show()

In [146]:
dff = pd.melt(personas_desaparecidas_year,ignore_index=False, var_name = 'sexo',value_vars=['Hombre', 'Mujer'], value_name='personas_desaparecidas')

fig = px.bar(dff, x=dff.index, y='personas_desaparecidas', color='sexo',orientation='v',barmode='group',
            title = 'Personas desaparecidas (de 0-14) años en Sonora del 2017-2022, por Año y sexo',
            labels = {'index':"",
                        "personas_desaparecidas": "Número de personas",
                        'sexo':'Sexo' },
            template='ggplot2')
fig.show()

### Personas de 0 - 14 años desaparecidas en Sonora en los ultimos 12 meses

In [147]:
# Definiendo el path del archivo
path = pathlib.Path('..', 'data/raw/personas_desaparecidas/personas-desaparecidas-tercero.csv')

In [148]:
# Leyendo los datos
personas_desaparecidas_mensual = pd.read_csv(path)

# Leyendo los primeros 5 registros
personas_desaparecidas_mensual.head()

Unnamed: 0,Category,Hombre,Mujer,Indeterminado
0,2020-MARZO,0,1,0
1,2020-ABRIL,1,2,0
2,2020-MAYO,0,2,0
3,2020-JUNIO,1,0,0
4,2020-JULIO,2,1,0


In [149]:
# Confirmando que el tipo de datos sea el correcto y observamos el número de registros
personas_desaparecidas_mensual.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 4 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   Category       12 non-null     object
 1   Hombre         12 non-null     int64 
 2   Mujer          12 non-null     int64 
 3   Indeterminado  12 non-null     int64 
dtypes: int64(3), object(1)
memory usage: 512.0+ bytes


In [150]:
# Renombrando la columna Category
personas_desaparecidas_mensual.rename({'Category': 'Fecha'}, axis=1, inplace=True)

In [151]:
# Confirmaremos los diferentes valores en la columna indeterminado para ver si eliminamos la columna
personas_desaparecidas_mensual['Indeterminado'].unique()

array([0])

In [152]:
#Eliminamos la columna de Indeterminado
personas_desaparecidas_mensual.drop('Indeterminado', axis=1, inplace=True)

In [155]:
personas_desaparecidas_mensual.set_index('Fecha', inplace=True)

In [160]:
# Ya tenemos el Dataset para comenzar a explorar
personas_desaparecidas_mensual.head()

Unnamed: 0_level_0,Hombre,Mujer
Fecha,Unnamed: 1_level_1,Unnamed: 2_level_1
2020-MARZO,0,1
2020-ABRIL,1,2
2020-MAYO,0,2
2020-JUNIO,1,0
2020-JULIO,2,1


In [158]:
dff = personas_desaparecidas_mensual.sum(axis=1)
fig = px.line(dff, x=dff.index, y=dff.values,
                labels = {'y':'Personas desaparecidas'},
                title='Personas desaparecidas (de 0-14) años en Sonora en los ultimos 12 meses',
                template='ggplot2')
fig.update_yaxes(rangemode="tozero")


fig.show()

In [178]:
dff = pd.melt(personas_desaparecidas_mensual,ignore_index=False, var_name = 'sexo',value_vars=['Hombre', 'Mujer'], value_name='personas_desaparecidas')

fig = px.bar(dff, x=dff.index, y='personas_desaparecidas', color='sexo',orientation='v',barmode='group',
            title = 'Personas desaparecidas (de 0-14) años en Sonora en los ultimos 12 meses, por Año y sexo',
            labels = {'index':"",
                        "personas_desaparecidas": "Número de personas",
                        'sexo':'Sexo' },
            template='ggplot2')
fig.show()

### Personas de 0 - 14 años desaparecidas en Sonora por Edad

In [161]:
# Definiendo el path del archivo
path = pathlib.Path('..', 'data/raw/personas_desaparecidas/personas-desaparecidas-cuarto.csv')

In [162]:
# Leyendo los datos
personas_desaparecidas_edad = pd.read_csv(path)

# Leyendo los primeros 5 registros
personas_desaparecidas_edad.head()

Unnamed: 0,Category,Hombre,Mujer,Indeterminado
0,0,5,6,0
1,1,1,0,0
2,2,1,2,0
3,3,1,2,0
4,4,3,2,0


In [163]:
# Confirmando que el tipo de datos sea el correcto y observamos el número de registros
personas_desaparecidas_edad.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 14 entries, 0 to 13
Data columns (total 4 columns):
 #   Column         Non-Null Count  Dtype
---  ------         --------------  -----
 0   Category       14 non-null     int64
 1   Hombre         14 non-null     int64
 2   Mujer          14 non-null     int64
 3   Indeterminado  14 non-null     int64
dtypes: int64(4)
memory usage: 576.0 bytes


In [165]:
# Renombrando la columna Category
personas_desaparecidas_edad.rename({'Category': 'Edad'}, axis=1, inplace=True)

In [166]:
# Confirmaremos los diferentes valores en la columna indeterminado para ver si eliminamos la columna
personas_desaparecidas_edad['Indeterminado'].unique()

array([0])

In [167]:
#Eliminamos la columna de Indeterminado
personas_desaparecidas_edad.drop('Indeterminado', axis=1, inplace=True)

In [168]:
personas_desaparecidas_edad.set_index('Edad', inplace=True)

In [169]:
# Ya tenemos el Dataset para comenzar a explorar
personas_desaparecidas_edad.head()

Unnamed: 0_level_0,Hombre,Mujer
Edad,Unnamed: 1_level_1,Unnamed: 2_level_1
0,5,6
1,1,0
2,1,2
3,1,2
4,3,2


In [173]:
dff = personas_desaparecidas_edad.sum(axis=1)
fig = px.bar(dff, x=dff.index, y=dff.values,
                labels = {'y':'Personas desaparecidas'},
                title='Personas desaparecidas (de 0-14) años en Sonora 2017-2022, por edad.',
                template='ggplot2')
fig.update_yaxes(rangemode="tozero")


fig.show()

In [177]:
dff = pd.melt(personas_desaparecidas_edad,ignore_index=False, var_name = 'sexo',value_vars=['Hombre', 'Mujer'], value_name='personas_desaparecidas')

fig = px.bar(dff, x=dff.index, y='personas_desaparecidas', color='sexo',orientation='v',barmode='group',
            title = 'Personas desaparecidas (de 0-14) años en Sonora del 2017-2022, por Año y sexo',
            labels = {'index':"",
                        "personas_desaparecidas": "Número de personas",
                        'sexo':'Sexo' },
            template='ggplot2')
fig.show()

### Personas de 0 - 14 años desaparecidas en Sonora por Nacionalidad

In [179]:
# Definiendo el path del archivo
path = pathlib.Path('..', 'data/raw/personas_desaparecidas/personas-desaparecidas-quinto.csv')

In [180]:
# Leyendo los datos
personas_desaparecidas_nacionalidad = pd.read_csv(path)

# Leyendo los primeros 5 registros
personas_desaparecidas_nacionalidad.head()

Unnamed: 0,Category,Hombre,Mujer,Indeterminado
0,MEXICANA,37,66,0
1,SE DESCONOCE,20,19,0


In [181]:
# Confirmando que el tipo de datos sea el correcto y observamos el número de registros
personas_desaparecidas_nacionalidad.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2 entries, 0 to 1
Data columns (total 4 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   Category       2 non-null      object
 1   Hombre         2 non-null      int64 
 2   Mujer          2 non-null      int64 
 3   Indeterminado  2 non-null      int64 
dtypes: int64(3), object(1)
memory usage: 192.0+ bytes


In [182]:
# Renombrando la columna Category
personas_desaparecidas_nacionalidad.rename({'Category': 'Nacionalidad'}, axis=1, inplace=True)

In [184]:
# Confirmaremos los diferentes valores en la columna indeterminado para ver si eliminamos la columna
personas_desaparecidas_nacionalidad['Indeterminado'].unique()

array([0])

In [186]:
#Eliminamos la columna de Indeterminado
personas_desaparecidas_nacionalidad.drop('Indeterminado', axis=1, inplace=True)

In [188]:
personas_desaparecidas_nacionalidad.set_index('Nacionalidad', inplace=True)

In [190]:
# Ya tenemos el Dataset para comenzar a explorar
personas_desaparecidas_nacionalidad.head()

Unnamed: 0_level_0,Hombre,Mujer
Nacionalidad,Unnamed: 1_level_1,Unnamed: 2_level_1
MEXICANA,37,66
SE DESCONOCE,20,19


In [196]:
dff = personas_desaparecidas_nacionalidad.sum(axis=1)
fig = px.bar(dff, y=dff.index, x=dff.values,orientation='h',
                labels = {'y':'Personas desaparecidas'},
                title='Personas desaparecidas (de 0-14) años en Sonora por nacionalidad',
                template='ggplot2')
fig.update_yaxes(rangemode="tozero")


fig.show()

In [202]:
dff = pd.melt(personas_desaparecidas_nacionalidad,ignore_index=False, var_name = 'sexo',value_vars=['Hombre', 'Mujer'], value_name='personas_desaparecidas')

fig = px.line(dff, x=dff.index, y='personas_desaparecidas', color='sexo',
            title = 'Personas desaparecidas (de 0-14) años en Sonora del 2017-2022, por nacionalidad y sexo',
            labels = {'index':"",
                        "personas_desaparecidas": "Número de personas",
                        'sexo':'Sexo' },
            template='ggplot2',
            markers=True)

fig.show()