## Sistema de Indicadores para Monitoreo y Seguimiento de la ENAPEA

Los datos se obtuvieron del sitio web http://indicadores.conapo.gob.mx/ENAPEA.html el 10 de Abril del 2022.
En la sección de 'Propósito'

* Razón de fecundidad en niñas de 10 a 14 años, 1990 (Por cada mil) (CONAPO)
* Tasa específica de fecundidad en niñas de 12 a 14 años, 1990 (Por cada mil) (CONAPO)


In [1]:
#Importando librerias necesarias
import pandas as pd
import pathlib

#Todo lo relacionado a graficar
import plotly.express as px

### Razón de fecundidad en niñas de 10 a 14 años, 1990 (Por cada mil) (CONAPO)

In [2]:
#Definiendo el Path del archivo
path = pathlib.Path('..', 'data/raw/data_dir/Razón de fecundidad en niñas de 10 a 14 años, Sonora (Por cada mil) (CONAPO).csv')

In [3]:
#Leyendo los datos
razon_fecundidad = pd.read_csv(path)

In [4]:
#Confirmando que los datos se leyeron correctamente
razon_fecundidad.head()

Unnamed: 0,Año,Valor
0,1990,1.69
1,1991,1.38
2,1992,1.4
3,1993,1.35
4,1994,1.4


#### Limpieza de datos

In [5]:
#Confirmamos que el tipo de datos sea el correcto
razon_fecundidad.dtypes

Año        int64
Valor    float64
dtype: object

In [6]:
#Confirmamos que no haya valores nulos
razon_fecundidad.isnull().sum()

Año      0
Valor    0
dtype: int64

#### Análisis de Datos Exploratorio

In [7]:
# Calculamos estadisticas descriptivas para la columna de valor
razon_fecundidad['Valor'].describe()

count    31.000000
mean      1.392258
std       0.136668
min       1.130000
25%       1.290000
50%       1.380000
75%       1.505000
max       1.690000
Name: Valor, dtype: float64

In [8]:
# Observamos esas estadisticas en un boxplot
fig = px.box(razon_fecundidad,y="Valor", 
             title='Distribucion de razón de fecundidad en niñas de 10 a 14 años, por cada mil (1990-2020)')

fig.show()

In [9]:
# Graficamos la serie de tiempo
fig = px.line(razon_fecundidad, x="Año", y="Valor",
                title='Razón de fecundidad en niñas de 10 a 14 años, por cada mil (1990-2020)',
                labels={'Valor' : 'Razón de fecundidad(Por cada mil)'})
fig.layout.update(showlegend=False) 
fig.show()

### Tasa específica de fecundidad en niñas de 12 a 14 años, 1990 (Por cada mil) (CONAPO)

In [10]:
#Definiendo el Path del archivo
path = pathlib.Path('..', 'data_dir/Tasa específica de fecundidad en niñas de 12 a 14 años, Sonora (Por cada mil) (CONAPO).csv')

In [11]:
#Leyendo los datos
tasa_fecundidad = pd.read_csv(path)

In [12]:
tasa_fecundidad.head()

Unnamed: 0,Año,Valor
0,1990,2.79
1,1991,2.21
2,1992,2.3
3,1993,2.22
4,1994,2.22


#### Limpieza de Datos

In [13]:
#Confirmamos que el tipo de datos sea el correcto
tasa_fecundidad.dtypes

Año        int64
Valor    float64
dtype: object

In [14]:
#Confirmamos que no haya valores perdidos
tasa_fecundidad.isnull().sum()

Año      0
Valor    0
dtype: int64

#### Análisis de Datos Exploratorio

In [15]:
# Calculamos estadisticas descriptivas para la columna de valor
tasa_fecundidad['Valor'].describe()

count    31.000000
mean      2.304194
std       0.233306
min       1.830000
25%       2.145000
50%       2.220000
75%       2.495000
max       2.790000
Name: Valor, dtype: float64

In [16]:
# Observamos esas estadisticas en un boxplot
fig = px.box(tasa_fecundidad,y="Valor", 
             title='Distribucion de tasa específica de fecundidad en niñas de 12 a 14 años, Sonora (Por cada mil) (1990-2020)')

fig.show()

In [17]:
# Graficamos la serie de tiempo
fig = px.line(tasa_fecundidad, x="Año", y="Valor",
                title='Tasa específica de fecundidad en niñas de 12 a 14 años, Sonora (Por cada mil) (1990-2020)',
                labels={'Valor' : 'Tasa específica de fecundidad(Por cada mil)'})
fig.layout.update(showlegend=False) 
fig.show()

### Uniendo Datasets

In [18]:
#Cambiamos el nombre de la columna Valor de ambos datasets para poder unirlos
tasa_fecundidad.rename(columns={'Valor':'tasa_fecundidad'}, inplace=True)
razon_fecundidad.rename(columns={'Valor':'razon_fecundidad'}, inplace=True)


In [19]:
datos_fecundidad = tasa_fecundidad.merge(razon_fecundidad, on='Año')
datos_fecundidad

Unnamed: 0,Año,tasa_fecundidad,razon_fecundidad
0,1990,2.79,1.69
1,1991,2.21,1.38
2,1992,2.3,1.4
3,1993,2.22,1.35
4,1994,2.22,1.4
5,1995,1.93,1.17
6,1996,1.98,1.2
7,1997,1.83,1.13
8,1998,2.18,1.33
9,1999,2.43,1.47


### Observaciones principales

*  La tasa específica y la razón de fecundidad siguen el mismo comporamiento
*  Ambas han ido bajando desde el 2014

#### Guardando los datos

In [21]:
path_to_save = pathlib.Path('..', 'data_clean/datos_fecundidad_limpios.csv')


In [22]:
datos_fecundidad.to_csv(path_to_save)