# Práctica 2

Para esta tarea, veremos los datos de vacunas de 2017. El archivo con estos datos está en `/data/NISPUF17.csv`. Para conocer los nombres de las variables de los datos tienes disponible una guía de usuarios de datos en `/data/NIS-PUF17-DUG.pdf`.

## Pregunta 1

Escribe una función llamada `proportion_of_education` que devuelva la proporción de niños en el dataset que tuvieron una madre con los niveles de educación: igual a menor de secundaria (<12), secundaria (12), mayor que secundaria pero sin ser universitaria graduada (>12) y con título universitario.

Esta función debería devolver un diccionario en forma de (use los números correctos, no redondee los números):

```python
{"menor que  secundaria": 0.2,
 "secundaria": 0.4,
 "mayor a secundaria pero no universitaria": 0.2,
 "universitaria": 0.2}
```


**El siguiente código muestra la proporción de niños que tuvieron una madre con distintos niveles de educación:**

In [19]:
import pandas as pd

def proportion_of_education():
    # Leer el archivo de datos y cargar en un DataFrame
    df = pd.read_csv('../data/NISPUF17.csv')

    # Contar el número de niños para cada nivel de educación de la madre
    education_counts = df['EDUC1'].value_counts().sort_index()

    # Calcular el número total de niños
    total_children = education_counts.sum()

    # Calcular la proporción para cada nivel de educación
    proportion = {
        "menor que secundaria": education_counts[1] / total_children,
        "secundaria": education_counts[2] / total_children,
        "mayor a secundaria pero no universitaria": education_counts[3] / total_children,
        "universitaria": education_counts[4] / total_children
    }

    return proportion

proportion_of_education()

{'menor que secundaria': 0.10202002459160373,
 'secundaria': 0.172352011241876,
 'mayor a secundaria pero no universitaria': 0.24588090637625154,
 'universitaria': 0.47974705779026877}

## Pregunta 2

Exploremos la relación entre ser alimentado con leche materna (fed breast milk) cuando era niño y recibir una vacuna contra la influenza estacional (seasonal influenza) de un proveedor de atención médica.

Devuelva una tupla del número promedio de vacunas contra la influenza para aquellos niños que sabemos que recibieron leche materna cuando eran niños y aquellos que sabemos que no.

In [18]:
import pandas as pd

def average_influenza_doses():
    # Leer el archivo de datos
    df = pd.read_csv('../data/NISPUF17.csv')
    # Filtrar el DataFrame para obtener dos grupos: leche materna y no leche materna
    grupo_leche_materna = df[df['CBF_01'] == 1]  # Grupo que recibió leche materna
    grupo_sin_leche_materna = df[df['CBF_01'] == 2]  # Grupo que no recibió leche materna
    
    # Número promedio de vacunas contra la influenza para cada grupo
    prom_influenza_leche_materna = grupo_leche_materna['P_NUMFLU'].mean()
    prom_influenza_sin_leche_materna = grupo_sin_leche_materna['P_NUMFLU'].mean()
    
    return (prom_influenza_leche_materna,  prom_influenza_sin_leche_materna)

average_influenza_doses()

(1.8799187420058687, 1.5963945918878317)

# Pregunta 3

Sería interesante ver si hay evidencia de un vínculo entre la efectividad de la vacuna y el sexo del niño.
Calcule el ratio entre el número de niños que contrajeron varicela (chickenpox) pero que fueron vacunados contra ella (al menos una dosis) versus los que fueron vacunados y no contrajeron varicela.

Devuelve los resultados por sexo.

Esta función debería devolver un diccionario en forma de:

```python
{"male": 0.2, "female": 0.4}
```

Nota: Para ayudar en la verificación, el valor de chickenpox_by_sex()['female'] comienza con los dígitos 0.0077.

In [20]:
import pandas as pd
# Leer el archivo de datos
    
def chickenpox_by_sex():
    # Leer el archivo de datos
    df = pd.read_csv('../data/NISPUF17.csv')
    
    # Filtrar el DataFrame para obtener dos grupos: vacunados y contrajeron varicela, vacunados y no contrajeron varicela
    vacunado_con_varicela = df[(df['P_NUMVRC'] >= 1) & (df['HAD_CPOX'] == 1)]
    vacunado_sin_varicela = df[(df['P_NUMVRC'] >= 1) & (df['HAD_CPOX'] == 2)]
    
     # Calcular el ratio para cada grupo
    ratio_male = len(vacunado_con_varicela[vacunado_con_varicela['SEX'] == 1]) / len(vacunado_sin_varicela[vacunado_sin_varicela['SEX'] == 1])
    ratio_female = len(vacunado_con_varicela[vacunado_con_varicela['SEX'] == 2]) / len(vacunado_sin_varicela[vacunado_sin_varicela['SEX'] == 2])
     
    return {"male": ratio_male, "female": ratio_female}

chickenpox_by_sex()

{'male': 0.009675583380762664, 'female': 0.0077918259335489565}