# Práctica 2

Para esta tarea, veremos los datos de vacunas de 2017. El archivo con estos datos está en `/data/NISPUF17.csv`. Para conocer los nombres de las variables de los datos tienes disponible una guía de usuarios de datos en `/data/NIS-PUF17-DUG.pdf`.

## Pregunta 1

Escribe una función llamada `proportion_of_education` que devuelva la proporción de niños en el dataset que tuvieron una madre con los niveles de educación: igual a menor de secundaria (<12), secundaria (12), mayor que secundaria pero sin ser universitaria graduada (>12) y con título universitario.

Esta función debería devolver un diccionario en forma de (use los números correctos, no redondee los números):

```python
{"menor que secundaria": 0.2,
 "secundaria": 0.4,
 "mayor a secundaria pero no universitaria": 0.2,
 "universitaria": 0.2}
```


In [13]:
import pandas as pd

def proportion_of_education(dataset_path="../data/NISPUF17.csv"):
    df = pd.read_csv(dataset_path)

    # 1 = <12 years, 2 = 12 years, 3 = >12 years, not a college graduate, 4 = College graduate
    education_counts = df['EDUC1'].value_counts(normalize=True)

    result = {
        "menor que secundaria":                     education_counts.get(1, 0).item(),
        "secundaria":                               education_counts.get(2, 0).item(),
        "mayor a secundaria pero no universitaria": education_counts.get(3, 0).item(),
        "universitaria":                            education_counts.get(4, 0).item()
    }

    return result

proportion_of_education()


{'menor que secundaria': 0.10202002459160373,
 'secundaria': 0.172352011241876,
 'mayor a secundaria pero no universitaria': 0.24588090637625154,
 'universitaria': 0.47974705779026877}

## Pregunta 2

Exploremos la relación entre ser alimentado con leche materna (fed breast milk) cuando era niño y recibir una vacuna contra la influenza estacional (seasonal influenza) de un proveedor de atención médica.

Devuelva una tupla del número promedio de vacunas contra la influenza para aquellos niños que sabemos que recibieron leche materna cuando eran niños y aquellos que sabemos que no.

In [14]:
import pandas as pd

def average_influenza_doses(dataset_path="../data/NISPUF17.csv"):
    df = pd.read_csv(dataset_path)

    # Leche materna (CBF_01 == 1)
    breastfed = df[df["CBF_01"] == 1]["P_NUMFLU"]

    # No recibieron leche materna (CBF_01 == 2)
    not_breastfed = df[df["CBF_01"] == 2]["P_NUMFLU"]

    avg_breastfed = breastfed.mean().item()
    avg_not_breastfed = not_breastfed.mean().item()

    return (avg_breastfed, avg_not_breastfed)

average_influenza_doses()


(1.8799187420058687, 1.5963945918878317)

# Pregunta 3

Sería interesante ver si hay evidencia de un vínculo entre la efectividad de la vacuna y el sexo del niño.
Calcule el ratio entre el número de niños que contrajeron varicela (chickenpox) pero que fueron vacunados contra ella (al menos una dosis) versus los que fueron vacunados y no contrajeron varicela.

Devuelve los resultados por sexo.

Esta función debería devolver un diccionario en forma de:

```python
{"male": 0.2, "female": 0.4}
```

Nota: Para ayudar en la verificación, el valor de chickenpox_by_sex()['female'] comienza con los dígitos 0.0077.

In [17]:
import pandas as pd

def chickenpox_by_sex(dataset_path="../data/NISPUF17.csv"):
    df = pd.read_csv(dataset_path)

    result = {"male": 0, "female": 0}

    vaccinated = df[df["P_NUMVRC"] >= 1]

    for sex in [1, 2]:  # 1 Hombre, 2 Mujer
        sex_group = vaccinated[vaccinated["SEX"] == sex]
        cases_of_chickenpox = sex_group[sex_group["HAD_CPOX"] == 1].shape[0]  # Contrajeron varicela
        non_cases_of_chickenpox = sex_group[sex_group["HAD_CPOX"] == 2].shape[0]  # No contrajeron varicela

        if non_cases_of_chickenpox > 0:
            ratio = cases_of_chickenpox / non_cases_of_chickenpox
        else:
            ratio = 0

        if sex == 1:
            result["male"] = ratio
        else:
            result["female"] = ratio

    return result

chickenpox_by_sex()


{'male': 0.009675583380762664, 'female': 0.0077918259335489565}