# Práctica 2

Para esta tarea, veremos los datos de vacunas de 2017. El archivo con estos datos está en `/data/NISPUF17.csv`. Para conocer los nombres de las variables de los datos tienes disponible una guía de usuarios de datos en `/data/NIS-PUF17-DUG.pdf`.

## Pregunta 1

Escribe una función llamada `proportion_of_education` que devuelva la proporción de niños en el dataset que tuvieron una madre con los niveles de educación: igual a menor de secundaria (<12), secundaria (12), mayor que secundaria pero sin ser universitaria graduada (>12) y con título universitario.

Esta función debería devolver un diccionario en forma de (use los números correctos, no redondee los números):

```python
{"menor que  secundaria": 0.2,
 "secundaria": 0.4,
 "mayor a secundaria pero no universitaria": 0.2,
 "universitaria": 0.2}
```


In [2]:
import pandas as pd

def proportion_of_education():
    # Cargar en un DataFrame
    df = pd.read_csv('../data/NISPUF17.csv')

    # Calculamos la cantidad total de niños
    cant_ninos = len(df)

    # Filtramos la cantidad de madres que hay por cada grupo
    edu_madres = df['EDUC1'].value_counts().sort_index()

    # Calculamos la proporción sobre el total 
    proporcion = edu_madres / cant_ninos

    # Función que devuelve un diccionario
    etiquetas = {
        1: "menor que secundaria",
        2: "secundaria",
        3: "mayor a secundaria pero no universitaria",
        4: "universitaria"
    }

    resultado = {etiquetas[i]: proporcion[i] for i in etiquetas}

    print(resultado)

proportion_of_education()


{'menor que secundaria': 0.10202002459160373, 'secundaria': 0.172352011241876, 'mayor a secundaria pero no universitaria': 0.24588090637625154, 'universitaria': 0.47974705779026877}


## Pregunta 2

Exploremos la relación entre ser alimentado con leche materna (fed breast milk) cuando era niño y recibir una vacuna contra la influenza estacional (seasonal influenza) de un proveedor de atención médica.

Devuelva una tupla del número promedio de vacunas contra la influenza para aquellos niños que sabemos que recibieron leche materna cuando eran niños y aquellos que sabemos que no.

In [3]:
def average_influenza_doses():
    # Cargar el DataFrame
    df = pd.read_csv('../data/NISPUF17.csv')

    # Filtra y selecciona las columnas relevantes y elimina filas con valores nulos
    filtered_data = df[['CBF_01', 'P_NUMFLU']].dropna()

    # Calcula el promedio de vacunas para ambos grupos en una sola línea
    avg_vaccines_by_breastfeeding = filtered_data.groupby('CBF_01')['P_NUMFLU'].mean()

    avg_with_breast_milk = avg_vaccines_by_breastfeeding[1]
    avg_without_breast_milk = avg_vaccines_by_breastfeeding[2]

    return {'avg_with_breast_milk': avg_with_breast_milk, 'avg_without_breast_milk': avg_without_breast_milk}

result = average_influenza_doses()
print(result)

{'avg_with_breast_milk': 1.8799187420058687, 'avg_without_breast_milk': 1.5963945918878317}


# Pregunta 3

Sería interesante ver si hay evidencia de un vínculo entre la efectividad de la vacuna y el sexo del niño.
Calcule el ratio entre el número de niños que contrajeron varicela (chickenpox) pero que fueron vacunados contra ella (al menos una dosis) versus los que fueron vacunados y no contrajeron varicela.

Devuelve los resultados por sexo.

Esta función debería devolver un diccionario en forma de:

```python
{"male": 0.2, "female": 0.4}
```

Nota: Para ayudar en la verificación, el valor de chickenpox_by_sex()['female'] comienza con los dígitos 0.0077.

In [4]:
def chickenpox_by_sex():
    # Cargar el DataFrame
    df = pd.read_csv('../data/NISPUF17.csv')

    # Filtrar los datos relevantes
    filtered_data = df[['HAD_CPOX', 'SEX', 'P_NUMVRC']].dropna()

    # Filtrar datos para niños que contrajeron varicela y fueron vacunados
    chickenpox_vaccinated = filtered_data[(filtered_data['HAD_CPOX'] == 1) & (filtered_data['P_NUMVRC'] > 0)]

    # Filtrar datos para niños que fueron vacunados y no contrajeron varicela
    vaccinated_not_chickenpox = filtered_data[(filtered_data['HAD_CPOX'] == 2) & (filtered_data['P_NUMVRC'] > 0)]

    # Calcular el ratio por sexo
    male_ratio = chickenpox_vaccinated[filtered_data['SEX'] == 1].shape[0] / vaccinated_not_chickenpox[filtered_data['SEX'] == 1].shape[0]
    female_ratio = chickenpox_vaccinated[filtered_data['SEX'] == 2].shape[0] / vaccinated_not_chickenpox[filtered_data['SEX'] == 2].shape[0]

    return {"male": male_ratio, "female": female_ratio}

result = chickenpox_by_sex()
print(result)

{'male': 0.009675583380762664, 'female': 0.0077918259335489565}


  male_ratio = chickenpox_vaccinated[filtered_data['SEX'] == 1].shape[0] / vaccinated_not_chickenpox[filtered_data['SEX'] == 1].shape[0]
  male_ratio = chickenpox_vaccinated[filtered_data['SEX'] == 1].shape[0] / vaccinated_not_chickenpox[filtered_data['SEX'] == 1].shape[0]
  female_ratio = chickenpox_vaccinated[filtered_data['SEX'] == 2].shape[0] / vaccinated_not_chickenpox[filtered_data['SEX'] == 2].shape[0]
  female_ratio = chickenpox_vaccinated[filtered_data['SEX'] == 2].shape[0] / vaccinated_not_chickenpox[filtered_data['SEX'] == 2].shape[0]
