# Práctica 2

Para esta tarea, veremos los datos de vacunas de 2017. El archivo con estos datos está en `/data/NISPUF17.csv`. Para conocer los nombres de las variables de los datos tienes disponible una guía de usuarios de datos en `/data/NIS-PUF17-DUG.pdf`.

## Pregunta 1

Escribe una función llamada `proportion_of_education` que devuelva la proporción de niños en el dataset que tuvieron una madre con los niveles de educación: igual a menor de secundaria (<12), secundaria (12), mayor que secundaria pero sin ser universitaria graduada (>12) y con título universitario.

Esta función debería devolver un diccionario en forma de (use los números correctos, no redondee los números):

```python
{"menor que  secundaria": 0.2,
 "secundaria": 0.4,
 "mayor a secundaria pero no universitaria": 0.2,
 "universitaria": 0.2}
```


In [2]:
import pandas as pd
def proportion_of_education(file_path):
    # Cargar los datos desde el archivo especificado en el enunciado
    data = pd.read_csv(file_path)

    # Filtrar y contar la cantidad de niños en cada categoría de educación
    education_counts = data['EDUC1'].value_counts()

    # Calcular la proporción
    total_children = len(data)
    proportions = {
        "menor que secundaria": education_counts[1] / total_children,
        "secundaria": education_counts[2] / total_children,
        "mayor a secundaria pero no universitaria": education_counts[3] / total_children,
        "universitaria": education_counts[4] / total_children
    }

    return proportions

# Ruta al archivo de datos
file_path = '../data/NISPUF17.csv'
result = proportion_of_education(file_path)

# Crear un DataFrame a partir del resultado
df = pd.DataFrame(list(result.items()), columns=['Nivel de Educación', 'Proporción'])

# Imprimir el DataFrame como una tabla
print(df)
pass

                         Nivel de Educación  Proporción
0                      menor que secundaria    0.102020
1                                secundaria    0.172352
2  mayor a secundaria pero no universitaria    0.245881
3                             universitaria    0.479747


## Pregunta 2

Exploremos la relación entre ser alimentado con leche materna (fed breast milk) cuando era niño y recibir una vacuna contra la influenza estacional (seasonal influenza) de un proveedor de atención médica.

Devuelva una tupla del número promedio de vacunas contra la influenza para aquellos niños que sabemos que recibieron leche materna cuando eran niños y aquellos que sabemos que no.

In [5]:
def average_influenza_doses(file_path):
    # Cargar los datos desde el archivo especificado en el enunciado
    data = pd.read_csv(file_path)

    # Filtrar los datos para obtener dos conjuntos: niños con leche materna y sin leche materna
    breast_fed = data[data['CBF_01'] == 1]  # CBF_01 es la columna que indica si recibieron leche materna
    not_breast_fed = data[data['CBF_01'] == 2]

    # Calcular el promedio de las vacunas contra la influenza para ambos conjuntos
    avg_influenza_doses_breast_fed = breast_fed['P_NUMFLU'].mean()
    avg_influenza_doses_not_breast_fed = not_breast_fed['P_NUMFLU'].mean()

    return (avg_influenza_doses_breast_fed, avg_influenza_doses_not_breast_fed)

# Ruta al archivo de datos
file_path = '../data/NISPUF17.csv'
result = average_influenza_doses(file_path)
print(result)


(1.8799187420058687, 1.5963945918878317)


# Pregunta 3

Sería interesante ver si hay evidencia de un vínculo entre la efectividad de la vacuna y el sexo del niño.
Calcule el ratio entre el número de niños que contrajeron varicela (chickenpox) pero que fueron vacunados contra ella (al menos una dosis) versus los que fueron vacunados y no contrajeron varicela.

Devuelve los resultados por sexo.

Esta función debería devolver un diccionario en forma de:

```python
{"male": 0.2, "female": 0.4}
```

Nota: Para ayudar en la verificación, el valor de chickenpox_by_sex()['female'] comienza con los dígitos 0.0077.

In [6]:
import pandas as pd
def chickenpox_by_sex(file_path):
    # Cargar los datos desde el archivo especificado en el enunciado
    data = pd.read_csv(file_path)

    # Filtrar los datos para obtener dos conjuntos: vacunados con varicela y contrajeron varicela, y vacunados pero no contrajeron
    vaccinated_and_chickenpox = data[(data['P_NUMVRC'] >= 1) & (data['HAD_CPOX'] == 1)]
    vaccinated_and_no_chickenpox = data[(data['P_NUMVRC'] >= 1) & (data['HAD_CPOX'] == 2)]

    # Calcular el ratio para cada conjunto por sexo
    ratio_male = (len(vaccinated_and_chickenpox[vaccinated_and_chickenpox['SEX'] == 1]) / len(vaccinated_and_no_chickenpox[vaccinated_and_no_chickenpox['SEX'] == 1]))
    ratio_female = (len(vaccinated_and_chickenpox[vaccinated_and_chickenpox['SEX'] == 2]) / len(vaccinated_and_no_chickenpox[vaccinated_and_no_chickenpox['SEX'] == 2]))

    return {"male": ratio_male, "female": ratio_female}

# Ruta al archivo de datos
file_path = '../data/NISPUF17.csv'
result = chickenpox_by_sex(file_path)
print(result)

{'male': 0.009675583380762664, 'female': 0.0077918259335489565}
