In [None]:
import pandas as pd

def calculate_demographic_data(print_data=True):
    # Leer los datos desde el archivo CSV
    df = pd.read_csv("adult.data.csv")

    # ¿Cuántas personas de cada raza están representadas en este set de datos?
    race_count = df["race"].value_counts()

    # ¿Cuál es la edad promedio de los hombres?
    average_age_men = round(df[df["sex"] == "Male"]["age"].mean(), 1)

    # ¿Cuál es el porcentaje de personas que tienen un grado de licenciatura?
    percentage_bachelors = round((df["education"] == "Bachelors").mean() * 100, 1)

    # ¿Qué porcentaje de personas con educación avanzada ganan más de 50k?
    higher_education = df["education"].isin(["Bachelors", "Masters", "Doctorate"])
    higher_education_rich = round((df[higher_education]["salary"] == ">50K").mean() * 100, 1)

    # ¿Qué porcentaje de personas sin educación avanzada ganan más de 50k?
    lower_education = ~higher_education
    lower_education_rich = round((df[lower_education]["salary"] == ">50K").mean() * 100, 1)

    # ¿Cuál es el mínimo número de horas que una persona trabaja por semana?
    min_work_hours = df["hours-per-week"].min()

    # ¿Qué porcentaje de personas que trabajan el mínimo de horas por semana tienen un salario de más de 50k?
    min_workers = df[df["hours-per-week"] == min_work_hours]
    rich_percentage = round((min_workers["salary"] == ">50K").mean() * 100, 1)

    # ¿Qué país tiene el mayor porcentaje de personas que ganan más de 50k?
    country_stats = df.groupby("native-country")["salary"].apply(lambda x: (x == ">50K").mean() * 100)
    highest_earning_country = country_stats.idxmax()
    highest_earning_country_percentage = round(country_stats.max(), 1)

    # Identifica la ocupación más popular de aquellos que ganan más de 50k en India.
    top_IN_occupation = df[(df["native-country"] == "India") & (df["salary"] == ">50K")]["occupation"].mode()[0]

    # Imprimir los resultados si print_data es True
    if print_data:
        print("Number of each race:", race_count)
        print("Average age of men:", average_age_men)
        print("Percentage with Bachelors degrees:", percentage_bachelors)
        print("Percentage with higher education that earn >50K:", higher_education_rich)
        print("Percentage without higher education that earn >50K:", lower_education_rich)
        print("Min work time:", min_work_hours, "hours/week")
        print("Percentage of rich among those who work fewest hours:", rich_percentage)
        print("Country with highest percentage of rich:", highest_earning_country)
        print("Highest percentage of rich people in country:", highest_earning_country_percentage)
        print("Top occupations in India:", top_IN_occupation)

    return {
        'race_count': race_count,
        'average_age_men': average_age_men,
        'percentage_bachelors': percentage_bachelors,
        'higher_education_rich': higher_education_rich,
        'lower_education_rich': lower_education_rich,
        'min_work_hours': min_work_hours,
        'rich_percentage': rich_percentage,
        'highest_earning_country': highest_earning_country,
        'highest_earning_country_percentage': highest_earning_country_percentage,
        'top_IN_occupation': top_IN_occupation
    }

# Ejecutar la función para probar
if __name__ == "__main__":
    calculate_demographic_data()
