In [1]:
import pandas as pd
import plotly.express as px

In [2]:
data = pd.read_parquet(
    "../../data/2_clean/youth_not_in_education_employment_or_training.parquet",
)

In [3]:
data = data.query("Sexe != 'Total'")
data

Indicateur,Pays et territoires insulaires du Pacifique,Sexe,Urbanisation,Invalidité,TIME_PERIOD,"Nombre de jeunes personnes sans études, emploi ni formation","Proportion de jeunes personnes sans études, emploi ni formation"
0,Cook Islands,Femme,National,Pas de ventilation par handicap,2015,244.0,23.80
1,Cook Islands,Femme,Rural,Pas de ventilation par handicap,2015,82.0,32.03
2,Cook Islands,Femme,Urbain,Pas de ventilation par handicap,2015,161.0,20.94
3,Cook Islands,Homme,National,Pas de ventilation par handicap,2015,151.0,14.55
4,Cook Islands,Homme,Rural,Pas de ventilation par handicap,2015,79.0,31.47
...,...,...,...,...,...,...,...
270,Vanuatu,Homme,Rural,Pas de ventilation par handicap,2019,8447.0,43.66
271,Vanuatu,Homme,Rural,Personnes handicapées,2019,73.0,85.88
272,Vanuatu,Homme,Rural,Personnes sans handicap,2019,8374.0,43.48
273,Vanuatu,Homme,Urbain,Pas de ventilation par handicap,2019,2128.0,30.69


In [4]:
data.info()

<class 'pandas.core.frame.DataFrame'>
Index: 184 entries, 0 to 274
Data columns (total 7 columns):
 #   Column                                                           Non-Null Count  Dtype   
---  ------                                                           --------------  -----   
 0   Pays et territoires insulaires du Pacifique                      184 non-null    category
 1   Sexe                                                             184 non-null    category
 2   Urbanisation                                                     184 non-null    category
 3   Invalidité                                                       184 non-null    category
 4   TIME_PERIOD                                                      184 non-null    int64   
 5   Nombre de jeunes personnes sans études, emploi ni formation      184 non-null    float64 
 6   Proportion de jeunes personnes sans études, emploi ni formation  184 non-null    float64 
dtypes: category(4), float64(2), int64(1)
memo

In [5]:
sans_emploi_by_year = (
    data.groupby(["Pays et territoires insulaires du Pacifique", "Sexe"])[
        "Nombre de jeunes personnes sans études, emploi ni formation"
    ]
    .mean()
    .dropna()
    .reset_index()
)
sans_emploi_by_year

  data.groupby(["Pays et territoires insulaires du Pacifique", "Sexe"])[


Unnamed: 0,Pays et territoires insulaires du Pacifique,Sexe,"Nombre de jeunes personnes sans études, emploi ni formation"
0,Cook Islands,Femme,162.333333
1,Cook Islands,Homme,100.666667
2,Kiribati,Femme,2421.705882
3,Kiribati,Homme,2421.388889
4,Marshall Islands,Femme,1346.888889
5,Marshall Islands,Homme,1010.6
6,Micronesia,Femme,2799.666667
7,Micronesia,Homme,2759.333333
8,Nauru,Femme,569.0
9,Nauru,Homme,373.5


In [6]:
px.bar(
    sans_emploi_by_year.reset_index(),
    x="Pays et territoires insulaires du Pacifique",
    y="Nombre de jeunes personnes sans études, emploi ni formation",
    color="Sexe",
    title="Nombre de jeunes personnes sans études, emploi ni formation par sexe",
    barmode="group",
)

In [7]:
men = (
    sans_emploi_by_year.query("Sexe == 'Homme'")
    .drop(columns="Sexe")
    .set_index("Pays et territoires insulaires du Pacifique")
    .dropna()
)
women = (
    sans_emploi_by_year.query("Sexe == 'Femme'")
    .drop(columns="Sexe")
    .set_index("Pays et territoires insulaires du Pacifique")
    .dropna()
)
all = men + women

men = (men / all) * 100
women = (women / all) * 100

men = men.rename(
    columns={"Nombre de jeunes personnes sans études, emploi ni formation": "Homme"}
).sort_index()
women = women.rename(
    columns={"Nombre de jeunes personnes sans études, emploi ni formation": "Femme"}
).sort_index()

unemployed_by_country = men.copy()
unemployed_by_country["Femme"] = women
unemployed_by_country = unemployed_by_country.stack().reset_index()
unemployed_by_country = unemployed_by_country.rename(
    {"level_1": "Sexe", 0: "Pourcentage"}, axis=1
)
unemployed_by_country

Unnamed: 0,Pays et territoires insulaires du Pacifique,Sexe,Pourcentage
0,Cook Islands,Homme,38.276299
1,Cook Islands,Femme,61.723701
2,Kiribati,Homme,49.996727
3,Kiribati,Femme,50.003273
4,Marshall Islands,Homme,42.867646
5,Marshall Islands,Femme,57.132354
6,Micronesia,Homme,49.637225
7,Micronesia,Femme,50.362775
8,Nauru,Homme,39.628647
9,Nauru,Femme,60.371353


In [8]:
fig = px.bar(
    unemployed_by_country,
    x="Pays et territoires insulaires du Pacifique",
    color="Sexe",
    y="Pourcentage",
)

fig.add_hline(y=unemployed_by_country["Pourcentage"].mean(), line_dash="dot")

In [9]:
fig = px.sunburst(
    unemployed_by_country,
    path=["Pays et territoires insulaires du Pacifique", "Sexe"],
    values="Pourcentage",
    title="Nombre de jeunes personnes sans études, emploi ni formation par sexe",
)
fig.show()







In [10]:
unemployed_by_country.to_parquet("../../data/3_product/unemployed_by_country.parquet")