# Work from home, from an external site or on the move (2018)

### Adresse web
- lien = https://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=isoc_iw_hem&lang=en


### Fichier source
- Pour l'année 2018 : Statistiques de la fréquence du télétravail par pays Européens
- L'unité qui nous intéresse ici : "Percentage of individuals"

## 1) Import des bibliothèques et paramètres

In [7]:
# Importation des bibliothèques
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Paramétrage des options d'affichage des colonnes
pd.options.display.max_columns = None
pd.set_option('display.max_colwidth', None)

## 2) Nettoyage des données

In [8]:
# Création du dataframe
df = pd.read_csv("./isoc_iw_hem_1_Data.csv", sep=',', engine='python')

# Renommage des colonnes 
df.rename(columns={'INDIC_IS':'categorie', 'GEO':'pays',
                     'IND_TYPE':'type_individu', 'TIME':'annee',
                     'UNIT':'unite', 'Value':'valeur', 'Flag and Footnotes':'notes'}, inplace=True)

# Suppression des colonnes non pertinentes
df_2 = df.drop(["type_individu", "annee", "notes"], axis=1)

# Remplace les ":" par la valeur "888" afin de faire le traitement et conversion
df_2['valeur'] = df_2['valeur'].str.replace(':','888') # 888 pour identification simple des NaN
df_2.valeur = df_2.valeur.astype(int)

# Sélection des occurrences avec pour unité "Percentage of individuals"
df_3 = df_2[df_2["unite"] == "Percentage of individuals"]  # 280 lignes

## 3) Export

### Datasets originaux 

In [48]:
# Création de deux datasets de 1000 et 400 lignes afin de les exploiter sous Tableau Public
dataset_1 = df_2.loc[0:999, :]
dataset_2 = df_2.loc[1000:1401, :]

# Export des deux datasets crées au format CSV
dataset_1.to_csv(r'./lien1_dataset_1.csv')  # 1000 lignes
dataset_2.to_csv(r'./lien1_dataset_2.csv')  # 400  lignes


# Export du dataset entier au format CSV
df_2.to_csv(r'./lien1_dataset_full.csv')    # 1400 lignes

# Export du dataset réduit au format CSV
df_3.to_csv(r'./lien1_dataset_reduit.csv')    # 280 lignes

### Pivot table (sélection de l'unité désirée)

In [10]:
# Filtre sur la colonne "UNIT" : on s'intéresse à la valeur "Percentage of individuals"
df_3 = df_2[df_2["unite"] == "Percentage of individuals"]

# Création de la pivot table 
piv_table = pd.pivot_table(df_3, values='valeur', index=['pays'], columns=['categorie'])

# Export du pivot table au format CSV
piv_table.to_csv(r'./lien1_dataset_3.csv')