In [1]:
################################################################################
# Setup
################################################################################

import pandas as pd
import numpy  as np
from tqdm import tqdm 
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
from itertools import product
import re
warnings.filterwarnings('ignore')
sns.set_style('whitegrid')


################################################################################
# path
################################################################################

path        = '/content/drive/MyDrive/PES/'
path_input  = '/content/drive/MyDrive/PES/gol/input/'
path_output = '/content/drive/MyDrive/PES/gol/output/'

In [2]:
################################################################################
# list
################################################################################

list_rename = {
'mean': 'Média',
'std' : 'Desvio-Padrão',
'min' : 'Mínimo',
'25%' : '25%',
'50%' : '20%',
'75%' : '20%',
'max' : 'Máximo'}

In [3]:
################################################################################
# clean dataset
################################################################################

df_original = pd.read_csv(path_input + 'ieer_gol.csv')

df_clean    = round(df_original[['ieer_diretoria', 'ieer_gerencia','ieer_nao_lideranca', 'ieer_ponderado']].describe(), 3) 
df_clean    = df_clean.drop('count',       axis = 0)
df_clean    = df_clean.rename(list_rename, axis = 0)

df_clean.to_csv(path_output + 'estatistica_descritiva_gol.csv')

In [None]:
################################################################################
# plot
################################################################################

fig, ax = plt.subplots(figsize=(6,6))


sns.distplot(df_clean['ieer_gerencia'     ] , kde = True, hist = False, color = 'red'      , label = "Gerência"      )
sns.distplot(df_clean['ieer_diretoria'    ] , kde = True, hist = False, color = 'black'    , label = "Diretoria"     )
sns.distplot(df_clean['ieer_nao_lideranca'] , kde = True, hist = False, color = 'royalblue', label = "Não-Liderança" )
sns.distplot(df_clean['ieer_ponderado'    ] , kde = True, hist = False, color = 'gray'     , label = "Ponderado"     )

ax.set_ylabel("IEER")
ax.set_xlabel('IER')

ax.spines['top'  ].set_visible(False)
ax.spines['right'].set_visible(False)

ax.legend(loc = 'upper center', bbox_to_anchor = (0.5, -0.15), fancybox = True, shadow = True, ncol=4)

fig.savefig(path_output + 'fig_summary_gol.pdf', bbox_inches='tight')