In [321]:
#tratamento de dados
import pandas as pd
import numpy as np

#visualização de dados
import matplotlib.pyplot as plt
import plotly.graph_objs as go
import plotly.express as px
import plotly.offline as py
import seaborn as sns

py.init_notebook_mode(connected=True)


import warnings
warnings.filterwarnings('ignore')

# Links Uteis

- https://plotly.com/python/plotly-fundamentals/

In [322]:
#cria um banco de dados aleatorio
df = pd.DataFrame(np.random.randint(-75,75,size=(1000, 6)), 
                  columns=["Sales", "Consulting", "Net revenue", "Purchases", "Other expenses", "Profit before tax"])

In [323]:
df.head()

Unnamed: 0,Sales,Consulting,Net revenue,Purchases,Other expenses,Profit before tax
0,53,58,38,21,46,-2
1,-24,-73,14,-54,29,65
2,48,-33,-66,-33,-75,12
3,35,23,44,-31,7,40
4,30,22,-66,26,-57,62


# Watterfall

In [324]:
def watterfall(df, titulo):
    '''
    INPUT:
    df - banco de dados apenas com colunas que deseja analisar e linhas com valores inteiros
    titulo - (str) titulo do gráfico
    
    OUTPUT:
    html_file - salva o gráfico em um arquivo html no local onde está o código
    Gráfico de cascata
    
    '''
    
    
    
    #transforma as colunas em linhas para conseguir criar o waterfall
    df = df.melt().groupby('variable', as_index=False)['value'].sum()
    
    #acrescenta uma linha de total no fim
    df.loc[len(df.index)] = ['Total', df['value'].sum()]
    
    #define as variaveis
    x = df['variable'].tolist()
    y = df['value'].tolist()
    
    #cria o gráfico
    fig = go.Figure(go.Waterfall(
        name = "1", orientation = "v",
        #variaveis
        x = x,
        y = y,
        #anotações e posicionamento
        text = y,
        connector = {"line":{"color":"rgb(63, 63, 63)"}},
    ))

    fig.update_layout(
        title = titulo, #titulo
        showlegend = False,
        
        #define as cores
        paper_bgcolor='rgba(0, 0, 0, 0)',
        plot_bgcolor='rgba(0, 0, 0, 0)',
    )
        
    fig.update_traces(texttemplate='%{text:.3s}', textposition='outside')

    fig.show()
    
    html_file = fig.write_html("./watterfall.html")
    
    return html_file

In [325]:
watterfall(df, 'Profit and loss statement 2018')

In [434]:
tamanho = 3285

colunas = ['Sales', 'Purchases']

#cria um banco de dados aleatorio
df = pd.DataFrame(np.random.randint(50,75,size=(tamanho, len(colunas))), 
                  columns=colunas)

df['Date'] = pd.date_range(start='1/1/2018', periods=tamanho)
df['Month'] = df['Date'].dt.month
df['Year'] = df['Date'].dt.year

df = df[['Date', 'Month' ,'Year', 'Sales', 'Purchases']]

In [435]:
df_group = df.groupby(['Year'], as_index=False)['Sales', 'Purchases'].sum()

In [436]:
fig = px.line(df_group, x='Year', y=['Sales', 'Purchases'])
fig.show()

In [437]:
estados = ['RS', 'PR', 'SC',
           'SP', 'RJ', 'MG', 'ES',
           'PA', 'AM', 'RO', 'TO', 'AC', 'AP', 'RR',
           'BA', 'CE', 'PE', 'MA', 'RN', 'PB', 'SE', 'AL', 'PI',
           'MS', 'MT', 'GO', 'DF'
          ]

regiao = ['Sul', 'Sul', 'Sul',
          'Sudeste', 'Sudeste', 'Sudeste', 'Sudeste',
          'Norte', 'Norte', 'Norte', 'Norte', 'Norte', 'Norte', 'Norte',
          'Nordeste', 'Nordeste', 'Nordeste', 'Nordeste', 'Nordeste', 'Nordeste', 'Nordeste', 'Nordeste', 'Nordeste',
          'Centro-Oeste', 'Centro-Oeste', 'Centro-Oeste', 'Centro-Oeste'
         ]

In [438]:
df = pd.DataFrame(columns=['Estado', 'Regiao'])
df['Estado'] = estados
df['Regiao'] = regiao
df['B3'] = np.random.randint(20000, 40000, size=len(df))
df['Empresa'] = np.random.randint(1000, 15000, size=len(df))

df['B3_perc'] = df['B3']/sum(df['B3'])*100
df['Empresa_perc'] = df['Empresa']/sum(df['Empresa'])*100

In [439]:
df_melt = pd.melt(df, id_vars=['Estado', 'Regiao'], value_vars=['B3_perc', 'Empresa_perc'], ignore_index=False)

In [463]:
df_melt = df_melt.groupby(['Regiao', 'variable'], as_index=False)['value'].sum()

In [462]:
colors = ['#808080'] * 10
colors[3] = 'grey'

fig = px.bar(df_melt, x="variable", y="value", color=colors)

fig.update_layout(
    title = "Long-Form Input", #titulo
    showlegend = False,
        
    #define as cores
    paper_bgcolor='rgba(0, 0, 0, 0)',
    plot_bgcolor='rgba(0, 0, 0, 0)',
    uniformtext_minsize=8,
    uniformtext_mode='hide'
)

fig.update_layout(title_text='Least Used Feature')

fig.update_traces(texttemplate='%{text:.2s}', textposition='auto')

fig.show()