<a href="https://colab.research.google.com/github/danielgomescruz/Meus_estudos/blob/main/FormatarTabelasPandasNumpy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Visualização de dados em Python: Formatação de Tabelas**

Muitas vezes precisamos utilizar uma tabela para apresentar os resultados e é importante apresentar a tabela da forma mais informativa possível. 

No Python é possível customizar as tabelas da maneira desejada e da forma mais adequada. Nesse notebook apresento algumas opções de formatação de tabelas:

* Mudando a cor da fonte.
* Mundando a cor da célula.
* Adicionando uma gráfico de barra na célula.

Para fazer essas formatação utilizamos o comando 'style' da biblioteca Pandas.




##Gerando os dados

Para exemplificar as diversas maneiras de formatar uma tabela no Python geramos um pequeno conjunto de dados.

In [1]:
import numpy as np
import pandas as pd


In [10]:

notas = {'Joaquim': np.random.uniform(5, 10, 4).round(1),
              'Bruna': np.random.uniform(0, 7, 4).round(1),
              'Laura': np.random.uniform(3, 7, 4).round(1),
              'Daniel': np.random.uniform(0, 10, 4).round(1),
              'Clara': np.random.uniform(8, 10, 4).round(1)}

In [11]:
provas = pd.DataFrame(notas)
provas.index = ['P1', 'P2', 'P3', 'P4']
df = provas.transpose()
df

Unnamed: 0,P1,P2,P3,P4
Joaquim,5.5,5.3,5.6,8.5
Bruna,1.9,3.8,0.4,6.9
Laura,5.1,3.5,5.3,4.3
Daniel,7.3,2.6,1.7,4.5
Clara,8.5,8.8,9.9,8.5


In [5]:
#descritiva do dataset
df.describe()

Unnamed: 0,P1,P2,P3,P4
count,5.0,5.0,5.0,5.0
mean,6.38,6.3,6.4,7.06
std,2.532193,2.411431,2.462722,1.418802
min,3.1,4.1,3.7,5.5
25%,5.1,4.7,4.6,6.0
50%,5.9,5.2,5.9,6.9
75%,8.5,7.6,8.2,7.9
max,9.3,9.9,9.6,9.0


In [12]:
#Analisando a descritiva pela linha
df.transpose().describe()

Unnamed: 0,Joaquim,Bruna,Laura,Daniel,Clara
count,4.0,4.0,4.0,4.0,4.0
mean,6.225,3.25,4.55,4.025,8.925
std,1.521786,2.802975,0.822598,2.475715,0.665207
min,5.3,0.4,3.5,1.7,8.5
25%,5.45,1.525,4.1,2.375,8.5
50%,5.55,2.85,4.7,3.55,8.65
75%,6.325,4.575,5.15,5.2,9.075
max,8.5,6.9,5.3,7.3,9.9


##Adicionando novas variáveis na Tabela

Muitas vezes é necessário criar novas variáveis, a seguir mostramos dois exemplos de como podemos adicionar novas variáveis em um conjunto de dados.

In [13]:
#criado a variável média final
df['MF'] = df.mean(axis = 1).round(1)
df

Unnamed: 0,P1,P2,P3,P4,MF
Joaquim,5.5,5.3,5.6,8.5,6.2
Bruna,1.9,3.8,0.4,6.9,3.2
Laura,5.1,3.5,5.3,4.3,4.6
Daniel,7.3,2.6,1.7,4.5,4.0
Clara,8.5,8.8,9.9,8.5,8.9


In [15]:
#criando uma variável situação
def aux(x):
    if x >= 5:
        return 'Aprovado'
    else:
        return 'Reprovado'

df['Situação'] = df['MF'].apply(aux)
df

Unnamed: 0,P1,P2,P3,P4,MF,Situação
Joaquim,5.5,5.3,5.6,8.5,6.2,Aprovado
Bruna,1.9,3.8,0.4,6.9,3.2,Reprovado
Laura,5.1,3.5,5.3,4.3,4.6,Reprovado
Daniel,7.3,2.6,1.7,4.5,4.0,Reprovado
Clara,8.5,8.8,9.9,8.5,8.9,Aprovado


#**Formatando a cor da letra em uma Tabela**

Numa tabela com as informações das notas é importante realçar os alunos com baixo rendimento e os alunos com um bom rendimento. 

Para isso criamos uma função para definir alguns critérios, aqui vamos mudar a cor da fonte para vermelho para os alunos que tiveram nota inferior a 5 e azul para os alunos com nota acima ou igual a 5.

Criamos uma função para colorir a situação dos alunos (aprovado ou reprovado).

Depois utilizamos o 'style.applymap' para aplicar as funções criadas. O comando 'format' utlizamos para formatar os números.

In [16]:
def cores (notas):
    color = 'red' if notas <5 else 'blue'
    return 'color: %s' % color 
 
def cor(val):
    return 'color: %s' % ('blue' if val in {"Aprovado"} else 'red')

df1 = df.style.applymap(cores, subset=['P1','P2','P3','P4','MF'])\
            .applymap(cor, subset=['Situação'])\
            .format({"P1":"{:50,.2f}",
                  "P2":"{:50,.2f}",
                  "P3":"{:50,.2f}",
                  "P4":"{:50,.2f}",
                "MF":"{:50,.2f}"})
df1

Unnamed: 0,P1,P2,P3,P4,MF,Situação
Joaquim,5.5,5.3,5.6,8.5,6.2,Aprovado
Bruna,1.9,3.8,0.4,6.9,3.2,Reprovado
Laura,5.1,3.5,5.3,4.3,4.6,Reprovado
Daniel,7.3,2.6,1.7,4.5,4.0,Reprovado
Clara,8.5,8.8,9.9,8.5,8.9,Aprovado


##**Formatando a cor da célula em uma Tabela**

E se ao invés de mudar a cor da fonte, o interesse for em colorir a célula (cor de fundo), preciso aplicar a cor no background. Para isso utilizo o comando 'background_gradient',

In [17]:

df.style.format({"P1":"{:50,.2f}",
                  "P2":"{:50,.2f}",
                  "P3":"{:50,.2f}",
                  "P4":"{:50,.2f}",
                "MF":"{:50,.2f}"})\
        .background_gradient(cmap='Blues')

Unnamed: 0,P1,P2,P3,P4,MF,Situação
Joaquim,5.5,5.3,5.6,8.5,6.2,Aprovado
Bruna,1.9,3.8,0.4,6.9,3.2,Reprovado
Laura,5.1,3.5,5.3,4.3,4.6,Reprovado
Daniel,7.3,2.6,1.7,4.5,4.0,Reprovado
Clara,8.5,8.8,9.9,8.5,8.9,Aprovado


E se você quiser mudar a cor da célula, utilizando um critério próprio, é preciso criar uma função definindo esse critério e no 'return' aplicamos a cor no background ('background-color').

In [18]:
def cores (notas):
    color = '#FF9185' if notas <5 else 'lightblue'
    return 'background-color: %s' % color 

df1 = df.style.applymap(cores, subset=['P1','P2','P3','P4','MF'])\
            .applymap(cor, subset=['Situação'])\
            .format({"P1":"{:50,.2f}",
                  "P2":"{:50,.2f}",
                  "P3":"{:50,.2f}",
                  "P4":"{:50,.2f}",
                "MF":"{:50,.2f}"})
df1

Unnamed: 0,P1,P2,P3,P4,MF,Situação
Joaquim,5.5,5.3,5.6,8.5,6.2,Aprovado
Bruna,1.9,3.8,0.4,6.9,3.2,Reprovado
Laura,5.1,3.5,5.3,4.3,4.6,Reprovado
Daniel,7.3,2.6,1.7,4.5,4.0,Reprovado
Clara,8.5,8.8,9.9,8.5,8.9,Aprovado


##**Adicionando uma barra nas linhas da Tabela**

Uma maneira interessante de formatar uma tabela é acrescentando uma barra nas células. Para isso utilizamos o comando 'style.bar'.

In [19]:
df.style.format({"P1":"{:20,.2f}",
                  "P2":"{:20,.2f}",
                  "P3":"{:20,.2f}",
                  "P4":"{:20,.2f}",
                  "MF":"{:20,.2f}"})\
          .bar(subset=["P1",], color='lightgreen',vmin=0,vmax=10)\
          .bar(subset=["P2",], color='#ee1f5f',vmin=0)\
          .bar(subset=["P3",], color='#FFA07A',vmin=0)\
          .bar(subset=["P4",], color='lightblue',vmin=0)\
          .bar(subset=["MF",], color='#c8a2c8 ',vmin=0)\

Unnamed: 0,P1,P2,P3,P4,MF,Situação
Joaquim,5.5,5.3,5.6,8.5,6.2,Aprovado
Bruna,1.9,3.8,0.4,6.9,3.2,Reprovado
Laura,5.1,3.5,5.3,4.3,4.6,Reprovado
Daniel,7.3,2.6,1.7,4.5,4.0,Reprovado
Clara,8.5,8.8,9.9,8.5,8.9,Aprovado


In [20]:
df.style.format({"P1":"{:20,.2f}",
                  "P2":"{:20,.2f}",
                  "P3":"{:20,.2f}",
                  "P4":"{:20,.2f}",
                  "MF":"{:20,.2f}"})\
          .bar(subset=["P1","P2","P3","P4","MF"], color='#FF9185 ',vmin=0,vmax=5)\
          .bar(subset=["P1","P2","P3","P4","MF"], color='lightblue',vmin=5,vmax=10)\

Unnamed: 0,P1,P2,P3,P4,MF,Situação
Joaquim,5.5,5.3,5.6,8.5,6.2,Aprovado
Bruna,1.9,3.8,0.4,6.9,3.2,Reprovado
Laura,5.1,3.5,5.3,4.3,4.6,Reprovado
Daniel,7.3,2.6,1.7,4.5,4.0,Reprovado
Clara,8.5,8.8,9.9,8.5,8.9,Aprovado


##**Links Úteis**

https://pandas.pydata.org/pandas-docs/stable/user_guide/style.html