#**Criando tabula√ß√µes com pivot_table**


###**Carregando os dados**

In [None]:
import pandas as pd

In [None]:
df = pd.read_csv('https://raw.githubusercontent.com/alura-cursos/python_dados/refs/heads/main/Dados/contagem_bicicletas.csv')

Neste conjunto de dados, temos informa√ß√µes sobre uma empresa que realiza o aluguel de bicicletas. O DataFrame cont√©m registros detalhados, como o n√∫mero de bicicletas alugadas por dia e hor√°rio, condi√ß√µes clim√°ticas e informa√ß√µes sobre finais feriados e finais de semana:

In [None]:
df.head()

Unnamed: 0,data_hora,contagem,temperatura,sensacao_termica,umidade,velocidade_vento,clima,feriado,fim_de_semana,estacao
0,2015-01-04 00:00:00,182,3.0,2.0,93.0,6.0,Nublado,N√£o,Sim,Inverno
1,2015-01-04 01:00:00,138,2.75,2.25,93.0,5.0,C√©u limpo,N√£o,Sim,Inverno
2,2015-01-04 02:00:00,134,2.5,2.5,96.5,0.0,C√©u limpo,N√£o,Sim,Inverno
3,2015-01-04 03:00:00,72,2.0,2.0,100.0,0.0,C√©u limpo,N√£o,Sim,Inverno
4,2015-01-04 04:00:00,47,2.0,2.0,93.0,6.5,C√©u limpo,N√£o,Sim,Inverno


###**Utilizando o m√©todo pivot_table**

O m√©todo [pivot_table()](https://pandas.pydata.org/docs/reference/api/pandas.pivot_table.html) permite agrupar e reorganizar os dados de maneira semelhante a uma tabela din√¢mica. Embora chegue aos mesmos resultados do `groupby()` ele oferece vantagens adicionais que podem facilitar a an√°lise, as quais vamos explorar ao longo deste curso.

Vamos come√ßar criando uma tabela que mostre a m√©dia de bicicletas alugadas por tipo de clima. Para isso, precisamos especificar o dataframe que estamos utilizando, a coluna que cont√©m os valores a serem analisados (neste caso, a coluna `contagem`), e a coluna que ser√° usada como √≠ndice, que ser√° a coluna `clima`. O `pivot_table()` calcula automaticamente a m√©dia, pois essa √© a fun√ß√£o de agrega√ß√£o padr√£o. Portanto, o √∫nico passo necess√°rio √© indicar essas informa√ß√µes, e o `pivot_table()` cuidar√° do restante:



In [None]:
pivot_clima = pd.pivot_table(df, values='contagem', index='clima')
pivot_clima

Unnamed: 0_level_0,contagem
clima,Unnamed: 1_level_1
Chuva com trovoadas,583.428571
Chuva leve,712.966371
C√©u limpo,1162.088943
Neve,250.85
Nublado,1195.124472
Parcialmente nublado,1266.925791


Al√©m da m√©dia, que √© calculada por padr√£o, √© poss√≠vel personalizar as opera√ß√µes realizadas atrav√©s do uso de diferentes m√©todos como a soma `sum()` para obter insights espec√≠ficos:

In [None]:
pivot_clima = pd.pivot_table(df, values='contagem', index='clima', aggfunc='sum')
pivot_clima

Unnamed: 0_level_0,contagem
clima,Unnamed: 1_level_1
Chuva com trovoadas,8168
Chuva leve,1526461
C√©u limpo,7146847
Neve,15051
Nublado,4243887
Parcialmente nublado,6965558


>üë©‚Äçüíª***Dica da Val:*** Podemos ordenar os dados para tornar a an√°lise mais clara e intuitiva, com uso do m√©todo `sort_values(ascending=False)`.

Tamb√©m podemos criar uma tabela multi-index, adicionando mais de uma coluna ao `index`:

In [None]:
pivot_clima_estacao = pd.pivot_table(df, values='contagem', index=['estacao', 'clima'], aggfunc='mean')
pivot_clima_estacao

Unnamed: 0_level_0,Unnamed: 1_level_0,contagem
estacao,clima,Unnamed: 2_level_1
Inverno,Chuva com trovoadas,228.0
Inverno,Chuva leve,542.968153
Inverno,C√©u limpo,760.163115
Inverno,Neve,318.409091
Inverno,Nublado,971.990635
Inverno,Parcialmente nublado,908.79607
Outono,Chuva com trovoadas,242.0
Outono,Chuva leve,788.809249
Outono,C√©u limpo,1130.973451
Outono,Neve,59.3


Se quisermos reorganizar a estrutura da tabela, o processo √© bem simples. Podemos definir as colunas utilizando o par√¢metro `columns`:

In [None]:
pivot_clima_estacao = pd.pivot_table(df, values='contagem', index=['estacao'], columns=['clima'], aggfunc='mean')
pivot_clima_estacao

clima,Chuva com trovoadas,Chuva leve,C√©u limpo,Neve,Nublado,Parcialmente nublado
estacao,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
Inverno,228.0,542.968153,760.163115,318.409091,971.990635,908.79607
Outono,242.0,788.809249,1130.973451,59.3,1281.383778,1304.220484
Primavera,798.428571,677.873162,1144.472603,74.666667,1162.028607,1199.101483
Ver√£o,421.8,905.16,1471.312843,,1393.618065,1688.683146


Para realizar m√∫ltiplas agrega√ß√µes, podemos usar o par√¢metro `aggfunc` e especificar uma fun√ß√£o de agrega√ß√£o diferente para cada coluna, atrav√©s de um dicion√°rio. No exemplo abaixo, estamos aplicando a soma para a coluna `contagem` e a m√©dia para as colunas `temperatura`, `sensa√ß√£o t√©rmica` e `umidade`:

In [None]:
pivot_agregacoes = df.pivot_table(
    index=['estacao', 'clima'],
    values=['contagem', 'temperatura', 'sensacao_termica', 'umidade'],
    aggfunc={
        'contagem': 'sum',
        'temperatura': 'mean',
        'sensacao_termica': 'mean',
        'umidade': 'mean'
    }
)
pivot_agregacoes

Unnamed: 0_level_0,Unnamed: 1_level_0,contagem,sensacao_termica,temperatura,umidade
estacao,clima,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
Inverno,Chuva com trovoadas,228,6.5,10.0,88.0
Inverno,Chuva leve,340984,7.188296,9.046576,83.73965
Inverno,C√©u limpo,927399,3.811066,6.022336,76.006148
Inverno,Neve,14010,1.568182,4.375,87.829545
Inverno,Nublado,934083,7.008585,8.754422,78.369927
Inverno,Parcialmente nublado,1341383,5.933096,7.887873,76.405149
Outono,Chuva com trovoadas,242,18.5,18.5,91.0
Outono,Chuva leve,409392,12.222543,12.830443,84.075145
Outono,C√©u limpo,1533600,11.516962,12.233776,74.282448
Outono,Neve,593,3.8,7.4,91.55


>
üë©‚Äçüíª***Dica da Val:*** Ap√≥s a agrega√ß√£o, podemos renomear as colunas para torn√°-las mais descritivas e intuitivas.

Com o `pivot_table()`, tamb√©m podemos ativar a op√ß√£o `margins=True`, que adiciona automaticamente uma linha e uma coluna ao final da tabela, exibindo os valores gerais para cada m√©trica. Dependendo da fun√ß√£o de agrega√ß√£o utilizada, o comportamento ser√° o seguinte: se for aplicada a m√©dia, ele calcular√° a m√©dia de todas as linhas e colunas; se for utilizada a soma, ele somar√° os valores; se for o valor m√≠nimo, ele mostrar√° o menor valor de cada linha e coluna, e assim por diante. Esse recurso facilita a visualiza√ß√£o dos totais e resumos das m√©tricas na tabela.

No exemplo abaixo, como estamos utilizando a fun√ß√£o de soma, ele somou os valores de todas as linhas e colunas.

Essa funcionalidade √© √∫til para obter uma vis√£o r√°pida do comportamento geral dos dados, sem precisar de c√°lculos adicionais.

Al√©m disso, o `pivot_table()` oferece o par√¢metro `fill_value`, que preenche os valores nulos (NaN) com um valor especificado, como 0, por exemplo, o que ajuda a evitar lacunas nos resultados:

In [None]:
pivot_table = df.pivot_table(
    index='estacao',
    columns='clima',
    values='contagem',
    aggfunc={'contagem': 'sum'},
    margins=True,
    margins_name='Total',
    fill_value=0
)
pivot_table

clima,Chuva com trovoadas,Chuva leve,C√©u limpo,Neve,Nublado,Parcialmente nublado,Total
estacao,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
Inverno,228,340984,927399,14010,934083,1341383,3558087
Outono,242,409392,1533600,593,1295479,1833734,5073040
Primavera,5589,368763,2005116,448,934271,1536049,4850236
Ver√£o,2109,407322,2680732,0,1080054,2254392,6424609
Total,8168,1526461,7146847,15051,4243887,6965558,19905972


Com isso, podemos concluir que o `pivot_table()` √© bastante flex√≠vel, permitindo agrupar dados, aplicar fun√ß√µes de agrega√ß√£o e ainda adicionar totais gerais com o par√¢metro margins. Al√©m de lidar com valores nulos de forma simples.

