# Consumo de Cerveja em São Paulo

In [40]:
#Bibliotecas básicas
import numpy as np
import pandas as pd

#Bibliotecas para vizualização
import plotly.express as px
import plotly.graph_objects as go
import seaborn as sns
import plotly as py
import matplotlib.pyplot as plt

In [13]:
# Importando dataset
df = pd.read_csv(r"C:\Users\Pedro\Documents\Consumo-de-cerveja\Consumo_cerveja.csv", decimal=",")
df

Unnamed: 0,Data,Temperatura Media (C),Temperatura Minima (C),Temperatura Maxima (C),Precipitacao (mm),Final de Semana,Consumo de cerveja (litros)
0,2015-01-01,27.30,23.9,32.5,0.0,0.0,25.461
1,2015-01-02,27.02,24.5,33.5,0.0,0.0,28.972
2,2015-01-03,24.82,22.4,29.9,0.0,1.0,30.814
3,2015-01-04,23.98,21.5,28.6,1.2,1.0,29.799
4,2015-01-05,23.82,21.0,28.3,0.0,0.0,28.900
...,...,...,...,...,...,...,...
936,,,,,,,
937,,,,,,,
938,,,,,,,
939,,,,,,,


In [14]:
# Nomiando as colunas para melhor uso
df.columns = ['Data', 'Temp_Media', 'Temp_Min', 'Temp_Max', 'Precipitacao', 'Final_de_semana', 'Consumo_em_litros']

In [15]:
# Checando as colunas
df.isnull().sum()

Data                 576
Temp_Media           576
Temp_Min             576
Temp_Max             576
Precipitacao         576
Final_de_semana      576
Consumo_em_litros    576
dtype: int64

# Explorando os dados

### Quantos litros de cerveja foi consumido no geral nos finais de semana e dias de semana? 

In [17]:
# Descartando as linhas depois que o ano termina, não há informações fornecidas, apenas valores nulos
df =  df.dropna()

df['Consumo_em_litros'] = pd.to_numeric(df['Consumo_em_litros'])

In [24]:
Dias_da_Semana = sum(df[df.Final_de_semana == 0]['Consumo_em_litros'])
Final_de_Semana = sum(df[df.Final_de_semana==1]['Consumo_em_litros'])

labels = ['dias_da_semana','final_de_semana']
values = [Dias_da_Semana, Final_de_Semana]
colors = ['bisque']

fig = go.Figure(data=[go.Bar(
    x=labels, y=values, marker_color= colors
)])
fig.show()

### Quanta cerveja foi consumida em média por dia da semana? 

In [25]:
df['Data'] = pd.to_datetime(df['Data'])

df['Mes'] = df['Data'].apply(lambda x: x.strftime('%B'))
df['Dia'] = df['Data'].apply(lambda x: x.strftime('%A'))

In [26]:
df.head()

Unnamed: 0,Data,Temp_Media,Temp_Min,Temp_Max,Precipitacao,Final_de_semana,Consumo_em_litros,Mes,Dia
0,2015-01-01,27.3,23.9,32.5,0.0,0.0,25.461,January,Thursday
1,2015-01-02,27.02,24.5,33.5,0.0,0.0,28.972,January,Friday
2,2015-01-03,24.82,22.4,29.9,0.0,1.0,30.814,January,Saturday
3,2015-01-04,23.98,21.5,28.6,1.2,1.0,29.799,January,Sunday
4,2015-01-05,23.82,21.0,28.3,0.0,0.0,28.9,January,Monday


In [29]:
fig = px.box(df, x="Dia", y="Consumo_em_litros", color="Dia", orientation='v', notched=True, title = 'Consumo de cerveja nos dias da semana')

fig.show()

### Consumo de cerveja por mês

In [31]:
fig = px.box(df, x="Mes", y="Consumo_em_litros", color="Mes", orientation='v', notched=True, title = 'Consumo de cerveja por Mês')

fig.show()

### Análise da temperatura em São Paulo por Mês

In [33]:
fig = go.Figure()

fig.add_trace(go.Scatter(x=df['Data'], y=df['Temp_Min'], name='Temperatura Minima',
                         line=dict(color='royalblue', width=3)))
fig.add_trace(go.Scatter(x=df['Data'], y=df['Temp_Max'], name = 'Temperatura Maxima',
                         line=dict(color='crimson', width=3)))
fig.add_trace(go.Scatter(x=df['Data'], y=df['Temp_Media'], name='Temperatura Media',
                         line=dict(color='orange', width=3,
                              dash='dash') 
))



fig.update_layout(title='Temperatura em toda grande São Paulo',
                   xaxis_title='Data',
                   yaxis_title='Temperatura em (graus C )')


fig.show()

### Análise da temperatura de São Paulo por meio das estações do ano

In [54]:
seasons_map = {
    'January': 'Verão',
    'February': 'Verão',
    'March': 'Verão',
    'April': 'Outono',
    'May': 'Outono',
    'June': 'Inverno',
    'July': 'Inverno',
    'August': 'Inverno',
    'September': 'Inverno',
    'October': 'Primavera',
    'November': 'Primavera',
    'December': 'Verão'
    
}


df['Estações'] = df['Mes'].apply(lambda x: seasons_map[x])

In [61]:
fig = px.box(df, x="Estações", y="Consumo_em_litros", color="Estações", orientation='v', notched=True, title = 'Consumo de cerveja nas estações do ano')

fig.show()