<a href="https://colab.research.google.com/github/MargaridaVitolo/Educ360/blob/main/Python%20-%20Semana%205/Semana_5_Plotly.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Atividade 1 - Plotly

In [None]:
import pandas as pd
import plotly.express as px

df = pd.read_csv('https://raw.githubusercontent.com/profivan-ai/cdb-Python/refs/heads/main/arquivos/vendas_loja.csv',sep=',')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 50 entries, 0 to 49
Data columns (total 6 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   ID         50 non-null     int64  
 1   Produto    50 non-null     object 
 2   Categoria  50 non-null     object 
 3   Regiao     49 non-null     object 
 4   Vendas     44 non-null     float64
 5   Mes        50 non-null     object 
dtypes: float64(1), int64(1), object(4)
memory usage: 2.5+ KB


In [None]:
# verificar nulos
df.isnull().sum()

Unnamed: 0,0
ID,0
Produto,0
Categoria,0
Regiao,1
Vendas,6
Mes,0


In [None]:
# preencher Região com 'Não informado
df['Regiao'] = df['Regiao'].fillna('Não Informado')

In [None]:
# preencher com zeros
df['Vendas'] = df['Vendas'].fillna(0)
display(df.isnull().sum())

Unnamed: 0,0
ID,0
Produto,0
Categoria,0
Regiao,0
Vendas,0
Mes,0


In [None]:
# gráfico de barras com o total de vendas por categoria

df_vendas = df.groupby('Categoria', sort=True).agg({'Vendas':'sum'}).sort_values(by='Vendas', ascending=False).reset_index()
fig = px.bar(df_vendas,
             x='Categoria',
             y='Vendas',
             title='Total de vendas por categoria',
             color='Categoria',
             text='Vendas',
             labels={'Vendas': 'Vendas (R$)'},
             color_discrete_sequence=px.colors.qualitative.Pastel
             )

fig.update_layout(title_x=0.5, title_xanchor='center')
fig.show()


In [None]:
# gráfico de pizza com a distribuição de vendas por região
import plotly.graph_objects as go
df_vnd_regiao = df.groupby('Regiao', sort=True).agg({'Vendas':'sum'}).sort_values(by='Vendas', ascending=False).reset_index()

# Encontrar índice da maior venda
idx_maior = df_vnd_regiao['Vendas'].idxmax()

# Criar lista de pull, destacando apenas a maior fatia com valor 0.1, as outras 0
pulls = [0.1 if i == idx_maior else 0 for i in range(len(df_vnd_regiao))]

fig=go.Figure(
    data=[
        go.Pie(
            labels=df_vnd_regiao['Regiao'],
            values=df_vnd_regiao['Vendas'],
            title_font_size=20,
            title='Distribuição de vendas por região',
            name='Vendas',
            textinfo='label+percent',  # mostra nomes e percentuais juntos
            textposition='outside',    # tudo fora
            pull=pulls)])
fig.show()

In [None]:
# gráfico de linhas com a evolução das vendas ao longo dos meses, com meses ordenados
# Definir a ordem dos meses
ordem_meses = ["Jan", "Feb", "Mar", "Abr", "Mai", "Jun", "Jul", "Ago", "Set", "Out", "Nov", "Dez"]

# Transformar a coluna Mes em categoria ordenada
df['Mes'] = pd.Categorical(df['Mes'], categories=ordem_meses, ordered=True)

# observed=False para eliminar o warning
# Agrupar e somar as vendas por mês
df_vnd_mes = df.groupby('Mes', observed=False, sort=True).agg({'Vendas':'sum'}).reset_index()

# Ordenar pelo índice da categoria (a ordem dos meses)
df_vnd_mes = df_vnd_mes.sort_values('Mes')

# Create the line chart using Plotly Express
fig=px.line(
    df_vnd_mes,
    x='Mes',
    y='Vendas',
    title='Evolução de vendas ao longo dos meses',
    labels={'Vendas': 'Vendas (R$)', 'Mes': 'Meses'},
    markers=True,
    hover_name='Vendas'
)

# Colocar o texto acima dos pontos - usar a biblioteca graph_objects
import plotly.graph_objects as go

fig.add_trace(go.Scatter(
    x=df_vnd_mes['Mes'],
    y=df_vnd_mes['Vendas'],
    mode='text',
    text=df_vnd_mes['Vendas'],
    textposition='top center',
    showlegend=False
))

fig.update_layout(title_x=0.5, title_xanchor='center')
fig.show()

###Atividade 2 - Plotly

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px

df2 = pd.read_csv('https://raw.githubusercontent.com/profivan-ai/cdb-Python/refs/heads/main/arquivos/pacientes.csv',sep=',')
df2.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 70 entries, 0 to 69
Data columns (total 8 columns):
 #   Column   Non-Null Count  Dtype  
---  ------   --------------  -----  
 0   ID       70 non-null     int64  
 1   Nome     70 non-null     object 
 2   Idade    70 non-null     int64  
 3   Genero   70 non-null     object 
 4   Peso     70 non-null     int64  
 5   Glicose  62 non-null     float64
 6   Pressao  65 non-null     float64
 7   Mes      70 non-null     object 
dtypes: float64(2), int64(3), object(3)
memory usage: 4.5+ KB


In [None]:
# verificar nulos
df2.isnull().sum()

#valores nulos em glicose e pressao serão preenchidos com a média
# código abaixo para eliminar o warning do inplace=True
df2['Glicose'] = df2['Glicose'].fillna(df2['Glicose'].mean())
df2['Pressao'] = df2['Pressao'].fillna(df2['Pressao'].mean())

df2.isnull().sum()

Unnamed: 0,0
ID,0
Nome,0
Idade,0
Genero,0
Peso,0
Glicose,0
Pressao,0
Mes,0


In [None]:
def faixa_etaria(Idade):
    if Idade <= 30:
        return 'Até 30'
    elif Idade > 30 and Idade <= 40:
        return '31 - 40'
    elif Idade > 40 and Idade <= 50:
        return '41 - 50'
    elif Idade > 50 and Idade <= 60:
        return '51 - 60'
    else:
        return '60+'

In [None]:
glicose_idade=df2.groupby(df2['Idade'].apply(faixa_etaria))['Glicose'].mean()
print(glicose_idade)

Idade
31 - 40     93.958710
41 - 50    101.393888
51 - 60    108.096774
60+        109.580645
Até 30      86.400000
Name: Glicose, dtype: float64


In [None]:
# gráfico de barras com a média de glicose por faixa etária
import numpy as np
#define a ordem do eixo x (de acordo com a idade)
fx_etaria_ordem = ['Até 30', '31 - 40', '41 - 50', '51 - 60', '60+']

# Reordenar usando a variável criada glicose_idade
glicose_idade = glicose_idade.reindex(fx_etaria_ordem)
glicose_idade = glicose_idade.round(2)

fig = px.bar(
    glicose_idade,
    x=glicose_idade.index,
    y=glicose_idade.values,
    title='Média de Glicose por Faixa Etária',
    labels={'value': 'Glicose (mg/dL)', 'index': 'Faixa Etária'},
    color=glicose_idade,
    text=glicose_idade.values,
    text_auto=True
)

fig.update_layout(title_x=0.5, title_xanchor='center')
fig.show()



In [None]:
# gráfico de pizza com a proporção de pacientes por gênero
import plotly.express as px

# Calcula o nr de pacientes de cada gênero
nr_genero = df2['Genero'].value_counts().reset_index()
nr_genero.columns = ['Genero', 'Qtde']

fig=px.pie(
    nr_genero,
    names='Genero',
    values='Qtde',
    title='Proporção de Pacientes por Gênero',
    hole=0.3,
    color_discrete_sequence=px.colors.qualitative.Pastel
)

fig.update_layout(title_x=0.5, title_xanchor='center')
fig.show()

In [None]:
# Gráfico de linhas com a Evolução média da pressão arterial por mês
# Definir a ordem dos meses
ordem_meses = ["Jan", "Fev", "Mar", "Abr", "Mai", "Jun", "Jul", "Ago", "Set", "Out", "Nov", "Dez"]

# Transformar a coluna Mes em categoria ordenada
df2['Mes'] = pd.Categorical(df2['Mes'], categories=ordem_meses, ordered=True)

# observed=False para eliminar o warning
df2_med_mes = df2.groupby('Mes', observed=False)['Pressao'].mean()

#Calcular a média de pressão para preencher os meses que não tem registro
med_pressao = df2['Pressao'].mean()

# preencher os meses que não tem informação com essa média
df2_med_mes = df2_med_mes.fillna(med_pressao)

df2_med_mes = df2_med_mes.sort_index().reset_index()

# Ordenar pelo índice da categoria (a ordem dos meses)
df2_med_mes = df2_med_mes.sort_values('Mes')

# Criar o grafico usando o Plotly Express
fig=px.line(
    df2_med_mes,
    x='Mes',
    y='Pressao',
    title='Evolução Média da Pressão Arterial por Mês',
    labels={'Pressao': 'Pressão arterial (mg/dL)', 'Mes': 'Meses'},
    markers=True,
    hover_name='Pressao'
)

# Colocar o texto acima dos pontos - usar a biblioteca graph_objects
import plotly.graph_objects as go

fig.add_trace(go.Scatter(
    x=df2_med_mes['Mes'],
    y=df2_med_mes['Pressao'],
    mode='text',
    #garantir duas casas decimais na apresentação dos valores
    text=[f'{val:.2f}'for val in df2_med_mes['Pressao']],
    textposition='top left',
    showlegend=False
))

fig.update_layout(title_x=0.5, title_xanchor='center')
fig.show()

