### Relatório de Análise Estratégica

##### Importar bibliotecas e carregar dados

In [1]:
# Importando as bibliotecas
import pandas as pd
import plotly.express as px

# Carregando os dados
df = pd.read_csv("../data/raw/SalesDataset.csv")

##### Questão de negócio 1 - Quais são as 5 categorias e subcategorias mais vendidas?

In [5]:
# Agrupando por categoria e subcategoria, somando as vendas
vendas_por_subcategoria = df.groupby(['Category', 'Sub-Category'])['Amount'].sum().reset_index()

# Selecionando as 5 combinações mais vendidas
top5 = vendas_por_subcategoria.nlargest(5, 'Amount')

# Mostrando a tabela com os resultados
print("Top 5 Categorias/Subcategorias por Vendas:")
display(top5)

# Criando gráfico de barras
fig = px.bar(
    top5,
    x='Sub-Category',
    y='Amount',
    color='Category',
    title='Top 5 Subcategorias mais vendidas por Categoria',
    labels={'Amount': 'Vendas Totais ($)', 'Sub-Category': 'Subcategoria'},
    text='Amount'
)

# Ajustando formatação
fig.update_layout(
    yaxis_tickprefix='$',  
    xaxis_title='Subcategoria',
    yaxis_title='Vendas Totais',
    hovermode='x' 
)
fig.update_traces(texttemplate='$%{text:,.0f}', textposition='outside')

# Mostrando o gráfico
fig.show()

Top 5 Categorias/Subcategorias por Vendas:


Unnamed: 0,Category,Sub-Category,Amount
9,Office Supplies,Markers,627875
7,Furniture,Tables,625177
6,Furniture,Sofas,568367
3,Electronics,Printers,566359
0,Electronics,Electronic Games,565092


##### Questão de negócio 2 - Quais subcategorias têm o maior lucro dentro de cada categoria?

In [8]:
# Agrupando por categoria e subcategoria, somando seu lucro total
lucro_por_subcategoria = df.groupby(['Category', 'Sub-Category'])['Profit'].sum().reset_index()

# Encontrando a subcategoria com maior lucro em cada categoria
top_subcategorias = lucro_por_subcategoria.sort_values('Profit', ascending=False).groupby('Category').head(3)

# Mostrando os resultados em tabela
print("Subcategorias com maior lucro em cada categoria:")
display(top_subcategorias)

# Criando visualização
fig = px.bar(
    top_subcategorias,
    x='Sub-Category',
    y='Profit',
    color='Category',
    title='Subcategorias com maior Lucro em cada Categoria',
    labels={'Profit': 'Lucro Total ($)', 'Category': 'Categoria'},
    text='Profit'
)

# Ajustando formatação
fig.update_traces(texttemplate='$%{text:,.0f}', textposition='outside')
fig.update_layout(yaxis_tickprefix='$')

# Mostrando o gráfico
fig.show()

Subcategorias com maior lucro em cada categoria:


Unnamed: 0,Category,Sub-Category,Profit
9,Office Supplies,Markers,174749
7,Furniture,Tables,156796
10,Office Supplies,Paper,149723
0,Electronics,Electronic Games,148454
3,Electronics,Printers,146259
6,Furniture,Sofas,142854
11,Office Supplies,Pens,129846
5,Furniture,Chairs,122892
2,Electronics,Phones,113607


##### Questão de negócio 3 - Quais estados e cidades geram maior volume de vendas e lucro?

In [None]:
# Calculando métricas por estado
estados = df.groupby('State').agg(
    Vendas=('Amount', 'sum'),
    Lucro=('Profit', 'sum')
).nlargest(5, 'Vendas').reset_index()

# Calculando métricas por cidade
cidades = df.groupby(['State', 'City']).agg(
    Vendas=('Amount', 'sum'),
    Lucro=('Profit', 'sum')
).nlargest(10, 'Vendas').reset_index()

# Gráfico de estados
fig1 = px.bar(estados,
             x='State',
             y='Vendas',
             title='Top 10 Estados por volume de Vendas',
             labels={'State': 'Estado', 'Vendas': 'Vendas Totais ($)'},
             text='Vendas',
             color='Lucro')  

fig1.update_traces(texttemplate='$%{text:,.0f}', textposition='outside')
fig1.update_layout(yaxis_tickprefix='$')

# Gráfico de cidades
fig2 = px.bar(cidades,
             y='City',
             x='Vendas',
             title='Top 10 Cidades por Volume de Vendas',
             labels={'City': 'Cidade', 'Vendas': 'Vendas Totais ($)'},
             text='Vendas',
             color='State',
             hover_data=['State', 'Lucro'],
             orientation='h')

fig2.update_traces(texttemplate='$%{text:,.0f}', textposition='outside')
fig2.update_layout(
    yaxis={'categoryorder':'total ascending'},
    xaxis_tickprefix='$',
    height=500 
)

# Exibindo tabelas
print("Top 5 Estados:")
display(estados)

print("\nTop 10 Cidades:")
display(cidades)

# Mostrando gráficos
fig1.show()
fig2.show()

Top 5 Estados:


Unnamed: 0,State,Vendas,Lucro
0,New York,1130048,308506
1,Florida,1091174,308706
2,California,1086436,278814
3,Texas,1011475,257780
4,Illinois,978738,240372



Top 10 Cidades:


Unnamed: 0,State,City,Vendas,Lucro
0,Florida,Orlando,452158,128125
1,California,San Francisco,440000,108106
2,New York,Buffalo,418514,111823
3,New York,Rochester,407291,109729
4,Texas,Dallas,390144,102483
5,California,San Diego,389104,101444
6,Florida,Miami,370881,109739
7,Illinois,Springfield,370131,84205
8,Illinois,Chicago,344675,80061
9,Texas,Austin,335199,82638
