### Relatório de Análise Estratégica

##### Importar bibliotecas e carregar dados

In [2]:
# Importando as bibliotecas
import pandas as pd
import plotly.express as px

# Carregando os dados
df = pd.read_csv("../data/raw/SalesDataset.csv")

#### Questões de Negócio
1. Quais são as 5 categorias e subcategorias com maior volume de vendas?
2. Dentro de cada categoria, quais subcategorias geram mais lucro?
3. Quais estados e cidades apresentam o maior desempenho em vendas e lucro?

##### Questão de negócio 1 - Quais são as 5 categorias e subcategorias com maior volume de vendas?

In [23]:
# Somando as vendas agrupadas por Categoria e Subcategoria
vendas = df.groupby(['Category', 'Sub-Category'])['Amount'].sum().reset_index()

# Selecionando as 5 maiores em volume de vendas
top5 = vendas.sort_values(by='Amount', ascending=False).head(5)

# Criando o gráfico de barras
fig = px.bar(
    top5,
    x='Sub-Category',
    y='Amount',
    color='Category',  # Cor para diferenciar as categorias
    title='Top 5 Subcategorias mais vendidas',
    labels={'Amount': 'Vendas ($)', 'Sub-Category': 'Subcategoria'},
    text='Amount'  # Mostra os valores em cima das barras
)

# Formatando os valores no gráfico
fig.update_traces(texttemplate='$%{text:,.0f}', textposition='outside')
fig.update_layout(yaxis_tickprefix='$')

# Exibindo o gráfico
fig.show()

##### Questão de negócio 2 - Dentro de cada categoria, quais subcategorias geram mais lucro?

In [21]:
# Somando o lucro por Categoria e Subcategoria
lucros = df.groupby(['Category', 'Sub-Category'])['Profit'].sum().reset_index()

# Selecionando a Subcategoria mais lucrativa dentro de cada Categoria
mais_lucrativas = lucros.sort_values(by='Profit', ascending=False).groupby('Category').head(1)

# Ordenando do maior para o menor lucro
mais_lucrativas = mais_lucrativas.sort_values(by='Profit', ascending=True)

# Mostrando tabela
print("Subcategorias com maior lucro dentro de cada categoria:")
display(mais_lucrativas)

# Criando gráfico de barras horizontal
fig = px.bar(
    mais_lucrativas,
    y='Sub-Category',
    x='Profit',
    color='Category',
    orientation='h',
    title='Subcategorias mais lucrativas por Categoria',
    labels={'Profit': 'Lucro ($)', 'Sub-Category': 'Subcategoria'},
    text='Profit'
)

# Ajustando a formatação
fig.update_traces(texttemplate='$%{text:,.0f}', textposition='outside')
fig.update_layout(xaxis_tickprefix='$')

# Exibindo o gráfico
fig.show()

Subcategorias com maior lucro dentro de cada categoria:


Unnamed: 0,Category,Sub-Category,Profit
0,Electronics,Electronic Games,148454
7,Furniture,Tables,156796
9,Office Supplies,Markers,174749


##### Questão de negócio 3 - Quais estados e cidades apresentam o maior desempenho em vendas e lucro?

In [46]:
# Agrupando por Estado e Cidade, somando Vendas e Lucro
desempenho = df.groupby(['State', 'City'])[['Amount', 'Profit']].sum().reset_index()

# Selecionando as 10 cidades com maior valor de Vendas
top_vendas = desempenho.sort_values(by='Amount', ascending=False).head(10)

# Selecionando as 10 cidades com maior Lucro
top_lucro = desempenho.sort_values(by='Profit', ascending=False).head(10)

# Ordenando os dados para o gráfico horizontal
top_vendas = top_vendas.sort_values(by='Amount', ascending=True)
top_lucro = top_lucro.sort_values(by='Profit', ascending=True)

In [48]:
# Gráfico 1: cidades com maior volume de vendas
fig1 = px.bar(
    top_vendas,
    y='City',
    x='Amount',
    color='State',
    orientation='h',
    title='Top 10 Cidades com maior Volume de Vendas',
    labels={'Amount': 'Vendas Totais ($)', 'City': 'Cidade'},
    text='Amount'
)

fig1.update_traces(texttemplate='$%{text:,.0f}', textposition='outside')
fig1.update_layout(xaxis_tickprefix='$')
fig1.show()

In [51]:
# Gráfico 2: Cidades com maior lucro
fig2 = px.bar(
    top_lucro,
    y='City',
    x='Profit',
    color='State',
    orientation='h',
    title='Top 10 Cidades com maior Lucro',
    labels={'Profit': 'Lucro Total ($)', 'City': 'Cidade'},
    text='Profit'
)

fig2.update_traces(texttemplate='$%{text:,.0f}', textposition='outside')
fig2.update_layout(xaxis_tickprefix='$')
fig2.show()