## Introdução

Este notebook realiza uma análise exploratória de dados de um dataset de vendas de um e-commerce. 
O objetivo é entender melhor o desempenho financeiro de diferentes categorias de produtos, 
identificar correlações entre variáveis e obter insights que possam ajudar na tomada de decisões.

In [45]:
# Carregamento de Dados
import pandas as pd 
import plotly.express as px 

# Carregar os dados
df = pd.read_csv("ecommerce_sales_analysis.csv")

## Limpeza de Dados
**Nesta seção, trata-se os valores nulos, ajusta-se tipos de dados, remove-se duplicatas e realiza-se outras operações necessárias para preparar os dados para a análise.**

In [46]:
# Limpeza de Dados
# Remover valores nulos
df.dropna(inplace=True)

# Verificar tipos de dados
df.dtypes

product_id          int64
product_name       object
category           object
price             float64
review_score      float64
review_count        int64
sales_month_1       int64
sales_month_2       int64
sales_month_3       int64
sales_month_4       int64
sales_month_5       int64
sales_month_6       int64
sales_month_7       int64
sales_month_8       int64
sales_month_9       int64
sales_month_10      int64
sales_month_11      int64
sales_month_12      int64
dtype: object

# Visualizações
**As visualizações ajuda a entender melhor os dados e comunicar os insights de maneira clara e eficaz. Nesta seção, foram criados gráficos detalhados para responder às perguntas da análise.**

## Análise de Produtos e Categorias

### 1. Quantos produtos únicos existem na base de dados?

Foi calculado o número total de produtos únicos na base de dados.

**Total de produtos únicos:** 1000

Essa contagem revela que há um total de 1000 produtos distintos registrados na base de dados. Conhecer o número de produtos únicos é fundamental para entender a amplitude e a diversidade da oferta disponível, bem como para realizar análises detalhadas sobre o portfólio de produtos e suas respectivas categorias.

In [47]:
num_unique_products = df['product_id'].nunique()

display(num_unique_products)


1000

### 2. Qual é a distribuição de produtos por categoria?

**Foi analisada a distribuição dos produtos em diferentes categorias.**

![Distribuição de Produtos por Categoria](graficos/dpc.png)

O gráfico revela a quantidade de produtos em cada categoria. As categorias com o maior número de produtos são, respectivamente: **Books**, **Sports** e **Toys**. Isso indica uma ampla variedade de opções disponíveis nessas categorias, sugerindo que elas são bastante diversificadas e bem abastecidas.

Em contraste, a categoria com a menor quantidade de produtos é **Home & Kitchen**. Essa menor quantidade pode indicar uma oferta mais limitada ou menor diversidade de produtos nesta categoria específica.

In [48]:
category_distribution = df.groupby('category').size().reset_index(name='Product Count')

# Gráfico de barras
fig = px.bar(category_distribution, 
             x='category', 
             y='Product Count', 
             title='Distribuição de Produtos por Categoria',
             labels={'category': 'Categoria', 'Product Count': 'Número de Produtos'},
             color_discrete_sequence=['red'])

# Layout para centralizar o título
fig.update_layout(
    title={
        'text': 'Distribuição de Produtos por Categoria',
        'x': 0.5,
        'xanchor': 'center',
        'font': {
            'size': 24,
            'color': 'black' 
        }
    }
)

fig.show()


# Análise de Preço

### 3. Qual é o preço médio dos produtos?

Foi calculado o preço médio dos produtos para fornecer uma visão geral do valor médio dos produtos disponíveis.

**Preço médio dos produtos:** R$ 247,68

Este valor representa o preço médio dos produtos no conjunto de dados analisado. Conhecer o preço médio pode ajudar a entender o posicionamento de preço geral dos produtos e fornecer uma referência para comparações com outras análises de mercado ou ajustes de estratégias de precificação.

In [49]:
average_price = df['price'].mean()

# Exibir o preço médio
display(f"{average_price:.2f}")

'247.68'

### 4. Como os preços variam entre diferentes categorias?

Foi analisada a variação dos preços entre as categorias de produtos.

![Variação de Preços por Categoria](/graficos/ppc.png)

Conforme ilustrado no gráfico, a categoria com o maior preço médio é **Health**, seguida pelas categorias **Sports** e **Books**. Isso indica que, em média, os produtos nas categorias de Saúde, Esportes e Livros tendem a ter preços mais altos.

Por outro lado, as categorias com os preços médios mais baixos são **Home & Kitchen**, **Electronics** e **Clothing**. Esses produtos têm preços médios mais acessíveis, indicando que os itens nessas categorias são geralmente mais baratos.

In [50]:
# Exibir o preço médio por categoria
price_by_category = df.groupby('category')['price'].mean().reset_index()
price_by_category.columns = ['Category', 'Average Price']
display(price_by_category)


Unnamed: 0,Category,Average Price
0,Books,251.384805
1,Clothing,230.041786
2,Electronics,239.674275
3,Health,265.14259
4,Home & Kitchen,239.76968
5,Sports,254.216275
6,Toys,251.40298


In [51]:
# Criar o gráfico de barras para visualizar o preço médio por categoria
fig = px.bar(price_by_category, 
             x='Category', 
             y='Average Price', 
             title='Preço Médio por Categoria',
             labels={'Category': 'Categoria', 'Average Price': 'Preço Médio'},
            color_discrete_sequence=px.colors.qualitative.T10)

# Atualizar o layout para centralizar o título e ajustar o estilo
fig.update_layout(
    title={
        'text': 'Preço Médio por Categoria',
        'x': 0.5,  # Centraliza o título horizontalmente
        'xanchor': 'center',  # Alinha o título ao centro
        'font': {
            'size': 24,  # Tamanho da fonte
            'color': 'black'  # Cor da fonte
        }
    },
    xaxis_title='Categoria',
    yaxis_title='Preço Médio'
)

# Exibir o gráfico
fig.show()

## Análise de Vendas

### 5. Qual é o volume total de vendas por mês?

**Foi calculado o volume total de vendas por mês para mostrar como as vendas acumulam ao longo do ano.**

![Volume Total de Vendas por Mês](/graficos/vpm.png)

Conforme ilustrado no gráfico, é possível observar uma queda significativa nas vendas entre os seguintes períodos:
- **Meses 4 e 5**
- **Meses 8 e 9**
- **Meses 10 e 12**


In [52]:
# Calcular o volume total de vendas por mês
sales_columns = [f'sales_month_{i}' for i in range(1, 13)]
total_sales_per_month = df[sales_columns].sum().reset_index()
total_sales_per_month.columns = ['Month', 'Total Sales']

# Ajustar os nomes dos meses para melhor visualização
total_sales_per_month['Month'] = total_sales_per_month['Month'].apply(lambda x: f'Mês {x.split("_")[-1]}')

# Exibir o volume total de vendas por mês
display(total_sales_per_month)


Unnamed: 0,Month,Total Sales
0,Mês 1,498306
1,Mês 2,507661
2,Mês 3,506739
3,Mês 4,503823
4,Mês 5,487194
5,Mês 6,491653
6,Mês 7,507011
7,Mês 8,504569
8,Mês 9,491934
9,Mês 10,514798


In [53]:
# Supondo que total_sales_per_month é o seu DataFrame
fig_line = px.line(total_sales_per_month, 
                   x='Month', 
                   y='Total Sales', 
                   title='Volume Total de Vendas por Mês',
                   labels={'Month': 'Mês', 'Total Sales': 'Total de Vendas'},
                   markers=True)

# Ajustar o layout do gráfico
fig_line.update_layout(
    title={
        'text': 'Volume Total de Vendas por Mês',
        'x': 0.5,
        'xanchor': 'center', 
        'font': {
            'size': 24,
            'color': 'black' 
        }
    },
    xaxis_title='Mês', 
    yaxis_title='Total de Vendas'
)

fig_line.show()

### 6. Quais produtos têm maior e menor volume de vendas?

Para responder a essa pergunta, foram elaborados dois gráficos de barras:

- Um gráfico representa os **produtos com maior volume de vendas**.
- O outro gráfico mostra os **produtos com menor volume de vendas**.

![Produtos com maior volume de vendas](/graficos/topps.png)

#### Produtos com Maior Volume de Vendas

O gráfico acima ilustra os produtos com o maior volume de vendas. Observa-se que os itens listados têm uma alta quantidade de unidades vendidas, indicando grande popularidade e demanda entre os consumidores. Esses produtos podem ser estratégicos para campanhas promocionais e planejamento de estoque.

![Produtos com menor volume de vendas](/graficos/bottomps.png)

#### Produtos com Menor Volume de Vendas

O gráfico acima mostra os produtos com o menor volume de vendas. Esses itens têm uma quantidade reduzida de unidades vendidas, o que pode sugerir menor popularidade ou demanda. Analisar essas informações pode ajudar a identificar produtos que precisam de ajustes na estratégia de marketing ou revisão de estoque.

In [54]:
# Calcular o volume total de vendas para cada produto
sales_columns = [f'sales_month_{i}' for i in range(1, 13)]
df['total_sales'] = df[sales_columns].sum(axis=1)

# Identificar os produtos com maiores e menores volumes de vendas
product_sales = df[['product_id', 'product_name', 'total_sales']]

# Ordenar os produtos por volume de vendas
product_sales_sorted = product_sales.sort_values(by='total_sales', ascending=False).reset_index(drop=True)

# Produtos com maiores e menores volumes de vendas
top_products = product_sales_sorted.head(10)
bottom_products = product_sales_sorted.tail(10)

# Exibir os resultados
print("Produtos com maiores volumes de vendas:")
display(top_products)

print("Produtos com menores volumes de vendas:")
display(bottom_products)


Produtos com maiores volumes de vendas:


Unnamed: 0,product_id,product_name,total_sales
0,224,Product_224,9151
1,286,Product_286,8921
2,734,Product_734,8914
3,905,Product_905,8783
4,180,Product_180,8775
5,853,Product_853,8765
6,239,Product_239,8724
7,924,Product_924,8525
8,937,Product_937,8459
9,197,Product_197,8418


Produtos com menores volumes de vendas:


Unnamed: 0,product_id,product_name,total_sales
990,625,Product_625,3641
991,544,Product_544,3564
992,815,Product_815,3551
993,95,Product_95,3539
994,179,Product_179,3443
995,136,Product_136,3391
996,666,Product_666,3301
997,786,Product_786,3286
998,692,Product_692,3162
999,123,Product_123,2972


In [55]:
# Ordenar os produtos do maior para o menor no gráfico
top_products_sorted = top_products.sort_values(by='total_sales', ascending=True) 
bottom_products_sorted = bottom_products.sort_values(by='total_sales', ascending=True)  


In [56]:

# Gráfico dos produtos com maiores volumes de vendas
fig_top = px.bar(top_products_sorted, 
                 x='total_sales', 
                 y='product_name', 
                 title='Top Produtos por Volume de Vendas',
                 labels={'product_name': 'Produto', 'total_sales': 'Total de Vendas'},
                 color='total_sales',
                 color_continuous_scale='Viridis')  # Paleta de cores

# Atualizar o layout do gráfico
fig_top.update_layout(
    title={
        'text': 'Top Produtos por Volume de Vendas',
        'x': 0.5,
        'xanchor': 'center',  
        'font': {
            'size': 24,  
            'color': 'black'  
        }
    },
    xaxis_title='Total de Vendas',
    yaxis_title='Produto'
)

fig_top.show()

# Gráfico dos produtos com menores volumes de vendas
fig_bottom = px.bar(bottom_products_sorted, 
                    x='total_sales', 
                    y='product_name', 
                    title='Produtos com Menores Volumes de Vendas',
                    labels={'product_name': 'Produto', 'total_sales': 'Total de Vendas'},
                    color='total_sales',
                    color_continuous_scale='Cividis')  # Paleta de cores

# Atualizar o layout do gráfico
fig_bottom.update_layout(
    title={
        'text': 'Produtos com Menores Volumes de Vendas',
        'x': 0.5, 
        'xanchor': 'center',  
        'font': {
            'size': 24,
            'color': 'black'  
        }
    },
    xaxis_title='Total de Vendas',
    yaxis_title='Produto'
)

fig_bottom.show()

## Análise de Reviews

### 7. Qual é a média dos scores de review para os produtos?

Para obter uma visão geral das avaliações dos produtos, foi calculada a média dos scores de review.

**Média dos scores de review:** [3.03]

Essa média reflete a avaliação geral dos produtos pelos clientes. Um score de 3.03 indica que, em média, as avaliações dos produtos estão em um nível intermediário. É importante considerar esse valor ao analisar a satisfação dos clientes e identificar áreas para melhoria.

In [57]:
#  Calcular a média dos scores de review
average_review_score = df['review_score'].mean()

# Exibir a média dos scores de review
display(f'{average_review_score:.2f}')


'3.03'

### 8. Quais produtos têm as melhores e piores avaliações?

Foram identificados os produtos com as melhores e piores avaliações. Esta análise destaca quais produtos receberam as melhores e as piores avaliações dos clientes.

#### Produtos com Melhores Avaliações
Os seguintes produtos receberam a melhor avaliação possível de **5.0**:

| Produto       | Avaliação |
|---------------|-----------|
| Product_12    | 5.0       |
| Product_55    | 5.0       |
| Product_75    | 5.0       |
| Product_89    | 5.0       |
| Product_105   | 5.0       |
| Product_210   | 5.0       |
| Product_334   | 5.0       |
| Product_349   | 5.0       |
| Product_465   | 5.0       |
| Product_585   | 5.0       |

#### Produtos com Piores Avaliações
Os seguintes produtos receberam a pior avaliação possível de **1.0**:

| Produto       | Avaliação |
|---------------|-----------|
| Product_169   | 1.0       |
| Product_265   | 1.0       |
| Product_284   | 1.0       |
| Product_427   | 1.0       |
| Product_484   | 1.0       |
| Product_516   | 1.0       |
| Product_744   | 1.0       |
| Product_753   | 1.0       |
| Product_800   | 1.0       |
| Product_887   | 1.0       |


In [58]:
# Produtos com melhores avaliações
top_rated_products = df.nlargest(10, 'review_score')  
# Produtos com piores avaliações
bottom_rated_products = df.nsmallest(10, 'review_score')
display(top_rated_products, bottom_rated_products)
# Adicionar uma coluna para distinguir entre as duas séries
top_rated_products['Category'] = 'Melhores Avaliações'
bottom_rated_products['Category'] = 'Piores Avaliações'


Unnamed: 0,product_id,product_name,category,price,review_score,review_count,sales_month_1,sales_month_2,sales_month_3,sales_month_4,sales_month_5,sales_month_6,sales_month_7,sales_month_8,sales_month_9,sales_month_10,sales_month_11,sales_month_12,total_sales
11,12,Product_12,Health,485.11,5.0,991,276,214,991,906,495,374,962,100,201,819,491,132,5961
54,55,Product_55,Books,300.96,5.0,314,103,802,489,655,787,737,122,793,933,364,560,581,6926
74,75,Product_75,Toys,354.89,5.0,629,289,147,974,302,851,802,697,495,822,95,94,317,5885
88,89,Product_89,Toys,444.17,5.0,43,655,282,844,159,360,342,199,625,830,481,261,952,5990
104,105,Product_105,Health,454.25,5.0,22,973,594,806,38,304,209,605,842,616,209,426,92,5714
209,210,Product_210,Sports,84.6,5.0,283,82,638,110,475,223,188,921,714,584,324,47,799,5105
333,334,Product_334,Health,62.46,5.0,935,848,361,549,426,341,58,755,212,559,800,532,177,5618
348,349,Product_349,Clothing,190.43,5.0,815,170,629,287,51,96,167,296,769,638,327,69,805,4304
464,465,Product_465,Clothing,481.28,5.0,432,970,192,624,259,111,146,299,238,146,485,233,899,4602
584,585,Product_585,Toys,318.53,5.0,704,38,313,508,890,924,284,731,578,825,182,537,679,6489


Unnamed: 0,product_id,product_name,category,price,review_score,review_count,sales_month_1,sales_month_2,sales_month_3,sales_month_4,sales_month_5,sales_month_6,sales_month_7,sales_month_8,sales_month_9,sales_month_10,sales_month_11,sales_month_12,total_sales
168,169,Product_169,Books,25.18,1.0,436,872,784,307,660,904,844,124,554,848,707,338,815,7757
264,265,Product_265,Home & Kitchen,439.3,1.0,645,767,661,738,851,333,772,454,935,36,164,805,926,7442
283,284,Product_284,Books,51.52,1.0,457,458,2,231,771,356,962,728,667,832,73,187,713,5980
426,427,Product_427,Sports,223.56,1.0,437,217,329,470,558,690,991,91,135,355,697,85,367,4985
483,484,Product_484,Home & Kitchen,315.64,1.0,445,4,72,137,845,481,70,57,550,670,121,799,98,3904
515,516,Product_516,Books,18.05,1.0,669,989,383,843,529,698,226,483,191,344,426,473,134,5719
743,744,Product_744,Clothing,253.85,1.0,41,535,956,958,428,479,73,792,227,563,326,195,405,5937
752,753,Product_753,Clothing,315.72,1.0,612,627,674,453,65,587,268,805,488,839,913,650,838,7207
799,800,Product_800,Health,461.64,1.0,837,111,18,605,252,198,240,955,536,482,832,851,397,5477
886,887,Product_887,Books,328.11,1.0,866,75,221,174,628,356,641,999,164,836,36,74,130,4334


## Análise Combinada

### 9. Existe correlação entre o preço e o score de review?

Foi calculada a correlação entre o preço dos produtos e o score de review para entender se há uma relação entre essas duas variáveis.

**Correlação entre preço e score de review:** 0.03

O valor da correlação é muito próximo de 0, indicando uma relação muito fraca entre o preço dos produtos e suas avaliações. Isso sugere que o preço dos produtos não tem um impacto significativo nas avaliações que eles recebem.

![Gráfico de dispersão](/graficos/correlacao.png)

O gráfico de dispersão acima ilustra a distribuição dos scores de review em relação ao preço dos produtos. Como o valor da correlação é baixo, o gráfico nos mostra uma dispersão dos pontos que não segue um padrão claro, reforçando a ideia de que não há uma relação forte entre o preço e as avaliações dos produtos.


In [59]:
# Calcular a correlação entre o preço e o score de review
correlation = df['price'].corr(df['review_score'])
print(f'Correlação entre Preço e Score de Review: {correlation:.2f}')

Correlação entre Preço e Score de Review: 0.03


In [60]:
fig = px.scatter(df, 
                 x='price', 
                 y='review_score', 
                 title='Correlação entre Preço e Score de Review',
                 labels={'price': 'Preço', 'review_score': 'Score de Review'},
                 trendline='ols', 
                 color='review_score',
                 color_continuous_scale=px.colors.sequential.Viridis) 
# Atualizar o layout do gráfico
fig.update_layout(
    title={
        'text': 'Correlação entre Preço e Score de Review',
        'x': 0.5, 
        'xanchor': 'center', 
        'font': {
            'size': 24, 
            'color': 'black'  
        }
    },
    xaxis_title='Preço',
    yaxis_title='Score de Review'
)

fig.show()

### 10. Existe correlação entre o volume de vendas e o score de review?

Foi analisada a correlação entre o volume de vendas e o score de review para verificar se produtos com mais vendas tendem a ter melhores ou piores avaliações.

**Correlação entre volume de vendas e score de review:** -0.02

O valor da correlação é muito próximo de 0, e o sinal negativo sugere uma relação muito fraca e ligeiramente negativa entre o volume de vendas e as avaliações. Isso indica que não há uma tendência significativa de que produtos com mais vendas tenham melhores ou piores avaliações.

![Gráfico de dispersão](/graficos/vvsr.png)

O gráfico de dispersão acima ilustra a relação entre o volume de vendas e o score de review dos produtos. Embora a correlação seja baixa, é possível observar que os pontos estão mais concentrados entre os produtos com volume de vendas variando de **4000 a 8000** unidades. Isso sugere que, independentemente da avaliação, a maioria dos produtos se situa nessa faixa de volume de vendas, mas sem uma relação clara entre a quantidade de vendas e o score de review.


In [61]:

# Calcular o volume total de vendas
df['total_sales'] = df[['sales_month_1', 'sales_month_2', 'sales_month_3', 'sales_month_4', 'sales_month_5', 'sales_month_6', 'sales_month_7', 'sales_month_8', 'sales_month_9', 'sales_month_10', 'sales_month_11', 'sales_month_12']].sum(axis=1)

# Calcular a correlação entre o volume de vendas e o score de review
correlation = df['total_sales'].corr(df['review_score'])
print(f'Correlação entre Volume de Vendas e Score de Review: {correlation:.2f}')


Correlação entre Volume de Vendas e Score de Review: -0.02


In [62]:
# Criar o gráfico de dispersão
fig = px.scatter(df, 
                 x='total_sales', 
                 y='review_score', 
                 title='Correlação entre Volume de Vendas e Score de Review',
                 labels={'total_sales': 'Volume de Vendas', 'review_score': 'Score de Review'},
                 color='review_score',  # Cores baseadas no score de review
                 color_continuous_scale=px.colors.sequential.Viridis)  # Paleta de cores sequenciais

# Atualizar o layout do gráfico
fig.update_layout(
    title={
        'text': 'Correlação entre Volume de Vendas e Score de Review',
        'x': 0.5,  # Centraliza o título horizontalmente
        'xanchor': 'center',  # Alinha o título ao centro
        'font': {
            'size': 18,  # Tamanho da fonte
            'color': 'black'  # Cor da fonte
        }
    },
    xaxis_title='Volume de Vendas',
    yaxis_title='Score de Review'
)

# Mostrar o gráfico
fig.show()

### 11. Quais são as categorias com as melhores e piores avaliações?

Foi calculada a média dos scores de review por categoria para identificar quais categorias têm as melhores e piores avaliações, respectivamente.

**Categorias com Melhor Média de Avaliação:**

| Categoria     | Média de Avaliação |
|---------------|--------------------|
| Electronics   | 3.14               |

**Categoria com Pior Média de Avaliação:**

| Categoria     | Média de Avaliação |
|---------------|--------------------|
| Toys          | 2.87               |

A média de avaliação de **Electronics** é a mais alta, com um score médio de **3.14**, indicando que, em média, os produtos dessa categoria são avaliados mais positivamente pelos clientes. Por outro lado, a categoria **Toys** tem a média de avaliação mais baixa, com um score médio de **2.87**, sugerindo que os produtos dessa categoria recebem avaliações menos favoráveis.


In [63]:

# Calcular a média de avaliação por categoria
category_avg_review = df.groupby('category')['review_score'].mean().reset_index()
category_avg_review.columns = ['Category', 'Average Review Score']

display(category_avg_review)
# Encontrar a categoria com a melhor avaliação
best_category = category_avg_review.loc[category_avg_review['Average Review Score'].idxmax()]
# Encontrar a categoria com a pior avaliação
worst_category = category_avg_review.loc[category_avg_review['Average Review Score'].idxmin()]

# Ordenar os valores em ordem crescente
category_avg_review_sorted = category_avg_review.sort_values(by='Average Review Score', ascending=True)

print(f'Categoria com a Melhor Avaliação: {best_category["Category"]} - Média: {best_category["Average Review Score"]:.2f}')
print(f'Categoria com a Pior Avaliação: {worst_category["Category"]} - Média: {worst_category["Average Review Score"]:.2f}')


Unnamed: 0,Category,Average Review Score
0,Books,3.096753
1,Clothing,2.952143
2,Electronics,3.143478
3,Health,3.005036
4,Home & Kitchen,3.0352
5,Sports,3.091503
6,Toys,2.870861


Categoria com a Melhor Avaliação: Electronics - Média: 3.14
Categoria com a Pior Avaliação: Toys - Média: 2.87


## Perguntas de Desempenho e Tendências

### 12. Quais produtos e categorias estão crescendo ou diminuindo em popularidade?

Foi realizada uma análise para identificar quais produtos e categorias estão crescendo ou diminuindo em popularidade com base nas mudanças no volume de vendas ao longo do tempo.

![Gráfico de variação por categoria ao longo dos meses](/graficos/grafmeses.png)


### Categorias Crescentes

1. **Health:**
   - Aumento significativo nos meses 3 e 4, com picos novamente nos meses 7 e 10.
   - Tendência geral positiva com mais meses de crescimento do que de declínio.

2. **Books:**
   - Diminuição consistente nos meses 3, 6, 8 e 11.
   - Padrão de crescimento em certos períodos, indicando sazonalidade ou campanhas promocionais bem-sucedidas.

4. **Toys:**
   - Queda acentuada nos meses 3, 4, 7, 9 e 11.
   - Padrão de crescimento em certos períodos, especialmente nos meses 6 e 10, provavelmente devido ao dia das crianças.

### Categorias em Declínio

1. **Clothing:**
   - Queda acentuada nos meses 3, 5, 7 e 11.
   - Apesar de alguns aumentos pontuais, a tendência geral é de declínio.

3. **Electronics:**
   - Flutuações, com aumento notável nos meses 4, 7 e 9.
   - Tendência geral de declínio.

3. **Home & Kitchen:**
   - Declínios notáveis nos meses 4, 5, 7, 9, 11 e 12.
   - Flutuações ao longo dos meses com tendência geral de queda.

4. **Sports:**
   - Queda acentuada nos meses 3, 7, 8, 10 e 12.
   - Tendência geral de declínio, especialmente em meses específicos.

In [64]:
# Calcular a variação percentual das vendas mês a mês para cada categoria
sales_columns = [f'sales_month_{i}' for i in range(1, 13)]
df_category_monthly_sales = df.groupby('category')[sales_columns].sum()

# Calcular a variação percentual mês a mês
df_category_monthly_sales_pct_change = df_category_monthly_sales.pct_change(axis='columns') * 100

# Redefinir o índice para que 'category' seja uma coluna
df_category_monthly_sales_pct_change.reset_index(inplace=True)

# Transformar os dados para o formato longo
df_long = pd.melt(df_category_monthly_sales_pct_change, id_vars='category', var_name='month', value_name='sales_growth')

# Remover linhas onde sales_growth é NaN (como resultado do pct_change)
df_long.dropna(subset=['sales_growth'], inplace=True)

# Ajustar os nomes dos meses para uma melhor apresentação
df_long['month'] = df_long['month'].apply(lambda x: x.replace('sales_month_', 'Mês '))


In [65]:
fig = px.line(df_long, 
              x='month', 
              y='sales_growth', 
              color='category',
              title='Variação Percentual das Vendas Mês a Mês por Categoria',
              labels={'sales_growth': 'Variação Percentual (%)', 'month': 'Mês'})

fig.update_layout(
    title={
        'text': 'Variação Percentual das Vendas Mês a Mês por Categoria',
        'x': 0.5,   
        'xanchor': 'center',   
        'font': {
            'size': 24,  
            'color': 'black'  
        }
    },
    xaxis_title='Mês',
    yaxis_title='Variação Percentual (%)',
    width=1000,  # Largura do gráfico em pixels
    height=500,  # Altura do gráfico em pixels
)

# Exibir o gráfico
fig.show()


### 13: Qual foi a receita total gerada por cada categoria?

Para entender o desempenho financeiro de cada categoria, foi calculada a receita total gerada. A receita total é um indicador crucial que reflete a contribuição financeira de cada categoria para o resultado global. Analisar esses dados ajuda a identificar quais categorias estão gerando mais receita e quais podem precisar de mais atenção ou ajustes estratégicos.

O gráfico de barras abaixo mostra a receita total gerada por cada categoria.

![Receita Total por Categoria](graficos/receitacateg.png)

### Insights da Receita Total por Categoria

1. **Categorias de Maior Receita:**
   - Toys, Esportes e Books e Health.

2. **Categorias com Baixa Receita:**
   - Home & Kitchen, Electronics e Clothing.


In [66]:
# Calcular a receita total para cada mês
months = [f'sales_month_{i}' for i in range(1, 13)]
df['total_revenue'] = df[months].sum(axis=1) * df['price']

# Calcular a receita total por categoria
revenue_by_category = df.groupby('category')['total_revenue'].sum().reset_index()
revenue_by_category.columns = ['Category', 'Total Revenue']

In [67]:
# Criar o gráfico de barras para receita total por categoria
fig = px.bar(revenue_by_category, 
             x='Category', 
             y='Total Revenue', 
             title='Receita Total por Categoria',
             labels={'Category': 'Categoria', 'Total Revenue': 'Receita Total'},
             color='Total Revenue', 
             color_continuous_scale='Viridis')

# Personalizar o layout do gráfico
fig.update_layout(
    title={
        'text': 'Receita Total por Categoria',
        'x': 0.5,
        'xanchor': 'center', 
        'font': {
            'size': 24,
            'color': 'black'
    }
    }
)
fig.show()

## Conclusão

### Resumo dos Principais Insights

1. **Diversidade de Produtos:**
   - A base de dados contém **1000 produtos únicos**, refletindo uma ampla variedade e um portfólio diversificado. As categorias com maior número de produtos são **Books**, **Sports**, e **Toys**, enquanto **Home & Kitchen** tem a menor quantidade de produtos. Essa distribuição sugere que algumas categorias são mais amplamente abastecidas do que outras, o que pode influenciar a oferta e a demanda.

2. **Análise de Preços:**
   - O **preço médio dos produtos** é de R$ 247,68. Categorias como **Health**, **Sports**, e **Books** apresentam preços médios mais altos, indicando que esses produtos são geralmente mais caros. Em contraste, **Home & Kitchen**, **Electronics**, e **Clothing** possuem preços médios mais baixos, sugerindo uma oferta de produtos mais acessíveis.

3. **Volume de Vendas:**
   - O volume total de vendas mostra uma **queda significativa** em meses específicos ao longo do ano. Essa variação pode ser atribuída a fatores sazonais ou eventos específicos, como campanhas promocionais. Produtos com maior volume de vendas são altamente populares e podem ser estratégicos para campanhas e planejamento de estoque. Já os produtos com menor volume de vendas podem precisar de ajustes nas estratégias de marketing e estoque.

4. **Avaliações e Satisfação:**
   - A média dos **scores de review** é de 3.03, indicando avaliações intermediárias. A análise revelou que **Electronics** tem a melhor média de avaliação, enquanto **Toys** possui a média mais baixa. A correlação entre o preço e o score de review é muito fraca (0.03), assim como entre o volume de vendas e o score de review (-0.02), sugerindo que nem o preço nem o volume de vendas têm um impacto significativo nas avaliações dos produtos.

5. **Tendências de Popularidade:**
   - Categorias como **Health** mostram um crescimento positivo, enquanto **Clothing** e **Sports** apresentam uma tendência de declínio. Esses padrões de crescimento e declínio podem ajudar a direcionar estratégias de marketing e investimento.

6. **Receita por Categoria:**
   - As categorias **Toys**, **Sports**, e **Books** são as maiores geradoras de receita, enquanto **Home & Kitchen**, **Electronics**, e **Clothing** têm uma receita menor. Esse desempenho financeiro pode indicar onde focar os investimentos e onde realizar ajustes para melhorar o desempenho.

### Recomendações

- **Investir em Categorias de Crescimento:** Ampliar as ofertas e intensifique as campanhas de marketing para categorias que estão mostrando crescimento, como **Health**.
- **Explorar Oportunidades em Categorias Menos Populares:** Considerar expandir e diversificar a oferta na categoria **Home & Kitchen** e revisar as estratégias para categorias com baixa receita.
- **Ajustar Estratégias de Preço e Avaliação:** Avaliar as estratégias de preços e a satisfação do cliente para melhorar as avaliações dos produtos e ajustar o posicionamento de preço.
- **Monitorar Tendências de Vendas:** Se atentar às variações sazonais no volume de vendas para otimizar o planejamento de estoque e as campanhas promocionais.