# Alura Store 
Análise Data-Driven: Recomendação baseada em faturamento, desempenho geográfico e satisfação do cliente

## 1. Contexto do Problema  

 Ajudar o Senhor João a decidir qual loja da sua rede Alura Store vender para iniciar um novo empreendimento.

- Objetivo: Identificar a loja menos eficiente para venda.  
- Dados disponíveis: Vendas em 2023, avaliações, localização. 

### 1.1 Instalando e importação das bibliotecas utilizadas

Utilizaremos diversas ferramentas para esse trabalho, _pandas_ para acessar as informações, _seaborn_ e _matplotlib_ para a vizualização dos dados e _folium_ para a análise geográfica. 

In [None]:
!pip install requirements

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.ticker import FuncFormatter
import seaborn as sns
import folium
from folium.plugins import HeatMap

### 1.2 Importação dos dados

Foi repassado os seguintes dados referentes a cada loja. Com informação das vendas no período de 2021 a 


In [None]:
# Carregar e consolidar os dados
loja1 = pd.read_csv('data/loja_1.csv')
loja2 = pd.read_csv('data/loja_2.csv')
loja3 = pd.read_csv('data/loja_3.csv')
loja4 = pd.read_csv('data/loja_4.csv')


### 1.3 Unificação dos dados

Para facilitar as análises a seguir, utilizarei uma abordagem de unificar cada _data frame_, para assim facilitar a leitura e evitar repetição de código.

In [None]:
# Adicionando uma coluna 'Loja' em cada data frame
loja1['Loja'] = 'Loja 1'
loja2['Loja'] = 'Loja 2'
loja3['Loja'] = 'Loja 3'
loja4['Loja'] = 'Loja 4'


# Criando o único data frame
lojas = [loja1, loja2, loja3, loja4]

df = pd.concat(lojas, ignore_index=True)

df.head()

### Estilização dos gráficos
Explicação...

In [None]:
sns.set_style('whitegrid')

## 2. Análise Exploratória (EDA)

A seguir, faremos uma análise de cada loja em relação ao faturamento, stisfação do cliente, custo de frete e análise geográfica

### 2.1  Faturamento por Loja

Para o faturamento por loja, somaremos os falores da coluna 'Preço', onde separaremos pela coluna 'Loja'

In [None]:
faturamento = df.groupby('Loja')['Preço'].sum().sort_values(ascending=False).reset_index()

print(faturamento)

In [None]:
# Plotando o gráfico do faturamento
plt.figure(figsize=(10, 6))
sns.barplot(data=faturamento, x='Loja', y='Preço', hue='Loja', palette='Blues_d', legend=False)
plt.title('Faturamento Total por Loja', pad=20)
plt.ylabel('Faturamento Total Por Loja')
plt.xlabel('')
plt.gca().yaxis.set_major_formatter(plt.FuncFormatter(lambda x, _: f'R${x:,.0f}'))
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()

Mesmo que a loja 1 possua um faturamento total maior vemos que todas as lojas possuem faturamentos similares. Logo, para uma melhro acurácia, analisaremos as vendas ao logo dos anos

In [None]:
# Extrair ano da data
df['Ano'] = pd.to_datetime(df['Data da Compra'],  format='%d/%m/%Y').dt.year

# Calcular faturamento anual por loja
faturamento_anual = df.groupby(['Ano', 'Loja'])['Preço'].sum().unstack()
print(faturamento_anual)

In [None]:
# Plotando gráfico do faturamento anual
plt.figure(figsize=(12, 6))
sns.barplot(data=df, x='Loja', y='Preço', hue='Ano', estimator=sum,
            palette='viridis_d', errorbar=None)
plt.title('Evolução Anual do Faturamento por Loja', pad=20)
plt.xlabel('Lojas')
plt.ylabel('Faturamento (R$)')
plt.yticks(range(0, 550000, 50000))
plt.gca().yaxis.set_major_formatter(plt.FuncFormatter(lambda x, _: f'R${x:,.0f}'))
plt.legend(title='Ano', bbox_to_anchor=(1.05, 1))
plt.tight_layout()
plt.show()

Despresando o ano de 2023, que não estava complento, vemos uma queda nos faturamentos anuais na loja 1 e um aumento nas vendas anuais da loja 2. Nota-se uma variação na Loja 3 e na Loja 4

### 2.2. Desempenho por Categoria  

Cada loja pode ter categorias mais procuradas, portanto é importante analisar quais são os pontos fortes de cada setor

In [None]:
vendas_categoria_faturamento = df.groupby(['Loja', 'Categoria do Produto'])['Preço'].sum().unstack()

vendas_categoria_faturamento.plot(kind='bar', stacked=True, figsize=(10, 6))

Observa-se que todas as lojas são parecidas em relação ao faturamento por categorias, porém é válio analisar a quantidade de produtos vendidos em cada loja. 

In [None]:
vendas_categoria_quantidade = df.groupby('Loja')['Categoria do Produto'].count().unstack()

vendas_categoria_quantidade.plot(kind='bar', stacked=True, figsize=(10, 6))

### 2.3. Satisfação do Cliente  

Um ponto deveras importante, é analisar se os clientes estão satisfeitos com o atendimento e as compras feitas nas lojas. Para isso, faremos um média de avaliação por loja

In [None]:
avaliacao_media = df.groupby('Loja')['Avaliação da compra'].mean().sort_values(ascending=False)
avaliacao_media.plot(kind='barh', color='green', title='Média de Avaliação por Loja')

In [None]:
print(loja1['Avaliação da compra'].sum)
print(loja2['Avaliação da compra'].sum)
print(loja3['Avaliação da compra'].sum)
print(loja4['Avaliação da compra'].sum)

## 2.4. Produtos mais e menos vendidos

Outra informação válida são os produtos preferidos pelos clientes de cada loja

In [None]:
top_produtos = df.groupby(['Loja', 'Produto']).size().groupby('Loja').nlargest(5)

print(top_produtos)


### 2.5. Frete  médio por loja

In [None]:
frete_medio = df.groupby('Loja')['Frete'].mean().sort_values()
frete_medio.plot(kind='pie', autopct='%.1f%%', title='Frete Médio por Loja')

### 2.6. Análise Geográfica 

## 3. Insights Críticos  


## 4. Relatório final