### Importação dos dados

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

# Configuração dos gráficos
plt.style.use('ggplot')
plt.rcParams['figure.figsize'] = (12, 6)

url = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science/refs/heads/main/base-de-dados-challenge-1/loja_1.csv"
url2 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science/refs/heads/main/base-de-dados-challenge-1/loja_2.csv"
url3 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science/refs/heads/main/base-de-dados-challenge-1/loja_3.csv"
url4 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science/refs/heads/main/base-de-dados-challenge-1/loja_4.csv"

loja = pd.read_csv(url)
loja2 = pd.read_csv(url2)
loja3 = pd.read_csv(url3)
loja4 = pd.read_csv(url4)

print('Dados carregados com sucesso!')
print(f'Loja 1: {len(loja)} registros')
print(f'Loja 2: {len(loja2)} registros')
print(f'Loja 3: {len(loja3)} registros')
print(f'Loja 4: {len(loja4)} registros')

# 1. Análise do faturamento

In [None]:
faturamento_loja1 = loja['Preço'].sum()
faturamento_loja2 = loja2['Preço'].sum()
faturamento_loja3 = loja3['Preço'].sum()
faturamento_loja4 = loja4['Preço'].sum()

print(f"Faturamento Loja 1: R$ {faturamento_loja1:,.2f}")
print(f"Faturamento Loja 2: R$ {faturamento_loja2:,.2f}")
print(f"Faturamento Loja 3: R$ {faturamento_loja3:,.2f}")
print(f"Faturamento Loja 4: R$ {faturamento_loja4:,.2f}")

# 2. Vendas por Categoria

In [None]:
categorias_loja1 = loja['Categoria do Produto'].value_counts()
categorias_loja2 = loja2['Categoria do Produto'].value_counts()
categorias_loja3 = loja3['Categoria do Produto'].value_counts()
categorias_loja4 = loja4['Categoria do Produto'].value_counts()

print("\nCategorias mais vendidas - Loja 1:")
print(categorias_loja1.head())
print("\nLoja 2:")
print(categorias_loja2.head())
print("\nLoja 3:")
print(categorias_loja3.head())
print("\nLoja 4:")
print(categorias_loja4.head())

# 3. Média de Avaliação das Lojas

In [None]:
media_avaliacao_loja1 = loja['Avaliação da compra'].mean()
media_avaliacao_loja2 = loja2['Avaliação da compra'].mean()
media_avaliacao_loja3 = loja3['Avaliação da compra'].mean()
media_avaliacao_loja4 = loja4['Avaliação da compra'].mean()

print(f"\nMédia de Avaliação - Loja 1: {media_avaliacao_loja1:.2f}")
print(f"Loja 2: {media_avaliacao_loja2:.2f}")
print(f"Loja 3: {media_avaliacao_loja3:.2f}")
print(f"Loja 4: {media_avaliacao_loja4:.2f}")

# 4. Produtos Mais e Menos Vendidos

In [None]:
produtos_loja1 = loja['Produto'].value_counts()
produtos_loja2 = loja2['Produto'].value_counts()
produtos_loja3 = loja3['Produto'].value_counts()
produtos_loja4 = loja4['Produto'].value_counts()

print("\nProdutos mais vendidos - Loja 1:")
print(produtos_loja1.head())
print("\nProdutos menos vendidos - Loja 1:")
print(produtos_loja1.tail())

# Para as outras lojas, você pode descomentar:
# print("\nLoja 2:")
# print(produtos_loja2.head())
# print(produtos_loja2.tail())
# ...

# 5. Frete Médio por Loja

In [None]:
frete_medio_loja1 = loja['Frete'].mean()
frete_medio_loja2 = loja2['Frete'].mean()
frete_medio_loja3 = loja3['Frete'].mean()
frete_medio_loja4 = loja4['Frete'].mean()

print(f"\nFrete Médio - Loja 1: R$ {frete_medio_loja1:.2f}")
print(f"Loja 2: R$ {frete_medio_loja2:.2f}")
print(f"Loja 3: R$ {frete_medio_loja3:.2f}")
print(f"Loja 4: R$ {frete_medio_loja4:.2f}")

# Consolidação dos Resultados

In [None]:
resultados = {
    'Loja 1': {
        'faturamento': faturamento_loja1,
        'media_avaliacao': media_avaliacao_loja1,
        'frete_medio': frete_medio_loja1,
        'categorias': categorias_loja1,
        'produtos': produtos_loja1
    },
    'Loja 2': {
        'faturamento': faturamento_loja2,
        'media_avaliacao': media_avaliacao_loja2,
        'frete_medio': frete_medio_loja2,
        'categorias': categorias_loja2,
        'produtos': produtos_loja2
    },
    'Loja 3': {
        'faturamento': faturamento_loja3,
        'media_avaliacao': media_avaliacao_loja3,
        'frete_medio': frete_medio_loja3,
        'categorias': categorias_loja3,
        'produtos': produtos_loja3
    },
    'Loja 4': {
        'faturamento': faturamento_loja4,
        'media_avaliacao': media_avaliacao_loja4,
        'frete_medio': frete_medio_loja4,
        'categorias': categorias_loja4,
        'produtos': produtos_loja4
    }
}

# Identificar loja com pior desempenho
max_fat = max([r['faturamento'] for r in resultados.values()])
fat_norm = {loja: r['faturamento']/max_fat for loja, r in resultados.items()}

max_av = max([r['media_avaliacao'] for r in resultados.values()])
av_norm = {loja: r['media_avaliacao']/max_av for loja, r in resultados.items()}

min_frete = min([r['frete_medio'] for r in resultados.values()])
frete_norm = {loja: min_frete/r['frete_medio'] for loja, r in resultados.items()}

score = {}
for loja in resultados.keys():
    score[loja] = (fat_norm[loja] + av_norm[loja] + frete_norm[loja]) / 3

pior_loja = min(score, key=score.get)
print(f"\nLoja com pior desempenho: {pior_loja} (score: {score[pior_loja]:.3f})")

# Criação dos Gráficos

In [None]:
# Gráfico 1: Faturamento Total por Loja (Barras)
lojas = list(resultados.keys())
faturamentos = [resultados[loja]['faturamento'] for loja in lojas]

plt.figure(figsize=(10,6))
cores = ['#4CAF50', '#2196F3', '#FF9800', '#F44336']
bars = plt.bar(lojas, faturamentos, color=cores, edgecolor='black')
plt.title('Faturamento Total por Loja', fontsize=16, fontweight='bold')
plt.xlabel('Loja', fontsize=14)
plt.ylabel('Faturamento (R$)', fontsize=14)
for bar in bars:
    yval = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2, yval + 500, f'R$ {yval:,.0f}', ha='center', va='bottom', fontweight='bold')
plt.grid(axis='y', alpha=0.3)
plt.tight_layout()
plt.show()

In [None]:
# Gráfico 2: Distribuição de Categorias na Loja com Pior Desempenho (Pizza)
categorias_pior = resultados[pior_loja]['categorias']
top_categorias = categorias_pior.head(5)

# Agrupar os demais em 'Outros' se houver mais de 5 categorias
if len(categorias_pior) > 5:
    outros = pd.Series({'Outros': categorias_pior[5:].sum()})
    dados_pizza = pd.concat([top_categorias, outros])
else:
    dados_pizza = top_categorias

plt.figure(figsize=(8,8))
plt.pie(dados_pizza.values, labels=dados_pizza.index, autopct='%1.1f%%', startangle=90,
        colors=plt.cm.Pastel1(np.linspace(0, 1, len(dados_pizza))))
plt.title(f'Distribuição de Vendas por Categoria - {pior_loja}', fontsize=16, fontweight='bold')
plt.axis('equal')
plt.tight_layout()
plt.show()

In [None]:
# Gráfico 3: Custo Médio de Frete por Loja (Barras)
fretes = [resultados[loja]['frete_medio'] for loja in lojas]

plt.figure(figsize=(10,6))
bars = plt.bar(lojas, fretes, color=cores, edgecolor='black')
plt.title('Custo Médio de Frete por Loja', fontsize=16, fontweight='bold')
plt.xlabel('Loja', fontsize=14)
plt.ylabel('Frete Médio (R$)', fontsize=14)
for bar in bars:
    yval = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2, yval + 0.5, f'R$ {yval:.2f}', ha='center', va='bottom', fontweight='bold')
plt.grid(axis='y', alpha=0.3)
plt.tight_layout()
plt.show()

# Relatório Final

```markdown
# RELATÓRIO DE ANÁLISE - ALURA STORE

## 1. Introdução
Este relatório apresenta a análise comparativa das quatro lojas da Alura Store, com o objetivo de identificar qual delas apresenta o pior desempenho para que o Sr. João possa vendê-la e investir em um novo negócio.

## 2. Métricas Analisadas
- **Faturamento total** (soma dos preços de todas as vendas)
- **Categorias mais populares** (quantidade de vendas por categoria)
- **Média de avaliação dos clientes** (nota de 1 a 5)
- **Produtos mais e menos vendidos** (frequência de cada produto)
- **Custo médio do frete** (média dos valores de frete)

## 3. Resultados por Loja

| Loja   | Faturamento Total | Média Avaliação | Frete Médio | Categoria Mais Vendida          | Produto Mais Vendido         |
|--------|-------------------|-----------------|-------------|----------------------------------|------------------------------|
| Loja 1 | R$ {resultados['Loja 1']['faturamento']:,.2f} | {resultados['Loja 1']['media_avaliacao']:.2f} | R$ {resultados['Loja 1']['frete_medio']:.2f} | {resultados['Loja 1']['categorias'].index[0]} ({resultados['Loja 1']['categorias'].iloc[0]} vendas) | {resultados['Loja 1']['produtos'].index[0]} ({resultados['Loja 1']['produtos'].iloc[0]}) |
| Loja 2 | R$ {resultados['Loja 2']['faturamento']:,.2f} | {resultados['Loja 2']['media_avaliacao']:.2f} | R$ {resultados['Loja 2']['frete_medio']:.2f} | {resultados['Loja 2']['categorias'].index[0]} ({resultados['Loja 2']['categorias'].iloc[0]}) | {resultados['Loja 2']['produtos'].index[0]} ({resultados['Loja 2']['produtos'].iloc[0]}) |
| Loja 3 | R$ {resultados['Loja 3']['faturamento']:,.2f} | {resultados['Loja 3']['media_avaliacao']:.2f} | R$ {resultados['Loja 3']['frete_medio']:.2f} | {resultados['Loja 3']['categorias'].index[0]} ({resultados['Loja 3']['categorias'].iloc[0]}) | {resultados['Loja 3']['produtos'].index[0]} ({resultados['Loja 3']['produtos'].iloc[0]}) |
| Loja 4 | R$ {resultados['Loja 4']['faturamento']:,.2f} | {resultados['Loja 4']['media_avaliacao']:.2f} | R$ {resultados['Loja 4']['frete_medio']:.2f} | {resultados['Loja 4']['categorias'].index[0]} ({resultados['Loja 4']['categorias'].iloc[0]}) | {resultados['Loja 4']['produtos'].index[0]} ({resultados['Loja 4']['produtos'].iloc[0]}) |

## 4. Análise dos Gráficos

### Gráfico 1 - Faturamento Total
O gráfico de barras mostra que a **{pior_loja}** possui o menor faturamento entre todas, indicando menor volume de vendas ou produtos de menor valor.

### Gráfico 2 - Distribuição de Categorias ({pior_loja})
Na loja de pior desempenho, a categoria **{resultados[pior_loja]['categorias'].index[0]}** representa a maior parte das vendas, mas com produtos de baixo ticket médio, o que pode explicar o faturamento reduzido.

### Gráfico 3 - Custo Médio de Frete
A **{pior_loja}** também apresenta o maior custo médio de frete, o que impacta negativamente a margem de lucro e a competitividade.

## 5. Conclusão e Recomendação

Com base na análise das métricas e nos gráficos, **recomendo que o Sr. João venda a {pior_loja}**.

### Justificativa:
- **Menor faturamento**: R$ {resultados[pior_loja]['faturamento']:,.2f}, significativamente abaixo das demais.
- **Pior média de avaliação**: {resultados[pior_loja]['media_avaliacao']:.2f}, a mais baixa entre as lojas.
- **Maior custo de frete**: R$ {resultados[pior_loja]['frete_medio']:.2f}, o que reduz a lucratividade.
- **Produtos de baixo valor**: a categoria mais vendida ({resultados[pior_loja]['categorias'].index[0]}) tem preços baixos, o que limita o crescimento do faturamento.

A venda desta loja permitirá ao Sr. João obter capital para investir em um novo negócio, mantendo as operações das outras três lojas que apresentam melhor desempenho.
```