In [None]:
# Desafio Allure Store - Análise de Desempenho das Lojas

# 1. Importação de bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
from google.colab import files

# 2. Upload dos dados (caso esteja no Colab)
uploaded = files.upload()

# 3. Importação dos dados
df_loja1 = pd.read_csv('loja_1.csv')
df_loja2 = pd.read_csv('loja_2.csv')
df_loja3 = pd.read_csv('loja_3.csv')
df_loja4 = pd.read_csv('loja_4.csv')

lojas = {
    'Loja 1': df_loja1,
    'Loja 2': df_loja2,
    'Loja 3': df_loja3,
    'Loja 4': df_loja4
}

# 4. Análises

# Faturamento total por loja
faturamento_total = {
    nome: (df['Preço'] + df['Frete']).sum()
    for nome, df in lojas.items()
}
faturamento_df = pd.DataFrame.from_dict(faturamento_total, orient='index', columns=['Faturamento Total'])

# Categorias mais populares por loja
categorias_populares = {
    nome: df['Categoria do Produto'].value_counts().idxmax()
    for nome, df in lojas.items()
}
categorias_df = pd.DataFrame.from_dict(categorias_populares, orient='index', columns=['Categoria Mais Popular'])

# Média de avaliação dos clientes por loja
media_avaliacoes = {
    nome: df['Avaliação da compra'].mean()
    for nome, df in lojas.items()
}
avaliacoes_df = pd.DataFrame.from_dict(media_avaliacoes, orient='index', columns=['Média de Avaliação'])

# Produtos mais vendidos por loja
produtos_mais_vendidos = {
    nome: df['Produto'].value_counts().idxmax()
    for nome, df in lojas.items()
}
mais_vendidos_df = pd.DataFrame.from_dict(produtos_mais_vendidos, orient='index', columns=['Produto Mais Vendido'])

# Produtos menos vendidos por loja
produtos_menos_vendidos = {
    nome: df['Produto'].value_counts().idxmin()
    for nome, df in lojas.items()
}
menos_vendidos_df = pd.DataFrame.from_dict(produtos_menos_vendidos, orient='index', columns=['Produto Menos Vendido'])

# Custo médio do frete por loja
frete_medio = {
    nome: df['Frete'].mean()
    for nome, df in lojas.items()
}
frete_df = pd.DataFrame.from_dict(frete_medio, orient='index', columns=['Frete Médio'])

# 5. Gráficos

# Gráfico de barras - Faturamento
faturamento_df.plot(kind='bar', legend=False)
plt.title('Faturamento Total por Loja')
plt.ylabel('R$')
plt.xlabel('Lojas')
plt.grid(axis='y')
plt.tight_layout()
plt.show()

# Gráfico de pizza - Categoria mais popular (geral)
todas_categorias = pd.concat([df['Categoria do Produto'] for df in lojas.values()])
todas_categorias.value_counts().plot(kind='pie', autopct='%1.1f%%', startangle=90)
plt.title('Distribuição Geral de Categorias Vendidas')
plt.ylabel('')
plt.tight_layout()
plt.show()

# Gráfico de barras - Média de Avaliações
avaliacoes_df.plot(kind='bar', legend=False, color='orange')
plt.title('Média de Avaliação por Loja')
plt.ylabel('Nota')
plt.xlabel('Lojas')
plt.grid(axis='y')
plt.ylim(0,5)
plt.tight_layout()
plt.show()

# 6. Relatório Final em Markdown
from IPython.display import Markdown

relatorio = """
# Relatório Final

## Faturamento Total
{faturamento}

## Categoria Mais Popular
{categorias}

## Média de Avaliação
{avaliacoes}

## Produto Mais Vendido
{mais_vendidos}

## Produto Menos Vendido
{menos_vendidos}

## Frete Médio
{frete}

### Recomendação Final

Com base nas métricas analisadas, recomenda-se ao Sr. João que **venda a Loja 4**, pois ela apresenta:

- O **menor faturamento total** entre as quatro lojas;
- A **menor média de avaliação**, empatada tecnicamente com a Loja 1;
- E mesmo com o **menor custo médio de frete**, o desempenho geral é inferior às demais lojas.

Essa decisão permitirá ao Sr. João capitalizar em cima de uma loja com menor performance e manter as lojas mais rentáveis e bem avaliadas.

""".format(
    faturamento=faturamento_df.to_markdown(),
    categorias=categorias_df.to_markdown(),
    avaliacoes=avaliacoes_df.to_markdown(),
    mais_vendidos=mais_vendidos_df.to_markdown(),
    menos_vendidos=menos_vendidos_df.to_markdown(),
    frete=frete_df.to_markdown()
)

Markdown(relatorio)
