# Projeto: Análise de Compras em Loja Fictícia

#### Objetivo
 Analisar os dados de clientes e suas compras para gerar insights como:

- Qual cliente gastou mais.
- Produto mais vendido.
- Quantidade total de itens vendidos por categoria.


In [115]:
import pandas as pd

#Criação e tratamento do DataFrame apartir do .csv
dados = pd.read_csv('empresa_PE.csv')
dados = dados.dropna()
dados['Data_Compra'] = pd.to_datetime(dados['Data_Compra'])
dados['Quantidade'] = dados['Quantidade'].astype(int)

# Fazendo que não repita os nomes dos clientes e somando todas suas compras
dados_numericos = dados.groupby('Cliente')[['Quantidade']].sum()
dados_nao_numericos = dados.groupby('Cliente')[['Preco_Unitario', 'Produto', 'Categoria', 'Data_Compra', 'Loja']].first()
dados = pd.concat([dados_numericos, dados_nao_numericos], axis=1)

#Criando nova coluna
dados['Total'] = dados['Quantidade'] * dados['Preco_Unitario']


#Filtrando qual cliente mais gastou + o valor gasto
cliente_que_gastou_mais = dados.groupby('Cliente')[['Categoria', 'Total']].sum().sort_values(by="Total", ascending=False)
cliente_mais = cliente_que_gastou_mais.index[0]
valor_gasto = cliente_que_gastou_mais.iloc[0]['Total']

#Em qual localização a loja lucrou mais
mais_lucro = dados.groupby('Loja')['Total'].sum().sort_values(ascending=False).reset_index().iloc[0]['Loja']

#Identificar qual produto mais vendido
produto_mais_vendido = dados.groupby('Produto')['Total'].sum().sort_values(ascending=False).reset_index().iloc[0]

#Quantidade total de itens vendidos por categoria
por_Quantidade = dados.groupby('Categoria')['Quantidade'].sum().sort_values(ascending=False).reset_index().iloc[0]['Quantidade']
por_categoria = dados.groupby('Categoria')['Quantidade'].sum().sort_values(ascending=False).reset_index().iloc[0]['Categoria']

#Criando um dicionario
dados_resultado = {
    'Cliente_Gastou_Mais': [cliente_mais],
    'Loja_Lucrou_Mais': [mais_lucro],
    'Categoria': [por_categoria],
    'Mais_Vendido': produto_mais_vendido['Produto'],
    'Quantidade_Itens_Vendidos': [por_Quantidade]
}
#Transformando o dicionário em DataFrame
df = pd.DataFrame(dados_resultado)

#Salvar em csv
df.to_csv('Resultado_dados_apurados.csv', index=False)

#Ver a base de dados que salvou
display(pd.read_csv('Resultado_dados_apurados.csv'))

Unnamed: 0,Cliente_Gastou_Mais,Loja_Lucrou_Mais,Categoria,Mais_Vendido,Quantidade_Itens_Vendidos
0,Jim Ramirez,Boa Viagem,Vestuário,Tênis,374
