In [None]:
import pandas as pd

# Carregar os dados
produtos_df = pd.read_csv('../data/extracted/produtos.csv')
movimentacoes_itens_df = pd.read_csv('../data/extracted/movimentacoes_itens.csv')

# Exibir as primeiras linhas dos dataframes
print(produtos_df.head())
print(movimentacoes_itens_df.head())

# Visão geral dos produtos
print("Quantidade total de produtos:", produtos_df.shape[0])
print("Produtos com maior quantidade em estoque:")
print(produtos_df.nlargest(5, 'quantidade'))
print("Produtos com menor quantidade em estoque:")
print(produtos_df.nsmallest(5, 'quantidade'))

# Distribuição dos preços de custo e venda
produtos_df[['preco_custo', 'preco_venda']].describe()


In [None]:
# Conversão das colunas de data para datetime
produtos_df['criado_em'] = pd.to_datetime(produtos_df['criado_em'])
produtos_df['atualizado_em'] = pd.to_datetime(produtos_df['atualizado_em'])
movimentacoes_itens_df['criado_em'] = pd.to_datetime(movimentacoes_itens_df['criado_em'])

# Volume de movimentações por período
movimentacoes_itens_df.set_index('criado_em', inplace=True)
movimentacoes_por_mes = movimentacoes_itens_df.resample('M').sum()['quantidade']

movimentacoes_por_mes.plot(title='Volume de Movimentações por Mês')

# Produto mais movimentado
produto_mais_movimentado = movimentacoes_itens_df.groupby('produto_id')['quantidade'].sum().idxmax()
print("Produto mais movimentado (ID):", produto_mais_movimentado)

# Unindo informações de produtos para análises mais detalhadas
movimentacoes_itens_df = movimentacoes_itens_df.merge(produtos_df[['id', 'descricao']], left_on='produto_id', right_on='id')
produto_mais_movimentado_descricao = movimentacoes_itens_df.loc[movimentacoes_itens_df['produto_id'] == produto_mais_movimentado, 'descricao'].iloc[0]
print("Produto mais movimentado (Descrição):", produto_mais_movimentado_descricao)


In [None]:
# Calculando a margem de lucro
produtos_df['margem_lucro'] = produtos_df['preco_venda'] - produtos_df['preco_custo']
print("Produtos com maior margem de lucro:")
print(produtos_df.nlargest(5, 'margem_lucro'))
print("Produtos com menor margem de lucro:")
print(produtos_df.nsmallest(5, 'margem_lucro'))


In [None]:
import matplotlib.pyplot as plt

# Evolução de preços ao longo do tempo
produtos_df.set_index('criado_em', inplace=True)
produtos_df[['preco_custo', 'preco_venda']].plot(title='Evolução de Preços ao Longo do Tempo')
plt.show()
