In [None]:
import pandas as pd # importando a biblioteca pandas
import seaborn as sns # importando a biblioteca seaborn
import matplotlib.pyplot as plt # importando a biblioteca matplotlib

In [None]:
#adptando para o jupyter notebook, assim, fazendo os gráficos surgiram nas caixas de resultado
%matplotlib inline 

In [None]:
clientes = pd.read_csv("../loja_insights_pandas/data/clientes.csv") # importando a base de clientes
clientes

In [None]:
produtos = pd.read_csv("../loja_insights_pandas/data/produtos.csv") # importando a base de produtos
produtos = produtos.rename(columns={"Nome": "Nome_Produto"}) # renomeando a coluna 
produtos = produtos[list(["Produto_ID", "Nome_Produto", "Categoria"])] # selecionando as colunas
produtos

In [None]:
vendas = pd.read_csv("../loja_insights_pandas/data/vendas.csv") # importando a base de vendas
vendas

In [None]:
vendas_cliente = pd.merge(clientes, vendas, how="left", on=["Cliente_ID"]) # unindo as bases de clientes e de vendas pela chave Cliente_ID

In [None]:
vendas_cliente

In [None]:
vendas_geral = pd.merge(vendas_cliente, produtos, how="left", on=["Produto_ID"]) # unindo a base criada anteriormente com a de produtos pela chave Produto_ID
vendas_geral = vendas_geral.rename(columns={"Nome": "Nome_Cliente"}) # renomeando a coluna
vendas_geral


In [None]:
vendas_geral["Data"] = pd.to_datetime(vendas_geral["Data"]) # transformando a coluna data em formato datetime
vendas_geral["Mês"] = vendas_geral["Data"].dt.to_period("M") # criando a coluna mês deixando apenas o mês da compra
vendas_geral['Mês'] = vendas_geral['Mês'].dt.to_timestamp() # transformando a coluna data em formato timestamp
vendas_mes = vendas_geral.groupby("Mês")["Valor_Total"].sum().reset_index() # agrupando a soma do valor total por cada mês
vendas_mes = vendas_mes.rename(columns={"Valor_Total": "Total"}) # renomeando a coluna
print(vendas_mes)
barra = sns.barplot(data=vendas_mes, x="Mês", y="Total") # criando o gráfico de barras
plt.xticks(rotation=45) # rotacionando o texto de mês no eixo X
for i, (_, row) in enumerate(vendas_mes.iterrows()): # aplicando o valor da barra para o índice da ordenação e não no índice primário do DataFrame
    barra.text( # aplicando o valor do total dentro das barras
        x=i, 
        y=row['Total'] * 0.5, 
        s=row['Total'], 
        ha='center', 
        va='bottom', 
        rotation=90,
        fontsize=7,
        
    )
plt.title("Quantidade de vendas por mês") # colocando o título no gráfico
plt.show()

In [None]:
vendas_produtos = vendas_geral.groupby(["Mês", "Nome_Produto"])["Produto_ID"].count().reset_index() # agrupando a quantidade de produtos vendidos por cada mês
vendas_produtos = vendas_produtos.rename(columns={"Produto_ID": "Quantidade de Produtos"}) # renomeando a coluna
print(vendas_produtos)
plt.figure(figsize=(16,6)) # definindo o tamanho da imagem do gráfico
barra = sns.barplot(data=vendas_produtos, x="Mês", y="Quantidade de Produtos", hue="Nome_Produto",) # criando o gráfico de barras para três elementos
plt.xticks(rotation=45) # rotacionando o texto de mês no eixo X
plt.title("Quantidade de vendas no mês por produto") # colocando o título no gráfico
plt.show()

In [None]:
vendas_categorias = vendas_geral.groupby(["Mês", "Categoria"])["Produto_ID"].count().reset_index() # agrupando a quantidade de categorias vendidos por cada mês
vendas_categorias = vendas_categorias.rename(columns={"Produto_ID": "Quantidade de Produtos"}) # renomeando a coluna
print(vendas_categorias)
plt.figure(figsize=(10,6)) # definindo o tamanho da imagem do gráfico
barra = sns.barplot(data=vendas_categorias, x="Mês", y="Quantidade de Produtos", hue="Categoria",) # criando o gráfico de barras para três elementos
plt.xticks(rotation=45) # rotacionando o texto de mês no eixo X

plt.title("Quantidade de vendas no mês por categoria") # colocando o título no gráfico 
plt.show()

In [None]:
produto_mais = vendas_geral.groupby("Nome_Produto")["Produto_ID"].count().reset_index() # agrupando a quantidade de produtos 
produto_mais = produto_mais.rename(columns={"Produto_ID": "Quantidade de Produtos"}) # renomeando a coluna
produto_mais = produto_mais.sort_values("Quantidade de Produtos", ascending=False) # ordenando em ordem decrescente a quantidade de produtos
print(produto_mais)
barra = sns.barplot(data=produto_mais, x="Quantidade de Produtos", y="Nome_Produto") # criando o gráfico de barras
for i, (_, row) in enumerate(produto_mais.iterrows()): # aplicando o valor da barra para o índice da ordenação e não no índice primário do DataFrame
    barra.text( # aplicando o valor do total dentro das barras
        x=row['Quantidade de Produtos'] * 0.5, 
        y=i, 
        s=row['Quantidade de Produtos'], 
        ha='center', 
        va='center', 
        fontsize=7,
            
    )
plt.title("Produtos mais vendidos") # colocando o título no gráfico
plt.tight_layout()
plt.show()

In [None]:
cliente_mais = vendas_geral.groupby("Nome_Cliente")["Cliente_ID"].count().reset_index() # agrupando a quantidade de compras de cada cliente
cliente_mais = cliente_mais.rename(columns={"Cliente_ID": "Quantidade de Compras"}) # renomeando a coluna
cliente_mais = cliente_mais.sort_values("Quantidade de Compras", ascending=False) # ordenando em ordem decrescente a quantidade de compras
print(cliente_mais)
plt.figure(figsize=(10, 6)) # definindo o tamanho da imagem do gráfico
barra = sns.barplot(data=cliente_mais, x="Quantidade de Compras", y="Nome_Cliente") # criando o gráfico de barras
for i, (_, row) in enumerate(cliente_mais.iterrows()): # aplicando o valor da barra para o índice da ordenação e não no índice primário do DataFrame
    barra.text( # aplicando o valor do total dentro das barras
        x=row["Quantidade de Compras"] * 0.5, 
        y=i, 
        s=row["Quantidade de Compras"], 
        ha='center', 
        va='center', 
        fontsize=7,
            
    )
plt.title("Clientes de mais compraram") # colocando o título no gráfico
plt.tight_layout()
plt.show()