# Importação das Bibliotecas

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import locale
from cycler import cycler
from dotenv import load_dotenv
import os

## Carregar a Variável de Ambiente

In [4]:
# Carregar variáveis do arquivo .env
load_dotenv()

# Obter as credenciais do banco de dados do .env
DADOS = os.getenv("DADOS")
print(DADOS) 

None


# Leitura do CSV

In [3]:
DADOS = DADOS

df_vendas = pd.read_csv(DADOS)

df_vendas.head()

ValueError: Invalid file path or buffer object type: <class 'NoneType'>

In [None]:
df_vendas.tail()

In [None]:
df_vendas.info()

In [None]:
df_vendas.describe()

# Criação dos Gráficos

In [None]:
# Converter a coluna 'Date' para o formato datetime
df_vendas['Date'] = pd.to_datetime(df_vendas['Date'], format='%d/%m/%Y')

# Criar uma nova coluna 'YearMonth' combinando ano e mês
df_vendas['YearMonth'] = df_vendas['Date'].dt.to_period('M')

df_vendas.info()

In [None]:
df_vendas

In [None]:
# Agrupar os valores de Total Amount por mês
df_mes_agrupado = df_vendas.groupby('YearMonth')['Total Amount'].sum().reset_index()

df_mes_agrupado

In [None]:
# Função para formatar valores de forma compacta
def formatar_valor(valor):
    if valor >= 1_000_000:
        return f"R$ {valor / 1_000_000:.1f}M".replace(".", ",")  # Milhões
    elif valor >= 1_000:
        return f"R$ {valor / 1_000:.1f}K".replace(".", ",")  # Milhares
    else:
        return f"R$ {valor:.0f}".replace(".", ",")  # Valores pequenos

In [None]:
df_mes_agrupado["YearMonth"] = df_mes_agrupado["YearMonth"].astype(str)

# dados
x_mes = df_mes_agrupado["YearMonth"]
y_venda_mes = df_mes_agrupado["Total Amount"]

# Cores
cores = plt.get_cmap('Pastel1').colors
ciclo_cores = cycler('color', cores)
plt.rc('axes', prop_cycle=ciclo_cores)

# Criar o gráfico
fig, ax = plt.subplots(figsize=(10, 4))

# Adicionar linha
ax.plot(x_mes, y_venda_mes, marker='o', linestyle='-', color='skyblue', linewidth=2, markersize=6, label="Venda Total")

# Título
ax.set_title("Total de Vendas por Mês", fontsize=14, fontweight='bold', color='gray', pad=25)

# Rotacionar os rótulos do eixo X para melhor visualização
plt.xticks(rotation=45, ha='right')

# Identificar o índice do maior valor
max_index = y.idxmax()

# Adicionar valores no gráfico
for i, value in enumerate(y):
    if i == max_index:  # Adiciona rótulo apenas para o maior valor
        ax.text(x[max_index], 
               y[max_index] + max(y) * 0.05,  # Posição ajustada acima do ponto
               formatar_valor(value),  # Usar a função de formatação compacta
               # f"R$ {value:,.2f}".replace(",", "X").replace(".", ",").replace("X", "."), 
               ha='center', va='bottom', fontsize=10, color=cores[6], fontweight='bold',
               bbox=dict(facecolor='white', edgecolor='none', boxstyle='round,pad=0.5')
               )

# Tirar as bordas dos eixos
ax.spines['top'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['left'].set_visible(False)

# Remover o eixo Y
ax.set_yticks([])
# Remover os tracinhos do eixo X
ax.tick_params(axis="x", length=0) 

# Ajustar layout
plt.tight_layout()

# Exibir o gráfico
plt.show()

## Valor Total por Categoria

In [None]:
# df_vendas_agrupado = df_vendas.groupby('Produto')['Valor Total'].sum().reset_index()
df_vendas_agrupado = df_vendas.groupby('Product Category')['Total Amount'].sum().reset_index()

df_vendas_agrupado.head()

In [None]:
print(f"Listagem das Categorias de Produtos")
print(df_vendas_agrupado["Product Category"])

print("-----")

print(f"Listagem dos Valores Totais")
print(df_vendas_agrupado["Total Amount"])


In [None]:
# Dados
x = df_vendas_agrupado["Product Category"]
y = df_vendas_agrupado["Total Amount"]

# Cores
cores = plt.get_cmap('Pastel1').colors
ciclo_cores = cycler('color', cores)
plt.rc('axes', prop_cycle=ciclo_cores)

# Criar o gráfico
fig, ax = plt.subplots(figsize=(8, 4))

barras = ax.bar(x, y, 
       width=1, 
       edgecolor="white", 
       linewidth=0.7, 
       color=cores[1]
      )

# barras[2].set_color('darkred')
# barras[2].set_alpha(0.8)

# Adicionar rótulos de dados acima das barras
for i, value in enumerate(y):
    # Formatar como moeda BRL com duas casas decimais
    formatted_value = f"R$ {value:,.2f}".replace(",", "X").replace(".", ",").replace("X", ".")
    
    ax.text(i, value + max(y) * 0.02,  # Posição X e Y ajustada
            formatted_value,  # Formato de moeda BRL
            # f"{value:.2f}",  # Formato do rótulo
            # f"R$ {locale.currency(value, grouping=True)}",  # Formato de moeda BRL,
            ha="center", 
            va="bottom", 
            fontsize=10, 
            color="grey",
           fontweight="bold"
           )

# Remover o eixo Y
ax.set_yticks([])

# Remover os tracinhos do eixo X
ax.tick_params(axis="x", length=0) 

# Remover as linhas do eixo
ax.spines["left"].set_visible(False)
ax.spines["right"].set_visible(False)
ax.spines["top"].set_visible(False)
ax.spines["bottom"].set_visible(False)

ax.set_title("Valor Total de Venda por Produto", pad=20, color="gray", fontsize=14, fontweight="bold")

plt.show()

## Quantidade Total por Categoria

In [None]:
# df_vendas_agrupado = df_vendas.groupby('Produto')['Valor Total'].sum().reset_index()
df_quantidade_vendida_agrupado = df_vendas.groupby('Product Category')['Quantity'].sum().reset_index()

df_quantidade_vendida_agrupado.head()

In [None]:
print(f"Listagem das Categorias de Produtos")
print(df_quantidade_vendida_agrupado["Product Category"])

print("-----")

print(f"Listagem das Quantidades Totais")
print(df_quantidade_vendida_agrupado["Quantity"])

In [None]:
# Dados
x = df_quantidade_vendida_agrupado["Product Category"]
y = df_quantidade_vendida_agrupado["Quantity"]

cores = plt.get_cmap('Pastel1').colors
ciclo_cores = cycler('color', cores)
plt.rc('axes', prop_cycle=ciclo_cores)

# Criar o gráfico
fig, ax = plt.subplots(figsize=(8, 4))

ax.bar(x, y, 
       width=1, 
       edgecolor="white", 
       linewidth=0.7, 
       color=cores[2]
      )

# Adicionar rótulos de dados acima das barras
for i, value in enumerate(y):
    ax.text(i, value + max(y) * 0.02,  # Posição X e Y ajustada
            f"{value:.0f}",  # Formato do rótulo
            ha="center", 
            va="bottom", 
            fontsize=10, 
            color="grey",
           fontweight="bold"
           )

# Remover o eixo Y
ax.set_yticks([])  # Remove os valores do eixo Y

# Remover os tracinhos do eixo X
ax.tick_params(axis="x", length=0) 

# Remover as linhas do eixo
ax.spines["left"].set_visible(False)
ax.spines["right"].set_visible(False)
ax.spines["top"].set_visible(False)
ax.spines["bottom"].set_visible(False)

ax.set_title("Quantidade Vendida por Produto", pad=20, fontsize=14, color="gray", fontweight="bold")

plt.show()

In [None]:
# Calcular o total de vendas
total_vendas = df_vendas["Total Amount"].sum()
print(round(total_vendas, 2))  # Apenas exibe o valor arredondado
# total_vendas agora contém o valor original

# Calcular o total de quantidade vendida
total_quantidade_vendida = df_vendas["Quantity"].sum()
print(round(total_quantidade_vendida, 2))  # Apenas exibe o valor arredondado
# total_quantidade_vendida agora contém o valor original

# Média de vendas por quantidade
ticket_medio = total_vendas / total_quantidade_vendida
print(round(ticket_medio, 2))  # Exibir o resultado arredondado

In [None]:
# Agrupar por 'Produto' e somar 'Valor Total' e 'Quantidade'
df_ticket_medio = df_vendas.groupby('Product Category')[['Total Amount', 'Quantity']].sum().reset_index()

# Calcular o ticket médio (Valor Total / Quantidade)
df_ticket_medio['Ticket Médio'] = df_ticket_medio['Total Amount'] / df_ticket_medio['Quantity']

# Arredondar a coluna 'Ticket Médio' para duas casas decimais
df_ticket_medio['Ticket Médio'] = df_ticket_medio['Ticket Médio'].round(2)

# Exibir as 5 primeiras linhas do DataFrame resultante
df_ticket_medio.head()

In [None]:
# Dados
x = df_ticket_medio["Product Category"]
y = df_ticket_medio["Ticket Médio"]

# Criar o gráfico
fig, ax = plt.subplots(figsize=(7, 3))

ax.bar(x, y, 
       width=1, 
       edgecolor="white", 
       linewidth=0.7, 
       color= "skyblue"
      )

# Adicionar rótulos de dados acima das barras
for i, value in enumerate(y):
    # Formatar como moeda BRL com duas casas decimais
    formatted_value = f"R$ {value:,.2f}".replace(",", "X").replace(".", ",").replace("X", ".")
    
    ax.text(i, value + max(y) * 0.02,  # Posição X e Y ajustada
            formatted_value,
            # f"{value:.2f}",  # Formato do rótulo
            ha="center", 
            va="bottom", 
            fontsize=10, 
            color="grey",
           fontweight="bold"
           )

# Remover o eixo Y
ax.set_yticks([])  # Remove os valores do eixo Y

# Remover os tracinhos do eixo X
ax.tick_params(axis="x", length=0) 

# Remover as linhas do eixo
ax.spines["left"].set_visible(False)
ax.spines["right"].set_visible(False)
ax.spines["top"].set_visible(False)
ax.spines["bottom"].set_visible(False)

ax.set_title("Quantidade Vendida por Produto", pad=20, color="gray", fontweight="bold")

plt.show()

# Construção do Mosaico

In [None]:
# Cores
cores = plt.get_cmap('Pastel1').colors
ciclo_cores = cycler('color', cores)
plt.rc('axes', prop_cycle=ciclo_cores)

# Criando o mosaico
mosaico = "AA;BB;CC"
fig = plt.figure(figsize=(10, 12))
espacamento = {'wspace': 0.8, 'hspace': 0.8}
axs = fig.subplot_mosaic(mosaico, gridspec_kw=espacamento)

# -------------- Primeiro Gráfico

# dados
x_mes = df_mes_agrupado["YearMonth"]
y_venda_mes = df_mes_agrupado["Total Amount"]

# Adicionar linha no gráfico 'A'
axs['A'].plot(x_mes, y_venda_mes, marker='o', linestyle='-', color='skyblue', linewidth=2, markersize=6, label="Venda Total")

# Título
axs['A'].set_title("Total de Vendas por Mês", fontsize=14, fontweight='bold', color='gray', pad=25)

# Rotacionar os rótulos do eixo X para melhor visualização
axs['A'].tick_params(axis="x", labelrotation=45)

# Identificar o índice do maior valor
max_index = y_venda_mes.idxmax()

# Adicionar valores no gráfico
for i, value in enumerate(y_venda_mes):
    if i == max_index:  # Adiciona rótulo apenas para o maior valor
        axs['A'].text(x_mes[max_index], 
               y_venda_mes[max_index] + max(y_venda_mes) * 0.05,  # Posição ajustada acima do ponto
               formatar_valor(value),  # Usar a função de formatação compacta
               ha='center', va='bottom', fontsize=10, color=cores[6], fontweight='bold',
               bbox=dict(facecolor='white', edgecolor='none', boxstyle='round,pad=0.5')
               )

# Tirar as bordas dos eixos
axs['A'].spines['top'].set_visible(False)
axs['A'].spines['bottom'].set_visible(False)
axs['A'].spines['right'].set_visible(False)
axs['A'].spines['left'].set_visible(False)

# Remover o eixo Y
axs['A'].set_yticks([])
# Remover os tracinhos do eixo X
axs['A'].tick_params(axis="x", length=0) 

# -------------- Segundo Gráfico

# Dados
x = df_vendas_agrupado["Product Category"]
y = df_vendas_agrupado["Total Amount"]

barras = axs['B'].bar(x, y, 
       width=1, 
       edgecolor="white", 
       linewidth=0.7, 
       color=cores[1]
      )

# barras[2].set_color('darkred')
# barras[2].set_alpha(0.8)

# Adicionar rótulos de dados acima das barras
for i, value in enumerate(y):
    # Formatar como moeda BRL com duas casas decimais
    formatted_value = f"R$ {value:,.2f}".replace(",", "X").replace(".", ",").replace("X", ".")
    
    axs['B'].text(i, value + max(y) * 0.02,  # Posição X e Y ajustada
            formatted_value,  # Formato de moeda BRL
            # f"{value:.2f}",  # Formato do rótulo
            # f"R$ {locale.currency(value, grouping=True)}",  # Formato de moeda BRL,
            ha="center", 
            va="bottom", 
            fontsize=10, 
            color="grey",
           fontweight="bold"
           )

# Remover o eixo Y
axs['B'].set_yticks([])

# Remover os tracinhos do eixo X
axs['B'].tick_params(axis="x", length=0) 

# Remover as linhas do eixo
axs['B'].spines["left"].set_visible(False)
axs['B'].spines["right"].set_visible(False)
axs['B'].spines["top"].set_visible(False)
axs['B'].spines["bottom"].set_visible(False)

axs['B'].set_title("Valor Total de Venda por Produto", pad=20, color="gray", fontsize=14, fontweight="bold")

# -------------- Terceiro Gráfico

# Dados
x = df_ticket_medio["Product Category"]
y = df_ticket_medio["Ticket Médio"]

axs['C'].bar(x, y, 
       width=1, 
       edgecolor="white", 
       linewidth=0.7, 
       color= "skyblue"
      )

# Adicionar rótulos de dados acima das barras
for i, value in enumerate(y):
    # Formatar como moeda BRL com duas casas decimais
    formatted_value = f"R$ {value:,.2f}".replace(",", "X").replace(".", ",").replace("X", ".")
    
    axs['C'].text(i, value + max(y) * 0.02,  # Posição X e Y ajustada
            formatted_value,
            # f"{value:.2f}",  # Formato do rótulo
            ha="center", 
            va="bottom", 
            fontsize=10, 
            color="grey",
           fontweight="bold"
           )

# Remover o eixo Y
axs['C'].set_yticks([])  # Remove os valores do eixo Y

# Remover os tracinhos do eixo X
axs['C'].tick_params(axis="x", length=0) 

# Remover as linhas do eixo
axs['C'].spines["left"].set_visible(False)
axs['C'].spines["right"].set_visible(False)
axs['C'].spines["top"].set_visible(False)
axs['C'].spines["bottom"].set_visible(False)

axs['C'].set_title("Quantidade Vendida por Produto", pad=20, color="gray", fontweight="bold")

# configurando a figura e exibindo -------------------------------------------------------

# título da figura
fig.suptitle('Estudo de Vendas - Empresa de Varejo', fontsize=20, fontweight='bold', color='darkgrey')

# salvando a figura
plt.savefig('mosaico.png', dpi=300)

# Mostrando a figura
plt.show()