üìñ An√°lise e Gera√ß√£o de Relat√≥rios de E-commerce: Explica√ß√£o Detalhada

Este Notebook Jupyter serve como um guia completo para o projeto de an√°lise de vendas de e-commerce. Aqui, exploraremos cada etapa do c√≥digo, desde o carregamento dos dados e seu pr√©-processamento, passando pela intera√ß√£o com um banco de dados SQLite, at√© a gera√ß√£o de relat√≥rios visuais. O projeto √© estruturado com Programa√ß√£o Orientada a Objetos (POO) para modularidade e boa pr√°tica de c√≥digo.

üì¶ 1. Importa√ß√£o de Bibliotecas
Iniciamos importando todas as bibliotecas necess√°rias para as opera√ß√µes de manipula√ß√£o de dados, visualiza√ß√£o e intera√ß√£o com o banco de dados.

In [None]:
# C√©lula de C√≥digo 1
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import sqlite3
import os # Necess√°rio para interagir com o sistema de arquivos, como criar diret√≥rios

‚öôÔ∏è 2. Configura√ß√µes Iniciais de Visualiza√ß√£o
Definimos algumas configura√ß√µes para melhorar a est√©tica e o tamanho padr√£o dos gr√°ficos gerados pelo Matplotlib e Seaborn.

In [None]:
# C√©lula de C√≥digo 2
sns.set_style("whitegrid") # Define um estilo de fundo com grade branca para os gr√°ficos
plt.rcParams['figure.figsize'] = (10, 6) # Define o tamanho padr√£o (largura, altura) para todas as figuras

üìù 3. Classe DataManager
A classe DataManager √© respons√°vel por todas as opera√ß√µes relacionadas ao gerenciamento dos dados. Isso inclui carregar o arquivo CSV, realizar o pr√©-processamento essencial (como convers√£o de tipos e cria√ß√£o de novas colunas) e fornecer os dados j√° prontos para an√°lise ou outras partes do sistema. Ela encapsula a l√≥gica de manipula√ß√£o do DataFrame.

In [None]:
# C√©lula de C√≥digo 3
class DataManager:
    """
    Gerencia o carregamento, pr√©-processamento e acesso aos dados de vendas.
    """
    def __init__(self, csv_file):
        """
        O construtor da classe DataManager.
        Inicializa o DataManager com o caminho para o arquivo CSV e um DataFrame vazio.

        Args:
            csv_file (str): O caminho para o arquivo CSV de vendas.
        """
        self.csv_file = csv_file
        self.df_vendas = pd.DataFrame() # Inicializa um DataFrame vazio para os dados de vendas

    def load_data(self):
        """
        Carrega os dados do CSV para o DataFrame 'df_vendas'.
        Inclui tratamento de erro caso o arquivo n√£o seja encontrado ou haja problemas de leitura.

        Returns:
            bool: True se o carregamento for bem-sucedido, False caso contr√°rio.
        """
        if not os.path.exists(self.csv_file):
            print(f"Erro: O arquivo '{self.csv_file}' n√£o foi encontrado.")
            return False
        try:
            self.df_vendas = pd.read_csv(self.csv_file)
            print(f"Arquivo '{self.csv_file}' carregado com sucesso.")
            return True
        except Exception as e:
            print(f"Erro ao carregar o arquivo CSV: {e}")
            return False

    def preprocess_data(self):
        """
        Realiza o pr√©-processamento essencial nos dados carregados:
        - Converte a coluna 'Data_Venda' para o tipo datetime, permitindo opera√ß√µes temporais.
        - Calcula 'Valor_Total_Venda' multiplicando 'Preco_Unitario' por 'Quantidade_Vendida'.
        - Extrai 'Mes_Venda' no formato 'AAAA-MM' para agrupamentos mensais.
        """
        if self.df_vendas.empty:
            print("DataFrame vazio. Carregue os dados primeiro para pr√©-process√°-los.")
            return

        # Converte a coluna 'Data_Venda' para o tipo datetime.
        # Isso √© crucial para que o Pandas reconhe√ßa e manipule as datas corretamente.
        self.df_vendas['Data_Venda'] = pd.to_datetime(self.df_vendas['Data_Venda'])

        # Calcula o valor total de cada transa√ß√£o.
        # √â uma nova feature (caracter√≠stica) que agregamos aos dados existentes.
        self.df_vendas['Valor_Total_Venda'] = self.df_vendas['Preco_Unitario'] * self.df_vendas['Quantidade_Vendida']

        # Extrai o m√™s e o ano da 'Data_Venda' para an√°lises temporais por m√™s.
        # O formato 'M' cria um objeto Period (AAAA-MM), ideal para agrupamento.
        self.df_vendas['Mes_Venda'] = self.df_vendas['Data_Venda'].dt.to_period('M')
        print("Dados pr√©-processados com sucesso.")

    def get_df_vendas(self):
        """
        Retorna o DataFrame de vendas processado.
        Outras partes do programa podem acessar os dados limpos e enriquecidos atrav√©s deste m√©todo.

        Returns:
            pd.DataFrame: O DataFrame de vendas com todas as transforma√ß√µes aplicadas.
        """
        return self.df_vendas

    def get_sales_by_category(self):
        """
        Calcula as vendas totais agrupadas por categoria de produto.

        Returns:
            pd.Series: Uma S√©rie Pandas com as categorias como √≠ndice e o valor total de vendas.
        """
        # Agrupa o DataFrame pela coluna 'Categoria_Produto' e soma o 'Valor_Total_Venda' para cada grupo.
        # 'sort_values(ascending=False)' ordena do maior para o menor valor.
        return self.df_vendas.groupby('Categoria_Produto')['Valor_Total_Venda'].sum().sort_values(ascending=False)

    def get_sales_by_region(self):
        """
        Calcula as vendas totais agrupadas por regi√£o do cliente.

        Returns:
            pd.Series: Uma S√©rie Pandas com as regi√µes como √≠ndice e o valor total de vendas.
        """
        # Agrupa pela coluna 'Regiao_Cliente' e soma o 'Valor_Total_Venda'.
        return self.df_vendas.groupby('Regiao_Cliente')['Valor_Total_Venda'].sum().sort_values(ascending=False)

    def get_sales_by_month(self):
        """
        Calcula as vendas totais agrupadas por m√™s.

        Returns:
            pd.DataFrame: Um DataFrame com 'Mes_Venda' e 'Valor_Total_Venda', ordenado cronologicamente.
        """
        # Agrupa por 'Mes_Venda', soma 'Valor_Total_Venda', ordena pelo √≠ndice (m√™s) e reseta o √≠ndice.
        # O reset_index() transforma o √≠ndice 'Mes_Venda' em uma coluna comum para facilitar a plotagem no Seaborn.
        return self.df_vendas.groupby('Mes_Venda')['Valor_Total_Venda'].sum().sort_index(ascending=True).reset_index()

üóÑÔ∏è 4. Classe DatabaseManager
A classe DatabaseManager √© respons√°vel por toda a intera√ß√£o com o banco de dados SQLite. Ela gerencia a conex√£o, a cria√ß√£o da tabela, a inser√ß√£o de dados do DataFrame e a recupera√ß√£o de dados do banco. Isso isola a l√≥gica de banco de dados do restante da aplica√ß√£o.

In [None]:
# C√©lula de C√≥digo 4
class DatabaseManager:
    """
    Gerencia a conex√£o e as opera√ß√µes com o banco de dados SQLite.
    """
    def __init__(self, db_file):
        """
        O construtor da classe DatabaseManager.
        Inicializa o DatabaseManager com o caminho para o arquivo do banco de dados SQLite.

        Args:
            db_file (str): O caminho para o arquivo do banco de dados SQLite (ex: 'ecommerce_data.db').
        """
        self.db_file = db_file
        self.conn = None # Atributo para armazenar a conex√£o com o banco de dados
        self.cursor = None # Atributo para armazenar o cursor do banco de dados

    def connect(self):
        """
        Estabelece a conex√£o com o banco de dados SQLite.
        Se o arquivo do banco de dados n√£o existir, ele ser√° criado automaticamente.

        Returns:
            bool: True se a conex√£o for bem-sucedida, False caso contr√°rio.
        """
        try:
            self.conn = sqlite3.connect(self.db_file)
            self.cursor = self.conn.cursor() # Cria um cursor para executar comandos SQL
            print(f"Conex√£o com o banco de dados '{self.db_file}' estabelecida com sucesso.")
            return True
        except sqlite3.Error as e:
            print(f"Erro ao conectar ao banco de dados: {e}")
            return False

    def create_table(self):
        """
        Cria a tabela 'vendas' no banco de dados, se ela ainda n√£o existir.
        Define o esquema da tabela com os tipos de dados apropriados para o SQLite.

        Returns:
            bool: True se a tabela for criada/verificada com sucesso, False caso contr√°rio.
        """
        if not self.conn:
            print("N√£o h√° conex√£o com o banco de dados. Conecte-se primeiro para criar a tabela.")
            return False
        try:
            self.cursor.execute('''
                CREATE TABLE IF NOT EXISTS vendas (
                    ID_Venda INTEGER PRIMARY KEY,
                    Data_Venda TEXT,
                    Nome_Produto TEXT,
                    Categoria_Produto TEXT,
                    Preco_Unitario REAL,
                    Quantidade_Vendida INTEGER,
                    Cliente_ID TEXT,
                    Regiao_Cliente TEXT,
                    Valor_Total_Venda REAL,
                    Mes_Venda TEXT -- Coluna adicionada para armazenar o m√™s como texto (AAAA-MM)
                )
            ''')
            self.conn.commit() # Confirma as altera√ß√µes (cria√ß√£o da tabela) no banco de dados
            print("Tabela 'vendas' verificada/criada com sucesso.")
            return True
        except sqlite3.Error as e:
            print(f"Erro ao criar tabela: {e}")
            return False

    def insert_data(self, df_data):
        """
        Insere dados de um DataFrame Pandas na tabela 'vendas' do SQLite.
        Utiliza a fun√ß√£o to_sql() do Pandas, que √© eficiente para essa tarefa.

        Args:
            df_data (pd.DataFrame): O DataFrame contendo os dados a serem inseridos.

        Returns:
            bool: True se a inser√ß√£o for bem-sucedida, False caso contr√°rio.
        """
        if not self.conn:
            print("N√£o h√° conex√£o com o banco de dados. Conecte-se primeiro para inserir dados.")
            return False
        try:
            # Cria uma c√≥pia do DataFrame e converte 'Mes_Venda' para string.
            # Isso √© necess√°rio porque o SQLite n√£o suporta o tipo 'Period' diretamente.
            df_to_insert = df_data.copy()
            df_to_insert['Mes_Venda'] = df_to_insert['Mes_Venda'].astype(str)

            # Usa o m√©todo to_sql() do Pandas para inserir o DataFrame na tabela 'vendas'.
            # 'if_exists='replace'' apaga e recria a tabela se ela j√° existir.
            # 'index=False' evita que o √≠ndice do DataFrame seja salvo como uma coluna na tabela.
            df_to_insert.to_sql('vendas', self.conn, if_exists='replace', index=False)
            self.conn.commit() # Confirma a inser√ß√£o dos dados no banco
            print("Dados do DataFrame inseridos na tabela 'vendas' com sucesso.")
            return True
        except sqlite3.Error as e:
            print(f"Erro ao inserir dados: {e}")
            return False

    def fetch_all_vendas(self):
        """
        Recupera todos os dados da tabela 'vendas' do SQLite e os carrega em um novo DataFrame Pandas.

        Returns:
            pd.DataFrame: Um DataFrame Pandas contendo os dados recuperados do banco de dados,
                          ou um DataFrame vazio em caso de erro ou sem conex√£o.
        """
        if not self.conn:
            print("N√£o h√° conex√£o com o banco de dados. Conecte-se primeiro para recuperar dados.")
            return pd.DataFrame()
        try:
            # Executa uma consulta SQL para selecionar todas as colunas da tabela 'vendas'.
            # pd.read_sql_query() executa a consulta e retorna os resultados como um DataFrame.
            df_from_db = pd.read_sql_query("SELECT * FROM vendas", self.conn)
            print("Dados recuperados do SQLite com sucesso.")
            # Opcional: converte 'Data_Venda' de volta para datetime, pois foi salva como TEXT no SQLite.
            df_from_db['Data_Venda'] = pd.to_datetime(df_from_db['Data_Venda'])
            return df_from_db
        except sqlite3.Error as e:
            print(f"Erro ao recuperar dados: {e}")
            return pd.DataFrame()

    def close_connection(self):
        """
        Fecha a conex√£o ativa com o banco de dados SQLite.
        √â uma boa pr√°tica fechar a conex√£o para liberar recursos.
        """
        if self.conn:
            self.conn.close()
            print("Conex√£o com o banco de dados fechada.")

üöÄ 5. L√≥gica Principal do Programa (Orquestrador)
Esta se√ß√£o orquestra as opera√ß√µes, instanciando as classes DataManager e DatabaseManager e chamando seus m√©todos em sequ√™ncia para executar o fluxo completo do projeto: carregar dados, process√°-los, persistir no banco de dados e gerar visualiza√ß√µes.

In [None]:
# C√©lula de C√≥digo 5
if __name__ == "__main__":
    # Define os caminhos para o arquivo CSV, o arquivo do banco de dados e o diret√≥rio de sa√≠da dos gr√°ficos.
    csv_path = 'vendas.csv'
    db_path = 'ecommerce_data.db'
    output_dir = 'relatorios_imagens'

    # Cria o diret√≥rio de sa√≠da para os gr√°ficos se ele ainda n√£o existir.
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
        print(f"Diret√≥rio '{output_dir}' criado para salvar os relat√≥rios.")

    # --- Etapa 1: Gerenciamento e Pr√©-processamento de Dados ---
    print("\n--- Iniciando Gerenciamento de Dados ---")
    data_manager = DataManager(csv_path) # Instancia o DataManager
    if data_manager.load_data(): # Tenta carregar os dados do CSV
        data_manager.preprocess_data() # Pr√©-processa os dados (convers√£o de tipo, c√°lculo de valor total)
        df_vendas = data_manager.get_df_vendas() # Obt√©m o DataFrame processado

        # --- Etapa 2: Gerenciamento do Banco de Dados ---
        print("\n--- Iniciando Gerenciamento do Banco de Dados ---")
        db_manager = DatabaseManager(db_path) # Instancia o DatabaseManager
        if db_manager.connect(): # Tenta conectar ao banco de dados
            db_manager.create_table() # Cria a tabela de vendas (se n√£o existir)
            db_manager.insert_data(df_vendas) # Insere os dados processados do DataFrame no banco

            # Opcional: Recupera os dados do banco de dados para verificar se a inser√ß√£o foi bem-sucedida.
            df_vendas_from_db = db_manager.fetch_all_vendas()
            print("\n--- Primeiras 5 linhas do DataFrame lido do DB (verifica√ß√£o) ---")
            print(df_vendas_from_db.head()) # Exibe as primeiras linhas do DataFrame recuperado
            print("\n--- Informa√ß√µes do DataFrame lido do DB (verifica√ß√£o) ---")
            df_vendas_from_db.info() # Exibe informa√ß√µes sobre os tipos de dados do DataFrame recuperado
            db_manager.close_connection() # Fecha a conex√£o com o banco de dados

        # --- Etapa 3: Gera√ß√£o e Exibi√ß√£o de Visualiza√ß√µes ---
        print("\n--- Gerando e Salvando Visualiza√ß√µes ---")

        # 3.1. Gr√°fico de Vendas por Categoria de Produto
        vendas_por_categoria = data_manager.get_sales_by_category() # Obt√©m os dados agregados
        plt.figure(figsize=(10, 6)) # Cria uma nova figura para o gr√°fico
        sns.barplot(x=vendas_por_categoria.index, y=vendas_por_categoria.values, palette='viridis') # Cria o gr√°fico de barras
        plt.title('Vendas Totais por Categoria de Produto') # Define o t√≠tulo do gr√°fico
        plt.xlabel('Categoria de Produto') # R√≥tulo do eixo X
        plt.ylabel('Valor Total de Vendas (R$)') # R√≥tulo do eixo Y
        plt.xticks(rotation=45, ha='right') # Gira os r√≥tulos do eixo X para melhor legibilidade
        plt.tight_layout() # Ajusta o layout para evitar que elementos se sobreponham
        plt.savefig(os.path.join(output_dir, 'vendas_por_categoria.png')) # Salva o gr√°fico como PNG
        plt.show() # Exibe o gr√°fico na tela

        # 3.2. Gr√°fico de Vendas por Regi√£o do Cliente
        vendas_por_regiao = data_manager.get_sales_by_region() # Obt√©m os dados agregados
        plt.figure(figsize=(10, 6)) # Nova figura
        sns.barplot(x=vendas_por_regiao.index, y=vendas_por_regiao.values, palette='magma') # Cria o gr√°fico de barras
        plt.title('Vendas Totais por Regi√£o do Cliente')
        plt.xlabel('Regi√£o do Cliente')
        plt.ylabel('Valor Total de Vendas (R$)')
        plt.xticks(rotation=45, ha='right')
        plt.tight_layout()
        plt.savefig(os.path.join(output_dir, 'vendas_por_regiao.png')) # Salva o gr√°fico
        plt.show() # Exibe o gr√°fico

        # 3.3. Gr√°fico de Tend√™ncia de Vendas por M√™s
        vendas_por_mes = data_manager.get_sales_by_month() # Obt√©m os dados agregados por m√™s
        plt.figure(figsize=(12, 6)) # Nova figura
        # Para o gr√°fico de linhas, convertemos 'Mes_Venda' para string para garantir a plotagem correta
        sns.lineplot(x=vendas_por_mes['Mes_Venda'].astype(str), y='Valor_Total_Venda', data=vendas_por_mes, marker='o')
        plt.title('Tend√™ncia de Vendas Totais por M√™s')
        plt.xlabel('M√™s da Venda')
        plt.ylabel('Valor Total de Vendas (R$)')
        plt.xticks(rotation=45, ha='right')
        plt.tight_layout()
        plt.savefig(os.path.join(output_dir, 'vendas_por_mes.png')) # Salva o gr√°fico
        plt.show() # Exibe o gr√°fico

    else:
        print("N√£o foi poss√≠vel prosseguir devido a erros no carregamento ou pr√©-processamento dos dados.")