Exploratory Data Analysis üèóÔ∏èüìä
Configuration

In [None]:
import pandas as pd  # Importa a biblioteca Pandas para manipula√ß√£o de dados
import numpy as np  # Importa a biblioteca NumPy para opera√ß√µes num√©ricas
import sqlite3  # Importa a biblioteca SQLite para intera√ß√£o com bancos de dados SQLite
import dash  # Importa a biblioteca Dash para cria√ß√£o de aplicativos web interativos
from dash import dcc, html, dash_table  # Importa os componentes dcc (gr√°ficos), html e dash_table do Dash
import plotly.express as px  # Importa a biblioteca Plotly Express para criar gr√°ficos de forma f√°cil
import matplotlib.pyplot as plt  # Importa a biblioteca Matplotlib para cria√ß√£o de gr√°ficos
import io  # Importa a biblioteca io para lidar com streams de dados
import base64  # Importa a biblioteca base64 para codificar imagens
import plotly.graph_objects as go  # Importa a biblioteca Plotly Graph Objects para criar gr√°ficos mais complexos

DB_PATH = 'G:/Meu Drive/Documents/GitHubPublished/DataScienceProject/database/ecommerceProject.db'  # Define o caminho para o arquivo do banco de dados SQLite
conn = None  # Inicializa a vari√°vel de conex√£o com o banco de dados como None

def run_query(query: str, params=()):
    """
    Executa uma consulta SQL no banco de dados e retorna o resultado como um DataFrame.
    Adiciona tratamento de erro para a execu√ß√£o da query.

    Args:
        query (str): A consulta SQL a ser executada.
        params (tuple, optional): Par√¢metros para a consulta SQL. Padr√£o √© ().

    Returns:
        pandas.DataFrame: O resultado da consulta como um DataFrame, ou um DataFrame vazio em caso de erro.
    """
    global conn  # Permite que a fun√ß√£o modifique a vari√°vel global conn
    if conn is None:  # Verifica se a conex√£o com o banco de dados ainda n√£o foi estabelecida
        try:
            conn = sqlite3.connect(DB_PATH)  # Conecta ao banco de dados SQLite
        except sqlite3.Error as e:  # Captura erros relacionados √† conex√£o com o banco de dados
            print(f"Erro ao conectar ao banco de dados: {e}")  # Imprime uma mensagem de erro
            return pd.DataFrame()  # Retorna um DataFrame vazio em caso de erro

    try:
        df = pd.read_sql(query, conn, params=params)  # Executa a consulta SQL e armazena os resultados em um DataFrame
        return df  # Retorna o DataFrame com os resultados da consulta
    except Exception as e:  # Captura outros erros inesperados
        print(f"Erro ao executar a query: {query}\nErro: {e}")  # Imprime uma mensagem de erro
        return pd.DataFrame()  # Retorna um DataFrame vazio em caso de erro

def load_data():
    """
    Carrega todos os DataFrames necess√°rios para a an√°lise usando consultas SQL.

    Returns:
        dict: Um dicion√°rio onde as chaves s√£o os nomes dos DataFrames e os valores s√£o os DataFrames correspondentes.
    """
    queries = {
        "customers": 'SELECT * FROM customers',
        "orders": 'SELECT * FROM orders',
        "products": 'SELECT * FROM products',
        "categories": 'SELECT * FROM categories',
        "order_items": 'SELECT * FROM order_items',
        "products_by_categories": '''
            SELECT c.category_name, COUNT(DISTINCT p.product_name) AS count
            FROM categories c
            JOIN products p ON c.category_id = p.category_id
            GROUP BY c.category_name
            ORDER BY c.category_name''',
        "top_10_customer_value": '''
            SELECT c.customer_name, ROUND(SUM(o.order_value),2) AS total
            FROM customers c
            JOIN orders o ON c.customer_id = o.customer_id
            GROUP BY c.customer_name
            ORDER BY total DESC
            LIMIT 10''',
        "sales_over_time": '''
            SELECT STRFTIME('%Y-%m', order_date) AS month, SUM(order_value) AS total_sales
            FROM orders
            GROUP BY month
            ORDER BY month''',
        "top_selling_products_quantity": '''
            SELECT p.product_name, SUM(oi.order_quantity) AS total_quantity_sold
            FROM products p
            JOIN order_items oi ON p.product_id = oi.product_id
            GROUP BY p.product_name
            ORDER BY total_quantity_sold DESC
            LIMIT 10''',
        "order_value_vs_items": '''
            SELECT o.order_value, COUNT(oi.items_id) AS num_items
            FROM orders o
            JOIN order_items oi ON o.order_id = oi.order_id
            GROUP BY o.order_id, o.order_value''',
        "products_without_category": '''
            SELECT p.product_id, p.product_name
            FROM products p
            LEFT JOIN categories c ON p.category_id = c.category_id
            WHERE c.category_id IS NULL''',
        "orders_with_invalid_customer": '''
            SELECT o.order_id, o.customer_id
            FROM orders o
            LEFT JOIN customers c ON o.customer_id = c.customer_id
            WHERE c.customer_id IS NULL'''
    }  # Define um dicion√°rio com as consultas SQL para carregar os dados

    data = {}  # Inicializa um dicion√°rio para armazenar os DataFrames
    for key, query in queries.items():  # Itera sobre as consultas SQL
        data[key] = run_query(query)  # Executa a consulta e armazena o resultado no dicion√°rio
    return data  # Retorna o dicion√°rio com os DataFrames

def fig_to_base64(fig):
    """
    Converte uma figura Matplotlib em uma string base64 para ser exibida em HTML.

    Args:
        fig (matplotlib.figure.Figure): A figura Matplotlib a ser convertida.

    Returns:
        str: Uma string base64 representando a imagem da figura.
    """
    buf = io.BytesIO()  # Cria um buffer na mem√≥ria
    fig.savefig(buf, format="png", bbox_inches='tight')  # Salva a figura no buffer como PNG
    plt.close(fig)  # Fecha a figura para liberar mem√≥ria
    return base64.b64encode(buf.getvalue()).decode()  # Codifica a imagem em base64 e retorna a string

# --- Fun√ß√µes de Valida√ß√£o de Dados ---
def generate_quality_report(df, df_name, unique_id_col=None, numeric_cols=None):
    """
    Gera um relat√≥rio HTML com m√©tricas de qualidade de dados para um DataFrame.
    Inclui valores ausentes, duplicados e uma an√°lise b√°sica de outliers.

    Args:
        df (pandas.DataFrame): O DataFrame a ser analisado.
        df_name (str): O nome do DataFrame (para exibi√ß√£o no relat√≥rio).
        unique_id_col (str, optional): O nome da coluna que deve conter IDs √∫nicos. Padr√£o √© None.
        numeric_cols (list, optional): Uma lista de nomes de colunas num√©ricas para an√°lise de outliers. Padr√£o √© None.

    Returns:
        dash.html.Div: Um componente Div do Dash contendo o relat√≥rio de qualidade de dados.
    """
    if df.empty:  # Verifica se o DataFrame est√° vazio
        return html.Div([  # Retorna um componente Div do Dash com uma mensagem de erro
            html.H4(f"Relat√≥rio de Qualidade de Dados para {df_name}", style={'color': '#333'}),  # Define um t√≠tulo
            html.P("DataFrame vazio. Verifique a fonte de dados.", style={'color': 'red'})  # Define uma mensagem de erro
        ], style={'marginBottom': '20px', 'border': '1px solid #ddd', 'padding': '15px', 'borderRadius': '5px'})  # Define estilos para o cont√™iner

    report_items = [html.H4(f"Relat√≥rio de Qualidade de Dados para {df_name}", style={'color': '#333'})]  # Inicializa uma lista com o t√≠tulo do relat√≥rio

    # 1. Valores Ausentes
    missing_data = df.isnull().sum()  # Calcula a soma de valores ausentes por coluna
    missing_data = missing_data[missing_data > 0]  # Filtra as colunas com valores ausentes
    if not missing_data.empty:  # Verifica se h√° valores ausentes
        report_items.append(html.P("Valores Ausentes:", style={'fontWeight': 'bold'}))  # Adiciona um cabe√ßalho
        for col, count in missing_data.items():  # Itera sobre as colunas com valores ausentes
            report_items.append(html.Li(f"'{col}': {count} valores ausentes ({count/len(df)*100:.2f}%)"))  # Adiciona um item de lista com o nome da coluna e a contagem de valores ausentes
    else:
        report_items.append(html.P("Nenhum valor ausente encontrado.", style={'color': 'green'}))  # Adiciona uma mensagem indicando que n√£o h√° valores ausentes

    # 2. Linhas Duplicadas
    duplicates = df.duplicated().sum()  # Calcula a soma de linhas duplicadas
    if duplicates > 0:  # Verifica se h√° linhas duplicadas
        report_items.append(html.P(f"Linhas Duplicadas (total): {duplicates}", style={'color': 'orange', 'fontWeight': 'bold'}))  # Adiciona um item com a contagem de linhas duplicadas
    else:
        report_items.append(html.P("Nenhuma linha duplicada encontrada (total).", style={'color': 'green'}))  # Adiciona uma mensagem indicando que n√£o h√° linhas duplicadas

    # 3. Duplicatas baseadas em ID √∫nico
    if unique_id_col and unique_id_col in df.columns:  # Verifica se a coluna de ID √∫nico foi especificada e existe no DataFrame
        id_duplicates = df.duplicated(subset=[unique_id_col]).sum()  # Calcula a soma de linhas duplicadas com base na coluna de ID √∫nico
        if id_duplicates > 0:  # Verifica se h√° linhas duplicadas com base no ID √∫nico
            report_items.append(html.P(f"Linhas duplicadas baseadas no '{unique_id_col}': {id_duplicates}", style={'color': 'red', 'fontWeight': 'bold'}))  # Adiciona um item com a contagem de linhas duplicadas com base no ID √∫nico
        else:
            report_items.append(html.P(f"Nenhuma duplicata para '{unique_id_col}'.", style={'color': 'green'}))  # Adiciona uma mensagem indicando que n√£o h√° duplicatas com base no ID √∫nico

    # 4. An√°lise de Outliers (M√©todo IQR) para colunas num√©ricas especificadas
    if numeric_cols:  # Verifica se colunas num√©ricas foram especificadas
        report_items.append(html.P("Outliers (M√©todo IQR):", style={'fontWeight': 'bold'}))  # Adiciona um cabe√ßalho
        outliers_found = False  # Inicializa uma flag para verificar se outliers foram encontrados
        for col in numeric_cols:  # Itera sobre as colunas num√©ricas
            if col in df.columns and pd.api.types.is_numeric_dtype(df[col]) and len(df[col].dropna()) > 0:  # Verifica se a coluna existe no DataFrame e se √© num√©rica
                Q1 = df[col].quantile(0.25)  # Calcula o primeiro quartil
                Q3 = df[col].quantile(0.75)  # Calcula o terceiro quartil
                IQR = Q3 - Q1  # Calcula o intervalo interquartil
                lower_bound = Q1 - 1.5 * IQR  # Calcula o limite inferior
                upper_bound = Q3 + 1.5 * IQR  # Calcula o limite superior
                outliers_count = df[(df[col] < lower_bound) | (df[col] > upper_bound)].shape[0]  # Calcula a contagem de outliers
                if outliers_count > 0:  # Verifica se outliers foram encontrados
                    report_items.append(html.Li(f"'{col}': {outliers_count} outliers ({outliers_count/len(df)*100:.2f}%)", style={'color': 'orange'}))  # Adiciona um item com a contagem de outliers
                    outliers_found = True  # Define a flag como True
        if not outliers_found:  # Verifica se outliers n√£o foram encontrados
            report_items.append(html.Li("Nenhum outlier significativo detectado nas colunas num√©ricas fornecidas.", style={'color': 'green'}))  # Adiciona uma mensagem indicando que n√£o h√° outliers

    return html.Div(report_items, style={'marginBottom': '20px', 'border': '1px solid #ddd', 'padding': '15px', 'borderRadius': '5px', 'backgroundColor': '#f9f9f9'})  # Retorna um componente Div do Dash com o relat√≥rio de qualidade de dados


Exploratory Data Analysis üèóÔ∏èüìä
Data Quality Assessment

In [None]:

# --- Carregar os Dados ---
dataframes = load_data()  # Carrega os DataFrames do banco de dados

# Atribuir os DataFrames (com pd.DataFrame() vazio para evitar erros caso a query falhe)
tCustomers = dataframes.get("customers", pd.DataFrame())  # Obt√©m o DataFrame de clientes do dicion√°rio
tOrders = dataframes.get("orders", pd.DataFrame())  # Obt√©m o DataFrame de pedidos do dicion√°rio
tProducts = dataframes.get("products", pd.DataFrame())  # Obt√©m o DataFrame de produtos do dicion√°rio
tCategories = dataframes.get("categories", pd.DataFrame())  # Obt√©m o DataFrame de categorias do dicion√°rio
tOrderItens = dataframes.get("order_items", pd.DataFrame())  # Obt√©m o DataFrame de itens de pedido do dicion√°rio
tProductsByCategories = dataframes.get("products_by_categories", pd.DataFrame())  # Obt√©m o DataFrame de produtos por categoria do dicion√°rio
tTop10CustomerValue = dataframes.get("top_10_customer_value", pd.DataFrame())  # Obt√©m o DataFrame dos top 10 clientes por valor do dicion√°rio
tSalesOverTime = dataframes.get("sales_over_time", pd.DataFrame())  # Obt√©m o DataFrame de vendas ao longo do tempo do dicion√°rio
tTopSellingProductsQuantity = dataframes.get("top_selling_products_quantity", pd.DataFrame())  # Obt√©m o DataFrame dos top 10 produtos mais vendidos do dicion√°rio
tOrderValueVsItems = dataframes.get("order_value_vs_items", pd.DataFrame())  # Obt√©m o DataFrame de valor do pedido versus itens do dicion√°rio
tProductsWithoutCategory = dataframes.get("products_without_category", pd.DataFrame())  # Obt√©m o DataFrame de produtos sem categoria do dicion√°rio
tOrdersWithInvalidCustomer = dataframes.get("orders_with_invalid_customer", pd.DataFrame())  # Obt√©m o DataFrame de pedidos com cliente inv√°lido do dicion√°rio


# --- Cria√ß√£o de Gr√°ficos (Plotly Express para interatividade) ---

# Quantidade de Produtos por Categoria
fig_products_by_category = px.bar(
    tProductsByCategories, x='category_name', y='count',
    title='Quantidade de Produtos por Categoria',
    labels={'category_name': 'Categoria', 'count': 'Quantidade'},
    color='count', color_continuous_scale=px.colors.sequential.PuBu
)  # Cria um gr√°fico de barras interativo com Plotly Express

# Top 10 Clientes por Valor Total de Compras
fig_top_customers = px.bar(
    tTop10CustomerValue, x='customer_name', y='total',
    title='Top 10 Clientes por Valor Total de Compras',
    labels={'customer_name': 'Cliente', 'total': 'Valor Total'},
    color='total', color_continuous_scale=px.colors.sequential.Greens
)  # Cria um gr√°fico de barras interativo com Plotly Express

# Tend√™ncia de Vendas Mensais (se houver dados de pedidos)
if not tSalesOverTime.empty:  # Verifica se h√° dados para criar o gr√°fico
    fig_sales_time = px.line(
        tSalesOverTime, x='month', y='total_sales',
        title='Tend√™ncia de Vendas Mensais',
        labels={'month': 'M√™s', 'total_sales': 'Total de Vendas'},
        markers=True
    )  # Cria um gr√°fico de linha interativo com Plotly Express
else:
    fig_sales_time = go.Figure().add_annotation(text="Sem dados para tend√™ncia de vendas.", showarrow=False)  # Cria uma anota√ß√£o indicando que n√£o h√° dados

# Top 10 Produtos Mais Vendidos (por Quantidade)
if not tTopSellingProductsQuantity.empty:  # Verifica se h√° dados para criar o gr√°fico
    fig_top_products_quantity = px.bar(
        tTopSellingProductsQuantity, x='product_name', y='total_quantity_sold',
        title='Top 10 Produtos Mais Vendidos (por Quantidade)',
        labels={'product_name': 'Produto', 'total_quantity_sold': 'Quantidade Vendida'},
        color='total_quantity_sold', color_continuous_scale=px.colors.sequential.Oranges
    )  # Cria um gr√°fico de barras interativo com Plotly Express
else:
    fig_top_products_quantity = go.Figure().add_annotation(text="Sem dados de produtos mais vendidos.", showarrow=False)  # Cria uma anota√ß√£o indicando que n√£o h√° dados


# Correla√ß√£o: Valor do Pedido vs. N√∫mero de Itens
if not tOrderValueVsItems.empty:  # Verifica se h√° dados para criar o gr√°fico
    fig_order_correlation = px.scatter(
        tOrderValueVsItems, x='num_items', y='order_value',
        title='Correla√ß√£o: Valor do Pedido vs. N√∫mero de Itens',
        labels={'num_items': 'N√∫mero de Itens no Pedido', 'order_value': 'Valor do Pedido'},
        hover_data=['order_value', 'num_items']
    )  # Cria um gr√°fico de dispers√£o interativo com Plotly Express
else:
    fig_order_correlation = go.Figure().add_annotation(text="Sem dados para correla√ß√£o de pedidos.", showarrow=False)  # Cria uma anota√ß√£o indicando que n√£o h√° dados


# --- Inicializa√ß√£o do Aplicativo Dash ---
app = dash.Dash(__name__)  # Cria uma inst√¢ncia do aplicativo Dash

# Define o layout do aplicativo Dash
app.layout = html.Div([
    html.H1("An√°lise Explorat√≥ria de Dados e Qualidade - E-commerce",
            style={"textAlign": "center", "marginBottom": "40px", "color": "#2c3e50"}),  # Define o t√≠tulo principal

    # --- Relat√≥rios de Qualidade de Dados ---
    html.H2("Relat√≥rios de Qualidade de Dados", style={"marginTop": "50px", "color": "#34495e"}),  # Define um subt√≠tulo
    html.Div([
        generate_quality_report(tCustomers, "Clientes", unique_id_col='customer_id'),  # Gera o relat√≥rio de qualidade de dados para a tabela de clientes
        generate_quality_report(tOrders, "Pedidos", unique_id_col='order_id', numeric_cols=['order_value']),  # Gera o relat√≥rio de qualidade de dados para a tabela de pedidos
        generate_quality_report(tProducts, "Produtos", unique_id_col='product_id', numeric_cols=['price']),  # Gera o relat√≥rio de qualidade de dados para a tabela de produtos
        generate_quality_report(tCategories, "Categorias", unique_id_col='category_id'),  # Gera o relat√≥rio de qualidade de dados para a tabela de categorias
        generate_quality_report(tOrderItens, "Itens de Pedido", numeric_cols=['quantity', 'price_at_order'])  # Gera o relat√≥rio de qualidade de dados para a tabela de itens de pedido
    ], style={'display': 'flex', 'flexWrap': 'wrap', 'gap': '20px', 'justifyContent': 'space-around'}),  # Define o estilo do cont√™iner

    # --- Inconsist√™ncias Identificadas ---
    html.H2("Poss√≠veis Inconsist√™ncias", style={"marginTop": "50px", "color": "#34495e"}),  # Define um subt√≠tulo
    html.Div([
        html.Div([
            html.H4("Produtos sem Categoria V√°lida", style={'color': '#e74c3c'}),  # Define um subt√≠tulo
            dash_table.DataTable(
                id='products-without-category-table',  # Define o ID da tabela
                columns=[{"name": col, "id": col} for col in tProductsWithoutCategory.columns],  # Define as colunas da tabela
                data=tProductsWithoutCategory.to_dict('records'),  # Define os dados da tabela
                style_table={'overflowX': 'auto', 'border': '1px solid #ddd'},  # Define o estilo da tabela
                style_cell={'textAlign': 'left', 'padding': '10px'},  # Define o estilo das c√©lulas
                style_header={'backgroundColor': '#f8f8f8', 'fontWeight': 'bold'}  # Define o estilo do cabe√ßalho
            ) if not tProductsWithoutCategory.empty else html.P("Nenhum produto sem categoria v√°lida detectado.", style={'color': 'green'})  # Exibe uma mensagem se n√£o houver produtos sem categoria
        ], style={'width': '48%', 'minWidth': '300px', 'marginBottom': '20px', 'border': '1px solid #ddd', 'padding': '15px', 'borderRadius': '5px'}),  # Define o estilo do cont√™iner

        html.Div([
            html.H4("Pedidos com Cliente Inv√°lido/Inexistente", style={'color': '#e74c3c'}),  # Define um subt√≠tulo
            dash_table.DataTable(
                id='orders-with-invalid-customer-table',  # Define o ID da tabela
                columns=[{"name": col, "id": col} for col in tOrdersWithInvalidCustomer.columns],  # Define as colunas da tabela
                data=tOrdersWithInvalidCustomer.to_dict('records'),  # Define os dados da tabela
                style_table={'overflowX': 'auto', 'border': '1px solid #ddd'},  # Define o estilo da tabela
                style_cell={'textAlign': 'left', 'padding': '10px'},  # Define o estilo das c√©lulas
                style_header={'backgroundColor': '#f8f8f8', 'fontWeight': 'bold'}  # Define o estilo do cabe√ßalho
            ) if not tOrdersWithInvalidCustomer.empty else html.P("Nenhum pedido com cliente inv√°lido detectado.", style={'color': 'green'})  # Exibe uma mensagem se n√£o houver pedidos com cliente inv√°lido
        ], style={'width': '48%', 'minWidth': '300px', 'marginBottom': '20px', 'border': '1px solid #ddd', 'padding': '15px', 'borderRadius': '5px'})  # Define o estilo do cont√™iner
    ], style={'display': 'flex', 'flexWrap': 'wrap', 'gap': '20px', 'justifyContent': 'space-around'}),  # Define o estilo do cont√™iner

    # --- Vis√£o Geral das Tabelas ---
    html.H2("Vis√£o Geral das Tabelas (Primeiras 5 linhas)", style={"marginTop": "50px", "color": "#34495e"}),  # Define um subt√≠tulo
    html.Details([
        html.Summary("Clique para expandir/recolher as tabelas"),  # Define um resumo para o componente Details
        html.Div([
            html.H4("Clientes", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
            dash_table.DataTable(
                id='customers-table',  # Define o ID da tabela
                columns=[{"name": col, "id": col} for col in tCustomers.columns],  # Define as colunas da tabela
                data=tCustomers.head(5).to_dict('records'),  # Define os dados da tabela
                style_table={'overflowX': 'auto', 'marginBottom': '20px'},  # Define o estilo da tabela
                style_cell={'textAlign': 'left', 'minWidth': '80px', 'width': '120px', 'maxWidth': '180px'},  # Define o estilo das c√©lulas
                style_data_conditional=[
                    {'if': {'row_index': 'odd'}, 'backgroundColor': 'rgb(248, 248, 248)'}  # Define o estilo para linhas √≠mpares
                ],
                style_header={'backgroundColor': 'rgb(230, 230, 230)', 'fontWeight': 'bold'}  # Define o estilo do cabe√ßalho
            ),
            html.H4("Pedidos", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
            dash_table.DataTable(
                id='orders-table',  # Define o ID da tabela
                columns=[{"name": col, "id": col} for col in tOrders.columns],  # Define as colunas da tabela
                data=tOrders.head(5).to_dict('records'),  # Define os dados da tabela
                style_table={'overflowX': 'auto', 'marginBottom': '20px'},  # Define o estilo da tabela
                style_cell={'textAlign': 'left', 'minWidth': '80px', 'width': '120px', 'maxWidth': '180px'},  # Define o estilo das c√©lulas
                style_data_conditional=[
                    {'if': {'row_index': 'odd'}, 'backgroundColor': 'rgb(248, 248, 248)'}  # Define o estilo para linhas √≠mpares
                ],
                style_header={'backgroundColor': 'rgb(230, 230, 230)', 'fontWeight': 'bold'}  # Define o estilo do cabe√ßalho
            ),
            html.H4("Produtos", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
            dash_table.DataTable(
                id='products-table',  # Define o ID da tabela
                columns=[{"name": col, "id": col} for col in tProducts.columns],  # Define as colunas da tabela
                data=tProducts.head(5).to_dict('records'),  # Define os dados da tabela
                style_table={'overflowX': 'auto', 'marginBottom': '20px'},  # Define o estilo da tabela
                style_cell={'textAlign': 'left', 'minWidth': '80px', 'width': '120px', 'maxWidth': '180px'},  # Define o estilo das c√©lulas
                style_data_conditional=[
                    {'if': {'row_index': 'odd'}, 'backgroundColor': 'rgb(248, 248, 248)'}  # Define o estilo para linhas √≠mpares
                ],
                style_header={'backgroundColor': 'rgb(230, 230, 230)', 'fontWeight': 'bold'}  # Define o estilo do cabe√ßalho
            ),
            html.H4("Categorias", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
            dash_table.DataTable(
                id='categories-table',  # Define o ID da tabela
                columns=[{"name": col, "id": col} for col in tCategories.columns],  # Define as colunas da tabela
                data=tCategories.head(5).to_dict('records'),  # Define os dados da tabela
                style_table={'overflowX': 'auto', 'marginBottom': '20px'},  # Define o estilo da tabela
                style_cell={'textAlign': 'left', 'minWidth': '80px', 'width': '120px', 'maxWidth': '180px'},  # Define o estilo das c√©lulas
                style_data_conditional=[
                    {'if': {'row_index': 'odd'}, 'backgroundColor': 'rgb(248, 248, 248)'}  # Define o estilo para linhas √≠mpares
                ],
                style_header={'backgroundColor': 'rgb(230, 230, 230)', 'fontWeight': 'bold'}  # Define o estilo do cabe√ßalho
            ),
            html.H4("Itens de Pedido", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
            dash_table.DataTable(
                id='order-items-table',  # Define o ID da tabela
                columns=[{"name": col, "id": col} for col in tOrderItens.columns],  # Define as colunas da tabela
                data=tOrderItens.head(5).to_dict('records'),  # Define os dados da tabela
                style_table={'overflowX': 'auto', 'marginBottom': '20px'},  # Define o estilo da tabela
                style_cell={'textAlign': 'left', 'minWidth': '80px', 'width': '120px', 'maxWidth': '180px'},  # Define o estilo das c√©lulas
                style_data_conditional=[
                    {'if': {'row_index': 'odd'}, 'backgroundColor': 'rgb(248, 248, 248)'}  # Define o estilo para linhas √≠mpares
                ],
                style_header={'backgroundColor': 'rgb(230, 230, 230)', 'fontWeight': 'bold'}  # Define o estilo do cabe√ßalho
            )
        ])
    ], style={'marginBottom': '40px', 'border': '1px solid #ccc', 'padding': '15px', 'borderRadius': '8px', 'boxShadow': '2px 2px 5px rgba(0,0,0,0.1)'}),  # Define o estilo do cont√™iner

    # --- Visualiza√ß√µes Gr√°ficas para Tend√™ncias, Correla√ß√µes e Outliers ---
    html.H2("Tend√™ncias, Correla√ß√µes e Outliers", style={"marginTop": "50px", "color": "#34495e"}),  # Define um subt√≠tulo

    html.Div([
        html.H4("Quantidade de Produtos por Categoria", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
        dcc.Graph(figure=fig_products_by_category)  # Exibe o gr√°fico interativo
    ], style={'marginBottom': '40px', 'border': '1px solid #eee', 'borderRadius': '8px', 'padding': '10px', 'boxShadow': '1px 1px 3px rgba(0,0,0,0.05)'}),  # Define o estilo do cont√™iner

    html.Div([
        html.H4("Top 10 Clientes por Valor Total de Compras", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
        dcc.Graph(figure=fig_top_customers)  # Exibe o gr√°fico interativo
    ], style={'marginBottom': '40px', 'border': '1px solid #eee', 'borderRadius': '8px', 'padding': '10px', 'boxShadow': '1px 1px 3px rgba(0,0,0,0.05)'}),  # Define o estilo do cont√™iner

    html.Div([
        html.H4("Tend√™ncia de Vendas Mensais", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
        dcc.Graph(figure=fig_sales_time)  # Exibe o gr√°fico interativo
    ], style={'marginBottom': '40px', 'border': '1px solid #eee', 'borderRadius': '8px', 'padding': '10px', 'boxShadow': '1px 1px 3px rgba(0,0,0,0.05)'}),  # Define o estilo do cont√™iner

    html.Div([
        html.H4("Top 10 Produtos Mais Vendidos (por Quantidade)", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
        dcc.Graph(figure=fig_top_products_quantity)  # Exibe o gr√°fico interativo
    ], style={'marginBottom': '40px', 'border': '1px solid #eee', 'borderRadius': '8px', 'padding': '10px', 'boxShadow': '1px 1px 3px rgba(0,0,0,0.05)'}),  # Define o estilo do cont√™iner

    html.Div([
        html.H4("Correla√ß√£o: Valor do Pedido vs. N√∫mero de Itens", style={'color': '#2c3e50'}),  # Define um subt√≠tulo
        dcc.Graph(figure=fig_order_correlation)  # Exibe o gr√°fico interativo
    ], style={'marginBottom': '40px', 'border': '1px solid #eee', 'borderRadius': '8px', 'padding': '10px', 'boxShadow': '1px 1px 3px rgba(0,0,0,0.05)'}),  # Define o estilo do cont√™iner
])

if __name__ == '__main__':  # Garante que o c√≥digo dentro deste bloco s√≥ seja executado quando o script for executado diretamente
    try:
        app.run(debug=True)  # Inicia o aplicativo Dash no modo de depura√ß√£o
    finally:
        # Garante que a conex√£o seja fechada quando o aplicativo Dash encerrar
        if conn:  # Verifica se a conex√£o com o banco de dados foi estabelecida
            conn.close()  # Fecha a conex√£o com o banco de dados
            print("Conex√£o com o banco de dados SQLite fechada.")  # Imprime uma mensagem indicando que a conex√£o foi fechada