Exploratory Data Analysis 🏗️📊
Configuration

In [None]:
import pandas as pd  # Importa a biblioteca Pandas para manipulação de dados
import numpy as np  # Importa a biblioteca NumPy para operações numéricas
import sqlite3  # Importa a biblioteca SQLite para interação com bancos de dados SQLite
import dash  # Importa a biblioteca Dash para criação de aplicativos web interativos
import dash_table  # Importa o componente dash_table para exibir dados em tabelas
from dash import dcc, html  # Importa os componentes dcc (gráficos) e html do Dash
import plotly.express as px  # Importa a biblioteca Plotly Express para criar gráficos de forma fácil

conn = sqlite3.connect('C:/Users/santo/Documents/GitHubPublished/DataScienceProject/database/ecommerceProject.db')  # Conecta ao banco de dados SQLite

# Define um dicionário com consultas SQL para diferentes análises
dictQuery = {
    "queryCustomers": 'SELECT * FROM customers LIMIT 5',
    "queryOrders": 'SELECT * FROM orders LIMIT 5',
    "queryProducts": 'SELECT * FROM products LIMIT 5',
    "queryCategories": 'SELECT * FROM categories LIMIT 5',
    "queryOrderItens": 'SELECT * FROM order_items LIMIT 5',
    "queryCountProducts": 'SELECT COUNT(*) AS total_products FROM products',
    "queryCountCategories": 'SELECT COUNT(*) AS total_categories FROM categories',
    "queryAvgSales": 'SELECT Round(AVG(order_value),2) AS avg_sales FROM orders',
    "queryDistinctCategories": 'SELECT DISTINCT category_name FROM categories',
    "queryProductsByCategories": '''
                SELECT c.category_name, COUNT(DISTINCT p.product_name) AS count
                FROM categories c
                JOIN products p
                ON c.category_id = p.category_id
                GROUP BY c.category_name
                ORDER BY c.category_name''',
    "queryTop10CustomerValue": '''
                SELECT
                c.customer_id,
                Round(SUM(o.order_value),2) AS total
                FROM customers c
                JOIN orders o
                ON c.customer_id = o.customer_id
                GROUP BY c.customer_id
                ORDER BY total DESC
                LIMIT 10'''
}

def runQuery(queryKey, params=()):
    """Executa uma consulta SQL e retorna o resultado como um DataFrame.

    Args:
        queryKey (str): Chave da consulta no dicionário `dictQuery`.
        params (tuple, optional): Parâmetros para a consulta SQL. Padrão é ().

    Returns:
        pandas.DataFrame: DataFrame com o resultado da consulta.
    """
    query = dictQuery[queryKey]  # Obtém a consulta SQL do dicionário
    return pd.read_sql(query, conn, params=params)  # Executa a consulta e retorna o resultado como um DataFrame

Exploratory Data Analysis 🏗️📊
Analysis

In [None]:
# Executa as consultas SQL e armazena os resultados em DataFrames
tCustomers = runQuery("queryCustomers")
tOrders = runQuery("queryOrders")
tProducts = runQuery("queryProducts")
tCategories = runQuery("queryCategories")
tOrderItens = runQuery("queryOrderItens")
tCountProducts = runQuery("queryCountProducts")
tCountCategories = runQuery("queryCountCategories")
tAvgSales = runQuery("queryAvgSales")
tDistinctCategories = runQuery("queryDistinctCategories")
tProductsByCategories = runQuery("queryProductsByCategories")
tTop10CustomerValue = runQuery("queryTop10CustomerValue")

app = dash.Dash(__name__)  # Cria uma instância do aplicativo Dash

# Define o layout do aplicativo Dash
app.layout = html.Div([
    html.H1("Tabelas do Banco de Dados E-commerce (Consultas Básicas)", style={"textAlign": "center"}),  # Define um título principal

    html.H2("Clientes"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='customers-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tCustomers.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tCustomers.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Pedidos"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='orders-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tOrders.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tOrders.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Produtos"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='products-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tProducts.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tProducts.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Categorias"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='categories-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tCategories.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tCategories.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Itens de Pedido"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='order-itens-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tOrderItens.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tOrderItens.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Contagem de Produtos"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='count-products-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tCountProducts.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tCountProducts.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Contagem de Categorias"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='count-categories-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tCountCategories.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tCountCategories.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Média de Vendas"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='avg-sales-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tAvgSales.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tAvgSales.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Categorias Distintas"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='distinct-categories-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tDistinctCategories.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tDistinctCategories.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),

    html.H1("Tabelas do Banco de Dados E-commerce (Agregações, Agrupamentos e Joins)", style={"textAlign": "center"}),  # Define um título principal
    html.H2("Produtos por Categorias"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='products-by-categories-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tProductsByCategories.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tProductsByCategories.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
    html.H2("Top 10 Clientes por Valor de Compra"),  # Define um subtítulo
    dash_table.DataTable(  # Cria uma tabela Dash
        id='top10-customer-value-table',  # Define o ID da tabela
        columns=[{"name": col, "id": col} for col in tTop10CustomerValue.columns],  # Define as colunas da tabela com base nas colunas do DataFrame
        data=tTop10CustomerValue.to_dict('records'),  # Define os dados da tabela com base nos dados do DataFrame
        style_table={'height': 'auto', 'overflowY': 'auto'},  # Define estilos para a tabela
        style_cell={'textAlign': 'left'}  # Define estilos para as células da tabela
    ),
])

if __name__ == '__main__':  # Garante que o código dentro deste bloco só seja executado quando o script for executado diretamente
    app.run(debug=True)  # Inicia o aplicativo Dash no modo de depuração

In [None]:
conn.close()  # Fecha a conexão com o banco de dados