In [1]:
import os
import gc
import time
import subprocess
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

from tqdm import tqdm
from dotenv import dotenv_values
from sqlalchemy import text, create_engine

In [2]:
DATABASE_URL = dotenv_values("../.env.local")['DATABASE_URL']
senha = "mr230303A!!"
engine = None

In [3]:
%load_ext sql

%sql $DATABASE_URL

In [4]:
def get_statistics(durations):
    """
    Calculate the mean and standard deviation of a list of durations.
    """
    mean = np.mean(durations)
    median = np.median(durations)
    std = np.std(durations)
    min_duration = np.min(durations)
    max_duration = np.max(durations)

    print(f"Mean: {mean:.6f} s")
    print(f"Median: {median:.6f} s")
    print(f"Std Dev: {std:.6f} s")
    print(f"Min: {min_duration:.6f} s")
    print(f"Max: {max_duration:.6f} s")

In [5]:
def PrintPlan(pl):
    print('\nPlano:','-'*100)
    for linha in pl:
        print(linha[0])
    print('-'*107,'\n')

In [6]:
def create_new_engine():
    return create_engine(DATABASE_URL, pool_pre_ping=True)

def ensure_connection_alive():
    global engine
    try:
        # Se engine não existe ainda
        if engine is None:
            engine = create_new_engine()
            return

        # Tenta usar a engine atual
        with engine.connect() as conn:
            conn.execute(text("SELECT 1"))

    except (OperationalError, StatementError):
        print("🔁 Conexão inválida. Descartando e recriando engine...")
        if engine:
            engine.dispose()
            del engine  # remove a referência para liberar via GC
        engine = create_new_engine()

In [7]:
def set_query_statistics(queryid: int, query: str, index_type: str, description: str):
    for _ in tqdm(range(100), position=0):
        clear_cache()
        time.sleep(2)
        
        ensure_connection_alive()

        with engine.connect() as conn:
            conn.execute(
                text("CALL insert_query_statistics(:qid, :qtext, :index_type, :description);"),
                {
                    "qid": queryid,
                    "qtext": query,
                    "index_type": index_type,
                    "description": description,
                }
            )
            conn.commit()
        
        gc.collect()

In [8]:
def clear_cache():
    comando = 'echo 3 > /proc/sys/vm/drop_caches'
    proc = subprocess.run(
        ['sudo', '-S', 'sh', '-c', comando],
        input=(senha + '\n').encode(),
        stdout=subprocess.PIPE,
        stderr=subprocess.PIPE
    )
    if proc.returncode != 0:
        print(f"Erro ao limpar cache:\n{proc.stderr.decode()}")
    else:
        print("Cache do sistema limpo com sucesso.")
    os.system("docker restart postgres-main")

In [9]:
%config SqlMagic.style = '_DEPRECATED_DEFAULT'

In [10]:
%%sql

DROP TABLE IF EXISTS stats_queries;

CREATE TABLE IF NOT EXISTS stats_queries (
    statid INTEGER,
    queryid INTEGER,
    index_type TEXT,
    description TEXT,
    elapsedtime DOUBLE PRECISION,
    CONSTRAINT stats_queries_pk PRIMARY KEY (statid)
);

CREATE INDEX idx_stats_queries_search ON stats_queries USING BTREE(queryid, index_type);

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
Done.
Done.
Done.


[]

In [11]:
%%sql 

CREATE OR REPLACE PROCEDURE insert_query_statistics (
    queryid INTEGER,
    query_text TEXT,
    query_index_type TEXT,
    query_description TEXT
) AS $$
    DECLARE
        start_time TIMESTAMPTZ;
        end_time TIMESTAMPTZ;
        stats_index INTEGER;
        _row RECORD;
    BEGIN
        SELECT COALESCE(MAX(statid), 0) INTO stats_index FROM stats_queries;

        stats_index := stats_index + 1;

        start_time := clock_timestamp();
        FOR _row IN EXECUTE query_text LOOP
        END LOOP;
        end_time := clock_timestamp();

        INSERT INTO stats_queries VALUES (stats_index, queryid, query_index_type, query_description, EXTRACT(EPOCH FROM (end_time - start_time)));
    END;
$$ LANGUAGE plpgsql;

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
Done.


[]

In [12]:
%%sql

CREATE OR REPLACE FUNCTION get_query_statistics (queryid INTEGER, index_type TEXT) RETURNS TABLE (
    tempomedio NUMERIC(8,2),
    tempominimo NUMERIC(8,2),
    tempoprimeiroquartil NUMERIC(8,2),
    tempomediana NUMERIC(8,2),
    tempoterceiroquartil NUMERIC(8,2),
    tempomaximo NUMERIC(8,2),
    tempodesviopadrao NUMERIC(8,2)
) AS $$
    BEGIN
        RETURN QUERY 
           SELECT
                AVG(elapsedtime)::NUMERIC(8,2) AS TempoMedio,
                MIN(elapsedtime)::NUMERIC(8,2) AS TempoMinimo,
                (percentile_cont(0.25) WITHIN GROUP (ORDER BY elapsedtime))::NUMERIC(8,2) AS TempoPrimeiroQuartil,
                (percentile_cont(0.5)  WITHIN GROUP (ORDER BY elapsedtime))::NUMERIC(8,2) AS TempoMediana,
                (percentile_cont(0.75) WITHIN GROUP (ORDER BY elapsedtime))::NUMERIC(8,2) AS TempoTerceiroQuartil,
                MAX(elapsedtime)::NUMERIC(8,2) AS TempoMaximo,
                STDDEV(elapsedtime)::NUMERIC(8,2) AS TempoDesvioPadrao
            FROM stats_queries AS SQ
            GROUP BY SQ.queryid, SQ.index_type
            HAVING SQ.queryid = queryid AND SQ.index_type = index_type;
    END;
$$ LANGUAGE plpgsql;

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
Done.


[]

# Analysis Thirth Query
---

* **Query 3: Análise do Desempenho do Pneu em relação a temperatura da pista**
    * Essa consulta ranqueia quais tipos de pneus possuem maior uso com relação a temperatura média da pista. Dentro da Base, foram armazenadas diversas informações sobre cada tipo de pneu e informações sobre condições climáticas no tempo que permitem realizar esta análise.  


In [13]:
third_query = f"""
    SELECT  
        TS.compound AS CompostoPneu,
        AVG(WC.track_temperature)::NUMERIC(8,2) AS TemperaturaMediaPista,
        MAX(TS.lap_end - TS.lap_start) AS MaxLapDurationTyre
    FROM tyre_stints AS TS
    INNER JOIN weather_conditions AS WC ON WC.session_key = TS.session_key
    GROUP BY TS.compound
    ORDER BY MaxLapDurationTyre DESC
"""

In [14]:
%sql $third_query LIMIT 10

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb


8 rows affected.


compostopneu,temperaturamediapista,maxlapdurationtyre
HARD,37.73,55
MEDIUM,37.95,54
,24.09,32
SOFT,36.61,28
INTERMEDIATE,21.81,25
WET,25.27,16
UNKNOWN,33.75,13
TEST_UNKNOWN,38.31,12


In [15]:
clear_cache()

Cache do sistema limpo com sucesso.
postgres-main


In [17]:
%sql Plano << EXPLAIN (ANALYZE, BUFFERS) $third_query

PrintPlan(Plano)

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
22 rows affected.
Returning data to local variable Plano

Plano: ----------------------------------------------------------------------------------------------------
Sort  (cost=14785.94..14785.96 rows=7 width=24) (actual time=286.650..286.662 rows=8 loops=1)
  Sort Key: (max((ts.lap_end - ts.lap_start))) DESC
  Sort Method: quicksort  Memory: 25kB
  Buffers: shared hit=3 read=162
  ->  HashAggregate  (cost=14785.72..14785.84 rows=7 width=24) (actual time=286.569..286.597 rows=8 loops=1)
        Group Key: ts.compound
        Batches: 1  Memory Usage: 24kB
        Buffers: shared read=162
        ->  Hash Join  (cost=230.94..8239.11 rows=654661 width=22) (actual time=4.594..107.166 rows=654661 loops=1)
              Hash Cond: (wc.session_key = ts.session_key)
              Buffers: shared read=162
              ->  Seq Scan on weather_conditions wc  (cost=0.00..188.19 rows=8419 width=12) (actual time=0.185..5.123 row

## Default
---

Como default a consulta não utiliza os índices criados no formação do dataset. O que iremos fazer agora será ver o desempenho dessa consulta sem nenhum índide. Depois disso iremos propor algum índice que faça sendito para o nosso problema e seja de uma série temporal, abordanddo o escolo do nosso projeto.

In [18]:
check_indexes = """
    SELECT
        indexname,
        indexdef
    FROM
        pg_indexes
    WHERE
        tablename = 'tyre_stints';
"""

In [19]:
%sql $check_indexes

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
1 rows affected.


indexname,indexdef
tyre_stints_pkey,"CREATE UNIQUE INDEX tyre_stints_pkey ON public.tyre_stints USING btree (session_key, driver_number, stint_number)"


In [20]:
set_query_statistics(3, third_query, 'BTREE', 'Consulta 3 usando o índice B-Tree')

  0%|          | 0/100 [00:00<?, ?it/s]

Cache do sistema limpo com sucesso.
postgres-main


  1%|          | 1/100 [00:03<06:20,  3.85s/it]

Cache do sistema limpo com sucesso.
postgres-main


  2%|▏         | 2/100 [00:07<06:09,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


  3%|▎         | 3/100 [00:11<06:04,  3.76s/it]

Cache do sistema limpo com sucesso.
postgres-main


  4%|▍         | 4/100 [00:14<05:46,  3.61s/it]

Cache do sistema limpo com sucesso.
postgres-main


  5%|▌         | 5/100 [00:18<05:48,  3.67s/it]

Cache do sistema limpo com sucesso.
postgres-main


  6%|▌         | 6/100 [00:22<05:45,  3.67s/it]

Cache do sistema limpo com sucesso.
postgres-main


  7%|▋         | 7/100 [00:25<05:44,  3.70s/it]

Cache do sistema limpo com sucesso.
postgres-main


  8%|▊         | 8/100 [00:29<05:38,  3.68s/it]

Cache do sistema limpo com sucesso.
postgres-main


  9%|▉         | 9/100 [00:33<05:35,  3.68s/it]

Cache do sistema limpo com sucesso.
postgres-main


 10%|█         | 10/100 [00:36<05:30,  3.67s/it]

Cache do sistema limpo com sucesso.
postgres-main


 11%|█         | 11/100 [00:40<05:27,  3.68s/it]

Cache do sistema limpo com sucesso.
postgres-main


 12%|█▏        | 12/100 [00:44<05:24,  3.68s/it]

Cache do sistema limpo com sucesso.
postgres-main


 13%|█▎        | 13/100 [00:47<05:19,  3.67s/it]

Cache do sistema limpo com sucesso.
postgres-main


 14%|█▍        | 14/100 [00:51<05:23,  3.76s/it]

Cache do sistema limpo com sucesso.
postgres-main


 15%|█▌        | 15/100 [00:55<05:17,  3.73s/it]

Cache do sistema limpo com sucesso.
postgres-main


 16%|█▌        | 16/100 [00:59<05:09,  3.68s/it]

Cache do sistema limpo com sucesso.
postgres-main


 17%|█▋        | 17/100 [01:02<05:07,  3.70s/it]

Cache do sistema limpo com sucesso.
postgres-main


 18%|█▊        | 18/100 [01:06<05:01,  3.68s/it]

Cache do sistema limpo com sucesso.
postgres-main


 19%|█▉        | 19/100 [01:10<04:56,  3.66s/it]

Cache do sistema limpo com sucesso.
postgres-main


 20%|██        | 20/100 [01:13<04:56,  3.71s/it]

Cache do sistema limpo com sucesso.
postgres-main


 21%|██        | 21/100 [01:17<04:48,  3.65s/it]

Cache do sistema limpo com sucesso.
postgres-main


 22%|██▏       | 22/100 [01:21<04:49,  3.72s/it]

Cache do sistema limpo com sucesso.
postgres-main


 23%|██▎       | 23/100 [01:25<04:48,  3.75s/it]

Cache do sistema limpo com sucesso.
postgres-main


 24%|██▍       | 24/100 [01:28<04:42,  3.71s/it]

Cache do sistema limpo com sucesso.
postgres-main


 25%|██▌       | 25/100 [01:32<04:42,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


 26%|██▌       | 26/100 [01:36<04:36,  3.74s/it]

Cache do sistema limpo com sucesso.
postgres-main


 27%|██▋       | 27/100 [01:40<04:33,  3.74s/it]

Cache do sistema limpo com sucesso.
postgres-main


 28%|██▊       | 28/100 [01:44<04:35,  3.83s/it]

Cache do sistema limpo com sucesso.
postgres-main


 29%|██▉       | 29/100 [01:47<04:29,  3.80s/it]

Cache do sistema limpo com sucesso.
postgres-main


 30%|███       | 30/100 [01:51<04:21,  3.74s/it]

Cache do sistema limpo com sucesso.
postgres-main


 31%|███       | 31/100 [01:55<04:20,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


 32%|███▏      | 32/100 [01:59<04:16,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


 33%|███▎      | 33/100 [02:02<04:12,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 34%|███▍      | 34/100 [02:06<04:12,  3.83s/it]

Cache do sistema limpo com sucesso.
postgres-main


 35%|███▌      | 35/100 [02:10<04:07,  3.81s/it]

Cache do sistema limpo com sucesso.
postgres-main


 36%|███▌      | 36/100 [02:14<04:02,  3.79s/it]

Cache do sistema limpo com sucesso.
postgres-main


 37%|███▋      | 37/100 [02:17<03:56,  3.75s/it]

Cache do sistema limpo com sucesso.
postgres-main


 38%|███▊      | 38/100 [02:21<03:53,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


 39%|███▉      | 39/100 [02:25<03:45,  3.69s/it]

Cache do sistema limpo com sucesso.
postgres-main


 40%|████      | 40/100 [02:29<03:44,  3.75s/it]

Cache do sistema limpo com sucesso.
postgres-main


 41%|████      | 41/100 [02:32<03:40,  3.73s/it]

Cache do sistema limpo com sucesso.
postgres-main


 42%|████▏     | 42/100 [02:36<03:35,  3.71s/it]

Cache do sistema limpo com sucesso.
postgres-main


 43%|████▎     | 43/100 [02:40<03:35,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


 44%|████▍     | 44/100 [02:44<03:31,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 45%|████▌     | 45/100 [02:48<03:27,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 46%|████▌     | 46/100 [02:51<03:24,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 47%|████▋     | 47/100 [02:55<03:22,  3.82s/it]

Cache do sistema limpo com sucesso.
postgres-main


 48%|████▊     | 48/100 [02:59<03:16,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 49%|████▉     | 49/100 [03:03<03:11,  3.76s/it]

Cache do sistema limpo com sucesso.
postgres-main


 50%|█████     | 50/100 [03:06<03:07,  3.75s/it]

Cache do sistema limpo com sucesso.
postgres-main


 51%|█████     | 51/100 [03:10<03:02,  3.72s/it]

Cache do sistema limpo com sucesso.
postgres-main


 52%|█████▏    | 52/100 [03:14<02:56,  3.68s/it]

Cache do sistema limpo com sucesso.
postgres-main


 53%|█████▎    | 53/100 [03:17<02:55,  3.74s/it]

Cache do sistema limpo com sucesso.
postgres-main


 54%|█████▍    | 54/100 [03:21<02:54,  3.79s/it]

Cache do sistema limpo com sucesso.
postgres-main


 55%|█████▌    | 55/100 [03:25<02:48,  3.75s/it]

Cache do sistema limpo com sucesso.
postgres-main


 56%|█████▌    | 56/100 [03:29<02:46,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 57%|█████▋    | 57/100 [03:33<02:42,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 58%|█████▊    | 58/100 [03:36<02:37,  3.75s/it]

Cache do sistema limpo com sucesso.
postgres-main


 59%|█████▉    | 59/100 [03:40<02:31,  3.70s/it]

Cache do sistema limpo com sucesso.
postgres-main


 60%|██████    | 60/100 [03:44<02:30,  3.76s/it]

Cache do sistema limpo com sucesso.
postgres-main


 61%|██████    | 61/100 [03:48<02:30,  3.86s/it]

Cache do sistema limpo com sucesso.
postgres-main


 62%|██████▏   | 62/100 [03:52<02:24,  3.81s/it]

Cache do sistema limpo com sucesso.
postgres-main


 63%|██████▎   | 63/100 [03:55<02:21,  3.84s/it]

Cache do sistema limpo com sucesso.
postgres-main


 64%|██████▍   | 64/100 [03:59<02:16,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 65%|██████▌   | 65/100 [04:03<02:11,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


 66%|██████▌   | 66/100 [04:07<02:08,  3.79s/it]

Cache do sistema limpo com sucesso.
postgres-main


 67%|██████▋   | 67/100 [04:11<02:05,  3.81s/it]

Cache do sistema limpo com sucesso.
postgres-main


 68%|██████▊   | 68/100 [04:14<02:01,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 69%|██████▉   | 69/100 [04:18<01:57,  3.79s/it]

Cache do sistema limpo com sucesso.
postgres-main


 70%|███████   | 70/100 [04:22<01:54,  3.81s/it]

Cache do sistema limpo com sucesso.
postgres-main


 71%|███████   | 71/100 [04:26<01:51,  3.84s/it]

Cache do sistema limpo com sucesso.
postgres-main


 72%|███████▏  | 72/100 [04:30<01:47,  3.82s/it]

Cache do sistema limpo com sucesso.
postgres-main


 73%|███████▎  | 73/100 [04:34<01:43,  3.85s/it]

Cache do sistema limpo com sucesso.
postgres-main


 74%|███████▍  | 74/100 [04:37<01:39,  3.83s/it]

Cache do sistema limpo com sucesso.
postgres-main


 75%|███████▌  | 75/100 [04:41<01:35,  3.82s/it]

Cache do sistema limpo com sucesso.
postgres-main


 76%|███████▌  | 76/100 [04:45<01:31,  3.79s/it]

Cache do sistema limpo com sucesso.
postgres-main


 77%|███████▋  | 77/100 [04:49<01:27,  3.82s/it]

Cache do sistema limpo com sucesso.
postgres-main


 78%|███████▊  | 78/100 [04:53<01:23,  3.82s/it]

Cache do sistema limpo com sucesso.
postgres-main


 79%|███████▉  | 79/100 [04:56<01:19,  3.80s/it]

Cache do sistema limpo com sucesso.
postgres-main


 80%|████████  | 80/100 [05:00<01:16,  3.84s/it]

Cache do sistema limpo com sucesso.
postgres-main


 81%|████████  | 81/100 [05:04<01:12,  3.80s/it]

Cache do sistema limpo com sucesso.
postgres-main


 82%|████████▏ | 82/100 [05:08<01:09,  3.84s/it]

Cache do sistema limpo com sucesso.
postgres-main


 83%|████████▎ | 83/100 [05:12<01:04,  3.80s/it]

Cache do sistema limpo com sucesso.
postgres-main


 84%|████████▍ | 84/100 [05:15<01:00,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 85%|████████▌ | 85/100 [05:19<00:56,  3.78s/it]

Cache do sistema limpo com sucesso.
postgres-main


 86%|████████▌ | 86/100 [05:23<00:52,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


 87%|████████▋ | 87/100 [05:27<00:49,  3.79s/it]

Cache do sistema limpo com sucesso.
postgres-main


 88%|████████▊ | 88/100 [05:30<00:44,  3.73s/it]

Cache do sistema limpo com sucesso.
postgres-main


 89%|████████▉ | 89/100 [05:34<00:40,  3.69s/it]

Cache do sistema limpo com sucesso.
postgres-main


 90%|█████████ | 90/100 [05:38<00:36,  3.68s/it]

Cache do sistema limpo com sucesso.
postgres-main


 91%|█████████ | 91/100 [05:41<00:33,  3.70s/it]

Cache do sistema limpo com sucesso.
postgres-main


 92%|█████████▏| 92/100 [05:45<00:29,  3.72s/it]

Cache do sistema limpo com sucesso.
postgres-main


 93%|█████████▎| 93/100 [05:49<00:26,  3.81s/it]

Cache do sistema limpo com sucesso.
postgres-main


 94%|█████████▍| 94/100 [05:53<00:22,  3.79s/it]

Cache do sistema limpo com sucesso.
postgres-main


 95%|█████████▌| 95/100 [05:57<00:18,  3.76s/it]

Cache do sistema limpo com sucesso.
postgres-main


 96%|█████████▌| 96/100 [06:00<00:15,  3.77s/it]

Cache do sistema limpo com sucesso.
postgres-main


 97%|█████████▋| 97/100 [06:04<00:11,  3.79s/it]

Cache do sistema limpo com sucesso.
postgres-main


 98%|█████████▊| 98/100 [06:08<00:07,  3.72s/it]

Cache do sistema limpo com sucesso.
postgres-main


 99%|█████████▉| 99/100 [06:11<00:03,  3.73s/it]

Cache do sistema limpo com sucesso.
postgres-main


100%|██████████| 100/100 [06:15<00:00,  3.76s/it]


In [23]:
%%sql

SELECT
    AVG(elapsedtime)::NUMERIC(8,2) AS TempoMedio,
    MIN(elapsedtime)::NUMERIC(8,2) AS TempoMinimo,
    (percentile_cont(0.25) WITHIN GROUP (ORDER BY elapsedtime))::NUMERIC(8,2) AS TempoPrimeiroQuartil,
    (percentile_cont(0.5)  WITHIN GROUP (ORDER BY elapsedtime))::NUMERIC(8,2) AS TempoMediana,
    (percentile_cont(0.75) WITHIN GROUP (ORDER BY elapsedtime))::NUMERIC(8,2) AS TempoTerceiroQuartil,
    MAX(elapsedtime)::NUMERIC(8,2) AS TempoMaximo,
    STDDEV(elapsedtime)::NUMERIC(8,2) AS TempoDesvioPadrao
FROM stats_queries AS SQ
GROUP BY SQ.queryid, SQ.index_type
HAVING SQ.queryid = 3 AND SQ.index_type = 'BTREE';

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
1 rows affected.


tempomedio,tempominimo,tempoprimeiroquartil,tempomediana,tempoterceiroquartil,tempomaximo,tempodesviopadrao
0.21,0.16,0.19,0.2,0.22,0.3,0.03


In [24]:
%sql duration_btree << SELECT elapsedtime FROM stats_queries AS SQ WHERE SQ.queryid = 3 AND SQ.index_type = 'BTREE';

duration_btree = [x[0] for x in duration_btree]
duration_btree

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
100 rows affected.
Returning data to local variable duration_btree


[0.187112,
 0.184682,
 0.294384,
 0.172318,
 0.206542,
 0.192797,
 0.302197,
 0.200541,
 0.241836,
 0.17106,
 0.1786,
 0.188737,
 0.193565,
 0.231976,
 0.222319,
 0.167027,
 0.196863,
 0.215216,
 0.176899,
 0.189668,
 0.212387,
 0.189433,
 0.241171,
 0.252193,
 0.212091,
 0.19605,
 0.176717,
 0.261101,
 0.225265,
 0.179882,
 0.292641,
 0.213721,
 0.200707,
 0.191919,
 0.188771,
 0.178518,
 0.163519,
 0.258636,
 0.180678,
 0.181679,
 0.186084,
 0.190125,
 0.249302,
 0.187457,
 0.183224,
 0.2671,
 0.235533,
 0.167243,
 0.193129,
 0.195542,
 0.19457,
 0.182074,
 0.217087,
 0.177105,
 0.182639,
 0.201816,
 0.197273,
 0.225828,
 0.173668,
 0.197122,
 0.255679,
 0.297434,
 0.170688,
 0.218775,
 0.197962,
 0.269783,
 0.20045,
 0.206017,
 0.222513,
 0.24696,
 0.257106,
 0.197002,
 0.184067,
 0.198822,
 0.180153,
 0.176071,
 0.205738,
 0.178273,
 0.22266,
 0.20208,
 0.273371,
 0.187742,
 0.175944,
 0.223035,
 0.207264,
 0.225997,
 0.220413,
 0.179702,
 0.20071,
 0.185477,
 0.19778,
 0.253735,
 

# Proposta de melhoria (btree)

Esta proposta de melhoria tem como objetivo criar um índice auxiliar para otimizar as consultas. Para isso, optamos por criar um índice com as colunas que representam as datas de início e fim do stint de pneus.

In [25]:
%sql CREATE INDEX IF NOT EXISTS idx_tyre_stints_compound_laps ON tyre_stints(compound, lap_end, lap_start)
%sql ANALYZE tyre_stints

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
Done.
 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
Done.


[]

In [26]:
%sql $check_indexes

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
2 rows affected.


indexname,indexdef
tyre_stints_pkey,"CREATE UNIQUE INDEX tyre_stints_pkey ON public.tyre_stints USING btree (session_key, driver_number, stint_number)"
idx_tyre_stints_compound_laps,"CREATE INDEX idx_tyre_stints_compound_laps ON public.tyre_stints USING btree (compound, lap_end, lap_start)"


In [27]:
clear_cache()

Cache do sistema limpo com sucesso.
postgres-main


In [29]:
%sql Plano <<  EXPLAIN (ANALYZE, BUFFERS) $third_query

PrintPlan(Plano)

 * postgresql+psycopg2://postgresadmin:***@localhost:5000/postgresdb
22 rows affected.
Returning data to local variable Plano

Plano: ----------------------------------------------------------------------------------------------------
Sort  (cost=14785.94..14785.96 rows=7 width=24) (actual time=278.540..278.543 rows=8 loops=1)
  Sort Key: (max((ts.lap_end - ts.lap_start))) DESC
  Sort Method: quicksort  Memory: 25kB
  Buffers: shared hit=3 read=162
  ->  HashAggregate  (cost=14785.72..14785.84 rows=7 width=24) (actual time=278.468..278.479 rows=8 loops=1)
        Group Key: ts.compound
        Batches: 1  Memory Usage: 24kB
        Buffers: shared read=162
        ->  Hash Join  (cost=230.94..8239.11 rows=654661 width=22) (actual time=5.239..106.008 rows=654661 loops=1)
              Hash Cond: (wc.session_key = ts.session_key)
              Buffers: shared read=162
              ->  Seq Scan on weather_conditions wc  (cost=0.00..188.19 rows=8419 width=12) (actual time=0.286..5.321 row

Como podemos perceber pela tabela acima, memso com o indexe criado o postgres prefere fazer um seq scan, o que pode ser um indicativo de que o indexe não é necessário.