In [0]:
pip install pytest

Python interpreter will be restarted.
Collecting pytest
  Downloading pytest-8.3.5-py3-none-any.whl (343 kB)
Collecting exceptiongroup>=1.0.0rc8
  Downloading exceptiongroup-1.3.0-py3-none-any.whl (16 kB)
Collecting iniconfig
  Downloading iniconfig-2.1.0-py3-none-any.whl (6.0 kB)
Collecting pluggy<2,>=1.5
  Downloading pluggy-1.6.0-py3-none-any.whl (20 kB)
Collecting typing-extensions>=4.6.0
  Downloading typing_extensions-4.13.2-py3-none-any.whl (45 kB)
Installing collected packages: typing-extensions, pluggy, iniconfig, exceptiongroup, pytest
  Attempting uninstall: typing-extensions
    Found existing installation: typing-extensions 4.1.1
    Not uninstalling typing-extensions at /databricks/python3/lib/python3.9/site-packages, outside environment /local_disk0/.ephemeral_nfs/envs/pythonEnv-e07fa9b1-08e8-495e-8590-c2baa992fb7c
    Can't uninstall 'typing-extensions'. No files were found to uninstall.
  Attempting uninstall: pluggy
    Found existing installation: pluggy 1.0.0
    No

###Ajustar nome das tabelas caso de erro, referente a existencia delas no diretório quando rodar os testes <br>
De alguma forma o databricks olha para o diretório de uma forma como se existisse algum resquicio de informação, mesmo rodando o código que limpa o diretório

In [0]:
%run
/Users/leonardomares1@gmail.com/CODE_ELEVATE/Diário_de_Bordo/UTILS

In [0]:
import pytest
from unittest.mock import patch

In [0]:
def test_download_csv_with_curl():
    """Testa se a função chama o subprocess corretamente."""
    url = "https://example.com/test.csv"
    local_path = "/tmp/test.csv"

    #Aqui é feito o mock do subprocess para evitar uma chamada real ao cURL
    with patch("subprocess.run") as mock_run:
        download_csv_with_curl(url, local_path)

        # Verifica se subprocess.run foi chamado corretamente
        mock_run.assert_called_once_with(['curl', '-L', url, '-o', local_path], check=True)

    print("✅ Teste `test_download_csv_with_curl` concluído com sucesso!")

test_download_csv_with_curl()

✅ Arquivo baixado para /tmp/test.csv
✅ Teste `test_download_csv_with_curl` concluído com sucesso!


In [0]:
#Vai apagar tudo dentro do diretório, para não ter o erro
dbutils.fs.rm("dbfs:/user/hive/warehouse/teste", recurse=True)

Out[14]: True

In [0]:
nome_tbl = "teste"

def test_salvar_csv_como_delta():
    schema = StructType([
        StructField("DATA_INICIO", StringType(), True),
        StructField("DATA_FIM", StringType(), True),
        StructField("CATEGORIA", StringType(), True),
        StructField("LOCAL_INICIO", StringType(), True),
        StructField("LOCAL_FIM", StringType(), True),
        StructField("PROPOSITO", StringType(), True),
        StructField("DISTANCIA", DecimalType(10, 2), True)
    ])
    caminho_csv = "/tmp/test.csv"
    delimitador = ","

    #Exclui o csv do teste anterior, para roda esse teste
    dbutils.fs.rm("dbfs:/tmp/test.csv", recurse=True)

    #Criando um CSV ficticio
    df_test = spark.createDataFrame([
    ("05-01-2025 10:00", "05-01-2025 12:00", "negócios", "São Paulo", "Rio de Janeiro", "Reunião", 432.5),
    ("05-01-2025 08:00", "05-01-2025 10:00", "pessoal", "São Paulo", "Campinas", "Visita à família", 98.7),
    ("05-02-2025 15:30", "05-02-2025 17:30", "negócios", "Curitiba", "Florianópolis", "Reunião", 300.2),
    ("05-02-2025 09:00", "05-02-2025 11:00", "pessoal", "Brasília", "Goiânia", "Passeio turístico", 209.4),
    ("05-03-2025 13:00", "05-03-2025 15:00", "negócios", "Porto Alegre", "Blumenau", "Reunião", 150.8),
    ("05-03-2025 07:30", "05-03-2025 09:30", "pessoal", "Recife", "João Pessoa", "Visita a amigos", 120.6),
    ("05-04-2025 11:00", "05-04-2025 13:00", "negócios", "Salvador", "Aracaju", "Reunião", 220.9),
    ("05-04-2025 14:30", "05-04-2025 16:30", "pessoal", "Belo Horizonte", "Ouro Preto", None, 100.3),
    ("05-05-2025 16:00", "05-05-2025 18:00", "negócios", "Fortaleza", "Natal", "Reunião", 410.7),
    ("05-05-2025 10:30", "05-05-2025 12:30", "pessoal", "Manaus", "Belém", "Viagem de lazer", 530.1)],
    ["DATA_INICIO", "DATA_FIM", "CATEGORIA", "LOCAL_INICIO", "LOCAL_FIM", "PROPOSITO", "DISTANCIA"])
    df_test.write.option("header", "true").mode("overwrite").csv(caminho_csv)

    df_resultado = salvar_csv_como_delta(schema, caminho_csv, nome_tbl, delimitador)
    assert spark._jsparkSession.catalog().tableExists(nome_tbl), "A Tabela não foi criada"

    print("✅ Teste salvar csv como delta foi bem sucedido!")

def test_salvar_csv_como_delta_schema():

    df_resultado = spark.sql(f"SELECT * FROM {nome_tbl}")

    assert df_resultado.count() > 0, "A Tabela esta vazia"

    schema_esperado = ["DATA_INICIO", "DATA_FIM", "CATEGORIA", "LOCAL_INICIO", "LOCAL_FIM", "PROPOSITO", "DISTANCIA"]
    schema_obtido = df_resultado.schema.names

    assert schema_esperado == schema_obtido, (f"Schemas não correspondem. Esperado: {schema_esperado} x Obtido: {schema_obtido}")
    
    print("✅ Teste de schema foi bem sucedido!")

test_salvar_csv_como_delta()
test_salvar_csv_como_delta_schema()

✅ Tabela Delta 'teste' criada com sucesso!
✅ Teste salvar csv como delta foi bem sucedido!
✅ Teste de schema foi bem sucedido!


In [0]:
def test_ler_tabela_delta():

    df = ler_tabela_delta(nome_tbl)

    assert df_resultado is not None, "O Dataframe é None"

    assert df_resultado is not None, "O Dataframe é None"
    assert df.count() > 0, "O Dataframe está vasio"

    print("Teste de leitura de tabela")

In [0]:
#display(dbutils.fs.ls("dbfs:/user/hive/warehouse/tabela_teste"))

In [0]:
#Vai apagar tudo dentro do diretório, para não ter o erro
dbutils.fs.rm("dbfs:/user/hive/warehouse/tabela_teste", recurse=True)

Out[18]: True

In [0]:
colunas = [
    "DT_REFE date",
    "QT_CORR int",
    "QT_CORR_NEG int",
    "QT_CORR_PESS int",
    "VL_MAX_DIST int",
    "VL_MIN_DIST int",
    "VL_AVG_DIST decimal (5,2)",
    "QT_CORR_REUNI int",
    "QT_CORR_NAO_REUNI int"]
nome_tbl = "tabela_teste"
particao = "DT_REFE"


def test_criar_tabela_calculada():
    
    df_resultado = criar_tabela_calculada(colunas, nome_tbl, particao)
    assert df_resultado is not None, "Erro: O Dataframe retornado é None!"
    
    print("✅ Teste de criação concluido com sucesso!")

def test_criar_tabela_calculada_coluna():

    df_test = spark.sql(f"select * from {nome_tbl}")

    # Extrai apenas os nomes das colunas
    colunas_esperadas = [col.split()[0] for col in colunas]
   
    assert set(df_test.columns) == set(colunas_esperadas), "Colunas não correspondem as esperadas"
    # assert df_test.count() > 0, "O Dataframe esta vasio!"
    print("✅ Teste de colunas concluido com sucesso!")

test_criar_tabela_calculada()
test_criar_tabela_calculada_coluna()


✅ Tabela tabela_teste, criada com sucesso
✅ Teste de criação concluido com sucesso!
✅ Teste de colunas concluido com sucesso!


In [0]:
def test_tratar_data():
    colunas = [
        "*",
        "CAST(TO_TIMESTAMP(DATA_INICIO, 'MM-dd-yyyy HH:mm') AS DATE) AS DT_REFE"
        ]
    tempview = "teste_data"

    df_resultado = tratar_data(colunas, "teste", tempview)
    assert df_resultado is not None, "Dataframe retornado é None!"

    df_test = spark.sql(f'select * from {tempview}')
    assert df_test.count() > 0, "df_test está vazio"

    colunas_esperadas = ["DATA_INICIO", "DATA_FIM", "CATEGORIA", "LOCAL_INICIO", "LOCAL_FIM", "PROPOSITO", "DISTANCIA", "DT_REFE"]
    assert set(df_test.columns) == set(colunas_esperadas), "As colunas não são correspondentes"
    

    print("✅ O Teste tratar_data foi bem-sucedido!!!")

test_tratar_data()

✅ O Tratamento de data foi bem-sucedido!!!
✅ O Teste tratar_data foi bem-sucedido!!!


In [0]:
%sql
select * from teste_data

DATA_INICIO,DATA_FIM,CATEGORIA,LOCAL_INICIO,LOCAL_FIM,PROPOSITO,DISTANCIA,DT_REFE
05-01-2025 08:00,05-01-2025 10:00,pessoal,São Paulo,Campinas,Visita à família,98.7,2025-05-01
05-01-2025 10:00,05-01-2025 12:00,negócios,São Paulo,Rio de Janeiro,Reunião,432.5,2025-05-01
05-03-2025 07:30,05-03-2025 09:30,pessoal,Recife,João Pessoa,Visita a amigos,120.6,2025-05-03
05-02-2025 15:30,05-02-2025 17:30,negócios,Curitiba,Florianópolis,Reunião,300.2,2025-05-02
05-04-2025 11:00,05-04-2025 13:00,negócios,Salvador,Aracaju,Reunião,220.9,2025-05-04
05-04-2025 14:30,05-04-2025 16:30,pessoal,Belo Horizonte,Ouro Preto,,100.3,2025-05-04
05-02-2025 09:00,05-02-2025 11:00,pessoal,Brasília,Goiânia,Passeio turístico,209.4,2025-05-02
05-03-2025 13:00,05-03-2025 15:00,negócios,Porto Alegre,Blumenau,Reunião,150.8,2025-05-03
05-05-2025 16:00,05-05-2025 18:00,negócios,Fortaleza,Natal,Reunião,410.7,2025-05-05
05-05-2025 10:30,05-05-2025 12:30,pessoal,Manaus,Belém,Viagem de lazer,530.1,2025-05-05


In [0]:
def test_count_categoria():
    filtro_tbl = "group by DT_REFE, DISTANCIA, CATEGORIA"
    colunas = [
        "DT_REFE",
        "DISTANCIA",
        "1 as qtd",
        "CASE WHEN CATEGORIA = 'negócios' THEN 1 ELSE 0 END AS qtd_neg",
        "CASE WHEN CATEGORIA = 'pessoal' THEN 1 ELSE 0 END AS qtd_pes"
    ]
    tempview = "teste_categ"

    df_resultado = count_categoria(colunas, "teste_data", tempview, filtro_tbl)
    assert df_resultado is not None, "Dataframe retornado é None!"

    df_test = spark.sql(f'select * from {tempview}')
    assert df_test.count() > 0, "df_test está vazio"

    colunas_esperadas = ["DT_REFE", "DISTANCIA", "qtd", "qtd_neg", "qtd_pes"]
    assert set(df_test.columns) == set(colunas_esperadas), "As colunas não são correspondentes"
    

    print("✅ O Teste count_categoria foi bem-sucedido!!!")

test_count_categoria()
    

✅ A contagem de categoria foi bem-sucedido!!!
✅ O Teste count_categoria foi bem-sucedido!!!


In [0]:
%sql
select * from teste_categ

DT_REFE,DISTANCIA,qtd,qtd_neg,qtd_pes
2025-05-01,98.7,1,0,1
2025-05-01,432.5,1,1,0
2025-05-03,120.6,1,0,1
2025-05-02,300.2,1,1,0
2025-05-04,220.9,1,1,0
2025-05-04,100.3,1,0,1
2025-05-02,209.4,1,0,1
2025-05-03,150.8,1,1,0
2025-05-05,410.7,1,1,0
2025-05-05,530.1,1,0,1


In [0]:
filtro_tbl = "group by DT_REFE"
def test_categoria_agregada():
    tempview = "test_categ_agreg"
    colunas = [
        "DT_REFE",
        "sum(qtd) as QT_CORR",
        "sum(qtd_neg) as QT_CORR_NEG",
        "sum(qtd_pes) as QT_CORR_PESS",
        "max(DISTANCIA) as VL_MAX_DIST",
        "min(DISTANCIA) as VL_MIN_DIST",
        "avg(DISTANCIA) as VL_AVG_DIST"
    ]

    df_resultado = count_categoria(colunas, "teste_categ", tempview, filtro_tbl)
    assert df_resultado is not None, "Dataframe retornado é None!"

    df_test = spark.sql(f'select * from {tempview}')
    assert df_test.count() > 0, "df_test está vazio"

    colunas_esperadas = ["DT_REFE", "QT_CORR", "QT_CORR_NEG", "QT_CORR_PESS", "VL_MAX_DIST", "VL_MIN_DIST", "VL_AVG_DIST"]
    assert set(df_test.columns) == set(colunas_esperadas), "As colunas não são correspondentes"
    

    print("✅ O Teste count_categoria foi bem-sucedido!!!")

test_categoria_agregada()


✅ A contagem de categoria foi bem-sucedido!!!
✅ O Teste count_categoria foi bem-sucedido!!!


In [0]:
%sql
select * from test_categ_agreg

DT_REFE,QT_CORR,QT_CORR_NEG,QT_CORR_PESS,VL_MAX_DIST,VL_MIN_DIST,VL_AVG_DIST
2025-05-02,2,1,1,300.2,209.4,254.8
2025-05-04,2,1,1,220.9,100.3,160.6
2025-05-03,2,1,1,150.8,120.6,135.7
2025-05-05,2,1,1,530.1,410.7,470.4
2025-05-01,2,1,1,432.5,98.7,265.6


In [0]:
def test_count_proposito():
    colunas = [
        "DT_REFE",
        "sum(CASE WHEN PROPOSITO = 'Reunião' THEN 1 ELSE 0 END) AS QT_CORR_REUNI",
        "sum(CASE WHEN PROPOSITO IS NOT NULL AND PROPOSITO <> 'Reunião' THEN 1 ELSE 0 END) AS QT_CORR_NAO_REUNI"
    ]
    tempview = "teste_prop"

    df_resultado = count_proposito(colunas, "teste_data", tempview, filtro_tbl)
    assert df_resultado is not None, "Dataframe retornado é None!"

    df_test = spark.sql(f'select * from {tempview}')
    assert df_test.count() > 0, "df_test está vazio"

    colunas_esperadas = ["DT_REFE", "QT_CORR_REUNI", "QT_CORR_NAO_REUNI"]
    assert set(df_test.columns) == set(colunas_esperadas), "As colunas não são correspondentes"
    

    print("✅ O Teste count_proposito foi bem-sucedido!!!")

test_count_proposito()

✅ A contagem de proposito foi bem-sucedido!!!
✅ O Teste count_proposito foi bem-sucedido!!!


In [0]:
%sql
select * from teste_prop

DT_REFE,QT_CORR_REUNI,QT_CORR_NAO_REUNI
2025-05-01,1,1
2025-05-03,1,1
2025-05-02,1,1
2025-05-04,1,0
2025-05-05,1,1


In [0]:
def test_join_tabelas():
    colunas = [
        "c.DT_REFE",
        "c.QT_CORR",
        "c.QT_CORR_NEG",
        "c.QT_CORR_PESS",
        "c.VL_MAX_DIST",
        "c.VL_MIN_DIST",
        "c.VL_AVG_DIST",
        "p.QT_CORR_REUNI",
        "p.QT_CORR_NAO_REUNI"
    ]
    tbl_filtro = "test_categ_agreg c"
    tbl_join = "teste_prop p"
    on = "c.DT_REFE = p.DT_REFE"
    filtro_tbl = """
    order by c.DT_REFE asc
    """
    tempview = "teste_tbl_final"

    df_resultado = join_tabelas(colunas, tbl_filtro, tbl_join, on, filtro_tbl, tempview)
    assert df_resultado is not None, "Dataframe retornado é None!"
    assert "QT_CORR_REUNI" in df_resultado.columns, "A coluna QT_CORR_REUNI, não foi encontrada"

    df_test = spark.sql(f'select * from {tempview}')
    assert df_test.count() > 0, "df_test está vazio"

    assert df_resultado.count() == df_test.count(), "A contangem não bate"

    print("✅ O Teste join_tabelas foi bem-sucedido!!!")

test_join_tabelas()

✅ O join das contagens foi bem-sucedido!!!
✅ O Teste join_tabelas foi bem-sucedido!!!


In [0]:
%sql
select * from teste_tbl_final

DT_REFE,QT_CORR,QT_CORR_NEG,QT_CORR_PESS,VL_MAX_DIST,VL_MIN_DIST,VL_AVG_DIST,QT_CORR_REUNI,QT_CORR_NAO_REUNI
2025-05-01,2,1,1,432.5,98.7,265.6,1,1
2025-05-02,2,1,1,300.2,209.4,254.8,1,1
2025-05-03,2,1,1,150.8,120.6,135.7,1,1
2025-05-04,2,1,1,220.9,100.3,160.6,1,0
2025-05-05,2,1,1,530.1,410.7,470.4,1,1


In [0]:
def test_ingestao_dados():
    tbl_calc = "tabela_teste"
    tbl_join = "teste_tbl_final"

    df_resultado = ingestao_dados(tbl_calc, tbl_join)
    df_test = spark.sql(f"select * from {tbl_join}")

    assert df_resultado.count() == df_test.count(), "A contagem das tabelas não bate"

    print("✅ O Teste ingestão de dados foi bem-sucedido!!!")

test_ingestao_dados()

✅ A ingestão foi bem-sucedida!!!
✅ O Teste ingestão de dados foi bem-sucedido!!!


In [0]:
%sql
select * from tabela_teste

DT_REFE,QT_CORR,QT_CORR_NEG,QT_CORR_PESS,VL_MAX_DIST,VL_MIN_DIST,VL_AVG_DIST,QT_CORR_REUNI,QT_CORR_NAO_REUNI
2025-05-05,2,1,1,530,410,470.4,1,1
2025-05-04,2,1,1,220,100,160.6,1,0
2025-05-03,2,1,1,150,120,135.7,1,1
2025-05-02,2,1,1,300,209,254.8,1,1
2025-05-01,2,1,1,432,98,265.6,1,1


#Teste em SQL

In [0]:
dbutils.fs.rm("dbfs:/user/hive/warehouse/teste_sql", recurse=True)

Out[33]: True

In [0]:
spark.sql(
    f"""
    CREATE OR REPLACE TABLE teste_sql (
    DATA_INICIO STRING,
    DATA_FIM STRING,
    CATEGORIA STRING,
    LOCAL_INICIO STRING,
    LOCAL_FIM STRING,
    PROPOSITO STRING,
    DISTANCIA DECIMAL(10,2))
    USING DELTA
""")

Out[34]: DataFrame[]

In [0]:
 %sql
INSERT INTO teste_sql (DATA_INICIO, DATA_FIM, CATEGORIA, LOCAL_INICIO, LOCAL_FIM, PROPOSITO, DISTANCIA) VALUES
('05-01-2025 10:00', '05-01-2025 12:00', 'negócios', 'São Paulo', 'Rio de Janeiro', 'Reunião', 432.5),
('05-01-2025 08:00', '05-01-2025 10:00', 'pessoal', 'São Paulo', 'Campinas', 'Visita à família', 98.7),
('05-02-2025 15:30', '05-02-2025 17:30', 'negócios', 'Curitiba', 'Florianópolis', 'Reunião', 300.2),
('05-02-2025 09:00', '05-02-2025 11:00', 'pessoal', 'Brasília', 'Goiânia', 'Passeio turístico', 209.4),
('05-03-2025 13:00', '05-03-2025 15:00', 'negócios', 'Porto Alegre', 'Blumenau', 'Reunião', 150.8),
('05-03-2025 07:30', '05-03-2025 09:30', 'pessoal', 'Recife', 'João Pessoa', 'Visita a amigos', 120.6),
('05-04-2025 11:00', '05-04-2025 13:00', 'negócios', 'Salvador', 'Aracaju', 'Reunião', 220.9),
('05-04-2025 14:30', '05-04-2025 16:30', 'pessoal', 'Belo Horizonte', 'Ouro Preto', NULL, 100.3),
('05-05-2025 16:00', '05-05-2025 18:00', 'negócios', 'Fortaleza', 'Natal', 'Reunião', 410.7),
('05-05-2025 10:30', '05-05-2025 12:30', 'pessoal', 'Manaus', 'Belém', 'Viagem de lazer', 530.1),
('05-06-2025 08:00', '05-06-2025 10:00', 'negócios', 'São Paulo', 'Brasília', 'Reunião', 850.6),
('05-06-2025 18:00', '05-06-2025 20:00', 'pessoal', 'Curitiba', 'Joinville', NULL, 130.9),
('05-07-2025 14:00', '05-07-2025 16:00', 'negócios', 'Vitória', 'Rio de Janeiro', 'Reunião', 400.5),
('05-07-2025 12:00', '05-07-2025 14:00', 'pessoal', 'São Luís', 'Teresina', 'Evento cultural', 250.8),
('05-08-2025 17:30', '05-08-2025 19:30', 'negócios', 'Belém', 'Macapá', 'Reunião', 320.2),
('05-08-2025 09:30', '05-08-2025 11:30', 'pessoal', 'Campo Grande', 'Dourados', 'Encontro com amigos', 150.4),
('05-09-2025 20:00', '05-09-2025 22:00', 'negócios', 'Florianópolis', 'Porto Alegre', 'Reunião', 470.7),
('05-09-2025 07:00', '05-09-2025 09:00', 'pessoal', 'Natal', 'Recife', NULL, 300.9),
('05-10-2025 11:30', '05-10-2025 13:30', 'negócios', 'Aracaju', 'Maceió', 'Reunião', 220.1),
('05-10-2025 15:00', '05-10-2025 17:00', 'pessoal', 'Rio Branco', 'Porto Velho', 'Viagem de descanso', 350.4),
('05-11-2025 08:30', '05-11-2025 10:30', 'negócios', 'João Pessoa', 'Natal', 'Reunião', 180.2),
('05-11-2025 16:30', '05-11-2025 18:30', 'pessoal', 'Maceió', 'Salvador', 'Férias', 700.3),
('05-12-2025 10:00', '05-12-2025 12:00', 'negócios', 'Brasília', 'São Paulo', 'Reunião', 870.5),
('05-12-2025 13:30', '05-12-2025 15:30', 'pessoal', 'Porto Alegre', 'Curitiba', NULL, 450.6);

num_affected_rows,num_inserted_rows
24,24


In [0]:
#Vai apagar tudo dentro do diretório, para não ter o erro 
dbutils.fs.rm("dbfs:/user/hive/warehouse/sql_final", recurse=True)

Out[36]: True

In [0]:
spark.sql(
    f"""
    create or replace table sql_final(
        DT_REFE date,
        QT_CORR int,
        QT_CORR_NEG int,
        QT_CORR_PESS int,
        VL_MAX_DIST int,
        VL_MIN_DIST int,
        VL_AVG_DIST double,
        QT_CORR_REUNI int,
        QT_CORR_NAO_REUNI int

    )
""")

Out[37]: DataFrame[]

In [0]:
%sql
insert into sql_final 
WITH contagem as
(SELECT 
  CAST(TO_TIMESTAMP(DATA_INICIO, 'MM-dd-yyyy HH:mm') AS DATE) AS DT_REFE,
  count(*) as qtd,
  CASE WHEN CATEGORIA = 'Negocio' THEN COUNT(categoria) else 0 END AS  qt_corrida_negocio,
  CASE WHEN CATEGORIA = 'Pessoal' THEN COUNT(categoria) else 0 END AS  qt_corrida_pessoal,
  DISTANCIA,
  CASE WHEN PROPOSITO = 'Reunião' then count(PROPOSITO) else 0 end as reuniao,
  CASE WHEN PROPOSITO IS NOT NULL AND PROPOSITO <> 'Reunião' THEN count(PROPOSITO) else 0 END AS pessoal 
FROM info_transportes
GROUP BY DATA_INICIO, CATEGORIA, DISTANCIA, PROPOSITO

ORDER BY DATA_INICIO ASC)

SELECT
  dt_refe,
  sum(qtd) as QT_CORR,
  sum(qt_corrida_negocio) as QT_CORR_NEG,
  sum(qt_corrida_pessoal) as QT_CORR_PESS,
  max(DISTANCIA) as VL_MAX_DIST,
  min(DISTANCIA) as VL_MIN_DIST,
  avg(DISTANCIA) as VL_AVG_DIST,
  sum(reuniao) as QT_CORR_REUNI,
  sum(pessoal) as QT_CORR_NAO_REUNI
  


FROM contagem
GROUP BY DT_REFE

num_affected_rows,num_inserted_rows
287,287


In [0]:
%sql
select * from sql_final

DT_REFE,QT_CORR,QT_CORR_NEG,QT_CORR_PESS,VL_MAX_DIST,VL_MIN_DIST,VL_AVG_DIST,QT_CORR_REUNI,QT_CORR_NAO_REUNI
2016-03-01,2,2,0,8,8,8.0,1,1
2016-10-03,4,4,0,127,16,69.0,0,0
2016-08-15,4,4,0,259,141,178.25,0,1
2016-05-03,1,1,0,25,25,25.0,0,1
2016-07-26,4,4,0,25,21,23.25,0,2
2016-01-28,3,3,0,157,19,107.66666666666669,2,1
2016-07-17,2,0,2,1802,151,976.5,0,2
2016-12-19,11,11,0,102,7,45.0,1,5
2016-11-08,4,4,0,122,3,68.5,1,1
2016-08-23,8,8,0,177,5,70.375,0,0
