In [2]:
# Bibliotecas
import pandas as pd
from sqlalchemy import create_engine, inspect, text
from datetime import datetime

In [3]:
# Conexão com os bancos de dados bronze
db_path_base01 = "../database/bronze/00_base1.db"
db_path_base02 = "../database/bronze/00_base2.db"

engine_base01 = create_engine(f"sqlite:///{db_path_base01}")
engine_base02 = create_engine(f"sqlite:///{db_path_base02}")

### Verificação das tabelas na base1 (bronze)

In [4]:
# Listando todas as tabelas na base1
inspector = inspect(engine_base01)
tables_base01 = inspector.get_table_names()
print("Tabelas na base1:")
for table in tables_base01:
    print(f"- {table}")

Tabelas na base1:
- 00_despesas_alucar
- 00_despesas_consigcar
- 00_metas_plr
- 00_receita_consigcar_estimativa
- 00_receita_pagseguro_consigcar
- 00_vendas_clientes_alucar
- 00_vendas_clientes_alucar_estimativa


In [5]:
# Verificando a estrutura de cada tabela na base1
for table in tables_base01:
    print(f"\nEstrutura da tabela {table}:")
    columns = inspector.get_columns(table)
    for column in columns:
        print(f"- {column['name']}: {column['type']}")


Estrutura da tabela 00_despesas_alucar:
- DESPESAS: TEXT
- Mês: TEXT
- Valor: TEXT
- timestamp: TEXT

Estrutura da tabela 00_despesas_consigcar:
- DESPESAS: TEXT
- Mês: TEXT
- Valor: TEXT
- timestamp: TEXT

Estrutura da tabela 00_metas_plr:
- Ano: TEXT
- Mês: BIGINT
- Meta_1_ALUCAR: BIGINT
- Meta_2_ALUCAR: BIGINT
- Meta_1_ConsigCar: BIGINT
- Meta_2_ConsigCar: BIGINT
- Data: DATETIME
- timestamp: TEXT

Estrutura da tabela 00_receita_consigcar_estimativa:
- Data: DATE
- Valor: TEXT
- timestamp: TEXT

Estrutura da tabela 00_receita_pagseguro_consigcar:
- Data: DATE
- Valor: TEXT
- timestamp: TEXT

Estrutura da tabela 00_vendas_clientes_alucar:
- Nome_(Alucar): TEXT
- Data: DATE
- Mes: BIGINT
- Ano: BIGINT
- Valor_Receita: TEXT
- timestamp: TEXT

Estrutura da tabela 00_vendas_clientes_alucar_estimativa:
- Nome_(Alucar): TEXT
- Data: DATE
- Mes: BIGINT
- Ano: BIGINT
- Valor_Receita: TEXT
- timestamp: TEXT


In [6]:
# Verificando amostra de dados de cada tabela na base1
for table in tables_base01:
    print(f"\nAmostra de dados da tabela {table}:")
    try:
        query = f"SELECT * FROM '{table}' LIMIT 5"
        df = pd.read_sql(query, engine_base01)
        display(df)
    except Exception as e:
        print(f"Erro ao acessar tabela {table}: {str(e)}")


Amostra de dados da tabela 00_despesas_alucar:


Unnamed: 0,DESPESAS,Mês,Valor,timestamp
0,Lucas Pereira Costa,janeiro,"R$ 7.325,00",2025-05-28 15:19:32
1,Mariana Oliveira Souza,janeiro,"R$ 1.892,41",2025-05-28 15:19:32
2,João Henrique Lima,janeiro,"R$ 2.600,22",2025-05-28 15:19:32
3,Ana Paula Santos,janeiro,"R$ 1.756,23",2025-05-28 15:19:32
4,Aluguel de escritório,janeiro,"R$ 1.800,00",2025-05-28 15:19:32



Amostra de dados da tabela 00_despesas_consigcar:


Unnamed: 0,DESPESAS,Mês,Valor,timestamp
0,Gustavo Augusto da Silva Pereira,janeiro,"R$ 3.482,76",2025-05-28 15:19:32
1,Fernanda Costa Almeida Lima,janeiro,"R$ 6.215,43",2025-05-28 15:19:32
2,Marcelo Henrique Oliveira Souza,janeiro,"R$ 4.823,36",2025-05-28 15:19:32
3,Leticia Beatriz Santos Ribeiro,janeiro,"R$ 4.890,22",2025-05-28 15:19:32
4,Rafael Augusto Souza Lima,janeiro,"R$ 2.658,90",2025-05-28 15:19:32



Amostra de dados da tabela 00_metas_plr:


Unnamed: 0,Ano,Mês,Meta_1_ALUCAR,Meta_2_ALUCAR,Meta_1_ConsigCar,Meta_2_ConsigCar,Data,timestamp
0,2025,1,22,30,32,42,2025-01-01 00:00:00.000000,2025-05-28 15:19:32
1,2025,2,44,60,57,67,2025-02-01 00:00:00.000000,2025-05-28 15:19:32
2,2025,3,66,90,86,96,2025-03-01 00:00:00.000000,2025-05-28 15:19:32
3,2025,4,88,120,122,129,2025-04-01 00:00:00.000000,2025-05-28 15:19:32
4,2025,5,110,150,172,199,2025-05-01 00:00:00.000000,2025-05-28 15:19:32



Amostra de dados da tabela 00_receita_consigcar_estimativa:


Unnamed: 0,Data,Valor,timestamp
0,2025-02-01,"35.918,27",2025-05-28 15:19:32
1,2025-01-02,"51.472,94",2025-05-28 15:19:32
2,2025-01-03,"34.994,22",2025-05-28 15:19:32
3,2025-01-04,"48.182,77",2025-05-28 15:19:32
4,2025-01-05,"41.348,00",2025-05-28 15:19:32



Amostra de dados da tabela 00_receita_pagseguro_consigcar:


Unnamed: 0,Data,Valor,timestamp
0,2025-01-01,"35.918,27",2025-05-28 15:19:32
1,2025-02-01,"51.472,94",2025-05-28 15:19:32
2,2025-03-01,"34.994,22",2025-05-28 15:19:32
3,2025-04-01,"48.182,77",2025-05-28 15:19:32
4,2025-05-01,"41.348,00",2025-05-28 15:19:32



Amostra de dados da tabela 00_vendas_clientes_alucar:


Unnamed: 0,Nome_(Alucar),Data,Mes,Ano,Valor_Receita,timestamp
0,João Carlos Silva Pereira,2025-01-02,1,2025,"R$ 1.432,00",2025-05-28 15:19:32
1,Maria Fernanda Souza Oliveira,2025-01-03,1,2025,"R$ 4.189,00",2025-05-28 15:19:32
2,Marcos Vinícius Silva Costa,2025-01-06,1,2025,"R$ 118,00",2025-05-28 15:19:32
3,Ana Beatriz Almeida Lima,2025-01-07,1,2025,"R$ 2.756,00",2025-05-28 15:19:32
4,Luiz Felipe Rocha Santos,2025-01-09,1,2025,"R$ 4.631,00",2025-05-28 15:19:32



Amostra de dados da tabela 00_vendas_clientes_alucar_estimativa:


Unnamed: 0,Nome_(Alucar),Data,Mes,Ano,Valor_Receita,timestamp
0,João Carlos Silva Pereira,2025-01-02,1,2025,"R$ 1.432,00",2025-05-28 15:19:32
1,Maria Fernanda Souza Oliveira,2025-01-03,1,2025,"R$ 4.189,00",2025-05-28 15:19:32
2,Marcos Vinícius Silva Costa,2025-01-06,1,2025,"R$ 118,00",2025-05-28 15:19:32
3,Ana Beatriz Almeida Lima,2025-01-07,1,2025,"R$ 2.756,00",2025-05-28 15:19:32
4,Luiz Felipe Rocha Santos,2025-01-09,1,2025,"R$ 4.631,00",2025-05-28 15:19:32


In [7]:
# Verificando tipos SQL das colunas da tabela 00_vendas_clientes_alucar
print("\nTipos SQL das colunas da tabela 00_vendas_clientes_alucar:")
query = "SELECT * FROM [00_vendas_clientes_alucar] LIMIT 1"
df = pd.read_sql(query, engine_base01)
for column in df.columns:
    column_info = inspector.get_columns('00_vendas_clientes_alucar')
    for col in column_info:
        if col['name'] == column:
            print(f"- {column}: {col['type']}")



Tipos SQL das colunas da tabela 00_vendas_clientes_alucar:
- Nome_(Alucar): TEXT
- Data: DATE
- Mes: BIGINT
- Ano: BIGINT
- Valor_Receita: TEXT
- timestamp: TEXT


### Verificação das tabelas na base2 (bronze)

In [8]:
# Listando todas as tabelas na base2
inspector = inspect(engine_base02)
tables_base02 = inspector.get_table_names()
print("Tabelas na base2:")
for table in tables_base02:
    print(f"- {table}")

Tabelas na base2:
- 00_vendas_clientes_consigcar


In [9]:
# Verificando a estrutura de cada tabela na base2
for table in tables_base02:
    print(f"\nEstrutura da tabela {table}:")
    columns = inspector.get_columns(table)
    for column in columns:
        print(f"- {column['name']}: {column['type']}")


Estrutura da tabela 00_vendas_clientes_consigcar:
- Data do Pagamento: DATE
- Tipo Produto: TEXT
- Nome: TEXT
- WhatsApp: TEXT
- Quantidade de vezes: BIGINT
- Valor parcela: FLOAT
- Vendedor: TEXT
- Comentarios: FLOAT
- timestamp: TEXT


In [10]:
# Verificando amostra de dados de cada tabela na base2
for table in tables_base02:
    print(f"\nAmostra de dados da tabela {table}:")
    query = f"SELECT * FROM '{table}' LIMIT 5"
    df = pd.read_sql(query, engine_base02)
    display(df)


print("\nTipos de dados das colunas:")
query = "SELECT * FROM [00_vendas_clientes_consigcar] LIMIT 1"
df = pd.read_sql(query, engine_base02)
for column in df.columns:
    print(f"- {column}: {df[column].dtype}")


Amostra de dados da tabela 00_vendas_clientes_consigcar:


Unnamed: 0,Data do Pagamento,Tipo Produto,Nome,WhatsApp,Quantidade de vezes,Valor parcela,Vendedor,Comentarios,timestamp
0,2024-11-11,Completa,Fernanda Gomes Ibrahim Campos,(11) 99123-4567,18,1834.66,Thiago,,2025-05-28 15:19:32
1,2024-11-22,Completa,Patrícia Zanetti Jardim Campos Souza,(21) 99234-5678,6,641.33,Thiago,,2025-05-28 15:19:32
2,2024-11-18,Completa,Eduardo Yamada Dias Vieira Nogueira,(43) 99345-6789,18,1879.3,Thiago,,2025-05-28 15:19:32
3,2024-10-22,Completa,Thiago Lopes Xavier Queiroz,(51) 99456-7890,18,1831.83,Thiago,,2025-05-28 15:19:32
4,2024-10-20,Completa,Vanessa Yamada Farias Krause Teixeira,(61) 99567-8901,6,645.73,Thiago,,2025-05-28 15:19:32



Tipos de dados das colunas:
- Data do Pagamento: object
- Tipo Produto: object
- Nome: object
- WhatsApp: object
- Quantidade de vezes: int64
- Valor parcela: float64
- Vendedor: object
- Comentarios: object
- timestamp: object


In [11]:
# Verificando amostra de dados da tabela 00_receita_consigcar_estimativa
print("\nAmostra de dados da tabela 00_receita_consigcar_estimativa:")
query = "SELECT * FROM [00_receita_consigcar_estimativa] LIMIT 5"
df = pd.read_sql(query, engine_base02)
display(df)



Amostra de dados da tabela 00_receita_consigcar_estimativa:


OperationalError: (sqlite3.OperationalError) no such table: 00_receita_consigcar_estimativa
[SQL: SELECT * FROM [00_receita_consigcar_estimativa] LIMIT 5]
(Background on this error at: https://sqlalche.me/e/20/e3q8)

### Análise de dados específicos

In [None]:
# Contagem de registros em cada tabela da base2
print("Contagem de registros na base2:")
for table in tables_base02:
    query = f"SELECT COUNT(*) as total FROM {table}"
    count = pd.read_sql(query, engine_base02).iloc[0,0]
    print(f"- {table}: {count} registros")