In [1]:
# Bibliotecas
import pandas as pd
from sqlalchemy import create_engine, inspect, text
from datetime import datetime

In [2]:
# Conexão com os bancos de dados bronze
db_path_base01 = "../database/bronze/00_base1.db"
db_path_base02 = "../database/bronze/00_base2.db"

engine_base01 = create_engine(f"sqlite:///{db_path_base01}")
engine_base02 = create_engine(f"sqlite:///{db_path_base02}")

### Verificação das tabelas na base1 (bronze)

In [None]:
# Listando todas as tabelas na base1
inspector = inspect(engine_base01)
tables_base01 = inspector.get_table_names()
print("Tabelas na base1:")
for table in tables_base01:
    print(f"- {table}")

In [19]:
# Verificando a estrutura de cada tabela na base1
for table in tables_base01:
    print(f"\nEstrutura da tabela {table}:")
    columns = inspector.get_columns(table)
    for column in columns:
        print(f"- {column['name']}: {column['type']}")

In [14]:
# Verificando amostra de dados de cada tabela na base1
for table in tables_base01:
    print(f"\nAmostra de dados da tabela {table}:")
    try:
        query = f"SELECT * FROM '{table}' LIMIT 20"
        df = pd.read_sql(query, engine_base01)
        print(df)
    except Exception as e:
        print(f"Erro ao acessar tabela {table}: {str(e)}")




Amostra de dados da tabela 00_despesas_alucar:
                                   DESPESAS      Mês        Valor  \
0                       Lucas Pereira Costa  janeiro  R$ 7.325,00   
1                    Mariana Oliveira Souza  janeiro  R$ 1.892,41   
2                        João Henrique Lima  janeiro  R$ 2.600,22   
3                          Ana Paula Santos  janeiro  R$ 1.756,23   
4                     Aluguel de escritório  janeiro  R$ 1.800,00   
5                      Rafael Martins Silva  janeiro  R$ 1.421,67   
6                Contas de energia elétrica  janeiro  R$ 2.089,34   
7                   Contas de água e esgoto  janeiro    R$ 225,25   
8                          Impostos e taxas  janeiro  R$ 1.956,11   
9                Despesas com matéria-prima  janeiro    R$ 628,75   
10       Despesas de transporte e logística  janeiro  R$ 1.843,28   
11               Manutenção de equipamentos  janeiro    R$ 270,98   
12     Despesas com marketing e publicidade  janeiro  R

In [13]:
# Verificando tipos SQL das colunas da tabela 00_vendas_clientes_alucar_estimativa
print("\nTipos SQL das colunas da tabela 00_vendas_clientes_alucar_estimativa:")
query = "SELECT * FROM [00_vendas_clientes_alucar_estimativa] "
df = pd.read_sql(query, engine_base01)
for column in df.columns:
    column_info = inspector.get_columns('00_vendas_clientes_alucar_estimativa')
    for col in column_info:
        if col['name'] == column:
            print(f"- {column}: {col['type']}")

# Verificando amostra de dados da tabela
print("\nAmostra de dados da tabela 00_vendas_clientes_alucar_estimativa:")
query = "SELECT * FROM [00_vendas_clientes_alucar_estimativa]"
df = pd.read_sql(query, engine_base01)
display(df)



Tipos SQL das colunas da tabela 00_vendas_clientes_alucar_estimativa:
- Nome_(Alucar): TEXT
- Data: DATE
- Mes: BIGINT
- Ano: BIGINT
- Valor_Receita: TEXT
- timestamp: TEXT

Amostra de dados da tabela 00_vendas_clientes_alucar_estimativa:


Unnamed: 0,Nome_(Alucar),Data,Mes,Ano,Valor_Receita,timestamp
0,João Carlos Silva Pereira,2025-01-02,1,2025,"R$ 1.432,00",2025-05-28 19:11:31
1,Maria Fernanda Souza Oliveira,2025-01-03,1,2025,"R$ 4.189,00",2025-05-28 19:11:31
2,Marcos Vinícius Silva Costa,2025-01-06,1,2025,"R$ 118,00",2025-05-28 19:11:31
3,Ana Beatriz Almeida Lima,2025-01-07,1,2025,"R$ 2.756,00",2025-05-28 19:11:31
4,Luiz Felipe Rocha Santos,2025-01-09,1,2025,"R$ 4.631,00",2025-05-28 19:11:31
...,...,...,...,...,...,...
83,Estimativa,2025-08-01,8,2025,"R$ 36.000,00",2025-05-28 19:11:31
84,Estimativa,2025-09-01,9,2025,"R$ 36.000,00",2025-05-28 19:11:31
85,Estimativa,2025-10-01,10,2025,"R$ 36.000,00",2025-05-28 19:11:31
86,Estimativa,2025-11-01,11,2025,"R$ 36.000,00",2025-05-28 19:11:31


In [None]:
# Verificando tipos SQL das colunas da tabela 00_vendas_clientes_alucar
print("\nTipos SQL das colunas da tabela 00_vendas_clientes_alucar:")
query = "SELECT * FROM [00_vendas_clientes_alucar] LIMIT 1"
df = pd.read_sql(query, engine_base01)
for column in df.columns:
    column_info = inspector.get_columns('00_vendas_clientes_alucar')
    for col in column_info:
        if col['name'] == column:
            print(f"- {column}: {col['type']}")


### Verificação das tabelas na base2 (bronze)

In [None]:
# Listando todas as tabelas na base2
inspector = inspect(engine_base02)
tables_base02 = inspector.get_table_names()
print("Tabelas na base2:")
for table in tables_base02:
    print(f"- {table}")

In [None]:
# Verificando a estrutura de cada tabela na base2
for table in tables_base02:
    print(f"\nEstrutura da tabela {table}:")
    columns = inspector.get_columns(table)
    for column in columns:
        print(f"- {column['name']}: {column['type']}")

In [None]:
# Verificando amostra de dados de cada tabela na base2
for table in tables_base02:
    print(f"\nAmostra de dados da tabela {table}:")
    query = f"SELECT * FROM '{table}' LIMIT 5"
    df = pd.read_sql(query, engine_base02)
    display(df)


print("\nTipos de dados das colunas:")
query = "SELECT * FROM [00_vendas_clientes_consigcar] LIMIT 1"
df = pd.read_sql(query, engine_base02)
for column in df.columns:
    print(f"- {column}: {df[column].dtype}")

In [None]:
# Verificando amostra de dados da tabela 00_receita_consigcar_estimativa
print("\nAmostra de dados da tabela 00_receita_consigcar_estimativa:")
query = "SELECT * FROM [00_receita_consigcar_estimativa] LIMIT 15"
df = pd.read_sql(query, engine_base01)
display(df)


### Análise de dados específicos

In [None]:
# Contagem de registros em cada tabela da base2
print("Contagem de registros na base2:")
for table in tables_base02:
    query = f"SELECT COUNT(*) as total FROM {table}"
    count = pd.read_sql(query, engine_base02).iloc[0,0]
    print(f"- {table}: {count} registros")