# CAT√ÅLOGO DE DADOS


### VIS√ÉO GERAL DO CAT√ÅLOGO
**Nome do conjunto de dados:** 
  Despesas pela Cota para Exerc√≠cio da Atividade Parlamentar (CEAP)

**Fontes oficiais:**
- [Portal de Dados Abertos da C√¢mara dos Deputados](https://dadosabertos.camara.leg.br)
- [Arquivos Dispon√≠veis](https://dadosabertos.camara.leg.br/swagger/api.html?tab=staticfile)
- [Documenta√ß√£o dos campos](https://dadosabertos.camara.leg.br/howtouse/2023-12-26-dados-ceap.html)
- [Dataset Utilizado](https://www.camara.leg.br/cotas/Ano-2024.csv.zip)

  
**Frequ√™ncia de atualiza√ß√£o:**
  Publica√ß√£o mensal, com revis√µes eventuais

### LINHAGEM DOS DADOS
O dataset de dados utilizado neste trabalho foi obtidos a partir da base p√∫blica da C√¢mara dos Deputados, disponibilizada em diversos formatos.

Os dados foram coletados e baixados no formato CSV.ZIP, no qual foram extra√≠dos e armazenados tanto o arquivo original .zip, quanto o extra√≠do .csv no volume do SCHEMA staging, preservando a estrutura original da fonte.

A **camada Bronze** ir√° preservar a estrutura original da fonte, sem altera√ß√µes de schema, garantindo reprodutibilidade e rastreabilidade.

Na **camada Silver**, os dados passaram por processos de limpeza, padroniza√ß√£o de tipos (datas, valores num√©ricos e campos categ√≥ricos), tratamento de valores nulos e remo√ß√£o de registros inconsistentes.

Na **camada Gold**, os dados foram reorganizados em um modelo anal√≠tico no formato Esquema Estrela, composto por uma tabela fato e tabelas dimens√£o, visando facilitar an√°lises e consultas anal√≠ticas.



## CAT√ÅLOGO ‚Äî TABELA FATO

**Tabela:** FATO_DESPESA_CEAP

**Descri√ß√£o:** Tabela central do modelo anal√≠tico que registra cada despesa individual declarada por um parlamentar no √¢mbito da CEAP.

**Granularidade:** Uma linha representa uma despesa individual associada a um documento fiscal declarado por um parlamentar.

**Campos da Tabela Fato**
| Campo           | Tipo          | Descri√ß√£o                                   | Dom√≠nio / Regras      |
| --------------- | ------------- | ------------------------------------------- | --------------------- |
| id_documento    | String        | Identificador √∫nico do documento da despesa | N√£o nulo              |
| valor_despesa   | Decimal(12,2) | Valor monet√°rio da despesa declarada        | ‚â• 0                   |
| data_despesa    | Date          | Data de emiss√£o do documento                | yyyy-mm-dd            |
| id_parlamentar  | Integer       | Identificador do parlamentar                | FK ‚Üí DIM_PARLAMENTAR  |
| id_tempo        | Integer       | Chave da dimens√£o tempo                     | FK ‚Üí DIM_TEMPO        |
| id_tipo_despesa | Integer       | C√≥digo do tipo de despesa                   | FK ‚Üí DIM_TIPO_DESPESA |
| id_partido      | Integer       | Identificador do partido pol√≠tico           | FK ‚Üí DIM_PARTIDO      |
| id_uf           | Integer       | Identificador da unidade federativa         | FK ‚Üí DIM_UF           |

---


### CAT√ÅLOGO ‚Äî DIMENS√ïES

#### DIM_PARLAMENTAR
**Descri√ß√£o:** Dimens√£o que cont√©m informa√ß√µes descritivas dos parlamentares que utilizaram a CEAP.
| Campo            | Tipo    | Descri√ß√£o                          | Dom√≠nio          |
| ---------------- | ------- | ---------------------------------- | ---------------- |
| id_parlamentar   | Integer | Identificador √∫nico do parlamentar | N√£o nulo         |
| nome_parlamentar | String  | Nome do parlamentar                | Texto            |
| legislatura      | Integer | N√∫mero da legislatura              | Inteiro positivo |
| sigla_partido    | String  | Sigla do partido pol√≠tico          | Ex: PT, PL, PSDB |
| sigla_uf         | String  | Unidade federativa do parlamentar  | Ex: SP, MG       |

---
#### DIM_TEMPO
**Descri√ß√£o:** Dimens√£o temporal utilizada para an√°lises cronol√≥gicas e agrega√ß√µes por per√≠odo.
| Campo     | Tipo    | Descri√ß√£o                          | Dom√≠nio          |
| --------- | ------- | ---------------------------------- | ---------------- |
| id_tempo  | Integer | Chave substituta da dimens√£o tempo | N√£o nulo         |
| data      | Date    | Data completa                      | yyyy-mm-dd       |
| ano       | Integer | Ano da despesa                     | ‚â• 1900           |
| mes       | Integer | M√™s da despesa                     | 1 a 12           |
| trimestre | Integer | Trimestre do ano                   | 1 a 4            |
| nome_mes  | String  | Nome do m√™s                        | Janeiro‚ÄìDezembro |

---
#### DIM_TIPO_DESPESA
**Descri√ß√£o:** Classifica o tipo de despesa conforme categoriza√ß√£o oficial da CEAP.
| Campo                  | Tipo    | Descri√ß√£o                 | Dom√≠nio       |
| ---------------------- | ------- | ------------------------- | ------------- |
| id_tipo_despesa        | Integer | C√≥digo do tipo de despesa | Conforme CEAP |
| descricao_tipo_despesa | String  | Descri√ß√£o textual do tipo | Texto         |

---
#### DIM_PARTIDO
**Descri√ß√£o:** Dimens√£o que representa os partidos pol√≠ticos aos quais os parlamentares est√£o vinculados.
| Campo         | Tipo    | Descri√ß√£o                   | Dom√≠nio    |
| ------------- | ------- | --------------------------- | ---------- |
| id_partido    | Integer | Chave substituta do partido | N√£o nulo   |
| sigla_partido | String  | Sigla do partido            | Ex: PT, PL |
| nome_partido  | String  | Nome completo do partido    | Texto      |

---
#### DIM_UF
**Descri√ß√£o:** Dimens√£o geogr√°fica baseada na unidade federativa do parlamentar.
| Campo    | Tipo    | Descri√ß√£o                   | Dom√≠nio    |
| -------- | ------- | --------------------------- | ---------- |
| id_uf    | Integer | Chave substituta da UF      | N√£o nulo   |
| sigla_uf | String  | Sigla da unidade federativa | Ex: SP, RJ |
| nome_uf  | String  | Nome completo do estado     | Texto      |

## üìê Diagrama de Modelagem ‚Äì Esquema Estrela (CEAP)

erDiagram
    FATO_DESPESA_CEAP {
        string  id_documento
        int     id_parlamentar
        int     id_tempo
        int     id_tipo_despesa
        string  id_partido
        string  id_uf
        decimal valor_documento
        decimal valor_glosa
        decimal valor_liquido
    }

    DIM_PARLAMENTAR {
        int     id_parlamentar
        string  nome_parlamentar
        string  sigla_partido
        string  sigla_uf
        int     num_legislatura
    }

    DIM_TEMPO {
        int     id_tempo
        date    data
        int     ano
        int     mes
        int     trimestre
        string  nome_mes
    }

    DIM_TIPO_DESPESA {
        int     id_tipo_despesa
        string  descricao_tipo_despesa
        int     id_especificacao_tipo
        string  descricao_especificacao_tipo
    }

    DIM_PARTIDO {
        string  id_partido
        string  sigla_partido
    }

    DIM_UF {
        string  id_uf
        string  sigla_uf
    }

    DIM_PARLAMENTAR ||--o{ FATO_DESPESA_CEAP : id_parlamentar
    DIM_TEMPO ||--o{ FATO_DESPESA_CEAP : id_tempo
    DIM_TIPO_DESPESA ||--o{ FATO_DESPESA_CEAP : id_tipo_despesa
    DIM_PARTIDO ||--o{ FATO_DESPESA_CEAP : id_partido
    DIM_UF ||--o{ FATO_DESPESA_CEAP : id_uf
