#1- Validação do schema das tabelas e verificação, tratamento e correção de possíveis valores nulos.

In [0]:
%python
from pyspark.sql.functions import col, count, when

# Lista das tabelas da bronze
tabelas = spark.sql("SHOW TABLES IN mvp_datasus.bronze").collect()

for row in tabelas:
    nome = row.tableName
    print(f"\n==================== {nome} ====================")

    # Carregar tabela
    df = spark.table(f"mvp_datasus.bronze.{nome}")

    # 1️⃣ Validar esquema da tabela
    print("\nESQUEMA DA TABELA:")
    df.printSchema()

    # 2️⃣ Contagem de valores nulos por coluna
    print("\nVALORES NULOS POR COLUNA:")
    df_nulls = df.select([
        count(when(col(c).isNull(), c)).alias(c)
        for c in df.columns
    ])
    display(df_nulls)

    # 3️⃣ Identificação de colunas numéricas para substituir nulos por 0
    colunas_numericas = [c.name for c in df.schema.fields if c.dataType.simpleString() in ["int", "bigint", "double", "float", "decimal"]]

    print("\nCOLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:")
    print(colunas_numericas)

    # Substituir nulos por 0 nas colunas numéricas
    df_clean = df.fillna(0, subset=colunas_numericas)

    # 4️⃣ Exibir primeiras linhas depois da limpeza
    print("\nPRIMEIRAS 5 LINHAS APÓS LIMPEZA:")
    display(df_clean.limit(5))





ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,4135,5725,3850,3983,3981,2706
12,Acre,1907,2325,1623,1753,1811,1109
13,Amazonas,9914,11544,7366,6913,7200,5332
14,Roraima,1696,2264,1507,1492,1084,436
15,Pará,15224,18017,14246,14500,14958,10709




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
13,Amazonas,0,1,1,1,1,0
15,Pará,1,1,1,1,0,0
21,Maranhão,0,0,1,0,1,0
22,Piauí,0,0,1,0,0,0
25,Paraíba,1,0,0,0,0,0




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2024: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2021,2022,2024
0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2021', '2022', '2024']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2021,2022,2024
13,Amazonas,0,1,0
22,Piauí,0,1,0
26,Pernambuco,0,1,1
31,Minas Gerais,0,0,1
32,Espírito Santo,0,1,0




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2021,2022,2023,2024,2025
0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2021,2022,2023,2024,2025
13,Amazonas,1,0,1,1,0
15,Pará,1,1,1,0,0
21,Maranhão,0,1,0,1,0
25,Paraíba,0,0,0,0,0
29,Bahia,0,0,0,0,1




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,0,3,1,5,4,3
12,Acre,1,1,1,0,1,0
13,Amazonas,16,17,16,12,13,14
14,Roraima,2,2,3,2,3,0
15,Pará,9,9,5,5,3,4




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,0,0,1,1,0,1
13,Amazonas,3,7,2,3,3,7
14,Roraima,0,1,0,2,0,0
15,Pará,3,3,1,1,0,2
16,Amapá,0,0,0,1,0,0




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,0,3,0,4,4,2
12,Acre,1,1,1,0,1,0
13,Amazonas,13,10,14,9,10,7
14,Roraima,2,1,3,0,3,0
15,Pará,6,6,4,4,3,2




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,6,18,18,19,25,12
12,Acre,6,1,2,2,9,1
13,Amazonas,89,102,77,81,93,43
14,Roraima,10,19,12,7,7,3
15,Pará,48,59,25,36,32,19




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,2,4,6,6,5,2
12,Acre,2,1,0,0,3,0
13,Amazonas,26,20,14,17,25,5
14,Roraima,1,6,0,0,2,1
15,Pará,15,15,4,8,10,6




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,4,14,12,13,20,10
12,Acre,4,0,2,2,6,1
13,Amazonas,63,82,63,64,68,38
14,Roraima,9,13,12,7,5,2
15,Pará,33,44,21,28,22,13




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,11,22,17,30,17,17
12,Acre,1,1,0,4,4,0
13,Amazonas,58,74,83,63,75,61
14,Roraima,11,8,7,13,2,2
15,Pará,39,41,29,23,30,21




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,7,6,6,6,6,5
12,Acre,0,0,0,1,0,0
13,Amazonas,15,17,20,18,24,18
14,Roraima,1,2,3,2,0,1
15,Pará,12,18,16,9,12,8




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,4,16,11,24,11,12
12,Acre,1,1,0,3,4,0
13,Amazonas,43,57,63,45,51,43
14,Roraima,10,6,4,11,2,1
15,Pará,27,23,13,14,18,13




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,6,14,6,5,8,11
12,Acre,0,1,1,2,2,3
13,Amazonas,13,18,18,24,28,13
14,Roraima,2,2,2,5,3,0
15,Pará,18,4,13,8,6,11




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,4,2,2,0,1,6
12,Acre,0,0,0,0,1,0
13,Amazonas,4,8,4,3,9,1
14,Roraima,2,1,0,3,2,0
15,Pará,6,1,4,3,3,4




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,2,12,4,5,7,5
12,Acre,0,1,1,2,1,3
13,Amazonas,9,10,14,21,19,12
14,Roraima,0,1,2,2,1,0
15,Pará,12,3,9,5,3,7




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,1,4,4,5,5,2
12,Acre,0,0,0,0,3,0
13,Amazonas,12,14,15,13,14,8
14,Roraima,2,1,0,1,2,2
15,Pará,4,2,4,4,7,2




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,1,0,1,0,1,1
13,Amazonas,2,5,7,1,2,1
14,Roraima,0,0,0,1,2,0
15,Pará,2,1,1,2,0,1
16,Amapá,0,0,0,1,0,0




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,0,4,3,5,4,1
12,Acre,0,0,0,0,3,0
13,Amazonas,10,9,8,12,12,7
14,Roraima,2,1,0,0,0,2
15,Pará,2,1,3,2,7,1




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,14,12,16,13,13,15
12,Acre,2,1,0,1,4,0
13,Amazonas,50,57,48,42,63,32
14,Roraima,4,10,3,8,6,2
15,Pará,38,38,26,23,25,21




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,24,61,46,64,59,45
12,Acre,8,4,4,8,19,4
13,Amazonas,188,226,210,194,224,139
14,Roraima,27,32,24,28,17,7
15,Pará,119,116,77,77,78,57




ESQUEMA DA TABELA:
root
 |-- cod_ibge: integer (nullable = true)
 |-- unidade_federacao: string (nullable = true)
 |-- 2020: integer (nullable = true)
 |-- 2021: integer (nullable = true)
 |-- 2022: integer (nullable = true)
 |-- 2023: integer (nullable = true)
 |-- 2024: integer (nullable = true)
 |-- 2025: integer (nullable = true)


VALORES NULOS POR COLUNA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
0,0,0,0,0,0,0,0



COLUNAS NUMÉRICAS QUE TERÃO NULOS SUBSTITUÍDOS POR 0:
['cod_ibge', '2020', '2021', '2022', '2023', '2024', '2025']

PRIMEIRAS 5 LINHAS APÓS LIMPEZA:


cod_ibge,unidade_federacao,2020,2021,2022,2023,2024,2025
11,Rondônia,10,49,30,51,46,30
12,Acre,6,3,4,7,15,4
13,Amazonas,138,169,162,152,161,107
14,Roraima,23,22,21,20,11,5
15,Pará,81,78,51,54,53,36
