In [13]:
import pandas as pd

In [14]:
auxilios = pd.read_excel('auxilios_novembro_2025.xlsx', skiprows=1)
auxilios.head()

In [None]:
auxilios.columns

Index(['APS', 'APS.1', 'Competência concessão', 'Espécie', 'Espécie.1', 'CID',
       'CID.1', 'Despacho', 'Despacho.1', 'Dt Nascimento', 'Sexo.',
       'Clientela', 'Mun Resid', 'Vínculo dependentes', 'Forma Filiação', 'UF',
       'Qt SM RMI', 'Ramo Atividade', 'Dt DCB', 'Dt DDB', 'Dt DIB',
       'País de Acordo Internacional', 'Classificador PA', 'CNAE 2.0',
       'CNAE 2.0.1', 'Grau Instrução', 'Qt Anos Contribuição'],
      dtype='object')

In [None]:
def limpeza_auxilios(auxilios): 
    auxilios = auxilios.copy()

    auxilios.columns = (
        auxilios.columns
        .str.strip() #remove os espaços antes e depois
        .str.normalize('NFKD') #remove acentos
    )
    
    colunas_para_remover = [
        'APS', 'APS.1', 'Competência concessão', 'Espécie', 'CID', 'Despacho', 'Mun Resid', 'País de Acordo Internacional', 'CNAE 2.0', 'CNAE 2.0.1'
    ]
    auxilios.drop(columns=colunas_para_remover, inplace=True, errors='ignore')

    renomear_colunas = {
        'Espécie.1' : 'Tipos de auxilio', 
        'CID.1' : 'CID',
        'Despacho.1' : 'Despacho',
        'Dt Nascimento' : 'Data nasc',
        'Sexo.' : 'Sexo',
        'Qt SM RMI' : 'Quant salarios minimos na RMI',
        'Dt DCB' : 'Data DCB',
        'Dt DDB' : 'Data DDB',
        'Dt DIB' : 'Data DIB',
        'Classificador PA' : 'Pensão Alimenticia'
    }
    auxilios.rename(columns=renomear_colunas, inplace=True)

    #arredonda para duas casas decimais
    auxilios['Quant salarios minimos na RMI'] = auxilios['Quant salarios minimos na RMI'].round(2)

    #transformar o que é string para datetime
    for col in ["Data DCB", "Data DDB", "Data DIB", "Data nasc"]:
        auxilios[col] = pd.to_datetime(auxilios[col], errors="coerce", dayfirst=True)

    #onde tem valores faltando colocar 'nao informado'
    auxilios['CID'] = auxilios['CID'].fillna('Não informado')
    
    #apaga a duplicada e deixa a original
    auxilios.drop_duplicates(inplace=True)

    return auxilios


In [None]:
auxilios = limpeza_auxilios(auxilios)

Unnamed: 0,Tipos de auxilio,CID,Despacho,Data nasc,Sexo,Clientela,Vínculo dependentes,Forma Filiação,UF,Quant salarios minimos na RMI,Ramo Atividade,Data DCB,Data DDB,Data DIB,Pensão Alimenticia,Grau Instrução,Qt Anos Contribuição
0,Auxílio Doenca Previdenciário,D25.1 Leiomioma Intramural do Utero,Concessao com Analise Documental,1984-07-04,Feminino,Urbano,Não Informado,Empregado,Alagoas,1.50,Comerciario,2025-10-25,2025-11-01,2025-10-11,Sem Pensâo Alimentícia,Não Informado,9
1,Auxílio Doenca por Acidente do Trabalho,F33.1 Transt Depress Recorr Episodio Atual Mo,Concessao com Analise Documental,1990-09-01,Feminino,Urbano,Não Informado,Empregado,Alagoas,2.06,Comerciario,2025-12-29,2025-11-01,2025-10-31,Sem Pensâo Alimentícia,Não Informado,11
2,Auxílio Doenca Previdenciário,M23 Transt Internos dos Joelhos,Concessao com Analise Documental,1987-12-29,Feminino,Urbano,Não Informado,Empregado,Alagoas,1.00,Comerciario,2025-12-13,2025-11-01,2025-10-30,Sem Pensâo Alimentícia,Não Informado,0
3,Auxílio Doenca Previdenciário,S92 Frat do Pe,Concessao com Analise Documental,1987-05-05,Feminino,Urbano,Não Informado,Empregado,Alagoas,1.46,Comerciario,2025-12-19,2025-11-01,2025-10-22,Sem Pensâo Alimentícia,Não Informado,11
4,Auxílio Doenca Previdenciário,M51.1 Transt Disco Lombar Outr Intervert Radi,Concessao com Analise Documental,1991-03-08,Masculino,Urbano,Não Informado,Desempregado,Alagoas,1.00,Comerciario,2025-12-21,2025-11-01,2025-10-23,Sem Pensâo Alimentícia,Não Informado,2
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
584916,Auxílio Doenca Previdenciário,F41.2 Transt Misto Ansioso e Depressivo,Concessao com Analise Documental,1997-10-04,Feminino,Urbano,Não Informado,Desempregado,Tocantins,1.08,Comerciario,2025-12-23,2025-11-29,2025-11-24,Sem Pensâo Alimentícia,Não Informado,2
584917,Auxílio Doenca Previdenciário,N80 Endometriose,Concessao com Analise Documental,1988-07-24,Feminino,Urbano,Não Informado,Empregado,Tocantins,1.00,Comerciario,2026-01-02,2025-11-29,2025-11-19,Sem Pensâo Alimentícia,Não Informado,6
584918,Auxílio Doenca Previdenciário,G56.0 Sindr do Tunel do Carpo,Concessao com Analise Documental,1973-11-23,Feminino,Urbano,Não Informado,Autônomo,Tocantins,1.00,Comerciario,2025-12-25,2025-11-29,2025-10-27,Sem Pensâo Alimentícia,Não Informado,11
584919,Amp. Social Pessoa Portadora Deficiencia,Zerados,Concessao Decorrente de Acao Judicial,1978-02-13,Masculino,Rural,Não Informado,Desempregado,Tocantins,1.00,Rural,NaT,2025-11-29,2024-08-13,Sem Pensâo Alimentícia,Não Informado,0


In [None]:
auxilios

Unnamed: 0,Tipos de auxilio,CID,Despacho,Data nasc,Sexo,Clientela,Vínculo dependentes,Forma Filiação,UF,Quant salarios minimos na RMI,Ramo Atividade,Data DCB,Data DDB,Data DIB,Pensão Alimenticia,Grau Instrução,Qt Anos Contribuição
0,Auxílio Doenca Previdenciário,D25.1 Leiomioma Intramural do Utero,Concessao com Analise Documental,1984-07-04,Feminino,Urbano,Não Informado,Empregado,Alagoas,1.50,Comerciario,2025-10-25,2025-11-01,2025-10-11,Sem Pensâo Alimentícia,Não Informado,9
1,Auxílio Doenca por Acidente do Trabalho,F33.1 Transt Depress Recorr Episodio Atual Mo,Concessao com Analise Documental,1990-09-01,Feminino,Urbano,Não Informado,Empregado,Alagoas,2.06,Comerciario,2025-12-29,2025-11-01,2025-10-31,Sem Pensâo Alimentícia,Não Informado,11
2,Auxílio Doenca Previdenciário,M23 Transt Internos dos Joelhos,Concessao com Analise Documental,1987-12-29,Feminino,Urbano,Não Informado,Empregado,Alagoas,1.00,Comerciario,2025-12-13,2025-11-01,2025-10-30,Sem Pensâo Alimentícia,Não Informado,0
3,Auxílio Doenca Previdenciário,S92 Frat do Pe,Concessao com Analise Documental,1987-05-05,Feminino,Urbano,Não Informado,Empregado,Alagoas,1.46,Comerciario,2025-12-19,2025-11-01,2025-10-22,Sem Pensâo Alimentícia,Não Informado,11
4,Auxílio Doenca Previdenciário,M51.1 Transt Disco Lombar Outr Intervert Radi,Concessao com Analise Documental,1991-03-08,Masculino,Urbano,Não Informado,Desempregado,Alagoas,1.00,Comerciario,2025-12-21,2025-11-01,2025-10-23,Sem Pensâo Alimentícia,Não Informado,2
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
584916,Auxílio Doenca Previdenciário,F41.2 Transt Misto Ansioso e Depressivo,Concessao com Analise Documental,1997-10-04,Feminino,Urbano,Não Informado,Desempregado,Tocantins,1.08,Comerciario,2025-12-23,2025-11-29,2025-11-24,Sem Pensâo Alimentícia,Não Informado,2
584917,Auxílio Doenca Previdenciário,N80 Endometriose,Concessao com Analise Documental,1988-07-24,Feminino,Urbano,Não Informado,Empregado,Tocantins,1.00,Comerciario,2026-01-02,2025-11-29,2025-11-19,Sem Pensâo Alimentícia,Não Informado,6
584918,Auxílio Doenca Previdenciário,G56.0 Sindr do Tunel do Carpo,Concessao com Analise Documental,1973-11-23,Feminino,Urbano,Não Informado,Autônomo,Tocantins,1.00,Comerciario,2025-12-25,2025-11-29,2025-10-27,Sem Pensâo Alimentícia,Não Informado,11
584919,Amp. Social Pessoa Portadora Deficiencia,Zerados,Concessao Decorrente de Acao Judicial,1978-02-13,Masculino,Rural,Não Informado,Desempregado,Tocantins,1.00,Rural,NaT,2025-11-29,2024-08-13,Sem Pensâo Alimentícia,Não Informado,0


In [None]:
auxilios.info()

<class 'pandas.core.frame.DataFrame'>
Index: 580803 entries, 0 to 584920
Data columns (total 17 columns):
 #   Column                         Non-Null Count   Dtype         
---  ------                         --------------   -----         
 0   Tipos de auxilio               580803 non-null  object        
 1   CID                            580803 non-null  object        
 2   Despacho                       580803 non-null  object        
 3   Data nasc                      580803 non-null  datetime64[ns]
 4   Sexo                           580803 non-null  object        
 5   Clientela                      580803 non-null  object        
 6   Vínculo dependentes           580803 non-null  object        
 7   Forma Filiação               580803 non-null  object        
 8   UF                             580803 non-null  object        
 9   Quant salarios minimos na RMI  580803 non-null  float64       
 10  Ramo Atividade                 580803 non-null  object        
 11  Data 

In [None]:
#retorna True se qualquer coluna tiver nulo (Nan ou None)
#auxilios.isna().any().any()

np.True_

In [None]:
#retorna quantos nulos tem por coluna
#auxilios.isna().sum()

Tipos de auxilio                      0
CID                                   0
Despacho                              0
Data nasc                             0
Sexo                                  0
Clientela                             0
Vínculo dependentes                  0
Forma Filiação                      0
UF                                    0
Quant salarios minimos na RMI         0
Ramo Atividade                        0
Data DCB                         157270
Data DDB                              0
Data DIB                              0
Pensão Alimenticia                    0
Grau Instrução                      0
Qt Anos Contribuição                0
dtype: int64

In [None]:
#mostra quantidade de duplicada
#auxilios.duplicated().sum()

In [None]:
#mostra as colunas duplicadas, a original e a outra 
#auxilios[auxilios.duplicated(keep=False)]

In [None]:
#retorna somente as colunas duplicadas, sem mostrar a original
auxilios[auxilios.duplicated()]

Unnamed: 0,Tipos de auxilio,CID,Despacho,Data nasc,Sexo,Clientela,Vínculo dependentes,Forma Filiação,UF,Quant salarios minimos na RMI,Ramo Atividade,Data DCB,Data DDB,Data DIB,Pensão Alimenticia,Grau Instrução,Qt Anos Contribuição
