## Problema
'codigo', 'descricao' e 'cod_pai' são nomes genéricos que não auxiliam na codificação, ou qualificam adequadamente a informação a que se referencia. 

## Solução
Utilizar nomes que contextualizem a tabela a que a coluna pertence.

Exemplos:
- cod -> cod_assunto
- descricao -> descricao_classe
- cod_pai -> cod_movimento_pai

In [11]:
import pandas as pd 

data_path = 'dados/01_tabelas_auxiliares/'

# Carrega tabebla base e renomeia os campos
assunto = pd.read_csv(data_path + 'sgt_assuntos.csv', sep=';', usecols=['codigo', 'descricao', 'cod_pai'])
assunto.rename(columns = {'codigo':'cod_assunto', 'descricao':'descricao_assunto', 'cod_pai':'cod_assunto_pai'}, inplace = True)
# Garante que os campos de 'join' possuem mesmo tipo
assunto['cod_assunto'] = assunto['cod_assunto'].astype(float)

# Carrega tabela pai
assunto_pai = assunto.loc[:,('cod_assunto', 'descricao_assunto')]
assunto_pai.rename(columns = {'cod_assunto':'cod_assunto_pai', 'descricao_assunto':'descricao_assunto_pai'}, inplace = True)

# Concatena tabelas e salva
tabAssunto = pd.merge(assunto, assunto_pai, how='left', on='cod_assunto_pai')
tabAssunto.to_csv(data_path + 'tabAssunto.csv', index=False)

In [12]:
print(tabAssunto.shape)
print(tabAssunto.dtypes)
print(tabAssunto)

(3685, 4)
cod_assunto              float64
descricao_assunto         object
cod_assunto_pai          float64
descricao_assunto_pai     object
dtype: object
      cod_assunto           descricao_assunto  cod_assunto_pai  \
0            14.0          DIREITO TRIBUTÁRIO              NaN   
1           195.0      DIREITO PREVIDENCIÁRIO              NaN   
2           287.0               DIREITO PENAL              NaN   
3           864.0         DIREITO DO TRABALHO              NaN   
4           899.0               DIREITO CIVIL              NaN   
...           ...                         ...              ...   
3680      12915.0           Sistema Prisional          12793.0   
3681      12916.0  Plano Estadual de Educação          12802.0   
3682      12917.0  Plano Nacional de Educação          12802.0   
3683      12918.0      Processo de Elaboração          12917.0   
3684      12919.0      Processo de Elaboração          12916.0   

           descricao_assunto_pai  
0               