# Cálculo das Probabilidades de Entrada em benefícios

Os cálculos são baseados no novo modelo de projeção da Fazenda.

Etapas:
 1. Obter o nome de todas as tabelas dentro do arquivo     
 2. Salvar todas as tabelas da planilha
     * As tabelas serão salvas em uma estrutura de dados do tipo DataFrame
     * Os DataFrames serão salvos em dicionários (hashtables) para facilitar o acesso
 3. Calcula as probabilidades ...

In [2]:
import pandas as pd

# Ano de referência para o cálculo das probabilidades
ano_estoque = 2014

# Arquivo com os dados da Fazenda
arquivo = '../../datasets/FAZENDA/dados_fazenda.xlsx'

# Listas com todos os estoques presentes na Planilha
# Cada item da lista representa uma planilha dentro do arquivo

lista_estoques = ["EsApinUrbPisoH", "EsApinUrbPisoM", "EsApidUrbPisoH", "EsApidUrbPisoM", 
                  "EsAtcnUrbPisoH", "EsAtcnUrbPisoM", "EsAtceUrbPisoH", "EsAtceUrbPisoM",
                  "EsAtcpUrbPisoH", "EsAtcpUrbPisoM", "EsAtcdUrbPisoH", "EsAtcdUrbPisoM",
                  "EsAinvUrbPisoH", "EsAinvUrbPisoM", 
                     
                  "EsApinRurH", "EsApinRurM", "EsApidRurH", "EsApidRurM",
                  "EsAtcnRurH", "EsAtcnRurM", "EsAtceRurH", "EsAtceRurM",
                  "EsAtcpRurH", "EsAtcpRurM", "EsAtcdRurH","EsAtcdRurM",
                  "EsAinvRurH", "EsAinvRurM",  
                  
                  "EsApinUrbAcimH", "EsApinUrbAcimM", "EsApidUrbAcimH", "EsApidUrbAcimM", 
                  "EsAtcnUrbAcimH", "EsAtcnUrbAcimM", "EsAtceUrbAcimH", "EsAtceUrbAcimM", 
                  "EsAtcpUrbAcimH", "EsAtcpUrbAcimM", "EsAtcdUrbAcimH", "EsAtcdUrbAcimM",
                  "EsAinvUrbAcimH", "EsAinvUrbAcimM",                   
                  "EsAuxdUrbPisoH", "EsAuxdUrbPisoM", "EsAuxdRurH", "EsAuxdRurM",                
                  "EsAuxdUrbAcimH", "EsAuxdUrbAcimM", "EsAuxaUrbPisoH", "EsAuxaUrbPisoM", "EsAuxrUrbPisoH", "EsAuxrUrbPisoM", 
                  "EsAuxaRurH", "EsAuxaRurM", "EsAuxrRurH", "EsAuxrRurM", "EsAuxaUrbAcimH",
                  "EsAuxaUrbAcimM", "EsAuxrUrbAcimH", "EsAuxrUrbAcimM",
                  "EsSalMatUrbPisoM","EsSalMatRurM", "EsSalMatUrbAcimM",
                  "EsPensUrbPisoH", "EsPensUrbPisoM", "EsPensRurH", 
                  "EsPensRurM", "EsPensUrbAcimH", "EsPensUrbAcimM" ,
                  "EsLoasIdoH", "EsLoasIdoM", "EsLoasDefH", 
                  "EsLoasDefM", "EsRmvH", "EsRmvM"]



# Lista com todas as tabelas de concessões presentes na Planilha
lista_concessoes = ["CoApinUrbPisoH", "CoApinUrbPisoM", "CoApidUrbPisoH", "CoApidUrbPisoM", 
                  "CoAtcnUrbPisoH", "CoAtcnUrbPisoM", "CoAtceUrbPisoH", "CoAtceUrbPisoM",
                  "CoAtcpUrbPisoH", "CoAtcpUrbPisoM", "CoAtcdUrbPisoH", "CoAtcdUrbPisoM",
                  "CoAinvUrbPisoH", "CoAinvUrbPisoM", "CoAuxdUrbPisoH", "CoAuxdUrbPisoM", 
                                    
                  "CoSalMatUrbPisoM", "CoPensUrbPisoH", "CoPensUrbPisoM",
                  "CoApinRurH", "CoApinRurM", "CoApidRurH", "CoApidRurM",
                  "CoAtcnRurH", "CoAtcnRurM", "CoAtceRurH", "CoAtceRurM",
                  "CoAtcpRurH", "CoAtcpRurM", "CoAtcdRurH","CoAtcdRurM",
                  "CoAinvRurH", "CoAinvRurM", "CoAuxdRurH", "CoAuxdRurM",
                  "CoSalMatRurM", "CoPensRurH", "CoPensRurM", 
                  
                  "CoApinUrbAcimH", "CoApinUrbAcimM", "CoApidUrbAcimH", "CoApidUrbAcimM", 
                  "CoAtcnUrbAcimH", "CoAtcnUrbAcimM", "CoAtceUrbAcimH", "CoAtceUrbAcimM", 
                  "CoAtcpUrbAcimH", "CoAtcpUrbAcimM", "CoAtcdUrbAcimH", "CoAtcdUrbAcimM",
                  "CoAinvUrbAcimH", "CoAinvUrbAcimM", "CoAuxdUrbAcimH", "CoAuxdUrbAcimM",
                  "CoSalMatUrbAcimM", "CoPensUrbAcimH", "CoPensUrbAcimM",
                  
                  "CoLoasIdoH", "CoLoasIdoM", "CoLoasDefH", "CoLoasDefM" 
                 ]

# Lista com todos os estoques presentes na Planilha
# Cada item da lista representa uma planilha dentro do arquivo
lista_cessacoes = ["CeApinUrbPisoH", "CeApinUrbPisoM", "CeApidUrbPisoH", "CeApidUrbPisoM", 
                  "CeAtcnUrbPisoH", "CeAtcnUrbPisoM", "CeAtceUrbPisoH", "CeAtceUrbPisoM",
                  "CeAtcpUrbPisoH", "CeAtcpUrbPisoM", "CeAtcdUrbPisoH", "CeAtcdUrbPisoM",
                  "CeAinvUrbPisoH", "CeAinvUrbPisoM", 
                  
                  "CePensUrbPisoH", "CePensUrbPisoM", "CeApinRurH", "CeApinRurM", 
                  "CeApidRurH", "CeApidRurM", "CeAtcnRurH", "CeAtcnRurM", 
                  "CeAtceRurH", "CeAtceRurM",
                  "CeAtcpRurH", "CeAtcpRurM", "CeAtcdRurH","CeAtcdRurM",
                  "CeAinvRurH", "CeAinvRurM", 
                  "CePensRurH", "CePensRurM", 
                  
                  "CeApinUrbAcimH", "CeApinUrbAcimM", "CeApidUrbAcimH", "CeApidUrbAcimM", 
                  "CeAtcnUrbAcimH", "CeAtcnUrbAcimM", "CeAtceUrbAcimH", "CeAtceUrbAcimM", 
                  "CeAtcpUrbAcimH", "CeAtcpUrbAcimM", "CeAtcdUrbAcimH", "CeAtcdUrbAcimM",
                  "CeAinvUrbAcimH", "CeAinvUrbAcimM",                 
                  "CePensUrbAcimH", "CePensUrbAcimM",
                  
                  "CeLoasIdoH", "CeLoasIdoM", "CeLoasDefH", "CeLoasDefM", "CeRmvH", "CeRmvM"                  
                 ]



Em seguida carregamos o arquivo Excel e obtemos cada uma das tabelas listadas nas variáveis

In [3]:
# lendo arquivo
xls = pd.ExcelFile(arquivo)

# Lista com as tabelas com dados ausentes
tabsIncompletas = []

# Dicionários que armazenarão os estoques, quantidades de benefícios concedidos e cessados
estoques = {}
concessoes = {}
cessacoes = {}

# Função que extrai as tabelas do arquivo
# Recebe o arquivo (planilha) e a lista de tabelas a serem extraídas
def carrega_dados(lista, xls):        
    
    # Dicionário que salva as tabelas
    colecao_tabelas = {}
    
    # Lê cada uma das tabelas dentro do arquivo 
    # Converte cada tabela em um DataFrame e salva no dicionário
    for i in lista:
        colecao_tabelas[i] = xls.parse(i, index_col=0)                 # Converte a tabela para um DataFrame
        colecao_tabelas[i].drop('Total', inplace=True)                 # Elimina a linha 'Total'
        colecao_tabelas[i].dropna(thresh=89, axis=1, inplace=True)     # Elimina colunas com dados ausentes
        colecao_tabelas[i].dropna(how='all', inplace=True)             # Elimina linhas completamente vazias
        

        # Remove as tabelas que possuem dados ausentes
        if colecao_tabelas[i].empty:                     
            tabsIncompletas.append(i)        
            colecao_tabelas.pop(i)            

    return colecao_tabelas

# Carrega os dados
estoques = carrega_dados(lista_estoques, xls)
concessoes = carrega_dados(lista_concessoes, xls)
cessacoes = carrega_dados(lista_cessacoes, xls)

# Exibe algumas informações sobre as tabelas
print('Total de tabelas de ESTOQUES: %s' %len(lista_estoques))        
print('Total de tabelas de CONCESSÕES: %s' %len(lista_concessoes))        
print('Total de tabelas de CESSAÇÕES: %s' %len(lista_cessacoes))        

print('Total de tabelas incompletas e removidas: %s' %len(tabsIncompletas))
print(*tabsIncompletas, sep='\n')

print('Total de tabelas carregadas: %s' %(len(estoques)+len(concessoes)+len(cessacoes)))

Total de tabelas de ESTOQUES: 75
Total de tabelas de CONCESSÕES: 61
Total de tabelas de CESSAÇÕES: 54
Total de tabelas incompletas e removidas: 26
EsApidRurH
EsApidRurM
EsAtceRurH
EsAtceRurM
EsAtcpRurH
EsAtcpRurM
EsAtcdRurH
EsAtcdRurM
EsSalMatUrbPisoM
CoSalMatUrbPisoM
CoApidRurH
CoApidRurM
CoAtceRurH
CoAtceRurM
CoAtcpRurH
CoAtcpRurM
CoAtcdRurH
CoAtcdRurM
CeApidRurH
CeApidRurM
CeAtceRurH
CeAtceRurM
CeAtcpRurH
CeAtcpRurM
CeAtcdRurH
CeAtcdRurM
Total de tabelas carregadas: 164


Após carregar todos os dados é possível ver o conjunto de dados de cada tabela.

In [160]:
# A execução desta célula é opcional

# Função que obtém cada um das tabelas do dicionário e exibe parte do conteúdo
def print_tabelas(colecao):
    for i in colecao:    
        print('Tabela: %s' % (i))
        print(colecao[i])
        print('------------------\n')


# Exibe o parte do conteúdo de cada tabela
print_tabelas(estoques)
print_tabelas(concessoes)
print_tabelas(cessacoes)

Tabela: EsApinUrbPisoH
        2010          2011          2012          2013          2014
ÍNDICE                                                              
0        0.0      0.000000      0.000000      0.000000      0.000000
1        0.0      0.000000      0.000000      0.000000      0.000000
2        0.0      0.000000      0.000000      0.000000      0.000000
3        0.0      0.000000      0.000000      0.000000      0.000000
4        0.0      0.000000      0.000000      0.000000      0.000000
5        0.0      0.000000      0.000000      0.000000      0.000000
6        0.0      0.000000      0.000000      0.000000      0.000000
7        0.0      0.000000      0.000000      0.000000      0.000000
8        0.0      0.000000      0.000000      0.000000      0.000000
9        0.0      0.000000      0.000000      0.000000      0.000000
10       0.0      0.000000      0.000000      0.000000      0.000000
11       0.0      0.000000      0.000000      0.000000      0.000000
12       0.

ÍNDICE
0        0.000000
1        0.000000
2        0.000000
3        0.000000
4        0.000000
5        0.000000
6        0.000000
7        0.000000
8        0.000000
9        0.000000
10       0.000000
11       0.000000
12       0.000000
13       0.000000
14       0.000000
15       0.000000
16       0.000000
17       0.000000
18       0.000000
19       0.000000
20       0.000000
21       0.000000
22       1.790406
23       2.048684
24       2.617614
25       3.065768
26       3.568231
27       5.781110
28       4.141905
29       8.142923
         ...     
61     481.618318
62     536.246448
63     577.733024
64     585.097381
65     629.691946
66     702.393261
67     802.023255
68     773.875728
69     788.727307
70     857.672974
71     940.465646
72     940.571251
73     941.665032
74    1123.841188
75    1158.329054
76    1175.460977
77    1293.243514
78    1479.821308
79    1639.178984
80    1592.805783
81    1634.133447
82    1646.960423
83    1712.628036
84    1777.687698
85 