# Carga, limpeza e consolidação inicial dos dados obtidos do ProInfo.

A origem dos dados para essa rotina são 3 relatórios do ProInfo:<br>

**** Lista de Protocolos ****<br>
Obtida em: Ferramentas >> Consultar Protocolos:<br>
 - Planilhas com os Processos com Julgados.<br>

**** Lista de Resoluções ****<br>
Obtida em: Ferramentas >> Consultar Peças Processuais: <br>
 - Planilhas com a relação dos Processos com Resoluções; e<br>
 - Arquivo PDF com o conteúdo das resoluções.<br>

 Foram consideradas apenas as Resoluções da 2ª Câmara em 2013<br>

**** Relatório de Decisões do Período ****<br>
Obtida em: Relatórios >> Decisões no Período<br>
 - Planilhas com os resultados dos processos julgados<br>


O relatório de decisões só possui informações a partir de 2013, portanto os demais relatórios serão filtrados a partir dessa data.<br>



Produtos:<br>
01 - ProInfo - Lista Protocolos v1_0.xlsx<br>
01 - ProInfo - Lista de Resoluções v1_0.xlsx<br>
01 - ProInfo - Lista de Decisões v1_0.xlsx<br>
01 - ProInfo - Lista Consolidada v1_0.xlsx<br>


In [None]:
# %conda install -c anaconda xlrd
# %pip install xlrd
# %pip install --upgrade pip
# %pip install openpyxl
# %conda install tabulate
# %conda install -n base ipykernel --update-deps --force-reinstall

In [1]:
import pandas as pd
import os

if os.name == 'nt':  # Windows
    path_produtos = 'Dados\\Produtos\\'
    path_originais = 'Dados\\Coletados\\'
    path_ajustados = 'Dados\\Ajustados\\'
else:  # Ubuntu
    path_produtos = 'Dados/Produtos/'
    path_originais = 'Dados/Coletados/'
    path_ajustados = 'Dados/Ajustados/'

## Compilação e limpeza do arquivo de Protocolos

In [2]:
# Gera DataSet geral com todos os protocolos do ProInfo gerados por Consultar Protocolo

def juntar(df, arq, header, last_col):
    df_temp = pd.read_excel(path_originais+arq, header=header, usecols=list(range(1,last_col)))
    df_temp.dropna(how='all', inplace=True)
    df = pd.concat([df,df_temp], ignore_index=True)
    return df

df_prot = pd.DataFrame()
df_prot = juntar(df_prot, 'PROInfo - Lista Protocolos (2013).xls', 2, 27)
df_prot = juntar(df_prot, 'PROInfo - Lista Protocolos(2014-2016).xls', 2, 27)
df_prot = juntar(df_prot, 'PROInfo - Lista Protocolos(2017-2024).xls', 2, 27)

df_prot.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3809 entries, 0 to 3808
Data columns (total 26 columns):
 #   Column                          Non-Null Count  Dtype         
---  ------                          --------------  -----         
 0   Nº Protocolo                    3809 non-null   object        
 1   Tipo do Protocolo               3809 non-null   object        
 2   Situação                        3809 non-null   object        
 3   Natureza                        3809 non-null   object        
 4   Data do Protocolo               3809 non-null   datetime64[ns]
 5   Volumes                         3809 non-null   float64       
 6   Prazo                           1867 non-null   datetime64[ns]
 7   Sessão de Julgamento            3809 non-null   datetime64[ns]
 8   Informações Complementares      1577 non-null   object        
 9   Anexos                          1498 non-null   object        
 10  Relator                         3809 non-null   object        
 11  Revi

In [3]:
df_prot['Sessão de Julgamento'].dt.year.value_counts().sort_index()


Sessão de Julgamento
2013    290
2014    924
2015    441
2016    262
2017    201
2018    241
2019    214
2020    199
2021    217
2022    342
2023    297
2024    181
Name: count, dtype: int64

In [4]:
df_prot.describe(include=object)

Unnamed: 0,Nº Protocolo,Tipo do Protocolo,Situação,Natureza,Informações Complementares,Anexos,Relator,Revisor,Localização,Tempo de Permanência,Motivo do Último Trâmite,Envolvido Pessoa Física,Envolvido Pessoa Jurídica,Nº de Origem,Exercício,Colegiado,Procuradoria
count,3809,3809,3809,3809,1577,1498,3809,3,3809,3809,3809,3805,3809,3004,3764.0,3808,1465
unique,3809,1,58,13,1559,557,13,3,53,235,13,3552,2854,2712,50.0,3,6
top,TCE/012907/2023,Processo,ARQUIVADO - JULGADO - CONFERIDO - NO ARQUIVO -...,"COMPROVAÇÃO, PRESTAÇÃO E TOMADA DE CONTAS - RE...",RECONSTITUIÇÃO,VOLUME II,Pedro Henrique Lino de Souza,MANOEL FIGUEIREDO CASTRO,No Arquivo,<1 min,Arquivar,Gestor: JOSÉ CARLOS LIMA SANTOS,"Órgão de Origem: SECRETARIA DA SAÚDE, Entidade...",Oficio nº 083 /2021 - CONDER/DIPRE,2010.0,2ª Câmara,(2PC) 2ª Procuradoria de Contas
freq,1,3809,1257,1697,6,246,1170,1,2533,3315,3307,18,27,23,213.0,3044,375


In [None]:
# Código para eliminar registros de Protocolos duplicados, mantendo os mais recentes.
# Não foram encontrados registros duplicados.

#df_prot = df_prot.sort_values('Sessão de Julgamento').drop_duplicates('Nº Protocolo', keep='last')
#print(df_prot.info())
#print(df_prot.describe(include=object).to_markdown())

In [5]:

df_prot.to_excel(path_ajustados+'01 - ProInfo - Lista Protocolos.xlsx')

## Compilação e limpeza do arquivo de Resoluções

In [6]:
# Gera DataSet geral de todos as resoluções do ProInfo (Consultar Peças Processuais )

def JuntarResol(df, arq):
    df_temp = pd.read_excel(path_originais+arq, header=2, usecols=list(range(1,9)))
    df_temp.dropna(how='all', inplace=True)
    df = pd.concat([df,df_temp], ignore_index=True)
    return df

df_resol = pd.DataFrame()
df_resol = JuntarResol(df_resol, 'PROInfo - Lista de Peças Processuais(Resoluções 2014-2024).xls')
df_resol = JuntarResol(df_resol, 'PROInfo - Lista de Peças Processuais(Resoluções 1ª Câmara 2014-2024).xls')
df_resol = JuntarResol(df_resol, 'PROInfo - Lista de Peças Processuais(Resoluções 2ª Câmara 2013).xls')
df_resol = JuntarResol(df_resol, 'PROInfo - Lista de Peças Processuais(Resoluções 2ª Câmara 2014-2019).xls')
df_resol = JuntarResol(df_resol, 'PROInfo - Lista de Peças Processuais(Resoluções 2ª Câmara 2020-2024).xls')

print(df_resol.info())
print(df_resol.describe(include=object).to_markdown())


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3531 entries, 0 to 3530
Data columns (total 8 columns):
 #   Column         Non-Null Count  Dtype         
---  ------         --------------  -----         
 0   Ref.           3531 non-null   float64       
 1   Tipo           3531 non-null   object        
 2   Número/Ano     3531 non-null   object        
 3   Título         3531 non-null   object        
 4   Nº Protocolo   3531 non-null   object        
 5   Natureza       3531 non-null   object        
 6   Setor Criação  3529 non-null   object        
 7   Data Criação   3531 non-null   datetime64[ns]
dtypes: datetime64[ns](1), float64(1), object(6)
memory usage: 220.8+ KB
None
|        | Tipo                   | Número/Ano     | Título    | Nº Protocolo    | Natureza                                                                             | Setor Criação   |
|:-------|:-----------------------|:---------------|:----------|:----------------|:-----------------------------------

In [7]:
# Eliminação dos registros de Protocolos duplicados, mantendo os mais recentes.
df_resol = df_resol.sort_values('Data Criação').drop_duplicates('Nº Protocolo', keep='last')
print(df_resol.info())
print(df_resol.describe(include=object).to_markdown())


<class 'pandas.core.frame.DataFrame'>
Index: 3424 entries, 868 to 3104
Data columns (total 8 columns):
 #   Column         Non-Null Count  Dtype         
---  ------         --------------  -----         
 0   Ref.           3424 non-null   float64       
 1   Tipo           3424 non-null   object        
 2   Número/Ano     3424 non-null   object        
 3   Título         3424 non-null   object        
 4   Nº Protocolo   3424 non-null   object        
 5   Natureza       3424 non-null   object        
 6   Setor Criação  3422 non-null   object        
 7   Data Criação   3424 non-null   datetime64[ns]
dtypes: datetime64[ns](1), float64(1), object(6)
memory usage: 240.8+ KB
None
|        | Tipo                   | Número/Ano     | Título    | Nº Protocolo    | Natureza                                                                             | Setor Criação   |
|:-------|:-----------------------|:---------------|:----------|:----------------|:--------------------------------------

In [8]:
df_resol['Data Criação'].dt.year.value_counts().sort_index()

Data Criação
2013     66
2014    824
2015    395
2016    241
2017    201
2018    241
2019    195
2020    212
2021    224
2022    343
2023    299
2024    183
Name: count, dtype: int64

In [9]:
df_resol.to_excel(path_ajustados+'01 - ProInfo - Lista de Resoluções.xlsx')

## Compilação e limpeza do arquivo de Decisões

In [10]:
# Antes de executar a carga do arquivo foi realizado um ajuste manual diretamente no arquivo
# apagando as linhas de totalização e rodapé do relatório gerado pelo ProInfo.

def JuntarDecis(df, arq):
    df_temp = pd.read_excel(path_originais+arq, header=4, usecols=list(range(1,18)))
    df_temp.dropna(how='all', inplace=True)
    df = pd.concat([df,df_temp], ignore_index=True)
    return df

df_decis = pd.DataFrame()
df_decis = JuntarDecis(df_decis, 'PROInfo - Relatorio de decisoes no periodo(2013).xls')
df_decis = JuntarDecis(df_decis, 'PROInfo - Relatorio de decisoes no periodo(2014-2024).xls')
df_decis = df_decis[df_decis['Processo'].notnull()]
print(df_decis.info())
print(df_decis.describe(include=object).to_markdown())

<class 'pandas.core.frame.DataFrame'>
Index: 3191 entries, 0 to 3191
Data columns (total 17 columns):
 #   Column              Non-Null Count  Dtype         
---  ------              --------------  -----         
 0   Colegiado           3191 non-null   object        
 1   Decisão             3191 non-null   object        
 2   Número              3191 non-null   float64       
 3   Ano                 3191 non-null   float64       
 4   Processo            3191 non-null   object        
 5   Natureza            3191 non-null   object        
 6   Ementa              3191 non-null   object        
 7   Tipo de julgamento  3191 non-null   object        
 8   Data da sessão      3191 non-null   datetime64[ns]
 9   Relator             3191 non-null   object        
 10  Revisor             1 non-null      object        
 11  Data Protocolo      3191 non-null   datetime64[ns]
 12  Envolvido PF        3174 non-null   object        
 13  Envolvido PJ        3191 non-null   object        
 1

In [11]:
# Verifica se existem registros anteriores a 2014.
df_decis['Data da sessão'].dt.year.value_counts().sort_index()

Data da sessão
2013    100
2014    793
2015    394
2016    227
2017    158
2018    220
2019    199
2020    190
2021    216
2022    282
2023    251
2024    161
Name: count, dtype: int64

In [12]:
# Verifica se existem arquivos com número de protocolo repetido.
df_decis[df_decis['Processo'].duplicated(keep=False)].sort_values(['Processo', 'Data da sessão']).head(6)

Unnamed: 0,Colegiado,Decisão,Número,Ano,Processo,Natureza,Ementa,Tipo de julgamento,Data da sessão,Relator,Revisor,Data Protocolo,Envolvido PF,Envolvido PJ,Exercício,Referenciados,Vinculados
2177,2ª Câmara,Resolução da 2ª Câmara,234.0,2016.0,TCE/000081/2004,"COMPROVAÇÃO, PRESTAÇÃO E TOMADA DE CONTAS - RE...",PRESTAÇÃO DE CONTAS DE RECURSOS ATRIBUÍDOS A E...,Desaprovado em Débito,2016-10-26,Pedro Henrique Lino de Souza,,2004-01-08,LUIZ GONZAGA MENDES,"SECRETARIA DA AGRICULTURA, IRRIGAÇÃO E REFORMA...",2001.0,,
2511,2ª Câmara,Resolução da 2ª Câmara,191.0,2018.0,TCE/000081/2004,"COMPROVAÇÃO, PRESTAÇÃO E TOMADA DE CONTAS - RE...",CONVENIO. DESAPROVAÇÃO. DÉBITO. CÓPIA AO MPE. ...,Desaprovado em Débito,2018-12-19,Pedro Henrique Lino de Souza,,2004-01-08,LUIZ GONZAGA MENDES,"SECRETARIA DA AGRICULTURA, IRRIGAÇÃO E REFORMA...",2001.0,,
193,1ª Câmara,Resolução da 1ª Câmara,24.0,2019.0,TCE/000622/2007,"COMPROVAÇÃO, PRESTAÇÃO E TOMADA DE CONTAS - RE...",PRESTAÇÃO DE CONTAS DE RECURSOS ESTADUAIS ATRI...,Desaprovado com Determinação,2019-03-19,Carolina Matos,,2007-02-13,MATEUS REIS SIMOES,SECRETARIA DA SAÚDE,2006.0,,
659,1ª Câmara,Resolução da 1ª Câmara,108.0,2023.0,TCE/000622/2007,"COMPROVAÇÃO, PRESTAÇÃO E TOMADA DE CONTAS - RE...","COMPROVAÇÃO, PRESTAÇÃO E TOMADA DE CONTAS - RE...",Desaprovado com Recomendações,2023-06-06,Carolina Matos,,2007-02-13,MATEUS REIS SIMOES,SECRETARIA DA SAÚDE,2006.0,,
24,2ª Câmara,Resolução da 2ª Câmara,205.0,2013.0,TCE/001264/2010,TOMADA DE CONTAS - TOMADA DE CONTAS DE PREFEIT...,PRESTAÇÃO DE CONTAS DE RECURSOS ESTADUAIS ATRI...,Aprovado com Multa,2013-11-20,Pedro Henrique Lino de Souza,,2010-04-27,EMILIA MARIA SALVADOR SILVA,SECRETARIA DE TURISMO-SETUR,2009.0,,
2325,2ª Câmara,Resolução da 2ª Câmara,122.0,2017.0,TCE/001264/2010,TOMADA DE CONTAS - TOMADA DE CONTAS DE PREFEIT...,CONVENIO. NÃO APLICAR MULTA A SRA. EMÍLIA MARI...,Procedente sem multa,2017-08-23,Pedro Henrique Lino de Souza,,2010-04-27,EMILIA MARIA SALVADOR SILVA,SECRETARIA DE TURISMO-SETUR,2009.0,,


In [13]:
# Eliminação dos registros de Decisões duplicados, mantendo os mais recentes.
df_decis = df_decis.sort_values('Data da sessão').drop_duplicates('Processo', keep='last')
print(df_decis.info())
print(df_decis.describe(include=object).to_markdown())

<class 'pandas.core.frame.DataFrame'>
Index: 3165 entries, 0 to 3188
Data columns (total 17 columns):
 #   Column              Non-Null Count  Dtype         
---  ------              --------------  -----         
 0   Colegiado           3165 non-null   object        
 1   Decisão             3165 non-null   object        
 2   Número              3165 non-null   float64       
 3   Ano                 3165 non-null   float64       
 4   Processo            3165 non-null   object        
 5   Natureza            3165 non-null   object        
 6   Ementa              3165 non-null   object        
 7   Tipo de julgamento  3165 non-null   object        
 8   Data da sessão      3165 non-null   datetime64[ns]
 9   Relator             3165 non-null   object        
 10  Revisor             1 non-null      object        
 11  Data Protocolo      3165 non-null   datetime64[ns]
 12  Envolvido PF        3148 non-null   object        
 13  Envolvido PJ        3165 non-null   object        
 1

In [14]:
julgamentos = df_decis.loc[df_decis['Tipo de julgamento'].notna(),'Tipo de julgamento'].unique()
print(f'A quantidade de tipos de julgamento é de', len(julgamentos))
print('A quantidade de linhas duplicadas é de', len(df_decis[df_decis['Processo'].duplicated(keep=False)]))


A quantidade de tipos de julgamento é de 58
A quantidade de linhas duplicadas é de 0


In [15]:
# Removendo da base os registros que não aprovam ou desaprovam os processos
julgamentos = df_decis.loc[df_decis['Tipo de julgamento'].notna(),'Tipo de julgamento'].unique()
apagar = [julgamento for julgamento in julgamentos if 'Aprovado' not in julgamento and 'Desaprovado' not in julgamento and 'Desaprovação' not in julgamento]
df_decis_removidas = df_decis[df_decis['Tipo de julgamento'].isin(apagar)]
df_decis = df_decis[~df_decis['Tipo de julgamento'].isin(apagar)]
print('Os tipos de julgamento apagados foram: ', apagar)
# O DataFrame de trabalho passa a ser df_decis[]


Os tipos de julgamento apagados foram:  ['Decisão Interna', 'Irregular', 'Arquivar', 'Arquivar sem Baixa de Responsabilidade', 'Devolver ao TCM', 'Conhecimento', 'Devolver ao TCU', 'Perda de Objeto', 'Procedente sem multa', 'Ilegalidade', 'Deu-se Provimento', 'Extinção do Processo', 'Expedir Determinação', 'Sobrestamento', 'Incompetência da corte', 'Juntar Prestação de Contas', 'Arquivamento e recomendação', 'Arquivar sem Baixa de Responsabilidade com Recomendações']


In [16]:
print(f'A quantidade de tipos de julgamento é de', len(df_decis['Tipo de julgamento'].unique()))
print('A quantidade de linhas duplicadas é de', len(df_decis[df_decis['Processo'].duplicated(keep=False)]))

A quantidade de tipos de julgamento é de 40
A quantidade de linhas duplicadas é de 0


In [17]:
# Elimina decisões com Protocolos duplicados, mantendo os mais recentes.
df_decis = df_decis.sort_values('Data da sessão').drop_duplicates('Processo', keep='last')
print(f'A quantidade de tipos de julgamento é de', len(df_decis['Tipo de julgamento'].unique()))
print('A quantidade de linhas duplicadas é de', len(df_decis[df_decis['Processo'].duplicated(keep=False)]),'\n')
print(df_decis.info(),'\n')
print(df_decis.describe(include=object).to_markdown())

A quantidade de tipos de julgamento é de 40
A quantidade de linhas duplicadas é de 0 

<class 'pandas.core.frame.DataFrame'>
Index: 2527 entries, 0 to 3188
Data columns (total 17 columns):
 #   Column              Non-Null Count  Dtype         
---  ------              --------------  -----         
 0   Colegiado           2527 non-null   object        
 1   Decisão             2527 non-null   object        
 2   Número              2527 non-null   float64       
 3   Ano                 2527 non-null   float64       
 4   Processo            2527 non-null   object        
 5   Natureza            2527 non-null   object        
 6   Ementa              2527 non-null   object        
 7   Tipo de julgamento  2527 non-null   object        
 8   Data da sessão      2527 non-null   datetime64[ns]
 9   Relator             2527 non-null   object        
 10  Revisor             1 non-null      object        
 11  Data Protocolo      2527 non-null   datetime64[ns]
 12  Envolvido PF        25

In [18]:
df_decis.to_excel(path_ajustados+'01 - ProInfo - Lista de Decisões.xlsx')

# Conferência de compatibilidade do protocolos entre os arquivos
Verifica se os protocolos listados em um arquivo aparecem nos outros

In [19]:
# Preparando variáveis com protocolos únicos existentes nos arquivos

set_decis = set(df_decis['Processo'])  # Aqui vou considerar todas as decisões antes da limpeza de dados.
set_resol = set(df_resol['Nº Protocolo'])
set_prot  = set(df_prot['Nº Protocolo'])
set_protocolos_comuns = set_decis & set_resol & set_prot
print(f"Qtde de Protocolos no arquivo de Decisões  = {len(set_decis)}, {len(df_decis)}")
print(f"Qtde de Protocolos no arquivo de Resoluções = {len(set_resol)}, {len(df_resol)}")
print(f"Qtde de Protocolos no arquivo de Protocolos = {len(set_prot)}, {len(df_prot)}")
print(f"Qtde de Protocolos que aparecem nos 3 arquivos = {len(set_protocolos_comuns)}, {len(set_protocolos_comuns)}")

Qtde de Protocolos no arquivo de Decisões  = 2527, 2527
Qtde de Protocolos no arquivo de Resoluções = 3424, 3424
Qtde de Protocolos no arquivo de Protocolos = 3809, 3809
Qtde de Protocolos que aparecem nos 3 arquivos = 2525, 2525


In [20]:
# Análise dos protocolos em Decisões que não aparecem nos outros arquivos:
print(df_decis[df_decis['Processo'].isin(set_decis-set_protocolos_comuns)].to_markdown())


|      | Colegiado   | Decisão                |   Número |   Ano | Processo        | Natureza                                                                                   | Ementa                                                                                                                                                                                                                                      | Tipo de julgamento                    | Data da sessão      | Relator                            |   Revisor | Data Protocolo      | Envolvido PF                     | Envolvido PJ                                                     |   Exercício | Referenciados   |   Vinculados |
|-----:|:------------|:-----------------------|---------:|------:|:----------------|:-------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------

In [21]:
# O processo TCE/002882/2012 está marcado como ARQUIVADO - RETIRADO DE SESSÃO DE JULGAMENTO - NOTIFICADO -
# O processo TCE/008649/2020 após recurso do interessado voltou a ficar em andamento.
# Ambos os processos serão descartados.
df_decis = df_decis[~df_decis['Processo'].isin(set(['TCE/002882/2012', 'TCE/008649/2020']))]

In [22]:
set_decis = set(df_decis['Processo']) 
set_resol = set(df_resol['Nº Protocolo'])
set_prot  = set(df_prot['Nº Protocolo'])
set_protocolos_comuns = set_decis & set_resol & set_prot
print(f"Qtde de Protocolos no arquivo de Decisões  = {len(set_decis)}, {len(df_decis)}")
print(f"Qtde de Protocolos no arquivo de Resoluções = {len(set_resol)}, {len(df_resol)}")
print(f"Qtde de Protocolos no arquivo de Protocolos = {len(set_prot)}, {len(df_prot)}")
print(f"Qtde de Protocolos que aparecem nos 3 arquivos = {len(set_protocolos_comuns)}, {len(set_protocolos_comuns)}")

Qtde de Protocolos no arquivo de Decisões  = 2525, 2525
Qtde de Protocolos no arquivo de Resoluções = 3424, 3424
Qtde de Protocolos no arquivo de Protocolos = 3809, 3809
Qtde de Protocolos que aparecem nos 3 arquivos = 2525, 2525


In [23]:
# Todos os protocolos restantes das Decisões aparecem nos outros arquivos.

## Análise dos protocolos que estão em Protocolos e Resoluções, mas não aparecem em decisões.

In [24]:
set_resol_proto = (set_resol | set_prot) - set_protocolos_comuns # Protocolos que aparecem em Protocolos e Resoluções e não aparece em Decisões
len(set_resol_proto)

1293

In [25]:
# Verifica quantos protocolos foram removidos com base no texto da decisão (não foi aprovado nem desaprovado)
len(df_decis_removidas[df_decis_removidas['Processo'].isin(set_resol_proto)])

638

In [26]:
set_resol_proto = set_resol_proto - set(df_decis_removidas['Processo']) # Retirados os protocolos removidos com base no texto da decisão (não foi aprovado nem desaprovado)
len(set_resol_proto)

655

In [27]:
print(df_prot[df_prot['Nº Protocolo'].isin(set_resol_proto)][['Nº Protocolo','Informações Complementares']].to_markdown())

|      | Nº Protocolo    | Informações Complementares                                                                                                                                                                        |
|-----:|:----------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|    1 | TCE/000655/2001 | nan                                                                                                                                                                                               |
|    2 | TCE/000212/2002 | FUNDAÇÃO DE NEROLOGIA E NEUROCIRURGIA-INSTITUTO DO CEREBRO;Processo apensado ao processo TCE/000253/2002 em 28/04/03 11:53:42;Processo anexo ao processo TCE/000253/2002 em 20/03/2013 11:40:58   |
|    3 | TCE/000215/2002 | Processo apensado ao processo TCE/000253/2002 em 28/3/2006 17:06:42;Processo anex

Os casos avaliados em uma amostra selecionada identificou apenas situações em que o protocolo havia sido apensado a outro processo.
Todos os casos serão descartados.

Registro do funcionamento do ProInfo.<br>

Vinculação são os processos e documentos associados aos arquivo em questão.<br>
Referencia acontece quando um processo foi associado a outro <br>

Considerando que o Processo A foi apensado ao processo B e este ao processo C então:

Situação do Processo A:
- Vinculados: nenhum
- Referenciados: Processo B

Situação do Processo B:
- Vinculados: Processo A
- Referenciados: Processo C

Situação do Processo C:
- Vinculados: Processo B e Processo A
- Referenciados: nenhum

In [28]:
# Descarta todos os protocolos descasados do arquivo de decisões.
df_prot = df_prot[df_prot['Nº Protocolo'].isin(set_protocolos_comuns)]
df_resol = df_resol[df_resol['Nº Protocolo'].isin(set_protocolos_comuns)]
df_decis = df_decis[df_decis['Processo'].isin(set_protocolos_comuns)]

In [29]:
set_decis = set(df_decis['Processo']) 
set_resol = set(df_resol['Nº Protocolo'])
set_prot  = set(df_prot['Nº Protocolo'])
set_protocolos_comuns = set_decis & set_resol & set_prot
print(f"Qtde de Protocolos no arquivo de Decisões  = {len(set_decis)}, {len(df_decis)}")
print(f"Qtde de Protocolos no arquivo de Resoluções = {len(set_resol)}, {len(df_resol)}")
print(f"Qtde de Protocolos no arquivo de Protocolos = {len(set_prot)}, {len(df_prot)}")
print(f"Qtde de Protocolos que aparecem nos 3 arquivos = {len(set_protocolos_comuns)}, {len(set_protocolos_comuns)}")

Qtde de Protocolos no arquivo de Decisões  = 2525, 2525
Qtde de Protocolos no arquivo de Resoluções = 2525, 2525
Qtde de Protocolos no arquivo de Protocolos = 2525, 2525
Qtde de Protocolos que aparecem nos 3 arquivos = 2525, 2525


In [30]:
df_prot.to_excel(path_produtos+'01 - ProInfo - Lista Protocolos v1_0.xlsx')
df_resol.to_excel(path_produtos+'01 - ProInfo - Lista de Resoluções v1_0.xlsx')
df_decis.to_excel(path_produtos+'01 - ProInfo - Lista de Decisões v1_0.xlsx')

# Gera um arquivo unificado com os atributos de interesse.

In [31]:
#path_produtos = 'Dados\Produtos\\'
df_prot = pd.read_excel(path_produtos+'01 - ProInfo - Lista Protocolos v1_0.xlsx', index_col=0)
df_resol = pd.read_excel(path_produtos+'01 - ProInfo - Lista de Resoluções v1_0.xlsx', index_col=0)
df_decis = pd.read_excel(path_produtos+'01 - ProInfo - Lista de Decisões v1_0.xlsx', index_col=0)


In [32]:
# Cria arquivo df_proinfo com as informações do ProInfo sobre os processos.
df_decis = df_decis[['Colegiado', 'Número', 'Ano', 'Processo',
                    'Natureza', 'Tipo de julgamento', 'Data da sessão',
                    'Relator', 'Exercício']]
df_decis.rename(columns={'Processo': 'Protocolo'}, inplace=True)
df_prot.rename(columns={'Nº Protocolo': 'Protocolo'}, inplace=True)
df_proinfo = df_decis.merge(df_prot[['Protocolo','Situação', 'Envolvido Pessoa Física', 'Envolvido Pessoa Jurídica', 'Nº de Origem']], 
               how='left', on='Protocolo')

df_proinfo.to_excel(path_produtos+'01 - ProInfo - Lista Consolidada v1_0.xlsx')

In [None]:
# Arquivo testado em 05/03/2025. Com alterações na WEB. Alterado. Mais ou menos teste