# Pedidos de LAI de 2015 a 2021

Há duas bases de dados sobre pedidos de LAI disponibilizadas pela CGU:

1. A primeira contém os metadados das solicitações, mas não contém detalhes do pedido e da resposta da solicitação. Contém dados desde 2012 e está disponível no endereço https://falabr.cgu.gov.br/publico/DownloadDados/DownloadDadosLai.aspx .


2. A segunda base, além dos metadados, contém também a descrição das solicitações e das respostas. Por isso, é uma base já filtrada para desconsiderar as solicitações em que o órgão considera que o pedido contém informações pessoais. Essa base está disponível em http://www.consultaesic.cgu.gov.br/busca/_layouts/15/DownloadPedidos/DownloadDados.aspx .


As bases estão separadas por ano. O intuito desse caderno é apenas agregar os dataframes em um único arquivo para facilitar a análise. Além disso, renomeia as colunas de acordo com  dos anos de 2015 a 2021 e gera um único arquivo csv com as colunas nomeadas de acordo com o dicionário de dados.

In [1]:
import pandas as pd

def carrega_dados_lai(nome_arquivo_base, ano, nome_colunas):
    df = pd.read_csv(f'{nome_arquivo_base}{ano}.csv', encoding="utf-16", sep=';', header=None)
    df.columns = nome_colunas
    return df

def unifica_pedidos_lai(nome_arquivo_base, anos, nome_colunas, nome_arquivo_resultante):
    df_agrupado = pd.DataFrame(columns=nome_colunas)
    for ano in anos:
        df = carrega_dados_lai(nome_arquivo_base, ano, nome_colunas)
        df_agrupado = pd.concat([df_agrupado, df])

    df_agrupado.to_csv(f'{nome_arquivo_resultante}.csv', encoding='utf-16', sep=';', index=False)


def gera_base_unificada_filtrada():
    nome_arquivo_base = './dados/base_filtrada_com_pedido_e_resposta/20220609_Pedidos_csv_'
    nome_arquivo_resultante = './dados/base_filtrada_com_pedido_e_resposta/pedidos_lai_com_solicitacao_e_resposta_2015_a_2022'
    anos = range(2015, 2023)
    nome_colunas = ["id_pedido", "protocolo_pedido", "esfera", "orgao_destinatario",
                   "situacao", "data_registro", "resumo_solicitacao", 
                   "detalhamento_solicitacao", "prazo_atendimento", "foi_prorrogado", 
                   "foi_reencaminhado", "forma_resposta", "origem_solicitacao", 
                   "id_solicitante", "assunto_pedido", "sub_assunto_pedido",
                   "tag", "data_resposta", "resposta", "decisao", "especificacao_decisao"]
    unifica_pedidos_lai(nome_arquivo_base, anos, nome_colunas, nome_arquivo_resultante)
    
def gera_base_unificada_apenas_metadados():
    nome_arquivo_base = './dados/base_completa_sem_pedido_e_resposta/20220610_Pedidos_csv_'
    nome_arquivo_resultante = './dados/base_completa_sem_pedido_e_resposta/pedidos_lai_metadados_2012_a_2022'
    anos = range(2012, 2023)
    nome_colunas = ["id_pedido", "protocolo_pedido", "esfera", "uf", "municipio", 
                    "orgao_destinatario", "situacao", "data_registro", "prazo_atendimento", 
                   "foi_prorrogado", "foi_reencaminhado", "forma_resposta", "origem_solicitacao", 
                   "id_solicitante", "assunto_pedido", "sub_assunto_pedido",
                   "tag", "data_resposta", "decisao", "especificacao_decisao"]
    unifica_pedidos_lai(nome_arquivo_base, anos, nome_colunas, nome_arquivo_resultante)
    
gera_base_unificada_filtrada()
gera_base_unificada_apenas_metadados()

Para facilitar a visualização do dicionário de dados para a base de pedidos, replico aqui o dicionário de dados das duas bases:

1. Base completa, apenas metadados: https://falabr.cgu.gov.br/publico/DownloadDados/Pedidos-Formato.txt

------------------------------
-- CAMPOS: PEDIDOS
------------------------------
- IdPedido - inteiro: identificador único do pedido (não mostrado no sistema);
- ProtocoloPedido - texto(17): número do protocolo do pedido;
- Esfera - texto(30): esfera do órgão destinatário do pedido;
- UF - texto(2): Sigla da UF do pedido quando não federal; 
- Municipio - texto(200): Nome do município do pedido quando não federal;
- OrgaoDestinatario  - texto(250): nome do órgão destinatário do pedido;
- Situacao - texto(200): descrição da situação do pedido;
- DataRegistro - Data DD/MM/AAAA HH:MM:SS : data de abertura do pedido;
- PrazoAtendimento - Data DD/MM/AAAA HH:MM:ss : data limite para atendimento ao pedido;
- FoiProrrogado - texto(3) "Sim" ou "Não" : informa se houve prorrogação do prazo do pedido;
- FoiReencaminhado - texto(3) "Sim" ou "Não": informa se o pedido foi reencaminhado;
- FormaResposta - texto(200): tipo de resposta escolhida pelo solicitante na abertura do pedido;
- OrigemSolicitacao - texto(50): informa se o pedido foi aberto em um Balcão SIC ou pela Internet;
- IdSolicitante - inteiro: identificador único do solicitante (não mostrado no sistema);
- AssuntoPedido - texto(200) : assunto do pedido atribuído pel SIC;
- SubAssuntoPedido - texto(200) : subassunto do pedido atribuída pelo SIC;
- Tag - texto(1024): as tags são marcadores no pedido para realizar classificações que não estão em assuntos/ subassuntos;
- DataResposta - Data DD/MM/AAAA HH:MM:SS : data da resposta ao pedido (campo em branco para pedidos que ainda estejam na situação "Em Tramitação");
- Decisao - texto(100) : tipo resposta dada ao pedido (campo em branco para pedidos que ainda estejam na situação "Em Tramitação");
- EspecificacaoDecisao - texto(200): subtipo da resposta dada ao pedido (campo em branco para pedidos que ainda estejam na situação "Em Tramitação");


2. Base filtrada: http://www.consultaesic.cgu.gov.br/arquivosRelatorios/PedidosRespostas/Dicionario-Dados-Exportacao.txt

------------------------------
-- CAMPOS: PEDIDOS
------------------------------
- IdPedido - inteiro: identificador único do pedido (não mostrado no sistema);
- ProtocoloPedido - texto(17): número do protocolo do pedido;
- Esfera - texto(30): esfera do órgão destinatário do pedido; 
- OrgaoDestinatario  - texto(250): nome do órgão destinatário do pedido;
- Situacao - texto(200): descrição da situação do pedido;
- DataRegistro - Data DD/MM/AAAA HH:MM:SS : data de abertura do pedido;
- ResumoSolicitacao - texto(255): resumo do pedido;
- DetalhamentoSolicitacao - texto(2048): detalhamento do pedido;
- PrazoAtendimento - Data DD/MM/AAAA HH:MM:ss : data limite para atendimento ao pedido;
- FoiProrrogado - texto(3) "Sim" ou "Não" : informa se houve prorrogação do prazo do pedido;
- FoiReencaminhado - texto(3) "Sim" ou "Não": informa se o pedido foi reencaminhado;
- FormaResposta - texto(200): tipo de resposta escolhida pelo solicitante na abertura do pedido;
- OrigemSolicitacao - texto(50): informa se o pedido foi aberto em um Balcão SIC ou pela Internet;
- IdSolicitante - inteiro: identificador único do solicitante (não mostrado no sistema);
- AssuntoPedido - texto(200) : assunto do pedido atribuído pel SIC;
- SubAssuntoPedido - texto(200) : subassunto do pedido atribuída pelo SIC;
- Tag - texto(1024): as tags são marcadores no pedido para realizar classificações que não estão em assuntos/ subassuntos;
- DataResposta - Data DD/MM/AAAA HH:MM:SS : data da resposta ao pedido (campo em branco para pedidos que ainda estejam na situação "Em Tramitação");
- Resposta - texto(8000): resposta ao pedido;
- Decisao - texto(100) : tipo resposta dada ao pedido (campo em branco para pedidos que ainda estejam na situação "Em Tramitação");
- EspecificacaoDecisao - texto(200): subtipo da resposta dada ao pedido (campo em branco para pedidos que ainda estejam na situação "Em Tramitação");