# Análise dos relatórios de auditoria

#### UFPB - Universidade Federal da Paraíba
#### Gestão Pública
Autor: Bianca Batista Fagundes  
bianca.fagundes@academico.ufpb.br

### Primeiramente é importado o .CSV referente à tabela com os dados dos critérios de auditoria

Serão realizadas diversas análises com a finalidade de representar melhor os dados e responder às seguintes questões:

- Quantos e qual a porcentagem dos casos por unidade da federação?
- Quantos e qual a porcentagem dos casos por tipo do relatório?
- Quantos e qual a porcentagem dos casos pelo ano de publicação do relatório?
- Qual a porcentagem dos critérios por unidade da federação?
- Qual a porcentagem dos critérios por tipo do relatório?
- Qual a porcentagem dos critérios por ano de publicação do relatório?

In [4]:
import pandas as pd
import seaborn as sns
sns.set(style="white")
import numpy as np
import matplotlib.pyplot as plt

#Realizo o tratamento da tabela para substituir todos os valores diferentes de 0 por 1, já que alguns dos valores 1 continham comentários ao lado e precisam ser substituídos apenas pelo valor 1
tabela_relatorios = pd.read_csv("relatorios.csv", keep_default_na=False ,sep = ",", header = 0, encoding = 'utf8')
tabela_relatorios.loc[tabela_relatorios["a. Questões de Auditoria"] != "0", "a. Questões de Auditoria"] = 1
tabela_relatorios.loc[tabela_relatorios["b. Subquestões de Auditoria"] != "0", "b. Subquestões de Auditoria"] = 1
tabela_relatorios.loc[tabela_relatorios["c. Descrição sumária"] != "0", "c. Descrição sumária"] = 1
tabela_relatorios.loc[tabela_relatorios["d. Critério (O que deveria ser)"] != "0", "d. Critério (O que deveria ser)"] = 1
tabela_relatorios.loc[tabela_relatorios["e. Condição ou situação encontrada (O que é) [achados]"] != "0", "e. Condição ou situação encontrada (O que é) [achados]"] = 1
tabela_relatorios.loc[tabela_relatorios["f. Evidências"] != "0", "f. Evidências"] = 1
tabela_relatorios.loc[tabela_relatorios["g. Informação extraída das evidências"] != "0", "g. Informação extraída das evidências"] = 1
tabela_relatorios.loc[tabela_relatorios["h. Causas"] != "0", "h. Causas"] = 1
tabela_relatorios.loc[tabela_relatorios["i. Efeitos"] != "0", "i. Efeitos"] = 1
tabela_relatorios.loc[tabela_relatorios["j. Boas Práticas"] != "0", "j. Boas Práticas"] = 1
tabela_relatorios.loc[tabela_relatorios["k. Recomendações"] != "0", "k. Recomendações"] = 1
tabela_relatorios.loc[tabela_relatorios["l. Benefícios esperados"] != "0", "l. Benefícios esperados"] = 1
tabela_relatorios.loc[tabela_relatorios["m. Manifestação"] != "0", "m. Manifestação"] = 1
tabela_relatorios.loc[tabela_relatorios["n. Conclusões"] != "0", "n. Conclusões"] = 1

tabela_relatorios.loc[tabela_relatorios["n. Conclusões"] != "0", "n. Conclusões"] = 1

#Mostro as primeiras 10 linhas da tabela para saber se ficou tudo OK
display(tabela_relatorios.head(10))

Unnamed: 0,Titulo,Serviço,Grupo,Ação,Avaliação,Publicação,Localidade,Matriz de Achados?,a. Questões de Auditoria,b. Subquestões de Auditoria,...,e. Condição ou situação encontrada (O que é) [achados],f. Evidências,g. Informação extraída das evidências,h. Causas,i. Efeitos,j. Boas Práticas,k. Recomendações,l. Benefícios esperados,m. Manifestação,n. Conclusões
0,Relatório de Auditoria nº 201700011 - Universi...,Auditoria Interna Governamental - Avaliação,Seleção baseada em riscos,Auditoria interna governamental,Não,3/1/2018,Recife/PE,0,0,0,...,1,0,0,1,0,0,1,0,0,1
1,Relatório de Auditoria nº 201701628 - Fundação...,Auditoria Interna Governamental - Avaliação,Seleção baseada em riscos,Auditoria interna governamental,Não,1/3/2018,Palmas/TO,0,0,0,...,1,0,0,0,0,0,0,0,0,1
2,Relatório de Auditoria Anual de Contas nº 2017...,Auditoria Interna Governamental - Avaliação,Avaliação da Prestação Anual de Contas,Auditoria interna governamental,Não,1/3/2018,Lavras/MG,0,1,0,...,1,0,0,1,0,0,1,0,1,1
3,Relatório de Auditoria nº 201700080 - Universi...,Auditoria Interna Governamental - Avaliação,Seleção baseada em riscos,Auditoria interna governamental,Não,1/3/2018,Diamantina/MG,0,0,0,...,1,0,0,0,0,0,0,0,0,1
4,Relatório nº 201603422 - Universidade Federal ...,Auditoria Interna Governamental - Avaliação,Seleção baseada em riscos,Auditoria interna governamental,Não,1/3/2018,Porto Alegre/RS,0,1,0,...,1,0,0,1,0,0,1,0,1,1
5,Relatório de Avaliação dos Resultados da Gestã...,Auditoria Interna Governamental - Avaliação,Seleção baseada em riscos,Auditoria interna governamental,Não,1/3/2018,Ouro Preto/MG,0,1,0,...,1,0,0,1,0,0,1,0,1,1
6,Relatório de Avaliação dos Resultados da Gestã...,Auditoria Interna Governamental - Avaliação,Seleção baseada em riscos,Auditoria interna governamental,Não,1/3/2018,Alfenas/MG,0,1,0,...,1,0,0,0,0,0,1,0,1,1
7,Relatório de Avaliação dos Resultados da Gestã...,Auditoria Interna Governamental - Avaliação,Seleção baseada em riscos,Auditoria interna governamental,Não,1/3/2018,Juiz de Fora/MG,0,1,0,...,1,0,0,1,0,0,1,0,1,1
8,Relatório de Avaliação dos Resultados da Gestã...,Auditoria Interna Governamental - Avaliação,Seleção baseada em riscos,Auditoria interna governamental,Não,1/3/2018,Diamantina/MG,0,1,0,...,1,0,0,1,0,0,1,0,1,1
9,Relatório de Auditoria nº 201700872 - Institut...,Auditoria Interna Governamental - Avaliação,Avaliação da Prestação Anual de Contas,Auditoria interna governamental,Não,1/4/2018,João Pessoa/PB,0,0,0,...,1,0,0,1,0,0,1,1,1,1


### 1. Casos por Unidade da Federação

In [5]:
#Tabela apenas com os relatórios do Acre
tabela_acre_bool = tabela_relatorios['Localidade'].str.contains("AC", case=True, na=False) #booleano categoriza apenas quando é do Acre
tabela_acre = tabela_relatorios[tabela_acre_bool]
tabela_acre_count = len(tabela_acre.index)
#display(tabela_acre_count)
#display(tabela_acre.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Alagoas
tabela_alagoas_bool = tabela_relatorios['Localidade'].str.contains("AL", case=True, na=False) #booleano categoriza apenas quando é do Alagoas
tabela_alagoas = tabela_relatorios[tabela_alagoas_bool]
tabela_alagoas_count = len(tabela_alagoas.index)
#display(tabela_alagoas_count)
#display(tabela_alagoas.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Amazonas
tabela_amazonas_bool = tabela_relatorios['Localidade'].str.contains("AM", case=True, na=False) #booleano categoriza apenas quando é do Amazonas
tabela_amazonas = tabela_relatorios[tabela_amazonas_bool]
tabela_amazonas_count = len(tabela_amazonas.index)
#display(tabela_amazonas_count)
#display(tabela_amazonas.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Amapá
tabela_amapa_bool = tabela_relatorios['Localidade'].str.contains("AP", case=True, na=False) #booleano categoriza apenas quando é do Amapá
tabela_amapa = tabela_relatorios[tabela_amapa_bool]
tabela_amapa_count = len(tabela_amapa.index)
#display(tabela_amapa_count)
#display(tabela_amapa.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios da Bahia
tabela_bahia_bool = tabela_relatorios['Localidade'].str.contains("BA", case=True, na=False) #booleano categoriza apenas quando é da Bahia
tabela_bahia = tabela_relatorios[tabela_bahia_bool]
tabela_bahia_count = len(tabela_bahia.index)
#display(tabela_bahia_count)
#display(tabela_bahia.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Ceará
tabela_ceara_bool = tabela_relatorios['Localidade'].str.contains("CE", case=True, na=False) #booleano categoriza apenas quando é do Ceará
tabela_ceara = tabela_relatorios[tabela_ceara_bool]
tabela_ceara_count = len(tabela_ceara.index)
#display(tabela_ceara_count)
#display(tabela_ceara.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Distrito Federal
tabela_df_bool = tabela_relatorios['Localidade'].str.contains("DF", case=True, na=False) #booleano categoriza apenas quando é do Distrito Federal
tabela_df = tabela_relatorios[tabela_df_bool]
tabela_df_count = len(tabela_df.index)
#display(tabela_df_count)
#display(tabela_df.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Espírito Santo
tabela_es_bool = tabela_relatorios['Localidade'].str.contains("ES", case=True, na=False) #booleano categoriza apenas quando é do Espírito Santo
tabela_es = tabela_relatorios[tabela_es_bool]
tabela_es_count = len(tabela_es.index)
#display(tabela_es_count)
#display(tabela_es.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Goiás
tabela_goias_bool = tabela_relatorios['Localidade'].str.contains("GO", case=True, na=False) #booleano categoriza apenas quando é de Goiás
tabela_goias = tabela_relatorios[tabela_goias_bool]
tabela_goias_count = len(tabela_goias.index)
#display(tabela_goias_count)
#display(tabela_goias.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Maranhão
tabela_maranhao_bool = tabela_relatorios['Localidade'].str.contains("MA", case=True, na=False) #booleano categoriza apenas quando é do Maranhão
tabela_maranhao = tabela_relatorios[tabela_maranhao_bool]
tabela_maranhao_count = len(tabela_maranhao.index)
#display(tabela_maranhao_count)
#display(tabela_maranhao.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Minas Gerais
tabela_mg_bool = tabela_relatorios['Localidade'].str.contains("MG", case=True, na=False) #booleano categoriza apenas quando é de Minas Gerais
tabela_mg = tabela_relatorios[tabela_mg_bool]
tabela_mg_count = len(tabela_mg.index)
#display(tabela_mg_count)
#display(tabela_mg.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Mato Grosso do Sul
tabela_ms_bool = tabela_relatorios['Localidade'].str.contains("MS", case=True, na=False) #booleano categoriza apenas quando é do Mato Grosso do Sul
tabela_ms = tabela_relatorios[tabela_ms_bool]
tabela_ms_count = len(tabela_ms.index)
#display(tabela_ms_count)
#display(tabela_ms.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Mato Grosso
tabela_mt_bool = tabela_relatorios['Localidade'].str.contains("MT", case=True, na=False) #booleano categoriza apenas quando é do Mato Grosso
tabela_mt = tabela_relatorios[tabela_mt_bool]
tabela_mt_count = len(tabela_mt.index)
#display(tabela_mt_count)
#display(tabela_mt.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Pará
tabela_para_bool = tabela_relatorios['Localidade'].str.contains("PA", case=True, na=False) #booleano categoriza apenas quando é do Pará
tabela_para = tabela_relatorios[tabela_para_bool]
tabela_para_count = len(tabela_para.index)
#display(tabela_para_count)
#display(tabela_para.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios da Paraíba
tabela_paraiba_bool = tabela_relatorios['Localidade'].str.contains("PB", case=True, na=False) #booleano categoriza apenas quando é da Paraíba
tabela_paraiba = tabela_relatorios[tabela_paraiba_bool]
tabela_paraiba_count = len(tabela_paraiba.index)
#display(tabela_paraiba_count)
#display(tabela_paraiba.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Pernambuco
tabela_pernambuco_bool = tabela_relatorios['Localidade'].str.contains("PE", case=True, na=False) #booleano categoriza apenas quando é de Pernambuco
tabela_pernambuco = tabela_relatorios[tabela_pernambuco_bool]
tabela_pernambuco_count = len(tabela_pernambuco.index)
#display(tabela_pernambuco_count)
#display(tabela_pernambuco.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Piauí
tabela_piaui_bool = tabela_relatorios['Localidade'].str.contains("PI", case=True, na=False) #booleano categoriza apenas quando é do Piauí
tabela_piaui = tabela_relatorios[tabela_piaui_bool]
tabela_piaui_count = len(tabela_piaui.index)
#display(tabela_piaui_count)
#display(tabela_piaui.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Paraná
tabela_parana_bool = tabela_relatorios['Localidade'].str.contains("PR", case=True, na=False) #booleano categoriza apenas quando é do Paraná
tabela_parana = tabela_relatorios[tabela_parana_bool]
tabela_parana_count = len(tabela_parana.index)
#display(tabela_parana_count)
#display(tabela_parana.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Rio de Janeiro
tabela_rj_bool = tabela_relatorios['Localidade'].str.contains("RJ", case=True, na=False) #booleano categoriza apenas quando é do Rio de Janeiro
tabela_rj = tabela_relatorios[tabela_rj_bool]
tabela_rj_count = len(tabela_rj.index)
#display(tabela_rj_count)
#display(tabela_rj.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Rio Grande do Norte
tabela_rn_bool = tabela_relatorios['Localidade'].str.contains("RN", case=True, na=False) #booleano categoriza apenas quando é do Rio Grande do Norte
tabela_rn = tabela_relatorios[tabela_rn_bool]
tabela_rn_count = len(tabela_rn.index)
#display(tabela_rn_count)
#display(tabela_rn.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do Rio Grande do Sul
tabela_rs_bool = tabela_relatorios['Localidade'].str.contains("RS", case=True, na=False) #booleano categoriza apenas quando é do Rio Grande do Sul
tabela_rs = tabela_relatorios[tabela_rs_bool]
tabela_rs_count = len(tabela_rs.index)
#display(tabela_rs_count)
#display(tabela_rs.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Rondônia
tabela_rondonia_bool = tabela_relatorios['Localidade'].str.contains("RO", case=True, na=False) #booleano categoriza apenas quando é de Rondônia
tabela_rondonia = tabela_relatorios[tabela_rondonia_bool]
tabela_rondonia_count = len(tabela_rondonia.index)
#display(tabela_rondonia_count)
#display(tabela_rondonia.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Roraima
tabela_roraima_bool = tabela_relatorios['Localidade'].str.contains("RR", case=True, na=False) #booleano categoriza apenas quando é de Roraima
tabela_roraima = tabela_relatorios[tabela_roraima_bool]
tabela_roraima_count = len(tabela_roraima.index)
#display(tabela_roraima_count)
#display(tabela_roraima.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Santa Catarina
tabela_sc_bool = tabela_relatorios['Localidade'].str.contains("SC", case=True, na=False) #booleano categoriza apenas quando é de Santa Catarina
tabela_sc = tabela_relatorios[tabela_sc_bool]
tabela_sc_count = len(tabela_sc.index)
#display(tabela_sc_count)
#display(tabela_sc.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Sergipe
tabela_sergipe_bool = tabela_relatorios['Localidade'].str.contains("SE", case=True, na=False) #booleano categoriza apenas quando é de Sergipe
tabela_sergipe = tabela_relatorios[tabela_sergipe_bool]
tabela_sergipe_count = len(tabela_sergipe.index)
#display(tabela_sergipe_count)
#display(tabela_sergipe.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de São Paulo
tabela_sp_bool = tabela_relatorios['Localidade'].str.contains("SP", case=True, na=False) #booleano categoriza apenas quando é de São Paulo
tabela_sp = tabela_relatorios[tabela_sp_bool]
tabela_sp_count = len(tabela_sp.index)
#display(tabela_sp_count)
#display(tabela_sp.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios de Tocantins
tabela_tocantins_bool = tabela_relatorios['Localidade'].str.contains("TO", case=True, na=False) #booleano categoriza apenas quando é de Tocantins
tabela_tocantins = tabela_relatorios[tabela_tocantins_bool]
tabela_tocantins_count = len(tabela_tocantins.index)
#display(tabela_tocantins_count)
#display(tabela_tocantins.head(10)) #Exibe amostra da tabela para saber se está tudo ok

qtd_total_relatórios = len(tabela_relatorios.index) #Número total de relatórios
# Lista contendo a lista de estados
array_estados = ["Acre", "Alagoas", "Amazonas", "Amapá", "Bahia", "Ceará", "Distrito Federal", "Espírito Santo", "Goiás", "Maranhão", "Minas Gerais", "Mato Grosso do Sul", "Mato Grosso", "Pará", "Paraíba", "Pernambuco", "Piauí", "Paraná", "Rio de Janeiro", "Rio Grande do Norte", "Rio Grande do Sul", "Rondônia", "Roraima", "Santa Catarina", "Sergipe", "São Paulo", "Tocantins"]
#Lista contendo a quantidade de relatórios por estado
array_quantidades_estados = [tabela_acre_count, tabela_alagoas_count, tabela_amazonas_count, tabela_amapa_count, tabela_bahia_count, tabela_ceara_count, tabela_df_count, tabela_es_count, tabela_goias_count, tabela_maranhao_count, tabela_mg_count, tabela_ms_count, tabela_mt_count, tabela_para_count, tabela_paraiba_count, tabela_pernambuco_count, tabela_piaui_count, tabela_parana_count, tabela_rj_count, tabela_rn_count, tabela_rs_count, tabela_rondonia_count, tabela_roraima_count, tabela_sc_count, tabela_sergipe_count, tabela_sp_count, tabela_tocantins_count]
#Lista contendo a porcentagem de relatórios por estado
array_porcentagens_estados = [round(((tabela_acre_count/qtd_total_relatórios)*100), 2), round(((tabela_alagoas_count/qtd_total_relatórios)*100), 2), round(((tabela_amazonas_count/qtd_total_relatórios)*100), 2), round(((tabela_amapa_count/qtd_total_relatórios)*100), 2), round(((tabela_bahia_count/qtd_total_relatórios)*100), 2), round(((tabela_ceara_count/qtd_total_relatórios)*100), 2), round(((tabela_df_count/qtd_total_relatórios)*100), 2), round(((tabela_es_count/qtd_total_relatórios)*100), 2), round(((tabela_goias_count/qtd_total_relatórios)*100),2), round(((tabela_maranhao_count/qtd_total_relatórios)*100),2), round(((tabela_mg_count/qtd_total_relatórios)*100), 2), round(((tabela_ms_count/qtd_total_relatórios)*100), 2), round(((tabela_mt_count/qtd_total_relatórios)*100), 2), round(((tabela_para_count/qtd_total_relatórios)*100), 2), round(((tabela_paraiba_count/qtd_total_relatórios)*100), 2), round(((tabela_pernambuco_count/qtd_total_relatórios)*100), 2), round(((tabela_piaui_count/qtd_total_relatórios)*100), 2), round(((tabela_parana_count/qtd_total_relatórios)*100), 2), round(((tabela_rj_count/qtd_total_relatórios)*100), 2), round(((tabela_rn_count/qtd_total_relatórios)*100), 2), round(((tabela_rs_count/qtd_total_relatórios)*100), 2), round(((tabela_rondonia_count/qtd_total_relatórios)*100), 2), round(((tabela_roraima_count/qtd_total_relatórios)*100), 2), round(((tabela_sc_count/qtd_total_relatórios)*100), 2), round(((tabela_sergipe_count/qtd_total_relatórios)*100), 2), round(((tabela_sp_count/qtd_total_relatórios)*100), 2), round(((tabela_tocantins_count/qtd_total_relatórios)*100), 2)]

#Tabela que mostra a porcentagem de relatórios por estado e sua quantidade
tabela_porcentagem_estado = pd.DataFrame({'Estado': array_estados+["Total"], 'Quantidade de relatórios': array_quantidades_estados+[qtd_total_relatórios], 'Porcentagem (%)': array_porcentagens_estados+["100"]})

tabela_porcentagem_estado.to_excel('casos_por_estado.xlsx')

display(tabela_porcentagem_estado)

Unnamed: 0,Estado,Quantidade de relatórios,Porcentagem (%)
0,Acre,44,1.06
1,Alagoas,77,1.85
2,Amazonas,54,1.3
3,Amapá,26,0.62
4,Bahia,181,4.34
5,Ceará,115,2.76
6,Distrito Federal,714,17.13
7,Espírito Santo,152,3.65
8,Goiás,216,5.18
9,Maranhão,44,1.06


### 2. Casos por Tipo de Relatório:

In [6]:
#Tabela apenas com os relatórios do tipo Avaliação
tabela_relatorios_avaliacao_bool = tabela_relatorios['Serviço'].str.contains("Avaliação", case=False, na=False) #booleano categoriza apenas quando é do tipo Avaliação
tabela_relatorios_avaliacao = tabela_relatorios[tabela_relatorios_avaliacao_bool]
tabela_relatorios_avaliacao_count = len(tabela_relatorios_avaliacao.index)
#display(tabela_relatorios_avaliacao_count)
#display(tabela_relatorios_avaliacao.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do tipo Consultoria
tabela_relatorios_consultoria_bool = tabela_relatorios['Serviço'].str.contains("Consultoria", case=False, na=False) #booleano categoriza apenas quando é do tipo Consultoria
tabela_relatorios_consultoria = tabela_relatorios[tabela_relatorios_consultoria_bool]
tabela_relatorios_consultoria_count = len(tabela_relatorios_consultoria.index)
#display(tabela_relatorios_consultoria_count)
#display(tabela_relatorios_consultoria.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela apenas com os relatórios do tipo Apuração
tabela_relatorios_apuracao_bool = tabela_relatorios['Serviço'].str.contains("Apuração", case=False, na=False) #booleano categoriza apenas quando é do tipo Apuração
tabela_relatorios_apuracao = tabela_relatorios[tabela_relatorios_apuracao_bool]
tabela_relatorios_apuracao_count = len(tabela_relatorios_apuracao.index)
#display(tabela_relatorios_apuracao_count)
#display(tabela_relatorios_apuracao.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Tabela com os relatórios que não se aplicam a nenhum dos tipos
tabela_relatorios_nao_se_aplicam = pd.concat([tabela_relatorios,tabela_relatorios_avaliacao, tabela_relatorios_consultoria, tabela_relatorios_apuracao]).drop_duplicates(keep=False)
tabela_relatorios_nao_se_aplicam_count = len(tabela_relatorios_nao_se_aplicam.index)
#display(tabela_relatorios_nao_se_aplicam_count)
#display(tabela_relatorios_nao_se_aplicam.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Quantidade de relatórios por tipo, respectivamente
array_quantidades_tipos = [tabela_relatorios_avaliacao_count, tabela_relatorios_consultoria_count, tabela_relatorios_apuracao_count, tabela_relatorios_nao_se_aplicam_count]
#Tipos respectivos de relatório
array_tipo_relatorio = ["Avaliação", "Consultoria", "Apuração", "Não se aplica"]
#Porcentagens por tipo de relatório
array_porcentagens_tipos_relatorios = [round(((tabela_relatorios_avaliacao_count/qtd_total_relatórios)*100), 2), round(((tabela_relatorios_consultoria_count/qtd_total_relatórios)*100), 2), round(((tabela_relatorios_apuracao_count/qtd_total_relatórios)*100), 2), round(((tabela_relatorios_nao_se_aplicam_count/qtd_total_relatórios)*100), 2)]

#Tabela com as quantidades e tipos de relatórios
tabela_tipo_relatorio = pd.DataFrame({'Tipo do Relatório': array_tipo_relatorio, 'Quantidade de relatórios': array_quantidades_tipos, 'Porcentagem (%)': array_porcentagens_tipos_relatorios})

tabela_tipo_relatorio.to_excel('casos_por_tipo.xlsx')

#Desenha a tabela
display(tabela_tipo_relatorio)


Unnamed: 0,Tipo do Relatório,Quantidade de relatórios,Porcentagem (%)
0,Avaliação,3468,83.19
1,Consultoria,4,0.1
2,Apuração,685,16.43
3,Não se aplica,12,0.29


### 3. Casos por Ano do Relatório:

In [7]:
tabela_relatorios_2018_bool = tabela_relatorios['Publicação'].str.contains("2018", case=False, na=False) #booleano categoriza apenas quando é do ano de 2018
tabela_relatorios_2018 = tabela_relatorios[tabela_relatorios_2018_bool]
tabela_relatorios_2018_count = len(tabela_relatorios_2018.index)
#display(tabela_relatorios_avaliacao_count)
#display(tabela_relatorios_avaliacao.head(10)) #Exibe amostra da tabela para saber se está tudo ok

tabela_relatorios_2019_bool = tabela_relatorios['Publicação'].str.contains("2019", case=False, na=False) #booleano categoriza apenas quando é do ano de 2019
tabela_relatorios_2019 = tabela_relatorios[tabela_relatorios_2019_bool]
tabela_relatorios_2019_count = len(tabela_relatorios_2019.index)
#display(tabela_relatorios_consultoria_count)
#display(tabela_relatorios_consultoria.head(10)) #Exibe amostra da tabela para saber se está tudo ok

tabela_relatorios_2020_bool = tabela_relatorios['Publicação'].str.contains("2020", case=False, na=False) #booleano categoriza apenas quando é do ano de 2020
tabela_relatorios_2020 = tabela_relatorios[tabela_relatorios_2020_bool]
tabela_relatorios_2020_count = len(tabela_relatorios_2020.index)
#display(tabela_relatorios_apuracao_count)
#display(tabela_relatorios_apuracao.head(10)) #Exibe amostra da tabela para saber se está tudo ok

tabela_relatorios_2021_bool = tabela_relatorios['Publicação'].str.contains("2021", case=False, na=False) #booleano categoriza apenas quando é do ano de 2021
tabela_relatorios_2021 = tabela_relatorios[tabela_relatorios_2021_bool]
tabela_relatorios_2021_count = len(tabela_relatorios_2021.index)
#display(tabela_relatorios_apuracao_count)
#display(tabela_relatorios_apuracao.head(10)) #Exibe amostra da tabela para saber se está tudo ok

#Quantidade de relatórios por ano, respectivamente
array_quantidades_anos = [tabela_relatorios_2018_count, tabela_relatorios_2019_count, tabela_relatorios_2020_count, tabela_relatorios_2021_count]
#Anos respectivos de relatório
array_ano_relatorio = ['2018', '2019', '2020', '2021']
#Porcentagens por ano de relatório
array_porcentagens_anos_relatorios = [round(((tabela_relatorios_2018_count/qtd_total_relatórios)*100), 2), round(((tabela_relatorios_2019_count/qtd_total_relatórios)*100), 2), round(((tabela_relatorios_2020_count/qtd_total_relatórios)*100), 2), round(((tabela_relatorios_2021_count/qtd_total_relatórios)*100), 2)]

#Tabela com as quantidades e anos de relatórios
tabela_ano_relatorio = pd.DataFrame({'Ano do relatório': array_ano_relatorio, 'Quantidade de relatórios': array_quantidades_anos, 'Porcentagem (%)': array_porcentagens_anos_relatorios})

tabela_ano_relatorio.to_excel('casos_por_ano.xlsx')

#Desenha a tabela
display(tabela_ano_relatorio)

Unnamed: 0,Ano do relatório,Quantidade de relatórios,Porcentagem (%)
0,2018,1872,44.9
1,2019,1260,30.22
2,2020,691,16.57
3,2021,343,8.23


### 4. Critérios por estado:

In [8]:
array_criterios = ["Matriz", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N"]

def porcentagem_criterios_estado(tabela_relatorios_estado):
    
    qtd_relatorios_estado = len(tabela_relatorios_estado.index)
    porcentagens_por_criterio = pd.Series(index=array_criterios, dtype='float64')
    
    #Quantidade do critério matriz de achados
    tabela_criterio_matriz_bool = tabela_relatorios_estado["Matriz de Achados?"]==1
    tabela_criterio_matriz = tabela_relatorios_estado[tabela_criterio_matriz_bool]
    criterio_matriz_count = len(tabela_criterio_matriz.index)
    porcentagem_criterio_matriz = round(((criterio_matriz_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["Matriz"] = porcentagem_criterio_matriz

    #Quantidade do critério questões auditoria
    tabela_criterio_questoes_auditoria_bool = tabela_relatorios_estado["a. Questões de Auditoria"]==1
    tabela_criterio_questoes_auditoria = tabela_relatorios_estado[tabela_criterio_questoes_auditoria_bool]
    criterio_questoes_auditoria_count = len(tabela_criterio_questoes_auditoria.index)
    porcentagem_criterio_questoes_auditoria = round(((criterio_questoes_auditoria_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["A"] = porcentagem_criterio_questoes_auditoria

    #Quantidade do critério subquestões auditoria
    tabela_criterio_subquestoes_auditoria_bool = tabela_relatorios_estado["b. Subquestões de Auditoria"]==1
    tabela_criterio_subquestoes_auditoria = tabela_relatorios_estado[tabela_criterio_subquestoes_auditoria_bool]
    criterio_subquestoes_auditoria_count = len(tabela_criterio_subquestoes_auditoria.index)
    porcentagem_criterio_subquestoes_auditoria = round(((criterio_subquestoes_auditoria_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["B"] = porcentagem_criterio_subquestoes_auditoria

    #Quantidade do critério c. Descrição sumária
    tabela_criterio_descricao_sumaria_bool = tabela_relatorios_estado["c. Descrição sumária"]==1
    tabela_criterio_descricao_sumaria = tabela_relatorios_estado[tabela_criterio_descricao_sumaria_bool]
    criterio_descricao_sumaria_count = len(tabela_criterio_descricao_sumaria.index)
    porcentagem_criterio_descricao_sumaria = round(((criterio_descricao_sumaria_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["C"] = porcentagem_criterio_descricao_sumaria

    #Quantidade do critério d. Critério (O que deveria ser)
    tabela_criterio_deveria_ser_bool = tabela_relatorios_estado["d. Critério (O que deveria ser)"]==1
    tabela_criterio_deveria_ser = tabela_relatorios_estado[tabela_criterio_deveria_ser_bool]
    criterio_deveria_ser_count = len(tabela_criterio_deveria_ser.index)
    porcentagem_criterio_deveria_ser = round(((criterio_deveria_ser_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["D"] = porcentagem_criterio_deveria_ser

    #Quantidade do critério e. Condição ou situação encontrada (O que é) [achados]
    tabela_criterio_achados_bool = tabela_relatorios_estado["e. Condição ou situação encontrada (O que é) [achados]"]==1
    tabela_criterio_achados = tabela_relatorios_estado[tabela_criterio_achados_bool]
    criterio_achados_count = len(tabela_criterio_achados.index)
    porcentagem_criterio_achados = round(((criterio_achados_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["E"] = porcentagem_criterio_achados

    #Quantidade do critério f. Evidências
    tabela_criterio_evidencias_bool = tabela_relatorios_estado["f. Evidências"]==1
    tabela_criterio_evidencias = tabela_relatorios_estado[tabela_criterio_evidencias_bool]
    criterio_evidencias_count = len(tabela_criterio_evidencias.index)
    porcentagem_criterio_evidencias = round(((criterio_evidencias_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["F"] = porcentagem_criterio_evidencias

    #Quantidade do critério g. Informação extraída das evidências
    tabela_criterio_info_evidencias_bool = tabela_relatorios_estado["g. Informação extraída das evidências"]==1
    tabela_criterio_info_evidencias = tabela_relatorios_estado[tabela_criterio_info_evidencias_bool]
    criterio_info_evidencias_count = len(tabela_criterio_info_evidencias.index)
    porcentagem_criterio_info_evidencias= round(((criterio_info_evidencias_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["G"] = porcentagem_criterio_info_evidencias
    
    #Quantidade do critério h. Causas
    tabela_criterio_causas_bool = tabela_relatorios_estado["h. Causas"]==1
    tabela_criterio_causas = tabela_relatorios_estado[tabela_criterio_causas_bool]
    criterio_causas_count = len(tabela_criterio_causas.index)
    porcentagem_criterio_causas = round(((criterio_causas_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["H"] = porcentagem_criterio_causas

    #Quantidade do critério i. Efeitos
    tabela_criterio_efeitos_bool = tabela_relatorios_estado["i. Efeitos"]==1
    tabela_criterio_efeitos = tabela_relatorios_estado[tabela_criterio_efeitos_bool]
    criterio_efeitos_count = len(tabela_criterio_efeitos.index)
    porcentagem_criterio_efeitos = round(((criterio_efeitos_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["I"] = porcentagem_criterio_efeitos

    #Quantidade do critério j. Boas Práticas
    tabela_criterio_boas_praticas_bool = tabela_relatorios_estado["j. Boas Práticas"]==1
    tabela_criterio_boas_praticas = tabela_relatorios_estado[tabela_criterio_boas_praticas_bool]
    criterio_boas_praticas_count = len(tabela_criterio_boas_praticas.index)
    porcentagem_criterio_boas_praticas = round(((criterio_boas_praticas_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["J"] = porcentagem_criterio_boas_praticas

    #Quantidade do critério k. Recomendações
    tabela_criterio_recomendacoes_bool = tabela_relatorios_estado["k. Recomendações"]==1
    tabela_criterio_recomendacoes = tabela_relatorios_estado[tabela_criterio_recomendacoes_bool]
    criterio_recomendacoes_count = len(tabela_criterio_recomendacoes.index)
    porcentagem_criterio_recomendacoes = round(((criterio_recomendacoes_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["K"] = porcentagem_criterio_recomendacoes

    #Quantidade do critério l. Benefícios esperados
    tabela_criterio_beneficios_bool = tabela_relatorios_estado["l. Benefícios esperados"]==1
    tabela_criterio_beneficios = tabela_relatorios_estado[tabela_criterio_beneficios_bool]
    criterio_beneficios_count = len(tabela_criterio_beneficios.index)
    porcentagem_criterio_beneficios = round(((criterio_beneficios_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["L"] = porcentagem_criterio_beneficios

    #Quantidade do critério m. Manifestação
    tabela_criterio_manifestacao_bool = tabela_relatorios_estado["m. Manifestação"]==1
    tabela_criterio_manifestacao = tabela_relatorios_estado[tabela_criterio_manifestacao_bool]
    criterio_manifestacao_count = len(tabela_criterio_manifestacao.index)
    porcentagem_criterio_manifestacao = round(((criterio_manifestacao_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["M"] = porcentagem_criterio_manifestacao

    #Quantidade do critério n. Conclusões
    tabela_criterio_conclusoes_bool = tabela_relatorios_estado["n. Conclusões"]==1
    tabela_criterio_conclusoes = tabela_relatorios_estado[tabela_criterio_conclusoes_bool]
    criterio_conclusoes_count = len(tabela_criterio_conclusoes.index)
    porcentagem_criterio_conclusoes = round(((criterio_conclusoes_count/qtd_relatorios_estado)*100), 2)
    porcentagens_por_criterio["N"] = porcentagem_criterio_conclusoes

    return porcentagens_por_criterio

array_tabelas_estados = [tabela_acre, tabela_alagoas, tabela_amazonas, tabela_amapa, tabela_bahia, tabela_ceara, tabela_df, tabela_es, tabela_goias, tabela_maranhao, tabela_mg, tabela_ms, tabela_mt, tabela_para, tabela_paraiba, tabela_pernambuco, tabela_piaui, tabela_parana, tabela_rj, tabela_rn, tabela_rs, tabela_rondonia, tabela_roraima, tabela_sc, tabela_sergipe, tabela_sp, tabela_tocantins]

porcentagem_criterios_estado_aux = []

for i in array_tabelas_estados:
    porcentagem_criterios_estado_aux.append(porcentagem_criterios_estado(i)) #Roda para todos os estados e adiciona à tabela auxiliar de porcentagem dos critérios


porcentagens_criterios_por_estado = pd.DataFrame(porcentagem_criterios_estado_aux, index=array_estados)
porcentagens_criterios_por_estado.to_excel('criterios_por_estado.xlsx')


display(porcentagens_criterios_por_estado.reset_index(names="Estados"))


Unnamed: 0,Estados,Matriz,A,B,C,D,E,F,G,H,I,J,K,L,M,N
0,Acre,0.0,34.09,6.82,77.27,52.27,97.73,90.91,70.45,45.45,11.36,2.27,56.82,9.09,65.91,100.0
1,Alagoas,0.0,46.75,22.08,81.82,55.84,98.7,93.51,87.01,53.25,1.3,2.6,71.43,3.9,77.92,100.0
2,Amazonas,0.0,33.33,5.56,77.78,51.85,96.3,68.52,57.41,44.44,7.41,7.41,46.3,11.11,64.81,94.44
3,Amapá,0.0,38.46,30.77,53.85,65.38,100.0,92.31,84.62,50.0,11.54,11.54,57.69,11.54,73.08,100.0
4,Bahia,0.0,12.71,7.73,71.27,35.36,100.0,82.32,72.38,25.41,9.94,6.08,24.31,7.18,69.06,100.0
5,Ceará,0.0,34.78,6.96,84.35,40.0,100.0,93.91,84.35,38.26,13.04,8.7,47.83,9.57,69.57,99.13
6,Distrito Federal,0.0,52.66,17.37,91.18,64.15,98.88,88.94,78.29,50.0,21.01,23.25,82.35,16.25,75.07,98.18
7,Espírito Santo,0.0,48.68,14.47,63.16,47.37,100.0,84.21,76.97,30.92,13.16,10.53,46.05,10.53,68.42,100.0
8,Goiás,0.0,35.65,10.65,85.65,32.41,99.07,84.26,70.37,31.02,9.72,6.02,33.8,8.8,63.89,99.54
9,Maranhão,0.0,9.09,2.27,72.73,34.09,100.0,90.91,84.09,27.27,4.55,2.27,25.0,4.55,54.55,100.0


### 5. Critérios por tipo:

In [9]:
array_criterios = ["Matriz", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N"]

def porcentagem_criterios_tipo(tabela_relatorios_tipo):
    
    qtd_relatorios_tipo = len(tabela_relatorios_tipo.index)
    porcentagens_por_criterio = pd.Series(index=array_criterios, dtype='float64')
    
    #Quantidade do critério matriz de achados
    tabela_criterio_matriz_bool = tabela_relatorios_tipo["Matriz de Achados?"]==1
    tabela_criterio_matriz = tabela_relatorios_tipo[tabela_criterio_matriz_bool]
    criterio_matriz_count = len(tabela_criterio_matriz.index)
    porcentagem_criterio_matriz = round(((criterio_matriz_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["Matriz"] = porcentagem_criterio_matriz

    #Quantidade do critério questões auditoria
    tabela_criterio_questoes_auditoria_bool = tabela_relatorios_tipo["a. Questões de Auditoria"]==1
    tabela_criterio_questoes_auditoria = tabela_relatorios_tipo[tabela_criterio_questoes_auditoria_bool]
    criterio_questoes_auditoria_count = len(tabela_criterio_questoes_auditoria.index)
    porcentagem_criterio_questoes_auditoria = round(((criterio_questoes_auditoria_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["A"] = porcentagem_criterio_questoes_auditoria

    #Quantidade do critério subquestões auditoria
    tabela_criterio_subquestoes_auditoria_bool = tabela_relatorios_tipo["b. Subquestões de Auditoria"]==1
    tabela_criterio_subquestoes_auditoria = tabela_relatorios_tipo[tabela_criterio_subquestoes_auditoria_bool]
    criterio_subquestoes_auditoria_count = len(tabela_criterio_subquestoes_auditoria.index)
    porcentagem_criterio_subquestoes_auditoria = round(((criterio_subquestoes_auditoria_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["B"] = porcentagem_criterio_subquestoes_auditoria

    #Quantidade do critério c. Descrição sumária
    tabela_criterio_descricao_sumaria_bool = tabela_relatorios_tipo["c. Descrição sumária"]==1
    tabela_criterio_descricao_sumaria = tabela_relatorios_tipo[tabela_criterio_descricao_sumaria_bool]
    criterio_descricao_sumaria_count = len(tabela_criterio_descricao_sumaria.index)
    porcentagem_criterio_descricao_sumaria = round(((criterio_descricao_sumaria_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["C"] = porcentagem_criterio_descricao_sumaria

    #Quantidade do critério d. Critério (O que deveria ser)
    tabela_criterio_deveria_ser_bool = tabela_relatorios_tipo["d. Critério (O que deveria ser)"]==1
    tabela_criterio_deveria_ser = tabela_relatorios_tipo[tabela_criterio_deveria_ser_bool]
    criterio_deveria_ser_count = len(tabela_criterio_deveria_ser.index)
    porcentagem_criterio_deveria_ser = round(((criterio_deveria_ser_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["D"] = porcentagem_criterio_deveria_ser

    #Quantidade do critério e. Condição ou situação encontrada (O que é) [achados]
    tabela_criterio_achados_bool = tabela_relatorios_tipo["e. Condição ou situação encontrada (O que é) [achados]"]==1
    tabela_criterio_achados = tabela_relatorios_tipo[tabela_criterio_achados_bool]
    criterio_achados_count = len(tabela_criterio_achados.index)
    porcentagem_criterio_achados = round(((criterio_achados_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["E"] = porcentagem_criterio_achados

    #Quantidade do critério f. Evidências
    tabela_criterio_evidencias_bool = tabela_relatorios_tipo["f. Evidências"]==1
    tabela_criterio_evidencias = tabela_relatorios_tipo[tabela_criterio_evidencias_bool]
    criterio_evidencias_count = len(tabela_criterio_evidencias.index)
    porcentagem_criterio_evidencias = round(((criterio_evidencias_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["F"] = porcentagem_criterio_evidencias

    #Quantidade do critério g. Informação extraída das evidências
    tabela_criterio_info_evidencias_bool = tabela_relatorios_tipo["g. Informação extraída das evidências"]==1
    tabela_criterio_info_evidencias = tabela_relatorios_tipo[tabela_criterio_info_evidencias_bool]
    criterio_info_evidencias_count = len(tabela_criterio_info_evidencias.index)
    porcentagem_criterio_info_evidencias= round(((criterio_info_evidencias_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["G"] = porcentagem_criterio_info_evidencias
    
    #Quantidade do critério h. Causas
    tabela_criterio_causas_bool = tabela_relatorios_tipo["h. Causas"]==1
    tabela_criterio_causas = tabela_relatorios_tipo[tabela_criterio_causas_bool]
    criterio_causas_count = len(tabela_criterio_causas.index)
    porcentagem_criterio_causas = round(((criterio_causas_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["H"] = porcentagem_criterio_causas

    #Quantidade do critério i. Efeitos
    tabela_criterio_efeitos_bool = tabela_relatorios_tipo["i. Efeitos"]==1
    tabela_criterio_efeitos = tabela_relatorios_tipo[tabela_criterio_efeitos_bool]
    criterio_efeitos_count = len(tabela_criterio_efeitos.index)
    porcentagem_criterio_efeitos = round(((criterio_efeitos_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["I"] = porcentagem_criterio_efeitos

    #Quantidade do critério j. Boas Práticas
    tabela_criterio_boas_praticas_bool = tabela_relatorios_tipo["j. Boas Práticas"]==1
    tabela_criterio_boas_praticas = tabela_relatorios_tipo[tabela_criterio_boas_praticas_bool]
    criterio_boas_praticas_count = len(tabela_criterio_boas_praticas.index)
    porcentagem_criterio_boas_praticas = round(((criterio_boas_praticas_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["J"] = porcentagem_criterio_boas_praticas

    #Quantidade do critério k. Recomendações
    tabela_criterio_recomendacoes_bool = tabela_relatorios_tipo["k. Recomendações"]==1
    tabela_criterio_recomendacoes = tabela_relatorios_tipo[tabela_criterio_recomendacoes_bool]
    criterio_recomendacoes_count = len(tabela_criterio_recomendacoes.index)
    porcentagem_criterio_recomendacoes = round(((criterio_recomendacoes_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["K"] = porcentagem_criterio_recomendacoes

    #Quantidade do critério l. Benefícios esperados
    tabela_criterio_beneficios_bool = tabela_relatorios_tipo["l. Benefícios esperados"]==1
    tabela_criterio_beneficios = tabela_relatorios_tipo[tabela_criterio_beneficios_bool]
    criterio_beneficios_count = len(tabela_criterio_beneficios.index)
    porcentagem_criterio_beneficios = round(((criterio_beneficios_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["L"] = porcentagem_criterio_beneficios

    #Quantidade do critério m. Manifestação
    tabela_criterio_manifestacao_bool = tabela_relatorios_tipo["m. Manifestação"]==1
    tabela_criterio_manifestacao = tabela_relatorios_tipo[tabela_criterio_manifestacao_bool]
    criterio_manifestacao_count = len(tabela_criterio_manifestacao.index)
    porcentagem_criterio_manifestacao = round(((criterio_manifestacao_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["M"] = porcentagem_criterio_manifestacao

    #Quantidade do critério n. Conclusões
    tabela_criterio_conclusoes_bool = tabela_relatorios_tipo["n. Conclusões"]==1
    tabela_criterio_conclusoes = tabela_relatorios_tipo[tabela_criterio_conclusoes_bool]
    criterio_conclusoes_count = len(tabela_criterio_conclusoes.index)
    porcentagem_criterio_conclusoes = round(((criterio_conclusoes_count/qtd_relatorios_tipo)*100), 2)
    porcentagens_por_criterio["N"] = porcentagem_criterio_conclusoes

    return porcentagens_por_criterio

array_tabelas_tipo = [tabela_relatorios_avaliacao, tabela_relatorios_consultoria, tabela_relatorios_apuracao, tabela_relatorios_nao_se_aplicam]

porcentagem_criterios_tipo_aux = []

for i in array_tabelas_tipo:
    porcentagem_criterios_tipo_aux.append(porcentagem_criterios_tipo(i)) #Roda para todos os estados e adiciona à tabela auxiliar de porcentagem dos critérios


porcentagens_criterios_por_tipo = pd.DataFrame(porcentagem_criterios_tipo_aux, index=array_tipo_relatorio)
porcentagens_criterios_por_tipo.to_excel('criterios_por_tipo.xlsx')


display(porcentagens_criterios_por_tipo.reset_index(names="Tipo de Relatório"))

Unnamed: 0,Tipo de Relatório,Matriz,A,B,C,D,E,F,G,H,I,J,K,L,M,N
0,Avaliação,0.0,39.33,11.53,80.71,45.82,99.45,85.64,74.02,45.36,11.13,10.81,57.21,8.65,70.99,99.57
1,Consultoria,0.0,50.0,50.0,100.0,50.0,100.0,75.0,75.0,100.0,75.0,50.0,50.0,50.0,50.0,100.0
2,Apuração,0.0,20.88,4.53,87.74,37.23,99.71,92.41,78.39,14.31,8.61,6.57,21.9,5.99,71.24,99.27
3,Não se aplica,0.0,8.33,8.33,83.33,58.33,83.33,100.0,50.0,16.67,25.0,16.67,25.0,16.67,16.67,50.0


### 6. Critérios por ano:

In [10]:
array_criterios = ["Matriz", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N"]

def porcentagem_criterios_ano(tabela_relatorios_ano):
    
    qtd_relatorios_ano = len(tabela_relatorios_ano.index)
    porcentagens_por_criterio = pd.Series(index=array_criterios, dtype='float64')
    
    #Quantidade do critério matriz de achados
    tabela_criterio_matriz_bool = tabela_relatorios_ano["Matriz de Achados?"]==1
    tabela_criterio_matriz = tabela_relatorios_ano[tabela_criterio_matriz_bool]
    criterio_matriz_count = len(tabela_criterio_matriz.index)
    porcentagem_criterio_matriz = round(((criterio_matriz_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["Matriz"] = porcentagem_criterio_matriz

    #Quantidade do critério questões auditoria
    tabela_criterio_questoes_auditoria_bool = tabela_relatorios_ano["a. Questões de Auditoria"]==1
    tabela_criterio_questoes_auditoria = tabela_relatorios_ano[tabela_criterio_questoes_auditoria_bool]
    criterio_questoes_auditoria_count = len(tabela_criterio_questoes_auditoria.index)
    porcentagem_criterio_questoes_auditoria = round(((criterio_questoes_auditoria_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["A"] = porcentagem_criterio_questoes_auditoria

    #Quantidade do critério subquestões auditoria
    tabela_criterio_subquestoes_auditoria_bool = tabela_relatorios_ano["b. Subquestões de Auditoria"]==1
    tabela_criterio_subquestoes_auditoria = tabela_relatorios_ano[tabela_criterio_subquestoes_auditoria_bool]
    criterio_subquestoes_auditoria_count = len(tabela_criterio_subquestoes_auditoria.index)
    porcentagem_criterio_subquestoes_auditoria = round(((criterio_subquestoes_auditoria_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["B"] = porcentagem_criterio_subquestoes_auditoria

    #Quantidade do critério c. Descrição sumária
    tabela_criterio_descricao_sumaria_bool = tabela_relatorios_ano["c. Descrição sumária"]==1
    tabela_criterio_descricao_sumaria = tabela_relatorios_ano[tabela_criterio_descricao_sumaria_bool]
    criterio_descricao_sumaria_count = len(tabela_criterio_descricao_sumaria.index)
    porcentagem_criterio_descricao_sumaria = round(((criterio_descricao_sumaria_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["C"] = porcentagem_criterio_descricao_sumaria

    #Quantidade do critério d. Critério (O que deveria ser)
    tabela_criterio_deveria_ser_bool = tabela_relatorios_ano["d. Critério (O que deveria ser)"]==1
    tabela_criterio_deveria_ser = tabela_relatorios_ano[tabela_criterio_deveria_ser_bool]
    criterio_deveria_ser_count = len(tabela_criterio_deveria_ser.index)
    porcentagem_criterio_deveria_ser = round(((criterio_deveria_ser_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["D"] = porcentagem_criterio_deveria_ser

    #Quantidade do critério e. Condição ou situação encontrada (O que é) [achados]
    tabela_criterio_achados_bool = tabela_relatorios_ano["e. Condição ou situação encontrada (O que é) [achados]"]==1
    tabela_criterio_achados = tabela_relatorios_ano[tabela_criterio_achados_bool]
    criterio_achados_count = len(tabela_criterio_achados.index)
    porcentagem_criterio_achados = round(((criterio_achados_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["E"] = porcentagem_criterio_achados

    #Quantidade do critério f. Evidências
    tabela_criterio_evidencias_bool = tabela_relatorios_ano["f. Evidências"]==1
    tabela_criterio_evidencias = tabela_relatorios_ano[tabela_criterio_evidencias_bool]
    criterio_evidencias_count = len(tabela_criterio_evidencias.index)
    porcentagem_criterio_evidencias = round(((criterio_evidencias_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["F"] = porcentagem_criterio_evidencias

    #Quantidade do critério g. Informação extraída das evidências
    tabela_criterio_info_evidencias_bool = tabela_relatorios_ano["g. Informação extraída das evidências"]==1
    tabela_criterio_info_evidencias = tabela_relatorios_ano[tabela_criterio_info_evidencias_bool]
    criterio_info_evidencias_count = len(tabela_criterio_info_evidencias.index)
    porcentagem_criterio_info_evidencias= round(((criterio_info_evidencias_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["G"] = porcentagem_criterio_info_evidencias
    
    #Quantidade do critério h. Causas
    tabela_criterio_causas_bool = tabela_relatorios_ano["h. Causas"]==1
    tabela_criterio_causas = tabela_relatorios_ano[tabela_criterio_causas_bool]
    criterio_causas_count = len(tabela_criterio_causas.index)
    porcentagem_criterio_causas = round(((criterio_causas_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["H"] = porcentagem_criterio_causas

    #Quantidade do critério i. Efeitos
    tabela_criterio_efeitos_bool = tabela_relatorios_ano["i. Efeitos"]==1
    tabela_criterio_efeitos = tabela_relatorios_ano[tabela_criterio_efeitos_bool]
    criterio_efeitos_count = len(tabela_criterio_efeitos.index)
    porcentagem_criterio_efeitos = round(((criterio_efeitos_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["I"] = porcentagem_criterio_efeitos

    #Quantidade do critério j. Boas Práticas
    tabela_criterio_boas_praticas_bool = tabela_relatorios_ano["j. Boas Práticas"]==1
    tabela_criterio_boas_praticas = tabela_relatorios_ano[tabela_criterio_boas_praticas_bool]
    criterio_boas_praticas_count = len(tabela_criterio_boas_praticas.index)
    porcentagem_criterio_boas_praticas = round(((criterio_boas_praticas_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["J"] = porcentagem_criterio_boas_praticas

    #Quantidade do critério k. Recomendações
    tabela_criterio_recomendacoes_bool = tabela_relatorios_ano["k. Recomendações"]==1
    tabela_criterio_recomendacoes = tabela_relatorios_ano[tabela_criterio_recomendacoes_bool]
    criterio_recomendacoes_count = len(tabela_criterio_recomendacoes.index)
    porcentagem_criterio_recomendacoes = round(((criterio_recomendacoes_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["K"] = porcentagem_criterio_recomendacoes

    #Quantidade do critério l. Benefícios esperados
    tabela_criterio_beneficios_bool = tabela_relatorios_ano["l. Benefícios esperados"]==1
    tabela_criterio_beneficios = tabela_relatorios_ano[tabela_criterio_beneficios_bool]
    criterio_beneficios_count = len(tabela_criterio_beneficios.index)
    porcentagem_criterio_beneficios = round(((criterio_beneficios_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["L"] = porcentagem_criterio_beneficios

    #Quantidade do critério m. Manifestação
    tabela_criterio_manifestacao_bool = tabela_relatorios_ano["m. Manifestação"]==1
    tabela_criterio_manifestacao = tabela_relatorios_ano[tabela_criterio_manifestacao_bool]
    criterio_manifestacao_count = len(tabela_criterio_manifestacao.index)
    porcentagem_criterio_manifestacao = round(((criterio_manifestacao_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["M"] = porcentagem_criterio_manifestacao

    #Quantidade do critério n. Conclusões
    tabela_criterio_conclusoes_bool = tabela_relatorios_ano["n. Conclusões"]==1
    tabela_criterio_conclusoes = tabela_relatorios_ano[tabela_criterio_conclusoes_bool]
    criterio_conclusoes_count = len(tabela_criterio_conclusoes.index)
    porcentagem_criterio_conclusoes = round(((criterio_conclusoes_count/qtd_relatorios_ano)*100), 2)
    porcentagens_por_criterio["N"] = porcentagem_criterio_conclusoes

    return porcentagens_por_criterio

array_tabelas_ano = [tabela_relatorios_2018, tabela_relatorios_2019, tabela_relatorios_2020, tabela_relatorios_2021]

porcentagem_criterios_ano_aux = []

for i in array_tabelas_ano:
    porcentagem_criterios_ano_aux.append(porcentagem_criterios_ano(i)) #Roda para todos os anos e adiciona à tabela auxiliar de porcentagem dos critérios


porcentagens_criterios_por_ano = pd.DataFrame(porcentagem_criterios_ano_aux, index=array_ano_relatorio)
porcentagens_criterios_por_ano.to_excel('criterios_por_ano.xlsx')


display(porcentagens_criterios_por_ano.reset_index(names="Ano do Relatório"))

Unnamed: 0,Ano do Relatório,Matriz,A,B,C,D,E,F,G,H,I,J,K,L,M,N
0,2018,0.0,24.68,6.84,61.27,45.94,99.52,89.96,85.26,37.82,0.59,1.18,42.9,0.91,70.99,99.47
1,2019,0.0,32.3,4.37,98.1,31.51,99.05,83.33,62.54,36.9,9.84,6.03,48.89,5.4,64.84,98.97
2,2020,0.0,50.07,4.63,99.28,45.3,99.71,80.9,64.4,37.34,12.88,12.59,59.62,6.22,70.77,99.57
3,2021,0.0,85.42,63.85,100.0,81.92,100.0,93.88,81.92,71.14,66.18,69.68,89.21,63.27,92.42,100.0
