# Análise Exploratória

<div style="text-align:justify">
Este notebook realiza uma análise exploratória sobre os dados de Cadastro de Empresas Inidôneas e Suspensas (CEIS), disponíveis no Portal da Transparência e Controladoria Geral da União (CGU), acessíveis através do [Link](http://www.portaltransparencia.gov.br/downloads/snapshot.asp?c=CEIS#get).
</div>

### Carregando Pacotes

In [12]:
import matplotlib.pyplot
import pandas as pd
import seaborn as sns

import unicodedata
import re

%matplotlib inline
%pylab inline

Populating the interactive namespace from numpy and matplotlib


### Carregando Dados

<div style="text-align:justify">
Os dados carregados apresentam: <br><br>
Tipo de Pessoa; CPF ou CNPJ do Sancionado; Nome Informado pelo Órgão Sancionador; Razão Social - Cadastro Receita; Nome Fantasia - Cadastro Receita; Número do processo; Tipo Sanção; Data Início Sanção; Data Final Sanção; Órgão Sancionador; UF Órgão Sancionador; Origem Informações; Data Origem Informações; Data Publicação; Publicação; Detalhamento; Abrangência definida em decisão judicial; Fundamentação Legal; Descrição da Fundamentação Legal; Data do Trânsito em Julgado; Complemento do Órgão; e Contato da Origem da Informação.
</div>

In [13]:
dataset = pd.read_csv("datasets/20180331_CEIS.csv", sep=';', encoding='latin1')
dataset.count()

Tipo de Pessoa                              12537
CPF ou CNPJ do Sancionado                   12537
Nome Informado pelo Órgão Sancionador       12537
Razão Social - Cadastro Receita             12531
Nome Fantasia - Cadastro Receita             4528
Número do processo                          12537
Tipo Sanção                                 12537
Data Início Sanção                          12537
Data Final Sanção                           11384
Órgão Sancionador                           12536
UF Órgão Sancionador                        11547
Origem Informações                          12537
Data Origem Informações                     12537
Data Publicação                              6166
Publicação                                   5076
Detalhamento                                 2181
Abrangência definida em decisão judicial     1243
Fundamentação Legal                         12147
Descrição da Fundamentação Legal            12147
Data do Trânsito em Julgado                  5384


### Hipóteses de Análise:

- H1: Existe alguma predominância pelo tipo de pessoa
- H2: Existe alguma predominância pelo tipo de sanção
- H3: Algum orgão sancionador é mais predominante
- H4: Proporção de sanções por fundamentação legal

### H1: Predominância por Tipo de Pessoa

<div style="text-align:justify">
Podemos notar que não há predominância no número de sanções de acordo com o tipo de pessoa, muito embora a maior parte das sanções estejam associadas a Pessoas Jurídicas.
</div>

In [14]:
dataset[u"Tipo de Pessoa"].value_counts()

Juridica    6772
Fisica      5765
Name: Tipo de Pessoa, dtype: int64

### H2: Predominância pelo Tipo de Sanção

<div style="text-align:justify">
Podemos notar que existe predominância por tipo de sanção, onde o maior número de ocorrências é por _Proibição - Lei de Improbidade_, com 5982 sanções; seguido de 2160 _Impedimento - Lei do Pregão_ com e 2051 _Suspensão - Lei de Licitações_.
</div>

In [15]:
dataset[u"Tipo Sanção"].value_counts()

Proibição - Lei de Improbidade                                 5982
Impedimento - Lei do Pregão                                    2160
Suspensão - Lei de Licitações                                  2051
Inidoneidade - Lei de Licitações                                685
Inidoneidade - Legislação Estadual                              408
Decisão judicial liminar/cautelar que impeça contratação        242
Proibição - Lei Eleitoral                                       241
Inidoneidade - Lei da ANTT e ANTAQ                              196
Suspensão - Legislação Estadual                                 195
Inidoneidade - Lei Orgânica TCU                                 193
Impedimento - Legislação Estadual                                76
Suspensão - Legislação Municipal                                 22
Inidoneidade - Legislação Municipal                              17
Proibição - Lei Antitruste                                       16
Impedimento. Art. 28, Decreto 5450/2005         

<div style="text-align:justify">
Vamos agora fazer uma análise mais detalhada, avaliando a predominância de tipo de sanções por pessoa jurídica. Podemos notar que o maior número de ocorrências é o _Impedimento - Lei do Pregão_, com 2125 sanções; seguido de 1953 _Suspensão - Lei de Licitações_ e 663 _Inidoneidade - Lei de Licitações_.
</div>

In [16]:
dataset.loc[dataset[u"Tipo de Pessoa"] == "Juridica"][u"Tipo Sanção"].value_counts()

Impedimento - Lei do Pregão                                    2125
Suspensão - Lei de Licitações                                  1953
Inidoneidade - Lei de Licitações                                663
Proibição - Lei de Improbidade                                  562
Inidoneidade - Legislação Estadual                              393
Proibição - Lei Eleitoral                                       240
Inidoneidade - Lei da ANTT e ANTAQ                              196
Inidoneidade - Lei Orgânica TCU                                 189
Suspensão - Legislação Estadual                                 176
Decisão judicial liminar/cautelar que impeça contratação        106
Impedimento - Legislação Estadual                                71
Suspensão - Legislação Municipal                                 22
Inidoneidade - Legislação Municipal                              17
Impedimento. Art. 28, Decreto 5450/2005                          15
Suspensão - Lei das Estatais                    

<div style="text-align:justify">
Vamos agora fazer uma análise mais detalhada, avaliando a predominância de tipo de sanções por pessoa física. Podemos notar que é predominante o número de sanções do tipo _Proibição - Lei de Improbidade_, com 5420 ocorrências. Os demais tipo de sanções ocorrerm em número bem baixo, se comparado com este citado anteriormente.
</div>

In [17]:
dataset.loc[dataset[u"Tipo de Pessoa"] == "Fisica"][u"Tipo Sanção"].value_counts()

Proibição - Lei de Improbidade                                 5420
Decisão judicial liminar/cautelar que impeça contratação        136
Suspensão - Lei de Licitações                                    98
Impedimento - Lei do Pregão                                      35
Inidoneidade - Lei de Licitações                                 22
Suspensão - Legislação Estadual                                  19
Inidoneidade - Legislação Estadual                               15
Proibição - Lei Antitruste                                        7
Impedimento - Legislação Estadual                                 5
Inidoneidade - Lei Orgânica TCU                                   4
Suspensão - Decreto ANEEL                                         2
Proibição - Lei Eleitoral                                         1
Decisão judicial em execução cível que impeça a contratação       1
Name: Tipo Sanção, dtype: int64