# Ferramenta de Geração de Relacionamentos utilizando GRAFOS
##
 - Contribua com esse projeto aqui: https://github.com/anacarolmoraes/fiscalrecursospublicos
 - Desenvolvido por Ana Carolina Ribeiro de Moraes Paulo


In [None]:
import pandas as pd
import networkx as nx
import pymssql
from IPython.display import Image
from pyvis.network import Network
import numpy as np
import json
import ipywidgets
import urllib
from sqlalchemy import create_engine


In [None]:
try:
    from collections.abc import Callable  # noqa
except ImportError:
    from collections import Callable  # noqa

In [None]:
import getpass

user = input()
password = getpass.getpass('Senha')

In [None]:
db = create_engine(f'''mysql+pymysql://{user}:{password}@localhost:3306/dados_rfb''').connect()


### Escolha do CNPJ a ser investigado - Somente os primeiros 8 dígitos do CNPJ serão utilizados

In [None]:
cnpj_escolhido = '01419973'

###  Pesquisa dos dados da empresa

In [None]:
sql = f''' select EE.cnpj_basico, EE.cnpj_ordem, EE.cnpj_dv, E.razao_social, EE.nome_fantasia, case
           when E.porte_empresa = '00' then 'NÃO INFORMADO'
           when E.porte_empresa = '01' then 'MICRO EMPRESA'
           when E.porte_empresa = '04' then 'EMPRESA DE PEQUENO PORTE'
           when E.porte_empresa = '05' then 'DEMAIS' end as porte_empresa, 
EE.data_inicio_atividade,  case
           when EE.situacao_cadastral = '01' then 'NULA'
           when EE.situacao_cadastral = '02' then 'ATIVA'
           when EE.situacao_cadastral = '3' then 'SUSPENSA'
           when EE.situacao_cadastral = '4' then 'INAPTA'
           when EE.situacao_cadastral = '08' then 'BAIXADA' end as situacao_cadastral,  EE.data_situacao_cadastral,
CONCAT(trim(EE.tipo_logradouro), ' ', trim(EE.logradouro),' ', trim(EE.numero),' ', regexp_replace(EE.complemento, '[ ]+', ' '),' ', 
trim(EE.bairro),' ', trim(EE.cep),' ', trim(EE.municipio), '-', trim(EE.uf)) as endereco, 
CONCAT('(',trim(EE.ddd_1), ') ', trim(EE.telefone_1)) as telefone1, 
CONCAT('(',trim(EE.ddd_2), ') ', trim(EE.telefone_2)) as telefone2, 
EE.correio_eletronico as "E-MAIL", case when SS.opcao_pelo_simples = 'S' then 'EXISTE OPÇÃO PELO SIMPLES'
when  SS.opcao_pelo_simples = 'N' then 'NÃO EXISTE OPÇÃO PELO SIMPLES'
when  SS.opcao_pelo_simples = '' then 'OUTROS' end opcao_simples,data_opcao_simples, data_exclusao_simples	
from dados_rfb.empresa E join dados_rfb.estabelecimento EE on E.cnpj_basico =EE.cnpj_basico left join 
dados_rfb.simples SS on SS.cnpj_basico = E.cnpj_basico 
where EE.cnpj_basico in ({cnpj_escolhido})'''

empresa = pd.read_sql_query(sql,db)

In [None]:
empresa.fillna('-',inplace=True)

In [None]:
empresa['cnpj_completo'] = empresa['cnpj_basico']+empresa['cnpj_ordem']+empresa['cnpj_basico']

In [None]:
empresa['atributos_empresa'] =  "<div style=\"width:200px;\"><p>CNPJ: "+empresa['cnpj_completo']+"</p><p>Porte:  "+empresa['porte_empresa']+"</p> <p>Endereço:  "+empresa['endereco']+"</p><p>Situação Cadastral:  "+empresa['situacao_cadastral']+"</p><p>Data da Situação:  "+empresa['data_situacao_cadastral']+"</p><div style=\"background-color:lightblue\"><p>Simples: "+empresa['opcao_simples']+"</p><p>Dt Inclusão:  "+empresa['data_opcao_simples']+"</p><p>Dt Exclusão:  "+empresa['data_exclusao_simples']+"</p></div></div>"


### Pesquisa dos dados dos sócios da empresa - Fonte: Dados públicos da RFB

In [None]:
sql = f'''select  cnpj_basico, identificador_socio,nome_socio_razao_social,cpf_cnpj_socio,q.descricao as qualificacao_socio,data_entrada_sociedade,
representante_legal,nome_do_representante,qualificacao_representante_legal
from dados_rfb.socios S  join dados_rfb.quals q on q.codigo = S.qualificacao_socio  where S.cnpj_basico in ({cnpj_escolhido}) 
UNION
select  EE.cnpj_basico, identificador_socio,nome_socio_razao_social,cpf_cnpj_socio,q.descricao as qualificacao_socio,data_entrada_sociedade,
representante_legal,nome_do_representante,qualificacao_representante_legal
from dados_rfb.socios S join dados_rfb.estabelecimento EE on EE.cnpj_basico = S.cnpj_basico 
join dados_rfb.quals q on q.codigo = S.qualificacao_socio
where CONCAT(EE.cnpj_basico, EE.cnpj_ordem, EE.cnpj_dv)  in  (select  cpf_cnpj_socio
from dados_rfb.socios S2 where S2.cnpj_basico in ({cnpj_escolhido})  and S2.identificador_socio = 1)'''

socio = pd.read_sql_query(sql,db)

In [None]:
socio.fillna('-',inplace=True)

In [None]:
socio.head()

In [None]:
socio['data_entrada_sociedade'] = pd.to_datetime(socio['data_entrada_sociedade'])

In [None]:
socio['qualificacao_relacionamento'] = socio['qualificacao_socio']+" desde "+socio['data_entrada_sociedade'].dt.strftime('%d/%m/%Y')

In [None]:
socio['atributos_socio'] =  "<div style='width:200px;background-color:lightgreen'><p>CPF: "+socio['cpf_cnpj_socio']+"</p></div>"

### Primeira Camada de Relacionamento - Empresa x sócios

In [None]:
relacionamentos = pd.merge(socio[['nome_socio_razao_social', 'atributos_socio','cnpj_basico', 'qualificacao_relacionamento']], empresa[['razao_social', 'atributos_empresa', 'cnpj_basico']], left_on='cnpj_basico', right_on='cnpj_basico',  how='inner')

In [None]:
relacionamentos.rename(columns={'nome_socio_razao_social':'origem', 'atributos_socio':'atributos_origem', 'razao_social':'destino', 'atributos_empresa':'atributos_destino'}, inplace=True)

In [None]:
relacionamentos3=pd.DataFrame()
relacionamentos2=pd.DataFrame()

### Pesquisa dos dados dos gestores e a empresa pesquisada como licitante - Fonte: SICAP LCO

In [None]:
gestor = pd.read_excel('./dados_IRDR/gestores.xlsx')

In [None]:
licitante = pd.read_excel('./dados_IRDR/licitante.xlsx')

In [None]:
#licitante['DATABR'] = licitante['DATABR'].astype('datetime64[ns]')
licitante['CPFCGCLCE'] = licitante['CPFCGCLCE'].astype(str)
licitante['CPFCGCLCE'] = licitante['CPFCGCLCE'].str.zfill(14)

In [None]:
licitante['cnpj_basico'] =  licitante['CPFCGCLCE'].str.slice(0, 8)

In [None]:
licitante.head()

In [None]:
licitante['qualificacao_relacionamento'] = "Participou de licitação publicada em "+licitante['DATABR'].dt.strftime('%d/%m/%Y')
#socio['data_entrada_sociedade'] = pd.to_datetime(socio['data_entrada_sociedade'], format='%d/%m/%Y')

In [None]:
licitante = pd.merge(licitante, gestor, left_on='CGCUNDADR', right_on='codunidadegestora',  how='inner')

In [None]:
licitante['atributos_unidade_gestora'] = "<div style='width:200px;background-color:lightred'><p>CNPJ: "+licitante['codunidadegestora'].astype(str).str.zfill(14)+"/p><p>Gestor: "+licitante['nome_gestor']+"</p></div>"
licitante['atributos_origem'] = empresa['atributos_empresa']
licitante['atributos_origem'] = licitante['atributos_origem'][0]

### Segunda Camada de Relacionamento - Parte 1: Participação da Empresa investigada em licitações nos municípios e no Estado do Tocantins

In [None]:
relacionamento2 = licitante[['RAZSOC', 'atributos_origem', 'qualificacao_relacionamento', 'nomeEntidade', 'atributos_unidade_gestora', 'cnpj_basico']]
relacionamento2.rename(columns={'RAZSOC':'origem',  'nomeEntidade':'destino', 'atributos_unidade_gestora':'atributos_destino'}, inplace=True)

### Pesquisa das licitações nas quais a empresa investigada foi vencedora - Fonte: SICAP LCO

In [None]:
vencedor = pd.read_excel('./dados_IRDR/vencedor.xlsx')

In [None]:
vencedor['CPFCGCLCE'] = vencedor['CPFCGCLCE'].astype(str)
vencedor['CPFCGCLCE'] = vencedor['CPFCGCLCE'].str.zfill(14)


In [None]:
vencedor['InicioVigencia'] = pd.to_datetime(vencedor['InicioVigencia'])

vencedor['FimVigência'] = pd.to_datetime(vencedor['FimVigência'])

In [None]:
vencedor['cnpj_basico']  =  vencedor['CPFCGCLCE'].str.slice(0, 8)

In [None]:
vencedor = pd.merge(vencedor, gestor, left_on='CGCUNDADR', right_on='codunidadegestora',  how='inner')

In [None]:
vencedor['atributos_origem'] = empresa['atributos_empresa']
vencedor['atributos_origem'] = vencedor['atributos_origem'][0]

In [None]:
vencedor['atributos_unidade_gestora'] = "<div style='width:200px;background-color:lightred'><p>CNPJ: "+vencedor['codunidadegestora'].astype(str).str.zfill(14)+"</p><p>Gestor: "+vencedor['nome_gestor']+"</p></div>"

In [None]:
vencedor['atributos_unidade_gestora'].info()

In [None]:
vencedor['qualificacao_relacionamento'] = "Possui contrato ("+vencedor['InicioVigencia'].dt.strftime('%d/%m/%Y')+" a "+vencedor['FimVigência'].dt.strftime('%d/%m/%Y')+")"

### Segunda Camada de Relacionamento - Parte 2:  Empresa investigada como licitante vencedora em licitações nos municípios e no Estado do Tocantins

In [None]:
relacionamento3 = vencedor[['razsoc', 'atributos_origem', 'qualificacao_relacionamento', 'nomeEntidade', 'atributos_unidade_gestora', 'cnpj_basico']]
relacionamento3.rename(columns={'razsoc':'origem',  'nomeEntidade':'destino', 'atributos_unidade_gestora':'atributos_destino'}, inplace=True)

### Terceira Camada de Relacionamento - Sócios da empresa investigada que são servidores ou gestores de alguma unidade jurisdicionada Tocantinense (órgãos municipais ou estaduais)

### Quarta Camada de Relacionamento - Doações realizadas por empresa investigada ou seus sócios em campanhas políticas

### Quinta Camada de Relacionamento - Existência de registro de inidoneidade no CEIS da empresa investigada e/ou seus sócios

### União de todas as camadas geradas ou que não são vazias em um dataset

In [None]:
relacionamento_final = pd.concat([relacionamentos, relacionamento2, relacionamento3])

## Início da organização da parte Gráfica - Construção do Grafo de Relacionamento

#### Listagem de todos os nós

In [None]:
lista_origem = relacionamento_final['origem'].unique()
lista_destino = relacionamento_final['destino'].unique()
lista = np.concatenate((lista_origem, lista_destino))
lista = np.unique(lista).tolist()

In [None]:
# Para definir atributos específicos como cor dos nós para cada grupo de nó 

unidade_jurisdicionada_unica = relacionamento2['destino'].unique()
contratante_unica = relacionamento3['destino'].unique()
contratada_unica= relacionamento3['origem'].unique()
socio_unico = socio['nome_socio_razao_social'].unique()
lista_uj =  np.concatenate((unidade_jurisdicionada_unica, contratante_unica))

# Transforma em lista 

lista_uj_unica =  np.unique(lista_uj).tolist()
lista_socio_unico = np.unique(socio_unico).tolist()
lista_contratada_unica = np.unique(contratada_unica).tolist()

#### Listagem das arestas

In [None]:
relacionamento_final['id_origem']  = -1
relacionamento_final['id_destino']  = -1
relacionamento_final['atributos_origem'] = relacionamento_final['atributos_origem'].astype('str') 
relacionamento_final['atributos_destino'] = relacionamento_final['atributos_destino'].astype('str') 
dicionario = dict()

In [None]:
def preencher_identificadores(row):
    indice = lista.index(row['origem'])
    
    dicionario[indice] = row['atributos_origem']
    return indice

relacionamento_final['id_origem'] = relacionamento_final.apply(lambda row : preencher_identificadores(row), axis=1) 

In [None]:
def preencher_identificadores(row):
    indice = lista.index(row['destino'])
    dicionario[indice] = row['atributos_destino']
    return indice

relacionamento_final['id_destino'] = relacionamento_final.apply(lambda row : preencher_identificadores(row), axis=1)

#### Desenho do grafo de relacionamentos

In [None]:
net = Network(directed =True,height=1000, width=1800, notebook=False)

c = 0;

for i in lista:
    if i in lista_uj_unica:
        cor = '#C70039'
    if i in lista_socio_unico:
        cor = '#FFC300'
    elif i in lista_contratada_unica:
        cor = '#FF5733'
    net.add_node(c, label=i, color=cor, title=dicionario[c], font='20px bold verdana')
    c=c+1
for  index, row in relacionamento_final.iterrows():
    
    net.add_edge(row['id_origem'], row['id_destino'], label=row['qualificacao_relacionamento'],  weight=100)


    
net.set_edge_smooth('dynamic')
net.repulsion(node_distance=220, spring_length=550)
net.toggle_physics(True)
net.show('mygraph.html')


In [None]:
relacionamento_final