# Análise dos grafos de CNPJs por licitação

In [None]:
import sys
sys.path.insert(0, '..')

import pandas as pd
import plotly.express as px
from util import carregamento_dados as cd, ferramentas_grafos as fg

Os dados foram previamente gerados pelo script *gera_grafos_licitacoes.py* utilizando funções do pacote graph implementado na pasta util. Os dados são salvos pelo método *pickle* para que se possa salvar em memória externa objetos como grafos que se perderiam em um arquivo .csv

In [None]:
df = pd.read_pickle('../pickles/licitacoes/licitacoes_com_densidade')
df.head(1)

Nos dados acima temos a coluna de licitação, o grafo da licitação salvo como objeto nx.Graph(), a lista de cliques desse grafo, a sua densidade. A partir da coluna cliques podemos extrair a max clique ao selecionar o máximo da lista. Isso é feito a seguir:

In [None]:
df['max_clique'] = df['cliques'].apply(
    lambda x: fg.calcula_max_clique(x)
)
df.head(1)

Vamos agora gerar algumas visualizações estatísticas em nível estadual.

In [None]:
def plota_histograma_tamanho_max_clique(df):
    df = df
    fig = px.histogram(df, x='max_clique', log_y=True,
                       title="Numero de licitacoes por tamanho da max clique",
                       labels={
                       'max_clique' : "tamanho da max clique"
                       }
                      )
    fig.update_xaxes(visible=True, showticklabels=True)
    fig.update_yaxes(title='número de licitacoes')
    fig.write_image("../images/nmr_licitacoes_por_tamanho_max_clique.jpg")
    fig.show()

plota_histograma_tamanho_max_clique(df)

In [None]:
def plota_histograma_densidade(df):
    df = df
    fig = px.histogram(df, x='densidade', log_y=True, nbins=100,
                       title="Número de licitacoes por densidade do grafo",
                       labels={
                       'densidade' : "densidade do grafo"
                       }
                      )
    fig.update_xaxes(visible=True, showticklabels=True)
    fig.update_yaxes(title='número de licitacoes')
    fig.write_image("../images/nmr_licitacoes_por_tamanho_max_clique.jpg")
    fig.show()

plota_histograma_densidade(df)

In [None]:
df.groupby(['modalidade']).mean()

In [None]:
def plota_histograma_modalidade(df):
    df = df.groupby(['modalidade']).mean()
    fig = px.bar(df, x='densidade',
                       title="Densidade media por modalidade",
                       labels={
                       'densidade' : "densidade do grafo"
                       }
                      )
    fig.update_xaxes(visible=True, showticklabels=True)
    fig.update_yaxes(categoryorder="total descending")
    fig.update_yaxes(title='modalidade')
    fig.write_image("../images/nmr_licitacoes_por_tamanho_max_clique.jpg")
    fig.show()

plota_histograma_modalidade(df)

In [None]:
def plota_histograma_modalidade(df):
    df = df.groupby(['modalidade']).mean()
    fig = px.bar(df, x='max_clique',
                       title="Max clique media por modalidade",
                       labels={
                       'densidade' : "densidade do grafo"
                       }
                      )
    fig.update_xaxes(visible=True, showticklabels=True)
    fig.update_yaxes(categoryorder="total descending")
    fig.update_yaxes(title='modalidade')
    fig.write_image("../images/nmr_licitacoes_por_tamanho_max_clique.jpg")
    fig.show()

plota_histograma_modalidade(df)

In [None]:
df.groupby(['municipio']).mean()

In [None]:
def plota_histograma_modalidade(df):
    df = df.groupby(['municipio']).mean()
    fig = px.bar(df, x='densidade',
                       title="Densidade media por municipio",
                       labels={
                       'densidade' : "densidade do grafo"
                       }
                      )
    fig.update_xaxes(visible=True, showticklabels=True)
    fig.update_yaxes(categoryorder="total descending")
    fig.update_yaxes(title='municipio')
    fig.write_image("../images/nmr_licitacoes_por_tamanho_max_clique.jpg")
    fig.show()

plota_histograma_modalidade(df)

In [None]:
def plota_histograma_modalidade(df):
    df = df.groupby(['municipio']).mean()
    fig = px.bar(df, x='max_clique',
                       title="Max clique media por municipio",
                       labels={
                       'densidade' : "densidade do grafo"
                       }
                      )
    fig.update_xaxes(visible=True, showticklabels=True)
    fig.update_yaxes(categoryorder="total descending")
    fig.update_yaxes(title='municipio')
    fig.write_image("../images/nmr_licitacoes_por_tamanho_max_clique.jpg")
    fig.show()

plota_histograma_modalidade(df)