# 03 - Visualizações e Resultados

Neste notebook, apresento as visualizações gráficas e tabelas geradas a partir dos dados consolidados e da clusterização aplicada aos fornecedores do IFSP. O objetivo é facilitar a interpretação dos padrões orçamentários e da concentração contratual ao longo do período analisado.

In [None]:
# Importação de bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

## Leitura dos dados com clusterização aplicada
Carrego os dados com os CNPJs já classificados em clusters, gerados no notebook anterior.

In [None]:
# Leitura dos dados
df_cluster = pd.read_csv('../output/fornecedores_com_clusters.csv')
df_cluster.head()

## Gráfico: Distribuição por Cluster
Visualização da distribuição de fornecedores de acordo com os clusters identificados (frequência).

In [None]:
# Contagem de fornecedores por cluster
plt.figure(figsize=(8,5))
sns.countplot(data=df_cluster, x='cluster', palette='viridis')
plt.title('Número de Fornecedores por Cluster')
plt.xlabel('Cluster')
plt.ylabel('Quantidade de CNPJs')
plt.grid(True)
plt.show()

## Gráfico: Total Empenhado por Cluster
Soma total empenhada por grupo de cluster.

In [None]:
# Soma de valores empenhados por cluster
empenhos_por_cluster = df_cluster.groupby('cluster')['total_empenhado'].sum().reset_index()

plt.figure(figsize=(8,5))
sns.barplot(data=empenhos_por_cluster, x='cluster', y='total_empenhado', palette='magma')
plt.title('Total Empenhado por Cluster')
plt.xlabel('Cluster')
plt.ylabel('Valor Empenhado (R$)')
plt.grid(True)
plt.show()

## Tabela: CNPJs com maiores valores empenhados
Exibimos os principais fornecedores por volume financeiro acumulado.

In [None]:
# Top 10 fornecedores com maiores valores empenhados
df_cluster.sort_values(by='total_empenhado', ascending=False).head(10)