# Setup

## Instalação de pacotes

O pacote `vectordb2` é usado para armazenar e recuperar textos usando técnicas de chunking (segmentação de texto), embeddings (conversão de texto para vetores numéricos) e busca vetorial.

In [None]:
%pip install vectordb2
%pip install requests

O pacote `networkx` é usado para a criação, manipulação e representação de grafos.

In [None]:
%pip install networkx

## Aquisição dos dados

Os dados do documento são importados e guardados na variável `arquivo`.

In [8]:
import requests

arquivo = requests.get('https://raw.githubusercontent.com/Cehiim/TeoriaDosGrafos/refs/heads/main/Projeto/palavras.txt').text

In [None]:
#with open("./Projeto/palavras.txt", 'r') as file:
#    arquivo = file.read()

As palavras contidas no documento são segmentadas e armazenadas na lista `palavras`.

In [None]:
palavras = arquivo.split()
n_palavras = 50

## Embedding das palavras

Aqui é utilizado a biblioteca VectorDB para criar uma memória virtual.

- `chunking_strategy`: Define a estratégia de fragmentação dos dados. Na estratégia "sliding_window", os dados são divididos em chunks (pedaços de texto) de tamanho fixo.

- `window_size`: Define a quantidade de palavras que um chunk representa. Neste caso, cada chunk representa uma palavra.

- `overlap`: Define quantos elementos de sobreposição existirão entre os chunks adjacentes. Neste caso, não haverá sobreposição já que as palavras usadas não formam frases, logo são independentes uma das outras.

In [None]:
from vectordb import Memory

memory = Memory(chunking_strategy={"mode": "sliding_window", "window_size": 1, "overlap": 0})

Aqui cada palavra é convertida para um vetor numérico e guardada na memória.

In [11]:
for i in range(n_palavras):
  memory.save(palavras[i])

## Busca

Quanto menor é a distância, maior é a proximidade semântica.

In [None]:
for i in range(n_palavras):
  print(f"\n\nBusca: {palavras[i]}\n")
  buscas = memory.search(palavras[i], top_n=6)

  for j in range(1,6):
    palavra = buscas[j]['chunk']
    distancia = buscas[j]['distance']
    print(f"Palavra: {palavra}\nDistância: {distancia:.2f}\n")

## Definição da classe Grafo

In [None]:
"""
Created on Mon Feb 13 13:59:10 2023

@author: icalc
"""

# Grafo como uma matriz de adjacência
class Grafo:
    TAM_MAX_DEFAULT = 100 # qtde de vértices máxima default
    # construtor da classe grafo
    def __init__(self, n=TAM_MAX_DEFAULT):
        self.n = n # número de vértices
        self.m = 0 # número de arestas
        # matriz de adjacência
        self.adj = [[0 for i in range(n)] for j in range(n)]

	# Insere uma aresta no Grafo tal que
	# v é adjacente a w
    def insereA(self, v, w):
        if self.adj[v][w] == 0:
            self.adj[v][w] = 1
            self.m+=1 # atualiza qtd arestas
    
# remove uma aresta v->w do Grafo
    def removeA(self, v, w):
        if(v == w):
            return
        # testa se temos a aresta
        if self.adj[v][w] == 1:
            self.adj[v][w] = 0
            self.m -= 1  # atualiza qtd arestas

	# Apresenta o Grafo contendo
	# número de vértices, arestas
	# e a matriz de adjacência obtida	
    def show(self):
        print(f"\n n: {self.n:2d} ", end="")
        print(f"m: {self.m:2d}\n")
        for i in range(self.n):
            for w in range(self.n):
                if self.adj[i][w] == 1:
                    print(f"Adj[{i:2d},{w:2d}] = 1 ", end="") 
                else:
                    print(f"Adj[{i:2d},{w:2d}] = 0 ", end="")
            print("\n")
        print("\nfim da impressao do grafo." )


	# Apresenta o Grafo contendo
	# número de vértices, arestas
	# e a matriz de adjacência obtida 
    # Apresentando apenas os valores 0 ou 1	
    def showMin(self):
        print(f"\n n: {self.n:2d} ", end="")
        print(f"m: {self.m:2d}\n")
        for i in range(self.n):
            for w in range(self.n):
                if self.adj[i][w] == 1:
                    print(" 1 ", end="") 
                else:
                    print(" 0 ", end="")
            print("\n")
        print("\nfim da impressao do grafo." )


    # Função para calcular o grau de entrada no vértice v Ex 1)
    #OBS: Estou assumindo que, para os métodos abaixo, o valor v pertence ao intervalo [0, n - 1] ao invés de [1, n], em que n é o número de vértices
    def inDegree(self, v):
        degree = 0
        for i in range(self.n):
            degree += self.adj[i][v]
        return degree
    
    #Função para calcular o grau de saída no vértice v Ex 2)
    def outDegree(self, v):
        degree = 0
        for i in range(self.n):
            degree += self.adj[v][i]
        return degree
    
    #Função para verificar se um vértice é fonte Ex 3)
    def ehFonte(self, v):
        if(self.inDegree(v) == 0 and self.outDegree(v) > 0):
            return 1
        else:
            return 0
    
    #Função para verificar se um vértice é sorvedouro Ex 4)
    def ehSoverdouro(self, v):
        if(self.inDegree(v) > 0 and self.outDegree(v) == 0):
            return 1
        else:
            return 0

    #Função para verificar se um grafo é simétrico Ex 5)    
    def ehSimetrico(self):
        for i in range(self.n):
            for j in range(i, self.n):
                if(self.adj[i][j] != self.adj[j][i]):
                    return 0
        return 1
    
    #Método para ler um grafo de um arquivo .txt Ex 6)
    def leGrafo(self, path = "grafo.txt"):
        with open(path, 'r') as file:
            self.n = int(file.readline())
            self.m = int(file.readline())
            for _ in range(self.m):
                string = file.readline()
                i, j = int(string[0]), int(string[2])
                self.adj[i][j] = 1
    
    #Método para remover um vértice de um grafo direcionado Ex 25)
    def removeV(self, v):
        for i in range(self.n):
            if self.adj[i][v] == 1 or self.adj[v][i] == 1: #Verifica se havia uma aresta para subtrair
                self.m -= 1
            if i != v and i != len(self.adj) - 1: #Substitui a linha e coluna da matriz a serem apagadas pelas últimas linha e coluna respectivamente
                self.adj[i][v] = self.adj[i][-1]
                self.adj[v][i] = self.adj[-1][i]

        self.adj[v][v] = self.adj[-1][-1]
        for i in range(self.n):
            self.adj[i].pop() #Remove a última coluna da matriz
        
        self.adj.pop() #Remove a última linha
        self.n -= 1 #Decrementa um vértice
        
    def ehCompleto(self): # Ex 11
        if((self.n ** 2) - self.n == self.m):
            return "O grafo é completo"
        return "O grafo não é completo"

# Métodos

## 1. Ler dados

## 2. Gravar dados

## 3. Inserir vértice

## 4. Inserir aresta

## 5. Remover vértice

## 6. Remover aresta

## 7. Mostrar conteúdo

## 8. Mostrar grafo

## 9. Apresentar conexidade do grafo e o reduzido

## 10. Encerrar a aplicação

# Menu

In [12]:
import os, time

grafo = Grafo() #Cria objeto grafo
while(True):
    choice = int(input(
'''
Menu:
    1) Ler dados do arquivo grafo.txt
    2) Gravar dados no arquivo grafo.txt
    3) Inserir vértice
    4) Inserir aresta
    5) Remove vértice
    6) Remove aresta
    7) Mostrar conteúdo do arquivo
    8) Mostrar grafo
    9) Apresentar a conexidade do grafo e o reduzido
    10) Encerrar a aplicação
'''))
    if choice == 1: # Lê grafo
        grafo.leGrafo()
        print("Grafo lido com sucesso!")
    
    elif choice == 2: # Grava dados no arquivo .txt
        print("oi")

    elif choice == 3: # Insere vértice
        print("oi")
    
    elif choice == 4: # Insere aresta
        print("oi")

    elif choice == 5: # Remove vértice
        print("oi")

    elif choice == 6: # Remove varesta
        print("oi")

    elif choice == 7: # Imprime arquivo
        print("oi")

    elif choice == 8: # Exibe grafo
        print("oi")

    elif choice == 9: # Apresenta a conexidade do grafo e grafo reduzido
        print("oi")

    elif choice == 10: # Encerra
        exit()
    
    else:
        print("Escolha inválida!")
    
    time.sleep(3) #Volta para o menu após 3 segundos
    os.system('clear') #OBS: Trocar para 'cls' no Windows
