# Desafio

Com base nas informações contidas na lista pública de discentes ativos no cuso Gestão da Informação (UFG), disponível em https://sigaa.sistemas.ufg.br/sigaa/public/curso/alunos.jsf?lc=pt_BR&id=69675808, construa uma solução usando busca em profundidade e busca em largura, de forma separada, que, dado o nome de duas pessoas (ou números de matrícula), deverá retornar o caminho, com base nas conexões de sobrenome, entre as duas pessoas.

O código deverá mostrar tanto o caminho usando BFS quanto o caminho usando DFS. Explique, dentro do próprio notebook, as diferenças entre os resultados obtidos pelos dois algoritmos. Observação: deverá ser enviado o arquivo .ipynb com as células já executadas. Envios fora do prazo ou por outro meio que não o SIGAA serão desconsiderados.


### Extrair dados do SIGAA com Javascript via console

```javascript
const linhasDeAlunos = document.querySelectorAll(
  "#table_lt tr.linhaPar, #table_lt tr.linhaImpar"
);

const dadosFormatados = Array.from(linhasDeAlunos).map((linha) => {
  const matricula = linha.cells[0].textContent.trim();
  const nome = linha.cells[1].textContent.trim();

  return `${nome}, ${matricula}`;
});

console.log(dadosFormatados.join("\n"));
```


#### Regra:

- Dois alunos (nós) são conectados por uma aresta se eles compartilharem pelo menos um sobrenome.
- Consideramos como sobrenome qualquer palavra do nome, exceto a primeira


In [43]:
!pip install --upgrade pip
!pip install nltk
!pip install requests
!pip install beautifulsoup4
!pip install unidecode

Collecting unidecode
  Downloading Unidecode-1.4.0-py3-none-any.whl.metadata (13 kB)
Downloading Unidecode-1.4.0-py3-none-any.whl (235 kB)
Installing collected packages: unidecode
Successfully installed unidecode-1.4.0


In [46]:
import nltk
import time
import requests
from bs4 import BeautifulSoup
from unidecode import unidecode

In [None]:
url = "https://sigaa.sistemas.ufg.br/sigaa/public/curso/alunos.jsf?lc=pt_BR&id=69675808"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"
}

discentes_map = {}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()

    soup = BeautifulSoup(response.content.decode("utf-8"), "html.parser")
    tabela_alunos = soup.find("table", id="table_lt")

    if tabela_alunos:
        linhas = tabela_alunos.find_all("tr", class_=["linhaPar", "linhaImpar"])

        print("Iniciando extração de dados...\n")
        for linha in linhas:
            celulas = linha.find_all("td")

            if len(celulas) >= 2:
                matricula = celulas[0].get_text(strip=True)
                nome = celulas[1].get_text(strip=True)
                nome = unidecode(nome).upper()

                discentes_map[nome] = matricula

                print(f"Matrícula: {matricula}, Nome: {nome}")

        print("\nExtração concluída.")
        print(f"Total de discentes extraídos: {len(discentes_map)}")
    else:
        print("A tabela com o ID 'table_lt' não foi encontrada na página.")

except requests.exceptions.RequestException as e:
    print(f"Ocorreu um erro ao acessar a URL: {e}")

Iniciando extração de dados...

Matrícula: 202204260, Nome: ALESSANDRA ANTUNES RODRIGUES SOUZA
Matrícula: 202406372, Nome: ALEXANDRE HENRIQUE DA SILVA SANTOS
Matrícula: 202206316, Nome: AMANDA PIRES GERMANO ALVES
Matrícula: 202503867, Nome: ANA CLARA NASCIMENTO ALVES
Matrícula: 202503868, Nome: ANDRE CINTRA DA SILVA LOBO
Matrícula: 202105702, Nome: ANDRE LUCAS OLIVEIRA SILVA
Matrícula: 202303208, Nome: ANDRESSA BELTRAO DE SOUZA
Matrícula: 202503869, Nome: ANDRE VILELA CALATAYUD CASTROVIEJO
Matrícula: 202202303, Nome: ANNA CLARA SANTANA DOS SANTOS
Matrícula: 202202304, Nome: ANNA LAURA MAGALHAES PORTO
Matrícula: 202503870, Nome: ANTHONY REGAN
Matrícula: 202503871, Nome: ARTHUR FERREIRA LOUREIRO MAIOR
Matrícula: 202202306, Nome: ARTHUR OLIVEIRA TAVARES
Matrícula: 202105705, Nome: ARTHUR SILVA GOMES
Matrícula: 202303209, Nome: AUGUSTO CESAR CANDIDO DE OLIVEIRA
Matrícula: 202503872, Nome: AUGUSTO TORRES DO CARMO
Matrícula: 202303210, Nome: BEATRIZ CAROLINA DARA NEVES SALDANHA
Matrícula: 20

In [52]:
print(discentes_map)

{'ALESSANDRA ANTUNES RODRIGUES SOUZA': '202204260', 'ALEXANDRE HENRIQUE DA SILVA SANTOS': '202406372', 'AMANDA PIRES GERMANO ALVES': '202206316', 'ANA CLARA NASCIMENTO ALVES': '202503867', 'ANDRE CINTRA DA SILVA LOBO': '202503868', 'ANDRE LUCAS OLIVEIRA SILVA': '202105702', 'ANDRESSA BELTRAO DE SOUZA': '202303208', 'ANDRE VILELA CALATAYUD CASTROVIEJO': '202503869', 'ANNA CLARA SANTANA DOS SANTOS': '202202303', 'ANNA LAURA MAGALHAES PORTO': '202202304', 'ANTHONY REGAN': '202503870', 'ARTHUR FERREIRA LOUREIRO MAIOR': '202503871', 'ARTHUR OLIVEIRA TAVARES': '202202306', 'ARTHUR SILVA GOMES': '202105705', 'AUGUSTO CESAR CANDIDO DE OLIVEIRA': '202303209', 'AUGUSTO TORRES DO CARMO': '202503872', 'BEATRIZ CAROLINA DARA NEVES SALDANHA': '202303210', 'BERTRAND OTONIEL PEREIRA CARVALHO': '202503873', 'BETHANYA DA SILVA CARDOSO': '202202307', 'BRENDA MEL BARBOSA SILVA': '202403763', 'BRENO PONTES OLIVEIRA': '202001256', 'CAMILA BARROS CARREIRO': '201709226', 'CARLA FERNANDA PEREIRA DIAS': '202403

In [None]:
nltk.download("stopwords")
stopwords = set(nltk.corpus.stopwords.words("portuguese"))
stopwords = set(sw.upper() for sw in stopwords)
stopwords.update(["DA", "DEDO", "DOS"])

[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


In [61]:
print(list(stopwords))

['SEU', 'DEPOIS', 'ESSAS', 'À', 'SER', 'TIVESSEM', 'ESTÁVAMOS', 'FOSSEM', 'ESTE', 'SEJA', 'ISTO', 'ME', 'UMA', 'TENHA', 'HOUVESSE', 'LHE', 'HOUVERIAM', 'TEUS', 'TU', 'ELES', 'LHES', 'MAIS', 'NAS', 'ESTEJAMOS', 'VOCÊS', 'ENTRE', 'OU', 'TEM', 'ELA', 'MINHA', 'QUE', 'SOU', 'SEM', 'TINHA', 'FOREM', 'TE', 'AQUELAS', 'AOS', 'SERIA', 'ESTAS', 'HOUVEREM', 'PELAS', 'ESTAMOS', 'ESTIVER', 'HAJAM', 'ESTIVÉSSEMOS', 'COMO', 'SERÁ', 'ESSA', 'ELE', 'AS', 'NOS', 'HOUVEREMOS', 'DELES', 'TEREI', 'TIVESSE', 'FORMOS', 'HOUVEREI', 'NEM', 'É', 'HAJAMOS', 'ESTIVESSE', 'HOUVERÃO', 'SEREMOS', 'E', 'TUAS', 'HOUVERAM', 'MAS', 'TEMOS', 'TIVE', 'SERÍAMOS', 'HOUVÉSSEMOS', 'EU', 'HAJA', 'ESTAVAM', 'TIVEREM', 'ESTIVEREM', 'FORA', 'ESSE', 'AQUELES', 'FOI', 'TIVEMOS', 'SERÃO', 'HOUVERA', 'DE', 'TIVER', 'SEJAMOS', 'ESTEVE', 'ÉRAMOS', 'DELA', 'HOUVEMOS', 'COM', 'TENHAM', 'ÀS', 'SEREI', 'SUAS', 'TENHO', 'ESTAR', 'VOS', 'FOSSE', 'TEREMOS', 'AO', 'DELAS', 'ISSO', 'TIVERAM', 'TERÁ', 'ESTEJAM', 'FOMOS', 'TAMBÉM', 'HÁ', 'DEDO',

In [64]:
matricula_map = {v: k for k, v in discentes_map.items()}
nomes_discentes = list(discentes_map.keys())

print("Dados carregados com sucesso!")
print(f"Total de discentes: {len(nomes_discentes)}")
print(nomes_discentes)
print(matricula_map)

Dados carregados com sucesso!
Total de discentes: 165
['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'ALEXANDRE HENRIQUE DA SILVA SANTOS', 'AMANDA PIRES GERMANO ALVES', 'ANA CLARA NASCIMENTO ALVES', 'ANDRE CINTRA DA SILVA LOBO', 'ANDRE LUCAS OLIVEIRA SILVA', 'ANDRESSA BELTRAO DE SOUZA', 'ANDRE VILELA CALATAYUD CASTROVIEJO', 'ANNA CLARA SANTANA DOS SANTOS', 'ANNA LAURA MAGALHAES PORTO', 'ANTHONY REGAN', 'ARTHUR FERREIRA LOUREIRO MAIOR', 'ARTHUR OLIVEIRA TAVARES', 'ARTHUR SILVA GOMES', 'AUGUSTO CESAR CANDIDO DE OLIVEIRA', 'AUGUSTO TORRES DO CARMO', 'BEATRIZ CAROLINA DARA NEVES SALDANHA', 'BERTRAND OTONIEL PEREIRA CARVALHO', 'BETHANYA DA SILVA CARDOSO', 'BRENDA MEL BARBOSA SILVA', 'BRENO PONTES OLIVEIRA', 'CAMILA BARROS CARREIRO', 'CARLA FERNANDA PEREIRA DIAS', 'CARLOS HENRIQUE DIOGO RUST', 'DAIANE MOREIRA MELO', 'DAIANE SOUZA VITOR', 'DANIEL MARIANO FELIX ARAUJO', 'DANIEL VIEIRA MARQUES', 'DANIEL XAVIER CASTRO', 'DANYEVILLIN COSTA SOUZA', 'DAVID DANIEL DE ANDRADE RODRIGUES', 'DAVID DO NASCIMENTO

In [None]:
graph = {nome: [] for nome in nomes_discentes}

for i in range(len(nomes_discentes)):
    for j in range(i + 1, len(nomes_discentes)):
        nome = nomes_discentes[i]
        nome_compara = nomes_discentes[j]

        sobrenome = set(word for word in nome.split()[1:] if word not in stopwords)
        sobrenome_compara = set(
            word for word in nome_compara.split()[1:] if word not in stopwords
        )

        if sobrenome.intersection(sobrenome_compara):
            graph[nome].append(nome_compara)
            graph[nome_compara].append(nome)

print("Grafo construído.")
print(graph)

for v, k in graph.items():
    print(f"{v}: {k}")

Grafo construído.
{'ALESSANDRA ANTUNES RODRIGUES SOUZA': ['ANDRESSA BELTRAO DE SOUZA', 'DAIANE SOUZA VITOR', 'DANYEVILLIN COSTA SOUZA', 'DAVID DANIEL DE ANDRADE RODRIGUES', 'GABRIEL MENDES RODRIGUES SILVA', 'GABRIEL PEDRO ANTUNES SOUSA', 'GUILHERME RODRIGUES DE SOUZA BARROS E SILVA', 'ISIS SOUZA ELIAS', 'KAEL DIAS RODRIGUES', 'LEONOR LISSA RODRIGUES DE OLIVEIRA', 'LUIZA RODRIGUES MIRANDA', 'MARIA CLARA RODRIGUES DE OLIVEIRA', 'MARINA DE PADUA PEREIRA RODRIGUES', 'NOADIA KELLY SOUZA SANTOS', 'PAULA LETICIA ARAUJO DE SOUZA', 'PEDRO JOSE DE SOUZA MARQUES'], 'ALEXANDRE HENRIQUE DA SILVA SANTOS': ['ANDRE CINTRA DA SILVA LOBO', 'ANDRE LUCAS OLIVEIRA SILVA', 'ANNA CLARA SANTANA DOS SANTOS', 'ARTHUR SILVA GOMES', 'BETHANYA DA SILVA CARDOSO', 'BRENDA MEL BARBOSA SILVA', 'CARLOS HENRIQUE DIOGO RUST', 'EDUARDO OLIVEIRA DOS SANTOS', 'ELOISA NATHYELLE DA COSTA SILVA', 'ENZO EDUARDO BRITO DOS SANTOS', 'ESTHELA KAROLYNE SILVA NASCIMENTO', 'FABIANY CRISTINA SANTOS NUNES', 'FERNANDO HENRIQUE GONCALVES 

In [None]:
# Busca em Profundidade (DFS)


def dfs(graph, start, end, path=None):
    print(path)

    if path is None:
        path = [start]

    if start == end:
        return path

    for neighbor in graph.get(start, []):
        if neighbor not in path:
            new_path = dfs(graph, neighbor, end, path + [neighbor])
            if new_path is not None:
                return new_path

    return None


start = time.time()
resultado_dfs = dfs(
    graph, "ALESSANDRA ANTUNES RODRIGUES SOUZA", "FELIPE ALVES DE QUEIROZ"
)
print(resultado_dfs)
end = time.time()

print("RESULTADO DA BUSCA (DFS)")
if resultado_dfs:
    print("Caminho encontrado:")
    print(" -> ".join(resultado_dfs))
    print(f"Número de conexões: {len(resultado_dfs) - 1}")
else:
    print("Nenhum caminho encontrado.")

print(f"Tempo de execução: {round(end - start, 5)} segundos")

None
['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'ANDRESSA BELTRAO DE SOUZA']
['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'ANDRESSA BELTRAO DE SOUZA', 'DAIANE SOUZA VITOR']
['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'ANDRESSA BELTRAO DE SOUZA', 'DAIANE SOUZA VITOR', 'DANYEVILLIN COSTA SOUZA']
['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'ANDRESSA BELTRAO DE SOUZA', 'DAIANE SOUZA VITOR', 'DANYEVILLIN COSTA SOUZA', 'ELOISA NATHYELLE DA COSTA SILVA']
['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'ANDRESSA BELTRAO DE SOUZA', 'DAIANE SOUZA VITOR', 'DANYEVILLIN COSTA SOUZA', 'ELOISA NATHYELLE DA COSTA SILVA', 'ALEXANDRE HENRIQUE DA SILVA SANTOS']
['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'ANDRESSA BELTRAO DE SOUZA', 'DAIANE SOUZA VITOR', 'DANYEVILLIN COSTA SOUZA', 'ELOISA NATHYELLE DA COSTA SILVA', 'ALEXANDRE HENRIQUE DA SILVA SANTOS', 'ANDRE CINTRA DA SILVA LOBO']
['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'ANDRESSA BELTRAO DE SOUZA', 'DAIANE SOUZA VITOR', 'DANYEVILLIN COSTA SOUZA', 'ELOISA NATHYELLE DA COSTA SILVA', 'ALEXA

In [None]:
# Busca em Largura (BFS)
from collections import deque


def bfs(grafo, inicio, fim):
    if inicio not in grafo or fim not in grafo:
        print("Erro: Nó de início ou de fim não encontrado no grafo.")
        return None

    fila = deque([[inicio]])
    visitados = {inicio}
    contador_passos = 1

    print("INICIANDO BUSCA EM LARGURA (BFS)")
    print(f"Nó Inicial: '{inicio}'")
    print(f"Nó Destino: '{fim}'")
    print("-" * 40)

    while fila:
        print(f"Passo {contador_passos}")
        print(f"Estado ATUAL da Fila: {list(fila)}")

        caminho = fila.popleft()
        no_atual = caminho[-1]

        print(f"Processando o caminho -> {caminho}")
        print(f"Nó atual sendo analisado: '{no_atual}'")

        if no_atual == fim:
            print("\n CAMINHO ENCONTRADO!")
            return caminho

        print(f"Verificando vizinhos de '{no_atual}': {grafo.get(no_atual, [])}")
        for vizinho in grafo.get(no_atual, []):
            if vizinho not in visitados:
                visitados.add(vizinho)
                novo_caminho = list(caminho)
                novo_caminho.append(vizinho)
                fila.append(novo_caminho)
                print(f"-> Vizinho '{vizinho}' é novo! Adicionando caminho à fila.")
            else:
                print(f"-> Vizinho '{vizinho}' já foi visitado. Ignorando.")

        print("-" * 40)
        contador_passos += 1

    print("FIM DA BUSCA: DESTINO NÃO ENCONTRADO.")
    return None


start = time.time()
caminho_bfs = bfs(
    graph, "ALESSANDRA ANTUNES RODRIGUES SOUZA", "FELIPE ALVES DE QUEIROZ"
)
print(caminho_bfs)
print(f"Número de conexões: {len(caminho_bfs) - 1}")
end = time.time()
print(f"Tempo de execução: {round(end - start, 4)} segundos")

NTOS BATISTA SOUSA'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'GABRIEL PEDRO ANTUNES SOUSA', 'RENATO PEDRO DOS SANTOS'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'GUILHERME RODRIGUES DE SOUZA BARROS E SILVA', 'CAMILA BARROS CARREIRO'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'GUILHERME RODRIGUES DE SOUZA BARROS E SILVA', 'LUCAS SANTOS BARROS'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'KAEL DIAS RODRIGUES', 'CARLA FERNANDA PEREIRA DIAS'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'KAEL DIAS RODRIGUES', 'GEOVANA GONCALVES DIAS'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'LEONOR LISSA RODRIGUES DE OLIVEIRA', 'ARTHUR OLIVEIRA TAVARES'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'LEONOR LISSA RODRIGUES DE OLIVEIRA', 'AUGUSTO CESAR CANDIDO DE OLIVEIRA'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'LEONOR LISSA RODRIGUES DE OLIVEIRA', 'BRENO PONTES OLIVEIRA'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'LEONOR LISSA RODRIGUES DE OLIVEIRA', 'EDUARDO OLIVEIRA DOS SANTOS'], ['ALESSANDRA ANTUNES RODRIGUES SOUZA', 'LE

# Conclusão

O algoritmo de busca em largura (BFS) é um algoritmo de busca não informada que explora todos os vértices de um grafo em largura, ou seja, visita todos os vértices vizinhos de um vértice antes de visitar os vértices vizinhos dos vizinhos. Começando pelo nó inicial, ela visita primeiro todos os seus vizinhos diretos (distância 1). Depois, visita todos os vizinhos desses vizinhos (distância 2), e assim por diante. O algoritmo BFS, garante encontrar um caminho ótimo. Enquanto o algoritmo de DFS não garante encontrar o caminho mais curto, pois ele explora o grafo em profundidade, ou seja, visita o primeiro vizinho de um vértice, depois o primeiro vizinho desse vizinho, e assim por diante, até que não haja mais vizinhos para visitar. Onde DFS só explorará o caminho mais curto, depois de esgotar outras possibilidades.

A questão é que o algoritmo DFS é mais eficiente em termos de memória que a BFS, pois só precisa armazenar o caminho atual em que está "aprofundando", e não todas as ramificações de uma camada, como podemos observar no exemplo acima.

Exemplo:
Conexões BFS = 3 - Menor número de conexões maior número de passos
Conexões DFS = 15 - Maior número de conexões menor número de passos
