## BFS

### Iterativo

In [10]:
graph = {'A': set(['B', 'C']),
         'B': set(['A', 'D', 'E']),
         'C': set(['A', 'F']),
         'D': set(['B']),
         'E': set(['B', 'F']),
         'F': set(['C', 'E'])}

def dfs(graph, start):
    visited, stack = set(), [start]
    while stack:
        vertex = stack.pop()
        if vertex not in visited:
            visited.add(vertex)
            stack.extend(graph[vertex] - visited)
    return visited

print(dfs(graph, 'C'))

{'F', 'B', 'D', 'C', 'E', 'A'}


### Paralelo - MapReduce

In [112]:
from pyspark import SparkFiles
from operator import add

sc = SparkContext.getOrCreate()

class BFS:
    
    def search(self, graphRDD, origem, destino):
        contein = []
        lista_visitados = [origem]
        v = destino
        len_graph = graphRDD.flatMap(lambda x: x.items()).count()
        todos_percorridos = [origem]
        while contein == [] and len_graph >=len(todos_percorridos): # verifica ciclo
            lista_visitados = graphRDD.flatMap(lambda x: x.items())\
                                  .filter(lambda x: x[0] in lista_visitados)\
                                  .map(lambda x: x[1])\
                                  .flatMap(lambda x: x)\
                                  .map(lambda x: (x,1))\
                                  .reduceByKey(add)\
                                  .map(lambda x: x[0])
            contein = lista_visitados.filter(lambda x: x == v).collect()
            lista_visitados = lista_visitados.collect()
            todos_percorridos.append(lista_visitados)
            if len(todos_percorridos) > 3:
                if todos_percorridos[-1] == todos_percorridos[-2] and todos_percorridos[-2] == todos_percorridos[-3]:
                    break
        return sc.parallelize(todos_percorridos, 4).flatMap(lambda x: x).distinct()


if __name__ == "__main__":
    graphCiclo = [{'A': set(['B',]),
             'B': set(['C']),
             'C': set(['A']),
             'D': set(['B']),
             'E': set(['B', 'F']),
             'F': set(['C', 'E'])}]

    graph = [{'A': set(['B', 'C', 'D']),
         'B': set(['A', 'D', 'E']),
         'C': set(['A', 'F']),
         'D': set(['B']),
         'E': set(['B', 'F']),
         'F': set(['C', 'E'])}]
    
    bfs_parallel = BFS()
        
    print("Ciclo")
    print(bfs_parallel.search(sc.parallelize(graphCiclo, 4), "A", "D").collect())
    print("Sem Ciclo")
    print(bfs_parallel.search(sc.parallelize(graph, 4), "A", "D").collect())

Ciclo
['A', 'B', 'C']
Sem Ciclo
['A', 'B', 'C', 'D']
