# Lab02 : Graphs - Implement BFS and DFS on Graphs

## 1.	Sơ lược về các kiểu dữ liệu trừu tượng đồ thị

Ta sử dụng từ điển để cài đặt danh sách kề. Kiểu dữ liệu trừu tượng `Graph` sẽ có hai lớp: 

- `Graph` – chứa danh sách các đỉnh, và 

- `Vertex` - cho mỗi đỉnh trong đồ thị.

Mỗi `Vertex` là một từ điển tên `connectTo` giữ các đỉnh khác kề với nó và trọng số của cạnh tương ứng. 

In [1]:
from Queue import Queue

In [2]:
class Vertex(object):
    """Describes a vertex object in terms of a "key" and a
    dictionary that indicates edges to neighboring vertices with
    a specified weight.
    """
    def __init__(self, key):
        """Constructs a vertex with a key value (no payload in
        this example), and an empty dictionary in which we'll
        store other vertices to which this vertex is connected.
        """
        self.id = key
        self.connectedTo = {}   # empty dictionary for vertices
        self.color = 'white'
        self.distance = 0
        self.predecessor = None
        self.discovery = 0           # discovery time
        self.finish = 0            # finish time

    def addNeighbor(self, neighbor, weight=0):
        """Creates a new vertex entry in the dictionary, to which this
        vertex is connected by an edge. If a weight is not indicated,
        default weight is 0.
        """
        self.connectedTo[neighbor] = weight

    def setColor(self, color):
        self.color = color
    
    def getColor(self):
        return self.color

    def setDistance(self, distance):
        self.distance = distance

    def getDistance(self):
        return self.distance

    def setPred(self, predecessor):
        self.predecessor = predecessor

    def getPred(self):
        return self.predecessor

    def setDiscovery(self, dtime):
        self.discovery = dtime

    def getDiscovery(self):
        return self.discovery

    def setFinish(self, ftime):
        self.finish = ftime

    def getFinish(self):
        return self.finish

    def getConnections(self):
        """Returns the id values of the vertices we're connected to
        """
        return self.connectedTo.keys()

    def getId(self):
        return self.id

    def getWeight(self, neighbor):
        return self.connectedTo[neighbor]

    def __repr__(self):
        """Returns a representation of the graph, suitable for printing."""
        return "Vertex[id=" + str(self.id) + \
                     ',color=' + self.color + \
                     ",disc=" + str(self.discovery) + \
                     ",fin=" + str(self.finish) + \
                     ",dist=" + str(self.distance) + \
                     ",pred\t[" + str(self.predecessor) + \
                     "],neighbors=" + str([e.id for e in self.connectedTo]) + "]\n"

Lớp `Graph` gồm một từ điển kết buộc tên đỉnh vào đối tượng đỉnh. `Graph` cũng cung cấp các phương thức để thêm một đỉnh vào đồ thị và nối đỉnh này với đỉnh khác. 
- Phương thức getVertices trả về tên nhãn tất cả các đỉnh trong đồ thị. 

- Ngoài ra, phương thức `__iter__` dùng để duyệt qua các đối tượng đỉnh trong đồ thị. 

Hai phương thức này cho phép duyệt các đỉnh theo tên hoặc theo đối tượng.

In [3]:
class Graph(object):
    """Establishes a graph as a dictionary of vertices, where each entry in
    the dictionary has a key = the id of the vertex, and a value that is the
    Vertex object itself.
    """

    def __init__(self):
        self.vertexDict = {}    # includes keys for vertex objects,
                                # with the value the actual Vertex object

    def addVertex(self, key):
        """Takes a key value, creates a vertex object for it, and adds that
        object to the vertex dictionary.
        """
        new_vertex = Vertex(key)
        self.vertexDict[key] = new_vertex   # maps key to Vertex
        return new_vertex

    def getVertex(self, key):
        """Returns the Vertex object associated with this key"""
        if key in self.vertexDict.keys():
            return self.vertexDict[key]
        else:
            return None

    def __contains__(self, vertex):
        """Allows us to use the "in" operator"""
        return vertex in self.vertexDict.keys()

    def addEdge(self, fromKey, toKey, weight=0):
        """If we don't already have a Vertex object for either key, create
        one and add it to the vertex dictionary. Then add the second vertex
        as a neighbor to the first, thus creating an edge in the graph.
        """
        if fromKey not in self.vertexDict.keys():
            self.addVertex(fromKey)
        if toKey not in self.vertexDict.keys():
            self.addVertex(toKey)
        self.vertexDict[fromKey].addNeighbor(self.vertexDict[toKey], weight)

    def getVertices(self):
        return self.graph.keys()

    def __iter__(self):
        """Allows us to iterate through the vertices in the graph:
        for vertex in graph:
            # do something with vertex
        """
        return iter(self.vertexDict.values())



Viết chương trình `main()`để tạo `Graph` này và in ra biểu diễn `Python` của nó. Tạo một đồ thị `6` đỉnh, đánh nhãn từ `0` đến `5`, rồi hiển thị các đỉnh đó.
- Lưu ý rằng đối với mỗi khóa từ `0` đến `5`, tạo một thể hiện của `Vertex`. 

- Tiếp theo, thêm các cạnh cho đồ thị. 

- Cuối cùng, hiển thị đồ thị


In [4]:
def main():
    g = Graph()             # Create an empty graph
    for i in range(6):      # Create a series of empty vertices with
        g.addVertex(i)      # simple keys (the numbers 0-5)
        
    g.addEdge(0,1,2)        # Start adding edges connecting the vertices
    g.addEdge(0,5,12)
    g.addEdge(1,2,1)
    g.addEdge(1,3,5)
    g.addEdge(3,2,7)
    g.addEdge(2,4,2)
    g.addEdge(4,3,4)
    g.addEdge(5,4,6)


    # Here's one way of printing out the Graph
    for v in g:     # This is possible because we implemented __iter__
        print(v)
    print("\n--------------\n")
    # Here's another way of printing out the graph
    for v in g:
        for w in v.getConnections():
            print("(%s, %s, %d)" % (v.getId(), w.getId(), v.getWeight(w)))

if __name__ == "__main__":
    main()


Vertex[id=0,color=white,disc=0,fin=0,dist=0,pred	[None],neighbors=[1, 5]]

Vertex[id=1,color=white,disc=0,fin=0,dist=0,pred	[None],neighbors=[2, 3]]

Vertex[id=2,color=white,disc=0,fin=0,dist=0,pred	[None],neighbors=[4]]

Vertex[id=3,color=white,disc=0,fin=0,dist=0,pred	[None],neighbors=[2]]

Vertex[id=4,color=white,disc=0,fin=0,dist=0,pred	[None],neighbors=[3]]

Vertex[id=5,color=white,disc=0,fin=0,dist=0,pred	[None],neighbors=[4]]


--------------

(0, 1, 2)
(0, 5, 12)
(1, 2, 1)
(1, 3, 5)
(2, 4, 2)
(3, 2, 7)
(4, 3, 4)
(5, 4, 6)


## 2.	Breadth-first Search

### Xây dựng đồ thị của các từ có bốn chữ cái (Four-Letter Words)

Sử dụng thông tin ở trên, viết hàm `buildGraph(wordFile)` lấy một tệp từ, xây dựng một từ điển gồm tất cả các từ, sau đó tạo một graph trong mỗi nhóm, trong đó mỗi từ trong một nhóm được kết nối thông qua một cạnh với mọi từ khác trong nhóm đó.


In [5]:
def buildGraph(wordFile):
    d = {}
    g = Graph()
    wfile = open(wordFile,'r')
    # create buckets of words that differ by one letter
    for line in wfile:
        # print(line[-1])
        # last char is '\n'
        word = line[:-1]
        # print(word)
        for i in range(len(word)):
            bucket = word[:i] + '_' + word[i+1:]
            if bucket in d:
                d[bucket].append(word)
            else:
                d[bucket] = [word]
    # add vertices and edges for words in the same bucket
    for bucket in d.keys():
        for word1 in d[bucket]:
            for word2 in d[bucket]:
                if word1 != word2:
                    g.addEdge(word1,word2)
    return g


### Bổ sung một số phương thức cho Vertex class 

In [6]:
def getDistance(self):
        return self.distance

def setPred(self, predecessor):
    self.predecessor = predecessor

def getPred(self):
    return self.predecessor

def setDiscovery(self, dtime):
    self.discovery = dtime

def getDiscovery(self):
    return self.discovery

def setFinish(self, ftime):
    self.finish = ftime

def getFinish(self):
    return self.finish

def getConnections(self):
    """Returns the id values of the vertices we're connected to
    """
    return self.connectedTo.keys()

def getID(self):
    return self.id

def getWeight(self, neighbor):
    return self.connectedTo[neighbor]

def __repr__(self):
    """Returns a representation of the graph, suitable for printing."""
    return "Vertex[id=" + str(self.id) + \
                 ',color=' + self.color + \
                 ",disc=" + str(self.discovery) + \
                 ",fin=" + str(self.finish) + \
                 ",dist=" + str(self.distance) + \
                 ",pred\t[" + str(self.predecessor) + \
                 "],neighbors=" + str([e.id for e in self.connectedTo]) + "]\n"


### Cài đặt BFS 

Đoạn mã sau sử dụng biểu diễn đồ thị bằng danh sách kề. Sử dụng thêm một hàng đợi, để quyết định đỉnh nào sẽ được khám phá tiếp theo.


In [7]:
def bfs(g, start):
    """Performs a BFS on Graph `g` beginning at vertex `start`
    Once we're done, the graph will have identified a series of
    predecessor links that can be followed to a given solution.
    """
    start.setDistance(0)        # this first vertex is 0 away from itself ;)
    start.setPred(None)         # and there's nothing before this vertex
    q = Queue() 
    q.enqueue(start)            # place start vertex in the queue
    while q.size() > 0:
        current_vertex = q.dequeue()    # Get next item in line
        for neighbor in current_vertex.getConnections():
            if neighbor.getColor() == "white":      # first time seeing it
                neighbor.setColor("gray")
                neighbor.setDistance(current_vertex.getDistance() + 1)
                neighbor.setPred(current_vertex)
                q.enqueue(neighbor)
            # once we've explored all the neighbors...
        current_vertex.setColor("black")


Khi đã thi hành `BFS`, có thể bắt đầu ở bất kỳ đỉnh nào trong cây tìm kiếm BFS và lần theo nút trước quay trở lại gốc là đỉnh xuất phát. Hàm sau chỉ ra cách lần theo các liên kết nút trước để in ra thang từ.

In [8]:
def traverse(y):
    x = y
    while (x.getPred()):
        print(x.getId())
        x = x.getPred()
    print(x.getId())


Viết chương trình main() để tạo `BFSGraph` này và in ra biểu diễn Python của nó. Với data `“fourletterwords.txt”`
Xem data tại: https://www.dropbox.com/s/3iag8n3mzps6ny5/fourletterwords.txt?dl=0


In [9]:
if __name__ == '__main__':
    wordgraph = buildGraph("fourletterwords.txt")
    bfs(wordgraph, wordgraph.getVertex('FOOL'))
    traverse(wordgraph.getVertex('SAGE'))

SAGE
SALE
SALL
MALL
MOLL
MOOL
FOOL


## 3. Depth First Search

`DFS` có thể sẽ tạo ra nhiều hơn một cây, gọi là rừng. Như `BFS`, đầu tiên, DFS sử dụng các cung trước để xây dựng cây. Ngoài ra, `DFS` sẽ sử dụng hai biến bổ sung trong lớp Vertex. Các biến này giữ số lần khám phá `(time)` và kết thúc `(finish)`. Số lần khám phá là số bước trong thuật toán tính từ đỉnh đầu tiên. Số lần kết thúc là số bước trong thuật toán trước khi một đỉnh màu đen.


In [10]:
class DFSGraph(Graph):
    """Used to create a depth first forest. Inherits from the
    Graph class, but also adds a `time` variable used to track
    distances along the graph, as well as the two methods below.
    """
    
    def __init__(self):
        super().__init__()
        self.time = 0       # allows us to keep track of times when vertices
                            # are "discovered"
    
    def dfs(self):
        """Keeps track of time (ie. depth) across calls to dfsvisit
        for *all* nodes, not just a single node: we want to make sure
        that all nodes are considered, and that no vertices are left
        out of the forest.
        """
        for aVertex in self:            # iterate over all vertices
            aVertex.setColor('white')   # initial value of unexamined vertex
            aVertex.setPred(-1)         # no predecessor for first vertex
        for aVertex in self:            # now start working our way through
            if aVertex.getColor() == 'white':   # a depth-first exploration
                self.dfsvisit(aVertex)          # of the vertices
    
    def dfsvisit(self, startVertex):
        """Effectively uses a stack (by calling itself recursively) to
        explore down through the depth of the graph.
        """
        startVertex.setColor('gray')        # Gray color indicates that this
                                            # vertex is the one being explored
        self.time += 1                      # Increment the timer
        startVertex.setDiscovery(self.time) # Record the current time for this 
                                            # vertex's discovery
        for nextVertex in startVertex.getConnections(): # check all connections
            if nextVertex.getColor() == 'white':        # if we've touched this
                nextVertex.setPred(startVertex)         # reset pred to our start
                self.dfsvisit(nextVertex)               # continue depth search
        startVertex.setColor('black')       # After exploring all the way down
        self.time += 1                      # Last increment
        startVertex.setFinish(self.time)    # Stop "timing"



Nhớ lại rằng lớp Graph, mà từ đó DFSGraph kế thừa, đã có các phương thức mà chúng ta có thể sử dụng để thêm các đỉnh và cạnh vào đồ thị.

Viết chương trình main() để tạo DFSGraph này và in ra biểu diễn Python của nó.


In [11]:
if __name__ == '__main__':

    g = DFSGraph()
    g.addVertex('A')
    g.addVertex('B')
    g.addVertex('C')
    g.addVertex('D')
    g.addVertex('E')
    g.addVertex('F')
    g.addEdge('A', 'B', 1)
    g.addEdge('B', 'C', 1)
    g.addEdge('A', 'D', 1)
    g.addEdge('B', 'D', 1)
    g.addEdge('D', 'E', 1)
    g.addEdge('E', 'F', 1)
    g.addEdge('F', 'C', 1)
    g.addEdge('E', 'B', 1)
    g.dfs()
    
    for node in g:
        print(node.getId(), node.getDiscovery(), node.getFinish())


A 1 12
B 2 11
C 3 4
D 5 10
E 6 9
F 7 8
