In [22]:
from graphviz import Digraph
from queue import Queue
    
# TRIE 노드 클래스
class TrieNode(object):
    def __init__(self, value, morph=None):
        # 노드의 값 (음절)
        self.value = value
        # 노드의 형태소 (None이면 끝나는 형태소로 가능하다는 뜻. 즉 강의자료에서 is_leaf = 1)
        self.morph = morph
        # 노드의 자식 노드들
        self.children = {}
        # 부모노드
        self.parent = None
        
    # 노드의 완성형 문자열 계산
    def to_string(self):
        parent_node = self.parent
        string = self.value
        while parent_node is not None:
            string = string + parent_node.value
            parent_node = parent_node.parent
        return string
        
# TRIE 구조 클래스        
class Trie(object):
    def __init__(self):
        self.head = TrieNode(None)
    
    """
    사전에 문자열 추가
    """
    def add_word(self, word, morph):
        cur_node = self.head
        
        for char in word:
            if char not in cur_node.children:
                cur_node.children[char] = TrieNode(char)
                cur_node.children[char].value = char
                cur_node.children[char].parent = cur_node
                
            cur_node = cur_node.children[char]
            
        # 형태소 값 및 좌우접속정보를 저장
        cur_node.morph = morph
        
    
    """
    문자열이 TRIE에 존재하는지 검색하기
    """
    def search(self, word):
        cur_node = self.head
        
        for char in word:
            if char in cur_node.children:
                cur_node = cur_node.children[char]
            else:
                return False
            
        if (cur_node.data != None):
            return True
    
    
    """
    prefix로 시작하는 단어를 가진 TRIE 노드들을 검색하기
    """
    def search_prefix(self, prefix):
        cur_node = self.head
        # 결과 노드 리스트
        nodes = []
        # prefix로 시작하는 첫번째 노드
        prefix_node = None
        
        # TRIE에서 prefix로 시작하는 첫번째 노드를 검색하기
        for char in prefix:
            if char in cur_node.children:
                cur_node = cur_node.children[char]
                prefix_node = cur_node
            else:
                return None
            
        # prefix로 시작하는 모든 서브 노드들을 검색하여 nodes에 추가
        queue = list(prefix_node.children.values())
        
        while queue:
            cur = queue.pop()
            if cur.data != None:
                nodes.append(curr.data)
            
            queue += list(curr.children.values())
                
        return nodes
    
    
    def render(self, filename):
        i = 0
        diagram = Digraph(comment='Trie')
        diagram.attr('node', fontsize='4')
        diagram.attr('node', height='0.1')
        diagram.attr('node', width='0.1')
        diagram.attr('node', fixedsize='true')
        diagram.attr('node', shape='circle')
        diagram.attr('edge', arrowsize='0.3')
        diagram.node(str(i), self.head.value)

        q = Queue()
        q.put((self.head, i))

        # 트리 노드를 순회하며 그래프 생성
        while not q.empty():
            node, parent_index = q.get()

            for child in node.children:
                i += 1
                # 끝맺을 수 있는 형태소라면 
                if child.morph == None:
                    diagram.attr('node', shape='diamond')
                    diagram.node(str(i), child.value)
                    diagram.attr('node', shape='circle')
                else:
                    diagram.node(str(i), child.value)
                diagram.edge(str(parent_index), str(i))
                q.put((child, i))

        o = open(filename + '.gv', 'w')
        o.write(diagram.source)
        diagram.render(filename, view=False)
        o.close()
    
def tabular_parsing(trie, ):
    pass

def ispass(line):
    return line.startswith("#") or not line or line.isspace() or (len(line) == 1 and line == '\r')
    
trie = Trie()

o = open('grammer.txt', 'r')
for line in o.readlines():
    if ispass(line):
        continue
    word, morph = line.split('\t')
    trie.add_word(word, morph)
o.close()

trie.render("test")
    

﻿


AttributeError: 'str' object has no attribute 'morph'

In [10]:
not ""

True