# Knowledge Structure Graph Generator

## 1. DB연결

In [1]:
import pymysql

In [2]:
juso_db = pymysql.connect(
    user='root', 
    passwd='1234', 
    host='127.0.0.1', 
    db='test', 
    charset='utf8'
)

In [3]:
cursor = juso_db.cursor(pymysql.cursors.DictCursor)

In [4]:
sql = "SELECT * FROM knowledge_structure;"
cursor.execute(sql)
result = cursor.fetchall()

In [5]:
import pandas as pd

result = pd.DataFrame(result)
print("------------------------------지식구조 목록 리스트------------------------------")
print(result) #지식구조 목록 리스트화

------------------------------지식구조 목록 리스트------------------------------
  DOC_ID COT_MODE                                KNOWLEDGE_STRUCTURE
0   Hemp      scs  hemp,paper,5.7\nus,varieti,5.76\nhemp,us,5.78\...
1      차      scs  포함,식별자,1.01\n문서,식별자,1.1\n위키백과,식별자,1.18\n녹차,청차,...
2     차2      scs  홍차,청차,3.21\n지역,해당,3.79\n녹차,청차,3.86\n시기,분류,4.44...
3     햄프      scs  필요,확장,1.0\n외부,링크,1.0\n식별자,국가,1.0\n식별자,과거,1.0\n...


In [6]:
knowledge_structure = result['KNOWLEDGE_STRUCTURE']

## 2. 데이터 선택

In [7]:
data = knowledge_structure[2] #인덱스만 변경하기
print(data)

홍차,청차,3.21
지역,해당,3.79
녹차,청차,3.86
시기,분류,4.44
사용,경우,4.68
방법,원래,4.85
가공,분류,5.08
경우,원래,5.3
과정,위조,5.45
녹차,일본,5.56
청차,다음,5.59
경우,가공,5.66
방법,일본,5.69
발효,위조,5.75
발효,방법,5.77
해당,원래,5.99
중국,사용,6.0
중국,차나무,6.23
사용,차나무,6.23
시대,분류,6.26



In [8]:
import re

contents = re.split('\n', data)
contents = contents[:-1] #맨 끝 데이터는 공백

In [9]:
#노드 추가
for content in contents:
    value = re.split(',', content) # ,단위로 구분하여 리스트화
    print(value)

['홍차', '청차', '3.21']
['지역', '해당', '3.79']
['녹차', '청차', '3.86']
['시기', '분류', '4.44']
['사용', '경우', '4.68']
['방법', '원래', '4.85']
['가공', '분류', '5.08']
['경우', '원래', '5.3']
['과정', '위조', '5.45']
['녹차', '일본', '5.56']
['청차', '다음', '5.59']
['경우', '가공', '5.66']
['방법', '일본', '5.69']
['발효', '위조', '5.75']
['발효', '방법', '5.77']
['해당', '원래', '5.99']
['중국', '사용', '6.0']
['중국', '차나무', '6.23']
['사용', '차나무', '6.23']
['시대', '분류', '6.26']


## 3. Data JavaScript File 생성

### 파일 2개 생성
* keyword.js : data(nodes, edges)
* keyword.html : graph

### 01. keyword.js

In [482]:
import networkx as nx

In [556]:
G = nx.Graph()

In [557]:
# 에지리스트를 그래프에 넣기 : 그래프에 입력된 노드 확인용
for content in contents:
    tmp = re.split(',', content)
    G.add_edge(tmp[0], tmp[1], weight = tmp[2])

In [558]:
degree_list = [degree for degree in G.degree()] # 각 노드별 차수 저장

In [559]:
# 파일 저장용 nodes, edges
graph_nodes = "var nodes = "
graph_edges = "var edges = "

# 리스트 생성용
num = 0
nodes_list = []
reverse_graph = dict()

for name in G.nodes():
    # 딕셔너리 1개씩 생성하여 넣기
    tmp = dict()
    tmp['id'] = num
    tmp['label'] = name
    tmp['degree'] = degree_list[num][1]
    
    # 차수가 3이상이면 빨간색 지정
    if(degree_list[num][1] >= 3):
        tmp['color'] = "#FB7E81"
        
    nodes_list.append(tmp)   # {id: 0, label: 'hemp'}형태
    
    reverse_graph[name] = num   # {'hemp':0, 'cannabi':1}형태, 목적: 'hemp'검색시 바로 노드 번호 확인(편의성 목적)
    num += 1

In [560]:
nodes_list

[{'id': 0, 'label': '홍차', 'degree': 1},
 {'id': 1, 'label': '청차', 'degree': 3, 'color': '#FB7E81'},
 {'id': 2, 'label': '지역', 'degree': 1},
 {'id': 3, 'label': '해당', 'degree': 2},
 {'id': 4, 'label': '녹차', 'degree': 2},
 {'id': 5, 'label': '시기', 'degree': 1},
 {'id': 6, 'label': '분류', 'degree': 3, 'color': '#FB7E81'},
 {'id': 7, 'label': '사용', 'degree': 3, 'color': '#FB7E81'},
 {'id': 8, 'label': '경우', 'degree': 3, 'color': '#FB7E81'},
 {'id': 9, 'label': '방법', 'degree': 3, 'color': '#FB7E81'},
 {'id': 10, 'label': '원래', 'degree': 3, 'color': '#FB7E81'},
 {'id': 11, 'label': '가공', 'degree': 2},
 {'id': 12, 'label': '과정', 'degree': 1},
 {'id': 13, 'label': '위조', 'degree': 2},
 {'id': 14, 'label': '일본', 'degree': 2},
 {'id': 15, 'label': '다음', 'degree': 1},
 {'id': 16, 'label': '발효', 'degree': 2},
 {'id': 17, 'label': '중국', 'degree': 2},
 {'id': 18, 'label': '차나무', 'degree': 2},
 {'id': 19, 'label': '시대', 'degree': 1}]

In [561]:
graph_nodes += str(nodes_list) + ";"
print(graph_nodes)

var nodes = [{'id': 0, 'label': '홍차', 'degree': 1}, {'id': 1, 'label': '청차', 'degree': 3, 'color': '#FB7E81'}, {'id': 2, 'label': '지역', 'degree': 1}, {'id': 3, 'label': '해당', 'degree': 2}, {'id': 4, 'label': '녹차', 'degree': 2}, {'id': 5, 'label': '시기', 'degree': 1}, {'id': 6, 'label': '분류', 'degree': 3, 'color': '#FB7E81'}, {'id': 7, 'label': '사용', 'degree': 3, 'color': '#FB7E81'}, {'id': 8, 'label': '경우', 'degree': 3, 'color': '#FB7E81'}, {'id': 9, 'label': '방법', 'degree': 3, 'color': '#FB7E81'}, {'id': 10, 'label': '원래', 'degree': 3, 'color': '#FB7E81'}, {'id': 11, 'label': '가공', 'degree': 2}, {'id': 12, 'label': '과정', 'degree': 1}, {'id': 13, 'label': '위조', 'degree': 2}, {'id': 14, 'label': '일본', 'degree': 2}, {'id': 15, 'label': '다음', 'degree': 1}, {'id': 16, 'label': '발효', 'degree': 2}, {'id': 17, 'label': '중국', 'degree': 2}, {'id': 18, 'label': '차나무', 'degree': 2}, {'id': 19, 'label': '시대', 'degree': 1}];


In [562]:
print(reverse_graph) # graph_nodes를 뒤집어서 저장, 예를 들어  label명 : id명

{'홍차': 0, '청차': 1, '지역': 2, '해당': 3, '녹차': 4, '시기': 5, '분류': 6, '사용': 7, '경우': 8, '방법': 9, '원래': 10, '가공': 11, '과정': 12, '위조': 13, '일본': 14, '다음': 15, '발효': 16, '중국': 17, '차나무': 18, '시대': 19}


In [563]:
edges_list = []

# edges는 {'hemp', 'cannabi', '3.21'}형태
for edge in G.edges(data='weight'):
    tmp = dict()
    tmp['from']   = reverse_graph.get(edge[0])     # 'hemp'검색시 인덱스값
    tmp['to']     = reverse_graph.get(edge[1])     # 'cannabi'검색시 인덱스값
    tmp['label']  = edge[2]                        # 가중치 저장
    
    
    length = float(edge[2])
    minmax_scale = ((7.0 - length)/4.0) * 20       # 길이를 min max 스케일링
    tmp['value']  = round(minmax_scale, 2)         # Edge 두께를 가중치의 크기에 따라 변경(숫자가 클수록 두껍게)
    
    length = float(edge[2])
    minmax_scale = ((length - 2.0)/4.0) * 300
    tmp['length'] = round(minmax_scale + 50, 2)    # Edge 길이를 min max 스케일링
    
    tmp['color'] = "#97C2FC"                       # 기본은 파란색상

    edges_list.append(tmp)

In [564]:
graph_edges += str(edges_list) + ";"
print(graph_edges)

var edges = [{'from': 0, 'to': 1, 'label': '3.21', 'value': 18.95, 'length': 140.75, 'color': '#97C2FC'}, {'from': 1, 'to': 4, 'label': '3.86', 'value': 15.7, 'length': 189.5, 'color': '#97C2FC'}, {'from': 1, 'to': 15, 'label': '5.59', 'value': 7.05, 'length': 319.25, 'color': '#97C2FC'}, {'from': 2, 'to': 3, 'label': '3.79', 'value': 16.05, 'length': 184.25, 'color': '#97C2FC'}, {'from': 3, 'to': 10, 'label': '5.99', 'value': 5.05, 'length': 349.25, 'color': '#97C2FC'}, {'from': 4, 'to': 14, 'label': '5.56', 'value': 7.2, 'length': 317.0, 'color': '#97C2FC'}, {'from': 5, 'to': 6, 'label': '4.44', 'value': 12.8, 'length': 233.0, 'color': '#97C2FC'}, {'from': 6, 'to': 11, 'label': '5.08', 'value': 9.6, 'length': 281.0, 'color': '#97C2FC'}, {'from': 6, 'to': 19, 'label': '6.26', 'value': 3.7, 'length': 369.5, 'color': '#97C2FC'}, {'from': 7, 'to': 8, 'label': '4.68', 'value': 11.6, 'length': 251.0, 'color': '#97C2FC'}, {'from': 7, 'to': 17, 'label': '6.0', 'value': 5.0, 'length': 350.0, 

In [565]:
graph_data = graph_nodes + "\n\n" + graph_edges

In [566]:
print(graph_data)

var nodes = [{'id': 0, 'label': '홍차', 'degree': 1}, {'id': 1, 'label': '청차', 'degree': 3, 'color': '#FB7E81'}, {'id': 2, 'label': '지역', 'degree': 1}, {'id': 3, 'label': '해당', 'degree': 2}, {'id': 4, 'label': '녹차', 'degree': 2}, {'id': 5, 'label': '시기', 'degree': 1}, {'id': 6, 'label': '분류', 'degree': 3, 'color': '#FB7E81'}, {'id': 7, 'label': '사용', 'degree': 3, 'color': '#FB7E81'}, {'id': 8, 'label': '경우', 'degree': 3, 'color': '#FB7E81'}, {'id': 9, 'label': '방법', 'degree': 3, 'color': '#FB7E81'}, {'id': 10, 'label': '원래', 'degree': 3, 'color': '#FB7E81'}, {'id': 11, 'label': '가공', 'degree': 2}, {'id': 12, 'label': '과정', 'degree': 1}, {'id': 13, 'label': '위조', 'degree': 2}, {'id': 14, 'label': '일본', 'degree': 2}, {'id': 15, 'label': '다음', 'degree': 1}, {'id': 16, 'label': '발효', 'degree': 2}, {'id': 17, 'label': '중국', 'degree': 2}, {'id': 18, 'label': '차나무', 'degree': 2}, {'id': 19, 'label': '시대', 'degree': 1}];

var edges = [{'from': 0, 'to': 1, 'label': '3.21', 'value': 18.95, 'length

#### 작성할 파일 제목 정하기
* file_name = "파일명"

In [567]:
file_name = "차2"

In [568]:
f = open("./results/result_webgraph/data/" + file_name + ".js", 'w', encoding = 'utf8')
f.write(graph_data)
f.close()
print(file_name + ".js 파일 생성 완료")

차2.js 파일 생성 완료


### 2. keyword.html

In [579]:
html_top = """
<!doctype html>
<html>
<head>
	<title>Knowledge Structure</title>
    """

In [580]:
vis_location = """<script type="text/javascript" src="../../lib/drawing/vis.js"></script>
    """

In [581]:
js_location = """<script src="../../results/result_webgraph/data/""" + file_name + """.js" charset="utf-8">
    </script>
    <style type="text/css">#mynetwork 
        {width: 100%;height: 1000px;border: 1px solid lightgray;}
    </style>
</head>
<body>
    """

In [582]:
title = """<p> Cheonsol of Knowledge Structure.</p>"""

In [583]:
body = """
    <div id="mynetwork"></div>
	<script type="text/javascript">
		var container = document.getElementById('mynetwork');
		var data = { nodes: nodes, edges: edges }; """

In [584]:
option = """
        var options = 
        { "nodes": {"shape" : "circle",
                    "font":{"size": 30}},
        "edges": {"font": {"size" : 25}, 
            "smooth": {"type":"continuous","roundness": 0.6}},
            "physics": {"barnesHut": {"centralGravity": 0.1},
            "minVelocity": 0.75}};
        """

In [585]:
bottom = """var network = new vis.Network(container, data, options);
	</script>
</body>
</html>
"""

In [586]:
html_text = html_top + vis_location + js_location + title + body + option + bottom

In [587]:
html_text

'\n<!doctype html>\n<html>\n<head>\n\t<title>Knowledge Structure</title>\n    <script type="text/javascript" src="../../lib/drawing/vis.js"></script>\n    <script src="../../results/result_webgraph/data/차2.js" charset="utf-8">\n    </script>\n    <style type="text/css">#mynetwork \n        {width: 100%;height: 1000px;border: 1px solid lightgray;}\n    </style>\n</head>\n<body>\n    <p> Cheonsol of Knowledge Structure.</p>\n    <div id="mynetwork"></div>\n\t<script type="text/javascript">\n\t\tvar container = document.getElementById(\'mynetwork\');\n\t\tvar data = { nodes: nodes, edges: edges }; \n        var options = \n        { "nodes": {"shape" : "circle",\n                    "font":{"size": 30}},\n        "edges": {"font": {"size" : 25}, \n            "smooth": {"type":"continuous","roundness": 0.6}},\n            "physics": {"barnesHut": {"centralGravity": 0.1},\n            "minVelocity": 0.75}};\n        var network = new vis.Network(container, data, options);\n\t</script>\n</b

In [588]:
html_file = open('./results/result_webgraph/' + file_name + '.html', 'w')
html_file.write(html_text)
html_file.close()
print(file_name + ".html 파일 생성 완료")

차2.html 파일 생성 완료
