# 서울대학교 컴퓨테이셔널 방법론 부트캠프 2021
## 사회연결망 분석 (Social Network Analysis)
https://csssnu.github.io/method-bootcamp-2021/sna.html

* 18, November, 2021 (15:00 ~ 18:00)
* Gyuho Lee (SNU, hci+d lab. Ph.D Student)

# Networkx 기본 사용법

In [None]:
#import networkx # 이렇게 해도 되지만
import networkx as nx # 이 쪽이 더 편리하다

In [None]:
G = nx.Graph() # 앞으로 그래프 내용이 들어갈 '틀'을 만든다 (방향성이 없다고 가정)

In [None]:
G.add_node("A")
G.add_node("B")

In [None]:
nx.draw(G)

In [None]:
G.add_edge("A","B")

In [None]:
nx.draw(G)

In [None]:
G.add_nodes_from(["A","B","C","D","E"])

In [None]:
nx.draw(G)

In [None]:
G.add_edges_from(
    [
    ["B","C"],
    ["D","F"]
     ]
)

In [None]:
nx.draw(G)

In [None]:
nx.draw_networkx(G,
                 with_labels=True)

In [None]:
D = nx.DiGraph()

In [None]:
D.add_edges_from(
    [
     ["A","B"],
     ["B","C"],
     ["E","F"],
     ["C","F"]
    ]
)

In [None]:
nx.draw_networkx(D,
                 with_labels=True)

In [None]:
D.add_edges_from(
    [
     ["A","E"],
     ["B","E"],
    ]
)

In [None]:
nx.draw_networkx(D)

# Attribution이 있는 그래프

In [None]:
W = nx.Graph()

W.add_edge("A", "B", weight=1)
W.add_edge("A", "C", weight=2)
W.add_edge("B", "C", weight=3)
W.add_edge("C", "E", weight=2)
W.add_edge("C", "F", weight=1)

In [None]:
nx.draw(W)

In [None]:
nx.to_dict_of_dicts(W)

In [None]:
W['A']

In [None]:
W['A']['B']

In [None]:
W = nx.DiGraph()

W.add_edges_from([("A", "B"), ("B", "C")], weight=1)
W.add_edges_from([("C", "D"), ("D", "E")], weight=2)
W.add_edges_from([("A", "E"), ("B", "E")], weight=3)
W.add_edges_from([("E", "F"), ("C", "F")], weight=2)

In [None]:
W['A']

In [None]:
W['A']['B']

In [None]:
nx.draw(W)

# 최대 연결 / 밀도

* 작성된 그래프 객체 G,D,W의 세부 속성을 확인해 보자

In [None]:
print(nx.density(G))
print(nx.density(D))
print(nx.density(W))

In [None]:
# 슬라이드를 참조해 보자
print((2* len(G.edges)) / (len(G.nodes) * (len(G.nodes) -1 )))
print((len(D.edges)) / (len(D.nodes) * (len(D.nodes) -1 )))
print((len(W.edges)) / (len(W.nodes) * (len(W.nodes) -1 )))

# 데이터 변환/저장/불러오기

In [None]:
nx.to_pandas_adjacency(G)

In [None]:
nx.to_pandas_adjacency(D)

In [None]:
nx.to_pandas_adjacency(W)

In [None]:
nx.to_pandas_adjacency(D).to_csv("matrix.csv")

In [None]:
import pandas as pd

matrix = pd.read_csv("matrix.csv",
                     index_col=0)

In [None]:
matrix

In [None]:
D = nx.from_pandas_adjacency(matrix)

In [None]:
nx.to_pandas_edgelist(G)

In [None]:
nx.to_pandas_edgelist(D)

In [None]:
nx.to_pandas_edgelist(D).to_csv("edge_list.csv")

In [None]:
E = nx.from_pandas_edgelist(nx.to_pandas_edgelist(D)) # # https://networkx.org/documentation/stable/reference/generated/networkx.convert_matrix.from_pandas_edgelist.html

In [None]:
nx.draw(E)

In [None]:
nx.write_gml(E, "Networkx.gml")

In [None]:
F = nx.read_gml("Networkx.gml")

In [None]:
nx.draw(F)

# 한글 폰트를 위한 재설정

In [None]:
K = nx.Graph()

In [None]:
K.add_edges_from(
    [
     ["개구리","연못"],
     ["개구리","우물"],
     ["나무","물고기"]
    ]
)

In [None]:
nx.draw_networkx(K)

In [None]:
!apt-get update -qq
!apt-get install fonts-nanum* -qq

In [None]:
import matplotlib
matplotlib.font_manager._rebuild()

In [None]:
import networkx as nx
from matplotlib import font_manager as fm
fm.fontManager.ttflist

In [None]:
for font in fm.fontManager.ttflist:
  if "Nanum" in font.name:
    print(font)

In [None]:
[font.name for font in fm.fontManager.ttflist if "Nanum" in font.name]

In [None]:
K = nx.Graph()

In [None]:
K.add_edges_from(
    [
     ["개구리","연못"],
     ["개구리","우물"],
     ["나무","물고기"]
    ]
)

In [None]:
nx.draw_networkx(K,
                 font_family='NanumGothic')

# 연습문제

* 다음은 networkx의 기본 데이터셋인 Florentine families 네트워크의 구성 내용이다.
  * ('Acciaiuoli', 'Medici'),('Medici', 'Barbadori'),('Medici', 'Ridolfi'),('Medici', 'Tornabuoni'),('Medici', 'Albizzi'),('Medici', 'Salviati'),('Castellani', 'Peruzzi'),('Castellani', 'Strozzi'),('Castellani', 'Barbadori'),('Peruzzi', 'Strozzi'),('Peruzzi', 'Bischeri'),('Strozzi', 'Ridolfi'),('Strozzi', 'Bischeri'),('Ridolfi', 'Tornabuoni'),('Tornabuoni', 'Guadagni'),('Albizzi', 'Ginori'),('Albizzi', 'Guadagni'),('Salviati', 'Pazzi'),('Bischeri', 'Guadagni'),('Guadagni', 'Lamberteschi')
* 위 내용을 바탕으로 그래프를 구성하고 밀도를 확인/시각화 해 보자
* 위 구성을 Edgelist로 확인해 보자
* 위 네트워크를 Test.gml으로 저장해 보자
