In [1]:
# pip install --upgrade networkx

import networkx as nx    # SNA的主要套件networkx
from networkx.algorithms import community     # 社區發現演算法

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
%matplotlib notebook

### Graph 圖

In [2]:
G = nx.Graph()      # Graph是網絡節點的集合

In [3]:
H = nx.path_graph(10)    # H 是一個有10個點的 "鏈狀圖" (0~9)

In [None]:
G = nx.from_pandas_edgelist(df, 'source', 'target')

### Node 點

In [4]:
G.add_node(1)    # 在圖 G裡新增一個節點 1   # 除了None外，任何對象都可以是節點
G.add_nodes_from([2, 3])  # 從list裡增加2、3兩個節點  #注意list本身不是一個節點，若要令list為節點要用add_node

In [5]:
G.add_node("spam")       #添加一個節點'spam'
G.add_nodes_from("spam") #添加四個節點's' 'p' 'a' 'm'

In [6]:
G.add_node(H)   # 在graph G裡加入另一個 圖 H 當節點 (增加一個節點)
G.add_nodes_from(H)      # 在graph G裡加入另一個graph H 的節點 (增加10個節點)

### Edge 邊

In [7]:
G.add_edge(1, 2)  # 將1和2兩個點加邊

e = (1, 2)
G.add_edge(*e)  # 也可以這樣寫

In [8]:
G.add_edges_from([(1, 2), (1, 3)])  # 利用list增加多條邊(這裡是把1和2連一條，1和3連一條)

In [9]:
G.add_edges_from(H.edges())         # 在graph G裡加入graph H的邊    #不能寫成G.add_edges_from(H)

In [10]:
# 重複添加已經存在的點和邊不會有任何改變   # 給邊的話 那兩個點若不再圖上會自動加入圖中

### 去除點和邊

In [11]:

G.remove_node(H)
#G.remove_node()
#G.remove_nodes_from()
#G.remove_edge()
#G.remove_edges_from()    #邏輯與上面介紹的add一樣


In [12]:
'''
G.clear()   #刪掉所有的點和邊
'''

'\nG.clear()   #刪掉所有的點和邊\n'

In [13]:
# 和add不同，若圖中沒有要刪的目標會顯示錯誤

### 查看Graph的情形

In [None]:
print(nx.info(G))    # 查看G有多少點和邊

In [14]:
G.number_of_nodes()   # G的點的數量

15

In [15]:
G.nodes()             # 列出G的所有點

NodeView((1, 2, 3, 'spam', 's', 'p', 'a', 'm', 0, 4, 5, 6, 7, 8, 9))

In [None]:
G.has_node(n)        # 查看n點有沒有在G裡

In [16]:
G.number_of_edges()   # G的邊的數量

10

In [17]:
G.edges()             # 列出G的所有邊

EdgeView([(1, 2), (1, 3), (1, 0), (2, 3), (3, 4), (4, 5), (5, 6), (6, 7), (7, 8), (8, 9)])

In [None]:
G.has_edge(u, v)     # 查看u和v之間有沒有邊在G裡

In [18]:
G.degree(1)          # 節點1有多少邊

3

In [None]:
print G.degree()     # 列出所有節點的dgree

In [None]:
print nx.degree_histogram(G)  # 由大到小列出所有節點的dgree

### 屬性 Attributes

#### Graph

In [19]:
G = nx.Graph(day='Friday')     # 為圖添加屬性  # 點和邊也可以

In [20]:
G.graph['day'] = 'Monday'      # 更改屬性

In [21]:
G.graph['month'] = 'May'       # 新增新的屬性

In [22]:
G.graph

{'day': 'Monday', 'month': 'May'}

#### Node

In [23]:
G.add_node(1, time='5pm')

G.add_nodes_from([3], time='2pm')      # 在add_node時可以直接加屬性

In [24]:
G.nodes[1]['room'] = 714       # 直接指定已存在的node加屬性

G.nodes[1]['time'] = '4pm'     # 修改屬性

In [25]:
G.nodes.data()                # .data可以看到屬性

NodeDataView({1: {'time': '4pm', 'room': 714}, 3: {'time': '2pm'}})

#### Edge

In [26]:
G.add_edge(1, 2, weight=4.7 )      # 在1和2之間的邊加屬性

G.add_edges_from([(3, 4), (4, 5)], color='red')   # 在多個邊加屬性

G.add_edges_from([(1, 2, {'color': 'blue'}), (2, 3, {'weight': 8})])    # 在不同邊加不同屬性

In [27]:
G[1][2]['weight'] = 4.8        # 修改屬性

G.edges[3, 4]['weight'] = 4.2   # 或是這樣   # 若修改的屬性原本沒有，會直接加上去 = =

In [28]:
G.edges.data()

EdgeDataView([(1, 2, {'weight': 4.8, 'color': 'blue'}), (3, 4, {'color': 'red', 'weight': 4.2}), (3, 2, {'weight': 8}), (4, 5, {'color': 'red'})])

#### 由 DataFrame 加 Attributes 到 node

In [None]:
color = np.asarray(df['color'])
Color = pd.Series(color, index=df.ID).to_dict()   # 以node作為index，且要換為字典

nx.set_node_attributes(G, Color, 'color')         # 在G中的點加上Color字典裡的資料(屬性)，並命名該屬性為'color'

#### 查看屬性

In [None]:
G.node['1']['color']   # 看點1的顏色

In [None]:
nx.get_node_attributes(G,'color') # 看G所有點的color屬性

### Directed graphs 有向圖

In [29]:
DG = nx.DiGraph()      # DiGraph為有向圖

In [30]:
DG.add_weighted_edges_from([(1, 2, 0.5), (1, 3, 0.75),(2, 3, 0.75)])    # 給有向圖邊和那些邊 weight

In [31]:
DG.out_degree(1)       # degree 度，節點有多少邊    # out_degree代表出去的邊數、in_degree代表近來的邊數

2

In [32]:
DG.out_degree(1, weight='weight')     # weight應該是一個特殊屬性，在算法需要使用weight時會用到  #這邊給的是相加

1.25

In [33]:
DG.degree(1, weight='weight')      # 不分in out

1.25

In [34]:
list(DG.successors(1))     # 列出所有該點出去的下一個點

[2, 3]

In [35]:
list(DG.neighbors(1))     # 用於無向圖，但有向圖也可以用，意思和 successors一樣

[2, 3]

In [36]:
#  H = DG.to_undirected()    
#  H = nx.Graph(DG)          # 將有向圖轉為無向圖(兩種都可以)

### Multi graphs 多圖 (無向)

In [37]:
MG = nx.MultiGraph()     # 多圖指的是兩個點之間會有多條邊，多數演算法不能使用這種圖

In [38]:
MG.add_weighted_edges_from([(1, 2, 0.5), (1, 2, 0.75), (2, 3, 0.5)])

dict(MG.degree(weight='weight'))          # 沒有給點就會每個點都列出來

{1: 1.25, 2: 1.75, 3: 0.5}

### Multi Directed graphs 多圖(有向)

In [None]:
MDG = nx.MultiDiGraph()

### 其他

In [47]:
union(G1,G2)           # G1和G2兩圖結合成新的圖

disjoint_union(G1,G2)  # 假设所有節點都不同，然後再結合 

compose(G1,G2)         # 結合兩圖並顯示相同節點 

create_empty_copy(G)   # 複製一個只有G的點的圖(把所有邊去掉)

'\n\nunion(G1,G2)          # G1和G2兩圖結合成新的圖\n\ndisjoint_union(G1,G2) # 假设所有節點都不同，然後再結合 \n\ncompose(G1,G2)        # 結合兩圖並顯示相同節點 \n\ncreate_empty_copy(G)  # 複製一個只有G的點的圖(把所有邊去掉)\n\n'

### 新增Graph

In [None]:
# 由 pandas的 Dataframe匯入

G = nx.Graph()
G = nx.from_pandas_edgelist(df, 'node1', 'node2', edge_attr=['attribute1','attribute2']) # 若edge_attr=True等於代入其他col當屬性

### 網絡圖視覺化
https://networkx.github.io/documentation/stable/reference/drawing.html#module-networkx.drawing.layout

In [None]:
pos = nx.spring_layout          # spring_layout   多中心放射
                                # circular_layout 圓形
                                # random_layout   隨機分布
                                # shell_layout    同心圓

In [None]:
nx.draw_networkx(G, pos,            # pos為點的排列形式，預設為=None
                 arrows=True,       # 若為有向圖，True會畫出邊的箭頭(顏色和邊相同)
                 with_labels=True,  # 點上有標記名稱
                 node_size=300,
                 node_color='r',
                 cmap=True,         # 以 Matplotlib 的 colormap 呈現點的重要性(或社群顏色)
                 edge_color='r',
                 edge_cmap=None,    # 以 Matplotlib 的 colormap 呈現邊的重要性
                 style='dashed',    # 邊的style (預設:solid，其他 dashed dotted dashdot)
                 )

依顏色深淺畫出圖中各點重要性 或是 依照顏色區別圖中各社群有哪些點：
https://python-graph-gallery.com/324-map-a-color-to-network-nodes/

### 社群發現
https://networkx.github.io/documentation/stable/reference/algorithms/community.html

Girvan-Newman算法的基本流程：  
>1.計算網絡中所有點的betweenness centrality  
2.以最高betweenness centrality點的邊開始先把它從網絡中移除  
3.重複步驟2，直到每個點成為一個獨立的社區為止(網絡中没有邊存在)  
4.以Q值(Modularity Q)決定社群數量，切到Q值最大的時候停止(Q值為0~1之間，數值越大代表社區結構越明顯)  

因為是以betweenness centrality找群，所以列出的社群之節點會依照betweenness centrality由大到小排(越前面代表越靠近群的中心)  
缺點:不易處理太複雜的網絡(花太久時間)、在得知網絡有幾個社群之下無法使用GN切出該數量的社群(無法指定要幾個社群)  

參考資料 https://sikasjc.github.io/2017/12/20/GN/

In [None]:
# Girvan Newman

from networkx.algorithms import community

communities_generator = community.girvan_newman(G) 
next_level_communities = next(communities_generator)
sorted(map(sorted, next_level_communities))

In [None]:
# 將分群結果換為 DataFrame (以利於之後繪圖)

data = [[element, "{}".format(ii + 1)] for ii, st in enumerate(next_level_communities) for element in sorted(st)]
frame = pd.DataFrame(data=data, columns=['node', 'Group'])
frame

In [None]:
# k_clique
# 可以找出任兩點相連的社群(clique)，k為最小clique人數，以4為例就是找出4人以上的clique

from networkx.algorithms.Centrality import k_clique_communities

list(k_clique_communities(G, 4))

In [None]:
# Fluid Communities
# 每次分社群的結果會不一樣

from networkx.algorithms import community
communities_generator = community.asyn_fluidc(G, k)   # k可以設你想找幾個社群

### 連結
https://networkx.github.io/documentation/stable/reference/algorithms/component.html

In [None]:
# 僅無向圖適用
# 以連結為標準分群體  ([A,B],[C,D] 分為兩個不同的群體)

nx.connected_components(G)

nx.number_connected_components(G)     # 看可以分成幾個Graph

In [None]:
# 分為不同的Graph

list(nx.connected_component_subgraphs(G))   # 輸出為多個Graph的list，這些Graph都在G裡

K = max(nx.connected_component_subgraphs(G), key=len)   # 其中node最多的Graph

### 中心性
networkx:https://networkx.github.io/documentation/stable/reference/algorithms/centrality.html
解釋參考:https://www.zhihu.com/question/22610633

In [None]:
# degree centrality (以degree)

nx.degree_centrality(G)

In [None]:
# betweenness centrality  (被經過)

nx.betweenness_centrality(G)

In [None]:
# closeness centrality (以路徑長度)

nx.closeness_centrality(G)

In [None]:
# 將中心性 dict轉為 list再轉為 dataframe (直接用DataFrame會出錯)

degree_centrality = nx.degree_centrality(G)
centra = list(degree_centrality.items())     

pd.DataFrame(centra, columns=['node', 'centrality'])