**Дедлайн**: 22 февраля. 

Условие:
Провести Community Detection на заданном ненаправленном графе. 

Шкала оценивания:
- 10 (одна шт.) - будем обсуждать решения
- 9 (две шт.) - будем обсуждать решения
- 8 - $Modularity > 0,65$
- 6 - $Modularity > 0,64$
- 4 - любое решение

Ограничения:
- одна попытка в сутки
- все посылки подкреплены кодом
- код должен выбивать заявленное значение модулярности в 6/10 ранов


In [573]:
%load_ext autoreload
%autoreload 2

%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns

%config InlineBackend.figure_format = 'retina'
plt.rcParams['figure.figsize'] = 8, 5
plt.rcParams['font.size'] = 12
plt.rcParams['savefig.format'] = 'pdf'
sns.set_style('darkgrid')

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [574]:
import igraph as ig
import networkx as nx
import numpy as np
import pandas as pd

In [575]:
G = nx.read_edgelist("test.edgelist")
print('Number of nodes', len(G.nodes))
print('Number of edges', len(G.edges))

Number of nodes 12129
Number of edges 47137


In [576]:
graph = ig.Graph.Read_Ncol('test.edgelist', directed=False)
print(graph.vcount())
print(graph.ecount())

12129
47137


In [577]:
clustering = graph.community_leiden(objective_function='modularity', resolution=1.0, n_iterations=100)

In [578]:
clustering.modularity

0.6574212664512833

In [579]:
clustering.summary()

'Clustering with 12129 elements and 63 clusters'

In [580]:
result = clustering.graph.get_vertex_dataframe()
result.columns = ['node']
result['label'] = clustering.membership
result.to_csv('result.csv', index=False)
result.head()

Unnamed: 0_level_0,node,label
vertex ID,Unnamed: 1_level_1,Unnamed: 2_level_1
0,1,0
1,2,1
2,3,0
3,4,0
4,5,0


In [581]:
communities = [subgraph.get_vertex_dataframe()['name'].to_list() for subgraph in clustering.subgraphs()]

In [582]:
nx.community.modularity(G, communities)

0.6522971950007814