# Примеры анализа сетей при помощи networkx
### Кто в goto самый крутой?

networkx - библиотека python для работы с сетями. 

Ниже простейшие примеры работы с сетями

In [1]:
import networkx as nx

##### Создание нового графа
Граф - это набор всех вершин (__vertex__) и всех ребер(__edges__). 

Если в графе нет изолированных вершин - можно создать граф просто по очереди добавив в него все ребра

Создадим два графа ("звезда") и ("кольцо")

In [2]:
graph_star = nx.graph.Graph()

graph_star.add_edge(1,2)
graph_star.add_edge(1,3)
graph_star.add_edge(1,4)
graph_star.add_edge(1,5)

graph_cycle = nx.graph.Graph()
graph_cycle.add_edge(1, 2)
graph_cycle.add_edge(2, 3)
graph_cycle.add_edge(3, 4)
graph_cycle.add_edge(4, 5)
graph_cycle.add_edge(5, 1)

#### Визуализация графов
networkx позволяет визуализировать графы прямо в ipython notebook

In [3]:
nx.draw_networkx(graph_star)

In [4]:
nx.draw_networkx(graph_cycle)

#### Граф поинтереснее

Пусть у нас будет граф "влиятельности". Есть 11 человек которые могут влиять друг на друга.
Из A есть ребро в B, если A находится под влиянием B


In [5]:
graph = nx.digraph.DiGraph(directed=True)
graph.add_edge(2, 3)
graph.add_edge(3, 2)
graph.add_edge(4, 1)
graph.add_edge(4, 2)
graph.add_edge(5, 2)
graph.add_edge(5, 4)
graph.add_edge(5, 6)
graph.add_edge(6, 5)
graph.add_edge(7, 2)
graph.add_edge(7, 5)
graph.add_edge(8, 2)
graph.add_edge(8, 5)
graph.add_edge(9, 2)
graph.add_edge(9, 5) 
graph.add_edge(10, 5)
graph.add_edge(11, 5)

nx.draw_networkx(graph)

### page rank

Предложен гуглом для определения веса web-страниц в поисковой выдаче


In [6]:
weights = nx.pagerank(graph)
node_size = [weights[node]*5000 for node in graph.nodes()]
nx.draw_networkx(graph, node_size=node_size)

#### Другие меры "центральности"

nx.betweeness_centrality

nx.harmonic_centrality

nx.katz_centrality

nx.degree_centrality

nx.eigenvector_centrality

###### На самом деле pagerank является самой популярной, но не самой лучшей метрикой. 
Мы будем пользоваться harmonic_centrality

##### Кто самый крутой в GoTo?

In [7]:
import vk

In [8]:
GOTO_GROUP_ID=80270762
users = vk.get_group_subscribers(GOTO_GROUP_ID)
users_set = set(users)

In [9]:
friends = vk.get_friends_map(users)

In [11]:
goto_graph = nx.graph.Graph()
for i in range(len(users)):
    user = users[i]
    for friend in friends[i]:
        if friend in users:
            goto_graph.add_edge(user, friend)



631


In [13]:
print("nodes", len(goto_graph.nodes()))
print("edges", len(goto_graph.edges()))


nodes 631
edges 3075


In [58]:
coolness =  nx.harmonic_centrality(goto_graph)


In [59]:
user_info = list(vk.get_users_info(users))
user_info_dict = {}
for user in user_info:
    user_info_dict[user['uid']] = user

In [60]:
cnt = 0
for user in sorted(coolness.keys(), key=lambda x: -coolness[x])[:20]:
    cnt += 1
    print("{}{:15}\t{:17.3f}\t{} {}".format(cnt, user, coolness[user], user_info_dict[user]['first_name'], 
                                   user_info_dict[user]['last_name']))

1       55783291	          365.900	Алёна Ильина
2      169907505	          310.467	Андрей Творожков
3       59223044	          303.667	Тимофей Шунин
4        1286959	          299.050	Алексей Перепелкин
5       83848730	          296.300	Софья Оронова
6        7980360	          295.000	Roct Bb
7         165190	          294.500	Фёдор Фальковский
8      183987469	          292.583	Настя Черемисина
9      106157229	          288.200	Олег Корниенко
10       25735778	          287.383	Надежда Янушкевич
11      114776804	          286.967	Алена Есенина
12      215186179	          284.917	Мария Андреева
13      111030096	          282.633	Михаил Юрьевич
14      256159435	          282.333	Сергей Филиппов
15      164920337	          282.217	Георгий Хазиев
16      154044544	          281.500	Артём Мельников
17       48655021	          278.750	Даниил Никольский
18       18195994	          277.017	Александр Букин
19       87576787	          274.367	Евгений Кабо
20       85442227	          274.31