<h1 align="center"> Анализ социальных сетей </h1>

# PZ-4.2. Метрики центральности узлов сети

## Задачи
Применить различные меры центральности узлов для исследования сетей:
- сеть дружеских отношений
- сеть политических блогов

In [2]:
import networkx as nx
from networkx.algorithms.centrality import degree_centrality as dc
from networkx.algorithms.centrality import closeness_centrality as cc
from networkx.algorithms.centrality import betweenness_centrality as bc
from networkx.algorithms.centrality import harmonic_centrality as hc

In [None]:
G1 = nx.read_gml('friendships.gml')

## 1. Исследование сети дружеских отношений

Сеть дружеских отношений на факультете университета представлена файлом friendships.gml. Узел соответствует человеку, ребро - дружеским отношениям.

G1 = nx.read_gml('friendships.gml')


### Задание 1
Найти степень центральности, центральность по близости и нормированную центральность (исключая конечные точки) узла 100.

Функция должна возвращать кортеж действительных чисел с точностью три знака после запятой `(degree_centrality, closeness_centrality, betweenness_centrality)`.

In [33]:
answer_one = lambda G : (round(dc(G1)[100], 3), round(cc(G1)[100], 3), round(bc(G1)[100], 3),)

print(f'degree_centrality {dc(G1)[100]}')
print(f'closeness_centrality {cc(G1)[100]}')
print(f'betweenness_centrality {bc(G1)[100]}')

degree_centrality 0.0026501766784452294
closeness_centrality 0.2654784240150094
betweenness_centrality 7.142902633244772e-05


In [27]:
print(answer_one(G1))

(0, 0.265, 0.0)


### Ответ 1
<img src="./pic/answ1.png">

#### Для заданий 1.2, 1.3 и 1.4 предположим, что Вы ничего не знаете о структуре сети, за исключением всех значений центральности узлов. То есть используйте одну из рассчитанных мер центральности, чтобы ранжировать узлы и найти наиболее подходящего кандидата.

## Задание 2

Предположим, что вы работаете админом на сайте онлайн-покупок, и перед вами стоит задача выбрать одного пользователя в сети G1 для отправки ваучера. Мы ожидаем, что пользователь, получивший ваучер, отправит его своим друзьям в сети. Вы хотите, чтобы ваучер достиг максимально возможного количества узлов. Ваучер может быть переслан нескольким пользователям одновременно, но расстояние перемещения ваучера ограничено одним шагом, а это означает, что если ваучер перемещается более чем на один шаг в этой сети, он больше не действителен. Примените свои знания в области централизации сети, чтобы выбрать лучшего кандидата на ваучер.

*Эта функция должна возвращать целое число, имя узла.*

In [4]:
def answer_two():
    max_val = max(dict(G1.degree()).values())
    return [x[0] for x in dict(G1.degree()).items() if max_val == x[1]][0]

In [5]:
# Проверьте Ваш код
answer_two()

105

### Ответ 2
<img src="./pic/answ2.png">

## Задание 3

Теперь предел пройденного расстояния ваучера снят. Поскольку сеть связанна, независимо от того, кого вы выбрали, каждый узел в сети в конечном итоге получит ваучер. Однако теперь мы хотим убедиться, что ваучер достигает узлов за наименьшее среднее количество прыжков.

Как бы вы изменили свою стратегию выбора? Напишите функцию, определяющую лучшего кандидата в сети при этом условии.

*Эта функция должна возвращать целое число - имя узла.*

In [42]:
def answer_three():
    return list(sorted([(y[0], y[1],) for y in cc(G1).items()], key=lambda x: -x[1]))[0][0]

In [43]:
# Проверьте Ваш код
answer_three()

23

### Ответ 3
<img src="./pic/answ3.png">

## Задание 4

Предположим, что ограничение на расстояние прохождения ваучера по-прежнему снято, но теперь конкурент разработал стратегию удаления человека из сети, чтобы нарушить распространение ваучера вашей компании. Ваш конкурент специально нацелен на людей, которые часто являются мостами обмена информацией между другими парами людей. Определите наиболее опасного человека, которого нужно удалить по стратегии вашего конкурента.

*Эта функция должна возвращать целое число - имя узла.*

In [44]:
def answer_four():
    return list(sorted([(y[0], y[1],) for y in cc(G1).items()], key=lambda x: -x[1]))[1][0]

In [45]:
# Проверьте Ваш код
answer_four()

333

### Ответ 4
<img src="./pic/answ4.png">

## Часть 2

`G2` - это направленная сеть политических блогов, где узлы соответствуют блогу, ребра - ссылкам между блогами. Используйте свои знания PageRank и HITS, чтобы ответить на вопросы 5-9.

In [3]:
G2 = nx.read_gml('blogs.gml')

## Задание 5

Найдите Page Rank узла 'realclearpolitics.com' со значением демпфирования 0,85.

*Эта функция должна возвращать число с плавающей точкой.*

In [5]:
from networkx.algorithms.link_analysis.pagerank_alg import pagerank

In [9]:
def answer_five():
    return pagerank(G2, 0.85)['realclearpolitics.com']

In [10]:
# Проверьте Ваш код
answer_five()

0.004636694781649094

### Ответ 5
<img src="./pic/answ5.png">

## Задание 6

Примените алгоритм масштабирования Page Scaled к этой сети со значением демпфирования 0,85. Найдите 5 узлов с самым высоким Page Rank.

*Эта функция должна возвращать список из 5 лучших блогов в порядке убывания рейтинга страницы.*

In [15]:
def answer_six():
    return [x[0] for x in sorted([(name, val,) for name, val in pagerank(G2, 0.85).items()], key=lambda x: -x[1])][:5]

In [16]:
# Проверьте Ваш код
answer_six()

['dailykos.com',
 'atrios.blogspot.com',
 'instapundit.com',
 'blogsforbush.com',
 'talkingpointsmemo.com']

## Ответ 6
<img src="./pic/answ6.png">

## Задание 7

Примените алгоритм HITS к сети, чтобы найти значения центра и авторитетности узла 'realclearpolitics.com'.

*Ваш результат должен возвращать кортеж с плавающей точкой `(hub_score, authority_score)`.*

In [17]:
from networkx.algorithms.link_analysis.hits_alg import hits

In [23]:
def answer_seven():
    buff = hits(G2)
    return (buff[0]['realclearpolitics.com'], buff[1]['realclearpolitics.com'],)

In [24]:
# Проверьте Ваш код
answer_seven()

(0.0003243556140916672, 0.003918957645699851)

## Ответ 7
<img src="./pic/answ7.png">

## Задание 8

Примените алгоритм HITS к этой сети, чтобы найти 5 узлов с наивысшими оценками хабов(hub scores).

*Эта функция должна возвращать список из 5 лучших блогов в порядке убывания оценок хабов.*

In [28]:
def answer_eight():
    return [x[0] for x in sorted([(name, val,) for name, val in hits(G2)[0].items()], key=lambda x: -x[1])][:5]

In [29]:
# Проверьте Ваш код
answer_eight()

['politicalstrategy.org',
 'madkane.com/notable.html',
 'liberaloasis.com',
 'stagefour.typepad.com/commonprejudice',
 'bodyandsoul.typepad.com']

## Ответ 8
<img src="./pic/answ8.png">

## Задание 9

Примените алгоритм HITS к этой сети, чтобы найти 5 узлов с наивысшими оценками авторитета (*authority scores*).

*Эта функция должна возвращать список 5 лучших блогов в порядке убывания авторитетных оценок.*

In [30]:
def answer_nine():
    return [x[0] for x in sorted([(name, val,) for name, val in hits(G2)[1].items()], key=lambda x: -x[1])][:5]

In [31]:
# Проверьте Ваш код
answer_nine()

['dailykos.com',
 'talkingpointsmemo.com',
 'atrios.blogspot.com',
 'washingtonmonthly.com',
 'talkleft.com']

## Ответ 9
<img src="./pic/answ9.png">