# Алгоритмы в хемоинформатике, первое занятие
1. Модули Python для работы с графами, модуль networkx
2. Пример направленного графа (класс Digraph)
3. Пример ненаправленного графа (класс Graph)
4. Задачи
5. Документация

## 1. Модули Python для работы с графами
В Python есть несколько библиотек, реализующих функционал для работы с графами: **networkx**, **igraph**, **python-graph** и многие другие. Мы будем пользоваться модулем **networkx**, так как в нём представлено много алгоритмов.

In [1]:
import matplotlib.pyplot as plt      # для отрисовки иллюстраций графов;
                                     # если модуль не установлен, следует закомментировать строки,
                                     # в которых он используется

import networkx as nx                # загрузить всё содержимое модуля (потребуются некоторые функции)
from networkx import Graph, DiGraph  # загрузить только классы ненаправленных/направленных графов

## 2. Пример направленного графа

In [2]:
digraph = DiGraph()

Это пустой граф, в нём ничего нет. Добавим вершины:

In [3]:
for node_val in range(1, 8):
    digraph.add_node(node_val)

Соединим какие-нибудь из них:

In [4]:
digraph.add_edge(1, 2)
digraph.add_edge(1, 3)
digraph.add_edge(1, 4)
digraph.add_edge(2, 4)
digraph.add_edge(2, 5)
digraph.add_edge(3, 6)
digraph.add_edge(4, 3)
digraph.add_edge(4, 6)
digraph.add_edge(4, 7)
digraph.add_edge(5, 4)
digraph.add_edge(5, 7)
digraph.add_edge(7, 6)

Есть специальные функции для вывода вершин, ребер, смежностей и степеней вершин:

In [5]:
print(digraph.nodes())
print(digraph.edges())
print(digraph.adj[1].keys())
print(digraph.degree(1))

[1, 2, 3, 4, 5, 6, 7]
[(1, 2), (1, 3), (1, 4), (2, 4), (2, 5), (3, 6), (4, 3), (4, 6), (4, 7), (5, 4), (5, 7), (7, 6)]
[2, 3, 4]
3


Получим матрицу смежности. Функция *adjacency_matrix()* из модуля **networkx** вернёт разреженное представление матрицы (без нулей), чтобы получить полноценную матрицу, следует воспользоваться функцией *todense()* (применить к результату выполнения функции *adjacency_matrix()*):

In [6]:
adj_matrix_sparse = nx.adjacency_matrix(digraph)
adj_matrix_dense = adj_matrix_sparse.todense()
print(adj_matrix_dense)

[[0 1 1 1 0 0 0]
 [0 0 0 1 1 0 0]
 [0 0 0 0 0 1 0]
 [0 0 1 0 0 1 1]
 [0 0 0 1 0 0 1]
 [0 0 0 0 0 0 0]
 [0 0 0 0 0 1 0]]


К элементам матрицы можно обращаться по индексу:

In [7]:
print(adj_matrix_dense[0, 0])
print(adj_matrix_dense[-1, -2])

0
1


Можно получать отдельные строки/столбцы матрицы:

In [8]:
print(adj_matrix_dense[0, :])
print(adj_matrix_dense[:, 0])

[[0 1 1 1 0 0 0]]
[[0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]]


Получим список ребер:

In [9]:
adj_list = digraph.adjacency_list()
for adj_item in adj_list:
    print(adj_item)

[2, 3, 4]
[4, 5]
[6]
[3, 6, 7]
[4, 7]
[]
[6]


Для каждой вершины от 1 до 8 получили список её соседей (вершины, в которые задано направление). Данное представление не очень наглядно, лучше вывести пары "вершина-соседи":

In [10]:
for pair in digraph.adjacency_iter():
    print('Vertice: {}, Neighbors: {}'.format(pair[0], pair[1].keys()))

Vertice: 1, Neighbors: [2, 3, 4]
Vertice: 2, Neighbors: [4, 5]
Vertice: 3, Neighbors: [6]
Vertice: 4, Neighbors: [3, 6, 7]
Vertice: 5, Neighbors: [4, 7]
Vertice: 6, Neighbors: []
Vertice: 7, Neighbors: [6]


Граф можно сохранить в файл. Доступно множество вариантов (см. документацию в разделе "Reading and writing graphs" модуля **networkx**), рассмотрим два из них: данные графа и иллюстрация:

In [11]:
# 1. данные графа в виде списка ребер
nx.write_adjlist(digraph, '1_adjlist')
# 2. данные графа в формате GML
nx.write_gml(digraph, '2_gml')
# 3. иллюстрация
nx.draw_networkx(digraph)
plt.axis('off')
plt.savefig('3_picture.png')

Если есть файл с данными графа, можно из него инициализировать новый объект графа:

In [12]:
digraph3 = nx.read_gml('2_gml')

Вершинам и ребрам графов можно присваивать атрибуты. Это удобно во многих приложениях -- например, в молекулярных графах вершина может хранить множество атрибутов: заряд, атомную массу, радиус ван-дер-Ваальса и т.д.

In [13]:
digraph[1]['color'] = 'blue'
digraph[1][2]['color'] = 'green'

In [14]:
print(digraph[1]['color'])
print(digraph[1][2]['color'])

blue
green


# 3. Пример ненаправленного графа

In [15]:
graph = Graph()

Добавим вершины и ребра:

In [16]:
for node_val in range(1, 7):
    graph.add_node(node_val)
graph.add_edge(1, 2)
graph.add_edge(1, 5)
graph.add_edge(2, 3)
graph.add_edge(2, 5)
graph.add_edge(3, 4)
graph.add_edge(4, 5)
graph.add_edge(4, 6)

Выведем матрицу смежности:

In [17]:
adj_matrix_sparse = nx.adjacency_matrix(digraph)
adj_matrix_dense = adj_matrix_sparse.todense()
print(adj_matrix_dense)

[[0 1 1 1 0 0 0]
 [0 0 0 1 1 0 0]
 [0 0 0 0 0 1 0]
 [0 0 1 0 0 1 1]
 [0 0 0 1 0 0 1]
 [0 0 0 0 0 0 0]
 [0 0 0 0 0 1 0]]


Список пар "вершина/соседи":

In [18]:
for pair in graph.adjacency_iter():
    print('Vertice: {}, Neighbors: {}'.format(pair[0], pair[1].keys()))

Vertice: 1, Neighbors: [2, 5]
Vertice: 2, Neighbors: [1, 3, 5]
Vertice: 3, Neighbors: [2, 4]
Vertice: 4, Neighbors: [3, 5, 6]
Vertice: 5, Neighbors: [1, 2, 4]
Vertice: 6, Neighbors: [4]


## 4. Задачи
A) Написать функцию умножения матриц (задаются в виде списка списков целых чисел). Вход -- две матрицы A и B, выход -- одна матрица (C = A * B). Внутри функции нужно проверить допустимость умножения данной пары матриц; если они не могут быть умножены, нужно выбросить исключение ValueError.

B) Реализовать алгоритм BFS в виде функции (поиск кратчайшего пути от одной вершины до другой, краткую информацию можно посмотреть здесь: http://rosalind.info/problems/bfs/). Вход -- граф и индексы двух вершин i и j, выход -- расстояние между вершинами (0, если вершины совпадают, float('inf'), если нет пути из i в j).

Реализовать следующие функции:
1. Вычисление матрицы дистанций алгоритмом Флойда-Уоршела.
2. Вычисление матрицы дистанций методом BFS.
3. Вычисление матрицы дистанций методом возведения матрицы смежности в степень.
Вход каждой функции -- граф (например, из модуля **networkx**), выход -- матрица дистанций (список списков целых чисел).

Дополнительное задание: самостоятельно изучить функции .add_nodes_from и .add_edges_from объекта графа

## 5. Документация
- **networkx**: https://networkx.github.io/documentation/latest/tutorial.html

- **matplotlib**: http://matplotlib.org/tutorials/index.html