# Network Medicine

***Lucas Goiriz Beltrán***&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;*Instituto de Biología Integrativa y de Sistemas (I2SysBio, UV - CSIC) & Departamento de Matemática Aplicada (UPV)*

***Alberto Conejero Casares***&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;*Departamento de Matemática Aplicada (UPV)*

---------------------------------------------------------------------------------------------------------------------

## Primeros pasos con `Networkx`

*(Los conceptos y procedimientos tratados en este notebook pueden ser consultados, ya sea para solventar dudas como para ampliar conocimientos, en [la documentación oficial de `networkx`](https://networkx.org/documentation/stable/index.html))*

Bienvenidos a esta sesión de Network Medicine.
El objetivo de hoy va a ser conocer la librería `networkx` de `python`, la cual nos permitirá hacer los mismos (¡o incluso más!) análisis que los programas `Gephi` o `Cytoscape`.

Hay que cuidar un detalle **importante**: pese a tener funcionalidades (a priori rudimentarias) de visualización, `networkx` no es una librería de visualización, si no de análisis de grafos.

Para la visualización podemos recurrir a otras herramientas, o incluso exportar el grafo para abrirlo en `Gephi` o `Cytoscape`.

Para el desarrollo de las prácticas vamos a necesitar las siguientes librerías:

In [None]:
import networkx as nx
import numpy as np

Si al ejecutar la casilla anterior obtenéis un error porque no tenéis algún paquete instalado, ejecutad la siguiente casilla:

In [None]:
import sys
!conda install --yes --prefix {sys.prefix} numpy networkx

### 1. Crear un grafo vacío
Vamos a inicializar nuestro primer grafo mediante la clase `Graph` proporcionada por `networkx`:

¿Cuántos nodos y aristas tiene el grafo anterior?

<span style="color:green">*Responde en la casilla de abajo*</span>

### 2. Cómo poblar un grafo vacío
Podemos añadir nodos a un grafo de distintas maneras:
- Añadiéndo únicamente un nodo

Podemos añadir de esta manera cualquier elemento que sea hasheable (excepto el objeto vacío `None`):

¿Cuántos nodos y aristas tiene nuestro grafo ahora?

<span style="color:green">*Responde en la casilla de abajo*</span>

- Añadiendo varios nodos de forma simultánea a través de un iterable (`list`, `tuple`, `set`, `dict` ...)

- Añadiendo varios nodos de forma simultánea a través de un iterable, cuyos elementos tienen la forma:

`(nodo, {nombreDeLaCaracterística1 : característica1, ...})`

Hasta ahora hemos ido añadiendo nodos solitarios (es decir, sin aristas que los unan). Para añadir aristas, se puede proceder también de distintas maneras.
- Añadir una sola arista

- Añadir varias aristas de forma simultánea a través de un iterable

A la hora de añadir aristas, se pueden especificar propiedades a la misma, mediante asignación a parámetros clave.

Existen más maneras de añadir nodos, aristas, propiedades... Podéis consultarlo en la documentación si os resulta interesante.

Un detalle remarcable de `networkx`, es que mediante el método `add_node()`, podemos incluso añadir...  ¡OTRO GRAFO!

### 3. Propiedades generales de un grafo
#### 3.1 Nodos

Es sencillo acceder a los nodos de un grafo:

La clase `NodeView` es una estructura de datos que hereda de la clase `dict`. Eso quiere decir que, para acceder a la información contenida en alguno de los nodos, utilizamos la misma sintaxis que cuando deseamos acceder al `value` almacenado por una `key` en un diccionario

¿Qué propiedad contiene el nodo `40`?

<span style="color:green">*Escribe el código en la casilla de abajo y responde con un comentario o print*</span>

Esto nos permite comprobar un detalle de vital importancia: a la hora de añadir nodos que sean de tipo `str` hay que tener mucho cuidado. Bajo ciertas condiciones, `python` puede interpretar un `str` como un iterable cuyos elementos son las letras que lo conforman. Por eso, dependiendo de la manera en la que se añadan los nodos, se obtienen resultados completamente distintos, como podremos comprobar a continuación:

¿Qué es lo que ha pasado?

<span style="color:green">*Escribe la respuesta en la casilla de abajo*</span>

#### 3.2 Aristas
También podemos acceder a las aristas

Si le pasamos un nodo como argumento, obtenemos las aristas de ese nodo

#### 3.3 Cardinalidades

Es sencillo conocer el cardinal (o número de elementos) del conjunto de los nodos y de las aristas de un grafo.
Por ejemplo, si quisiéramos guardar en una variable `n` el número de nodos que poblan el grafo y en `m` el número de aristas del mismo:

#### 3.4 Adyacencia de un nodo
También es posible conocer los nodos adyacentes de un determinado nodo. Hay dos formas:
- Mediante el uso de `adj`

Este método nos devuelve un objeto llamado `AtlasView`, que hereda de un diccionario. Sus `keys` son los nodos a los que el nodo de interés es adyacente, mientras que los `values` son `dict` que contienen información sobre la arista que los une.

- Mediante el uso de `neighbors`

Cuidado, que `neighbors` devuelve in iterador. Si lo que nos interesa es ver los elementos, es recomentable transformar dicho iterador a `list`:

Dado que la clase `AtlasView` hereda de la clase `dict`, lo anterior también se puede conseguir, únicamente hacen falta las siguientes instrucciones:

- Accediendo directamente al nodo desde el grafo (el resultado es equivalente a emplear `adj`)

Un detalle interesante es que uno puede acceder a los atributos de, por ejemplo las aristas, empleando el método anterior junto a la "*concatenación*" (cuidado que aquí estoy haciendo un abuso de lenguaje al usar esta palabra) de accesos mediante corchetes:

También existen maneras de acceder de forma iterada a atributos de, por ejemplo, las aristas

¿Qué resultado obtenemos para aquellas aristas en las que no hemos definido un peso?

<span style="color:green">*Responde en la casilla de abajo*</span>

#### 3.5 Borrado de contenido de un grafo**
Realmente, no es una propiedad (por eso los asteriscos). Podemos borrar cosas de un grafo mediante unas sencillas instrucciones

Lo mismo se puede hacer con las aristas

O incluso borrar todo el contenido de un grafo, para así tener un grafo vacío

### 4. Uso del constructor de la clase `Graph`
Llegados a este punto, hemos aprendido a crear un grafo vacío, poblarlo con nodos, añadir aristas y obtener varias propiedades de un grafo.

La clase `Graph` contiene un constructor (método de una clase que permite crear una instancia de la misma) muy versátil que nos permite crear grafos a partir de distintas estructuras de datos de `python`

- A partir de un iterador de aristas

- A partir de un `dict` de adyacencias (`key` es el nombre de un nodo, `value` es un iterador con los nodos adyacentes)

- A partir de... ¡otro grafo!

Estos dos grafos tienen el mismo contenido, pero son objetos diferentes

Esto último puede resultar extraño. ¿Para qué iba a servir esto? La utilidad se ilustra en el apartado siguiente

### 5.Tipos de grafos y sus constructores

A estas alturas ya estaréis familiarizados con los distintos tipos de grafos. `networkx` permite la creación de los siguientes:
- `Graph`: un grafo no dirigido
- `DiGraph`: un grafo dirigido
- `MultiGraph`: un grafo no dirigido donde puede haber varias aristas uniendo una misma pareja de nodos
- `MultiDiGraph`: un grafo dirigido donde puede haber varias aristas uniendo una misma pareja de nodos

Un detalle adicional es que cada una de estas clases permite la existencia de lazos (aristas que nacen en un nodo y tienen como destino ese mismo nodo).

Todos los constructores de las clases anteriores funcionan de la misma manera.

De la casilla anterior, ¿hay algún resultado que no te esperabas?

<span style="color:green">*Responde en la casilla de abajo*</span>

### 6. Generadores de grafos

`networkx` viene equipado con una gran familia de generadores de grafos, como `complete_bipartite_graph`, `barbell_graph`, `
erdos_renyi_graph` o `barabasi_albert_graph`. No vamos a ver todos, pero es interesante que sepáis que existen.

### 7. Construcción de un grafo a partir de una matriz de adyacencia

Ya sabéis que todos los grafos pueden representarse como una matriz de adyacencia. Los constructores de grafos presentados anteriormente saben interpretar matrices (la clase `numpy.array`) y generar el grafo adecuado según el constructor empleado.

También podemos obtener la matriz de adyacencia de dos formas:
- Como matriz *sparse*

- Como matriz entera

### 8. Creación de grafos a partir de ficheros

En esta sección veremos 3 maneras de abrir 3 tipos de ficheros para crear un grafo.
Hay muchísimas maneras de guardar un grafo y por lo tanto, las mismas (¡o más!) de leer un fichero para crear un grafo. Todas las formas soportadas por `networkx` se encuentran en [este enlace](https://networkx.org/documentation/stable/reference/readwrite/index.html).

- A partir de un fichero `GraphML`

<span style="color:green">*Exportad la red que generasteis ayer con Gephi en formato `GraphML`, movedla a la carpeta de trabajo donde se encuentre este documento y completad el código de la casilla de abajo*</span>

In [None]:
nombreDelFicheroGraphML = "" # Completa con el nombre del fichero

grafoGephi = nx.read_graphml(nombreDelFicheroGraphML)

- A partir de una lista de aristas (a veces se usa la extensión `.edges`)

<span style="color:green">*Entrad en <a href=https://networkrepository.com/index.php>este enlace</a>, elegid una red biológica, descargad el fichero, descomprimidlo en esta carpeta de trabajo y completad el código de la casilla de abajo*</span>

In [None]:
nombreDelFicheroRedBio = "" # Completa con el nombre del fichero

grafoBio = nx.read_edgelist(nombreDelFicheroRedBio)
print(grafoBio.edges)

In [None]:
# Si se diese el caso de que la función fallase
# (porque por ejemplo la lista de aristas incluye información sobre los pesos por ejemplo)
# emplead la siguiente función

grafoBio = nx.read_weighted_edgelist(nombreDelFicheroRedBio)
print(grafoBio.edges)

- A partir de una matriz de adyacencia en formato `.csv`

In [None]:
# Como no disponemos de una, vamos a crearla y luego vamos a leerla.
matAleatoria = np.random.randint(0, high=5, size=(7,7))
np.savetxt("adjacenciaNumpy.csv", matAleatoria, delimiter=",")

grafoDesdeAdj = nx.Graph(
    np.genfromtxt("adjacenciaNumpy.csv", delimiter=',')
)
print(grafoDesdeAdj.edges)

### 9. Métricas

Al igual que `Gephi` y `Cytoscape`, `networkx` permite el cálculo de distintas métricas sobre un grafo. Emplearemos en este paso el grafo `grafoDesdeAdj` creado en el apartado anterior.

#### 9.1 Grado medio

Desgraciadamente, no existe función para el cálculo del grado medio de un grafo **no dirigido**. Sin embargo, mediante `python` y aplicando la definición de grado medio

$$
\frac{2\left|E\right|}{n}
$$

*donde $\left|E\right|$ es el cardinal de aristas y $n$ el cardinal de nodos*,

podemos definir una función que lleve a cabo ese cálculo para nosotros

<span style="color:green">*Completad el código de la casilla de abajo*</span>

In [None]:
def avgDegree(G):
    # Completad el código. Definimos k como el grado medio
#    k = 2*G.number_of_edges()/G.number_of_nodes()
    
    return k

avgDegree(grafoDesdeAdj)

#### 9.2 Diámetro

In [None]:
nx.diameter(grafoDesdeAdj)

#### 9.3 Excentricidad

In [None]:
nx.eccentricity(grafoDesdeAdj)

#### 9.4 Radio

In [None]:
nx.radius(grafoDesdeAdj)

#### 9.5 Densidad

In [None]:
nx.density(grafoDesdeAdj)

#### 9.6 Conectividad

`networkx` tiene una familia de funciones que nos proporciona información sobre la coenctividad

In [None]:
print(
    "¿El grafo es conexo? %s"
    % nx.is_connected(grafoDesdeAdj)
)
print(
    "Número de componentes conexas: %d"
    % nx.number_connected_components(grafoDesdeAdj)
)
print(
    "Componentes conexas:\n%s"
    % list(nx.connected_components(grafoDesdeAdj))
)

También existen funciones que estudian la conectividad de grafos dirigidos. Más información [en este enlace](https://networkx.org/documentation/stable/reference/algorithms/component.html).

#### 9.7 Comunidades

Existen distintos algoritmos para la detección (y generación) de comunidades. Nosotros vamos a probar el algoritmo de Louvain, que es el canónico

In [None]:
nx.algorithms.community.louvain_communities(grafoDesdeAdj)

*En caso de que tengáis problemas a la hora de utilizar `community.louvain_communities`, podéis importar la misma función a partir del fichero `louvain.py` de la siguiente manera: `from louvain import louvain_communities`*

#### 9.8 Pagereank

El cálculo del pagerank de cada nodo del grafo procede de la siguiente manera

In [None]:
nx.pagerank(grafoDesdeAdj)

#### 9.9 HITS

Su cálculo es tan sencillo como el de pagerank

In [None]:
nx.hits(grafoDesdeAdj)

#### Centralidad

Ya conocéis las dos medidas de centralidad principales: *betweeness*, *closeness* y *harmonic closeness*. [Este enlace](https://networkx.org/documentation/stable/reference/algorithms/centrality.html) contiene más información sobre medidas de centralidad.

In [None]:
print(
    "Betweeness centrality: %s"
    % nx.betweenness_centrality(grafoDesdeAdj)
)

print(
    "Closeness centrality: %s"
    % nx.closeness_centrality(grafoDesdeAdj)
)

print(
    "Closeness centrality: %s"
    % nx.harmonic_centrality(grafoDesdeAdj)
)