# Análisis de Redes en *Python*
<br>
<img src="https://miro.medium.com/max/2978/1*rmq7bd3GFjcwfXtkrBQaPQ.png" alt="drawing" width="300"/>

## Software

NetworkX es un paquete Python para la creación, manipulación y estudio de la estructura, dinámica y funciones de redes complejas.

In [None]:
#Installation
#!conda install networkx

<img src="https://networkx.org/_static/networkx_logo.svg" alt="drawing" width="300"/>

In [None]:
import networkx as nx

NetworkX es un paquete muy completo que incluye entre otras cosas:

* Estructuras de datos para grafos, dígrafos y multigrafos
* Muchos algoritmos estándar
* Medidas de análisis
* Generadores de grafos clásicos, grafos aleatorios y redes sintéticas

NetworkX tiene distintas clases para distintos tipos
* Graph: No dirigido, simple
* DiGraph: Dirigido, simple
* MultiGraph: No dirigido, múltiples aristas paralelas
* MultiDiGraph: Dirigido, múltiples aristas

NetworkX es versátil por lo que: 

* Los nodos pueden ser "cualquier cosa" (por ejemplo, texto, imágenes, registros XML)
* Los aristas pueden contener datos arbitrarios (por ejemplo, pesos, series temporales)

## Primeros pasos

Existen varias maneras de representar y cargar en grafo a NetworkX, por el momento utilizaremos un grafo precargado en la librería.

In [None]:
karate = nx.karate_club_graph() #Cargar un grafo

*Zachary’s Karate Club* representa una red social de un club de karate universitario, 
descrito en el paper *An Information Flow Model for Conflict and Fission in Small Groups* de Wayne W. Zachary. Es uno de los grafos mas famosos de todos los tiempos.

In [None]:
nx.draw_circular(karate) #Dibujar el grafo

### Analisis

Numero de Nodos y Aristas

In [None]:
print("\nNum_Nodes: "+str(karate.number_of_nodes()),"\nNum_Edges: "+str(karate.number_of_edges()))

#### Eccentricity

La eccentricity de un node v es la máxima distancia de v a todos los demas nodos en G.

In [None]:
nx.eccentricity(karate)

#### Diámetro

El Diámetro es la *eccentricity* máxima

In [None]:
nx.diameter(karate)

#### Radio

El Radio is la *eccentricity* mínima.



In [None]:
nx.radius(karate)

#### Grado

El grado de nodo es el número de aristas adyacentes al nodo.

In [None]:
karate.degree()

### Caminos más cortos (Geodésica)

### Centralidad: ¿Hay nodos más importantes que otros?

En teoría de grafos, la centralidad de un nodo es una medidad que determina su importancia relativa dentro del grafo al que pertenece.

Las aplicaciones incluyen la identificación de las personas más influyentes en una red social, los nodos de infraestructura clave en Internet y los superdispersores de enfermedades.

#### Degree Centrality

El grado de centralidad de un nodo v es la proporción de nodos a los que está conectado.

La centralidad de grado se define como el número de aristas que inciden en un nodo (es decir, el número de aristas que tiene un nodo). El grado puede interpretarse en términos del riesgo inmediato de un nodo de captar lo que fluye por la red (como un virus o alguna información). En el caso de una red dirigida (en la que los aristas tienen dirección), se suelen definir dos medidas separadas de la centralidad del grado, el ingrado y el exgrado. En consecuencia, el ingrado es un recuento del número de aristas dirigidos al nodo y exgrado es el número de aristas que salen del nodo a otros. 

In [None]:
nx.degree_centrality(karate)

#### Closeness Centrality

En un gráfico conectado, la centralidad *closeness* normalizada de un nodo es la longitud media del camino más corto entre el nodo y todos los demás nodos del gráfico. Así, cuanto más central es un nodo, más cerca está de todos los demás nodos.

In [None]:
nx.closeness_centrality(karate)

#### Betweenness Centrality

Betweenness es una medida de centralidad de un nodo dentro de un grafo. La centralidad Betweenness cuantifica el número de veces que un nodo actúa como puente a lo largo del camino más corto entre otros dos nodos. Fue introducida como una medida para cuantificar el dominio de un humano sobre la comunicación entre otros humanos en una red social por Linton Freeman. En su concepción, los nodos que tienen una alta probabilidad de existir en el camino más corto escogido al azar entre dos nodos escogidos al azar tienen una alta betweenness.

In [None]:
nx.betweenness_centrality(karate)

#### Page Rank

PageRank era un algoritmo usado por Google Search para clasificar las páginas web en los resultados de sus motores de búsqueda. PageRank es una forma de medir la importancia de las páginas web, funciona contando el número y la calidad de los enlaces a una página para determinar una estimación aproximada de la importancia del sitio web. La idea principa es que los sitios web más importantes probablemente reciban más enlaces de otros sitios web. Esta idea puede retomarse y adecuarse a otro tipo de redes.

In [None]:
nx.pagerank(karate,alpha =0.9)

## Construyendo y analizando un grafo: Respuestas a comentarios en Google Classroom

In [None]:
G = nx.MultiDiGraph() # Grafo dirigido con aristas multiples

In [None]:
G.add_nodes_from(["Marisol","Luis","Cristian","Angelica","Samuel","Stephany","Rodrigo"])

In [None]:
G.add_edges_from([("Samuel","Marisol"),("Marisol","Samuel"),("Stephany","Luis"),("Angelica","Luis"),("Stephany","Luis"),("Rodrigo","Stephany"),("Rodrigo","Angelica"),("Stephany","Marisol"),("Luis","Stephany"),("Cristian","Marisol"),("Cristian","Stephany"),("Samuel","Marisol"),("Samuel","Marisol"),("Marisol","Samuel"),("Samuel","Marisol"),("Samuel","Marisol"),("Stephany","Marisol"),("Samuel","Stephany"),("Cristian","Samuel"),("Cristian","Samuel"),("Samuel","Cristian"),("Angelica","Marisol"),("Samuel","Marisol"),("Samuel","Luis"),("Samuel","Luis"),("Samuel","Luis"),("Samuel","Marisol"),("Angelica","Marisol"),("Stephany","Marisol"),("Marisol","Angelica"),("Marisol","Stephany"),("Rodrigo","Cristian")])

In [None]:
import matplotlib.pyplot as plt

In [None]:
pos = nx.circular_layout(G)
nx.draw_networkx_nodes(G,pos,node_size=50)
nx.draw_networkx_edges(G,pos,arrowsize=10)
nx.draw_networkx_labels(G,pos)
plt.show()

In [None]:
centrality = {k: v for k, v in sorted(nx.degree_centrality(nx.DiGraph(G)).items(), key=lambda item: item[1],reverse=True)} #Solo funciona con Python>=3.7

In [None]:
centrality

¿Qué interpretas de estos resultados?

# Ahora es tu turno.

In [None]:
#EuroRoad representa la red de carreteras de Europa

In [None]:
import pandas as pd

In [None]:
edgelist = pd.read_csv("datasets/euroroad.edges", sep=' ', header=None, names=["target", "source"])

In [None]:
edgelist

In [None]:
G = nx.from_pandas_edgelist(edgelist)

In [None]:
pos = nx.fruchterman_reingold_layout(G) #Toma algo de tiempo

In [None]:
nx.draw_networkx_nodes(G, pos,node_size=10,node_color="red",alpha=0.2)
nx.draw_networkx_edges(G, pos,alpha=0.5)
plt.title("EuroRoad")
plt.show()

## Reto

La famosa compañia de tiendas de conveniencia *XOXO* desea abrir nuevas sucursales en las carreteras de Europa para captar al público viajero y te han contratado como científico de datos para encontrar los mejores lugares en donde abrir las nuevas tiendas. ¿Dónde las pondrías y por qué? Utiliza alguno de los métodos anteriormente vistos en el NoteBook para justificar tu respuesta.

Tips:

* Recuerda presentar tus resultados de manera en que los ejecutivos de grupo *XOXO* puedan entender facilmente.
* Se creativo

Hints:

* ¿Dónde seria un buen lugar para poner una tienda?
* ¿Cómo mido que tan importante es un lugar?

In [None]:
# Aquí va tu código

In [None]:
# Aquí va tu reporte

In [None]:
# Aquí van comentarios o dudas

In [None]:
# Rodrigo Cortez - rcortez+@+enesmorelia+.unam.mx