## U4 :: Análisis de estructuras en red
# **Práctica 2 - Comunicaciones en una PYME**


---

<br>

En esta tarea, se propone analizar una red interna de comunicaciones basada en correos electrónicos entre los empleados de PYME.
Cada nodo representa a un empleado y cada enlace (dirigido) entre dos nodos un correo electrónico individual. El nodo izquierdo representa al remitente y el nodo derecho representa al destinatario.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

import networkx as nx
import matplotlib.pyplot as plt

path ='/content/drive/MyDrive/Colab Notebooks/U4 :: Análisis de estructuras en red/P2/'

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


### **Pregunta 1**

Usando networkx, carga el multigrafo dirigido (puedes usar `nx.read_edgelist`) desde `datos_comunicaciones_email.txt`. Asegúrate de que los nombres de nodo son cadenas. Además, en la importación de los datos desde el fichero ten en cuenta que cada enlace cuenta con un atributo con la hora (en formato 'timestamp') del envío de cada email.

*Esta función debe devolver un grafo multigrafo dirigido.
Además, imprime el valor del atributo "hora" para el primer mensaje intercambiado entre los nodos 1 y 2.*



In [None]:
def respuesta_1():
    G = nx.read_edgelist(path + 'datos_comunicaciones_email.txt',
                         create_using=nx.MultiDiGraph(),
                         data=[('hora', int)],
                         nodetype=str)
    return G

G = respuesta_1()

# Imprimimos la hora del primer mensaje intercambiado entre los nodos 1 y 2
hora_1_2 = G.get_edge_data('1','2')
hora_1_2[0]['hora']

1262454010

### **Pregunta 2**

¿Cuántos empleados y emails están representados en el grafo del ejercicio 1?

*Esta función debería devolver el número de empleados junto al total de mensajes intercambiados por todos los empleados.*

In [None]:
def respuesta_2():

   G = respuesta_1()
   print(f"Número de empleados: {G.number_of_nodes()}")
   print(f"Número de mensajes enviados: {G.number_of_edges()}")

respuesta_2()


Número de empleados: 167
Número de mensajes enviados: 82927


### **Pregunta 3**

* **Parte 1**. Imagina que la información en esta empresa solo se puede intercambiar por correo electrónico.

     Cuando un empleado envía un correo electrónico a otro empleado, se ha creado un canal de comunicación que permite que el remitente proporcione información al receptor, pero no al revés.

     Según los correos electrónicos enviados, ¿es posible que la información pase de un empleado a otro empleado?


* **Parte 2**. Ahora imaginemos que un canal de comunicación establecido por un correo electrónico permite que la información se intercambie en ambos sentidos.

     Según los correos electrónicos enviados, ¿es posible que la información pase de un empleado a otro empleado?


*Esta función debe volver una tupla con valores booleanos (parte1, parte2).*

In [None]:
def respuesta_3():

    G = respuesta_1()
    parte_a = nx.is_strongly_connected(G)
    parte_b = nx.is_weakly_connected(G)
    return (parte_a, parte_b)


respuesta_3()

(False, True)

### **Pregunta 4**

¿Cuántos nodos hay en el componente débilmente conectado más grande (en términos de nodos)?

*Esta función debe devolver un `int`.*

In [None]:
def respuesta_4():

    G = respuesta_1()
    nodos = nx.weakly_connected_components(G)
    return len(list(nodos)[0])

print("Número de nodos del componente débilmente conectado más grande: ", respuesta_4())

Número de nodos del componente débilmente conectado más grande:  167


### **Pregunta 5**

¿Cuántos nodos hay en el componente fuertemente conectado más grande?

*Esta función debe devolver un `int`*

In [None]:
def respuesta_5():

    G = respuesta_1()
    componentes = sorted(nx.strongly_connected_components(G))
    return len(max(list(componentes), key=len))


print("Número de nodos del componente más grande: ", respuesta_5())

Número de nodos del componente más grande:  126


### **Pregunta 6**

Encuentra el subgrafo en el componente fuertemente conectado más grande y crea un subgrafo a partir del mismo con la función `subgraph`.

*Esta función debe devolver un subgrafo.*

In [None]:
def respuesta_6():

    G = respuesta_1()
    G_sc = max(nx.strongly_connected_components(G), key=len)
    return G.subgraph(G_sc)

Puedes usar el siguiente código para visualizar el subgrafo creado (**nota**: puede llevar varios minutos).

In [None]:
# Dibujar subgrafo

pos = nx.spring_layout(respuesta_6())
nx.draw(respuesta_6(), pos, with_labels=True)
plt.show()

### **Pregunta 7**

¿Cuál es la distancia media entre los nodos de ese subgrafo?

*Esta función debe devolver un `float`.*

In [None]:
def respuesta_7():

  G_sc = respuesta_6()
  distancia_media = nx.average_shortest_path_length(G_sc)
  return distancia_media

print("La distancia media es:", respuesta_7())

La distancia media es: 1.6461587301587302


### **Pregunta 8**

¿Cuál es la distancia más larga entre 2 empleados en el subgrafo previamente creado?

*Esta función debe devolver un `int`.*

In [None]:
def respuesta_8():

  G_sc = respuesta_6()
  diametro = nx.diameter(G_sc)
  return diametro


print("La distancia más larga es:", respuesta_8())

La distancia más larga es: 3


### **Pregunta 9**

¿Cuál es el conjunto de nodos del subgrafo anterior con excentricidad igual al diámetro?

*Esta función debe devolver un conjunto de nodo/s.*

In [None]:
def respuesta_9():
    G_sc = respuesta_6()
    periferia = nx.periphery(G_sc)
    return set(periferia)

print("Los nodos con excentricidad igual al diámetro son:", respuesta_9())

Los nodos con excentricidad igual al diámetro son: {'129', '134', '97'}


### **Pregunta 10**

¿Cuál es el conjunto de nodos en el subgrafo previo con excentricidad igual al radio?

*Esta función debe devolver un conjunto de nodo/s.*

In [None]:
def respuesta_10():
    G_sc = respuesta_6()
    center = nx.center(G_sc)
    return set(center)

print("Los nodos con excentricidad igual al radio son:", respuesta_10())

Los nodos con excentricidad igual al radio son: {'38'}


### **Pregunta 11**

¿Qué nodo en el subgrafo previo está conectado a la mayoría de los otros nodos por un camino más corto cuya longitud es igual al diámetro de subgrafo?, ¿Cuántos nodos están conectados a este nodo?


*Esta función debe devolver una tupla (nombre del nodo, número of nodos conectados).*

In [None]:
def respuesta_11():

    puntuacion = {}
    G_sc = respuesta_6()
    diametro = nx.diameter(G_sc)
    periferia = nx.periphery(G_sc)

    for p in periferia:
        s = nx.shortest_path_length(G_sc, p)
        actual = len([k for k,v in s.items() if v == diametro])
        puntuacion[p] = actual

    return (str(max(puntuacion)), puntuacion[max(puntuacion)])


print(respuesta_11())

('97', 63)


### **Pregunta 12**

Construye un grafo no dirigido llamado `G_un` a partir del subgrafo generado en momentos previos (se pueden ignorar los atributos).

*Esta función debe devolver un grafo*

In [None]:
def respuesta_12():

    G_sc = respuesta_6()
    G_sc_un = G_sc.to_undirected()
    G_un = nx.Graph(G_sc_un)
    return G_un

### **Pregunta 13**

¿Cuál es la transitividad y el coeficiente de agrupamiento promedio del grafo `G_un`?

*Esta función debería devolver una tupla (transitividad, agrupación promedio).*

In [None]:
def respuesta_13():
    G_un = respuesta_12()
    transitividad = nx.transitivity(G_un)
    media_clusters = nx.average_clustering(G_un)
    return (transitividad, media_clusters)


respuesta_13()

(0.570111160700385, 0.6975272437231418)