# **Micro Analisis**.

## **Caso de Uso 1. Metro de Madrid**s:

In [27]:
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors
import networkx as nx
import numpy as np
import pandas as pd
from pyvis.network import Network

def str_color(r,g,b,a):
    return "#" + format(int(r*255), f'0{2}x') + format(int(g*255), f'0{2}x') + format(int(b*255), f'0{2}x') + format(int(a*255), f'0{2}x')

def assign_colors(values, vmin=None, vmax=None, cmap=None):
    colormap = plt.cm.magma if cmap is None else cmap

    # Normalize your values to be in the range [0, 1] if they are not already
    if vmin is None:
        vmin = min(values)
    if vmax is None:
        vmax = max(values)
    norm = mcolors.Normalize(vmin=vmin, vmax=vmax)

    # Create a colormap scalar mappable
    sm = plt.cm.ScalarMappable(cmap=colormap, norm=norm)
    sm.set_array([])

    # Map your values to colors
    colors = [str_color(*colormap(norm(value))) for value in values]
    return colors

def draw_centrality(r, ax, pos=None, vmin=None, vmax=None):
    colors = assign_colors(r, vmin, vmax)
    nx.draw(G, ax=ax, pos=pos, with_labels=True, node_color=colors)

def make_graph():
    G = nx.florentine_families_graph()
    G = G.to_directed()
    G.add_edges_from([
        ('Navio', 'Panizo'),
        ('Panizo', 'Navio'),
        ('Garcia', 'Panizo'),
        ('Gonzalez', 'Panizo'),
        ('Panizo', 'Perez',),
        ('Panizo', 'Montes'),
        ('Panizo', 'Lopez'),
        ('Panizo', 'Lamberteschi'),
        ('Lamberteschi', 'Panizo')
    ])
    return G

In [28]:
!pip install pyvis --quiet

### Betweeness Centrality
Se quiere grabar un spot publicitario para la ciudad de Madrid donde aparezcan las estaciones de Metro más emblemáticas de Madrid. Para evitar discusiones entre los directores del spot se le ha pedido al consorcio de transportes que indiqué cuales son las 5 estaciones más emblemáticas de Madrid.

In [33]:
import pandas as pd
G = nx.read_graphml(path = './metro.graphml')
G = G.to_undirected()
centrality = nx.betweenness_centrality(G)

# top 3 nodes by degree centrality
display(pd.DataFrame.from_dict(centrality, orient='index', columns=['betweenness']).sort_values(by='betweenness', ascending=False).head(5))

# draw network
nx.set_node_attributes(G, {n:f"{v}" for n,v in centrality.items()}, 'title')
nx.set_node_attributes(G, {n:v for n,v in zip(centrality.keys(), assign_colors(centrality.values()))}, 'color')
nx.set_node_attributes(G, {n:f"{n}" for n in G.nodes}, 'label')
nx.set_node_attributes(G, "dot", 'shape')

net = Network(notebook=True, height='500px', width='100%', bgcolor="#DCDCDC")
net.from_nx(G)
net.show('micro-analisis.html')

Unnamed: 0,betweenness
147,0.320971
123,0.311315
68,0.306835
74,0.27987
127,0.268535


centrality.html


### Closeness

Se está realizando un estudio urbanístico sobre la ciudad de Madrid. Para una de las
partes del estudio se quiere conocer las 5 mejores estaciones del Metro de Madrid
dónde construir un hospital. El estudio se centra en construir ciudades más amigables
para todos los vecinos por lo que se busca que todo el mundo pueda acceder al hospital
lo más fácilmente posible.

In [23]:
G = nx.read_graphml(path = './metro.graphml')
G = G.to_undirected()
centrality = nx.closeness_centrality(G)

# top 3 nodes by degree centrality
display(pd.DataFrame.from_dict(centrality, orient='index', columns=['closeness']).sort_values(by='closeness', ascending=False).head(5))

# draw network
nx.set_node_attributes(G, {n:f"{v}" for n,v in centrality.items()}, 'title')
nx.set_node_attributes(G, {n:v for n,v in zip(centrality.keys(), assign_colors(centrality.values()))}, 'color')
nx.set_node_attributes(G, {n:f"{n}" for n in G.nodes}, 'label')
nx.set_node_attributes(G, "dot", 'shape')

net = Network(notebook=True, height='500px', width='100%', bgcolor="#DCDCDC")
net.from_nx(G)
net.show('micro-analisis.html')

Unnamed: 0,closeness
147,0.101774
68,0.101688
12,0.099505
74,0.0993
95,0.098047


centrality.html


### Betweenness

Se está realizando un estudio sobre la resiliencia de la red de Metro de Madrid. En una 
parte del estudio se quiere conocer que estaciones crearían mayores disrupciones en e 
transporte por la ciudad si dejasen de funcionar. Se tiene especial interés en aquell s
estaciones que si dejasen de funcionar aislaran una zona de la ciudad. 

Si una estación tiene alta centralidad de betweenness, significa que es n "puete" clave que conecta diferentes partes de la red. Si se elimina, puede aislar zonas completas del sistema de metro, ya que interrumpe los caminos más cortos entre otras estaciones.

## **Caso de Uso 2. Twitch**

Se quiere organizar una fiesta para usuarios de Twitch. Para ello contáis con una base de datos
con usuarios potenciales para la fiesta y sus followers. Se quiere que la fiesta sea un éxito, utilizar
técnicas de SNA para resolver las siguientes preguntas:

*La representacion de las redes no se realiza porque superan las capacidades de computo.*

In [1]:
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors
import networkx as nx
import numpy as np
import pandas as pd
from pyvis.network import Network

def str_color(r,g,b,a):
    return "#" + format(int(r*255), f'0{2}x') + format(int(g*255), f'0{2}x') + format(int(b*255), f'0{2}x') + format(int(a*255), f'0{2}x')

def assign_colors(values, vmin=None, vmax=None, cmap=None):
    colormap = plt.cm.magma if cmap is None else cmap

    # Normalize your values to be in the range [0, 1] if they are not already
    if vmin is None:
        vmin = min(values)
    if vmax is None:
        vmax = max(values)
    norm = mcolors.Normalize(vmin=vmin, vmax=vmax)

    # Create a colormap scalar mappable
    sm = plt.cm.ScalarMappable(cmap=colormap, norm=norm)
    sm.set_array([])

    # Map your values to colors
    colors = [str_color(*colormap(norm(value))) for value in values]
    return colors

def draw_centrality(r, ax, pos=None, vmin=None, vmax=None):
    colors = assign_colors(r, vmin, vmax)
    nx.draw(G, ax=ax, pos=pos, with_labels=True, node_color=colors)

def make_graph():
    G = nx.florentine_families_graph()
    G = G.to_directed()
    G.add_edges_from([
        ('Navio', 'Panizo'),
        ('Panizo', 'Navio'),
        ('Garcia', 'Panizo'),
        ('Gonzalez', 'Panizo'),
        ('Panizo', 'Perez',),
        ('Panizo', 'Montes'),
        ('Panizo', 'Lopez'),
        ('Panizo', 'Lamberteschi'),
        ('Lamberteschi', 'Panizo')
    ])
    return G

In [2]:
!pip install pyvis --quiet

### Degree de nodo o PageRank

Para promocionar la fiesta se quiere hacer un flyer para difundirlo en redes sociales. Se
quiere contactar con streamers de prestigio para que aparezcan en el flyer a modo de
promoción. Basado en los datos de followers que se tiene propón 25 candidatos para el
flyer.

**Degree**

In [3]:
import networkx as nx
from pyvis.network import Network
import pandas as pd

# Leer el archivo GraphML y convertir el grafo a no dirigido
G = nx.read_graphml(path='./twitch.graphml')
G = G.to_undirected()

# Calcular la centralidad de grado
centrality = nx.degree_centrality(G)

# Seleccionar los 25 nodos más relevantes según la centralidad de grado
top_nodes = sorted(centrality, key=centrality.get, reverse=True)[:25]
G_filtered = G.subgraph(top_nodes)

# Mostrar los top 25 nodos por centralidad de grado
display(pd.DataFrame.from_dict(centrality, orient='index', columns=['degree']).sort_values(by='degree', ascending=False).head(25))

# Asignar atributos a los nodos para la visualización
# Asignar título a los nodos según la centralidad
nx.set_node_attributes(G_filtered, {n: f"{v}" for n, v in centrality.items()}, 'title')

# Asignar colores a los nodos basados en la centralidad
def assign_colors(centrality_values):
    min_val = min(centrality_values)
    max_val = max(centrality_values)
    color_range = 255  # Color range for the color scale
    return [(int((val - min_val) / (max_val - min_val) * color_range), 0, 255 - int((val - min_val) / (max_val - min_val) * color_range)) for val in centrality_values]

colors = assign_colors(list(centrality.values()))
nx.set_node_attributes(G_filtered, {n: color for n, color in zip(centrality.keys(), colors)}, 'color')

# Asignar etiquetas con el nombre del nodo (por si se quiere mostrar en la visualización)
nx.set_node_attributes(G_filtered, {n: f"{n}" for n in G_filtered.nodes}, 'label')

# Configurar el layout y la física del grafo para mejorar el tiempo de renderizado
net = Network(notebook=True, height='500px', width='100%', bgcolor="#DCDCDC")

# Ajustar los parámetros de la física para hacer la visualización más rápida
net.force_atlas_2based(spring_length=50, spring_strength=0.01, damping=0.09, overlap=0.7)

# Utilizar las posiciones predefinidas del layout para los nodos
net.from_nx(G_filtered)

# Establecer opciones personalizadas de la red (interacción y física)
net.set_options("""
var options = {
  "interaction": {
    "hover": true,
    "zoomView": true
  },
  "physics": {
    "enabled": true,
    "stabilization": true
  }
}
""")

# Mostrar la visualización en un archivo HTML
net.show('micro-analisis.html')

Unnamed: 0,degree
1773,0.101053
4949,0.096982
3401,0.065263
6136,0.053053
166,0.049404
5842,0.047158
1924,0.044351
2732,0.039018
2447,0.038175
1103,0.035649


centrality.html


### Closeness

Para que la fiesta sea un éxito se quiere mantener un contacto directo con la comunidad
para poder preguntarles por posibles eventos y actividades. Basándote en los datos de
followers que se tienen, indica que usuarios serían los más adecuados para formar parte
de este grupo de contacto.

Aplicación: En este contexto, los usuarios con alta centralidad de cercanía serían aquellos que tienen un contacto directo y rápido con una amplia parte de la comunidad. Si el objetivo es mantener un contacto directo con la comunidad para obtener retroalimentación sobre futuros eventos, es crucial seleccionar a usuarios que puedan llegar a muchas personas rápidamente, lo que facilita la comunicación fluida y la recolección de opiniones.

In [4]:
G = nx.read_graphml(path = './twitch.graphml')
G = G.to_undirected()
centrality = nx.closeness_centrality(G)

# top 3 nodes by degree centrality
display(pd.DataFrame.from_dict(centrality, orient='index', columns=['closeness']).sort_values(by='closeness', ascending=False).head(5))

# draw network
nx.set_node_attributes(G, {n:f"{v}" for n,v in centrality.items()}, 'title')
nx.set_node_attributes(G, {n:v for n,v in zip(centrality.keys(), assign_colors(centrality.values()))}, 'color')
nx.set_node_attributes(G, {n:f"{n}" for n in G.nodes}, 'label')
nx.set_node_attributes(G, "dot", 'shape')

net = Network(notebook=True, height='500px', width='100%', bgcolor="#DCDCDC")
net.from_nx(G)
net.show('micro-analisis.html')

Unnamed: 0,closeness
4949,0.41635
1773,0.408872
3401,0.398579
5842,0.395262
2447,0.391118


centrality.html


### Betweenness Centrality y PageRank

En la fiesta asistirán personas de comunidades muy distintas de Twitch. Se quiere que
en la fiesta los asistentes se relacionen los unos con los otros para mejorar la comunidad.
Identifica que usuarios no pueden faltar a la fiesta si se quiere que los asistentes no se
aíslen en grupos.

Si una estación tiene alta centralidad de betweenness, significa que es n "puete" clave que conecta diferentes partes de la red. Si se elimina, puede aislar zonas completas del sistema de metro, ya que interrumpe los caminos más cortos entre otras estaciones.

### Closeness

Por último, la comunidad de Twitch es demasiado grande para poder enviar invitaciones
a todo el mundo. No obstante, todo el mundo debe conocer la existencia de la fiesta (no
queremos que nadie se sienta discriminado). Para solventar este problema, se pretende
recurrir al boca a boca, es decir, pedirles a algunos usuarios que avisen a sus seguidores.
Identifica las 1000 mejores cuentas para encargarse del boca a boca. Queremos que
todo el mundo se entere por un usuario que encuentre cercano (que sea follower
directo o follower de follower, no queremos que se entere por gente extraña para él
antes que por algún conocido ya que si no es posible que no se interese).

## **Caso de Uso 3: Dungeons**
Norsewind Studios, una empresa de videojuegos, está diseñando un editor de niveles
colaborativos para su próximo videojuego, "The Jötun's Lair”. Tras analizar el feedback de los
diseñadores de niveles se ha visto que una de las features más demandas es la recomendación
de monstruos a la hora de crear un encuentro, es decir, el grupo que monstruos a los que los
jugadores se tiene que enfrentar en una sala. Utiliza tus conocimientos de SNA y la base de datos
de mazmorras para implementar un sistema que dada una sala que al menos contenga un
monstruo sea capaz de recomendar otros 5 monstruos que podrían aparecer en el encuentro.
Como el videojuego ya tiene muchos niveles creados, aprovecha esta información a la hora de
realizar el sistema recom

**Modelo Bipartito:**

- Los nodos del grafo representan monstruos y salas.
- Las aristas entre los nodos indican que un monstruo está en una sala determinada.

**SNA (Social Network Analysis):**

- Se puede utilizar una matriz de adyacencia bipartita donde las filas son las salas y las columnas son los monstruos.
- Basándose en esta estructura, podemos usar diferentes técnicas para generar recomendaciones.


**Índice Jaccard**: Para cada monstruo en una sala, el sistema recomendador puede sugerir otros monstruos que hayan aparecido con él en el pasado en las mismas o en salas similares.endador.

In [6]:
import networkx as nx
import pandas as pd
from collections import defaultdict

# Cargar el grafo desde el archivo GraphML
G = nx.read_graphml('dungeons.graphml')

# Obtener los nodos de tipo 'monstruo' y 'sala' (por ejemplo, los nodos de monstruo tienen un 'type' 'monstruo')
monstruos = [n for n, d in G.nodes(data=True) if d.get('type') == 'monster']
salas = [n for n, d in G.nodes(data=True) if d.get('type') == 'room']

# Crear una matriz de adyacencia bipartita
# En este caso, cada sala está conectada a los monstruos que la ocupan.
sala_to_monstruos = defaultdict(list)

for node in salas:
    for neighbor in G.neighbors(node):
        if G.nodes[neighbor].get('type') == 'monster':
            sala_to_monstruos[node].append(neighbor)

# Función para calcular la similitud de Jaccard entre dos conjuntos de monstruos
def jaccard_similarity(set1, set2):
    intersection = len(set1.intersection(set2))
    union = len(set1.union(set2))
    return intersection / union if union != 0 else 0

# Recomendación de monstruos para una sala específica
def recomendar_monstruos(sala, num_recomendaciones=5):
    monstruos_sala = set(sala_to_monstruos[sala])
    similitudes = []

    # Calcular la similitud de Jaccard con todas las demás salas
    for otra_sala, monstruos_otra_sala in sala_to_monstruos.items():
        if otra_sala != sala:
            monstruos_otra_sala_set = set(monstruos_otra_sala)
            similitud = jaccard_similarity(monstruos_sala, monstruos_otra_sala_set)
            similitudes.append((otra_sala, similitud, monstruos_otra_sala))

    # Ordenar las salas por similitud y recomendar los monstruos de las salas más similares
    similitudes.sort(key=lambda x: x[1], reverse=True)

    recomendaciones = []
    for _, _, monstruos_otra_sala in similitudes[:num_recomendaciones]:
        for monstruo in monstruos_otra_sala:
            if monstruo not in monstruos_sala:
                recomendaciones.append(monstruo)
        if len(recomendaciones) >= num_recomendaciones:
            break

    return recomendaciones[:num_recomendaciones]

# Ejemplo de uso: recomendar monstruos para la sala con ID 'sala_1'
recomendaciones = recomendar_monstruos('sala_1')
print(f"Recomendaciones de monstruos para la sala 'sala_1': {recomendaciones}")

Recomendaciones de monstruos para la sala 'sala_1': ['11443', '11466', '11470', '11212', '11213']
