# Módulo Descubrimiento de comunidades - Obligatorio 2023
Para el contexto del obligatorio de Modelo Avanzados de base de datos se presento la realidad que tiene el servidor de discord y sus distintos módulos. Dentro de esto se planteo el análisis de que motor de base de datos tenia mas sentido para el descubrimiento de comunidades y el equipo selecciono la base de datos orientada a grafos Neo4j. El objetivo del equipo es intentar realizar una recomendación a un usuario en base a los servidores que se suscriben amigos y conocidos. 

En primera instancia se realizo una prueba utilizando Neo4J Desktop con una instancia local del servidor de Neo4j. En esta instancia se diseño las entidades participantes, se creo datos de pruebas. Para luego investigar como era posible conectarse al servidor Neo4J desde Python. Se encontro 2 librerías:
- Py2Neo (https://py2neo.org/2021.1/
    - Se encontro referencia en varios portales pero ya tiene un par de años que no tiene releases nuevos.
- Driver oficial de Neo4j
    - https://neo4j.com/developer/python/
    - La api ofrecido es un puente para ejecutar sentencias Cypher
- NeoModel (https://neomodel.readthedocs.io/en/latest/)
    - Utiliza el driver oficial
    - Ofrece una capa de servicios para facilitar el uso de Neo4j
    
Se decidio realizar una prueba de concepto de las 2 y se eligió NeoModel para el desarrollo del POC del recomendador.


In [None]:
pip install py2neo
pip install neomodel
pip install neo4jupyter

In [44]:
from py2neo import Graph,Node,Relationship,NodeMatcher
from neomodel import config
from neomodel import config, StructuredNode, StringProperty, IntegerProperty, UniqueIdProperty, RelationshipTo
from neomodel import db
import pandas as pd

In [45]:
graph = Graph("localhost:7473", auth=("neo4j", "mce2004"))


Se crean un conjunto de operaciones básicas para manipular la estructura del gráfo en base a nuestra realidad.

In [35]:
def create_user(name, tx):
    tx.Node("Usuario", nombre=name)
          
def create_server(server_name):
    return Node("Servidor", nombre=server_name)

def create_channel(channel_name, type_, id_):
    return Node("Canal", nombre=channel_name, tipo=type_, id=id_)

def create_rel_channel(server, channel):
    return Relationship(server, "TIENE", channel)

def create_rel_subscribe(user, server):
    return Relationship(user, "SUSCRITO_A", server)

def create_rel_friend(from_user, to_user):
    return Relationship(from_user, "AMIGO_DE", to_user)

def create_rel_interchange(from_user, to_user):
    return Relationship(from_user, "INTERCAMBIA_CON", to_user)

def get_user(name, graph, tx):
    query = f"MATCH (u1:Usuario) WHERE  u1.nombre = '{name}' return u1"

    return tx.evaluate(query)

Se prueba generar algunas entidades nuevas

In [11]:
tx=graph.begin()

u1 = create_user("Jose")

s1 = create_server("Fornite")
c1 = create_channel("General", "Juegos", 999)

tx.create(u1)
tx.create(s1)
tx.create(c1)
tx.create(create_rel_channel(s1, c1))
tx.create(create_rel_subscribe(u1, s1))

graph.commit()

  tx.commit()


Se prueba buscar nodos existentes y relacionarlos. En esta prueba se tuvo resultados aleatorios, en varias ocasiones quedaba trancado procesando sin feedback. 

tx = graph.begin()

u10 = create_user("Mirtha")
u11 = create_user("Susana")

tx.create(u10)
tx.create(u11)

tx.create(create_rel_friend(u10, u11))

graph.commit(tx)


Se procede a probar la consulta de ponderación  una consulta en Cypher y generar un dataframe de pandas

In [47]:
cypher_query = """
    MATCH (n)-[r]->(m)
    RETURN n, r, m;
"""

graph.run(cypher_query).to_data_frame()

Unnamed: 0,n,r,m
0,{'nombre': 'Teo'},{},{'nombre': 'Alberto'}
1,{'nombre': 'Dani'},{},{'nombre': 'Cocina'}
2,{'nombre': 'Alberto'},{},{'nombre': 'Cocina'}
3,{'nombre': 'Cocina'},{},"{'uid': 'b7ec1058965c409e9ac9e4edaf1c8bdd', 't..."
4,{'nombre': 'Teo'},{},{'nombre': 'Flipando.ai'}
5,{'nombre': 'Dani'},{},{'nombre': 'Flipando.ai'}
6,{'nombre': 'Flipando.ai'},{},"{'uid': '5871509a32b946a4ac53d358fbb309b2', 't..."
7,{'nombre': 'Flipando.ai'},{},"{'uid': '93e75d576e084c9a96f7efa06185116c', 't..."
8,{'nombre': 'Lorena'},{},{'nombre': 'Rocket League ESP'}
9,{'nombre': 'Joaco'},{},{'nombre': 'Rocket League ESP'}


Se procede a evaluar NeoModel, esta libreria implica modelar vertices del grafo y mapear las relaciones a entidades de una forma declarativa. 

config.DATABASE_URL = 'bolt://neo4j:mce2004@localhost:7687'  # default

Se crea modelo de entidades dado realidad del Obligatorio

In [2]:
class Canal(StructuredNode):
    nombre = StringProperty(required=True)
    uid = UniqueIdProperty()
    tipo = StringProperty(required=True)

class Servidor(StructuredNode):
    nombre = StringProperty(unique_index=True, required=True)
    canal = RelationshipTo(Canal, 'TIENE')
    
class Usuario(StructuredNode):
    nombre = StringProperty(unique_index=True, required=True)
    amigo = RelationshipTo('Usuario', 'AMIGO_DE')
    suscrito = RelationshipTo(Servidor, 'SUSCRITO_A')
    intermcambia = RelationshipTo('Usuario', 'INTERCAMBIA_CON')    

In [49]:
def clean_and_generate_test_date():    
    """
    Genera datos de prueba del modelo declarado, primero se borra todas las entidades.
    Esto se realiza directo en las entidades para entender funcionamiento
    
    """
    nombres_servidores = ["Flipando.ai", "Rocket League ESP", "VALORANT", "OpenAI", "J. Balvin", "Barbie.ai", "Viajes por el mundo", "Programacion en python"]

    # Canales por cada servidor
    canales = [[("Informacion", "Texto"), ("Charlar", "Voz")],
               [("General", "Texto"), ("Jugar", "Voz")],
               [("gameplay", "Texto"), ("Create a Channel", "Voz")],
               [("ai-discussions", "Texto"), ("opena-questions", "Texto")],
               [("Socials", "Texto"), ("Noticias", "Textp")],
               [("General", "Texto"), ("Jugar", "Voz")],
               [("General", "Texto"), ("Jugar", "Voz")],
               [("General", "Texto"), ("Jugar", "Voz")]]

    # Nombres de los usuarios
    nombres_usuarios = ["Dani", "Joaco", "Teo", "Lorena", "Julieta", "Ximena"]

    with db.transaction:        
        # Limpia todos los nodos
        db.cypher_query("MATCH (n) DETACH DELETE n")
        
        # Crear servidores y canales
        servidores = []
        for nombre, canales_servidor in zip(nombres_servidores, canales):
            servidor = Servidor(nombre=nombre).save()

            for canal_nombre, canal_tipo in canales_servidor:
                canal = Canal(nombre=canal_nombre, tipo=canal_tipo).save()
                servidor.canal.connect(canal)
            servidores.append(servidor)

        # Crear usuarios y sus relaciones
        usuarios = [Usuario(nombre=nombre).save() for nombre in nombres_usuarios]

        usuarios[0].suscrito.connect(servidores[0])
        usuarios[0].suscrito.connect(servidores[3])
        usuarios[0].suscrito.connect(servidores[1])
        usuarios[0].amigo.connect(usuarios[3])
        usuarios[3].amigo.connect(usuarios[0])
        usuarios[0].intermcambia.connect(usuarios[4])
        usuarios[4].intermcambia.connect(usuarios[0])

        usuarios[1].suscrito.connect(servidores[4])
        usuarios[1].suscrito.connect(servidores[1])
        usuarios[1].suscrito.connect(servidores[2])
        usuarios[1].amigo.connect(usuarios[2])
        usuarios[2].amigo.connect(usuarios[1])

        usuarios[2].suscrito.connect(servidores[0])
        usuarios[2].suscrito.connect(servidores[3])
        usuarios[2].suscrito.connect(servidores[2])
        usuarios[2].amigo.connect(usuarios[0])
        usuarios[0].amigo.connect(usuarios[2])

        usuarios[2].intermcambia.connect(usuarios[5])
        usuarios[5].intermcambia.connect(usuarios[2])

        usuarios[3].suscrito.connect(servidores[5])
        usuarios[3].suscrito.connect(servidores[1])

        usuarios[4].suscrito.connect(servidores[7])

        usuarios[5].suscrito.connect(servidores[6])
        usuarios[5].suscrito.connect(servidores[5])

# Se crea un conjunto de operaciones de utilidades para mapear la realidad de negocio con lo que permito la librebria sobre neo4j
        
def create_user(name):
    """
    Crea un nuevo usuario con el nombre especificado.

    Args:
        name (str): El nombre del usuario.

    Returns:
        Usuario: El objeto Usuario creado.
    """    
    return Usuario(nombre=name).save()

def get_user(name):
    """
    Obtiene un usuario por su nombre.

    Args:
        name (str): El nombre del usuario.

    Returns:
        Usuario: El objeto Usuario encontrado, o None si no se encuentra.
    """
    return Usuario.nodes.first(nombre=name)

def create_server(name):
    """
    Crea un nuevo servidor con el nombre especificado.

    Args:
        name (str): El nombre del servidor.

    Returns:
        Servidor: El objeto Servidor creado.
    """    
    return Servidor(nombre=name).save()

def get_server(name):
    """
    Obtiene un servidor por su nombre.

    Args:
        name (str): El nombre del servidor.

    Returns:
        Servidor: El objeto Servidor encontrado, o None si no se encuentra.
    """    
    return Servidor.nodes.first(nombre=name)

def create_channel(server_name, channel_name, channel_type):
    """
    Crea un nuevo canal en un servidor especificado.

    Args:
        server_name (str): El nombre del servidor.
        channel_name (str): El nombre del canal.
        channel_type (str): El tipo de canal.

    Returns:
        Canal: El objeto Canal creado.
    """
    c = Canal(nombre=channel_name, tipo=channel_type).save()
    
    get_server(server_name).canal.connect(c)
    
    return c
    
def add_suscription_to_server(user_name, server_name):
    """
    Agrega una suscripción de usuario a un servidor.

    Args:
        user_name (str): El nombre del usuario.
        server_name (str): El nombre del servidor.
    """    
    get_user(user_name).suscrito.connect(get_server(server_name))
    
def add_user_friend(user_name_from, user_name_to):
    """
    Agrega una relación de amistad entre dos usuarios.

    Args:
        user_name_from (str): El nombre del usuario origen.
        user_name_to (str): El nombre del usuario destino.
    """
    user_from = get_user(user_name_from)
    user_to = get_user(user_name_to)
    user_from.amigo.connect(user_to)
    user_to.amigo.connect(user_from)
    
def add_user_interaction(user_name_from, user_name_to):
    """
    Agrega una interacción entre dos usuarios.

    Args:
        user_name_from (str): El nombre del usuario origen.
        user_name_to (str): El nombre del usuario destino.
    """
    user_from = get_user(user_name_from)
    user_to = get_user(user_name_to)
    
    user_from.intermcambia.connect(user_to)
    user_to.intermcambia.connect(user_from)
        
def generate_recomendation_for_user(user_name):
    """
    Genera una recomendaciónm para un usuario siguiendo el criterio de recomendar servidores que estan
    suscriptos amigos hasta cierta distancia. Por defecto esta configurado con distancia 2 máximo entre amigos 
    y los mismo con usuarios que interactuo. Se busca crear una ponderación tomando en cuenta la cantidad de veces
    que el servidor esta en servidores de amigos y se le da mas peso si el servidor viene por un amigo que por un 

    Args:
        user_name_from: Nombre de usuario
    """
    distancia_max_amigo = 2
    distancia_max_intercambia = 1
    ponderador_amigo = 3
    ponderador_intercambia = 2

    cypher_all_relationship = f"""
        CALL {{
            MATCH path = (n:Usuario {{nombre: '{user_name}'}})-[r:AMIGO_DE*1..{distancia_max_amigo}]->(m)-[s:SUSCRITO_A]->(pepe: Servidor)
            where not exists((n)-[:SUSCRITO_A]->(pepe))
            WITH pepe.nombre AS groupingKey, path
            return groupingKey, min(length(path)) as largo_camino, count(*) as repeticiones, (toFloat(1)/min(length(path)))*(count(*))*{ponderador_amigo} as ponderador

            UNION 

            MATCH path = (n:Usuario {{nombre: '{user_name}'}})-[r:INTERCAMBIA_CON*1..{distancia_max_intercambia}]->(m)-[s:SUSCRITO_A]->(pepe: Servidor)
            where not exists((n)-[:SUSCRITO_A]->(pepe))
            WITH pepe.nombre AS groupingKey, path
            return groupingKey, min(length(path)) as largo_camino, count(*) as repeticiones, (toFloat(1)/min(length(path)))*(count(*))*{ponderador_intercambia} as ponderador
        }}
        WITH groupingKey, ponderador
        RETURN groupingKey, SUM(ponderador) as ponderador
        ORDER BY ponderador DESC
    """

    results, meta = db.cypher_query(cypher_all_relationship)

    df = pd.DataFrame(results, columns=[x[0] for x in meta])

    return df

In [50]:
clean_and_generate_test_date()

Se prueba generar una recomendación para el usuario Teo

In [51]:
generate_recomendation_for_user("Teo")

Unnamed: 0,g,p
0,Rocket League ESP,4.5
1,Barbie.ai,2.0
2,J. Balvin,1.5
3,Viajes por el mundo,1.0


Se agregan mas elementos al grafo y se visualiza como esto impacta en la recomendación

In [52]:
with db.transaction: 
    create_user("Alberto")
    create_server("Cocina")
    create_channel("Cocina", "recetas", "Texto")  
    add_suscription_to_server("Alberto", "Cocina")
    add_user_friend("Teo", "Alberto")

In [53]:
generate_recomendation_for_user("Teo")

Unnamed: 0,g,p
0,Rocket League ESP,4.5
1,Barbie.ai,2.0
2,J. Balvin,1.5
3,Cocina,1.5
4,Viajes por el mundo,1.0


Vamos a suscribir a al amigo de "Teo" a "Dani" para verificar que sube su ponderación

In [54]:
add_suscription_to_server("Dani", "Cocina")

In [None]:
generate_recomendation_for_user("Teo")

Por último se probo una librería de gráficos neo4jupyter para mostrar todo el gráfo. Es simple pero funcional, el javascript generado maneja física de los objetos y se puede interactuar.
    - https://github.com/merqurio/neo4jupyter

In [58]:
import neo4jupyter
neo4jupyter.init_notebook_mode()

<IPython.core.display.Javascript object>

In [64]:
neo4jupyter.draw(graph, options = {"Usuario": "nombre", "Servidor": "nombre", "Canal":"nombre"})