<a href="https://colab.research.google.com/github/Carolinsrainbow/UC_AnalisisRS/blob/main/Test_Lab10.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Ejercicio 1: Actualización de Etiqueta de un Nodo (Paso de Propagación de Etiquetas)

**Contexto:**
El algoritmo de propagación de etiquetas es un método para detectar comunidades en grafos. En cada paso, los nodos adoptan la etiqueta más frecuente entre sus vecinos.

**Tu Tarea:**
Implementa una función llamada `actualizar_etiqueta_nodo`. Esta función simulará un único paso de actualización para un nodo específico.

La función recibirá:
1.  Un grafo de NetworkX (`graph`).
2.  Un diccionario de partición actual (`current_partition_map`) donde las claves son nodos y los valores son sus etiquetas de comunidad actuales.
3.  El nodo específico (`node_to_update`) cuya etiqueta se va a determinar.

La función deberá:
*   Identificar las etiquetas de los vecinos del `node_to_update`.
*   Encontrar la etiqueta más frecuente entre estos vecinos.
*   Si hay un empate en la frecuencia de las etiquetas, se debe elegir una de las etiquetas empatadas de forma aleatoria.
*   Devolver la etiqueta seleccionada para `node_to_update`.

**Suposiciones:**
*   El `node_to_update` tiene vecinos. Si no tuviera vecinos, puede devolver su etiqueta actual.
*   La función `random.choice()` es útil para desempates.

In [2]:
import networkx as nx
import random
import numpy as np
from typing import Dict, Any, Set, List, Tuple, Optional
import math

def actualizar_etiqueta_nodo(graph: nx.Graph, current_partition_map: Dict[Any, int], node_to_update: Any) -> int:
    """
    Determina la nueva etiqueta para un nodo basada en la etiqueta más frecuente de sus vecinos.

    Args:
        graph: El grafo de NetworkX.
        current_partition_map: Un diccionario {nodo: etiqueta_actual}.
        node_to_update: El nodo cuya etiqueta se va a determinar.

    Returns:
        La nueva etiqueta seleccionada para el nodo.
    """
    return random.choice([label for label, count in
                          __import__('collections').Counter([current_partition_map[n] for n in graph.neighbors(node_to_update)]).items()
                          if count == max(__import__('collections').Counter([current_partition_map[n] for n in graph.neighbors(node_to_update)]).values())]) \
           if list(graph.neighbors(node_to_update)) else current_partition_map[node_to_update]


# Crear un grafo de prueba
G_test1 = nx.Graph()
G_test1.add_edges_from([(0,1), (0,2), (0,3), (1,2), (1,4), (2,4), (3,5)])
partition_map_test1 = {0:10, 1:20, 2:10, 3:30, 4:20, 5:30}
new_label_for_1 = actualizar_etiqueta_nodo(G_test1, partition_map_test1, 1)
assert new_label_for_1 == 10, f"Error para nodo 1. Esperado 10, obtenido {new_label_for_1}"


# Ejercicio 2: Cálculo de la Entropía de una Partición H(X)

**Contexto:**
La entropía $H(X)$ de una partición $X$ mide la incertidumbre o "sorpresa" asociada a la distribución de nodos en las comunidades. Una entropía más alta puede indicar una mayor cantidad de comunidades o una distribución más uniforme de nodos entre ellas.
La fórmula es:
$$ H(X) = - \sum_{x \in X} P(x) \log(P(x)) $$
donde $X$ es el conjunto de comunidades, $x$ es una comunidad individual, $P(x) = \frac{|x|}{N}$ es la proporción de nodos en la comunidad $x$, y $(N$) es el número total de nodos en el grafo. Usaremos el logaritmo natural (`np.log`).

**Tu Tarea:**
Implementa una función llamada `calcular_entropia_particion`.

La función recibirá:
1.  Una partición (`partition_sets`), representada como una lista de `set`s, donde cada `set` contiene los nodos de una comunidad.

La función deberá:
*   Calcular el número total de nodos $N$ en todas las comunidades.
*   Para cada comunidad $x$ en `partition_sets`:
    *   Calcular $P(x)$.
    *   Calcular $P(x) \log(P(x))$. (Si $P(x) = 0$, entonces $P(x) \log(P(x)) = 0$).
*   Sumar estos valores y multiplicar por -1 para obtener $H(X)$.
*   Devolver el valor de la entropía.

**Suposiciones:**
*   La `partition_sets` no estará vacía y los `set`s de comunidades no estarán vacíos.
*   Todos los nodos son únicos a través de las comunidades (es una partición válida).

In [3]:
def calcular_entropia_particion(partition_sets: List[Set[Any]]) -> float:
    """
    Calcula la entropía H(X) de una partición dada.

    Args:
        partition_sets: Una lista de sets, donde cada set es una comunidad.

    Returns:
        El valor de la entropía H(X).
    """
    return -sum((len(c)/sum(len(s) for s in partition_sets)) * np.log(len(c)/sum(len(s) for s in partition_sets)) for c in partition_sets)


# Partición de prueba 1:
particion_test2_a = [{0, 1, 2}, {3, 4, 5}]
# N=6. P(x1)=3/6=0.5, P(x2)=3/6=0.5
# H(X) = - (0.5*log(0.5) + 0.5*log(0.5)) = - (2 * 0.5 * log(0.5)) = -log(0.5) = log(2)
entropia_esperada_a = np.log(2) # Aproximadamente 0.693
entropia_calculada_a = calcular_entropia_particion(particion_test2_a)
assert np.isclose(entropia_calculada_a, entropia_esperada_a), \
    f"Error para partición A. Esperado {entropia_esperada_a:.4f}, obtenido {entropia_calculada_a:.4f}"

# Partición de prueba 1: Dos comunidades de igual tamaño
particion_test2_a = [{0, 1, 2}, {3, 4, 5}]
# N=6. P(x1)=3/6=0.5, P(x2)=3/6=0.5
# H(X) = - (0.5*log(0.5) + 0.5*log(0.5)) = - (2 * 0.5 * log(0.5)) = -log(0.5) = log(2)
entropia_esperada_a = np.log(2) # Aproximadamente 0.693
entropia_calculada_a = calcular_entropia_particion(particion_test2_a)
assert np.isclose(entropia_calculada_a, entropia_esperada_a), \
    f"Error para partición A. Esperado {entropia_esperada_a:.4f}, obtenido {entropia_calculada_a:.4f}"

# Partición de prueba 2: Una sola comunidad con todos los nodos
particion_test2_b = [{0, 1, 2, 3, 4, 5}]
# N=6. P(x1)=6/6=1.
# H(X) = - (1*log(1)) = 0
entropia_esperada_b = 0.0
entropia_calculada_b = calcular_entropia_particion(particion_test2_b)
assert np.isclose(entropia_calculada_b, entropia_esperada_b), \
    f"Error para partición B. Esperado {entropia_esperada_b:.4f}, obtenido {entropia_calculada_b:.4f}"

# Partición de prueba 3: Tres comunidades
particion_test2_c = [{0,1}, {2,3,4}, {5}]
# N=6. P(x1)=2/6, P(x2)=3/6, P(x3)=1/6
p1 = 2/6; p2 = 3/6; p3 = 1/6
entropia_esperada_c = - (p1*np.log(p1) + p2*np.log(p2) + p3*np.log(p3)) # Aprox 1.0114
entropia_calculada_c = calcular_entropia_particion(particion_test2_c)
assert np.isclose(entropia_calculada_c, entropia_esperada_c), \
    f"Error para partición C. Esperado {entropia_esperada_c:.4f}, obtenido {entropia_calculada_c:.4f}"

print("Tests para calcular_entropia_particion pasados exitosamente.")


Tests para calcular_entropia_particion pasados exitosamente.
