# DOCommunication - An√°lisis de Grafos de Comunicaci√≥n Gestual

Este notebook demuestra el an√°lisis completo de interacciones gestuales en UCI usando teor√≠a de grafos.

**Autor**: DOCommunication Team  
**Versi√≥n**: 1.0  
**Fecha**: 2024  

## Contenido

1. Configuraci√≥n e Imports
2. Generaci√≥n de Datos Simulados
3. Construcci√≥n del Grafo
4. An√°lisis de M√©tricas Estructurales
5. An√°lisis de Centralidades
6. Detecci√≥n de Comunidades
7. An√°lisis de Robustez
8. An√°lisis de Transiciones
9. Modelos de Difusi√≥n
10. Visualizaciones

## 1. Configuraci√≥n e Imports

In [None]:
# Imports
import sys
from pathlib import Path

# Agregar src al path
backend_path = Path.cwd().parent
src_path = backend_path / "src"
sys.path.insert(0, str(src_path))

# Imports del proyecto
from src.graph.analyzer import InteractionGraphAnalyzer
from src.utils.data_generator import DataGenerator
from src.models.session import InteractionRecord

# Imports de visualizaci√≥n
import matplotlib.pyplot as plt
import seaborn as sns
import networkx as nx
import numpy as np
import pandas as pd

# Configuraci√≥n de visualizaci√≥n
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")
%matplotlib inline

print("‚úÖ Imports completados")

## 2. Generaci√≥n de Datos Simulados

Generaremos datos de interacciones que simulan un paciente en UCI comunic√°ndose mediante gestos.

In [None]:
# Generar datos con estructura de comunidades
interactions = DataGenerator.generate_community_based(session_id="notebook_demo")

print(f"üìä Datos generados:")
print(f"  ‚Ä¢ Total de interacciones: {len(interactions)}")
print(f"  ‚Ä¢ Per√≠odo de tiempo: {interactions[-1].timestamp - interactions[0].timestamp:.1f} segundos")
print(f"\nüìù Primeras 5 interacciones:")

for i, interaction in enumerate(interactions[:5], 1):
    print(f"  {i}. {interaction.from_node} ‚Üí {interaction.to_node} (duraci√≥n: {interaction.duration:.2f}s)")

## 3. Construcci√≥n del Grafo

In [None]:
# Crear analizador y construir grafo
analyzer = InteractionGraphAnalyzer()
analyzer.build_from_interactions(interactions)

print(f"üîß Grafo construido:")
print(f"  ‚Ä¢ Nodos (palabras): {analyzer.graph.number_of_nodes()}")
print(f"  ‚Ä¢ Aristas (transiciones): {analyzer.graph.number_of_edges()}")
print(f"  ‚Ä¢ Tipo: {'Dirigido' if analyzer.graph.is_directed() else 'No dirigido'}")
print(f"  ‚Ä¢ D√©bilmente conexo: {'S√≠' if nx.is_weakly_connected(analyzer.graph) else 'No'}")

## 4. An√°lisis de M√©tricas Estructurales

In [None]:
# Calcular todas las m√©tricas
metrics = analyzer.compute_all_metrics()

print("üìà M√âTRICAS ESTRUCTURALES")
print("="*50)
print(f"Densidad: {metrics.density:.4f}")
print(f"Di√°metro: {metrics.diameter}")
print(f"Camino promedio: {metrics.avg_path_length:.4f}" if metrics.avg_path_length else "Camino promedio: N/A")
print(f"Clustering promedio: {metrics.avg_clustering_coefficient:.4f}")

# Distribuci√≥n de grados
degrees = [d for n, d in analyzer.graph.degree()]
print(f"\nDistribuci√≥n de grados:")
print(f"  ‚Ä¢ Grado promedio: {np.mean(degrees):.2f}")
print(f"  ‚Ä¢ Grado m√°ximo: {np.max(degrees)}")
print(f"  ‚Ä¢ Grado m√≠nimo: {np.min(degrees)}")

In [None]:
# Visualizar distribuci√≥n de grados
plt.figure(figsize=(10, 6))
plt.hist(degrees, bins=10, edgecolor='black', alpha=0.7)
plt.xlabel('Grado del Nodo')
plt.ylabel('Frecuencia')
plt.title('Distribuci√≥n de Grados en el Grafo de Interacciones')
plt.grid(True, alpha=0.3)
plt.show()

## 5. An√°lisis de Centralidades

Analizamos las diferentes medidas de centralidad para identificar nodos importantes.

In [None]:
# Crear DataFrame con centralidades
centrality_data = []
for node_metric in metrics.node_metrics:
    centrality_data.append({
        'Nodo': node_metric.node_id,
        'Degree': node_metric.degree_centrality,
        'Betweenness': node_metric.betweenness_centrality,
        'Closeness': node_metric.closeness_centrality,
        'Eigenvector': node_metric.eigenvector_centrality,
        'PageRank': node_metric.pagerank
    })

df_centralities = pd.DataFrame(centrality_data)
df_centralities = df_centralities.sort_values('PageRank', ascending=False)

print("üéØ TOP 5 NODOS POR CENTRALIDAD")
print("="*80)
print(df_centralities.head())

In [None]:
# Visualizar centralidades
fig, axes = plt.subplots(2, 3, figsize=(18, 12))
fig.suptitle('An√°lisis de Centralidades', fontsize=16, fontweight='bold')

centrality_cols = ['Degree', 'Betweenness', 'Closeness', 'Eigenvector', 'PageRank']

for idx, col in enumerate(centrality_cols):
    ax = axes[idx // 3, idx % 3]
    df_sorted = df_centralities.sort_values(col, ascending=True)
    
    ax.barh(df_sorted['Nodo'], df_sorted[col], color=sns.color_palette()[idx])
    ax.set_xlabel(col)
    ax.set_title(f'{col} Centrality')
    ax.grid(True, alpha=0.3)

# Ocultar el √∫ltimo subplot
axes[1, 2].axis('off')

plt.tight_layout()
plt.show()

## 6. Detecci√≥n de Comunidades

Identificamos grupos de palabras que tienden a aparecer juntas.

In [None]:
print(f"üåê AN√ÅLISIS DE COMUNIDADES")
print("="*50)
print(f"N√∫mero de comunidades: {metrics.num_communities}")
print(f"Modularidad: {metrics.modularity_score:.4f}")
print(f"\nDetalles por comunidad:")

for community in metrics.communities:
    print(f"\nComunidad {community.community_id}:")
    print(f"  ‚Ä¢ Tama√±o: {community.size} nodos")
    print(f"  ‚Ä¢ Nodos: {', '.join(community.nodes)}")
    print(f"  ‚Ä¢ Aristas internas: {community.internal_edges}")
    print(f"  ‚Ä¢ Aristas externas: {community.external_edges}")
    print(f"  ‚Ä¢ Contribuci√≥n a modularidad: {community.modularity_contribution:.4f}")

In [None]:
# Visualizar comunidades
plt.figure(figsize=(14, 10))

# Crear diccionario de colores por comunidad
community_colors = {}
for node_metric in metrics.node_metrics:
    community_colors[node_metric.node_id] = node_metric.community_id

# Layout
pos = nx.spring_layout(analyzer.graph, k=1.5, iterations=50, seed=42)

# Dibujar por comunidad
unique_communities = set(community_colors.values())
colors = sns.color_palette('husl', len(unique_communities))

for comm_id, color in zip(sorted(unique_communities), colors):
    nodes = [n for n, c in community_colors.items() if c == comm_id]
    nx.draw_networkx_nodes(
        analyzer.graph,
        pos,
        nodelist=nodes,
        node_color=[color],
        node_size=1500,
        label=f'Comunidad {comm_id}',
        alpha=0.9
    )

# Dibujar aristas
nx.draw_networkx_edges(
    analyzer.graph,
    pos,
    alpha=0.3,
    arrows=True,
    arrowsize=15
)

# Labels
nx.draw_networkx_labels(
    analyzer.graph,
    pos,
    font_size=10,
    font_weight='bold'
)

plt.title('Detecci√≥n de Comunidades en el Grafo de Interacciones', fontsize=16, fontweight='bold')
plt.legend()
plt.axis('off')
plt.tight_layout()
plt.show()

## 7. An√°lisis de Robustez

Evaluamos qu√© tan robusto es el grafo ante la remoci√≥n de nodos cr√≠ticos.

In [None]:
print("üõ°Ô∏è AN√ÅLISIS DE ROBUSTEZ")
print("="*50)
print(f"Nodos cr√≠ticos: {', '.join(metrics.robustness.critical_nodes)}")
print(f"Vulnerability score: {metrics.robustness.vulnerability_score:.4f}")
print(f"\nEfecto de remover nodo m√°s cr√≠tico:")
print(f"  ‚Ä¢ Camino promedio original: {metrics.robustness.avg_path_length_original:.4f}")
print(f"  ‚Ä¢ Camino promedio despu√©s: {metrics.robustness.avg_path_length_after_removal:.4f}")
print(f"  ‚Ä¢ P√©rdida de conectividad: {metrics.robustness.connectivity_loss:.1%}")

## 8. An√°lisis de Transiciones

Analizamos los patrones de transici√≥n entre palabras.

In [None]:
print("üîÑ AN√ÅLISIS DE TRANSICIONES")
print("="*50)
print(f"Entrop√≠a de Shannon: {metrics.transitions.entropy:.4f}")
print(f"Burstiness: {metrics.transitions.burstiness:.4f}")
print(f"\nCaminos m√°s comunes:")

for i, path in enumerate(metrics.transitions.most_common_paths[:5], 1):
    print(f"  {i}. {' ‚Üí '.join(path)}")

In [None]:
# Visualizar matriz de transiciones
transition_matrix = metrics.transitions.transition_matrix

# Convertir a matriz numpy
nodes = sorted(analyzer.graph.nodes())
n = len(nodes)
matrix = np.zeros((n, n))

for i, from_node in enumerate(nodes):
    if from_node in transition_matrix:
        for j, to_node in enumerate(nodes):
            if to_node in transition_matrix[from_node]:
                matrix[i, j] = transition_matrix[from_node][to_node]

# Visualizar
plt.figure(figsize=(12, 10))
sns.heatmap(
    matrix,
    xticklabels=nodes,
    yticklabels=nodes,
    annot=True,
    fmt='.2f',
    cmap='YlOrRd',
    cbar_kws={'label': 'Probabilidad de Transici√≥n'}
)
plt.title('Matriz de Transiciones', fontsize=16, fontweight='bold')
plt.xlabel('Nodo Destino')
plt.ylabel('Nodo Origen')
plt.tight_layout()
plt.show()

## 9. Modelos de Difusi√≥n

Simulamos c√≥mo se difundir√≠a informaci√≥n desde cada nodo.

In [None]:
print("üí´ AN√ÅLISIS DE DIFUSI√ìN")
print("="*50)
print(f"Threshold de activaci√≥n: {metrics.diffusion.activation_threshold:.2f}")
print(f"\nInfluence Maximizers (Top 3):")
for i, node in enumerate(metrics.diffusion.influence_maximizers, 1):
    spread = metrics.diffusion.spread_potential[node]
    cascade = metrics.diffusion.expected_cascade_size[node]
    print(f"  {i}. {node}: {spread:.1%} alcance, {cascade:.0f} nodos activados")

In [None]:
# Visualizar potencial de difusi√≥n
spread_data = [(node, metrics.diffusion.spread_potential[node]) 
               for node in analyzer.graph.nodes()]
spread_data.sort(key=lambda x: x[1], reverse=True)

nodes, spreads = zip(*spread_data)

plt.figure(figsize=(12, 6))
plt.bar(nodes, spreads, color=sns.color_palette('viridis', len(nodes)))
plt.xlabel('Nodo')
plt.ylabel('Potencial de Difusi√≥n')
plt.title('Potencial de Difusi√≥n por Nodo (Independent Cascade Model)', fontsize=14, fontweight='bold')
plt.xticks(rotation=45)
plt.grid(True, alpha=0.3, axis='y')
plt.tight_layout()
plt.show()

## 10. Visualizaci√≥n del Grafo Completo

In [None]:
# Visualizaci√≥n completa del grafo
plt.figure(figsize=(16, 12))

# Layout
pos = nx.spring_layout(analyzer.graph, k=2, iterations=50, seed=42)

# Tama√±o de nodos seg√∫n PageRank
pageranks = [m.pagerank for m in metrics.node_metrics]
node_sizes = [pr * 10000 for pr in pageranks]

# Color de nodos seg√∫n comunidad
community_map = {m.node_id: m.community_id for m in metrics.node_metrics}
node_colors = [community_map[node] for node in analyzer.graph.nodes()]

# Dibujar nodos
nx.draw_networkx_nodes(
    analyzer.graph,
    pos,
    node_size=node_sizes,
    node_color=node_colors,
    cmap='tab10',
    alpha=0.9
)

# Grosor de aristas seg√∫n peso
edges = analyzer.graph.edges()
weights = [analyzer.graph[u][v]['weight'] for u, v in edges]
max_weight = max(weights) if weights else 1

nx.draw_networkx_edges(
    analyzer.graph,
    pos,
    width=[w / max_weight * 5 for w in weights],
    alpha=0.4,
    edge_color='gray',
    arrows=True,
    arrowsize=20,
    connectionstyle='arc3,rad=0.1'
)

# Labels
nx.draw_networkx_labels(
    analyzer.graph,
    pos,
    font_size=12,
    font_weight='bold',
    font_color='white'
)

plt.title('Grafo de Interacciones DOCommunication\n(Tama√±o = PageRank, Color = Comunidad, Grosor = Frecuencia)',
         fontsize=16, fontweight='bold')
plt.axis('off')
plt.tight_layout()
plt.show()

## Conclusiones

Este notebook ha demostrado un an√°lisis completo del grafo de interacciones gestuales:

1. **M√©tricas Estructurales**: Evaluamos densidad, di√°metro y clustering
2. **Centralidades**: Identificamos nodos clave usando 5 m√©tricas diferentes
3. **Comunidades**: Detectamos grupos de palabras relacionadas
4. **Robustez**: Evaluamos vulnerabilidad del sistema
5. **Transiciones**: Analizamos patrones de flujo entre palabras
6. **Difusi√≥n**: Modelamos propagaci√≥n de informaci√≥n

### Aplicaciones Pr√°cticas

- **Optimizaci√≥n de vocabulario**: Priorizar palabras con alta centralidad
- **Dise√±o de UI**: Agrupar palabras por comunidades
- **Predicci√≥n**: Usar matriz de transiciones para sugerir pr√≥xima palabra
- **Robustez**: Identificar dependencias cr√≠ticas del sistema