In [4]:
import networkx as nx
import pickle as pkl

In [10]:
with open("/usrvol/processed_data/SNLI/test/constituency/constituency0.pkl", "rb") as f:
    graphs = pkl.load(f)

# Metrics with networkX

## Number of nodes

In [36]:
n_nodes = len(graphs[0][0].nodes)

## Number of edges

In [38]:
n_edges = len(graphs[0][0].edges)

## Average Degree

In [18]:
degree_dict = dict(graphs[0][0].degree())

In [20]:
avg_degree = sum(degree_dict.values()) / len(degree_dict)

## Betweenness Centrality

In [22]:
betweenness = nx.betweenness_centrality(G[0][0])


In [77]:
betweenness

{'S': 0.0,
 'NP0': 0.003694581280788177,
 0: 0.0,
 5: 0.0,
 12: 0.0,
 'VP1': 0.02832512315270936,
 18: 0.0,
 'PP11': 0.009852216748768473,
 24: 0.0,
 'NP111': 0.007389162561576354,
 27: 0.0,
 31: 0.0,
 'SBAR12': 0.04064039408866995,
 32: 0.0,
 'S121': 0.05665024630541872,
 'NP1210': 0.0049261083743842365,
 41: 0.0,
 'VP1211': 0.06403940886699508,
 'NP12111': 0.046798029556650245,
 'NP121110': 0.014778325123152709,
 51: 0.0,
 58: 0.0,
 'PP121111': 0.027093596059113302,
 64: 0.0,
 'NP1211111': 0.014778325123152709,
 73: 0.0,
 'PP12112': 0.019704433497536946,
 78: 0.0,
 'NP121121': 0.009852216748768473,
 89: 0.0}

## Local Clustering Coefficient

In [26]:
local_clustering_coeff = nx.clustering(G[0][0])

In [27]:
mean_local_clustering_coeff = sum(local_clustering_coeff.values()) / len(local_clustering_coeff)

## Global Clustering Coefficient

In [30]:
global_clustering_coeff = nx.transitivity(G[0][0])

## Density

In [32]:
density = nx.density(G[0][0])

## PageRank

In [34]:
pagerank = nx.pagerank(G[0][0])

# Metrics with Pytorch Geometric

In [44]:
from arguments import *
from dataloader import *

In [45]:
dataset = Dataset_GNN(root=args['root_test_data_path'], files_path=args['raw_test_data_path'])

## Number of nodes

In [65]:
n_nodes = len(dataset[0][0].x1)

## Number of edges

In [67]:
n_edges = len(dataset[0][0].edge_index1[0])

## Degree

In [207]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx


def calculate_average_degree(data):
    """
    Calculate the average degree of a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.

    Returns:
    - average_degree (float): The average degree of all nodes in the graph.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate the degrees of all nodes
    degrees = dict(G.degree())
    # Calculate the average degree
    average_degree = sum(degrees.values()) / len(degrees)
    return average_degree

In [208]:
# Calculate the average degree for the first graph representation (undirected)
average_degree1 = calculate_average_degree(Data(edge_index=dataset[0][0].edge_index1, num_nodes=dataset[0][0].x1.size(0)))
print(f"Average Degree for data1 (edge_index1): {average_degree1}")


Average Degree for data1 (edge_index1): 1.9


## Betweenness Centrality

In [196]:
def calculate_betweenness_centrality(data):
    """
    Calculate the average betweenness centrality of a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.

    Returns:
    - average_betweenness_centrality (float): The average betweenness centrality score of all nodes.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate Betweenness Centrality
    betweenness_centrality = nx.betweenness_centrality(G)
    # Calculate the average betweenness centrality
    average_betweenness_centrality = sum(betweenness_centrality.values()) / len(betweenness_centrality)
    return average_betweenness_centrality


In [197]:
# Calculate the average Betweenness Centrality for the first graph representation (undirected)
average_betweenness_centrality1 = calculate_betweenness_centrality(Data(edge_index=dataset[0][0].edge_index1, num_nodes=dataset[0][0].x1.size(0)))
print(f"Average Betweenness Centrality for data1 (edge_index1): {average_betweenness_centrality1}")

Average Betweenness Centrality for data1 (edge_index1): 0.17076023391812867


## Local clustering coefficient

In [176]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx


def calculate_mean_clustering_coefficient(data):
    """
    Calculate the mean clustering coefficient for a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.

    Returns:
    - mean_clustering_coefficient (float): The mean clustering coefficient for the graph.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate the local clustering coefficient
    clustering_coefficients = nx.clustering(G)
    # Calculate and return the mean clustering coefficient
    mean_clustering_coefficient = sum(clustering_coefficients.values()) / len(clustering_coefficients)
    return mean_clustering_coefficient

In [177]:
# Example usage
data = Data(edge_index=dataset[0][3].edge_index2, num_nodes=len(dataset[0][0].x2))  # Simple example graph
mean_clustering_coefficient = calculate_mean_clustering_coefficient(data)

In [178]:
mean_clustering_coefficient

0.0

## Global Clustering Coefficient

In [170]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx

def calculate_global_clustering_coefficient(data):
    """
    Calculate the global clustering coefficient for a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.

    Returns:
    - global_clustering_coefficient (float): The global clustering coefficient for the graph.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate the global clustering coefficient
    global_clustering_coefficient = nx.transitivity(G)
    return global_clustering_coefficient

In [171]:
global_clustering_coefficient1 = calculate_global_clustering_coefficient(Data(edge_index=dataset[0][0].edge_index1, num_nodes=dataset[0][0].x1.size(0)))

In [172]:
global_clustering_coefficient1

0

## Density

In [179]:
def calculate_density(data):
    """
    Calculate the density of a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.

    Returns:
    - density (float): The density of the graph.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate the density of the graph
    density = nx.density(G)
    return density

In [180]:
density1 = calculate_density(Data(edge_index=dataset[0][0].edge_index1, num_nodes=dataset[0][0].x1.size(0)))
print(f"Density for data1 (edge_index1): {density1}")

Density for data1 (edge_index1): 0.1


## Average PageRank

If the graph has a relatively uniform distribution of PageRank scores, the average will be similar across different nodes. If some nodes have significantly high centrality, the average PageRank will be higher. This is a good measure if you want to compare different graphs or understand the spread of importance across nodes.

In [223]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx


def calculate_average_pagerank(data, alpha=0.85):
    """
    Calculate the PageRank of each node in a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.
    - alpha (float): The damping factor for PageRank, default is 0.85.

    Returns:
    - pagerank (dict): A dictionary containing the PageRank score for each node.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate PageRank
    pagerank = nx.pagerank(G, alpha=alpha)
    average_pagerank = sum(pagerank.values()) / len(pagerank)
    return average_pagerank

In [224]:
# Calculate the PageRank for the first graph representation (undirected)
pagerank = calculate_average_pagerank(Data(edge_index=dataset[0][0].edge_index1, num_nodes=dataset[0][0].x1.size(0)))
print(f"PageRank for data1 (edge_index1): {pagerank}")

PageRank for data1 (edge_index1): 0.05000000000000001


## Total PageRank

The total value itself may not provide significant new information, but it can be useful when comparing how the centrality is distributed or when using different damping factors.

In [226]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx


def calculate_total_pagerank(data, alpha=0.85):
    """
    Calculate the PageRank of each node in a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.
    - alpha (float): The damping factor for PageRank, default is 0.85.

    Returns:
    - pagerank (dict): A dictionary containing the PageRank score for each node.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate PageRank
    pagerank = nx.pagerank(G, alpha=alpha)
    total_pagerank = sum(pagerank.values())
    return total_pagerank

In [228]:
# Calculate the PageRank for the first graph representation (undirected)
pagerank = calculate_total_pagerank(Data(edge_index=dataset[0][0].edge_index2, num_nodes=dataset[0][0].x2.size(0)))
print(f"PageRank for data1 (edge_index1): {pagerank}")

PageRank for data1 (edge_index1): 0.9999999999999999


## PageRank standard deviation

A high standard deviation means that some nodes have much higher importance than others, indicating a more hierarchical or unequal graph structure. A low standard deviation implies that importance is more evenly spread across nodes.

In [231]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx
import statistics

def calculate_std_dev_pagerank(data, alpha=0.85):
    """
    Calculate the PageRank of each node in a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.
    - alpha (float): The damping factor for PageRank, default is 0.85.

    Returns:
    - pagerank (dict): A dictionary containing the PageRank score for each node.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate PageRank
    pagerank = nx.pagerank(G, alpha=alpha)
    pagerank_scores = list(pagerank.values())
    pagerank_std_dev = statistics.stdev(pagerank_scores)
    return pagerank_std_dev

In [234]:
# Calculate the PageRank for the first graph representation (undirected)
pagerank = calculate_std_dev_pagerank(Data(edge_index=dataset[0][1].edge_index1, num_nodes=dataset[0][1].x1.size(0)))
print(f"PageRank standard deviation for data1 (edge_index1): {pagerank}")

PageRank standard deviation for data1 (edge_index1): 0.05096809409151725


## PageRank Entropy

Higher entropy means that PageRank is distributed more uniformly across nodes, whereas lower entropy indicates that a few nodes dominate the importance.

In [236]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx
import math

def calculate_entropy_pagerank(data, alpha=0.85):
    """
    Calculate the PageRank of each node in a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.
    - alpha (float): The damping factor for PageRank, default is 0.85.

    Returns:
    - pagerank (dict): A dictionary containing the PageRank score for each node.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate PageRank
    pagerank = nx.pagerank(G, alpha=alpha)
    pagerank_entropy = -sum(p * math.log(p) for p in pagerank.values() if p > 0)
    return pagerank_entropy

In [238]:
# Calculate the PageRank for the first graph representation (undirected)
pagerank = calculate_entropy_pagerank(Data(edge_index=dataset[0][1].edge_index1, num_nodes=dataset[0][1].x1.size(0)))
print(f"PageRank entropy for data1 (edge_index1): {pagerank}")

PageRank entropy for data1 (edge_index1): 2.450868311619199


## Maximum PageRank

This metric identifies which node in the graph holds the most influence or importance. This is useful for quickly finding the most influential node and understanding the relative dominance within the network.

In [240]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx

def calculate_maximum_pagerank(data, alpha=0.85):
    """
    Calculate the PageRank of each node in a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.
    - alpha (float): The damping factor for PageRank, default is 0.85.

    Returns:
    - pagerank (dict): A dictionary containing the PageRank score for each node.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate PageRank
    pagerank = nx.pagerank(G, alpha=alpha)
    max_pagerank = max(pagerank.values())
    return max_pagerank

In [242]:
# Calculate the PageRank for the first graph representation (undirected)
pagerank = calculate_maximum_pagerank(Data(edge_index=dataset[0][0].edge_index1, num_nodes=dataset[0][0].x1.size(0)))
print(f"Maximum PageRank for data1 (edge_index1): {pagerank}")

Maximum PageRank for data1 (edge_index1): 0.12776438625366332


## General PageRank Function

In [243]:
import torch
from torch_geometric.data import Data
import torch_geometric.utils as tg_utils
import networkx as nx
import math
import statistics


def calculate_pagerank(data, alpha=0.85):
    """
    Calculate the PageRank of each node in a PyTorch Geometric graph.

    Parameters:
    - data (torch_geometric.data.Data): The graph data object containing edge_index.
    - alpha (float): The damping factor for PageRank, default is 0.85.

    Returns:
    - pagerank (dict): A dictionary containing the PageRank score for each node.
    """
    # Convert PyTorch Geometric graph to NetworkX graph
    G = tg_utils.to_networkx(data, to_undirected=True, remove_self_loops=True)
    # Use NetworkX to calculate PageRank
    pagerank = nx.pagerank(G, alpha=alpha)
    average_pagerank = sum(pagerank.values()) / len(pagerank)
    total_pagerank = sum(pagerank.values())
    pagerank_scores = list(pagerank.values())
    pagerank_std_dev = statistics.stdev(pagerank_scores)
    pagerank_entropy = -sum(p * math.log(p) for p in pagerank.values() if p > 0)
    max_pagerank = max(pagerank.values())

    results = {
        'average_pagerank': average_pagerank,
        'total_pagerank': total_pagerank,
        'pagerank_std_dev': pagerank_std_dev,
        'pagerank_entropy': pagerank_entropy,
        'max_pagerank': max_pagerank
    }

    return results

In [247]:
# Calculate the PageRank for the first graph representation (undirected)
pagerank = calculate_pagerank(Data(edge_index=dataset[0][15].edge_index1, num_nodes=dataset[0][15].x1.size(0)))
print(f"Maximum PageRank for data1 (edge_index1): {pagerank['max_pagerank']}")
print(f"Average PageRank for data1 (edge_index1): {pagerank['average_pagerank']}")
print(f"Total PageRank for data1 (edge_index1): {pagerank['total_pagerank']}")
print(f"PageRank standard deviation for data1 (edge_index1): {pagerank['pagerank_std_dev']}")
print(f"PageRank entropy for data1 (edge_index1): {pagerank['pagerank_entropy']}")

Maximum PageRank for data1 (edge_index1): 0.10623133512032584
Average PageRank for data1 (edge_index1): 0.06666666666666665
Total PageRank for data1 (edge_index1): 0.9999999999999998
PageRank standard deviation for data1 (edge_index1): 0.027278800047661263
PageRank entropy for data1 (edge_index1): 2.6282297599056035


## General Degree Function

En esta función obtenemos diferentes métricas relacionadas con el grado del grafo, como es el grado promedio, grado máximo y mínimo, distribución del grado y porcentaje de nodos con bajo grado

# Calculo automático de rollout y expand_Atoms

Hacer que los parámetros **`rollout`** y **`expand_atoms`** dependan del **tamaño total del grafo** (es decir, el número de nodos y aristas) es una estrategia lógica y efectiva. Los grafos con distintos tamaños y estructuras tienen requerimientos de búsqueda diferentes, y adaptar estos parámetros a las características del grafo puede conducir a una mejor explicación de la estructura y comportamiento del grafo. A continuación, detallo cómo se podría establecer esta dependencia y cómo influiría en los valores óptimos para `rollout` y `expand_atoms`:

### Dependencia del Tamaño Total del Grafo

#### 1. **`rollout` Dependiente del Tamaño del Grafo**
El parámetro **`rollout`** representa el **número de simulaciones** o el **número de iteraciones** que se realizan durante la búsqueda con **Monte Carlo Tree Search (MCTS)** para explorar posibles expansiones del grafo. Su relación con el tamaño total del grafo es importante:

- **Grafo Pequeño**: 
  - Un grafo pequeño tiene menos nodos y aristas, lo que significa que hay un **espacio de búsqueda limitado**. En este caso, un `rollout` pequeño sería suficiente para explorar exhaustivamente la estructura del grafo. Un `rollout` demasiado alto resultaría en simulaciones redundantes, aumentando el costo computacional sin beneficio adicional.
  
- **Grafo Grande**: 
  - Un grafo grande tiene muchas más posibilidades de conexión y, por ende, el **espacio de búsqueda es mucho más amplio**. En este caso, se requiere un `rollout` mayor para tener una cobertura adecuada y explorar distintas partes del grafo. Un `rollout` bajo podría dejar sin explorar regiones potencialmente importantes, resultando en una explicación menos precisa.

Entonces, podrías definir `rollout` como una **función del número de nodos (N)**. Una fórmula posible sería:

\[
\text{rollout} = \alpha \times N
\]

donde **\(\alpha\)** es un factor de ajuste que puedes elegir según el problema específico.

Por ejemplo:
- Para grafos con menos de 100 nodos, podrías elegir \(\alpha = 1\), resultando en un `rollout` igual al número de nodos.
- Para grafos más grandes, podrías incrementar \(\alpha\), por ejemplo, \(\alpha = 2\) para un mayor nivel de cobertura.

#### 2. **`expand_atoms` Dependiente del Tamaño del Grafo**
El parámetro **`expand_atoms`** controla el **número de nodos a expandir** durante la construcción de la búsqueda de MCTS. Es decir, cuántos nodos adicionales considerar cuando se amplía la exploración de un subgrafo. Su dependencia del tamaño del grafo también es fundamental:

- **Grafo Pequeño**: 
  - En un grafo pequeño, donde hay menos nodos, es probable que se quiera mantener una **exploración controlada**. Si se expande demasiados nodos a la vez, es posible que se termine explorando una gran parte del grafo innecesariamente. Por lo tanto, es recomendable tener un `expand_atoms` relativamente pequeño en grafos pequeños.
  
- **Grafo Grande**:
  - En un grafo grande, hay muchas más opciones para la expansión, por lo cual es útil tener un `expand_atoms` más grande para **explorar más nodos en cada iteración**, ya que esto aumentará las posibilidades de cubrir las partes más importantes del grafo. Si `expand_atoms` es pequeño en un grafo grande, se corre el riesgo de avanzar de manera muy lenta y de no alcanzar partes significativas del grafo en un tiempo razonable.

Una posible fórmula para `expand_atoms` podría ser:

\[
\text{expand\_atoms} = \beta \times \log(N)
\]

donde **\(\beta\)** es un factor de ajuste.

- Usar una función logarítmica tiene sentido aquí porque:
  - A medida que aumenta el número de nodos, **`expand_atoms` crece más lentamente**, lo que ayuda a controlar el crecimiento del costo computacional.
  - Para grafos grandes, se permite una expansión más significativa, pero sin que crezca linealmente con el tamaño del grafo, lo cual podría volverse inmanejable.

#### 3. **Adaptación Combinada**
Para adaptar estos dos parámetros de manera efectiva, podrías definir una estrategia combinada que tenga en cuenta tanto el **número de nodos (\(N\))** como el **número de aristas (\(E\))**:

- **`rollout`**: Podría ser proporcional al número total de nodos, ajustado por un factor que dependa de la conectividad del grafo. Si el grafo es **muy disperso**, aumentar el valor de `rollout` puede ser más importante para tener una buena cobertura.

  \[
  \text{rollout} = \gamma \times N \times \left(1 + \frac{1}{\text{densidad}}\right)
  \]

  Donde la **densidad** es \(\frac{2E}{N(N-1)}\), y \(\gamma\) es un factor de ajuste. De esta manera, si el grafo es muy disperso (densidad baja), `rollout` se incrementa proporcionalmente para compensar la falta de conectividad.

- **`expand_atoms`**: Podría depender tanto del número de nodos como del **grado promedio**:

  \[
  \text{expand\_atoms} = \eta \times \log(N) + \delta \times \text{grado promedio}
  \]

  donde \(\eta\) y \(\delta\) son factores de ajuste. Esto hace que `expand_atoms` aumente con el tamaño del grafo, pero también tenga en cuenta la conectividad local (grado promedio).


### Conclusión
Hacer que **`rollout`** y **`expand_atoms`** dependan del **tamaño del grafo** y otras métricas como **densidad** y **grado promedio** es una buena práctica para adaptar automáticamente el proceso de expansión y búsqueda en MCTS. Estas adaptaciones permiten encontrar mejores subgrafos explicativos con una cobertura más adecuada del grafo, independientemente de si es pequeño, grande, disperso o denso. Esta estrategia no solo mejora la calidad de la explicación, sino que también optimiza los recursos computacionales, evitando cálculos innecesarios o insuficientes.

In [None]:
import numpy as np
import networkx as nx

def calculate_beta_auto(graph, beta_0=0.1):
    """
    Calcula el factor beta automáticamente según las propiedades del grafo,
    con normalización de las métricas para asegurar contribuciones equilibradas.

    Parámetros:
        graph: Un objeto grafo de NetworkX.
        beta_0: Valor base de beta.

    Retorna:
        beta: Valor calculado de beta.
    """
    N = graph.number_of_nodes()
    E = graph.number_of_edges()

    # Evitar divisiones por cero
    if N <= 1:
        return beta_0

    # Calcular densidad
    D = nx.density(graph)  # Rango [0, 1]

    # Calcular grado promedio
    avg_degree = (2 * E) / N

    # Calcular desviación estándar del grado
    degrees = [degree for node, degree in graph.degree()]
    std_degree = np.std(degrees)

    # Normalizar grado promedio y desviación estándar usando logaritmo
    avg_degree_norm = np.log(avg_degree + 1) / np.log(N)
    std_degree_norm = np.log(std_degree + 1) / np.log(N)

    # Limitar los valores normalizados a [0, 1]
    avg_degree_norm = min(avg_degree_norm, 1)
    std_degree_norm = min(std_degree_norm, 1)

    # Calcular beta automáticamente
    beta = beta_0 * (1 + (D + avg_degree_norm + std_degree_norm) / 3)

    return beta

In [None]:
def calculate_rollout(graph, alfa_method, gamma=1, beta_0=0.1):
    """
    Calcula el número de rollouts automáticamente según las propiedades del grafo.

    Parámetros:
        graph: Un objeto grafo de NetworkX.
        gamma: Factor de escala para alfa en rollout.
        beta_0: Valor base de beta.

    Retorna:
        rollout: Número de rollouts calculado automáticamente.
    """
    N = graph.number_of_nodes()

    # Calcular alfa basado en N
    if alfa_method == 'log':
        alpha = gamma * math.log10(N)
    
    elif alfa_method == 'step':
        if N <= 10:
            alpha = 1
        elif N > 10 and N <= 100:
            alpha = int(1 + 0.015*(N-10))
        elif N > 100:
            alpha = int(2.35+0.005*(N-100))

    # Calcular beta automáticamente con métricas normalizadas
    beta_auto = calculate_beta_auto(graph, beta_0)

    # Calcular rollout
    rollout = int(alpha * N * (1 + beta_auto))

    return rollout

In [None]:
import numpy as np
import networkx as nx

def calculate_expand_atoms(graph, eta_0=2):
    """
    Calcula el valor de expand_atoms automáticamente según las propiedades del grafo.

    Parámetros:
        graph: Un objeto grafo de NetworkX.
        eta_0: Valor base de expand_atoms.

    Retorna:
        expand_atoms: Valor calculado de expand_atoms.
    """
    N = graph.number_of_nodes()
    E = graph.number_of_edges()

    # Evitar divisiones por cero
    if N <= 1:
        return eta_0

    # Calcular grado promedio
    avg_degree = (2 * E) / N

    # Calcular desviación estándar del grado
    degrees = [degree for node, degree in graph.degree()]
    std_degree = np.std(degrees)

    # Normalizar grado promedio y desviación estándar
    avg_degree_norm = np.log(avg_degree + 1) / np.log(N)
    std_degree_norm = np.log(std_degree + 1) / np.log(N)

    # Limitar los valores normalizados a [0, 1]
    avg_degree_norm = min(avg_degree_norm, 1)
    std_degree_norm = min(std_degree_norm, 1)

    # Calcular densidad
    D = nx.density(graph)  # Ya está en el rango [0, 1]

    # Calcular expand_atoms
    expand_atoms = eta_0 * (1 + (avg_degree_norm + D + std_degree_norm) / 3)

    # Asegurar que expand_atoms sea al menos 1 y entero
    expand_atoms = max(int(expand_atoms), 1)

    return expand_atoms

# Cálculo automático de c_puct

Ah, entiendo ahora. **Estás preguntando cuál es el rango habitual o los valores típicos de `c_puct` utilizados en SubgraphX**, no los valores calculados a partir de nuestra fórmula propuesta. Mis disculpas por la confusión.

### **Rango Habitual de `c_puct` en SubgraphX**

En el contexto de **SubgraphX**, el parámetro **`c_puct`** se utiliza dentro del algoritmo de **Monte Carlo Tree Search (MCTS)** para controlar el equilibrio entre **exploración** y **explotación** durante la construcción del árbol de búsqueda. Este parámetro es crucial para el rendimiento del algoritmo, y su valor afecta significativamente la calidad y eficiencia de las explicaciones generadas.

#### **Valores Típicos de `c_puct`**

- **Valor Predeterminado**: En la implementación original de SubgraphX, el valor de `c_puct` suele establecerse en **10**.
- **Rango Común**: Los valores de `c_puct` en SubgraphX suelen variar entre **1** y **10**.
- **Elección Empírica**: El valor exacto se determina a menudo mediante experimentación, ajustándose según el conjunto de datos específico y la complejidad de los grafos analizados.

#### **Consideraciones al Seleccionar `c_puct`**

1. **Equilibrio entre Exploración y Explotación**:
   - **Valores Más Altos (e.g., `c_puct` = 10)**:
     - Promueven una mayor **exploración**.
     - El algoritmo tiende a visitar nodos menos explorados, buscando nuevas posibilidades.
     - Útil en grafos complejos o cuando se desea una cobertura más amplia del espacio de búsqueda.
   - **Valores Más Bajos (e.g., `c_puct` = 1)**:
     - Favorecen la **explotación**.
     - El algoritmo se centra más en los nodos con altas evaluaciones actuales.
     - Puede ser beneficioso cuando se tiene confianza en las estimaciones actuales o se desea una convergencia más rápida.

2. **Influencia del Tamaño y Estructura del Grafo**:
   - **Grafos Pequeños o Simples**:
     - Un valor menor de `c_puct` puede ser suficiente, ya que el espacio de búsqueda es más manejable.
   - **Grafos Grandes o Densos**:
     - Valores más altos de `c_puct` ayudan a explorar mejor el espacio de búsqueda complejo.

3. **Dependencia del Modelo y la Tarea**:
   - **Modelos con Alta Incertidumbre**:
     - Un `c_puct` mayor permite al algoritmo explorar más opciones, lo cual es útil si las predicciones del modelo son menos confiables.
   - **Tareas Críticas**:
     - En aplicaciones donde es crucial encontrar explicaciones precisas, puede ser preferible un `c_puct` más alto.


In [None]:
def calculate_c_puct(graph, c0=10.0, delta=1.0):
    N = graph.number_of_nodes()
    E = graph.number_of_edges()

    if N <= 1:
        return c0

    D = nx.density(graph)  # Densidad del grafo

    # Calcular grado promedio
    avg_degree = (2 * E) / N

    # Calcular desviación estándar del grado
    degrees = [degree for node, degree in graph.degree()]
    std_degree = np.std(degrees)

    # Normalizar grado promedio y desviación estándar usando logaritmo
    avg_degree_norm = np.log(avg_degree + 1) / np.log(N)
    std_degree_norm = np.log(std_degree + 1) / np.log(N)

    # Limitar los valores normalizados a [0, 1]
    avg_degree_norm = min(max(avg_degree_norm, 0), 1)
    std_degree_norm = min(max(std_degree_norm, 0), 1)

    # Calcular el promedio de las métricas normalizadas
    metrics_mean = (D + avg_degree_norm + std_degree_norm) / 3

    # Ajustar c_puct
    c_puct = c0 * (1 + delta * (metrics_mean - 0.5))

    # Asegurar que c_puct no sea menor que una fracción del valor base (por ejemplo, no menos del 50%)
    c_puct = max(c_puct, c0 * 0.5)

    return c_puct

# Cálculo automático de sample_num y min_atoms

## **4. Ejemplos y Tabla de Valores**

Calculemos **`sample_num`** para diferentes valores de **\(N\)**, usando **\(K = 100\)**.

### **Cálculos Preliminares**

- **scale_factor**:
  \[
  \text{scale\_factor} = \frac{N}{N + 100}
  \]

- **Denominador**:
  \[
  1 - \text{scale\_factor} = \frac{100}{N + 100}
  \]

### **Tabla de Valores**

| \(N\) | \(\text{min\_atoms}\) | \(\text{scale\_factor}\) | \(1 - \text{scale\_factor}\) | \(\log(N + 1)\) | \(\text{sample\_num}\)                           | \(\text{sample\_num}\) (entero) |
|-------|------------------------|--------------------------|------------------------------|-----------------|--------------------------------------------------|---------------------------|
| 1     | 1                      | \(1/101 \approx 0.0099\) | \(100/101 \approx 0.9901\)   | 0.6931          | \(1 + \frac{0.6931}{0.9901} \approx 1.6999\)     | 1                         |
| 5     | 1                      | \(5/105 \approx 0.0476\) | \(100/105 \approx 0.9524\)   | 1.7918          | \(1 + \frac{1.7918}{0.9524} \approx 2.8824\)     | 2                         |
| 10    | 1                      | \(10/110 \approx 0.0909\)| \(100/110 \approx 0.9091\)   | 2.3979          | \(1 + \frac{2.3979}{0.9091} \approx 3.6387\)     | 3                         |
| 20    | 2                      | \(20/120 \approx 0.1667\)| \(100/120 \approx 0.8333\)   | 3.0445          | \(2 + \frac{3.0445}{0.8333} \approx 5.6527\)     | 5                         |
| 50    | 5                      | \(50/150 \approx 0.3333\)| \(100/150 \approx 0.6667\)   | 3.9318          | \(5 + \frac{3.9318}{0.6667} \approx 10.8977\)    | 10                        |
| 100   | 10                     | \(100/200 = 0.5\)        | \(0.5\)                      | 4.6151          | \(10 + \frac{4.6151}{0.5} = 10 + 9.2302 = 19.2302\)| 19                        |
| 200   | 20                     | \(200/300 \approx 0.6667\)| \(100/300 \approx 0.3333\)  | 5.3033          | \(20 + \frac{5.3033}{0.3333} \approx 35.9098\)   | 35                        |
| 500   | 50                     | \(500/600 \approx 0.8333\)| \(100/600 \approx 0.1667\)  | 6.2166          | \(50 + \frac{6.2166}{0.1667} \approx 87.2990\)   | 87                        |
| 1000  | 100                    | \(1000/1100 \approx 0.9091\)| \(100/1100 \approx 0.0909\)| 6.9088          | \(100 + \frac{6.9088}{0.0909} \approx 176.9977\) | 176                       |

### **Observaciones**

- **Para \(N\) pequeños**:

  - **`scale_factor`** es cercano a **0**, y **\(1 - \text{scale\_factor}\)** es cercano a **1**.
  - El denominador es grande, lo que reduce el impacto de \(\log(N + 1)\) en **`sample_num`**.
  - **`sample_num`** es pequeño y no excede **\(N\)**.

- **Para \(N\) grandes**:

  - **`scale_factor`** se acerca a **1**, y **\(1 - \text{scale\_factor}\)** es pequeño.
  - El denominador disminuye, aumentando el impacto de \(\log(N + 1)\) en **`sample_num`**.
  - **`sample_num`** aumenta significativamente, pero podemos controlarlo estableciendo límites o ajustando **\(K\)**.

In [2]:
import numpy as np
import networkx as nx

def calculate_min_atoms(N):
    """
    Calcula min_atoms como el 10% de N, redondeado al número entero más cercano,
    asegurando que sea al menos 1.
    """
    min_atoms = max(1, int(round(0.1 * N)))
    return min_atoms

def calculate_scale_factor(N, K=100):
    """
    Calcula scale_factor como N / (N + K).
    """
    scale_factor = N / (N + K)
    return scale_factor

def calculate_sample_num(N, min_atoms, K=100):
    """
    Calcula sample_num usando min_atoms y scale_factor dependiente de N.
    """
    scale_factor = calculate_scale_factor(N, K)
    denominator = 1 - scale_factor  # Siempre positivo y menor o igual a 1

    sample_num = min_atoms + np.log(N + 1) / denominator
    sample_num = int(min(N, max(sample_num, min_atoms)))  # Asegura que sample_num esté entre min_atoms y N
    return sample_num

# Cálculo automático de local_radius

¡Claro! Ahora desarrollaré una metodología para calcular automáticamente el **`local_radius`** basándonos en las propiedades estructurales del grafo. El **`local_radius`** es un parámetro crucial que determina el alcance de la exploración o influencia alrededor de un nodo en el grafo. Calcularlo automáticamente permite adaptar el algoritmo a las características específicas de cada grafo.

---

### **Metodología para Calcular `local_radius` Automáticamente**

#### **1. Introducción**

El **`local_radius`** debe reflejar la estructura y propiedades del grafo. Algunas métricas clave que podemos utilizar son:

- **Longitud media de los caminos más cortos** (`average_shortest_path_length`): Indica cuán conectado está el grafo.
- **Diámetro del grafo** (`diameter`): La distancia máxima entre cualquier par de nodos.
- **Coeficiente de clustering** (`clustering coefficient`): Mide la tendencia de los nodos a agruparse.
- **Grado medio de los nodos** (`average_degree`): Promedio de conexiones por nodo.
- **Excentricidad**: La máxima distancia desde un nodo a cualquier otro nodo.

#### **2. Propuesta de Métodos**

##### **a) Basado en la Longitud Media de los Caminos Más Cortos**

\[
\text{local\_radius} = \alpha \times \text{Longitud Media de los Caminos Más Cortos}
\]

- **Ventajas**: Refleja la conectividad general del grafo.
- **Consideraciones**: Puede ser costoso de calcular en grafos muy grandes.

##### **b) Basado en el Diámetro del Grafo**

\[
\text{local\_radius} = \beta \times \text{Diámetro del Grafo}
\]

- **Ventajas**: Considera la máxima extensión del grafo.
- **Consideraciones**: Sensible a valores extremos o grafos con componentes desconectados.

##### **c) Basado en el Grado Medio de los Nodos**

\[
\text{local\_radius} = \gamma \times \left( \frac{1}{\text{Grado Medio}} \right)
\]

- **Ventajas**: Fácil de calcular y refleja la densidad local.
- **Consideraciones**: En grafos muy densos, puede resultar en valores pequeños de `local_radius`.

##### **d) Combinación de Múltiples Métricas**

\[
\text{local\_radius} = \delta \times \left( \frac{\text{Longitud Media} + \text{Diámetro}}{2} \right)
\]

- **Ventajas**: Equilibra la conectividad global y máxima del grafo.
- **Consideraciones**: Requiere calcular múltiples métricas.


In [None]:
import networkx as nx

def calculate_local_radius(graph, scale_factor=1.0):
    """
    Calcula local_radius basado en el diámetro del grafo y el grado medio.

    Parámetros:
        graph: Un objeto grafo de NetworkX.
        scale_factor: Factor de escala para ajustar local_radius.

    Retorna:
        local_radius: Valor calculado de local_radius.
    """
    N = graph.number_of_nodes()
    M = graph.number_of_edges()

    # Calcular el grado medio
    average_degree = (2 * M) / N

    # Calcular el diámetro del grafo
    diameter = nx.diameter(graph)


    # Calcular alfa basado en N
    if scale_factor == 'log':
        scale_factor = math.log10(N)
    
    elif scale_factor == 'step':
        if N <= 10:
            scale_factor = 1
        elif N > 10 and N <= 100:
            scale_factor = int(1 + 0.015*(N-10))
        elif N > 100:
            scale_factor = int(2.35+0.005*(N-100))

    # Calcular local_radius
    local_radius = scale_factor * (diameter / average_degree)

    # Aseguramos que local_radius sea al menos 1
    local_radius = max(1, local_radius)

    return local_radius

# Cálculo automático de num_hops

En el código de `SubgraphX`, el parámetro **`num_hops`** es opcional. Esto significa que, si no lo especificas, el algoritmo aún funcionará correctamente utilizando un valor predeterminado o calculado internamente.

---

### **1. `num_hops` es Opcional y Tiene un Valor Predeterminado**

En la definición de la clase `SubgraphX`, el parámetro `num_hops` se establece con un valor predeterminado de `None`:

```python
def __init__(self, model, num_classes: int, device, num_hops: Optional[int] = None, verbose: bool = False, ...)
```

Si no proporcionas un valor para `num_hops` al instanciar `SubgraphX`, el método `update_num_hops` se encarga de asignar un valor adecuado basado en tu modelo.

---

### **2. Cómo se Calcula el Valor Predeterminado de `num_hops`**

El método `update_num_hops` verifica si `num_hops` es `None`. Si es así, cuenta el número de capas de propagación de mensajes en tu modelo GNN y asigna ese número a `num_hops`:

```python
def update_num_hops(self, num_hops):
    if num_hops is not None:
        return num_hops

    k = 0
    for module in self.model.modules():
        if isinstance(module, MessagePassing):
            k += 1
    return k
```

Esto asegura que el valor de `num_hops` sea consistente con la profundidad de tu modelo GNN, lo que es razonable ya que el alcance de las características que el modelo puede capturar está relacionado con su número de capas.

---

### **3. Implicaciones de No Especificar `num_hops`**

- **Funcionamiento Correcto del Algoritmo**: El algoritmo está diseñado para funcionar sin que tengas que especificar `num_hops`. Utiliza un valor predeterminado que se ajusta a la arquitectura de tu modelo.

- **Consistencia con el Modelo**: Al basar `num_hops` en el número de capas de propagación de mensajes, el subgrafo extraído abarca la misma cantidad de saltos que el modelo utiliza para propagar información.

- **Flexibilidad**: Puedes optar por dejar que el algoritmo determine `num_hops` automáticamente o proporcionarlo manualmente si deseas un control más preciso sobre el alcance del subgrafo.

---

### **4. ¿Es Necesario Especificar `num_hops`?**

No es necesario especificar `num_hops` para que el algoritmo funcione. De hecho, en muchos casos, es preferible dejar que el algoritmo lo calcule automáticamente, ya que esto asegura que el subgrafo utilizado para la explicación esté alineado con la arquitectura de tu modelo.

---

### **5. Recomendaciones**

- **Dejar que el Algoritmo Calcule `num_hops`**: Si no tienes una razón específica para establecer `num_hops`, es recomendable permitir que el algoritmo lo calcule. Esto simplifica el proceso y reduce la posibilidad de inconsistencias.

- **Especificar `num_hops` si Tienes Requisitos Especiales**: Si, por alguna razón, deseas que el subgrafo abarque más o menos saltos que las capas de tu modelo, puedes especificar `num_hops` manualmente.

---

### **6. Ejemplo Práctico**

#### **Sin Especificar `num_hops`**

```python
# Instanciar SubgraphX sin especificar num_hops
subgraphx = SubgraphX(model=model, num_classes=2, device=device)

# Utilizar el método explain
_, explanation_results, related_preds = subgraphx(x_list, edge_index_list, batch_list)
```

En este ejemplo, `num_hops` será calculado automáticamente basado en el número de capas de propagación de mensajes en `model`.

#### **Especificando `num_hops` Manualmente**

```python
# Instanciar SubgraphX especificando num_hops
subgraphx = SubgraphX(model=model, num_classes=2, device=device, num_hops=3)

# Utilizar el método explain
_, explanation_results, related_preds = subgraphx(x_list, edge_index_list, batch_list)
```

Aquí, hemos fijado `num_hops` en 3, independientemente de la arquitectura del modelo.

---

### **7. Conclusión**

Puedes utilizar el algoritmo sin especificar `num_hops`, ya que es un parámetro opcional y el algoritmo está diseñado para calcular un valor adecuado automáticamente. Esto garantiza que el subgrafo extraído para la explicación sea coherente con la capacidad de tu modelo para propagar información a través de sus capas.

---

### **Información Adicional**

- **Interacción con Otros Parámetros**: Aunque `num_hops` es opcional, otros parámetros como `local_radius` y `sample_num` siguen siendo importantes para controlar aspectos específicos del algoritmo.

- **Flexibilidad y Personalización**: La posibilidad de dejar ciertos parámetros como opcionales te da flexibilidad para ajustar el algoritmo según tus necesidades sin tener que preocuparte por cada detalle.

---

Si tienes más preguntas o necesitas ayuda con otros aspectos del algoritmo, ¡no dudes en consultarme! Estoy aquí para ayudarte a aprovechar al máximo las capacidades de `SubgraphX`.

# Función general parámetros de entrada a subgraphX

In [None]:
import numpy as np
import networkx as nx
from torch_geometric.nn import MessagePassing

def calculate_subgraphx_parameters(model, graph, device, num_classes, num_hops=None, verbose=False,
                                   explain_graph=True, high2low=False, reward_method='mc_l_shapley',
                                   subgraph_building_method='zero_filling', save_dir=None,
                                   filename='example', vis=True):
    """
    Calcula todos los parámetros de entrada necesarios para SubgraphX basándose en el grafo y el modelo.

    Parámetros:
        model: El modelo GNN utilizado.
        graph: El grafo de NetworkX.
        device: El dispositivo ('cpu' o 'cuda') en el que se ejecuta el modelo.
        num_classes: Número de clases del problema.
        num_hops: Número de saltos para extraer el subgrafo (opcional).
        verbose: Si se desea mostrar información adicional durante la ejecución.
        explain_graph: Si se está explicando una tarea de clasificación de grafos.
        high2low: Ordenar los nodos de alto a bajo grado al expandir en MCTS.
        reward_method: Método de recompensa para SubgraphX.
        subgraph_building_method: Método para construir subgrafos ('zero_filling' o 'split').
        save_dir: Directorio para guardar los resultados.
        filename: Nombre del archivo para guardar los resultados.
        vis: Si se desea visualizar los resultados.

    Retorna:
        Un diccionario con todos los parámetros calculados para SubgraphX.
    """
    N = graph.number_of_nodes()
    M = graph.number_of_edges()

    # Calcular min_atoms
    min_atoms = max(1, int(round(0.1 * N)))

    # Calcular sample_num
    # Usando scale_factor dependiente de N
    K = 100  # Constante ajustable
    scale_factor = N / (N + K)
    denominator = 1 - scale_factor
    sample_num = min_atoms + np.log(N + 1) / denominator
    sample_num = int(min(N, max(sample_num, min_atoms)))

    # Calcular local_radius
    # Calcular grado medio
    average_degree = (2 * M) / N

    # Calcular diámetro del grafo
    try:
        diameter = nx.diameter(graph)
    except nx.NetworkXError:
        # Si el grafo no es conectado, usar el diámetro del componente más grande
        largest_cc = max(nx.connected_components(graph), key=len)
        subgraph = graph.subgraph(largest_cc)
        diameter = nx.diameter(subgraph)

    # Calcular scale_factor para local_radius
    a = 0.1  # Parámetro ajustable
    b = 0.5  # Parámetro ajustable
    scale_factor_lr = a * np.log(N) + b
    local_radius = scale_factor_lr * (diameter / average_degree)
    local_radius = max(1, local_radius)

    # Calcular c_puct
    c0 = 10.0  # Valor dado
    delta = 1.0  # Valor dado
    c_puct = c0 * np.log((N + delta) / delta)

    # Calcular expand_atoms
    eta_0 = 2  # Valor dado
    expand_atoms = int(eta_0 * np.log(N + 1))

    # Calcular rollout
    gamma = 0.01  # Valor dado
    beta_0 = 0.1  # Valor dado
    alpha = gamma * N
    beta_auto = beta_0  # Puedes ajustar beta_auto si tienes una función específica
    rollout = int(alpha * N * (1 + beta_auto))

    # Calcular num_hops si no se proporciona
    if num_hops is None:
        num_hops = 0
        for module in model.modules():
            if isinstance(module, MessagePassing):
                num_hops += 1

    # Preparar el diccionario de parámetros
    parameters = {
        'model': model,
        'num_classes': num_classes,
        'device': device,
        'num_hops': num_hops,
        'verbose': verbose,
        'explain_graph': explain_graph,
        'rollout': rollout,
        'min_atoms': min_atoms,
        'c_puct': c_puct,
        'expand_atoms': expand_atoms,
        'high2low': high2low,
        'local_radius': local_radius,
        'sample_num': sample_num,
        'reward_method': reward_method,
        'subgraph_building_method': subgraph_building_method,
        'save_dir': save_dir,
        'filename': filename,
        'vis': vis
    }

    return parameters


# Adaptación para N grafos en paralelo

In [None]:
import numpy as np
import networkx as nx
from torch_geometric.nn import MessagePassing

def calculate_subgraphx_parameters(model, graphs, device, num_classes, num_hops=None, verbose=False,
                                   explain_graph=True, high2low=False, reward_method='mc_l_shapley',
                                   subgraph_building_method='zero_filling', save_dir=None,
                                   filename='example', vis=True):
    """
    Calcula los parámetros de entrada necesarios para SubgraphX para múltiples grafos.

    Parámetros:
        model: El modelo GNN utilizado.
        graphs: Lista de grafos de NetworkX.
        device: El dispositivo ('cpu' o 'cuda') en el que se ejecuta el modelo.
        num_classes: Número de clases del problema.
        num_hops: Número de saltos para extraer el subgrafo (opcional).
        verbose: Si se desea mostrar información adicional durante la ejecución.
        explain_graph: Si se está explicando una tarea de clasificación de grafos.
        high2low: Ordenar los nodos de alto a bajo grado al expandir en MCTS.
        reward_method: Método de recompensa para SubgraphX.
        subgraph_building_method: Método para construir subgrafos ('zero_filling' o 'split').
        save_dir: Directorio para guardar los resultados.
        filename: Nombre del archivo para guardar los resultados.
        vis: Si se desea visualizar los resultados.

    Retorna:
        Una lista de diccionarios con los parámetros calculados para cada grafo.
    """
    # Parámetros compartidos
    if num_hops is None:
        num_hops = 0
        for module in model.modules():
            if isinstance(module, MessagePassing):
                num_hops += 1

    # Lista para almacenar los parámetros de cada grafo
    parameters_list = []

    # Constantes ajustables
    K = 100  # Para sample_num
    a = 0.1  # Para local_radius
    b = 0.5  # Para local_radius
    c0 = 10.0  # Para c_puct
    delta = 1.0  # Para c_puct
    eta_0 = 2  # Para expand_atoms
    gamma = 0.01  # Para rollout
    beta_0 = 0.1  # Para rollout

    # Iterar sobre cada grafo y calcular los parámetros
    for idx, graph in enumerate(graphs):
        N = graph.number_of_nodes()
        M = graph.number_of_edges()

        # Calcular min_atoms
        min_atoms = max(1, int(round(0.1 * N)))

        # Calcular sample_num
        scale_factor = N / (N + K)
        denominator = 1 - scale_factor
        sample_num = min_atoms + np.log(N + 1) / denominator
        sample_num = int(min(N, max(sample_num, min_atoms)))

        # Calcular local_radius
        average_degree = (2 * M) / N

        # Calcular diámetro del grafo
        try:
            diameter = nx.diameter(graph)
        except nx.NetworkXError:
            # Si el grafo no es conectado, usar el diámetro del componente más grande
            largest_cc = max(nx.connected_components(graph), key=len)
            subgraph = graph.subgraph(largest_cc)
            diameter = nx.diameter(subgraph)

        # Calcular scale_factor para local_radius
        scale_factor_lr = a * np.log(N) + b
        local_radius = scale_factor_lr * (diameter / average_degree)
        local_radius = max(1, local_radius)

        # Calcular c_puct
        c_puct = c0 * np.log((N + delta) / delta)

        # Calcular expand_atoms
        expand_atoms = int(eta_0 * np.log(N + 1))

        # Calcular rollout
        alpha = gamma * N
        beta_auto = beta_0  # Puedes ajustar beta_auto si tienes una función específica
        rollout = int(alpha * N * (1 + beta_auto))

        # Preparar el diccionario de parámetros para este grafo
        parameters = {
            'model': model,
            'num_classes': num_classes,
            'device': device,
            'num_hops': num_hops,
            'verbose': verbose,
            'explain_graph': explain_graph,
            'rollout': rollout,
            'min_atoms': min_atoms,
            'c_puct': c_puct,
            'expand_atoms': expand_atoms,
            'high2low': high2low,
            'local_radius': local_radius,
            'sample_num': sample_num,
            'reward_method': reward_method,
            'subgraph_building_method': subgraph_building_method,
            'save_dir': save_dir,
            'filename': f"{filename}_{idx}",  # Ajustar el nombre del archivo si se desea
            'vis': vis
        }

        parameters_list.append(parameters)

    return parameters_list
