# Modificación de los archivos de grafo para que los lea d-mercator

d-mercator necesita recibir la información del grafo con la forma de un archivo con dos columnas. La primera columna se corresponde con el nodo de origen de cada una de las aristas de un grafo y la segunda columan con el nodo de destino de dichas aristas.

Además, el grafo debe ser conexo (en caso contrario, d-mercator creará un nuevo archivo ".edge", con la componente gigante del grafo).

In [2]:
import networkx as nx

## Creación de los archivos de grafo

In [14]:
# No al tarifazo
G = nx.read_gexf("../graphs/nodes_hashtag/nat/429624.gexf")

# Componente gigante del grafo
Gcc = sorted(nx.connected_components(G), key=len, reverse=True)
G = G.subgraph(Gcc[0])

with open("graphs/nat/429624/429624.edge", "w") as f:
    for edge in G.edges():
        f.write(edge[0] + ' ' + edge[1] + '\n')

# 9n
G = nx.read_gexf("../graphs/nodes_hashtag/9n/437037.gexf")

# Componente gigante del grafo
Gcc = sorted(nx.connected_components(G), key=len, reverse=True)
G = G.subgraph(Gcc[0])

with open("graphs/9n/437037/437037.edge", "w") as f:
    for edge in G.edges():
        f.write(edge[0] + ' ' + edge[1] + '\n')

A continuación, hay que ejecutar el archivo dmercator_script.py desde terminal introduciendo como parámetro el archivo que debe usar: ```python3 dmercator.py```

## Creación de los archivos de grafo filtrando aristas

In [4]:
def create_filtered_graph(G, thresh_filt):
    """
    Crea un nuevo grafo a partir de un grafo original, filtrando las aristas según un umbral de peso.

    Dado un grafo `G`, esta función genera un nuevo grafo en el que solo se mantienen las aristas cuyo peso
    es mayor o igual al umbral especificado. Las aristas con peso inferior al umbral son eliminadas.

    Parámetros:
    -----------
    G : networkx.Graph
        El grafo original del cual se va a filtrar.

    thresh_filt : float
        El umbral de peso. Solo se conservarán las aristas cuyo peso sea mayor o igual a este umbral.

    Retorna:
    --------
    networkx.Graph
        Un nuevo grafo que contiene solo las aristas con peso mayor o igual al umbral especificado.
    """
    H = nx.Graph()
    # Añade nodos del grafo original al nuevo grafo
    H.add_nodes_from(G.nodes())

    # Añade aristas que cumplen con el umbral de peso
    for u, v, data in G.edges(data=True):
        if data['weight'] >= thresh_filt:
            H.add_edge(u, v, **data)
    return H

In [16]:
umbral_nat = 5
umbral_9n = 5
# No al tarifazo
G = nx.read_gexf("../graphs/nodes_hashtag/nat/429624.gexf")
nodos_original = G.number_of_nodes()
aristas_original = G.number_of_edges()
G = create_filtered_graph(G, umbral_nat)

# Componente gigante del grafo
Gcc = sorted(nx.connected_components(G), key=len, reverse=True)
G = G.subgraph(Gcc[0])

with open("graphs/nat/429624/" + str(umbral_nat) + "/429624.edge", "w") as f:
    for edge in G.edges():
        f.write(edge[0] + ' ' + edge[1] + '\n')
print("Grafo reducido a", round(G.number_of_nodes()/nodos_original*100,2), "% en nodos y ", round(G.number_of_edges()/aristas_original*100, 2), "% en aristas.")
# 9n
G = nx.read_gexf("../graphs/nodes_hashtag/9n/437037.gexf")

nodos_original = G.number_of_nodes()
aristas_original = G.number_of_edges()
G = create_filtered_graph(G, umbral_9n)

# Componente gigante del grafo
Gcc = sorted(nx.connected_components(G), key=len, reverse=True)
G = G.subgraph(Gcc[0])

print("Grafo reducido a", round(G.number_of_nodes()/nodos_original*100,2), "% en nodos y ", round(G.number_of_edges()/aristas_original*100, 2), "% en aristas.")
with open("graphs/9n/437037/" + str(umbral_9n) + "/437037.edge", "w") as f:
    for edge in G.edges():
        f.write(edge[0] + ' ' + edge[1] + '\n')

Grafo reducido a 27.73 % en nodos y  28.08 % en aristas.
Grafo reducido a 28.28 % en nodos y  22.26 % en aristas.
