<a href="https://colab.research.google.com/github/Yoyo1505/Noriega-Zaldiavr-Jorge-Armando_INV_OPS/blob/main/NetworkX_Tutorial.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Tutorial de Networkx**

Primero, descargamos las bibliotecas necesarias para realizar una explicación detallada y ejemplificada de sus funciones y aplicaciones que ofrece la libreria Networkx.

La biblioteca NetworkX es una herramienta que permite la creación, manipulación y análisis de redes complejas, tanto en su estructura como en su dinámica y funcionalidad. Es ampliamente utilizada en estudios de grafos, redes sociales, sistemas biológicos, entre otros.

La biblioteca yfinance se emplea para realizar análisis financieros básicos mediante la descarga de información de activos directamente desde Yahoo Finance. Una limitación importante es que, en ciertos horarios, Yahoo restringe el acceso a los datos. Como alternativa, se pueden utilizar otras bibliotecas como pandas_datareader (gratuita), backtrader (requiere clave API), quandl, entre otras.

NumPy es una biblioteca fundamental para cálculos numéricos. Ofrece funciones matemáticas avanzadas, herramientas de álgebra lineal, transformadas de Fourier, generación de números aleatorios y más.

Pandas está diseñada para la manipulación y análisis de datos estructurados. Proporciona estructuras eficientes como DataFrames y Series, ideales para trabajar con tablas, series temporales y grandes volúmenes de información.

Matplotlib es una biblioteca de visualización que permite crear gráficos estadísticos, esenciales para el análisis exploratorio de datos. Es compatible con múltiples estilos y formatos, lo que facilita la presentación de resultados de manera clara y profesional, al igual que seaborn.

Tabulate unicamente es para que los resultados de los datasets que contienen mucha información salgan organizados.

In [21]:
!pip install networkx yfinance numpy pandas matplotlib seaborn tabulate typing



Lo que sigue es importar las dependencias de las librerias. Esto es para tener acceso a todas las herramientas disponibles.

In [1]:
import networkx as nx
import pandas as pd
import numpy as np
import yfinance as yf
import matplotlib.pyplot as plt
import seaborn as sns
from typing import Dict, List, Tuple, Optional

De acuerdo con su página oficial, la biblioteca NetworkX es útil para cargar y almacenar redes de datos estructurados o no estructurados. También permite construir conjuntos de datos y desarrollar algoritmos que facilitan el análisis de información compleja.

Como se mencionó al principio, aplicaremos la biblioteca NetworkX en un contexto de análisis financiero. El objetivo es crear una gráfica que visualice nodos representando activos financieros, donde las conexiones entre ellos reflejan la correlación entre sus precios. Esta visualización es especialmente útil para la optimización de portafolios y el análisis de riesgo, ya que permite identificar relaciones significativas entre activos y tomar decisiones.

Comenzaremos con las funciones básicas de la biblioteca NetworkX, y poco a poco construiremos un análisis financiero más completo.

Primero, creamos un grafo. Un grafo es una colección de nodos o vértices, junto con conexiones entre ellos llamadas aristas. En NetworkX, estos nodos pueden ser cualquier objeto o variable de Python: desde cadenas de texto, imágenes, números, hasta incluso otros grafos.

En la primera línea del código, asignamos un nombre a nuestro grafo; en este caso lo llamaremos simplemente "Grafo". Luego, definimos que este objeto proviene de la biblioteca networkx (abreviada como nx) y especificamos que queremos crear un grafo vacío.

En la segunda línea, incluimos una instrucción de salida para verificar que el grafo se ha creado correctamente. Esta salida nos mostrará información básica sobre el grafo, como el número de nodos y aristas que contiene en ese momento.

In [2]:
N = nx.Graph()#Grafo vacio
print(N)#Salida

Graph with 0 nodes and 0 edges


En este caso solo nombramos un grafo sin conexiones, es decir, un grafo vacio, o sin información que conectar.

Ahora agreguemos un nodo o un punto. Recordemos que pueden ser cadenas de texto entonces agregamos el nombre de la empresas, de la forma en que aparece en el mercado de valores.

#Nodos

In [3]:
N.add_node("PLTR")#Agregamos el nodo
print(N)#Salida del nodo

Graph with 1 nodes and 0 edges


Ahora agregaremos mas nodos

In [4]:
N.add_node("SNAP")
N.add_node("SOUN")
N.add_node("WBD")
N.add_node("BBD")

Como podemos ver esto es algo largo y cansado entonces usando la función .add_nodes_from() podemos agregar varios nodos simultaneamente.

In [5]:
N.add_nodes_from((["JPM", "GOOGL", "TSLA", "NVDA", "BRK-B","META", "F", "CAT", "XOM", "CWAN", "FYBR"]))
print(N)

Graph with 16 nodes and 0 edges


Podemos agregarle atributos o caracteristicas dentro de los nodos con la misma función

In [6]:
N.add_nodes_from([("RIVN",{"Sector Financiero":"Industria de Automoviles"})])
print(N.nodes(data=True))

[('PLTR', {}), ('SNAP', {}), ('SOUN', {}), ('WBD', {}), ('BBD', {}), ('JPM', {}), ('GOOGL', {}), ('TSLA', {}), ('NVDA', {}), ('BRK-B', {}), ('META', {}), ('F', {}), ('CAT', {}), ('XOM', {}), ('CWAN', {}), ('FYBR', {}), ('RIVN', {'Sector Financiero': 'Industria de Automoviles'})]


Como podemos ver, el atributo aparece en el orden adecuado. Sin embargo para fines del ejemplo mantendremos las cosas simples y lo haremos sin atributos.
Entonces solo eliminaremos el ultimo nodo con la funcion .remove_nodes_from()

In [7]:
N.remove_nodes_from(["RIVN"])
print(N.nodes(data=True))
#Nota tambien podemos elimiar nodos por caracteristica con la misma función

[('PLTR', {}), ('SNAP', {}), ('SOUN', {}), ('WBD', {}), ('BBD', {}), ('JPM', {}), ('GOOGL', {}), ('TSLA', {}), ('NVDA', {}), ('BRK-B', {}), ('META', {}), ('F', {}), ('CAT', {}), ('XOM', {}), ('CWAN', {}), ('FYBR', {})]


Tambien podemos borras todos los nodos del grafo con la funcion .clear()

In [8]:
N.clear()
print(N)

Graph with 0 nodes and 0 edges


Volvemos a agregar los nodos nuevamente

In [9]:
N.add_nodes_from((["PLTR","SNAP","SOUN","WBD","BBD","JPM", "GOOGL", "TSLA", "NVDA", "BRK-B","META", "F", "CAT", "XOM", "CWAN", "FYBR"]))
print(N)

Graph with 16 nodes and 0 edges


#Edges

 Podemos agregar conexiones o aristas entre los nodos. Estas conexiones son conocidos como "edge". Y los agregamos con la función .add_edge o si queremos agregar varias conexiones al mismo tiempo usamos la función .add_edges_from

In [10]:
#Conexiones individuales
N.add_edge("JPM", "GOOGL")
N.add_edge("TSLA", "NVDA")
N.add_edge("BRK-B", "CAT")
#Conexiones multiples
N.add_edges_from([("META", "GOOGL"),("F", "XOM"),("CWAN", "FYBR"),("JPM", "BRK-B"),("TSLA", "META")])
print(N)

Graph with 16 nodes and 8 edges


Ahora creamos un grafo nuevo. Este grafo nos ayudara a entender el orden de los nodos y las conexiones.

In [11]:
DG=nx.DiGraph()

Con la funcion .DiGraph, creamos un grafo dirigido. En este tipo de grafo, las conexiones (aristas)  tienen dirección, es decir, una relación entre A y B no es la misma que entre B y A.

Al nuevo grafo le agregamos nuevas conexiones.

In [12]:
DG.add_edge("GOOGL", "JPM")
DG.add_edge("JPM", "TSLA")
DG.add_edge("GOOGL", "NVDA")
DG.add_edge("JPM", "GOOGL")

Mostramos los nodos y las aristas del grafo dirigido.
list(DG.edges) convierte las aristas a una lista explícita.
DG.successors(nodo) muestra todos los nodos a los que un nodo específico tiene una flecha saliente.

In [13]:
print("Grafo dirigido:")
print("Nodos:", DG.nodes())
print("Aristas:", list(DG.edges))
print("Sucesores de GOOGL:", list(DG.successors("GOOGL")))

Grafo dirigido:
Nodos: ['GOOGL', 'JPM', 'TSLA', 'NVDA']
Aristas: [('GOOGL', 'JPM'), ('GOOGL', 'NVDA'), ('JPM', 'TSLA'), ('JPM', 'GOOGL')]
Sucesores de GOOGL: ['JPM', 'NVDA']


Estas líneas verifican que el grafo dirigido tiene exactamente los sucesores y aristas esperadas.
Si la condición no se cumple, Python lanzará un error.

In [14]:
assert list(DG.successors("GOOGL")) == ["JPM", "NVDA"]
assert list(DG.edges) == [("GOOGL", "JPM"), ("GOOGL", "NVDA"), ("JPM", "TSLA"), ("JPM", "GOOGL")]

#Analisis de los elementos de un grafo

En esta sección se describe como podemos visualizar la información dentro de nuestro grafo, en caso de que queramos un nodo en especifico.

In [15]:
print("Lista de nodos en el grafo")
list(N.nodes)

Lista de nodos en el grafo


['PLTR',
 'SNAP',
 'SOUN',
 'WBD',
 'BBD',
 'JPM',
 'GOOGL',
 'TSLA',
 'NVDA',
 'BRK-B',
 'META',
 'F',
 'CAT',
 'XOM',
 'CWAN',
 'FYBR']

In [16]:
print("Lista de conexiones en el grafo")
list(N.edges)

Lista de conexiones en el grafo


[('JPM', 'GOOGL'),
 ('JPM', 'BRK-B'),
 ('GOOGL', 'META'),
 ('TSLA', 'NVDA'),
 ('TSLA', 'META'),
 ('BRK-B', 'CAT'),
 ('F', 'XOM'),
 ('CWAN', 'FYBR')]

In [17]:
print("Conexiones con el nodo TSLA")
list(N.neighbors("TSLA"))

Conexiones con el nodo TSLA


['NVDA', 'META']

Creamos una nueva grafica ahora con valores númericos que bien podrian representar algunos precios o valuaciones. Y se la adjuntamos al grafo dirigido que ya teniamos.

In [18]:
DG.add_edges_from([("GOOGL","JPM"),("TSLA","BRK-B"),("XOM","BBD")])
DG2=nx.DiGraph(DG)
list(DG2.edges())

[('GOOGL', 'JPM'),
 ('GOOGL', 'NVDA'),
 ('JPM', 'TSLA'),
 ('JPM', 'GOOGL'),
 ('TSLA', 'BRK-B'),
 ('XOM', 'BBD')]

Por último haremos un resumen con el ejemplo completo.

In [22]:


# --- Función para crear un grafo de ejemplo ---
def create_sample_graph() -> nx.Graph:
    """
    Creates a sample undirected graph with nodes and weighted edges.
    Returns:
        nx.Graph: A NetworkX graph with nodes and edges, all with weight attributes.
    """
    G = nx.Graph()

    # Añadir nodos
    nodes = ["A", "B", "C", "D", "E", "F"]
    G.add_nodes_from(nodes)

    # Añadir aristas con pesos
    edges = [
        ("A", "B", 1.0), ("B", "C", 0.8), ("C", "D", 0.5),
        ("D", "E", 1.2), ("E", "F", 0.7), ("F", "A", 1.0),
        ("A", "D", 0.3), ("B", "E", 0.9)
    ]
    G.add_weighted_edges_from(edges)

    # Añadir atributos a nodos
    for node in G.nodes():
        G.nodes[node]["color"] = "skyblue"  # Color por defecto
    G.nodes["A"]["color"] = "blue"  # Color especial para A
    G.nodes["B"]["color"] = "red"   # Color especial para B

    # Añadir atributo adicional a una arista
    G.edges["A", "B"]["type"] = "strong"

    return G

# --- Función para visualizar el grafo ---
def visualize_graph(G: nx.Graph, layout_type: str = "spring", title: str = "NetworkX Graph") -> None:
    """
    Visualizes a NetworkX graph with customizable layout and styling.
    Args:
        G: NetworkX graph to visualize.
        layout_type: Layout for node positioning ("spring", "circular", "kamada_kawai").
        title: Title of the plot.
    """
    plt.figure(figsize=(8, 6))

    # Seleccionar layout
    if layout_type == "circular":
        pos = nx.circular_layout(G)
    elif layout_type == "kamada_kawai":
        pos = nx.kamada_kawai_layout(G)
    else:
        pos = nx.spring_layout(G)

    # Obtener colores de nodos
    node_colors = [G.nodes[n].get("color", "skyblue") for n in G.nodes]

    # Obtener grosores de aristas (manejo de pesos faltantes)
    edge_widths = [G[u][v].get("weight", 1.0) * 2 for u, v in G.edges]

    # Dibujar nodos
    nx.draw_networkx_nodes(G, pos, node_size=500, node_color=node_colors, alpha=0.8)

    # Dibujar aristas
    nx.draw_networkx_edges(G, pos, width=edge_widths, edge_color="gray")

    # Dibujar etiquetas de nodos
    nx.draw_networkx_labels(G, pos, font_size=12, font_weight="bold")

    # Dibujar etiquetas de peso en las aristas
    edge_labels = nx.get_edge_attributes(G, "weight")
    nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels)

    plt.title(title)
    plt.show()

# --- Función para analizar métricas del grafo ---
def analyze_graph(G: nx.Graph) -> Dict[str, any]:
    """
    Computes various network metrics for the given graph.
    Args:
        G: NetworkX graph to analyze.
    Returns:
        Dict containing number of nodes, edges, degree, centrality, clustering, and communities.
    """
    metrics = {}

    # Número de nodos y aristas
    metrics["num_nodes"] = G.number_of_nodes()
    metrics["num_edges"] = G.number_of_edges()

    # Grado de los nodos
    metrics["degree"] = dict(G.degree())

    # Centralidad de grado
    metrics["degree_centrality"] = nx.degree_centrality(G)

    # Centralidad de intermediación (betweenness)
    metrics["betweenness_centrality"] = nx.betweenness_centrality(G, weight="weight")

    # PageRank
    metrics["pagerank"] = nx.pagerank(G, weight="weight")

    # Coeficiente de clustering
    metrics["clustering"] = nx.clustering(G)

    # Densidad del grafo
    metrics["density"] = nx.density(G)

    # Comunidades
    try:
        communities = nx.algorithms.community.greedy_modularity_communities(G)
        metrics["communities"] = [list(comm) for comm in communities]
    except:
        metrics["communities"] = []

    return metrics

# --- Función para imprimir métricas ---
def print_metrics(metrics: Dict[str, any]) -> None:
    """
    Prints network metrics in a formatted way.
    Args:
        metrics: Dictionary of metrics from analyze_graph.
    """
    print("\n=== Análisis del Grafo ===")
    print(f"Número de nodos: {metrics['num_nodes']}")
    print(f"Número de aristas: {metrics['num_edges']}")
    print("\nGrado de los nodos:")
    for node, degree in metrics["degree"].items():
        print(f"{node}: {degree}")
    print("\nCentralidad de grado:")
    for node, centrality in metrics["degree_centrality"].items():
        print(f"{node}: {centrality:.3f}")
    print("\nCentralidad de intermediación:")
    for node, centrality in metrics["betweenness_centrality"].items():
        print(f"{node}: {centrality:.3f}")
    print("\nPageRank:")
    for node, rank in metrics["pagerank"].items():
        print(f"{node}: {rank:.3f}")
    print("\nCoeficiente de clustering:")
    for node, coeff in metrics["clustering"].items():
        print(f"{node}: {coeff:.3f}")
    print(f"\nDensidad del grafo: {metrics['density']:.3f}")
    print("\nComunidades detectadas:")
    for i, comm in enumerate(metrics["communities"]):
        print(f"Comunidad {i+1}: {comm}")

# --- Función para generar un grafo aleatorio ---
def generate_random_graph(n: int = 10, p: float = 0.3) -> nx.Graph:
    """
    Generates a random Erdős-Rényi graph.
    Args:
        n: Number of nodes.
        p: Probability of edge creation.
    Returns:
        nx.Graph: A random graph with weights.
    """
    G = nx.erdos_renyi_graph(n, p)
    # Añadir pesos aleatorios a las aristas
    for u, v in G.edges():
        G[u][v]["weight"] = np.random.uniform(0.1, 1.0)
    return G

# --- Función principal ---
def main():
    """
    Main function to run the NetworkX tutorial.
    """
    # Crear grafo de ejemplo
    print("=== Creando grafo de ejemplo ===")
    G = create_sample_graph()
    print("Nodos:", G.nodes())
    print("Aristas:", G.edges(data=True))
    print("Atributos del nodo A:", G.nodes["A"])
    print("Atributos de la arista A-B:", G.edges["A", "B"])

    # Visualizar grafo con diferentes layouts
    print("\n=== Visualizando grafo (Spring Layout) ===")
    visualize_graph(G, layout_type="spring", title="Grafo de Ejemplo (Spring Layout)")

    print("\n=== Visualizando grafo (Circular Layout) ===")
    visualize_graph(G, layout_type="circular", title="Grafo de Ejemplo (Circular Layout)")

    print("\n=== Visualizando grafo (Kamada-Kawai Layout) ===")
    visualize_graph(G, layout_type="kamada_kawai", title="Grafo de Ejemplo (Kamada-Kawai Layout)")

    # Analizar métricas
    metrics = analyze_graph(G)
    print_metrics(metrics)

    # Caminos más cortos
    try:
        path = nx.shortest_path(G, source="A", target="E", weight="weight")
        path_length = nx.shortest_path_length(G, source="A", target="E", weight="weight")
        print("\nCamino más corto de A a E (ponderado por peso):", path)
        print("Longitud del camino más corto de A a E:", path_length)
    except nx.NetworkXNoPath:
        print("\nNo hay camino entre A y E")

    # Generar y visualizar grafo aleatorio
    print("\n=== Generando y visualizando grafo aleatorio ===")
    random_G = generate_random_graph(n=10, p=0.3)
    visualize_graph(random_G, title="Grafo Aleatorio (Erdős-Rényi)")
    random_metrics = analyze_graph(random_G)
    print_metrics(random_metrics)