<div align="center" style="border: 2px solid #E57373; border-radius: 10px; padding: 20px; background-color: #FFCDD2;">
    <h1 style="font-size: 28px; color: #D32F2F;">Clustering mediante Algoritmos de Embedding de Grafos para el Análisis de Postulantes en el Proceso de Admisión de UNIQ</h1>
    <p style="font-size: 18px; color: #EF6C00;">Explorando Perfiles y Tendencias a través de Datos Transformados</p>
    <img src="../images/logo.png" alt="Imagen de ejemplo" style="border-radius: 5px; box-shadow: 5px 5px 10px rgba(0, 0, 0, 0.2); max-width: 80%; margin-top: 20px;">
</div>


<div style="border: 2px solid #4CAF50; border-radius: 10px; padding: 20px; background-color: #E8F5E9;color: black">
<h3 style="color: #4CAF50;">🌐 Embedding para Datos de Gráficos</h3>
<p>El <span style="color: #E91E63; font-weight: bold;">embedding</span> es una técnica que permite representar entidades y relaciones en un grafo en un espacio vectorial de baja dimensión. 
En el contexto de datos de gráficos, el embedding captura las características semánticas y topológicas de los nodos y las relaciones en el grafo, transformándolos en vectores numéricos.</p>
<p>Estos vectores permiten una manipulación y análisis más eficiente de los datos, facilitando tareas como la detección de similitudes, el clustering y la visualización.</p>
</div>
<div align="center" style="border: 2px solid #E57373; border-radius: 10px; padding: 20px; background-color: #E3F2FD;">
    <a href="[about:blank](https://www.analyticsvidhya.com/blog/2018/04/introduction-to-graph-theory-network-analysis-python-codes/)" target="_blank">
        <img src="../images/Embedding.webp" alt="Red de Nodos" style="border-radius: 5px; max-width: 80%; box-shadow: 5px 5px 10px rgba(0, 0, 0, 0.2);">
    </a>
    <p style="font-size: 16px; color: #0a0a0a; margin-top: 10px;">
        <em> <strong>Embedding</strong>:
        Proceso de Incrustacion de Node2Vect</em>
    </p>
</div>
<div style="border: 2px solid #FF9800; border-radius: 10px; padding: 20px; background-color: #FFF3E0;color: black">
<h3 style="color: #FF9800;">📊 Node2Vec: Técnica de Embedding</h3>
<p><span style="color: #673AB7; font-weight: bold;">Node2Vec</span> es una técnica popular de embedding para grafos que permite generar representaciones vectoriales de nodos basadas en su estructura local en el grafo. Utiliza el concepto de "random walk" para capturar la proximidad semántica y topológica de los nodos.</p>
<p>Node2Vec utiliza un parámetro de control para ajustar el equilibrio entre explorar áreas distantes y explotar conexiones cercanas en el grafo. Los resultados son vectores numéricos que capturan la similitud y relación entre nodos en un espacio dimensional reducido.</p>
</div>
<div align="center" style="border: 2px solid #E57373; border-radius: 10px; padding: 20px; background-color: #E3F2FD;">
    <a href="[about:blank](https://www.analyticsvidhya.com/blog/2018/04/introduction-to-graph-theory-network-analysis-python-codes/)" target="_blank">
        <img src="../images/wor2vect.webp" alt="Red de Nodos" style="border-radius: 5px; max-width: 80%; box-shadow: 5px 5px 10px rgba(0, 0, 0, 0.2);">
    </a>
    <p style="font-size: 16px; color: #0a0a0a; margin-top: 10px;">
        <em> <strong>Nod2Vect</strong>:
        Defincion matematica de Nod2Vect</em>
    </p>
</div>
<div style="border: 2px solid #2196F3; border-radius: 10px; padding: 20px; background-color: #E3F2FD;color: black">
<h3 style="color: #2196F3;">🔗 NetworkX en Python</h3>
<p><span style="color: #FF5722; font-weight: bold;">NetworkX</span> es una biblioteca de Python utilizada para la creación, manipulación y análisis de estructuras de grafos. Proporciona una amplia gama de funciones para crear, visualizar y analizar grafos, así como para realizar cálculos y aplicar algoritmos de grafos.</p>
<p>NetworkX es útil para procesar y preparar datos de grafos antes de aplicar técnicas como embedding. Permite cargar, modificar y explorar la estructura y atributos de los grafos, lo que es esencial para el proceso de embedding.</p>
</div>

<div style="border: 2px solid #FFC107; border-radius: 10px; padding: 20px; background-color: #FFF9C4;color: black">
<h3 style="color: #FFC107;">🚀 Proceso de Incrustación de Datos</h3>
<p>El proceso de <span style="color: #009688; font-weight: bold;">incrustación de datos</span> implica la transformación de los nodos y relaciones de un grafo en vectores numéricos de baja dimensión. Para llevar a cabo la incrustación de los postulantes en el proceso de admisión de la UNIQ, se seguirán los siguientes pasos:</p>
<ol>
  <li>Preparación de Datos: Cargar los datos de los postulantes y construir un grafo representando las relaciones entre ellos.</li>
  <li>Aplicación de Node2Vec: Utilizar Node2Vec para generar los vectores de embedding para cada postulante en el grafo. Ajustar los parámetros de exploración y explotación según sea necesario.</li>
  <li>Exploración y Análisis: Explorar las representaciones de embedding para identificar similitudes y diferencias entre los postulantes. Esto puede involucrar técnicas de clustering y visualización.</li>
  <li>Aplicación de Resultados: Utilizar los vectores de embedding en análisis posteriores, como clustering de postulantes, detección de tendencias y patrones, y toma de decisiones informadas en el proceso de admisión.</li>
</ol>

</div>


In [None]:
# Importar la librería pandas para manejo de datos
import pandas as pd
import plotly.graph_objs as go
import plotly.offline as py
import seaborn as sns
import numpy as np

In [None]:
# Ruta al archivo CSV en tu Google Drive
csv_file_path = "../data/LISTA_DE_POSTULANTES_1.csv"

# Leer el archivo CSV en un DataFrame, especificando la codificación
Postulantes = pd.read_excel("../Data/Melsol-test.xlsx")

# Mostrar los primeros registros del DataFrame
Postulantes.head()

## <a><font size="6"><div style="border-radius:5px;color:#2F4F4F;background-color:#BFBF00;"> 🏋️‍♀️ 3.3 Acerca del Conjunto de Datos</div></font></a>


<div style="background-color:#20B2AA; border-radius:10px; padding:10px; box-shadow: 0px 2px 4px rgba(10, 39, 52, 0.1);">
    <h3 style="color:#333333;">📊 - Tamaño del conjunto de datos</h3>
    <p style="color:#555555;">Este es el tamaño actual del conjunto de datos:</p>
    <p style="color:#333333;">- <strong>Tamaño del conjunto de datos:</strong> (4928, 27)</p>
</div>

In [None]:
# Verificar el número de filas y columnas
num_filas, num_columnas = Postulantes.shape
print(f"Número de filas: {num_filas}")
print(f"Número de columnas: {num_columnas}")

In [None]:
# Tipos de datos de cada columna
print(Postulantes.dtypes)

In [None]:
# Cantidad de valores nulos
print(Postulantes.isnull().sum())