#  **2. TABLA DE VARIABLES: definiciones, tipificación y priorización.**

In [1]:
import pandas as pd

In [2]:
# Creamos una lista de diccionarios cuyas keys son: "Variable", "Definición", "Tipo de Variable", "Prioridad", "Comentario"

variables_lista = [
    {"Variable": "id", "Definición": "Identificador único de la competidora.", "Tipo de Variable": "Categórica (ID)", "Prioridad": "Alta", "Comentario": "Es clave para identificar a la floretista."},
    {"Variable": "opp_ID", "Definición": "Identificador único de la oponente.", "Tipo de Variable": "Categórica (ID)", "Prioridad": "Alta", "Comentario": "También importante para identificar a la oponente."},
    {"Variable": "fencer_age", "Definición": "Edad de la competidora.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Puede influir en el rendimiento de la competidora."},
    {"Variable": "opp_age", "Definición": "Edad de la oponente.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Importante para ver si la edad afecta el rendimiento."},
    {"Variable": "fencer_score", "Definición": "Puntuación de la competidora en el duelo.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Clave para comparar el rendimiento entre competidoras."},
    {"Variable": "opp_score", "Definición": "Puntuación de la oponente en el duelo.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Similar a fencer_score, para comparar los resultados entre ambas competidoras."},
    {"Variable": "winner_ID", "Definición": "Identificador de la competidora ganadora (igual a id si la competidora gana).", "Tipo de Variable": "Categórica (ID)", "Prioridad": "Alta", "Comentario": "Importante para determinar la ganadora."},
    {"Variable": "fencer_curr_pts", "Definición": "Puntos acumulados actuales de la competidora.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Importante para analizar si más puntos acumulados se relacionan con más victorias."},
    {"Variable": "opp_curr_pts", "Definición": "Puntos acumulados actuales de la oponente.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Similar a fencer_curr_pts, para comparar el rendimiento en base a puntos."},
    {"Variable": "competition_ID_x", "Definición": "Identificador único de la competición de la competidora.", "Tipo de Variable": "Categórica (ID)", "Prioridad": "Media", "Comentario": "Relacionado con el rendimiento de la competidora en cada competición."},
    {"Variable": "competition_ID_y", "Definición": "Identificador único de la competición de la oponente.", "Tipo de Variable": "Categórica (ID)", "Prioridad": "Media", "Comentario": "Similar al anterior, se puede usar para comparaciones entre competidoras."},
    {"Variable": "pool_ID", "Definición": "Identificador de la piscina o grupo en que compiten las competidoras.", "Tipo de Variable": "Categórica (ID)", "Prioridad": "Baja", "Comentario": "Relacionada con la fase de la competición, pero no directamente relevante para el análisis principal."},
    {"Variable": "upset", "Definición": "Variable binaria que indica si hubo un 'upset' (sorpresa) en la competición.", "Tipo de Variable": "Categórica (Binaria)", "Prioridad": "Alta", "Comentario": "Puede ser interesante para ver si la competidora con más puntos se enfrenta a 'upsets'."},
    {"Variable": "date", "Definición": "Fecha de la competición.", "Tipo de Variable": "Fecha", "Prioridad": "Media", "Comentario": "Útil para analizar tendencias a lo largo del tiempo."},
    {"Variable": "country_code", "Definición": "Código del país de la competidora.", "Tipo de Variable": "Categórica (Categoría)", "Prioridad": "Media", "Comentario": "Útil para análisis por país, aunque no es la principal variable de interés."},
    {"Variable": "country_x", "Definición": "Nombre del país de la competidora.", "Tipo de Variable": "Categórica (Categoría)", "Prioridad": "Media", "Comentario": "Similar a country_code, pero con más detalle."},
    {"Variable": "hand", "Definición": "Mano dominante de la competidora (derecha o izquierda).", "Tipo de Variable": "Categórica (Categoría)", "Prioridad": "Baja", "Comentario": "Puede influir en el rendimiento, pero no es crucial en el análisis general."},
    {"Variable": "age", "Definición": "Edad de la competidora.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Relacionado con el rendimiento y las diferencias entre competidoras, como la edad de las juniors vs seniors."},
    {"Variable": "category_x", "Definición": "Categoría de la competidora (Junior, Senior, etc.).", "Tipo de Variable": "Categórica (Categoría)", "Prioridad": "Alta", "Comentario": "Fundamental para ver si las categorías afectan los resultados."},
    {"Variable": "category_y", "Definición": "Categoría de la oponente.", "Tipo de Variable": "Categórica (Categoría)", "Prioridad": "Media", "Comentario": "Similar a category_x, para comparar entre competidoras."},
    {"Variable": "season_x", "Definición": "Temporada de la competidora.", "Tipo de Variable": "Categórica (Categoría)", "Prioridad": "Media", "Comentario": "Puede ser relevante para ver cómo cambian los resultados con el tiempo."},
    {"Variable": "season_y", "Definición": "Temporada de la oponente.", "Tipo de Variable": "Categórica (Categoría)", "Prioridad": "Media", "Comentario": "Similar a season_x, comparaciones entre competidoras."},
    {"Variable": "rank", "Definición": "Clasificación de la competidora.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Muy relevante para tu análisis, pues se puede relacionar con el rendimiento."},
    {"Variable": "points", "Definición": "Puntos obtenidos por la competidora en la competición.", "Tipo de Variable": "Numérica", "Prioridad": "Alta", "Comentario": "Es la variable clave en tu hipótesis, relacionada con el rendimiento."},
    {"Variable": "start_date", "Definición": "Fecha de inicio de la competición.", "Tipo de Variable": "Fecha", "Prioridad": "Media", "Comentario": "Importante para ver cómo cambian los puntos y resultados en función del tiempo."},
    {"Variable": "end_date", "Definición": "Fecha de fin de la competición.", "Tipo de Variable": "Fecha", "Prioridad": "Media", "Comentario": "Similar a start_date, relevante para analizar la duración y el efecto de las competiciones."},
    {"Variable": "timezone", "Definición": "Zona horaria de la competición.", "Tipo de Variable": "Categórica (Categoría)", "Prioridad": "Baja", "Comentario": "Relativamente irrelevante para el análisis, pero puede ser útil si comparas competiciones en diferentes zonas."},
    {"Variable": "url_x", "Definición": "URL de la competidora.", "Tipo de Variable": "Categórica (URL)", "Prioridad": "Baja", "Comentario": "Irrelevante para el análisis, más bien útil como referencia."},
    {"Variable": "url_y", "Definición": "URL de la oponente.", "Tipo de Variable": "Categórica (URL)", "Prioridad": "Baja", "Comentario": "Similar a url_x, no afecta el análisis."},
    {"Variable": "unique_ID", "Definición": "Identificador único de la competidora para cada entrada.", "Tipo de Variable": "Categórica (ID)", "Prioridad": "Alta", "Comentario": "Similar a id, clave para realizar un seguimiento de las competidoras."}
]

In [3]:
# Creamos el DF
df_variables = pd.DataFrame(variables_lista)

In [4]:
df_variables

Unnamed: 0,Variable,Definición,Tipo de Variable,Prioridad,Comentario
0,id,Identificador único de la competidora.,Categórica (ID),Alta,Es clave para identificar a la floretista.
1,opp_ID,Identificador único de la oponente.,Categórica (ID),Alta,También importante para identificar a la opone...
2,fencer_age,Edad de la competidora.,Numérica,Alta,Puede influir en el rendimiento de la competid...
3,opp_age,Edad de la oponente.,Numérica,Alta,Importante para ver si la edad afecta el rendi...
4,fencer_score,Puntuación de la competidora en el duelo.,Numérica,Alta,Clave para comparar el rendimiento entre compe...
5,opp_score,Puntuación de la oponente en el duelo.,Numérica,Alta,"Similar a fencer_score, para comparar los resu..."
6,winner_ID,Identificador de la competidora ganadora (igua...,Categórica (ID),Alta,Importante para determinar la ganadora.
7,fencer_curr_pts,Puntos acumulados actuales de la competidora.,Numérica,Alta,Importante para analizar si más puntos acumula...
8,opp_curr_pts,Puntos acumulados actuales de la oponente.,Numérica,Alta,"Similar a fencer_curr_pts, para comparar el re..."
9,competition_ID_x,Identificador único de la competición de la co...,Categórica (ID),Media,Relacionado con el rendimiento de la competido...


In [7]:
df_variables.to_csv('../data/tabla_variables.csv', index=False)
