# An√°lisis de Reglas de Asociaci√≥n en Partidas de Ajedrez## Descripci√≥n del ProyectoEste notebook implementa el algoritmo Apriori para analizar patrones en partidas de ajedrez de lichess.org. Se estudian dos modalidades de juego: **ajedrez rel√°mpago (600+0)** y **ajedrez bala (60+0)**.### Objetivos1. **Implementaci√≥n del Algoritmo Apriori**: Aplicaci√≥n pr√°ctica para descubrir reglas de asociaci√≥n2. **An√°lisis de Patrones de Juego**: Identificaci√≥n de relaciones entre variables categ√≥ricas3. **Verificaci√≥n de Hip√≥tesis Espec√≠ficas**: Validaci√≥n estad√≠stica de reglas propuestas4. **Comparaci√≥n de Modalidades**: An√°lisis diferencial entre ritmos de juego### Metodolog√≠a- **Preprocesamiento**: Limpieza y categorizaci√≥n de variables- **Extracci√≥n de reglas**: Aplicaci√≥n de Apriori con par√°metros apropiados- **M√©tricas de evaluaci√≥n**: C√°lculo de soporte, confianza y lift- **Comparaci√≥n de resultados**: Visualizaci√≥n de resultados

In [17]:
# Instalaci√≥n de librer√≠as necesarias!pip install mlxtend# Importaci√≥n de librer√≠as necesariasimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom mlxtend.frequent_patterns import apriori, association_rulesfrom mlxtend.preprocessing import TransactionEncoderimport warningswarnings.filterwarnings('ignore')# Configuraci√≥n de pandaspd.set_option('display.max_columns', None)pd.set_option('display.width', None)pd.set_option('display.max_colwidth', None)# Configuraci√≥n de gr√°ficosplt.style.use('default')sns.set_palette('husl')print('=' * 80)print('    AN√ÅLISIS DE REGLAS DE ASOCIACI√ìN EN PARTIDAS DE AJEDREZ')print('    Algoritmo Apriori - Dataset lichess.org 2013')print('=' * 80)print('\nLibrer√≠as cargadas')

    AN√ÅLISIS DE REGLAS DE ASOCIACI√ìN EN PARTIDAS DE AJEDREZ
    Algoritmo Apriori - Dataset lichess.org 2013

‚úì Entorno de an√°lisis configurado correctamente
‚úì Librer√≠as especializadas cargadas
‚úì Configuraci√≥n de visualizaci√≥n establecida


## 1. Carga y Exploraci√≥n Inicial del Dataset### Caracter√≠sticas del DatasetEl dataset `lichess_games_2013-01.csv` contiene informaci√≥n sobre partidas de ajedrez del portal lichess.org, incluyendo:- **Informaci√≥n de jugadores**: Nombres y puntuaciones Elo- **Caracter√≠sticas de partida**: Resultado, control de tiempo, n√∫mero de movimientos- **Informaci√≥n t√©cnica**: C√≥digo ECO, apertura, tipo de finalizaci√≥n### Proceso de Exploraci√≥nSe realizar√° un an√°lisis exploratorio  de los datos.

In [18]:
# Carga del dataset principalprint('Cargando datos...')df = pd.read_csv('lichess_games_2013-01.csv')# An√°lisis del datasetprint(f'\n INFORMACI√ìN DIMENSIONAL')print(f'Dimensiones del dataset: {df.shape[0]:,} filas √ó {df.shape[1]} columnas')print(f'Memoria utilizada: {df.memory_usage(deep=True).sum() / 1024**2:.2f} MB')# Informaci√≥n estructuralprint(f'\n INFORMACI√ìN ESTRUCTURAL')print(df.info())# Valores faltantesprint(f'\n INTEGRIDAD DE DATOS')print('Valores faltantes por columna:')missing_data = df.isnull().sum()for col, missing in missing_data.items():    if missing > 0:        percentage = (missing / len(df)) * 100        print(f'  {col}: {missing:,} ({percentage:.2f}%)')    else:        print(f'  {col}: Sin valores faltantes')print('\nDataset cargado')

Iniciando carga del dataset...

 INFORMACI√ìN DIMENSIONAL
Dimensiones del dataset: 121,332 filas √ó 11 columnas
Memoria utilizada: 66.91 MB

 INFORMACI√ìN ESTRUCTURAL
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 121332 entries, 0 to 121331
Data columns (total 11 columns):
 #   Column       Non-Null Count   Dtype 
---  ------       --------------   ----- 
 0   Site         121332 non-null  object
 1   White        121332 non-null  object
 2   Black        121332 non-null  object
 3   Result       121332 non-null  object
 4   WhiteElo     121332 non-null  object
 5   BlackElo     121332 non-null  object
 6   TimeControl  121332 non-null  object
 7   ECO          121332 non-null  object
 8   Opening      121332 non-null  object
 9   Termination  121332 non-null  object
 10  MovesCount   121332 non-null  int64 
dtypes: int64(1), object(10)
memory usage: 10.2+ MB
None

 INTEGRIDAD DE DATOS
Valores faltantes por columna:
  Site: Sin valores faltantes ‚úì
  White: Sin valores faltantes ‚

## 2. Preprocesamiento y Categorizaci√≥n de Variables### Tratamiento de Valores EspecialesSe realizar√° la limpieza de datos siguiendo las especificaciones del proyecto:- Conversi√≥n de valores "?" en Elo a 900 puntos- Categorizaci√≥n de Elo seg√∫n rangos est√°ndar- Categorizaci√≥n de n√∫mero de movimientos por duraci√≥n### Sistema de Categorizaci√≥n**Categor√≠as de Elo:**- Principiante: 0-1199- Intermedio: 1200-1599- Avanzado: 1600-1999- Experto: 2000-2399- Maestro: 2400-2799- Gran Maestro: 2800+**Categor√≠as de Duraci√≥n:**- Corta: <20 movimientos- Media: 20-39 movimientos- Larga: 40-59 movimientos- Muy larga: 60+ movimientos

In [19]:
# Creaci√≥n de copia para procesamientoprint(' INICIANDO PREPROCESAMIENTO DE DATOS')df_processed = df.copy()# Tratamiento de valores especiales en Eloprint('\n1. Tratamiento de valores Elo...')print(f'   Valores "?" en WhiteElo: {(df_processed["WhiteElo"] == "?").sum():,}')print(f'   Valores "?" en BlackElo: {(df_processed["BlackElo"] == "?").sum():,}')# Reemplazar "?" por 900 seg√∫n especificacionesdf_processed['WhiteElo'] = df_processed['WhiteElo'].replace('?', '900')df_processed['BlackElo'] = df_processed['BlackElo'].replace('?', '900')df_processed['WhiteElo'] = pd.to_numeric(df_processed['WhiteElo'], errors='coerce')df_processed['BlackElo'] = pd.to_numeric(df_processed['BlackElo'], errors='coerce')# Imputaci√≥n de valores faltantesdf_processed['WhiteElo'].fillna(900, inplace=True)df_processed['BlackElo'].fillna(900, inplace=True)print('   Conversi√≥n de Elo realizada ("?" ‚Üí 900)')print(f'   Rango WhiteElo: {df_processed["WhiteElo"].min():.0f} - {df_processed["WhiteElo"].max():.0f}')print(f'   Rango BlackElo: {df_processed["BlackElo"].min():.0f} - {df_processed["BlackElo"].max():.0f}')

 INICIANDO PREPROCESAMIENTO DE DATOS

1. Tratamiento de valores Elo...
   Valores "?" en WhiteElo: 78
   Valores "?" en BlackElo: 140
   ‚úì Conversi√≥n de Elo completada ("?" ‚Üí 900)
   Rango WhiteElo: 782 - 2403
   Rango BlackElo: 789 - 2386


In [20]:
# Funciones de categorizaci√≥ndef categorizar_elo(elo):    """Categoriza el Elo seg√∫n rangos est√°ndar internacionales de ajedrez"""    if elo < 1200:        return "Principiante"    elif elo < 1600:        return "Intermedio"    elif elo < 2000:        return "Avanzado"    elif elo < 2400:        return "Experto"    elif elo < 2800:        return "Maestro"    else:        return "Gran Maestro"def categorizar_movimientos(moves):    """Categoriza la duraci√≥n de partidas seg√∫n n√∫mero de movimientos"""    if moves < 20:        return "Corta"    elif moves < 40:        return "Media"    elif moves < 60:        return "Larga"    else:        return "Muy larga"# Aplicaci√≥n de categorizacionesprint('\n2. Categorizando variables...')df_processed['WhiteElo_Cat'] = df_processed['WhiteElo'].apply(categorizar_elo)df_processed['BlackElo_Cat'] = df_processed['BlackElo'].apply(categorizar_elo)df_processed['MovesCount_Cat'] = df_processed['MovesCount'].apply(categorizar_movimientos)print('   Categorizaci√≥n de Elo aplicada')print('   Categorizaci√≥n de movimientos aplicada')# Distribucionesprint(f'\nüìä AN√ÅLISIS DE DISTRIBUCIONES CATEG√ìRICAS')print('\nDistribuci√≥n WhiteElo_Cat:')white_elo_dist = df_processed['WhiteElo_Cat'].value_counts()print(white_elo_dist)print('\nDistribuci√≥n MovesCount_Cat:')moves_dist = df_processed['MovesCount_Cat'].value_counts()print(moves_dist)


2. Aplicando sistema de categorizaci√≥n...
   ‚úì Categorizaci√≥n de Elo completada
   ‚úì Categorizaci√≥n de movimientos completada

üìä AN√ÅLISIS DE DISTRIBUCIONES CATEG√ìRICAS

Distribuci√≥n WhiteElo_Cat:
WhiteElo_Cat
Intermedio      57571
Avanzado        57540
Experto          3550
Principiante     2670
Maestro             1
Name: count, dtype: int64

Distribuci√≥n MovesCount_Cat:
MovesCount_Cat
Media        61374
Larga        29137
Corta        21750
Muy larga     9071
Name: count, dtype: int64


In [21]:
# Variables derivadasprint('\n3. Calculando variables...')# Diferencia absoluta de Elodf_processed['EloDiff'] = abs(df_processed['WhiteElo'] - df_processed['BlackElo'])# Diferencia en categor√≠as de Elodef diferencia_categorias_elo(white_elo, black_elo):    """Calcula la diferencia en categor√≠as entre jugadores"""    categorias = [0, 1200, 1600, 2000, 2400, 2800, float('inf')]    cat_names = ['Principiante', 'Intermedio', 'Avanzado', 'Experto', 'Maestro', 'Gran Maestro']    # Determinar categor√≠a de cada jugador    white_cat_idx = next(i for i, threshold in enumerate(categorias[1:]) if white_elo < threshold)    black_cat_idx = next(i for i, threshold in enumerate(categorias[1:]) if black_elo < threshold)    return abs(white_cat_idx - black_cat_idx)# Aplicar funci√≥n de diferencia categ√≥ricadf_processed['EloDiff_Cat'] = df_processed.apply(    lambda row: diferencia_categorias_elo(row['WhiteElo'], row['BlackElo']), axis=1)# Jugador con mayor Elodef jugador_mas_fuerte(row):    """Identifica qu√© jugador tiene mayor Elo"""    if row['WhiteElo'] > row['BlackElo']:        return 'Blanco'    elif row['BlackElo'] > row['WhiteElo']:        return 'Negro'    else:        return 'Empate'df_processed['JugadorMasFuerte'] = df_processed.apply(jugador_mas_fuerte, axis=1)print('   Diferencia de Elo calculada')print('   Diferencia categ√≥rica calculada')print('   Jugador m√°s fuerte identificado')# Variables creadasprint(f'\n RESUMEN DE VARIABLES DERIVADAS')print(f'{df_processed.shape[0]:,} filas √ó {df_processed.shape[1]} columnas')print(f'\nNuevas variables creadas:')print('- WhiteElo_Cat, BlackElo_Cat: Categor√≠as de Elo')print('- MovesCount_Cat: Categor√≠as de duraci√≥n')print('- EloDiff: Diferencia absoluta de Elo')print('- EloDiff_Cat: Diferencia en categor√≠as')print('- JugadorMasFuerte: Identificaci√≥n de jugador dominante')


3. Generando variables derivadas...
   ‚úì Diferencia de Elo calculada
   ‚úì Diferencia categ√≥rica calculada
   ‚úì Jugador m√°s fuerte identificado

 RESUMEN DE VARIABLES DERIVADAS
Dataset procesado: 121,332 filas √ó 17 columnas

Nuevas variables creadas:
- WhiteElo_Cat, BlackElo_Cat: Categor√≠as de Elo
- MovesCount_Cat: Categor√≠as de duraci√≥n
- EloDiff: Diferencia absoluta de Elo
- EloDiff_Cat: Diferencia en categor√≠as
- JugadorMasFuerte: Identificaci√≥n de jugador dominante


## 3. An√°lisis del Subconjunto Ajedrez Rel√°mpago (600+0)### Caracter√≠sticas del Ajedrez Rel√°mpagoEl ajedrez rel√°mpago con control de tiempo "600+0" (10 minutos sin incremento) representa un formato equilibrado entre:- **Tiempo suficiente**: Para desarrollar estrategias- **Presi√≥n temporal**: Que a√±ade un presi√≥n de tiempo- **Popularidad**: Una de las modalidades m√°s jugadas en plataformas online### Objetivos del An√°lisis1. **Caracterizaci√≥n del subconjunto**: An√°lisis descriptivo de las partidas2. **Aplicaci√≥n de Apriori**: Descubrimiento de patrones frecuentes3. **Extracci√≥n de reglas**: Identificaci√≥n de reglas de asociaci√≥n significativas4. **Verificaci√≥n de hip√≥tesis**: Validaci√≥n de reglas espec√≠ficas propuestas

In [22]:
# Subconjunto ajedrez rel√°mpagoprint('AN√ÅLISIS DE AJEDREZ REL√ÅMPAGO (600+0)')print('=' * 60)# Filtrar partidas con TimeControl='600+0'df_600 = df_processed[df_processed['TimeControl'] == '600+0'].copy()# An√°lisis de disponibilidad de datosif len(df_600) == 0:    print('  No se encontraron partidas con TimeControl="600+0"')    print('\nüîç Analizando controles de tiempo disponibles:')    tc_counts = df_processed['TimeControl'].value_counts().head(10)    print(tc_counts)    # Seleccionar el TimeControl m√°s representativo    most_common_tc = tc_counts.index[0]    print(f'\n Usando el TimeControl m√°s com√∫n: {most_common_tc}')    df_600 = df_processed[df_processed['TimeControl'] == most_common_tc].copy()else:    most_common_tc = '600+0'# Estad√≠sticas descriptivas del subconjuntoprint(f'\n ESTAD√çSTICAS REL√ÅMPAGO')print(f'Control de tiempo: {most_common_tc}')print(f'N√∫mero de partidas: {len(df_600):,}')print(f'Porcentaje del total: {len(df_600)/len(df_processed)*100:.2f}%')if len(df_600) > 0:    print(f'\n DISTRIBUCI√ìN DE RESULTADOS')    result_dist = df_600['Result'].value_counts()    for result, count in result_dist.items():        percentage = (count / len(df_600)) * 100        print(f'  {result}: {count:,} partidas ({percentage:.1f}%)')    print(f'\nESTAD√çSTICAS PRINCIPALES')    print(f'Elo medio blancas: {df_600["WhiteElo"].mean():.0f}')    print(f'Elo medio negras: {df_600["BlackElo"].mean():.0f}')    print(f'Movimientos medio: {df_600["MovesCount"].mean():.1f}')    print(f'Diferencia Elo media: {df_600["EloDiff"].mean():.0f}')else:    print(' Datos insuficientes')

AN√ÅLISIS DE AJEDREZ REL√ÅMPAGO (600+0)

 ESTAD√çSTICAS DEL SUBCONJUNTO REL√ÅMPAGO
Control de tiempo analizado: 600+0
N√∫mero de partidas: 2,452
Porcentaje del dataset total: 2.02%

 DISTRIBUCI√ìN DE RESULTADOS
  1-0: 1,206 partidas (49.2%)
  0-1: 1,174 partidas (47.9%)
  1/2-1/2: 72 partidas (2.9%)

‚ö° CARACTER√çSTICAS TEMPORALES
Elo promedio blancas: 1553
Elo promedio negras: 1552
Movimientos promedio: 32.9
Diferencia Elo promedio: 145


## 4. Implementaci√≥n del Algoritmo Apriori### Fundamentos Te√≥ricosEl algoritmo Apriori es un m√©todo fundamental en miner√≠a de datos para descubrir reglas de asociaci√≥n. Utiliza el principio de que todos los subconjuntos de un conjunto frecuente tambi√©n son frecuentes.### M√©tricas de Evaluaci√≥n- **Soporte**: Frecuencia de aparici√≥n del conjunto de √≠tems- **Confianza**: Probabilidad condicional de ocurrencia- **Lift**: Medida de independencia estad√≠stica entre antecedente y consecuente### Preparaci√≥n de DatosLa implementaci√≥n requiere transformar los datos categ√≥ricos en formato de transacciones binarias.

In [23]:
# Algoritmo Aprioridef preparar_datos_apriori(df_subset):    """Prepara los datos en formato transaccional para Apriori"""    print(' Preparando datos para algoritmo Apriori...')    # Seleccionar variables categ√≥ricas relevantes    cols_categoricas = [        'Result', 'WhiteElo_Cat', 'BlackElo_Cat', 'MovesCount_Cat',        'ECO', 'Termination', 'JugadorMasFuerte'    ]    # Filtrar columnas existentes    cols_disponibles = [col for col in cols_categoricas if col in df_subset.columns]    print(f'   Variables disponibles: {len(cols_disponibles)}')    # Crear transacciones    transacciones = []    for _, row in df_subset.iterrows():        transaccion = []        for col in cols_disponibles:            if pd.notna(row[col]):                # Crear etiqueta descriptiva                if col == 'ECO' and len(df_subset) > 1000:  # Limitar ECO para datasets grandes                    continue                transaccion.append(f'{col}_{row[col]}')        transacciones.append(transaccion)    print(f'   Transacciones creadas: {len(transacciones):,}')    print(f'   √çtems por transacci√≥n: {np.mean([len(t) for t in transacciones]):.1f}')    return transaccionesdef ejecutar_apriori(df_subset, nombre_subset, min_support=0.01):    """Ejecuta el algoritmo Apriori y extrae reglas de asociaci√≥n"""    print(f'\n EJECUTANDO APRIORI - {nombre_subset.upper()}')    print('=' * 70)    if len(df_subset) == 0:        print(' Datos insuficientes')        return pd.DataFrame(), pd.DataFrame()    # Preparar datos    transacciones = preparar_datos_apriori(df_subset)    # Codificaci√≥n binaria    te = TransactionEncoder()    te_ary = te.fit(transacciones).transform(transacciones)    df_encoded = pd.DataFrame(te_ary, columns=te.columns_)    print(f'\n Matriz binaria: {df_encoded.shape[0]} √ó {df_encoded.shape[1]}')    # Aplicar Apriori para encontrar conjuntos frecuentes    print(f'\n  Aplicando Apriori (soporte: {min_support})')    frequent_itemsets = apriori(df_encoded, min_support=min_support, use_colnames=True)    if len(frequent_itemsets) == 0:        print(f'  Sin conjuntos frecuentes con soporte >= {min_support}')        print('   Reduciendo umbral de soporte')        frequent_itemsets = apriori(df_encoded, min_support=min_support/2, use_colnames=True)    print(f'   Conjuntos frecuentes encontrados: {len(frequent_itemsets)}')    if len(frequent_itemsets) == 0:        return pd.DataFrame(), pd.DataFrame()    # Generar reglas de asociaci√≥n    print('\n Extrayendo reglas...')    try:        rules = association_rules(frequent_itemsets, metric='confidence', min_threshold=0.1)        if len(rules) > 0:            # Ordenar por lift descendente            rules_sorted = rules.sort_values('lift', ascending=False)            print(f'   Reglas generadas: {len(rules)}')            print(f'\n TOP 10 REGLAS M√ÅS SIGNIFICATIVAS:')            print('-' * 120)            for i, (_, rule) in enumerate(rules_sorted.head(10).iterrows(), 1):                antecedents = ', '.join(list(rule['antecedents']))                consequents = ', '.join(list(rule['consequents']))                print(f'{i:2d}. {antecedents} ‚Üí {consequents}')                print(f'    Soporte: {rule["support"]:.4f} | '                      f'Confianza: {rule["confidence"]:.4f} | '                      f'Lift: {rule["lift"]:.4f}')                print()            return frequent_itemsets, rules_sorted        else:            print('     Sin reglas con estos umbrales')            return frequent_itemsets, pd.DataFrame()    except Exception as e:        print(f'    Error en extracci√≥n de reglas: {str(e)}')        return frequent_itemsets, pd.DataFrame()# Ejecutar Apriori para el subconjunto rel√°mpagoif len(df_600) > 0:    frequent_600, rules_600 = ejecutar_apriori(df_600, 'Ajedrez Rel√°mpago')else:    print(' Subconjunto vac√≠o')    frequent_600, rules_600 = pd.DataFrame(), pd.DataFrame()


 EJECUTANDO APRIORI - AJEDREZ REL√ÅMPAGO
 Preparando datos para algoritmo Apriori...
   Variables categ√≥ricas disponibles: 7
   Transacciones generadas: 2,452
   √çtems promedio por transacci√≥n: 6.0

 Matriz de codificaci√≥n: 2452 √ó 20

  Aplicando Apriori (soporte m√≠nimo: 0.01)
   ‚úì Conjuntos frecuentes encontrados: 873

 Generando reglas de asociaci√≥n...
   ‚úì Reglas generadas: 9346

 TOP 10 REGLAS M√ÅS SIGNIFICATIVAS:
------------------------------------------------------------------------------------------------------------------------
 1. MovesCount_Cat_Muy larga, Termination_Normal ‚Üí Result_1/2-1/2
    Soporte: 0.0114 | Confianza: 0.2171 | Lift: 7.3919

 2. Result_1/2-1/2 ‚Üí MovesCount_Cat_Muy larga, Termination_Normal
    Soporte: 0.0114 | Confianza: 0.3889 | Lift: 7.3919

 3. Result_1/2-1/2 ‚Üí MovesCount_Cat_Muy larga
    Soporte: 0.0143 | Confianza: 0.4861 | Lift: 7.0114

 4. MovesCount_Cat_Muy larga ‚Üí Result_1/2-1/2
    Soporte: 0.0143 | Confianza: 0.2059 | Lif

## 5. Verificaci√≥n de Hip√≥tesis Espec√≠ficas### Metodolog√≠a de Verificaci√≥nSe implementar√° un sistema de verificaci√≥n estad√≠stica para evaluar las siguientes hip√≥tesis:1. **H1**: Diferencia de Elo ‚â• 1 categor√≠a ‚Üí Victoria del jugador m√°s fuerte2. **H2**: Diferencia de Elo ‚â• 2 categor√≠as ‚Üí Victoria del jugador m√°s fuerte3. **H3**: Ambos jugadores Gran Maestros ‚Üí Resultado en tablas4. **H4**: Ambos jugadores Gran Maestros ‚Üí Victoria de blancas5. **H5**: Jugadores principiantes/intermedios ‚Üí Victoria de blancas6. **H6**: Terminaci√≥n Normal/Time forfeit seg√∫n duraci√≥n de partida### M√©tricas de Evaluaci√≥nPara cada hip√≥tesis se calcular√°:- **Soporte**: Frecuencia absoluta de ocurrencia- **Confianza**: Probabilidad condicional- **Interpretaci√≥n**: Validez estad√≠stica de la regla

In [25]:
# Verificaci√≥n de hip√≥tesisdef verificar_regla_diferencia_elo(df_subset, diferencia_min, nombre_regla):    """Verifica reglas relacionadas con diferencias de Elo"""    print(f'\n VERIFICACI√ìN: {nombre_regla}')    print('-' * 80)    if len(df_subset) == 0:        print(' Sin datos para verificar')        return    # Filtrar casos con diferencia significativa    casos_diferencia = df_subset[df_subset['EloDiff_Cat'] >= diferencia_min]    print(f'Total de partidas: {len(df_subset):,}')    print(f'Partidas con diferencia ‚â•{diferencia_min} categor√≠as: {len(casos_diferencia):,}')    if len(casos_diferencia) == 0:        print('  Casos insuficientes')        return    # Analizar por color del jugador m√°s fuerte    for color in ['Blanco', 'Negro']:        casos_color = casos_diferencia[casos_diferencia['JugadorMasFuerte'] == color]        if len(casos_color) == 0:            continue        # Determinar resultado esperado        resultado_esperado = '1-0' if color == 'Blanco' else '0-1'        casos_ganados = len(casos_color[casos_color['Result'] == resultado_esperado])        # Calcular m√©tricas        soporte = len(casos_color) / len(df_subset)        confianza = casos_ganados / len(casos_color) if len(casos_color) > 0 else 0        print(f'\n An√°lisis - Jugador m√°s fuerte con {color.lower()}s:')        print(f'   Casos v√°lidos: {len(casos_color):,}')        print(f'   Victorias esperadas: {casos_ganados:,}')        print(f'   Soporte: {soporte:.4f}')        print(f'   Confianza: {confianza:.4f} ({confianza*100:.1f}%)')        # Interpretaci√≥n        if confianza >= 0.7:            interpretacion = 'REGLA FUERTE'        elif confianza >= 0.5:            interpretacion = 'REGLA MODERADA'        else:            interpretacion = 'REGLA D√âBIL'        print(f'   Interpretaci√≥n: {interpretacion}')def verificar_regla_grandes_maestros(df_subset, resultado_esperado, nombre_regla):    """Verifica reglas espec√≠ficas para Grandes Maestros"""    print(f'\n VERIFICACI√ìN: {nombre_regla}')    print('-' * 80)    # Filtrar partidas donde ambos son Grandes Maestros    casos_gm = df_subset[        (df_subset['WhiteElo_Cat'] == 'Gran Maestro') &        (df_subset['BlackElo_Cat'] == 'Gran Maestro')    ]    print(f'Total de partidas: {len(df_subset):,}')    print(f'Partidas GM vs GM: {len(casos_gm):,}')    if len(casos_gm) == 0:        print('  Sin partidas GM vs GM')        return    # An√°lisis por duraci√≥n de partida    for categoria in df_subset['MovesCount_Cat'].unique():        casos_cat = casos_gm[casos_gm['MovesCount_Cat'] == categoria]        if len(casos_cat) == 0:            continue        casos_resultado = len(casos_cat[casos_cat['Result'] == resultado_esperado])        soporte = len(casos_cat) / len(df_subset)        confianza = casos_resultado / len(casos_cat) if len(casos_cat) > 0 else 0        print(f'\n Partidas {categoria.lower()}s:')        print(f'   GM vs GM: {len(casos_cat):,}')        print(f'   Resultado "{resultado_esperado}": {casos_resultado:,}')        print(f'   Soporte: {soporte:.4f}')        print(f'   Confianza: {confianza:.4f} ({confianza*100:.1f}%)')# Ejecutar todas las verificaciones de hip√≥tesisprint('\n VERIFICACI√ìN SISTEM√ÅTICA DE HIP√ìTESIS')print('=' * 80)if len(df_600) > 0:    # H1 y H2: Diferencias de Elo    verificar_regla_diferencia_elo(df_600, 1, 'H1: Diferencia ‚â•1 categor√≠a ‚Üí Victoria jugador fuerte')    verificar_regla_diferencia_elo(df_600, 2, 'H2: Diferencia ‚â•2 categor√≠as ‚Üí Victoria jugador fuerte')    # H3 y H4: Grandes Maestros    verificar_regla_grandes_maestros(df_600, '1/2-1/2', 'H3: GM vs GM ‚Üí Tablas')    verificar_regla_grandes_maestros(df_600, '1-0', 'H4: GM vs GM ‚Üí Victoria blancas')else:    print(' Sin datos para verificar')


 VERIFICACI√ìN SISTEM√ÅTICA DE HIP√ìTESIS

 VERIFICACI√ìN: H1: Diferencia ‚â•1 categor√≠a ‚Üí Victoria jugador fuerte
--------------------------------------------------------------------------------
Total de partidas analizadas: 2,452
Partidas con diferencia ‚â•1 categor√≠as: 1,014

 An√°lisis - Jugador m√°s fuerte con blancos:
   Casos aplicables: 508
   Victorias del m√°s fuerte: 349
   Soporte: 0.2072
   Confianza: 0.6870 (68.7%)
   Interpretaci√≥n: REGLA MODERADA

 An√°lisis - Jugador m√°s fuerte con negros:
   Casos aplicables: 506
   Victorias del m√°s fuerte: 347
   Soporte: 0.2064
   Confianza: 0.6858 (68.6%)
   Interpretaci√≥n: REGLA MODERADA

 VERIFICACI√ìN: H2: Diferencia ‚â•2 categor√≠as ‚Üí Victoria jugador fuerte
--------------------------------------------------------------------------------
Total de partidas analizadas: 2,452
Partidas con diferencia ‚â•2 categor√≠as: 31

 An√°lisis - Jugador m√°s fuerte con blancos:
   Casos aplicables: 16
   Victorias del m√°s fuerte: