# 📘 Fase 2: Comprensión de los Datos (CRISP-DM)

Este notebook documenta la **segunda fase de CRISP-DM: Comprensión de los Datos**,  
enfocada en el **Análisis Exploratorio de Datos (EDA)**.

Se relaciona directamente con el pipeline de *EDA*, que incluye:

- Análisis de la distribución de rarezas en los mazos.  
- Identificación de las cartas más usadas.  
- Análisis del uso de win conditions.  
- Generación de un resumen exploratorio (EDA summary).


## 1. Distribución de rarezas en los mazos

Se analiza cómo se distribuyen las cartas por rareza (Común, Rara, Épica, Legendaria).  
Se busca responder:

- ¿Qué rarezas dominan los mazos?  
- ¿Existen diferencias entre días de la temporada?  


## 2. Cartas más usadas

Se identifican las cartas más populares en los mazos de los jugadores.  
Se busca responder:

- ¿Cuáles son las cartas más frecuentes en general?  
- ¿Hay cartas que ganan popularidad en ciertos días?  


## 3. Win Conditions más usadas

Las **win conditions** son cartas clave que suelen definir la estrategia del mazo.  
Se analiza su frecuencia y efectividad en diferentes días.  
Se busca responder:

- ¿Qué win conditions se usan más a lo largo de la temporada?  
- ¿Hay cambios de tendencia entre días?  


## 4. Resumen exploratorio (EDA Summary)

Se sintetizan los hallazgos principales de la fase exploratoria.  
Esto servirá de base para la fase de preparación de datos y potencial modelado.


In [None]:
# Cargar salidas del pipeline de EDA desde Kedro
from kedro.framework.context import load_context

# Cargar contexto del proyecto Kedro (ajustar path si es necesario)
context = load_context("../")
catalog = context.catalog

try:
    rarity_analysis = catalog.load("rarity_distributions_analysis")
    most_used_cards = catalog.load("most_used_cards_analysis")
    win_conditions_usage = catalog.load("win_conditions_usage_analysis")
    eda_summary = catalog.load("eda_summary")

    print("Distribución de rarezas:")
    display(rarity_analysis)

    print("\nCartas más usadas:")
    display(most_used_cards)

    print("\nUso de win conditions:")
    display(win_conditions_usage)

    print("\nResumen del EDA:")
    display(eda_summary)
except Exception as e:
    print("Aún no se han generado salidas del pipeline:", e)
