# NFL prediction, Data exploration 

Alejandro Ozymandias Cepeda Beltran

In [None]:
import pandas as pd
import os

data_dir = 'data/train'

try:
    files_in_data_dir = os.listdir(data_dir)
    print(f"Archivos encontrados en el directorio '{data_dir}':")
    print(files_in_data_dir)
except FileNotFoundError:
    print(f"Error: El directorio '{data_dir}' no fue encontrado.")
    files_in_data_dir = []

files_to_explore = ['input_2023_w01.csv']

if files_in_data_dir:
    for filename in files_to_explore:
        if filename in files_in_data_dir:
            print(f"\n" + "="*50)
            print(f"Análisis del archivo: {filename}")
            print("="*50)
            
            file_path = os.path.join(data_dir, filename)
            df = pd.read_csv(file_path)
            datos_juego_1 = df.copy()
            
            print("\n--- 1. Primeras 5 filas (head) ---")
            display(df.head())
            
            print("\n--- 2. Información del DataFrame (.info) ---")
            df.info()
            
            print("\n--- 3. Estadísticas Descriptivas (.describe) ---")
            display(df.describe())
            
            print("\n--- 4. Conteo de valores nulos por columna ---")
            missing_values = df.isnull().sum()
            print(missing_values[missing_values > 0])
        else:
            print(f"\nAdvertencia: El archivo '{filename}' no se encontró en el directorio '{data_dir}'.")

In [None]:
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation
from IPython.display import HTML

# Seleccionar una jugada específica
game_id = datos_juego_1['game_id'].iloc[0]
play_id = datos_juego_1['play_id'].iloc[0]
jugada = datos_juego_1[(datos_juego_1['game_id'] == game_id) & (datos_juego_1['play_id'] == play_id)]

# Configurar figura
fig, ax = plt.subplots(figsize=(12, 6))
ax.set_xlim(0, 120)
ax.set_ylim(0, 53.3)
ax.set_facecolor('green')
ax.set_title(f'Jugada {play_id} - Game {game_id}')

# Dibujar líneas del campo
for x in range(10, 111, 10):
    ax.axvline(x, color='white', linewidth=1, alpha=0.5)

scatter = ax.scatter([], [], s=200, c=[], cmap='coolwarm', edgecolors='white', linewidths=2)
frame_text = ax.text(5, 50, '', color='white', fontsize=12, weight='bold')

def animate(frame):
    frame_data = jugada[jugada['frame_id'] == frame]
    scatter.set_offsets(frame_data[['x', 'y']].values)
    colors = [1 if side == 'home' else 0 for side in frame_data['player_side']]
    scatter.set_array(colors)
    frame_text.set_text(f'Frame: {frame}/25')
    return scatter, frame_text

frames = sorted(jugada['frame_id'].unique())[:25]
anim = FuncAnimation(fig, animate, frames=frames, interval=100, blit=True)
plt.close()

HTML(anim.to_jshtml())