## 1. Entregable.

### 1. *Título del trabajo:*
Predicción de Resultados de Partidos de Fútbol en La Liga utilizando Regresión Logística

### 2. *Introducción:*
En este proyecto, desarrollamos un modelo de predicción de resultados de partidos de fútbol en La Liga utilizando un modelo de regresión logística. Utilizando datos estadísticos de la temporada actual obtenidos de la página FBref, intentamos predecir si un equipo ganará, empatará o perderá en un partido. El fútbol es un deporte popular con una enorme cantidad de datos disponibles, lo que lo convierte en un excelente caso de estudio para aplicar técnicas de ciencia de datos. El uso de análisis predictivo en el fútbol ha cobrado relevancia, ya que ayuda a optimizar el rendimiento de los equipos, así como a mejorar las predicciones de aficionados y analistas. Estos modelos predictivos no solo son útiles en el ámbito deportivo, sino también para casas de apuestas, al generar pronósticos más precisos basados en datos.

### 3. *Antecedentes:*
Los datos utilizados en este proyecto fueron obtenidos de la página *FBref* ([https://fbref.com/es/equipos](https://fbref.com/es/equipos)), una fuente pública de estadísticas de fútbol que incluye información detallada sobre los equipos, jugadores, y partidos de varias ligas alrededor del mundo, incluyendo La Liga. A diferencia de datasets más estandarizados y conocidos en plataformas como Kaggle, estos datos fueron extraídos directamente a través de scraping web para poder utilizarlos en este proyecto. Este tipo de extracción permite una mayor flexibilidad, pero no cuenta con un historial previo de uso como otros datasets más conocidos.

### 4. *Objetivos:*

#### *Objetivos Generales:*
Desarrollar un flujo de trabajo completo que abarque desde la recolección de datos hasta el despliegue de un modelo de machine learning (ML) para la predicción de resultados de partidos de fútbol en La Liga. Este proceso incluye la extracción de datos, preprocesamiento, construcción y entrenamiento del modelo, así como la validación y evaluación de su rendimiento. El objetivo general es aplicar conocimientos adquiridos en ciencia de datos, incluyendo técnicas de machine learning y MLOps, con el fin de obtener una solución predictiva robusta que pueda desplegarse en entornos reales.

#### *Objetivos Específicos:*
•⁠  ⁠Realizar una recolección y análisis exploratorio de los datos de FBref sobre La Liga.
•⁠  ⁠Preprocesar los datos para eliminar valores nulos, codificar variables categóricas y escalar las variables numéricas.
•⁠  ⁠Entrenar un modelo de regresión logística multiclase que clasifique los resultados en "gana", "empata" o "pierde".
•⁠  ⁠Evaluar el rendimiento del modelo utilizando métricas como la matriz de confusión y el informe de clasificación.
•⁠  ⁠Implementar mejoras en el modelo si es necesario y analizar los resultados obtenidos.
•⁠  ⁠Desplegar el modelo en una plataforma que permita su uso en tiempo real o en escenarios prácticos de predicción de partidos.

### 5. *Planteamiento del problema:*
La predicción de resultados de partidos de fútbol es un desafío importante debido a la naturaleza impredecible del deporte, con factores como el rendimiento de los jugadores, lesiones, tácticas y decisiones arbitrales influyendo en los resultados. Sin embargo, con el análisis adecuado de los datos históricos y las estadísticas avanzadas, se pueden identificar patrones que permiten modelar los resultados. El problema que abordamos en este proyecto es la creación de un modelo predictivo que, basándose en estadísticas de equipos y partidos, prediga con precisión si un equipo ganará, empatará o perderá. Este tipo de predicción tiene aplicaciones en análisis deportivo y apuestas.

### 6. *Desarrollo de la solución:*

#### 6.1. *Recolección de datos:*
•⁠  ⁠Se utilizarán los datos de la temporada actual de La Liga extraídos de la página de FBref. Los datos incluirán estadísticas de equipos, como goles a favor, goles en contra, posesión del balón, tiros a puerta, entre otros.

#### 6.2. *Preprocesamiento de datos:*
•⁠  ⁠Limpieza de datos para eliminar filas o columnas con valores faltantes.
•⁠  ⁠Codificación de variables categóricas como nombres de equipos o ubicaciones en variables numéricas usando la técnica de *One-Hot Encoding*.
•⁠  ⁠Normalización de las variables numéricas para garantizar que los valores estén en una escala adecuada para la regresión logística.

#### 6.3. *Entrenamiento del modelo:*
•⁠  ⁠Se dividirán los datos en conjuntos de entrenamiento y prueba.
•⁠  ⁠Se implementará un modelo de regresión logística multiclase utilizando la librería *scikit-learn*.
•⁠  ⁠El modelo será entrenado en el conjunto de datos de entrenamiento.

#### 6.4. *Evaluación del modelo:*
•⁠  ⁠Se generará la matriz de confusión y el informe de clasificación para medir el rendimiento del modelo en el conjunto de datos de prueba.
•⁠  ⁠Se analizarán las métricas de precisión, recall y F1-score para cada categoría (gana, empata, pierde).

## 1. Entregable.

### 1. **Título del trabajo:**
Predicción de Resultados de Partidos de Fútbol en La Liga utilizando Regresión Logística

### 2. **Introducción:**
En este proyecto, desarrollamos un modelo de predicción de resultados de partidos de fútbol en La Liga utilizando un modelo de regresión logística. Utilizando datos estadísticos de la temporada actual obtenidos de la página FBref, intentamos predecir si un equipo ganará, empatará o perderá en un partido. El fútbol es un deporte popular con una enorme cantidad de datos disponibles, lo que lo convierte en un excelente caso de estudio para aplicar técnicas de ciencia de datos. El uso de análisis predictivo en el fútbol ha cobrado relevancia, ya que ayuda a optimizar el rendimiento de los equipos, así como a mejorar las predicciones de aficionados y analistas. Estos modelos predictivos no solo son útiles en el ámbito deportivo, sino también para casas de apuestas, al generar pronósticos más precisos basados en datos.

### 3. **Antecedentes:**
Los datos utilizados en este proyecto fueron obtenidos de la página **FBref** ([https://fbref.com/es/equipos](https://fbref.com/es/equipos)), una fuente pública de estadísticas de fútbol que incluye información detallada sobre los equipos, jugadores, y partidos de varias ligas alrededor del mundo, incluyendo La Liga. A diferencia de datasets más estandarizados y conocidos en plataformas como Kaggle, estos datos fueron extraídos directamente a través de scraping web para poder utilizarlos en este proyecto. Este tipo de extracción permite una mayor flexibilidad, pero no cuenta con un historial previo de uso como otros datasets más conocidos.

### 4. **Objetivos:**

#### **Objetivos Generales:**
Desarrollar un flujo de trabajo completo que abarque desde la recolección de datos hasta el despliegue de un modelo de machine learning (ML) para la predicción de resultados de partidos de fútbol en La Liga. Este proceso incluye la extracción de datos, preprocesamiento, construcción y entrenamiento del modelo, así como la validación y evaluación de su rendimiento. El objetivo general es aplicar conocimientos adquiridos en ciencia de datos, incluyendo técnicas de machine learning y MLOps, con el fin de obtener una solución predictiva robusta que pueda desplegarse en entornos reales.

#### **Objetivos Específicos:**
- Realizar una recolección y análisis exploratorio de los datos de FBref sobre La Liga.
- Preprocesar los datos para eliminar valores nulos, codificar variables categóricas y escalar las variables numéricas.
- Entrenar un modelo de regresión logística multiclase que clasifique los resultados en "gana", "empata" o "pierde".
- Evaluar el rendimiento del modelo utilizando métricas como la matriz de confusión y el informe de clasificación.
- Implementar mejoras en el modelo si es necesario y analizar los resultados obtenidos.
- Desplegar el modelo en una plataforma que permita su uso en tiempo real o en escenarios prácticos de predicción de partidos.

### 5. **Planteamiento del problema:**
La predicción de resultados de partidos de fútbol es un desafío importante debido a la naturaleza impredecible del deporte, con factores como el rendimiento de los jugadores, lesiones, tácticas y decisiones arbitrales influyendo en los resultados. Sin embargo, con el análisis adecuado de los datos históricos y las estadísticas avanzadas, se pueden identificar patrones que permiten modelar los resultados. El problema que abordamos en este proyecto es la creación de un modelo predictivo que, basándose en estadísticas de equipos y partidos, prediga con precisión si un equipo ganará, empatará o perderá. Este tipo de predicción tiene aplicaciones en análisis deportivo y apuestas.

### 6. **Desarrollo de la solución:**

#### 6.1. **Recolección de datos:**
- Se utilizarán los datos de la temporada actual de La Liga extraídos de la página de FBref. Los datos incluirán estadísticas de equipos, como goles a favor, goles en contra, posesión del balón, tiros a puerta, entre otros.

#### 6.2. **Preprocesamiento de datos:**
- Limpieza de datos para eliminar filas o columnas con valores faltantes.
- Codificación de variables categóricas como nombres de equipos o ubicaciones en variables numéricas usando la técnica de **One-Hot Encoding**.
- Normalización de las variables numéricas para garantizar que los valores estén en una escala adecuada para la regresión logística.

#### 6.3. **Entrenamiento del modelo:**
- Se dividirán los datos en conjuntos de entrenamiento y prueba.
- Se implementará un modelo de regresión logística multiclase utilizando la librería **scikit-learn**.
- El modelo será entrenado en el conjunto de datos de entrenamiento.

#### 6.4. **Evaluación del modelo:**
- Se generará la matriz de confusión y el informe de clasificación para medir el rendimiento del modelo en el conjunto de datos de prueba.
- Se analizarán las métricas de precisión, recall y F1-score para cada categoría (gana, empata, pierde).