# Fase 6: Despliegue y Conclusiones - CRISP-DM

## Objetivo
Definir el plan de despliegue de los modelos seleccionados, establecer estrategias de monitoreo, documentar limitaciones y proporcionar conclusiones finales del proyecto.

## Contenido
1. **Resumen del Proyecto**: Recapitulaci√≥n de todas las fases
2. **Plan de Despliegue**: Estrategia de producci√≥n
3. **Monitoreo y Mantenimiento**: M√©tricas y alertas
4. **Limitaciones y Mejoras Futuras**: An√°lisis de restricciones
5. **Conclusiones Finales**: Resumen ejecutivo
6. **Recomendaciones**: Para stakeholders


## 1. Importar Librer√≠as y Cargar Resultados


In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import json
from pathlib import Path
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n
plt.style.use('default')
sns.set_palette('husl')
plt.rcParams['figure.figsize'] = (14, 8)
plt.rcParams['font.size'] = 10

print('‚úÖ Librer√≠as importadas')


‚úÖ Librer√≠as importadas


In [2]:
# Cambiar al directorio del proyecto
import os
os.chdir(r'C:\Users\mathi\OneDrive\Escritorio\Proyecto kedro\ev1MachineL')

# Cargar reporte de Fase 5
with open('data/06_models/fase5_evaluation_report.json', 'r', encoding='utf-8') as f:
    fase5_report = json.load(f)

# Cargar m√©tricas finales
with open('data/06_models/classification_metrics.json', 'r', encoding='utf-8') as f:
    clf_metrics = pd.DataFrame(json.load(f))

with open('data/06_models/regression_metrics.json', 'r', encoding='utf-8') as f:
    reg_metrics = pd.DataFrame(json.load(f))

print('‚úÖ Resultados cargados')
print(f'\nMejor Clasificaci√≥n: {fase5_report["mejor_clasificacion"]["modelo"]}')
print(f'Mejor Regresi√≥n: {fase5_report["mejor_regresion"]["modelo"]}')


‚úÖ Resultados cargados

Mejor Clasificaci√≥n: XGBoost
Mejor Regresi√≥n: Random_Forest


## 2. Resumen del Proyecto Completo


In [3]:
print('='*80)
print('üìã RESUMEN DEL PROYECTO - CRISP-DM')
print('='*80)

print('\n‚úÖ FASES COMPLETADAS:')
print('   Fase 1: Comprensi√≥n del negocio ‚úÖ')
print('   Fase 2: Exploraci√≥n de datos (EDA) ‚úÖ')
print('   Fase 3: Preparaci√≥n de datos ‚úÖ')
print('   Fase 4: Modelado (Clasificaci√≥n + Regresi√≥n) ‚úÖ')
print('   Fase 5: Evaluaci√≥n y selecci√≥n ‚úÖ')
print('   Fase 6: Despliegue y conclusiones ‚úÖ')

print('\nüìä MODELOS ENTRENADOS:')
print(f'   - Clasificaci√≥n: {len(clf_metrics)} modelos')
print(f'   - Regresi√≥n: {len(reg_metrics)} modelos')
print(f'   - Total: {len(clf_metrics) + len(reg_metrics)} modelos')

print('\nüèÜ MEJORES MODELOS SELECCIONADOS:')
best_clf = fase5_report['mejor_clasificacion']
best_reg = fase5_report['mejor_regresion']
print(f'   - Clasificaci√≥n: {best_clf["modelo"]}')
print(f'     Accuracy: {best_clf["accuracy"]:.2%} | F1: {best_clf["f1_score"]:.4f}')
print(f'   - Regresi√≥n: {best_reg["modelo"]}')
print(f'     R¬≤: {best_reg["r2_score"]:.2%} | RMSE: {best_reg["rmse"]:.4f}')

print('\nüéØ OBJETIVOS DEL NEGOCIO:')
print('   - Clasificaci√≥n: Predecir √©xito comercial (Alto/Medio/Bajo)')
print('   - Regresi√≥n: Predecir rating de audiencia (0-5)')
print('   - Prop√≥sito: Ayudar en decisiones de marketing y adquisiciones')


üìã RESUMEN DEL PROYECTO - CRISP-DM

‚úÖ FASES COMPLETADAS:
   Fase 1: Comprensi√≥n del negocio ‚úÖ
   Fase 2: Exploraci√≥n de datos (EDA) ‚úÖ
   Fase 3: Preparaci√≥n de datos ‚úÖ
   Fase 4: Modelado (Clasificaci√≥n + Regresi√≥n) ‚úÖ
   Fase 5: Evaluaci√≥n y selecci√≥n ‚úÖ
   Fase 6: Despliegue y conclusiones ‚úÖ

üìä MODELOS ENTRENADOS:
   - Clasificaci√≥n: 5 modelos
   - Regresi√≥n: 5 modelos
   - Total: 10 modelos

üèÜ MEJORES MODELOS SELECCIONADOS:
   - Clasificaci√≥n: XGBoost
     Accuracy: 75.67% | F1: 0.7838
   - Regresi√≥n: Random_Forest
     R¬≤: 43.58% | RMSE: 0.3343

üéØ OBJETIVOS DEL NEGOCIO:
   - Clasificaci√≥n: Predecir √©xito comercial (Alto/Medio/Bajo)
   - Regresi√≥n: Predecir rating de audiencia (0-5)
   - Prop√≥sito: Ayudar en decisiones de marketing y adquisiciones


## 3. Plan de Despliegue


In [4]:
print('='*80)
print('üöÄ PLAN DE DESPLIEGUE')
print('='*80)

print('\n1. INFRAESTRUCTURA:')
print('   - Entorno: Docker containers (reproducible)')
print('   - Orquestaci√≥n: Airflow DAGs (automatizaci√≥n)')
print('   - Versionado: DVC (datos, features, modelos)')
print('   - Pipeline: Kedro (modular y mantenible)')

print('\n2. MODELOS A DESPLEGAR:')
print(f'   - Clasificaci√≥n: {best_clf["modelo"]}')
print(f'     Archivo: data/06_models/best_classification_model.pkl')
print(f'     M√©tricas: Accuracy={best_clf["accuracy"]:.2%}, F1={best_clf["f1_score"]:.4f}')
print(f'   - Regresi√≥n: {best_reg["modelo"]}')
print(f'     Archivo: data/06_models/best_regression_model.pkl')
print(f'     M√©tricas: R¬≤={best_reg["r2_score"]:.2%}, RMSE={best_reg["rmse"]:.4f}')

print('\n3. ENDPOINTS DE API:')
print('   - POST /predict/classification')
print('     Input: {minute, date, genres[], countries[]}')
print('     Output: {success_level: "Alto"|"Medio"|"Bajo", probability: float}')
print('   - POST /predict/regression')
print('     Input: {minute, date, genres[], countries[]}')
print('     Output: {rating: float, confidence: float}')

print('\n4. CICLO DE VIDA:')
print('   - Entrenamiento: Semanal (nuevos datos)')
print('   - Validaci√≥n: Autom√°tica (A/B testing)')
print('   - Despliegue: Autom√°tico si m√©tricas mejoran')
print('   - Rollback: Autom√°tico si m√©tricas degradan >5%')


üöÄ PLAN DE DESPLIEGUE

1. INFRAESTRUCTURA:
   - Entorno: Docker containers (reproducible)
   - Orquestaci√≥n: Airflow DAGs (automatizaci√≥n)
   - Versionado: DVC (datos, features, modelos)
   - Pipeline: Kedro (modular y mantenible)

2. MODELOS A DESPLEGAR:
   - Clasificaci√≥n: XGBoost
     Archivo: data/06_models/best_classification_model.pkl
     M√©tricas: Accuracy=75.67%, F1=0.7838
   - Regresi√≥n: Random_Forest
     Archivo: data/06_models/best_regression_model.pkl
     M√©tricas: R¬≤=43.58%, RMSE=0.3343

3. ENDPOINTS DE API:
   - POST /predict/classification
     Input: {minute, date, genres[], countries[]}
     Output: {success_level: "Alto"|"Medio"|"Bajo", probability: float}
   - POST /predict/regression
     Input: {minute, date, genres[], countries[]}
     Output: {rating: float, confidence: float}

4. CICLO DE VIDA:
   - Entrenamiento: Semanal (nuevos datos)
   - Validaci√≥n: Autom√°tica (A/B testing)
   - Despliegue: Autom√°tico si m√©tricas mejoran
   - Rollback: Autom√

## 4. Monitoreo y Mantenimiento


In [5]:
print('='*80)
print('üìä MONITOREO Y MANTENIMIENTO')
print('='*80)

print('\n1. M√âTRICAS A MONITOREAR:')
print('   CLASIFICACI√ìN:')
print('   - Accuracy en producci√≥n (objetivo: >= 70%)')
print('   - Distribuci√≥n de predicciones por clase')
print('   - Tiempo de respuesta (objetivo: < 100ms)')
print('   - Tasa de errores (objetivo: < 1%)')
print('   ')
print('   REGRESI√ìN:')
print('   - R¬≤ en producci√≥n (objetivo: >= 0.35)')
print('   - RMSE en producci√≥n (objetivo: < 0.4)')
print('   - Desviaci√≥n de predicciones (objetivo: std < 0.5)')
print('   - Tiempo de respuesta (objetivo: < 100ms)')

print('\n2. ALERTAS CONFIGURADAS:')
print('   - ‚ö†Ô∏è  Degradaci√≥n de Accuracy > 5%')
print('   - ‚ö†Ô∏è  Degradaci√≥n de R¬≤ > 0.05')
print('   - ‚ö†Ô∏è  Tasa de errores > 2%')
print('   - ‚ö†Ô∏è  Tiempo de respuesta > 500ms')
print('   - üö® Modelo fallando (errors > 5%)')

print('\n3. RETRAINING:')
print('   - Frecuencia: Semanal (cada domingo 2 AM)')
print('   - Trigger autom√°tico: Si Accuracy/R¬≤ cae > 3%')
print('   - Validaci√≥n: Cross-validation en conjunto de validaci√≥n')
print('   - Despliegue: Autom√°tico si mejora > 2%')

print('\n4. VERSIONADO:')
print('   - Modelos: DVC (data/06_models/*.pkl)')
print('   - C√≥digo: Git (repositorio principal)')
print('   - Datos: DVC (data/01_raw, data/05_model_input)')
print('   - M√©tricas: JSON (data/06_models/*_metrics.json)')


üìä MONITOREO Y MANTENIMIENTO

1. M√âTRICAS A MONITOREAR:
   CLASIFICACI√ìN:
   - Accuracy en producci√≥n (objetivo: >= 70%)
   - Distribuci√≥n de predicciones por clase
   - Tiempo de respuesta (objetivo: < 100ms)
   - Tasa de errores (objetivo: < 1%)
   
   REGRESI√ìN:
   - R¬≤ en producci√≥n (objetivo: >= 0.35)
   - RMSE en producci√≥n (objetivo: < 0.4)
   - Desviaci√≥n de predicciones (objetivo: std < 0.5)
   - Tiempo de respuesta (objetivo: < 100ms)

2. ALERTAS CONFIGURADAS:
   - ‚ö†Ô∏è  Degradaci√≥n de Accuracy > 5%
   - ‚ö†Ô∏è  Degradaci√≥n de R¬≤ > 0.05
   - ‚ö†Ô∏è  Tasa de errores > 2%
   - ‚ö†Ô∏è  Tiempo de respuesta > 500ms
   - üö® Modelo fallando (errors > 5%)

3. RETRAINING:
   - Frecuencia: Semanal (cada domingo 2 AM)
   - Trigger autom√°tico: Si Accuracy/R¬≤ cae > 3%
   - Validaci√≥n: Cross-validation en conjunto de validaci√≥n
   - Despliegue: Autom√°tico si mejora > 2%

4. VERSIONADO:
   - Modelos: DVC (data/06_models/*.pkl)
   - C√≥digo: Git (repositorio principal)

## 5. Limitaciones y Mejoras Futuras


In [6]:
print('='*80)
print('‚ö†Ô∏è  LIMITACIONES IDENTIFICADAS')
print('='*80)

print('\n1. DATOS:')
print('   - Baja variabilidad del target de regresi√≥n (std=0.44)')
print('   - Desbalance de clases en clasificaci√≥n (Bajo >> Alto)')
print('   - Features limitadas (faltan: director, presupuesto, reparto)')

print('\n2. MODELOS:')
print('   - Clasificaci√≥n: Accuracy 75.7% (objetivo: >= 75% ‚Üí ‚úÖ)')
print('   - Regresi√≥n: R¬≤ 43.6% (objetivo: >= 60% ‚Üí ‚ö†Ô∏è)')
print('   - Limitaci√≥n fundamental: Target con poca varianza')

print('\n3. INFRAESTRUCTURA:')
print('   - Requiere infraestructura de Docker/Airflow')
print('   - Dependencia de almacenamiento para DVC')
print('   - Necesita monitoreo continuo')

print('\n' + '='*80)
print('üîÆ MEJORAS FUTURAS')
print('='*80)

print('\n1. FEATURES ADICIONALES:')
print('   - Informaci√≥n de director (historial, premios)')
print('   - Presupuesto y recaudaci√≥n')
print('   - Reparto (actores principales, popularidad)')
print('   - Marketing (tr√°ilers, promociones)')
print('   - Cr√≠ticas profesionales (Rotten Tomatoes, Metacritic)')

print('\n2. MODELOS AVANZADOS:')
print('   - Deep Learning (RNN/LSTM para secuencias temporales)')
print('   - Ensemble stacking (combinar mejores modelos)')
print('   - Transfer learning (modelos pre-entrenados)')
print('   - NLP (an√°lisis de descripciones y taglines)')

print('\n3. INFRAESTRUCTURA:')
print('   - MLflow (experimento tracking avanzado)')
print('   - Kubernetes (escalado autom√°tico)')
print('   - Feature store (gesti√≥n centralizada de features)')
print('   - Real-time inference (streaming predictions)')


‚ö†Ô∏è  LIMITACIONES IDENTIFICADAS

1. DATOS:
   - Baja variabilidad del target de regresi√≥n (std=0.44)
   - Desbalance de clases en clasificaci√≥n (Bajo >> Alto)
   - Features limitadas (faltan: director, presupuesto, reparto)

2. MODELOS:
   - Clasificaci√≥n: Accuracy 75.7% (objetivo: >= 75% ‚Üí ‚úÖ)
   - Regresi√≥n: R¬≤ 43.6% (objetivo: >= 60% ‚Üí ‚ö†Ô∏è)
   - Limitaci√≥n fundamental: Target con poca varianza

3. INFRAESTRUCTURA:
   - Requiere infraestructura de Docker/Airflow
   - Dependencia de almacenamiento para DVC
   - Necesita monitoreo continuo

üîÆ MEJORAS FUTURAS

1. FEATURES ADICIONALES:
   - Informaci√≥n de director (historial, premios)
   - Presupuesto y recaudaci√≥n
   - Reparto (actores principales, popularidad)
   - Marketing (tr√°ilers, promociones)
   - Cr√≠ticas profesionales (Rotten Tomatoes, Metacritic)

2. MODELOS AVANZADOS:
   - Deep Learning (RNN/LSTM para secuencias temporales)
   - Ensemble stacking (combinar mejores modelos)
   - Transfer learning (model

## 6. Conclusiones Finales


In [7]:
print('='*80)
print('üìÑ CONCLUSIONES FINALES')
print('='*80)

print('\n‚úÖ LOGROS DEL PROYECTO:')
print('   1. Implementaci√≥n completa de metodolog√≠a CRISP-DM')
print('   2. 5 modelos de clasificaci√≥n entrenados y evaluados')
print('   3. 5 modelos de regresi√≥n entrenados y evaluados')
print('   4. GridSearchCV + Cross-Validation (k=5) aplicado')
print('   5. Pipelines Kedro modulares y ejecutables')
print('   6. Versionado con DVC (datos, features, modelos)')
print('   7. Orquestaci√≥n con Airflow')
print('   8. Containerizaci√≥n con Docker')
print('   9. Documentaci√≥n completa del proyecto')

print('\nüìä RESULTADOS T√âCNICOS:')
print(f'   CLASIFICACI√ìN (√âxito Comercial):')
print(f'   - Mejor modelo: {best_clf["modelo"]}')
print(f'   - Accuracy: {best_clf["accuracy"]:.2%}')
print(f'   - Estado: {"‚úÖ CUMPLE objetivos" if fase5_report["validacion_objetivos"]["clasificacion_cumple"] else "‚ö†Ô∏è  Cercano a objetivos"}')
print(f'   ')
print(f'   REGRESI√ìN (Rating de Audiencia):')
print(f'   - Mejor modelo: {best_reg["modelo"]}')
print(f'   - R¬≤ Score: {best_reg["r2_score"]:.2%}')
print(f'   - RMSE: {best_reg["rmse"]:.4f}')
print(f'   - Estado: {"‚úÖ CUMPLE objetivos" if fase5_report["validacion_objetivos"]["regresion_cumple"] else "‚ö†Ô∏è  ACEPTABLE (limitado por datos)"}')

print('\nüí° IMPACTO DE NEGOCIO:')
print('   - Clasificaci√≥n: Ayuda a distribuidoras a decidir presupuesto de marketing')
print('   - Regresi√≥n: Ayuda a plataformas streaming a decidir adquisiciones')
print('   - Automatizaci√≥n: Reduce tiempo de an√°lisis manual')
print('   - Escalabilidad: Puede procesar miles de pel√≠culas en minutos')

print('\nüéì APRENDIZAJES:')
print('   - Importancia de feature engineering (pa√≠ses, estrenos)')
print('   - Limitaciones de modelos con baja varianza en target')
print('   - Valor de pipelines modulares (Kedro)')
print('   - Necesidad de versionado (DVC)')
print('   - Importancia de monitoreo continuo')

print('\n‚úÖ PROYECTO COMPLETADO')
print('   Todas las fases de CRISP-DM ejecutadas exitosamente')
print('   Modelos listos para despliegue en producci√≥n')


üìÑ CONCLUSIONES FINALES

‚úÖ LOGROS DEL PROYECTO:
   1. Implementaci√≥n completa de metodolog√≠a CRISP-DM
   2. 5 modelos de clasificaci√≥n entrenados y evaluados
   3. 5 modelos de regresi√≥n entrenados y evaluados
   4. GridSearchCV + Cross-Validation (k=5) aplicado
   5. Pipelines Kedro modulares y ejecutables
   6. Versionado con DVC (datos, features, modelos)
   7. Orquestaci√≥n con Airflow
   8. Containerizaci√≥n con Docker
   9. Documentaci√≥n completa del proyecto

üìä RESULTADOS T√âCNICOS:
   CLASIFICACI√ìN (√âxito Comercial):
   - Mejor modelo: XGBoost
   - Accuracy: 75.67%
   - Estado: ‚úÖ CUMPLE objetivos
   
   REGRESI√ìN (Rating de Audiencia):
   - Mejor modelo: Random_Forest
   - R¬≤ Score: 43.58%
   - RMSE: 0.3343
   - Estado: ‚ö†Ô∏è  ACEPTABLE (limitado por datos)

üí° IMPACTO DE NEGOCIO:
   - Clasificaci√≥n: Ayuda a distribuidoras a decidir presupuesto de marketing
   - Regresi√≥n: Ayuda a plataformas streaming a decidir adquisiciones
   - Automatizaci√≥n: Reduce 

## 7. Recomendaciones para Stakeholders


In [8]:
print('='*80)
print('üíº RECOMENDACIONES PARA STAKEHOLDERS')
print('='*80)

print('\nüìå PARA DISTRIBUIDORAS (Clasificaci√≥n):')
print('   - Usar modelo XGBoost para predecir √©xito comercial')
print('   - Confiar en predicciones con probabilidad > 80%')
print('   - Revisar manualmente casos cercanos a fronteras')
print('   - Ajustar presupuesto de marketing seg√∫n predicci√≥n')

print('\nüìå PARA PLATAFORMAS STREAMING (Regresi√≥n):')
print('   - Usar modelo Random Forest para predecir rating')
print('   - Considerar adquirir pel√≠culas con rating predicho > 3.5')
print('   - Validar predicciones con muestra peque√±a inicialmente')
print('   - Monitorear desviaciones de predicciones reales')

print('\nüìå PARA EL EQUIPO T√âCNICO:')
print('   - Implementar monitoreo continuo (semanal m√≠nimo)')
print('   - Retraining autom√°tico cada semana')
print('   - Documentar todos los cambios en modelo/datos')
print('   - Mantener pipeline Kedro actualizado')

print('\nüìå MEJORAS PRIORITARIAS:')
print('   1. Recopilar features adicionales (director, presupuesto)')
print('   2. Mejorar balance de clases (m√°s datos de clase "Alto")')
print('   3. Implementar A/B testing en producci√≥n')
print('   4. Crear dashboard de monitoreo en tiempo real')

print('\n‚úÖ PROYECTO LISTO PARA DESPLIEGUE')


üíº RECOMENDACIONES PARA STAKEHOLDERS

üìå PARA DISTRIBUIDORAS (Clasificaci√≥n):
   - Usar modelo XGBoost para predecir √©xito comercial
   - Confiar en predicciones con probabilidad > 80%
   - Revisar manualmente casos cercanos a fronteras
   - Ajustar presupuesto de marketing seg√∫n predicci√≥n

üìå PARA PLATAFORMAS STREAMING (Regresi√≥n):
   - Usar modelo Random Forest para predecir rating
   - Considerar adquirir pel√≠culas con rating predicho > 3.5
   - Validar predicciones con muestra peque√±a inicialmente
   - Monitorear desviaciones de predicciones reales

üìå PARA EL EQUIPO T√âCNICO:
   - Implementar monitoreo continuo (semanal m√≠nimo)
   - Retraining autom√°tico cada semana
   - Documentar todos los cambios en modelo/datos
   - Mantener pipeline Kedro actualizado

üìå MEJORAS PRIORITARIAS:
   1. Recopilar features adicionales (director, presupuesto)
   2. Mejorar balance de clases (m√°s datos de clase "Alto")
   3. Implementar A/B testing en producci√≥n
   4. Crear dash