# Proyecto Final - Capítulo Modelos Supervisados
# Samsung Innovation Campus IA 2025

Desarrollo de una Solución de Inteligencia Artificial con Streamlit o
Gradio

## Objetivo

En grupos, las estudiantes deben diseñar, entrenar y presentar una
aplicación práctica de IA que resuelva un problema real utilizando un
dataset elegido por ellas. El proyecto debe incluir todas las fases del
ciclo de un modelo de machine learning: análisis exploratorio,
definición del problema, modelado, validación, despliegue y presentación
final.

------------------------------------------------------------------------

## Etapas del Proyecto

### 1. Selección del Dataset

-   El dataset debe provenir de una fuente pública, por ejemplo:
    -   [Kaggle Datasets](https://www.kaggle.com/datasets)
    -   [Datos Abiertos Chile](https://datos.gob.cl/)
    -   [Datos Abiertos UE](https://data.europa.eu/)
    -   [Google Dataset
        Search](https://datasetsearch.research.google.com/)

Elijan un dataset que sea relevante y manejable para el tiempo
disponible.

------------------------------------------------------------------------

### 2. Análisis Exploratorio de Datos (EDA)

-   Limpieza de datos: manejo de valores nulos, duplicados, outliers.\
-   Estadísticas descriptivas: medias, medianas, modas, desviaciones.\
-   Visualizaciones: histogramas, boxplots, correlaciones, pairplots,
    etc.\
-   Identificación de variables predictoras y variable objetivo.

Documenten todo el proceso en un cuaderno (.ipynb) explicando cada paso.

------------------------------------------------------------------------

### 3. Definición del Problema

-   Explicar claramente si es un problema de clasificación o de
    regresión.\
-   Justificar la decisión con base en el dataset y la variable
    objetivo.

------------------------------------------------------------------------

### 4. Modelado y Algoritmos

Entrenar al menos cuatro algoritmos diferentes:\
- Algoritmos base (ejemplo: Regresión Logística, KNN, Árboles de
Decisión, SVM).\
- Al menos un algoritmo de tipo conjunto (voting, bagging, boosting,
Random Forest, etc).

Usar GridSearchCV para encontrar los mejores hiperparámetros en los
modelos que corresponda.

------------------------------------------------------------------------

### 5. Validación y Evaluación

-   Comparar modelos con métricas adecuadas según el tipo de problema:
    -   Clasificación: accuracy, precisión, recall, F1-score, matriz de
        confusión, curva ROC.\
    -   Regresión: R², MSE, RMSE, MAE.\
-   Seleccionar el mejor modelo final según las métricas.

------------------------------------------------------------------------

### 6. Guardado del Modelo

Exportar el modelo final usando pickle:

``` python
import pickle

with open("modelo_final.pkl", "wb") as f:
    pickle.dump(mejor_modelo, f)
```

------------------------------------------------------------------------

### 7. Creación de la App (Despliegue Local)

Usar Streamlit o Gradio para crear una aplicación sencilla que permita:\
- Cargar datos de prueba.\
- Predecir con el modelo entrenado.\
- Mostrar métricas básicas y visualizaciones.

Documentación oficial:\
- [Streamlit Docs](https://docs.streamlit.io/)\
- [Gradio Docs](https://www.gradio.app/docs)

Ejemplo con Streamlit:

``` python
import streamlit as st
import pickle

# Cargar modelo
with open("modelo_final.pkl", "rb") as f:
    model = pickle.load(f)

st.title("App de Predicción con IA")

# Entrada de datos (ejemplo)
valor = st.number_input("Ingresa un valor:")

if st.button("Predecir"):
    pred = model.predict([[valor]])
    st.write("Predicción:", pred)
```

------------------------------------------------------------------------

### 8. Presentación Final

Cada grupo debe:\
- Explicar el dataset elegido y su relevancia.\
- Mostrar el proceso de EDA.\
- Justificar la selección de algoritmos.\
- Explicar el modelo final y sus métricas.\
- Hacer una demo en vivo de la app.

------------------------------------------------------------------------

## Criterios de Evaluación

1.  Claridad en la definición del problema (20%)\
2.  Calidad del EDA (20%)\
3.  Implementación y justificación de algoritmos (25%)\
4.  Validación, métricas y selección de modelo (15%)\
5.  Funcionalidad de la app (10%)\
6.  Presentación final del grupo (10%)

------------------------------------------------------------------------

## Resultado esperado

Una aplicación simple pero funcional que use un modelo entrenado por
ustedes y que muestre el flujo completo de un proyecto de IA aplicado.
