# Guía para presentación de proyectos.
> Se especifican los componentes básicos que deberá tener el proyecto final del curso `Proyecto en Ciencia de Datos`.


___
## 1. Entregable.
Los trabajos deben tener los siguientes componentes básicos.

#### 1. **Título del trabajo:**
El título del trabajo debe ser una descripción concisa pero informativa del proyecto. Debe reflejar el tema principal y el propósito de la solución que están desarrollando.

#### 2. **Introducción:**
La introducción es la sección inicial del informe que proporciona una visión general del proyecto. Debe explicar brevemente de qué trata el proyecto, su importancia y su relevancia en el contexto de la ciencia de datos.

#### 3. **Antecedentes:**
En esta sección, los estudiantes deben proporcionar información contextual sobre el tema del proyecto. Esto podría incluir investigaciones previas, estudios relacionados, tecnologías utilizadas y cualquier otro elemento que respalde la necesidad de abordar este problema.

#### 4. **Objetivos:**
En esta sección, se deben establecer los objetivos del proyecto. Esto incluye definir claramente lo que se espera lograr con la solución de ciencia de datos.

+ **Objetivos Generales:** Los objetivos generales son los propósitos amplios y fundamentales que se persiguen con el proyecto en su conjunto. Estos objetivos proporcionan una visión general de lo que se espera lograr, pero no entran en detalles específicos sobre cómo se lograrán. Son metas amplias que dan dirección al proyecto en su conjunto. En el contexto de un proyecto de ciencia de datos, los objetivos generales establecen el propósito general de aplicar los conceptos de ciencia de datos y MLOPS para resolver un problema real.
    
+ **Objetivos Específicos:** Los objetivos específicos son metas detalladas y concretas que se establecen para lograr los objetivos generales. Estos objetivos se centran en tareas o logros particulares que deben llevarse a cabo en el transcurso del proyecto. En un proyecto de ciencia de datos, los objetivos específicos pueden incluir pasos concretos como realizar un análisis exploratorio de datos, preprocesar datos, entrenar un modelo, crear una API, conteneirizar el servicio y desplegarlo en la nube. Los objetivos específicos brindan una hoja de ruta detallada para alcanzar los objetivos generales.

#### 5. **Planteamiento del problema:**
Aquí, los estudiantes deben describir detalladamente el problema que están abordando. Deben explicar por qué es un problema relevante y cómo puede resolverse o mejorarse mediante el uso de técnicas de ciencia de datos.

#### 6. **Desarrollo de la solución:**
Esta es la parte central del informe y debe dividirse en varias subsecciones:

+ **EDA (Análisis Exploratorio de Datos):** Aquí, los estudiantes deben mostrar cómo exploraron y analizaron los datos, identificando tendencias, patrones y características importantes.

+ **Data Wrangling:** En esta sección, se describe cómo se limpiaron y prepararon los datos para su análisis, incluyendo la eliminación de valores atípicos y la imputación de datos faltantes.

+ **Entrenamiento del modelo con `MLflow`:** En esta parte, se detalla cómo se entrenó el modelo de ciencia de datos. Deben utilizar `MLflow` para registrar los experimentos, incluyendo diferentes configuraciones de modelos y parámetros. Además, deben grabar métricas relevantes para evaluar el rendimiento de los modelos.

+ **Selección del mejor modelo:** Con base en los experimentos registrados en `MLflow`, se debe identificar y seleccionar el modelo que mejor desempeño y métricas muestra. Dicho modelo debe ser registrado en el `Registry Model` para posteriormente ser usado.

+ **Orquestación - Training Pipeline:** Convertir el flujo de entrenamiento previamente en un flujo de Prefect. 

+ **Servir el modelo (API) con el mejor desempeño:** Describe cómo se creó una API para servir el modelo con el mejor rendimiento y métricas a través de una interfaz web o un servicio.

+ **Interfaz Gráfica:**

+ **Conteneirizar del servicio:** Explica cómo se empaquetó el servicio y se subió a una plataforma de nube, lo que puede incluir el uso de contenedores como Docker.
 
+ **Despliegue del servicio en la nube:** Detalla cómo se implementó el servicio en la nube, cómo se configuraron los recursos. La API se despliega utilizando el modelo que ha mostrado el mejor rendimiento y métricas durante los experimentos.

#### 7. **Conclusiones:**
En esta sección, los estudiantes deben resumir los resultados del proyecto, destacar los logros, discutir los desafíos enfrentados y brindar recomendaciones o posibles mejoras futuras.

#### 8. **Referencias:**
Los estudiantes deben proporcionar una lista de todas las fuentes, libros, documentos técnicos, sitios web y recursos utilizados durante el proyecto. Esto incluye cualquier bibliografía y recursos citados en el informe.


NOTA: El proyecto se debe encontrar en un repositorio de `github`.

El repositorio debe tener la siguiente estructura recomendada, sin embargo puede adaptarla al caso de uso de su proyecto

```
├── LICENSE                              # License file for the project.
├── README.md                            # Top-level README for developers using this project.
├── data
│   ├── external                         # Data from third-party sources.
│   ├── interim                          # Intermediate data that has been transformed.
│   ├── processed                        # The final, canonical data sets for modeling.
│   └── raw                              # The original, immutable data dump.
├── notebooks                            # Jupyter notebooks for exploration, training, etc.
├── Informe Escrito
│   └── PrimerNombrePrimerApellido.ipynb
├── src
│   ├── __init__.py                      # Makes src a Python module.
│   ├── docker-compose.yaml              # Docker Compose file to orchestrate containers.
│   ├── frontend                         # Source code for the Streamlit user interface.
│   │   ├── Dockerfile                   # Dockerfile for building the frontend container.
│   │   ├── app.py                       # Streamlit app entry point.
│   │   └── requirements.txt             # Frontend-specific Python dependencies.
│   ├── backend                          # API source code for model interaction.
│   │   ├── Dockerfile                   # Dockerfile for building the backend container.
│   │   ├── __init__.py
│   │   ├── api.py                       # Example API module.
│   │   └── requirements.txt             # Backend-specific Python dependencies.
```

NOTA: El proyecto se debe encontrar en un repositorio de `dagshub` que al mismo tiempo debe estar ligado a un repositorio en `github`.

El repositorio debe tener la siguiente estructura

```

├── LICENSE                              # License file for the project.
├── README.md                            # Top-level README for developers using this project.
├── data
│   ├── external                         # Data from third-party sources.
│   ├── interim                          # Intermediate data that has been transformed.
│   ├── processed                        # The final, canonical data sets for modeling.
│   └── raw                              # The original, immutable data dump.
├── notebooks                            # Jupyter notebooks for exploration, training, etc.
├── Informe Escrito
│   └── PrimerNombrePrimerApellido.ipynb
├── src
│   ├── __init__.py                      # Makes src a Python module.
│   ├── docker-compose.yaml              # Docker Compose file to orchestrate containers.
│   ├── frontend                         # Source code for the Streamlit user interface.
│   │   ├── Dockerfile                   # Dockerfile for building the frontend container.
│   │   ├── app.py                       # Streamlit app entry point.
│   │   └── requirements.txt             # Frontend-specific Python dependencies.
│   ├── backend                          # API source code for model interaction.
│   │   ├── Dockerfile                   # Dockerfile for building the backend container.
│   │   ├── __init__.py
│   │   ├── api.py                       # Example API module.
│   │   └── requirements.txt             # Backend-specific Python dependencies.
```

___
## 2 Presentación.
> Recuerden que la nota del proyecto es mitad el trabajo, y mitad la presentación. Deben hacer una presentación en power point para presentar el trabajo en la clase. La presentación, además de llevar todos los componentes básicos descritos en el entregable, debe llevar una tabla de contenido.
>
> - Presentación: 25 minutos.
> - Seguir estas recomendaciones:
    > - https://www.ncsl.org/legislative-staff/lscc/tips-for-making-effective-powerpoint-presentations
    > - https://www.trentu.ca/academicskills/how-guides/how-write-university/how-approach-any-assignment/creating-effective-powerpoint-slides

<script>
  $(document).ready(function(){
    $('div.prompt').hide();
    $('div.back-to-top').hide();
    $('nav#menubar').hide();
    $('.breadcrumb').hide();
    $('.hidden-print').hide();
  });
</script>

<footer id="attribution" style="float:right; color:#808080; background:#fff;">
Created with Jupyter by Cristian Camilo Zapata Zuluaga.
</footer>