### Título del trabajo: Chromatic Charm

#### 2. **Introducción:**

La búsqueda de soluciones para la colorización precisa de imágenes en blanco y negro ha sido un desafío constante en el campo del procesamiento de imágenes y visión por computadora. En esta nueva iteración de nuestro proyecto, denominado "Chromatic-Charm", nos enfocamos en mejorar la calidad visual de imágenes monocromáticas mediante el uso de técnicas avanzadas de ciencia de datos y aprendizaje profundo. Exploraremos cómo podemos agregar color de manera realista y convincente a estas imágenes, abriendo nuevas posibilidades creativas y prácticas en el ámbito de la visualización digital.

Este proceso no solo requiere comprender la estructura y los detalles de las imágenes, sino también capturar la esencia y la tonalidad adecuadas para que el resultado final sea convincente para el ojo humano. A través del uso de técnicas avanzadas de aprendizaje profundo, exploraremos cómo podemos lograr esta transformación de manera eficaz y eficiente, abriendo nuevas posibilidades creativas y prácticas en el mundo de la visualización digital.

#### 3. **Antecedentes:**
Este proyecto revisita investigaciones previas que abordaron la colorización de imágenes mediante la implementación de autoencoders convolucionales ([Image-Colorization](https://github.com/xagallegos/Image-Colorization)). Aunque estos métodos demostraron cierto grado de capacidad para representar y generar imágenes en color, se descubrió que los resultados obtenidos no cumplían con los estándares deseados en cuanto a claridad y calidad visual. Estas limitaciones nos llevan a la exploración de nuevas metodologías, en este caso las GANs.

A lo largo de este trabajo se referencia el trabajo de Isola, P., Zhu, J. Y., Zhou, T., & Efros, A. A. (2017). [Image-to-image translation with conditional adversarial networks](https://arxiv.org/pdf/1611.07004.pdf), quienes exploran las redes adversarias condicionales como una solución de propósito general para problemas de traducción de imagen a imagen. 

#### 4. **Objetivos:**

**Objetivos Generales:**
Aplicar conceptos avanzados de ciencia de datos y aprendizaje profundo para desarrollar un modelo que sea capaz de colorizar imágenes de forma efectiva, conservando los detalles y la calidad de las mismas.

**Objetivos Específicos:**
1. Encontrar y adaptar un dataset de imágenes en pares de blanco y negro y color.
2. Realizar un exhaustivo análisis exploratorio de datos (EDA) para comprender las características y la distribución de las imágenes a blanco y negro, así como sus versiones a color.
3. Preprocesar y limpiar las imágenes para eliminar artefactos y valores atípicos que puedan afectar la calidad del modelo de colorización.
4. Entrenar modelos de Redes Generativas Adversarias (GANs) utilizando técnicas de ciencia de datos avanzadas para la colorización de imágnes. 
5. Implementar un sistema de registro de experimentos utilizando MLflow para rastrear el rendimiento de los modelos y optimizar los parámetros.
6. Seleccionar el mejor modelo en función de métricas de rendimiento y despliegue del modelo en una infraestructura en la nube para su uso práctico.

#### 5. **Planteamiento del problema:**
El desafío consiste en desarrollar un modelo efectivo que pueda agregar color de manera precisa a imágenes en blanco y negro, preservando la calidad original, de manera que el resultado final sea capaz de pasar desapercibido como una imágen a color para el ojo humano.

#### 6. **Desarrollo de la solución:**
Esta es la parte central del informe y debe dividirse en varias subsecciones:

+ **EDA (Análisis Exploratorio de Datos):** Aquí, los estudiantes deben mostrar cómo exploraron y analizaron los datos, identificando tendencias, patrones y características importantes.

+ **Data Wrangling:** En esta sección, se describe cómo se limpiaron y prepararon los datos para su análisis, incluyendo la eliminación de valores atípicos y la imputación de datos faltantes.

+ **Dataset final a trabajar:** Los estudiantes deben explicar qué datos seleccionaron para su proyecto y por qué eligieron esos datos específicos.

+ **Entrenamiento del modelo con MLflow:** En esta parte, se detalla cómo se entrenó el modelo de ciencia de datos. Deben utilizar MLflow para registrar los experimentos, incluyendo diferentes configuraciones de modelos y parámetros. Además, deben grabar métricas relevantes para evaluar el rendimiento de los modelos.

+ **Selección del mejor modelo:** Con base en los experimentos registrados en MLflow, se debe identificar y seleccionar el modelo que mejor desempeño y métricas muestra.

+ **Servir el modelo (API) con el mejor desempeño:** Describe cómo se creó una API para servir el modelo con el mejor rendimiento y métricas a través de una interfaz web o un servicio.

+ **Conteneirizar del servicio:** Explica cómo se empaquetó el servicio y se subió a una plataforma de nube, lo que puede incluir el uso de contenedores como Docker.

+ **Despliegue del servicio en la nube:** Detalla cómo se implementó el servicio en la nube, cómo se configuraron los recursos. La API se despliega utilizando el modelo que ha mostrado el mejor rendimiento y métricas durante los experimentos.


#### 7. **Conclusiones:**
En esta sección, los estudiantes deben resumir los resultados del proyecto, destacar los logros, discutir los desafíos enfrentados y brindar recomendaciones o posibles mejoras futuras.

#### 8. **Referencias:**
Dataset: https://research.google.com/audioset/dataset/speech.html

Los estudiantes deben proporcionar una lista de todas las fuentes, libros, documentos técnicos, sitios web y recursos utilizados durante el proyecto. Esto incluye cualquier bibliografía y recursos citados en el informe.

NOTA: El proyecto se debe encontrar en un repositorio de `dagshub` que al mismo tiempo debe estar ligado a un repositorio en `github`.

El repositorio debe tener la siguiente estructura

```
Proyecto de Ciencia de Datos
├── Informe Escrito
│   └── PrimerNombrePrimerApellido.ipynb
├── Data
│   ├── Raw Data (folder)
│   └── Clean Data (folder)
├── Entrenamiento
│   └── training.ipynb
├── EDA
│   └── EDA.ipynb
└── API
    ├── app.py
    ├── Dockerfile
    └── requirements.txt
```

___
## 2 Presentación.
> Recuerden que la nota del proyecto es mitad el trabajo, y mitad la presentación. Deben hacer una presentación en power point para presentar el trabajo en la clase. La presentación, además de llevar todos los componentes básicos descritos en el entregable, debe llevar una tabla de contenido.
>
> - Presentación: 15 minutos.
> - Seguir estas recomendaciones:
    > - https://www.ncsl.org/legislative-staff/lscc/tips-for-making-effective-powerpoint-presentations
    > - https://www.trentu.ca/academicskills/how-guides/how-write-university/how-approach-any-assignment/creating-effective-powerpoint-slides

<script>
  $(document).ready(function(){
    $('div.prompt').hide();
    $('div.back-to-top').hide();
    $('nav#menubar').hide();
    $('.breadcrumb').hide();
    $('.hidden-print').hide();
  });
</script>

<footer id="attribution" style="float:right; color:#808080; background:#fff;">
Created with Jupyter by Cristian Camilo Zapata Zuluaga.
</footer>

Rafael Juarez Badillo Chavez, Xander Gallegos