# Producción

__No tiene parte práctica__

Hasta el momento, solo nos hemos preocupado de las fases de exploración y desarrollo. En ellas, prima la interactividad del entorno y el objetivo es que el equipo encargado de esta fase sea lo más productivo posible.

A la hora de pasar a producción, cambian las prioridades. Cobran importancia:

* Automatización: ya no queremos ni necesitamos interactividad, sino procesos que corran sin intervención humana
* Robustez: que los procesos controlen casos extremos para no fallar, y que las partes con probabilidad de fallo (p.e. escritura de fichero, peticiones por internet, scraping, ...) se gestionen correctamente
* Logging: generación de trazas del proceso (informativas, de error, ...) para que se puedan consultar como parte de una operativa normal o de error inesperado
* Alarmas: en el caso de que algo vaya mal sobre un proceso crítico, debemos tener un mecanismo de aviso
* Estabilidad: mientras que en desarrollo podemos actualizar a nuevas versiones del lenguaje o de sus dependencias, en producción el entorno debe ser estable, y ser actualizado únicamente bajo demanda y habiendo comprobado que todo funciona correctamente

## Estructura del proyecto

Los notebooks de jupyter nos permiten desarrollar en un entorno interactivo. Pero un proyecto final que pasa a producción, seguirá una estructura de módulos (carpetas) estructurada.

Una estructura de ejemplo para un proyecto de clasificación de vinos:

```
|-- wineclassifier/             # Raíz del proyecto (repositorio git)
    |-- wineclassifier/
        |-- __init__.py         # Requerido al ser un módulo, habitualmente vacío
        |-- config.[py|yml]     # Configuración (cadenas de conexión, parametrización del modelo, ...)
        |-- model/              # Código relacionado con la generación del modelo
            |-- __init__.py
            |-- preprocess.py
            |-- regression.py   
        |-- resources/          # Recursos como queries, ...
            |-- __init__py
            |-- queries.py
        |-- util/               # Útiles, bastante reutilizables entre proyectos: lógica de conexión a BD, ...
            |-- __init__py
            |-- bd.py
            |-- storage.py
    |-- requirements.txt        # Dependencias con sus versiones del proyecto
    |-- train.py                # Lanza el entrenamiento
    |-- predict.py              # Lanza la predicción (batch, levanta API, ...)
    |-- README.md               # Instrucciones para lanzar el proyecto y doc importante
```

## Referencias

Más información:

* [Gestión excepciones en Python](https://www.datacamp.com/community/tutorials/exception-handling-python)
* [Tutorial de logging básico](https://code-maven.com/simple-logging-in-python)
* [Tutorial de docker](https://djangostars.com/blog/what-is-docker-and-how-to-use-it-with-python/)
* [Tutorial de testing](https://semaphoreci.com/community/tutorials/testing-python-applications-with-pytest)
* [CI/CD con GitHub, Travis y más](https://github.com/ksator/continuous-integration-with-python)
* [Convertir un modelo de ML en una API](https://www.datacamp.com/community/tutorials/machine-learning-models-api-python)
* [Virtual envs con conda](https://uoa-eresearch.github.io/eresearch-cookbook/recipe/2014/11/20/conda/)

Ejemplos de proyectos:

* [Homemade machine learning](https://github.com/trekhleb/homemade-machine-learning)

### Excepciones

In [1]:
a = 3
b = 'Carmen'
a + b

TypeError: unsupported operand type(s) for +: 'int' and 'str'

In [2]:
a = 3
b = 'Carmen'
# b = 9
try:  
    c = a+b
    print (a)
except TypeError:  
        print ("Type Error Exception Raised." )
else:  
    print ("Success, no error!")
finally:
    print('Yo me ejecuto si o si')

Type Error Exception Raised.
Yo me ejecuto si o si


In [16]:
a = 3
b = 9
try:  
    c = a+b
    print (a)
except TypeError:  
        print ("Type Error Exception Raised." )
else:  
    print ("Success, no error!")
finally:
    print('Yo me ejecuto si o si')

3
Success, no error!
Yo me ejecuto si o si


In [3]:
a = 3
b = 'Carmen'
#b = 9
try:  
    c = a+b
    print (a)
except Exception as e: # Exception es el comodín para cuando no sabemos qué error nos va a devolver el código. e es el tipo de error.
        print (e)
else:  
    print ("Success, no error!")
finally:                             # Es el gran olvidado, nadie lo usa (porque se arregla igual desindentando), pero existe.
    print('Yo me ejecuto si o si') 

unsupported operand type(s) for +: 'int' and 'str'
Yo me ejecuto si o si


In [1]:
def do_something():
    """The interface, not implemented"""
    raise NotImplementedError() # Por si, por lo que sea, quieres que tu código lance un error. Por ejemplo, para 
                                # avisar de que el código no está terminado.

In [4]:
do_something()

NotImplementedError: 

In [10]:
import logging # Se usa para hacer que en tus códigos salgan warnings.
 

#logging.basicConfig() # Esto es lo primero que hay que ejecutar, sin nada más.
logging.basicConfig(level = logging.DEBUG)
#logging.basicConfig(level = logging.INFO, format = '%(asctime)s  %(levelname)-10s %(processName)s  %(name)s %(message)s')



# Si lo queremos mandar a un fichero de log:
# logging.basicConfig(level = logging.INFO, filename = "my.log")
# logging.basicConfig(level = logging.INFO, filename = time.strftime("my-%Y-%m-%d.log"))

In [11]:
# Este es el orden de prioridad:
logging.debug("debug") 
logging.info("info") 
logging.warning("warning") # Para dejar un warning de algo que está pasando.
logging.error("error") # Te ha dado un error y quieres dejar constancia de él.
logging.critical("critical")

ERROR:root:error
CRITICAL:root:critical
