# Clase 5 - Excepciones, Decoradores y Módulos

**MDS7202: Laboratorio de Programación Científica para Ciencia de Datos**

*Profesor: Mauricio Araneda Hernandez*

## Objetivos de la Clase:

1. Manejo de Excepciones
2. Unit Testing
3. Decoradores
4. Generadores
5. Programacion Modular y Librerias
6. Docstrings
7. Estructura de proyectos en Data Science

## Parte 1: Manejo de Excepciones


El manejo de excepciones en Python sigue una estructura similar a la de otros lenguajes de programación. Aquí, se hace uso de bloques```try``` seguidos de uno o más bloques ```except```.

El contenido del bloque ```try``` se ejecuta en primera instancia y con normalidad, hasta que aparece un error o excepción de cierto tipo (```KeyError``` por ejemplo). En tal punto, se pasa al bloque `except` identificado con el tipo de excepción que se presente. 

**Ejemplo**: Recorramos una lista hasta un indice que no existe:


In [6]:
lista = [1000, 2000, 3000, 4000, 5000]

for i in [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]:
    print('Índice =', i, '| Elemento =', lista[i])
    
print('El programa continua')

Índice = 0 | Elemento = 1000
Índice = 1 | Elemento = 2000
Índice = 2 | Elemento = 3000
Índice = 3 | Elemento = 4000
Índice = 4 | Elemento = 5000


IndexError: list index out of range

In [7]:
variable_que_no_existe

NameError: name 'variable_que_no_existe' is not defined

In [8]:
1 + 'y' 

TypeError: unsupported operand type(s) for +: 'int' and 'str'

In [9]:
'y'/10

TypeError: unsupported operand type(s) for /: 'str' and 'int'

In [10]:
1/0

ZeroDivisionError: division by zero

In [11]:
a = 1

if not isinstance(a, str):
    raise TypeError('a no es string')

TypeError: a no es string

En algún punto nos lanza una excepción y detiene la ejecución del programa.

Podemos manjear esto a través de la estructura `try-except`:

In [12]:
lista = [1000, 2000, 3000, 4000, 5000]

try:
    for i in [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]:
        print('Índice =', i, '| Elemento =', lista[i])
except:
    print(f'Error!, indice {i} fuera de la lista\n')

print('El programa continua')

Índice = 0 | Elemento = 1000
Índice = 1 | Elemento = 2000
Índice = 2 | Elemento = 3000
Índice = 3 | Elemento = 4000
Índice = 4 | Elemento = 5000
Error!, indice 5 fuera de la lista

El programa continua


Podemos acceder incluso al error usando `except Exception as e:`

In [13]:
lista = [1000, 2000, 3000, 4000, 5000]

try:
    for i in range(10):
        print(lista[i])
except Exception as e:
    print(f'Error! Descripción del error: {e}')

print('El programa continua')

1000
2000
3000
4000
5000
Error! Descripción del error: list index out of range
El programa continua


In [14]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


Sin embargo, no es buena idea dejar pasar los errores sin hacer una acción que los maneje

> Errors should never pass silently.
> Unless explicitly silenced.

Para eso, podemos especificar que hacemos en cada tipo de excepción.

### Tipos de Excepciones en Python

---

> **Ejercicio ✏️**

Para entender que tipos de excepciones pueden existir en Python:

1. Nombre al menos 6 tipos de excepciones en Python. (*hint:https://docs.python.org/3/library/exceptions.html#bltin-exceptions* )
2. Genere un código que produzca exepciones del tipo: ```NameError```,```ZeroDivisionError``` y ```TypeError```.

---

In [None]:
f

In [None]:
1/0

In [5]:
lista['hola']

TypeError: list indices must be integers or slices, not str

Un bloque ```try``` puede tener más de un bloque ```except``` asociado, cada ```except``` explicita acciones a realizarse según el tipo de excepción aparecida en el código. A lo más, se podrá ejecutar un ```except``` (de los posiblemente múltiples). El código que maneja la excepción, asociada a un bloque ```except``` se le denomina *handler*. 

Las excepciones (del ejercicio anterior por ejemplo) pueden ser utilizadas para definir distintos handlers según la sintaxis: 

```python
try:
    # Accion que se desea ejecutar
    code_to_try
    
# Ejemplos de handlers y su sintaxis
except RuntimeError:
    handler_RuntimeError

except ZeroDivisionError:
    handler_ZeroDivisionError
    
except TypeError:
     handler_TypeError
...
```

Una manera más compacta viene dada por el uso de tuplas:


```python
try:
    # Accion que se desea ejecutar
    code_to_try
    
# Ejemplos de handlers y su sintaxis
except (RuntimeError,ZeroDivisionError,TypeError):
    handler_multi_exception
...
```

Finalmente, es posible tratar una excepción como una variable dentro de la scope que genera, para ello se utiliza la orden ```as``` según la sintaxis:

```python
try:
    # Accion que se desea ejecutar
    code_to_try
    
# Ejemplo de handler usando la variable err
except RuntimeError as err:
    handler_RuntimeError(err) #el handler usa la variable err

```

### Atributos de las Excepciones

Supongamos que queremos tener acceso a un archivo, pero no se escribe el nombre correcto. Esto es equivalente a acceder a un archivo que para el sistema es inexistente. La excepción asociada es del tipo ```FileNotFoundError```. Vale destacar que las excepción son objetos de la clase ```Exception``` y que por lo tanto tienen métodos (funciones) y atributos asociados. En este caso la variable ```err``` 
tiene el atributo ```.filename``` que hace referencia al archivo que se desea acceder:

In [None]:
try:
    '''
    La funcion open permite leer y excribir archivos de manera nativa
    '''
    f = open('archivo_inexistente.txt')
    s = f.readline()
    i = int(s.strip())
    

except FileNotFoundError as err:
    print("Error! archivo no encontrado:", err.filename)
    print('\nLos atributos y métodos disponibles del error son:\n', dir(err))

---

> **Ejercicio ✏️**

1. Considere un conjunto de bloques ```try```-```except``` donde cada ```except``` tiene especificado su comportamiento según una excepción especifica. ¿Es posible declarar un último bloque ```except``` al final, sin tener este, ninguna excepción asociada?

### Else

La estructura de los bloques ```try``` es similar a la de los bloques ```if```, estos, de hecho, comparten el uso de la orden ```else```. Cuando se utiliza esta última, el flujo comienza por la clausula ```try``` para luego pasar por cada bloque ```except```, si no se levanta ninguna excepción, se ejecuta el bloque ```else```.

> **Ejemplo 📖**

El siguiente código, se intenta acceder 
- al archivo `./archivo_inexistente_1.txt` que no existe y, 
- al archivo `./archivo.txt` que si existe y contiene texto.

In [None]:
#file = './archivo_inexistente_1.txt'
file = './archivo.txt'

try:
    '''
    Intenta abrir los archivos de la lista
    '''
    text = open(file, 'r')
except FileNotFoundError:
    '''
    Si no se encuentra el archivo, lo imprime en pantalla
    '''
    print('No se encuentra:', file, '\n')
else:
    '''
    Si no aparecen excepciones, aplica el código siguiente
    '''
    print('Archivo:', text.name, '\n')
    print(text.read())
    text.close()

Como podemos ver, los archivos inexistentes 1 y 2 arrojan el mensaje de error correspondiente. Por su parte, dado que ejemplo_2.txt existe en entorno de trabajo, no levanta ninguna excepción y ejecuta el código correspondiente:

1. Mostrar el nombre del archivo con el atributo ```.name```.
2. Mostrar el contenido en pantalla con el método ```.read()```
3. Finalmente, cerrar la conexión al archivo de texto por medio del método ```.close()```.

### Raise

Por otra parte, la orden ```raise``` permite forzar la aparición de una excepción.

> **Ejemplo 📖**

A continuación se levanta el error ```ValueError```, sin algún contexto especifico.

In [None]:
texto = 5

if not isinstance(texto, str):
    raise TypeError(f'Texto no es string. Entregado: {texto}')

Esta herramienta permite mayor control sobre los errores y el comportamiento que puede manejar nuestro código. 

### Finally

Por último, se puede agrear una orden de *limpieza* a un bloque ```try```, para ello se utiliza el comando ```finally```, este tipo de código se ejecuta sin importar la aparición de errores, su uso más común conlleva cerrar archivos antes abiertos, cerrar conexiones, borrar objetos de la memoria, etc...

La sintaxis para este tipo de orden es:

```python
try:
    accion
except: 
    manejo_de_excepcion
else: 
    accion_alternativa_sin_error
finally:
    accion_limpieza
```

> **Ejemplo 📖** 

A continuación se muestra un bloque en el que aparece un error y se realiza un acción de limpieza.

In [None]:
try:
    b = 5
    a = 0/0
    b += a
except ZeroDivisionError as e:
    print(f'Con errores: {e} \n')
else:
    print('Sin errores \n')
finally:
    print('Limpieza \n')
    b = None
    
print(b)

---

## Parte 2: Unit Testing


El *unit testing* o pruebas unitarias es un método para comprobar el correcto funcionamiento de un segmento de código o función.
La idea es crear casos de prueba en donde establecemos valores correctos que deberían retornar la funcion y luego comprobar que la función efectivamente los retorne. 

Para esto, los test que creemos deben ser determinísticos (no aleatorios) y repetibles. 


Python provee la *keyword* `assert` la cual verifica el valor de una condición: 

- Si es `True` continua la ejecución. 
- Si es `False`, lanza la excepción `AssertionError` y detiene la ejecución.

> **Ejemplo 📖**


def suma(a, b):
    return a + b

assert 5 == suma(2,3)

### La idea es hacer varios casos de prueba unitarios.
assert 5 == suma(2,3)
assert suma(2, -3) == -1
assert suma(99999,1) == 100000
assert suma(3,3) != 5
assert isinstance(suma(3,3.0), float)

### Comprobación de errores al modificar el código

Si por ejemplo, ahora modifico erroneamente la función suma y y en vez de sumar, multiplico `a` por `b`, el test los test que había programado de antemano deberían fallar.

def suma(a, b):
    return a * b 

assert suma(2,-3) == -1
assert suma(99999,1) == 100000
assert suma(3,3) != 5


### Le podemos indicar que nos entregue un mensaje de error

assert suma(3,2) == 5, 'Error en suma en el test suma(3, 2)'

> Nota interesante 📝:

    "Program testing can be used to show the presence of bugs, but never to show their absence!"
    
                                                                         —Edsger Dijkstra, 1970

### Paréntesis: TDD y pruebas unitarias

El test driven development (TDD) o desarrollo guiado por pruebas implica desarrollar las pruebas unitarias a las que se va a someter el software antes de escribirlo.
De esta manera, el desarrollo se realiza atendiendo a los requisitos que se han establecido en la prueba que deberá pasar.

(Fuente: https://www.yeeply.com/blog/que-son-pruebas-unitarias/)

### Paréntesis: Frameworks para testing en Python

Pytest
Tox



> **Ejercicio 💻**

Programe la función `promedio(lista)` que calcule el promedio de una lista y luego haga una serie de test unitarios que comprueben su funcionamiento. 
¿Qué pasa cuando el promedio es float?


---

## Parte 3: Decoradores


Los decoradores son funciones que se aplican sobre otras funciones a través de una sintaxis especial:


```python
@decorator
def func():
    pass
```


La idea es simple: 

- El decorador recibe una función objetivo como parámetro.
- Dentro del decorador se define una función que hace alguna operación y luego ejecuta la función objetivo ("la decora").
- Retorna la función decorada.

In [None]:
def info(f):
    
    def funcion_decorada(a, b):
        
        print(f"Se ha invocado a la función decorada con los argumentos: ({a}, {b})")
        return f(a, b)
    
    return funcion_decorada

In [None]:
def sumar(a, b):
    return a + b

info(sumar)(10, 5)

In [None]:
@info
def sumar(a, b):
    return a + b


print(sumar(10, 5))

---

### Parte 4: Generadores

Las funciones generadores nos permiten declarar una funcion que se comporta como un iterador, i.e. puede ser usada por un for loop.

Que ventajas tiene?

- Simplificacion de codigo
- Uso de memoria eficiente

Consideremos el ejemplo de construir una lista y sumar sus valores.


In [None]:
def first_n(n):
    '''Build and return a list'''
    num, nums = 0, []
    while num < n:
        nums.append(num)
        num += 1
    return nums

sum_of_first_n = sum(first_n(1000000))
sum_of_first_n

El codigo es bien sencillo, pero tiene que generar una lista completa con un millon de elementos en memoria. Esto lo podemos ejecutar en este ejemplo, pero que pasaria si cada elemento de la lista pesa 10megabytes?

Para evitar usar variables limitantes en memoria vamos a utilizar generadores.

In [None]:
# a generator that yields items instead of returning a list
def firstn(n):
    num = 0
    while num < n:
        yield num
        num += 1

sum_of_first_n = sum(firstn(1000000))
sum_of_first_n

> **Ejercicio 📝** 

1) Programe un decorador que aplique la funcion timer_sum() sobre una funcion y retorne el tiempo que demora la funcion en retornar su valor.
2) Utilice este decorador sobre las funciones definidas anteriormente y calcule el tiempo que demoran en ejecutar la suma sobre los elementos.

In [None]:
from time import time
def timer_sum(f):
    ...

In [None]:
# Lista
@timer_sum
def firstn_list(n):
    num, nums = 0, []
    while num < n:
        nums.append(num)
        num += 1
    return nums

# Generador
@timer_sum
def firstn_gen(n):
    num = 0
    while num < n:
        yield num
        num += 1

n_grande = 1000000
print(firstn_list(n_grande))
print(firstn_gen(n_grande))

---

### Parte 5: Programación Modular y Librerías

La programación modular es una técnica de de diseño de software. Sus cimientos se fundan la simplificación de sistemas complejos por medio del modelado de sus componentes o módulos. Este principio es agnóstico al paradigma de programación usado y está presente en la gran mayoría de proyectos de software. 

Para diseñar programas mantenibles, confiables y de fácil lectura con un nivel de esfuerzo razonable, se recomienda utilizar técnicas de desarrollo modular. Aquí, es de vital importancia, reducir la interdependencia entre componentes del sistema, generando piezas (o módulos) lo más independiente posibles. 

Python posee un manejo de módulos nativo, este sigue la sintaxis:

```python

import module_name

```

Así un modulo en Python es un archivo con extensión ```.py``` consistente en código Python. Un módulo puede contener una cantidad arbitraria de objetos, como por ejemplo, clases, archivos funciones, etc. Tampoco hay una sintaxis predefinida para definir tales objetos. 

El comando ```import``` permite obtener acceso a todos los objetos del archivo ```.py```. 

Ejemplo de un módulo de nombre `sample` :


    README.rst
    LICENSE
    setup.py
    requirements.txt
    sample/
        __init__.py
        core.py
        helpers.py
        subfolder/
            subcore.py
    docs/
        conf.py
        index.rst
    tests/
        test_basic.py
        test_advanced.py
        
    main.py  

<small>Referencia: https://docs.python-guide.org/writing/structure/ </small>




> **Ejemplo 📖**

El módulo ```math``` contiene ciertas constantes y funciones. A continuación se importa y se accede a algunos de sus objetos.

In [None]:
import math

# Función coseno
print('Coseno cos(0): ', math.cos(0))

# Función logaritmo natural

print('logaritmo natural ln(1): ', math.log(1))

# Constante de Euler
print('Numero de Euler e: ', math.e)



Al importar ```math``` se accede a sus funciones y constantes según la notación de objetos. Es posible importar solo algunos métodos o atributos por medio de la sintaxis:

```python
from module import method_1, attribute_1, ... , method_n
```

otra sintaxis relativamente útil es 

```python
from module import *
```

Esto quiere decir, que se importan todos los objetos de ```module```, directamente al namespace global. En el ejemplo del módulo ```math```,  al ejecutar la orden de importación usando el operador ```*```, ya no sería necesario llamar sus atributos y métodos por medio de ```math.cos()``` o ```math.e``` (para coseno y e) sino que se puede hacer directamente por medio de ```cos()``` y ```e```. 

> **Nota**: Los objetos importados con `*` se cargan al *namespace* global, lo que implica que pueden haber conflictos con los nombres de las variables globales. Por este motivo, **es una mala práctica**.

> **Ejemplo 📖**

Se importa el modulo random como rnd y se llama el método ```.gauss()```.

In [None]:
import random 

# Gaussiana 0,1
random.gauss(0, 1)


Por último, al considerar los módulos importados como objetos, se pueden renombrar en el namespace global por medio de la sintaxis

```python
import module_name as new_name
```


In [None]:
import random as rnd

# Gaussiana 0,1
rnd.gauss(0, 1)

#### Estructura de un Módulo

Un módulo en Python es un archivo conteniendo ordenes y definiciones. El nombre del módulo se deduce del nombre del archivo. Por ejemplo si se tiene el archivo ```module.py``` el nombre del módulo sera ```module```. 

> **Ejemplo 📖**

Se crea un archivo ```.py``` llamado ```zords.py```. Este archivo contiene las definiciones iniciales de las clases ```DinoZord```, ```Tyrannosaurus```, ```Mastodon```, ```Triceratops```, ```Sabertooth```, ```Pterodactyl``` y ```MegaZord```. Se importa según ```import zords``` y se accede a sus clases mediante la notación ```zord._____```. 

In [1]:
from src.zords.tyrannosaurus import Tyrannosaurus
from src.zords.mastodon import Mastodon
from src.zords.triceratops import Triceratops
from src.zords.sabertooth import Sabertooth
from src.zords.pterodactyl import Pterodactyl


tyrannosaurus = Tyrannosaurus()
tyrannosaurus.pilot = 'Jason Lee Scott'

mastodon = Mastodon()
mastodon.pilot = 'Zack Taylor'

triceratops = Triceratops()
triceratops.pilot = 'Billy Cranston'

sabertooth = Sabertooth()
sabertooth.pilot = 'Trini Kwan'

pterodactyl = Pterodactyl()
pterodactyl.pilot = 'Kimberly Hart'


In [2]:
tyrannosaurus

<src.zords.tyrannosaurus.Tyrannosaurus at 0x22f9cfd8490>

Al importarse un módulo, el interprete de Python busca en la misma carpeta donde se está ejecutando el código actual, luego busca en las carpetas de la configuración global, denotadas por la variable PYTHONPATH en sistemas operativos linux. Finalmente busca en la ruta donde Python fue instalado. Para conocer dicho orden se puede acceder al atributo `path` del módulo `sys`.

In [None]:
import sys
sys.path

---

## Parte 6: Docstrings


Cuando creamos funciones, lo hacemos principalmente por su funcionalidad, si trabajamos con otros desarrolladores, hacemos uso de comentarios por medio de la sintaxis:

```python
# Comentario

```
para comentarios de una linea, o

```python
"""
Para 
     comentarios 
                 multilinea
"""

```

Sin embargo, hay que tener en cuenta, que en general, se leerá el código durante más tiempo (por uno mismo o los desarrolladores) del que pasará escribiéndolo. 

El sistema de comentarios puede funcionar de manera perfecta al trabajar con desarrolladores con acceso al código fuente, pero al momento de que un usuario desee entender el significado de una función o trozo de código, no podrá necesariamente acceder al código de fuente cada vez que necesite utilizar sus funciones.

El término **Docstring** en Python se refiere a la documentación de tipo string asociada a una función, clase, modulo o método. Esta documentación se accede por medio de la función ```help(funcion)``` sobre el objeto que se desea consultar. 

Esta función permite comprender la funcionalidad de trozos de código a un nivel general y transversal (tanto para desarrolladores como para usuarios). Debido a que un *Docstring* es en esencia un texto producido por el programador para ser entendido por el público general (en especial el programador mismo), es que aparecen distintos tipos de estándar para generar estas documentaciones. 

In [None]:
help(list)

A continuación veremos algunos lineamientos a la hora de construir docstrings:

Para Docstrings de una linea:

* Se usa ```""" """``` inclusive si se puede escribir todo en una linea.
* Las comillas que inicial la documentación están en la misma linea que aquellas que la cierran.
* El docstring es una frase que termina en punto, describe el objeto al cual se hace referencia y su efecto en la forma (accion,resultado).
* La documentación no debe tener la "firma" (signature) del objeto subyacente: 

```python
# Mala practica:
def funcion_suma(a,b):
    """ funcion(a,b) -> int """
    return a+b
    
# Buena practica:
def funcion_suma(a,b):
    """Retorna la suma de a y b.
    
    Parameters
    ----------
    a 
        Entero o flotante.
    b 
        Entero o flotante

    Returns
    -------
    int
        Entero o flotante con la suma de a y b

    """
    return a+b
```

Docstrings multilinea:

* La documentación debe estar indentada completamente.

* La primera linea debe ser siempre un resumen corto y conciso de el propósito del objeto que se documenta.

* Debe haber una linea en blanco luego del resumen corto. Se puede agregar una explicación más profunda posterior al espacio.

En general existen cualidades comunes al momento de crear un docstring, estas incluyen, argumentos, atributos y resultados (returns). Los distintos estándares de creación de documentos abordan esto, dentro de los estándares más comunes se encuentran:

[Estándar google](https://github.com/google/styleguide/blob/gh-pages/pyguide.md#38-comments-and-docstrings)

[Estándar Numpy/Scipy](https://numpydoc.readthedocs.io/en/latest/format.html)

Una buena guia de manejo de docstrings se puede encontrar en la [documentación oficial](https://www.python.org/dev/peps/pep-0257/) de Python.

Podemos compilar la documentacion de un repositorio con herramientas como [Sphinx](https://www.sphinx-doc.org/en/master/).



---
> **Ejercicio 💻**

El estándar a seguir en este curso será el de Numpy/Scipy.

1. Estudia los lineamientos que tal estándar supone.

2. Aplica tales lineamientos a a los ejercicios con map/filter/reduce.

3. Elija una de las funciones, para una de las cuales confeccionó un docstring y acceda a tal documentación por medio del atributo ```help(function)```. (Desde un entorno jupyter notebook: ¿Qué ocurre se presiona las teclas ```shift+tab``` con el cursor dentro de la función? ejemplo: sum(|) ```shift+tab``` donde "|" es el cursor)


---

Para construir código "pythonico" vale decir, de fácil lectura y no redundante, se recomienda seguir la guía de estilo [PEP8](https://www.python.org/dev/peps/pep-0008/), su uso es transversal y se considera una buena práctica utilizarlo.

## Parte 7: Estructura de proyectos en Data Science

Cuando pensamos en el análisis de datos, a menudo pensamos sólo en los informes sobre resultados o la visualizacion de estos. Como son el producto principal normalmente se ignora la calidad del código que los genera. 

Dado que estos productos finales se crean mediante programación, la calidad del código sigue siendo importante, mas alla de que el codigo sea Pythonico en si mismo, la logica del proyecto debe ser limpia y logica. 



```
├── README.md          <- Un README que explique en que consiste el proyecto y como reproducirlo.
├── data
│   ├── external       <- Data externa que complemente y enriquezca nuestro dataset objetivo
│   ├── interim        <- Data intermedia que esta lista para transformarse en features para nuestro modelo. 
│   │                     (Filtros, Estandarizaciones, etc)
│   ├── processed      <- El dataset final para aplicar modelamiento.
│   └── raw            <- El dataset original como venia desde la fuente.
│
├── models             <- Pesos de nuestro modelos entrenados.
│
├── notebooks          <- Jupyter notebooks. La convencion de los nombres es un numero (para ordenar),
│                         iniciales de quien lo creo y un descripcion corta delimitada por `-`.
│                         Ejemplo: `1.0-mah-initial-data-exploration`.
│
├── reports            <- Analisis generados en formato HTML, PDF, LaTeX, etc.
│   └── figures        <- Graficos generados y figuras que se usaran al reportar.
│
├── requirements.txt   <- Requisitos para reproducir el ambiente de analisis.
│                         Generado con `pip freeze > requirements.txt`
│                         Aca podemos usar un environment.yaml para instalar dependencias desde conda. 
│
└── src                <- Carpeta con el codigo fuente
    ├── __init__.py    <- Hace que src sea un modulo
    │
    ├── data           <- Scripts para descargar los datos y filtrar/estandarizar los que usaremos.
    │   └── download_from_source.py
    │   └── filter_files.py
    │   └── standardize_data.py
    │
    ├── features       <- Scripts para transformar los datos raw en features para modelamiento.
    │   └── dataset.py 
    │
    ├── models         <- Scripts para entrenar modelos y usarlos para predecir
    │   ├── train_model.py
    │   └── predict_model.py
    │
    └── visualization  <- Scripts para crear visualizaciones exploratorias y de los resultados finales
        └── visualize.py
```

Para mas detalles pueden revisar [Cookiecutter](https://drivendata.github.io/cookiecutter-data-science/)