In [None]:
# Configuracion para recargar módulos y librerías 
%reload_ext autoreload
%autoreload 2

# MAT281

## Aplicaciones de la Matemática en la Ingeniería

Puedes ejecutar este jupyter notebook de manera interactiva:

[![Binder](../shared/images/jupyter_binder.png)](https://mybinder.org/v2/gh/sebastiandres/mat281_m01_introduccion/master?filepath=00_template/00_template.ipynb)

[![Colab](../shared/images/jupyter_colab.png)](https://colab.research.google.com/github/sebastiandres/mat281_m01_introduccion/blob/master//00_template/00_template.ipynb)

# Módulo 1: Data Science Toolkit 

## ¿Qué contenidos aprenderemos?

* [Sistema Operativo](#so)
* [Interfaz de Línea de Comandos](#cli)
* [Entorno Virtual](#venv)
* [Python](#python)
* [Project Jupyter](#jupyter)
* [Git](#git)

## Objetivos de la clase

* Instalación y uso de herramientas computacionales.
* Utilizar Jupyter Notebook/Lab.
* Recordar Python

<a id='so'></a>
## Sistema Operativo

* Personalmente recomiendo **Linux**, en particular distribuciones como Ubuntu, Mint o Fedora por su facilidad a la hora de instalar.
* En ocasiones las implementaciones en **Windows** no están completamente integradas e inclusive en ocasiones no están disponibles.
    - Una alternativa es [**Windows Subsystem for Linux**](https://docs.microsoft.com/en-us/windows/wsl/about), pero lamentablemente no se asegura un 100% de compatibilidad.
* En el caso que poseas un equipo con **macOS** no debería haber problema.

<a id='cli'></a>
## Interfaz de Línea de Comandos (*Command Line Interface* / CLI)

* Es un método que permite a los usuarios interactuar con algún programa informático por medio de líneas de texto.
* Típicamente se hace uso de una terminal/*shell* (ver imagen).
* En el día a día dentro de la oficina facilita flujo de trabajo.
* Permite moverse entre manipular directorios y ficheros, instalar/actualizar herramientas, aplicaciones, softwares, etc.

<img src="https://upload.wikimedia.org/wikipedia/commons/2/29/Linux_command-line._Bash._GNOME_Terminal._screenshot.png" alt="" align="center"/>

*Screenshot of a sample bash session in GNOME Terminal 3, Fedora 15. [Wikipedia](https://en.wikipedia.org/wiki/Command-line_interface)* 

<a id='venv'></a>
## Entorno Virtual

__Problemas recurrentes:__
- Dependencias de librerías (*packages*) incompatibles.
- Dificultad a la hora de compartir y reproducir resultados, e.g. no conocer las versiones de las librerías instaladas.
- Tener una máquina virtual para cada desarrollo es tedioso y costoso.
- Miedo constante a instalar algo nuevo y tu script vuelva a funcionar.

#### Solución 

Aislar el desarrollo con tal de mejorar la compatibilidad y reproducibilidad de resultados. 

####  ¿Cómo? 

Utilizando entornos virtuales.

####  Para el curso (es recomendable)

![Conda](https://conda.io/docs/_images/conda_logo.svg)

*Package, dependency and environment management for any language—Python, R, Ruby, Lua, Scala, Java, JavaScript, C/ C++, FORTRAN.* [(Link)](https://conda.io/docs/)


#### ¿Por qué Conda?

* Open Source
* Gestor de librerías __y__ entornos virtuales. 
* Compatible con Linux, Windows y macOS.
* Es agnóstico al lenguaje de programación (inicialmente fue desarrollado para Python).
* Es de fácil instalación y uso.

### Instalación

Toda la documentación se encuentra en este [link](https://conda.io/docs/user-guide/install/index.html), pero en resumen:

* Existe Anaconda y Miniconda, ambas contienen conda.
    - Anaconda es una distribución que incluye una artillería de librerías científicas.
    - Miniconda es para realizar una instalación mínima de conda sin adicionales (recomendada).
* Descarga e instala **Miniconda3** (Python3) según tu sistena operativo.
* __Importante__: En la fase final de la instalación se te preguntará si deseaas agregar Conda a tu PATH, dependiendo de tu sistema operativo:
    - En Windows selecciona la opción "NO" e inicia desde *Anaconda Prompt*.
    - En Linux y macOS acepta e inicia desde tu terminal.
* Test: 
    ```conda --version```

In [None]:
!conda --version

#### Otras alternativas:
* ```pip``` + ```virtualenv```, el primero es el gestor favorito de librerías de Python y el segundo es un gestos de entornos virtuales, el contra es que es exclusivo de Python. 
    - Ojo! En Conda también puedes instalar por  ```pip```.
* __Dockers__ es una herramienta muy de moda en grandes proyectos debido a ser, en palabras simples, un intermedio entre entornos virtuales y máquinas virtuales.

<a id='python'></a>
## Python

Las principales librerías científicas a instalar y que ocuparemos durante el curso son:

* [Numpy](http://www.numpy.org/): Computación científica.
* [Pandas](https://pandas.pydata.org/): Análisis de datos.
* [Matplotlib](https://matplotlib.org/): Visualización.
* [Altair](https://altair-viz.github.io/): Visualización Declarativa.
* [Scikit-Learn](http://scikit-learn.org/stable/): Machine Learning

<a id='juptyer'></a>
## Project Jupyter 

*[Project Jupyter](https://jupyter.org/index.html) exists to develop open-source software, open-standards, and services for interactive computing across dozens of programming languages.*
<img src="https://2.bp.blogspot.com/-Q23VBETHLS0/WN_lgpxinkI/AAAAAAAAA-k/f3DJQfBre0QD5rwMWmGIGhBGjU40MTAxQCLcB/s1600/jupyter.png" alt="" align="center"/>

### Jupyter Notebook

Es una aplicación web que permite crear y compartir documentos que contienen código, ecuaciones, visualizaciones y texto. Entre sus usos se encuentra:

* Limpieza de datos
* Transformación de datos
* Simulaciones numéricas
* Modelamiendo Estadístico
* Visualización de Datos
* Machine Learning
* Mucho más.

![Jupyter Notebook Example](https://jupyter.org/assets/jupyterpreview.png)

#### Dato Curioso

Esta presentación está hecha con Jupyter Notebook + [RISE](https://github.com/damianavila/RISE).

### Jupyter Lab

* Es la siguiente generación de la interfaz de usuario de *Project Jupyter*.
* Similar a Jupyter Notebook cuenta con la facilidad de editar archivos .ipynb (notebooks) y heramientas como una terminal, editor de texto, explorador de archivos, etc.
* Eventualmente Jupyter Lab reemplazará a Jupyter Notebok (aunque la versión estable fue liberada hace algunos meses).
* Cuenta con una serie de extensiones que puedes instalar (y desarrollar inclurisve.

<a id='git'></a>
## Git

*[__Git__](https://git-scm.com/) is a free and open source distributed version control system designed to handle everything from small to very large projects with speed and efficiency.*

### Instalación de Git

No es nada del otro mundo, basta con seguir las instrucciones de la página oficial en este [link](https://git-scm.com/book/en/v2/Getting-Started-Installing-Git). 

### Configuración de Git

No es un paso crucial, pero si en el futuro quieres tener tu propio repositorio o contribuir en otros proyectos, debes tener una identidad. 

Lo primero es configurar git, la [documentación oficial](https://git-scm.com/book/es/v1/Empezando-Configurando-Git-por-primera-vez) incluso está en español. Con configurar tu ```email``` y ```username``` debería bastar en una primera instancia.

Lo siguiente es tener una cuenta en la plataforma que utilizarás. Algunas de ellas son:
* GitHub
* GitLab
* Bitbucket

### GitHub

*[GitHub](https://github.com/) is a development platform inspired by the way you work. From open source to business, you can host and review code, manage projects, and build software alongside 30 million developers.*

Es decir, es una plataforma para alojar proyectos que utilizan Git como sistema de control.

### Material del curso

El material del curso estará alojado en el siguiente repositorio:

https://github.com/sebastiandres/mat281_2018S2

## Manos a la obra

1. Instalar [__git__](https://git-scm.com/).


2. En la terminal (de git si es el caso) moverte hasta donde quieras guardar el material del curso. En lo personal me gusta crear una carpeta llamada __git__ en __Documents__. Los pasos serían:
    * Abrir terminal
    * ```cd Documents```
    * ```mkdir git``` 
    

3. Clonar el repositorio del curso, ejecutando la siguiente línea de comando en la ruta deseada (en mi caso *~/Documents/git*): 

    ```git clone git@github.com:sebastiandres/mat281_m01_introduccion.git``` 

4. ```cd mat281_m01_introduccion``` (__tip__: Puedes usar ```TAB``` para autocompletar).


5. En la terminal (Anaconda Prompt si estás utilizando Windows) crear un entorno virtual de conda a partir de un archivo de requisitos (llamado *mat281_modulo1*), ejecutando la siguiente línea de comando:

    ```conda env create -f environment.yml```


6. Activar el entorno: 
    - Linux/macOS: ```source activate mat281_modulo1```
    - Windows: ```activate mat281_modulo1```

7. Ejecutar:
    - ```jupyter lab```, o
    - ```jupyter notebook```
8. Si no se abre atuomáticamente una nueva pestaña en tu navegador, copiar el link del token que se muestra en la terminal en tu navegador.
9. Abrir el notebook ```02_data_science_toolkit.ipynb``` ubicado en el directorio 02_data_science_toolkit.

![Ejemplo terminal jupyter lab](http://i.imgur.com/w3tb35S.png)

## Recordando Python

* Números y operaciones
* Listas, tuplas, conjuntos y diccionarios.
* Control flow
* Importar librerías

### Hola Mundo!

In [None]:
print('Hello World!')

In [None]:
name = 'John Titor'
print("Hola {}!".format(name))

## Números y operaciones

In [None]:
1 + 2

In [None]:
100 - 99

In [None]:
3 * 4

In [None]:
42 / 4  # En python 2 la división por defecto es entera

In [None]:
43 // 4

In [None]:
14 % 4

## Listas, tuplas, conjuntos y diccionarios

In [None]:
# Listas
my_list = [1, 2, 3, 4, 5]
print(my_list[0])

In [None]:
# Tuplas
my_tuple = (1, 2, 3, 4, 5)
print(my_tuple[4])

In [None]:
# Las listas pueden ser modificadas
my_list.append(100)  
print(my_list)

In [None]:
# Las tuplas son objetos inmutables!
my_tuple.append(50)

In [None]:
# Accediendo a valores
print(my_list[0])
print(my_list[-1])
print(my_list[0:2])
print(my_list[3:5])
print(my_list[::2])
print(my_list[:-2])

In [None]:
# Conjuntos
my_set = {1, 1, 1, 2, 2, 3}
print(my_set)

In [None]:
# Diccionarios
my_dict = {
    'llave': 'corazón',
    'sonrisa': 'corazones'
}
print(my_dict['sonrisa'])

## Control Flow

In [None]:
# Condicionales If, Elif, Else
x = 7
cota_inferior = 5
cota_superior = 10
if x < cota_inferior:
    print('{} es menor que {}'.format(x, cota_inferior))
elif x < cota_superior:
    print('{} es mayor igual que {} y menor que {}'.format(x, cota_inferior, cota_superior))
else:
    print('{} es mayor igual que {}'.format(x, cota_superior))

In [None]:
# Cilo While
i = 0
while i < 10:
    print(i)
    i += 1

In [None]:
# Ciclo For
for i in range(1, 10, 2):
    if i < 5:
        print('{} es menor que 5'.format(i))
    else:
        print('{} es mayor igual que 5'.format(i))

### Range no es una lista!

In [None]:
my_range = range(1, 10, 2)
type(my_range)

In [None]:
range?

In [None]:
# Presione TAB en el punto de la lína
my_range.

In [None]:
my_range.start

In [None]:
my_range.stop

In [None]:
my_range.step

## Librerías

In [None]:
import testFunction as tf

In [None]:
# En Jupyter podemos ver el código de fuente inclusive
tf.testFunction??

In [None]:
tf.testFunction(10, 2.5)

In [None]:
# La librería math no está cargada!
math.floor(2.5)

### Pro-Tip

Jupyter está basado en ```IPython```, por lo que puedes hacer uso de los comandos mágicos.

In [None]:
# Un poco de documentación
%magic

In [None]:
%lsmagic

In [None]:
%pwd

In [None]:
%%lsmagic

Existen comando mágicos de línea (```%```)y de celda completa (```%%```)

In [None]:
%timeit comprehension_list = [i*2 for i in range(1000)]

In [None]:
%%timeit

no_comprehension_list = []
for i in range(1000):
    no_comprehension_list.append(i * 2)

## Evaluación del laboratorio

#### Preparativos

* Crea un archivo en la misma carpeta de este notebook llamado ```labFunctions.py``` (tip: Puedes hacerlo desde Jupyter Notebook/Lab!).
* Se presentan a continuación tres ejercicios, para cada uno debes definir una función con el nombre y argumentos que se solicite.
* La evaluación consiste en que esas funciones se deben cargar a este notebook como una librería y se probarán con los datos entregados.

#### Se evaluará:

1. El código
2. Que la solución coincida con el ```assert```.
3. Que se ejecute el jupyter notebook.

### Ejercicio #1

* Definir la función llamada ```tribonacci``` con un argumento ```n``` tal que:
    - Para n = 1, 2 o 3 retorne el valor 1.
    - Para n >= 4 retorne la suma de los últimos tres valores de la sucesión.
    
Recuerda, para definir una función:

```python
def tribonacci(n):
    # Tu código va aquí
    value = ...
    return value
```

In [None]:
from labFunctions import tribonacci
n = 20
assert tribonacci(n) == 46499, 'Nope! Revisa cuidadosamente tu función'
print('Correcto!. El {0}-ésimo término de la serie es {1}.'.format(n, tribonacci(n)))

__OJO__: Engañar al ```assert``` es fácil. Podrías crear la siguiente función:

In [1]:
def tribonacci(n):
    if n == 20:
        return 46499
    else:
        return None
n = 20
assert tribonacci(n) == 46499, 'Nope! Revisa cuidadosamente tu función'
print('Correcto!. El {0}-ésimo término de la serie es {1}.'.format(n, tribonacci(n)))

Correcto!. El 20-ésimo término de la serie es 46499.


__Consejo:__ No lo hagas...

### Ejercicio #2

Primero, ejecuta la siguiente celda con tal de crear el diccionario ```nba_players``` que contiene información de los jugadores de la NBA en los últimos años de la siguiente manera:

- Las *keys* corresponden al nombre del jugador.
- Los *values* corresponden a listas en el siguiente formato:
    1. Año de inicio
    2. Año de fin
    3. Posición
    4. Altura (pies - pulgadas)
    5. Peso (libras)
    6. Día de nacimiento
    7. Universidad


In [None]:
import os
import pickle

with open(os.path.join('data', 'nba_player_data.pkl'), 'rb') as input_file:
    nba_player_data = pickle.load(input_file)

In [None]:
# Recordatorio! Los diccionarios son elementos iterables

for key, value in nba_player_data.items():
    print('El jugador {} tiene las siguientes estadísticas'.format(key))
    print('\t {}'.format(value))
    print('\n')

### Ejercicio #2

Define la función ```tallest_player(nba_player_data)``` tal que el argumento sea el diccionario anteriormente definido y retorne un objeto ```list``` con el/los jugadores más altos de la NBA.

#### Tip 1
Las listas poseen el método ```append```

In [None]:
list.append?

In [None]:
def onlyEvenNumbers(x):
    """Retorna los números pares de la lista x"""
    aux_list = []
    if isinstance(x, range) or isinstance(x, list):
        for i in x:
            if i % 2 == 0:
                aux_list.append(i)
        return aux_list
    else:
        print('El argumento debe ser una objeto list o range')
        return

print(onlyEvenNumbers(range(10)))
print('-------------------------')
print(onlyEvenNumbers({'key1': 1}))

#### Tip 2
Las objetos ```str``` (_string_) los puedes cortar con ```split```.

In [None]:
str.split?

In [None]:
pies, pulgadas = '10-1'.split('-')
print(pies)
print(type(pies))
print(int(pies))
print(type(int(pies)))

In [None]:
from labFunctions import tallest_player
assert tallest_player(nba_player_data) == ['Manute Bol', 'Gheorghe Muresan'], 'Nope! Revisa cuidadosamente tu función'
print('Correcto!. Los jugadores más altos de la NBA son:\n')
print(*tallest_player(nba_player_data), sep='\n')

### Ejercicio #3

Define la función ```more_time_position_player(nba_player_data, position)``` tal que el primer argumento sea el diccionario con los datos cargados, el segundo argumento la posición con tal que retorne una lista de el/los jugadores que estuvieron la mayor cantidad de años en la NBA para la posición seleccionada

Las posibles posiciones son:
['F-C', 'C-F', 'C', 'G', 'F', 'G-F', 'F-G']

In [None]:
from labFunctions import more_time_position_player
position = 'F-G'
assert more_time_position_player(nba_player_data, position) == ['Grant Hill', 'Paul Pierce'], 'Nope! Revisa cuidadosamente tu función'
print('Correcto! En la posición {} el/los jugadores con una mayor cantidad de tiempo son:\n'.format(position))
print(*more_time_position_player(nba_player_data, position), sep='\n')

### Nombre: Juanito Perez
#### Rol: 201110002-6