<center>

# Introducción al Machine Learning
### Docente práctico: José I. Robledo

## Ejercicio 0. Introducción a Python: Jupyter Notebook

Si estas leyendo esto significa que pudiste abrir correctamente esta instancia de Jupyter Notebook!

Jupyter notebook es un espacio de trabajo diseñado especialmente para programar en Python. El formato de los archivos jupyter notebook es ".ipynb".

En jupyter notebook, se pueden generar celdas de código o de texto, las cuales pueden intercalarse. Las celdas de código pueden ser ejecutadas secuencialmente. Ante la primera ejecución de una celda, se iniciará un kernel que mantendrá posteriormente todos los objetos y ejecuciones en memoria. Una vez que el kernel sea desconectado o se cierre la notebook, será necesario volver a ejecutar todas las celdas para volver a correr el código.

Un programa de python suele comenzar con la cabecera, en donde se explicitan los paquetes que se utilizarán en la notebook. Estos paquetes serán conjuntos de módulos, los cuáles podrán contener diversas clases con métodos y funciones. Será mediante estos paquetes que tendremos acceso a funciones ya programadas de gran utilidad.

**IMPORTANTE**: El caracter de comentario en python es "#". Usenlo para ir comentando el código, o bien agreguen celdas markdown y escriban para complementar la notebook con sus anotaciones. 


## Cabecera: Paquetes y módulos

Un módulo es un archivo con terminación `.py` que contiene clases o funciones de python. Los paquetes (conjunto de módulos) que utilizaremos en este tutorial son numpy y matplotlib. Para importar un paquete o módulo, debemos utilizar la palabra clave `import` seguida del nombre del paquete o módulo. Si queremos incluir un único módulo de un paquete, pofemos utilizar la sintáxis `from` {paquete} `import` {módulo} `as` {acrónimo}.  En python, para no tener que estar escribiendo todo el tiempo el nombre completo del paquete cada vez que lo queremos utilizar, se pueden definir acrónimos utilizando la palabra clave `as`. En el siguiente código, importaremos el módulo numpy como "np" y el módulo pyplot del paquete matplotlib como "plt". El caracter "." indica que pyplot es un módulo dentro de matplotlib.

La celda se puede ejecutar de varias maneras: apretando el botón `Ejecutar celda`, apretando `ctrl+enter` (sin pasar a la siguiente celda) o apretando `shift+enter` (lo que ejecutará la celda y pasará directamente a la siguiente celda). 

In [2]:
import numpy as np
import matplotlib.pyplot as plt
from numpy import sin as seno

Una vez ejecutada la celda anterior tendremos acceso a los métodos o funciones de numpy y de pyplot. Numpy contiene un gran número de funciones que pueden explorarse en su documentación. Para acceder a la documentación, podemos ir a la página de numpy, o bien utilizar el caracter "?", de la siguiente manera:

In [3]:
np?

con el caracter "?" podremos explorar la documentación de cada objeto que hayamos instanciado.

In [4]:
seno?

A pesar que se pueden importan módulos en cualquier parte de la notebook, se recomienda fuertemente que se declaren en la cabecera, al comienzo de la misma.


Para acceder a los métodos dentro de un objeto se utiliza el caracter ".". Por lo tanto, en la declaración `matplotlib.pyplot` estamos llamando únicamente al módulo pyplot del paquete matplotlib.


## Escribir código y acceder a ayudas

Comencemos a programar en python! Ustedes ya tienen experiencia en programar en R, con lo cual comenzaremos a programar salteando varias cuestiones. Utilizaremos siempre el símbolo "=" en vez de "<-" para instanciar una variable, función, o cualquier objeto. 

A continuación utilizaré una función llamada linspace del módulo numpy, la cual permite generar `num` números equiespaciados en el intervalo entre `start` y `stop` (ver la documentación). Generemos un objeto con 100 números entre 0 y $2 \pi$.

In [9]:
np.linspace?

In [8]:
x = np.linspace(start=0, 
                stop=2*np.pi, 
                num=100) # al número pi lo sacamos de numpy.
x?

Las variables en las funciones (como start, stop y num en el caso de linspace) tienen un orden el cuál se encuentra detallado en la documentación. Si se respeta el orden de la documentación entonces no resulta necesario explicitar la variable, simplificando drásticamente la notación. Por ejemplo, podríamos haber declarado a x de la siguiente manera:

In [10]:
x = np.linspace(0, 1, 100)
print(x) #función que imprime, default en python

[0.         0.01010101 0.02020202 0.03030303 0.04040404 0.05050505
 0.06060606 0.07070707 0.08080808 0.09090909 0.1010101  0.11111111
 0.12121212 0.13131313 0.14141414 0.15151515 0.16161616 0.17171717
 0.18181818 0.19191919 0.2020202  0.21212121 0.22222222 0.23232323
 0.24242424 0.25252525 0.26262626 0.27272727 0.28282828 0.29292929
 0.3030303  0.31313131 0.32323232 0.33333333 0.34343434 0.35353535
 0.36363636 0.37373737 0.38383838 0.39393939 0.4040404  0.41414141
 0.42424242 0.43434343 0.44444444 0.45454545 0.46464646 0.47474747
 0.48484848 0.49494949 0.50505051 0.51515152 0.52525253 0.53535354
 0.54545455 0.55555556 0.56565657 0.57575758 0.58585859 0.5959596
 0.60606061 0.61616162 0.62626263 0.63636364 0.64646465 0.65656566
 0.66666667 0.67676768 0.68686869 0.6969697  0.70707071 0.71717172
 0.72727273 0.73737374 0.74747475 0.75757576 0.76767677 0.77777778
 0.78787879 0.7979798  0.80808081 0.81818182 0.82828283 0.83838384
 0.84848485 0.85858586 0.86868687 0.87878788 0.88888889 0.89898

## Tipos 

Existen diversos tipos de objetos en python. Entre los más comunes que utilizaremos están los números *enteros (`int`), reales (`float`), los strings (`str`), las listas (`list`), los arrays de numpy (`numpy.ndarray`) y los diccionarios (`dict`)*. Para ver el tipo de un objeto, debemos usar la función `type()` de python.

In [11]:
type(x)

numpy.ndarray

In [12]:
type(seno)

numpy.ufunc

### Strings

Los strings son colecciones de letras o caracteres. Hay una clase de python que se llama `str`

In [14]:
string_1 = 'Hola!'
string_2 = "Chau!"

print(string_1 + string_2)
print("Así también funciona.")
print('''Tambien se puede poner mucho contenido,
formateado en distintas líneas, 
utilizando las tres comillas
de esta manera.''')

Hola!Chau!
Así también funciona.
Tambien se puede poner mucho contenido,
formateado en distintas líneas, 
utilizando las tres comillas
de esta manera.


In [16]:
string_1[2]

'l'

Cada tipo tiene sus propios métodos base incorporados. Estos métodos se acceden con el caracter ".". Por ejemplo los métodos `upper()` y `lower()` en strings permites poner o sacar las mayúsculas:

In [17]:
"hola".upper()

'HOLA'

In [18]:
"HOLa".lower()

'hola'

In [16]:
string_1.upper()

'HOLA!'

### Listas 

Las listas son objetos que permiten almacenar varios valores ordenados dentro de una sola variable. Lo interesante de la lista es que la dimensión de la misma puede variar. Podemos pensarlo en cierto sentido como un vector de dimensión variable. Las listas se definen con corchetes. En python SIEMPRE el primer elemento de cualquier lista o array comienza con 0.  Van unos ejemplos de definir una lista y de cómo acceder a sus elementos: 

In [26]:
a = [1,2,4]

print(f'El tipo de a es :{ type(a) }')
print(f'El primer elemento de a es: { a[0] }')
print(f'El segundo elemento de a es: { a[1] }')
print(f'Los últimos dos elementos de a son: { a[1:3] }')

El tipo de a es :<class 'list'>
El primer elemento de a es: 1
El segundo elemento de a es: 2
Los últimos dos elementos de a son: [2, 4]


### Arrays

Los arrays de numpy son similares en el sentido que almacenan varios valores ordenados, pero además pueden ser utilizados para realizar las operaciones matemáticas del módulo de numpy (operaciones que en el fondo son realizadas en el lenguaje C, mucho mas eficiente respecto al costo computacional).

In [None]:
x

Por ejemplo, utilicemos estos valores de x para calcular el seno(x). Como ya habíamos llamado a la función seno en la cabecera, ahora tendremos acceso a ella simplemente escribiendo "seno".

In [None]:
y = seno(x) #almacenamos los valores del seno(x) en la variable y.
#y = np.sin(x) Otra opcion más usual.
print(y)

### Diccionarios
Un Diccionario es una estructura de datos y un tipo de dato en Python con características especiales que nos permite almacenar cualquier tipo de valor como enteros, cadenas, listas e incluso otras funciones. Estos diccionarios nos permiten además identificar cada elemento por una clave (Key). Para definir un diccionario, se encierra el listado de valores entre llaves. Las parejas de clave y valor se separan con comas, y la clave y el valor se separan con dos puntos.

In [33]:
b = {'Nombre':'Jose',
     'Apellido':'Robledo',
     'Edad':31,
     'Lista':[1,2,3,4,10]}

print(f"Su nombre es { b['Nombre'] } { b['Apellido'] } y tiene { b['Edad'] } años.")


Su nombre es Jose Robledo y tiene 31 años.
