<img src="images\crisil_logo.png" align="right" border="0"><br>


# Capacitación en Python 06a - NumPy

En el siguiente cuaderno se presenta una introducción a Matplotlib. Lea atentamente el cuaderno y corra el código en cada celda para visualizar su salida.

---

## NumPy

<img src="images\numpy.jpeg" align="center" border="0"><br>

NumPy (o Numpy) es una biblioteca de álgebra lineal para Python, la razón por la que es tan importante para Data Science con Python es que casi todas las bibliotecas del ecosistema PyData confían en NumPy como uno de sus principales bloques de construcción. Permite el procesamiento de matrices y matrices multidimensionales de gran tamaño, con la ayuda de una gran coleccion de funciones matematicas de alto nivel.

Numpy también es increíblemente rápido, ya que tiene enlaces a bibliotecas en C. Para obtener más información sobre por qué desea utilizar matrices en lugar de listas, consulte esta excelente [publicación de StackOverflow](http://stackoverflow.com/questions/993984/why-numpy-instead-of-python-lists).


## Importación

Hasta este punto de la capacitación se ha trabajado sin la necesidad de importar librerías o paquetes externos a Python. LLegado este punto, es necesario aprender a importar una bibliteca externa. Como Numpy viene por defecto implementada en Anaconda Distribution, no es necesaria su instalación. Lo único que falta es aprender la sintaxis de importación, que se presenta en la próxima celda.

In [None]:
import numpy as np

La declaración `import` permite que el intérprete del lenguaje busque en las carpetas incluídas en el PATH algún paquete con el nombre que se indica despúes de un espacio. La declaración `as` permite llamar a el paquete o módulo importado por un nombremás conveniente. Por convención, se Numpy se importa como "np".

Numpy tiene muchas funciones y capacidades integradas. No se cubren todos, sino que nos centraremos en algunos de los aspectos más importantes de Numpy: vectores, arrays, matrices y generación de números. 

## Arrays de Numpy

Los arrays (arreglos) de NumPy son el principal elemento de Numpy que se utiliza a lo largo del curso. Éstos esencialmente vienen en dos sabores: vectores y matrices. Los vectores son estrictamente arrays 1-d y las matrices son 2-d (tenga en cuenta que de todos modos una matriz puede tener solo una fila o una columna).

Los temas a tratar en esta sección son:
 
 1. Creando arrays
 2. Métodos incorporados
 3. Random
 4. Indexación y selección
 5. Operaciones
 6. Funciones universales
 
### Creando arrays

#### Desde una lista de Python

Es posibe crear un array convirtiendo directamente una lista o lista de listas:

In [None]:
#Ejemplo de lista
list_1 = [1,2,3]
#muestro
list_1

In [None]:
#Asigno array a una variable
list_array=np.array(list_1)
#Imprimo el array
print(list_array)

In [None]:
nested_list= [[1,2,3],[4,5,6],[7,8,9]] # lista anidada
#muestro
nested_list

In [None]:
print(np.array(nested_list))

### Métodos incorporados

Hay muchos métodos incorporados en Numpy para generar arrays.

#### arange()

Retorno valores equiespaciados detro de un intervalo dado.

In [None]:
np.arange(0,10,2)

In [None]:
np.arange(0,11,2)

#### zeros() y ones()

Genero arrays de ceros y unos.

In [None]:
np.zeros(3) # Si sólo ingreso un argumento, se considera como un array de una fila

In [None]:
np.zeros((5,5)) # al ingresar dos argumentos el primero corresponde al nro de filas, el 2do al nro de columnas

In [None]:
np.ones(3) # sigue la misma idea que zeros()

In [None]:
np.ones((4,3))

#### linspace()
Retorna valores equiespaciados de números dentro de un intervalo específico.

In [None]:
np.linspace(0,10,3) # Los dos primeros argumentos indican el inicio y el final del intervalo
                    # el último argumento el número de puntos dentro del intervalo

In [None]:
np.linspace(0,10,50)

Su variante `np.logspace()` funciona de manera análoga pero el espaciado entre valores se encuentra en escala logarítmica.

#### eye()

Crea la matriz identidad por defecto, también se utiliza para crear matrices con elementos off-diagonal.

In [None]:
print(np.eye(4)) # el 1er argumento indica la dimensión de la matriz cuadrada, en este ej. 4x4
print('='*20)
print(np.eye(4, k=1)) #el argumento k indica que diagonal llenar

### Random 

Mediante el módulo Random, Numpy provee la funcionalidad de crear arrays con números aleatorios.

#### rand()

Crea un array de la forma dada y lo pobla con varoles aleatorios con una [distribución uniforme](https://en.wikipedia.org/wiki/Uniform_distribution_(continuous)) sobre `[0,1)` (no incluye 1). Note que para llamar al módulo `random` dentro de numpy, se utiliza la "notación de punto". Para llamar a la función `rand()` dentro del módulo `random`, otra vez se utiliza la notación de punto. 

In [None]:
np.random.rand(2) 

In [None]:
np.random.rand(5,5) # los primeros argumentos de rand() determinan las dimensiones del array

#### randn()

Retorna una muestra (o muestras) de la [distribución normal estandar](https://en.wikipedia.org/wiki/Normal_distribution#Standard_normal_distribution) , a diferencia de `rand()` que devuelve muestras de la distribución uniforme.

In [None]:
np.random.randn(2) # nuevamente se utiliza la notación de punto

In [None]:
np.random.randn(5,5)

#### randint()

Retorna números enteros aleatorios desde una cota inferior (incluída), a una cota superior (excluída). 

In [None]:
np.random.randint(1,100) # los primeros dos  argumentos son las cotas

In [None]:
np.random.randint(1,100,10) # el tercer argumento es el número de muestras (1 por defecto)

### Indexación y selección

In [None]:
#array de prueba
arr_example = np.arange(0,11)

In [None]:
#muestro array
arr_example

## Indexación y selección por corchetes
La manera más simple para elegir uno o más elementos de un array es similar al manejo de listas de Python:


In [None]:
#Selecciono un valor determinado
arr_example[8]

In [None]:
#Selecciono valores dentro de un rango
arr_example[1:5]

#### Broadcasting

Numpy difiere de una lista normal de Python por la posibilidad de realizar "broadcasting".

In [None]:
#Setear valores por medio de índices (Broadcasting)
arr_example[0:5]=100

#Muestro resultado
arr_example

In [None]:
lista=[ i for i in range(0,11)]
lista

In [None]:
lista[0:5]=100 # esto devuelve un error de asignación

#### Indexación de un array de 2D (matrices)

El formato general es **arr_2d [fila][col]** o **arr_2d [fila, col]**. Es recomendable utilizar la segunda notación para mayor claridad.

In [None]:
arr_2d = np.array([[5,10,15],[20,25,30],[35,40,45]])
    
#Muestro
arr_2d

In [None]:
#LLamando fila por índice
arr_2d[1]


In [None]:
# Selecciono un valor en particular
arr_2d[1][0]

In [None]:
# Se pueden tomar rebanas mediante la siguiente sintaxis
arr_2d[:2,1:] # corresponde al bloque superior derecho de 2x2 de la matriz original

In [None]:
#Todos las columnas de la última fila
arr_2d[-1,:]

### Operaciones

#### Aritmetica

Es fácil realizar operaciones aritméticas entre arrays, como también operaciones de escalares con arrays.

In [None]:
arr_example= np.arange(0,11)

In [None]:
arr_example + arr_example # adición entre elementos

In [None]:
arr_example * arr_example # multiplicación entre elementos, "producto de Hadamard" para matrices

In [None]:
arr_example - arr_example # sustracción entre elementos

In [None]:
arr_example/arr_example # Alerta por división por cero, reemplaza valor por NaN(Not a Number)

In [None]:
1/arr_example # Otro alerta, pero esta vez reemplaza por un valor infinito

In [None]:
arr_example**3 #potenciación

#### Operaciones vectoriales y matriciales

Las operaciones anteriores valen para matrices, y además, se agregan las siguientes.

In [None]:
A = np.random.randint(0, high=10, size=(3,2)) #matriz aleatoria A
B = np.random.randint(0, high=10,size=(2,2)) #matriz aleatoria B
print(A)
print('='*20)
print(B)

In [None]:
C = A.dot(B) # producto matricial
D = np.matmul(A,B) # también se puede escribir así
E = A @ B # o así
print(C)
# las 3 opciones son equivalentes para matrices 2d, se recomienda el uso de matmul()
np.all(C == D) and np.all(D==E) #all() verificar que los elemntos de un array correspondan a True

También se utiliza `dot()` para el producto escalar entre vectores.

In [None]:
a = np.array([1,0,0])
b = np.array([0,1,0])
c = a.dot(b)
print(c)

El producto vectorial se realiza mediante `cross()`.

In [None]:
d = np.cross(a,b)
print(d)

Para revisar las dimensiones de una matriz, se llama al atributo `shape`.

In [None]:
C.shape

Otros métodos útiles son `identity()`, `transpose()`, `linalg.inv()`. 

In [None]:
I = np.identity(3) #matriz identidad, a diferencia de eye() sólo permite llenar la diagonal principal
np.random.seed(42) # fijo semilla para obtener el mismo resultado de números "aleatorios"
A = np.random.randint(0, high=10, size=(3,3))
print(I)
print('='*20)
print(A)

In [None]:
A_t1 = A.transpose() #matriz transpuesta
A_t2 = A.T # es equivalente
print(A_t1)
A_t1 == A_t2 

In [None]:
A_inv = np.linalg.inv(A)# matriz inversa
print(A_inv)

### Funciones universales

Numpy viene con muchas [funciones universales de arrays](http://docs.scipy.org/doc/numpy/reference/ufuncs.html), que son esencialmente operaciones matemáticas que utilizan para realizar la operación en el array.

In [None]:
#Raiz cuadrada de cada elemento
np.sqrt(arr_example)

In [None]:
#Exponencial de cada valor
np.exp(arr_example)

In [None]:
#valor máximo en el array
np.max(arr_example) # también puede utilizarse arr_example.max()

In [None]:
# seno de cada elemento
np.sin(arr_example)

In [None]:
#logaritmo (devuelve advertencia para valor cero)
np.log(arr_example)

#### np.vectorize()

Esta función se utiliza para evaluar una función común de python sobre elementos de arrays de Numpy. No está diseñada pensada en su performance, sino en su utilidad. Pueden existir maneras más eficientes de conseguir el mismo resultado, pero no siempre de manera tan simple.

In [None]:
def mi_func(elemento_de_array):
    return (2*elemento_de_array+7)**2
    

In [None]:
func_vectorizada = np.vectorize(mi_func) #"vectorizo" para obtener una función universal de array equivalente 

In [None]:
func_vectorizada(arr_example)

¿Recuerdan las expresiones lambda? En este tipo de situaciones es cuando destacan. El anterior ejemplo se simplifica fácilmente.

In [None]:
np.vectorize(lambda x: (2*x+7)**2)(arr_example)

La mejor fuente de consulta sobre Numpy es su documentación oficial, aquellos interesados pueden referise a https://docs.scipy.org/doc/numpy/reference/index.html