# Introducción a  Numpy

**Autor:** Roberto Muñoz <br />
**E-mail:** <rmunoz@metricarts.com> <br />
**Github:** <https://github.com/rpmunoz> <br />

Uno de los módulos más importantes de Python es **[Numpy](http://www.numpy.org/)**. El origen de Numpy se debe principalmente al diseñador de software Jim Hugunin quien diseñó el módulo Numeric para dotar a Python de capacidades de cálculo similares a las de otros softwares como MATLAB. Posteriormente, mejoró Numeric incorporando nuevas funcionalidades naciendo lo que hoy conocemos como Numpy.

Numpy es el encargado de añadir toda la capacidad matemática y vectorial a Python haciendo posible operar con cualquier dato numérico o array (posteriormente veremos qué es un array). Incorpora operaciones tan básicas como la suma o la multiplicación u otras mucho más complejas como la transformada de Fourier o el álgebra lineal. Además incorpora herramientas que nos permiten incorporar código fuente de otros lenguajes de programación como C/C++ o Fortran lo que incrementa notablemente su compatibilidad e implementación.


## ¿Porqué usar Numpy?

En múltiples ocasiones necesitamos hacer operaciones numéricas sobre datos provenientes de archivos Excel o Bases de datos que contienen múltiples campos (columnas) y múltiples registros (filas).

Vimos que en Python existen las listas, tuplas y diccionarios, las cuales son de gran ayuda para almacenar y adminsitrar datos. Veamos qué sucede cuando queremos sumar los elementos almacenados en dos listas.

In [None]:
x=[1,2,3,4]
y=[5,6,7,8]
print(x+y)

Como podemos notar, el operador + simplemente concatena las dos listas.
¿Alguien sugiere como podriamos sumar los elmentos de las dos listas, elemento por elemento?

In [None]:
res=[]
for i in range(4):
    res.append(x[i]+y[i])
    
print(res)

## Cómo importar el paquete Numpy

Partimos importando el paquete numpy usando la función import. En este caso usaremos el alias np para referirnos de manera más abreviada a las clases y  métodos implementados en numpy.

In [None]:
import numpy

In [None]:
import numpy as np
print(np.__version__)

## Definición de arreglos en Numpy

In [None]:
# Definir arregle con 3 elementos

x= np.array([1,2,3])
x

In [None]:
x.shape

In [None]:
x.size

In [None]:
# Sumar el valor a cada elemento del arreglo x

x+10

In [None]:
# Definir un arreglo 2D

x = np.array([[1,2,3,4],[5,6,7,8]])

print(x)
print('type(x): ', type(x))
print('x.dtype: ', x.dtype)
print('x.size: ', x.size)
print('x.shape: ', x.shape)

In [None]:
# Definir un arreglo 1D como tipo de dato de punto flotante

x = np.array([1,2,3,4], dtype=np.float32)

print(x)
print('type(x): ', type(x))
print('x.dtype: ', x.dtype)
print('x.size: ', x.size)
print('x.shape: ', x.shape)

In [None]:
# Sumar dos arreglos 1D

x = np.array([1,2,3,4], dtype=np.float32)
y = np.array([5,6,7,8])

print('Suma: ', x+y)

In [None]:
# Multiplicar dos arreglos 1D

x = np.array([1,2,3,4], dtype=np.float32)
y = np.array([5,6,7,8])

print('Multiplicación: ', x*y)

In [None]:
# Calcular producto punto entre dos arreglos 1D

x = np.array([1,2,3,4], dtype=np.float32)
y = np.array([5,6,7,8])

print('x.shape: ', x.shape)
print('y.shape: ', y.shape)

print('Producto punto: ', np.dot(x, y) )

In [None]:
# Sumar un arreglo 2D con otro 1D

x = np.array([[1,2,3,4],[5,6,7,8]])
y = np.array([5,6,7,8])

print('x.shape: ', x.shape)
print('y.shape: ', y.shape)

print('Suma:\n ', x+y)

In [None]:
# Multiplicar un arreglo 2D con otro 1D

x = np.array([[1,2,3,4],[5,6,7,8]])
y = np.array([5,6,7,8])

z = x*y

print('Multiplicación:\n ', z)

In [None]:
print('x.shape: ', z.shape)

### Acceder a índices del arreglo n-dimensional

<img src="images/numpy_indexing.png" width="400">

In [None]:
# Definir un arreglo 2D

x = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print(x)

In [None]:
# Fila 0 - Columna 1

print('\nx[0,1]: ', x[0,1])

In [None]:
# Fila 1 - Columna 0

print('\nx[,0]: ', x[1,0])

### Acceder a slices o secciones del arreglo n-dimensional

<img src="images/boolean_indexing.png" width="400">

In [None]:
print(x)

In [None]:
# Extraer un slice del arreglo 2D
# Fila correspondiente al indice 0 y todas las columnas

x[0,:]

In [None]:
# Todas las filas y columna correspondiente al indice 0

x[:,0]

In [None]:
x[1:,:2]

### Crear arreglo n-dimensional lleno de 0's o 1's

In [None]:
# Inicializar un arreglo 1D y otro 2D con ceros

x=np.zeros(10)
print('x:\n ', x)

y=np.zeros([2,4])
print('y:\n ', y)

In [None]:
# Inicializar un arreglo 1D y otro 2D con unos

x=np.ones(10)
print('x:\n ', x)

y=np.ones([2,4])
print('y:\n ', y)

In [None]:
help(np.random.seed)

In [None]:
# Crear un arreglo usando valores aleatorios entre 0 y 1
np.random.seed(10)

x=np.random.random(100)
print(x)

### Creación de máscaras usando expresiones lógicas

In [None]:
x=np.array([1,2,3,4,5,6,7,8,9])

In [None]:
# Numpy permite crear máscaras fácilmente usando condiciones booleanas

a=x>6
print(a)

In [None]:
# Extraer los valores de x que satisfacen la condición booleana. Para ello usamos la máscara

x[a]

In [None]:
# Crear una copia del arreglo x, almacenarla en y, cambiar los valores a 0
# donde no se cumple la condición logica

y=x[:]
y[~a]=0
y

### Aplicar operaciones de suma

In [None]:
# Definir un arreglo 2D

x = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print(x)

In [None]:
# Sumar todos los valores del arreglo x

np.sum(x)

In [None]:
# Sumar los valores de un arreglo 2D a lo largo del axis=0

np.sum(x, axis=0)

In [None]:
# Sumar los valores de un arrego 2D a lo largo del axis=1

np.sum(x, axis=1)

### Aplicar operación para transponer una matriz

In [None]:
print('x.shape: ', x.shape)

In [None]:
# Crear la transpuesta de la matriz x

y = x.T

print(y)
print('y.shape: ', y.shape)

## Funciones matemáticas

In [None]:
x=np.random.random(10)
#print(x)
print('Mean: ', np.mean(x))
print('StdDev: ', np.std(x))

In [None]:
x=np.random.random(10000)
#print(x)
print('Mean: ', np.mean(x))
print('StdDev: ', np.std(x))

In [None]:
x=np.random.randn(10000)
print('Mean: ', np.mean(x))
print('StdDev: ', np.std(x))

In [None]:
import numpy as np

In [None]:
# También es posible importar algunas funciones directamente desde las librerías
# Para ello usamos la sintaxis from <nombre_libreria> import <nombre_funcion>

from numpy.random import random

In [None]:
random(10)

In [None]:
x=range(0,10, 0.5)
list(x)

In [None]:
# Crear un arreglo de enteros que comience en 0 y termine en 10 (no incluído)

x=np.arange(0,10)
print(x)

In [None]:
# Crear un arreglo de punto flotante que comience en 0 y termine en 10, con paso de 0.5

x=np.arange(0,10, 0.5, dtype=np.float64)
print(x)
print(x.dtype)

In [None]:
np.linspace(0,100, 6)

In [None]:
x

In [None]:
# Usar funciones trigonométricas
# Numpy contiene una serie de constantes matemáticas. Usaremos Pi

y=np.sin(x*np.pi)
print(y)

In [None]:
# Usar funciones como potencia

y=np.power(x,2) # elevar cada elemento del arreglo x, a la segunda potencia
print(y)

In [None]:
x**2

In [None]:
# Usar funciones como raíz cuadrada

y=np.sqrt(x) # raíz de a, del inglés "square root"
print(y)

In [None]:
x

In [None]:
x[10]=1000
x

In [None]:
x=np.array([[1,2,3,4]])
print(x)
print(x.shape)

In [None]:
y=np.array([x,x])
print(y)
print(y.shape)

In [None]:
from numpy import *

In [None]:
sqrt(x)

Escribir *np.sqrt(x)* es mucho más breve que la alternativa de usar funciones nativas de Python: Calcular una a una las raíces cuadradas de cada elemento de *x*.

In [None]:
result = []
for el in x:
    result.append(el**0.5)

print("\nUsando Python built-in: ", result)
print("\nUsando Numpy: ", y)

---

# Ejercicios

Realice los siguientes ejercicios. En caso de tener dudas, puede apoyarse con sus compañeros, preguntarle al profesor y hacer búsquedas en internet.

1. Cree una matriz de 7 columnas por 9 filas. Las primeras 3 columnas de la matriz tienen que tener el valor 0. La cuarta columna debe tener el valor 0.5, excepto por el último valor de esa columna, que tiene que ser 0.7. Las otras tres columnas deben tener el valor 1.

    Imprima la matriz y calcule las suma de los elementos de la última fila

2. La siguienteinstrucción crea una matriz aleatoria de 5 por 5 con valores entre 0 y 1
    `matriz_aleatoria=np.random.rand(5,5)` 

    Imprima las posiciones (Fila y columna) de los elementos de la matriz que son mayores que 0.5

In [None]:
matriz_aleatoria=np.random.rand(5,5)
print(matriz_aleatoria)