# Introducción

**NumPy** es la *librería* de python para computación científica. **NumPy** agrega al lenguaje lo siguiente: Arreglos multidimensionales, operaciones elemento por elemento (técnica conocida como *broadcasting*), algebra lineal, manipulación de imágenes, la habilidad de utilizar código `C/C++` y `FORTRAN`, entre muchas otras.

La mayor parte de los componentes del sistema de computo científico de Python, están construidas encima de **NumPy**, un ejemplo que veremos en el curso es `SciPy`.

Para poder utilizar **NumPy**, es necesario importarlo a la sesión del `notebook`.

### Bibliografía de soporte

- *NumPy Beginner's Guide* _Ivan Idris_,  PACKT Publishing, 2012
- *NumPy Cookbook* _Ivan Idris_, PACKT Publishing, 2012
- *Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython*, _Wes McKinney_, O'REILLY, 2012

In [None]:
import numpy as np

## Arrays

El principal componente de **NumPy** es el `array`, el cual es una versión más poderosa, pero menos flexible que las listas de python.

In [None]:
lst =  [1,2,3,4,5]
lst

In [None]:
arr = np.array([1,2,3,4,5])
arr

In [None]:
lst[2:3]

In [None]:
arr[2:3]

In [None]:
lst[-1] = "Las listas pueden tener varios tipos de datos"
lst

In [None]:
arr[-1] = "Los arreglos no..."

Una vez inicializado el `array` sólo puede contener un tipo de dato.

In [None]:
arr.dtype

In [None]:
arr[-1] = 1.23234
arr

In [None]:
arr.dtype

Sacrificamos la versatilidad de las listas por velocidad. Creeemos un `array` de 1 millón de elementos y multiplicaremos cada uno de ellos por una constante (*broadcasting*).

In [None]:
adoring_bootharr = np.arange(1e7)  

In [None]:
lst = arr.tolist()

Las listas no soportan *broadcasting* por lo que crearemos una función que lo simule

In [None]:
def lst_multiplicacion( alist , scalar ): 
    for i , val in enumerate ( alist ): 
        alist [ i ] = val
    return alist

In [None]:
%timeit arr * 1.1

In [None]:
%timeit lst_multiplicacion(lst, 1.1)

## Creación de arrays

In [None]:
arr

In [None]:
arr = np.arange(10,21)

In [None]:
arr

In [None]:
arr = np.zeros(5)

In [None]:
arr

In [None]:
arr = np.linspace(0,1,100)

In [None]:
arr

In [None]:
arr = np.logspace(0,1,100, base=10)

In [None]:
arr

In [None]:
arr2d = np.zeros((5,5))

In [None]:
arr2d

In [None]:
cubo = np.zeros((5,5,5)).astype(int)+1

In [None]:
cubo

In [None]:
cubo = np.ones((5,5,5)).astype(np.float16)

In [None]:
cubo

In [None]:
cubo.dtype

In [None]:
np.empty((2,3,4))

<div class="alert alert-danger">
**PELIGRO**

¡`np.empty` no devuelve un arreglo de ceros!
</div>

In [None]:
np.eye(4)

In [None]:
np.random.rand(3)

## Reshaping

In [None]:
arr = np.arange(1000)

In [None]:
arr3d = arr.reshape((10,10,10))

In [None]:
arr3d.ndim

In [None]:
arr3d.shape

In [None]:
arr3d

In [None]:
arr = np.arange(200)

In [None]:
arr2d = arr.reshape((10,20))

In [None]:
arr2d

## Aplanar

In [None]:
arr = np.zeros((4,4,4,4))

In [None]:
arr.shape

In [None]:
arr_plano = arr.ravel()

In [None]:
arr_plano.shape

In [None]:
arr_plano

## *Broadcasting*

In [None]:
data = np.array([1,2,3,4,5])

In [None]:
data

In [None]:
data + 1

In [None]:
data * 2

In [None]:
data ** 2

## Transponer

In [None]:
arr = np.arange(15).reshape((3,5))

In [None]:
arr

In [None]:
arr.T

¿Qué pasa en varias dimensiones?

In [None]:
arr  = np.arange(16).reshape((2,2,4))

In [None]:
arr

In [None]:
arr.transpose((1,0,2))

`transpose` recibe una `tupla` de los índices de los ejes y los permuta. `(O_o)`

## Slicing e Indexado

En el ejercicio vimos que el indexado en `arrays` de 1D es igual que el indexado y *slicing* de las listas de python. ¿Pero que sucede en $n-$dimensiones?

### Cuidado al hacer *slicing*

In [None]:
arr = np.arange(10)

In [None]:
arr

El _slincing_ genera (devuelve) una **vista**, si modificas el =array= original, la **vista** se ve modificada también.

In [None]:
arr_slice =  arr[5:8]

In [None]:
arr_slice

In [None]:
arr_slice[1]= 12345678

In [None]:
arr_slice

In [None]:
arr

In [None]:
arr_slice[:] = 345

In [None]:
arr_slice

In [None]:
arr

In [None]:
arr2 = np.copy(arr)

In [None]:
arr2

In [None]:
arr2[5:8] = [5,6,7]

In [None]:
arr2

In [None]:
arr

In [None]:
np.may_share_memory(arr, arr_slice)

In [None]:
np.may_share_memory(arr, arr2)

### Multidimensional

In [None]:
arr = np.arange(9)

In [None]:
arr.shape = (3,3)

In [None]:
arr

In [None]:
arr.ndim

In [None]:
arr[2]

In [None]:
arr[-1]

In [None]:
arr[1][1]

In [None]:
arr[1:]

In [None]:
arr[:2]

In [None]:
arr[:1,:2]

In [None]:
arr[1:,:2]

In [None]:
arr[1:,]

In [None]:
arr[1,:2]

In [None]:
arr[1,2:]

In [None]:
arr[:,1:]

In [None]:
arr[:,:1] 1,  1,  1,  1,  1]

<div class="alert alert-info">
    
**Ejercicio**:

Explique como funciona el *slicing* $n$-dimensional.
</div>

<div class="alert alert-info">
    
**Ejercicio**:
<ul>
    
<li> Cree un arreglo $3\times4\times5$, con $1$s. </li>
<li> Usando **slicing** , obtenga la columna de enmedio. </li>
<li> Usando *indexing*, obtenga el valor del elemento $[3,4,1]$. </li>
<li> Usando *slicing*, asigne el valor `1.34` a la $[2,3,]$ ¿Qué paso debe de hacer antes? </li>
</ul>
</div>

In [None]:
ejem = np.arange(60).reshape(3,4,5)
ejem

In [None]:
ejem_slice = ejem[:,:,2] 
ejem_slice

In [None]:
ejem_float = ejem.astype(np.float16)

In [None]:
ejem_float[2,3,] = 1.34
ejem_float

In [None]:
np.may_share_memory(ejem,ejem_float)

In [None]:
arr

In [None]:
index = arr > 2

In [None]:
index

In [None]:
arr[index]

In [None]:
arr2 = arr[index]

In [None]:
arr

In [None]:
arr2

<div class="alert alert-info">
    
**Ejercicio:**
(a) Cree un arreglo de 2D $5\times5$ lleno de unos. (b) Utilice *slicing* para seleccionar 1 cuadrado alrededor del centro  y llénelo con $2$s.  (c) Utilice *slicing* para seleccionar  el centro y asígnele $4$. (d) Copie el arreglo. (e) Utilice *slicing* lógico para seleccionar el cuadro interno y asígnele cero. (f) En el cuadro copiado, al centro y al cuadro exterior asígnele $0$.
</div>

## Fancy Indexing

In [None]:
arr = np.ones((5,4))

In [None]:
for i in range(5):
    arr[i]= i

In [None]:
arr

In [None]:
arr[[4,3,1,2]]

In [None]:
arr[[-3,-2,-1]]

¿Puedes explicar que hace el _fancy indexing_?

## Funciones Universales

Las *funciones universales*  realizan operaciones elemento por elemento en los arreglos. 

In [None]:
arr = np.arange(-10,10)

In [None]:
arr = -1*arr

In [None]:
arr

In [None]:
arr = np.abs(arr)

In [None]:
arr

In [None]:
np.sqrt(arr)

In [None]:
np.sign(arr)

In [None]:
np.isfinite(arr)

In [None]:
np.logical_not(arr)

In [None]:
if 10 : 
    print("Hello there")
else:
    print("General Kenobi!")

In [None]:
arr

In [None]:
arr = np.random.randn(10)

In [None]:
arr

In [None]:
np.ceil(arr)

In [None]:
np.floor(arr)

In [None]:
np.rint(arr)

In [None]:
arr2 = np.ones(10)

In [None]:
np.add(arr, arr2)

In [None]:
np.multiply(arr, arr2)

In [None]:
np.maximum(arr, arr2)

In [None]:
np.logical_and(arr, arr2)

## Agregaciones

Funciones que calculan operaciones a lo largo de un eje.

In [None]:
arr

In [None]:
arr.sum()

In [None]:
arr.mean()

In [None]:
arr = np.random.randn(5,4)

In [None]:
arr

In [None]:
arr.sum()

In [None]:
arr.mean()

In [None]:
arr.sum(0)

In [None]:
arr = np.arange(10)
arr

In [None]:
arr.cumsum()

In [None]:
arr.cumprod()

In [None]:
arr.reshape(2,5)

In [None]:
arr.cumsum()

In [None]:
arr > 5

In [None]:
(arr > 5).sum()

## Operaciones de conjuntos

In [None]:
arr

In [None]:
arr2

In [None]:
np.unique(arr2)

In [None]:
np.intersect1d(arr, arr2)

## Casting

In [None]:
a = np.array([1,2,3])
a

El tipo de mayor jerarquía define el _cast_

In [None]:
a +1.2

La asignación **no** cambia el tipo del arreglo.

In [None]:
a.dtype

In [None]:
(a + 1.5).dtype

## Tipos 

In [None]:
 np.iinfo(np.int32).max, 2**31 - 1   # Prueba con 8, 16, 32 y 64 bits

<div class="alert alert-info">
    
**Ejercicio** ¿Qué pasa con `int`?
</div>

In [None]:
np.finfo(np.float64).max 

In [None]:
np.finfo(np.float64).eps

In [None]:
np.float32(1e-8) + np.float32(1) == 1

In [None]:
np.float64(1e-8) + np.float64(1) == 1

## Estructura de datos

In [None]:
muestra = np.zeros((6,), dtype=[('codigo', 'S4'),('posicion', float), ('valor', float)])

In [None]:
muestra

In [None]:
muestra.ndim

In [None]:
muestra.shape

In [None]:
muestra.dtype.names

In [None]:
muestra[:] = [('ALFA',   1, 0.37), ('BETA', 1, 0.11), ('TAU', 1,   0.13),('ALFA', 1.5, 0.37), ('ALFA', 3, 0.11), ('TAU', 1.2, 0.13)]

In [None]:
muestra

In [None]:
muestra.shape

In [None]:
muestra['codigo']

In [None]:
muestra[0]['valor']

In [None]:
muestra[['codigo', 'valor']]

In [None]:
muestra[muestra['codigo'] == b'ALFA']

## Broadcasting (Segunda vuelta)

<div class="alert alert-warning">
    
**NOTA** Las imágenes y ejemplos están basados en la presentación  **The NumPy Array: A Structure for
Efficient Numerical Computation** de _Stéfan van der Walt_ de 2010.
</div>

### 1D

<img src="images/broadcasting_1d.png"/>

In [None]:
x = np.arange(4)
x

In [None]:
x + 3

### 2D

<img src="images/broadcasting_2d.png"/>

In [None]:
a = np.arange(12).reshape((3,4))
print (a.shape)
a

In [None]:
b = np.array([1,2,3])
print (b.shape)
b

In [None]:
a+b

<div class="alert alert-danger">
    
**Observa muy bien lo que acaba de pasar, el error es a propósito...**
</div>

In [None]:
b = b[:, np.newaxis]
print (b.shape)
b

In [None]:
a + b