# 2.4. Introducción a NumPy I.

- Instalar la librería con: ```pip install numpy```
- Se puede desde una termimal o desde una celda.
- Reiniciar el kernel después.
- También instalar matplotlib.

In [None]:
!pip install numpy

In [None]:
!pip install matplotlib

# NumPy Basics: Arrays and Vectorized Computation

- NumPy no es un módulo del core de Python, por lo que SIEMPRE habrá que importarlo de forma completa o componente a componente.

In [None]:
import numpy as np

- La librería para hacer plot es matplotlib.
- Utilizamos ```#%matplotlib inline``` para ver los gráficos dentro del notebook.

In [None]:
import matplotlib.pyplot as plt
#%matplotlib inline

- Las principlales motivaciones son su facilidad para realizar operaciones matemáticas y la rapidez de cómputo.

In [None]:
my_list = list(range(1000000))

In [None]:
%%timeit
my_list2 = [x * 2 for x in my_list]

In [None]:
my_arr = np.arange(1000000)

In [None]:
%%timeit
my_arr2 = my_arr * 2

## NumPy ndarray: Multidimensional Array Object

- Un ndarray puede contener elementos de <b>CUALQUIER TIPO</b></li>
- Todos los elementos de un ndarray deben tener <b>EL MISMO TIPO</b>.</li>
- El tamaño de un ndarray (número de elementos) se define en el momento de la creación y no puede modificarse.</li>
- Pero la organización de esos elementos entre diferentes dimensiones, sí puede modificarse</li>


- Un pequeño ejemplo:

In [None]:
# Generate some random data
data = np.random.randn(2, 3)
data

In [None]:
data * 10
data + data

In [None]:
data.shape

In [None]:
data.dtype

### Creación de  ndarrays

- Existen varias formas de crear un ndarray en NumPy. Vamos a ver las más relevantes:

<center>
<img src="imgs/np_1.png"  alt="drawing" width="700"/>
</center>

In [None]:
# from a list
data1 = [6, 7.5, 8, 0, 1]
arr1 = np.array(data1)
arr1

In [None]:
# from a list of list
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
arr2

In [None]:
arr2.ndim

In [None]:
arr2.shape

In [None]:
arr1.dtype

In [None]:
arr2.dtype

In [None]:
# Zeros
np.zeros(10)

In [None]:
# Multidimesional zeros
np.zeros((3, 6))

In [None]:
# Vacio
np.empty((2, 3, 2))

In [None]:
# rango
np.arange(15)

In [None]:
# equiespaciados
np.linspace(0, 2, 9)

### Tipos de datos en ndarrays

<center>
<img src="imgs/np_2.png"  alt="drawing" width="700"/>
</center>

In [None]:
arr1 = np.array([1, 2, 3], dtype=np.float64)
arr1.dtype

In [None]:
arr2 = np.array([1, 2, 3], dtype=np.int32)
arr2.dtype

In [None]:
arr = np.array([1, 2, 3, 4, 5])
arr.dtype

In [None]:
# Casting
float_arr = arr.astype(np.float64)
float_arr.dtype

In [None]:
arr = np.array([3.7, -1.2, -2.6, 0.5, 12.9, 10.1])
arr

In [None]:
# Casting
arr.astype(np.int32)

In [None]:
numeric_strings = np.array(['1.25', '-9.6', '42'], dtype=np.string_)
numeric_strings.astype(float)

In [None]:
int_array = np.arange(10)
calibers = np.array([.22, .270, .357, .380, .44, .50], dtype=np.float64)
int_array.astype(calibers.dtype)

In [None]:
empty_uint32 = np.empty(8, dtype='u4')
empty_uint32

### Consulta de la composición de un ndarray
- <b>dtype</b>: Tipo del contenido del ndarray.
- <b>ndim</b>: Número de dimensiones/ejes del ndarray.
- <b>shape</b>: Estructura/forma del ndarray, es decir, número de elementos en cada uno de los ejes/dimensiones.
- <b>size</b>: Número total de elementos en el ndarray.


In [None]:
array = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
array

In [None]:
# Tipo
array.dtype

In [None]:
# Número de dimensiones
array.ndim

In [None]:
# Dimesiones 
array.shape

In [None]:
# num elements
array.size

### Operaciones aritméticas entre ndarrays y escalares

- Los dos términos de la operación tienen que ser ndarrays de las mismas dimensiones y forma. Se aplica la operación elemento a elemento.

In [None]:
arr = np.array([[1., 2., 3.], [4., 5., 6.]])

In [None]:
arr

In [None]:
arr * arr

In [None]:
arr - arr

In [None]:
1 / arr

In [None]:
arr ** 0.5

In [None]:
arr2 = np.array([[0., 4., 1.], [7., 2., 12.]])

In [None]:
arr2

In [None]:
arr2 > arr

### Indexación y slicing básico
- En ndarrays unidimensionales el funcionamiento es idéntico al que se tiene en secuencias básicas de Python. 
- Se utiliza la indexación [a:b:c].
<center>
<img src="imgs/np_3.png"  alt="drawing" width="400"/>
</center>

In [None]:
arr = np.arange(10)
arr

In [None]:
arr[5]

In [None]:
arr[5:8]

In [None]:
arr[5:8] = 12
arr

In [None]:
arr_slice = arr[5:8]
arr_slice

In [None]:
arr_slice[1] = 12345
arr

In [None]:
arr_slice[:] = 64
arr

En ndarrays multidimensionales, existen dos posibles formas de realizar el acceso:<br/>
<ul>
<li><b>Mediante indexación recursiva:</b> array[a:b:c en dim_1][a:b:c en dim_2]...[a:b:c en dim_n]</li>
<li><b>Mediante indexación con comas:</b> array[a:b:c en dim_1, a:b:c en dim_2, ...a:b:c en dim_n]</li>
</ul>

In [None]:
arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
arr2d

In [None]:
arr2d[2]

In [None]:
arr2d[0][2]

In [None]:
# La mas usada
arr2d[0, 2]

In [None]:
arr3d = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
arr3d

In [None]:
arr3d[0]

#### Indexing con slices

<center>
<img src="imgs/np_4.png"  alt="drawing" width="400"/>
</center>

In [None]:
arr

In [None]:
arr[1:6]

In [None]:
arr2d

In [None]:
arr2d[:2]

In [None]:
arr2d[:2, :]

In [None]:
arr2d[:2, 1:]

In [None]:
arr2d[1, :2]

In [None]:
arr2d[:2, 2]

In [None]:
arr2d[:, :1]

In [None]:
arr2d[:2, 1:] = 0
arr2d

### Indexación y slicing booleano

In [None]:
names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
data = np.random.randn(7, 4)

In [None]:
names

In [None]:
data

In [None]:
names == 'Bob'

In [None]:
data[names == 'Bob']

In [None]:
data[names == 'Bob', 2:]

In [None]:
names != 'Bob'

In [None]:
data

In [None]:
data[~(names == 'Bob')]

In [None]:
cond = names == 'Bob'
data[~cond]

In [None]:
mask = (names == 'Bob') | (names == 'Will')
mask

In [None]:
data[mask]

In [None]:
data[data < 0] = 0
data

In [None]:
data[names != 'Joe'] = 7
data

### Indexación y slicing basado en secuencias de enteros - Fancy indexing

In [None]:
arr = np.empty((8, 4))
for i in range(8):
    arr[i] = i
arr

In [None]:
arr[[4, 3, 0, 6]]

In [None]:
arr[[-3, -5, -7]]

- También podemos indexar de manera arbitraria en múltiples dimensiones, utilizando para ello, una secuencia de enteros por cada dimensión.
- El resultado será la combinación de secuencias.

In [None]:
arr = np.arange(32).reshape((8, 4))
arr

In [None]:
arr[[1, 5, 7, 2], [0, 3, 1, 2]]