# 1.- La base de NumPy - ndarray

Toda la libería de NumPy se articula alrededor de una única estructura de datos: la **matriz multidimensional o ndarray (N-dimensional array)**.<br/>

**ndarray=matriz que puede tener distintas dimensiones**

# Características básicas de ndarray

Un ndarray puede contener **elementos de CUALQUIER TIPO**

**Todos los elementos** de un ndarray **deben tener EL MISMO TIPO**.
    
El **número de elementos se define en el momento de la creación y no puede modificarse** (bueno, exite el **método resize** que puede hacer incrementos automáticos aunque es bueno mantener en todo momento el control de la definición de los elementos originales.

Pero **la dimensión de la matriz sí puede modificarse (manteniendo el mismo número de elementos total)**


# Importación del módulo NumPy

Hay que recordar que **NumPy no es** un módulo **del core** de Python por lo que **SIEMPRE habrá que importarlo** de forma completa o componente a componente.

In [4]:
import numpy as np

# Creación de ndarrays

Existen **varias formas** de crear un ndarray en NumPy. Vamos a ver las más relevantes.

## Creación con una secuencia numérica

**Con un parámetro: np.arange(n)**

**Con dos parámetros: np.arange(n,m)**

**Con tres parámetros: np.arange(n,m,salto)**

In [5]:
# Un parámetro: desde 0 (incluido) hasta el valor indicado (no incluido)
array_secuencia_1 = np.arange(10)
array_secuencia_1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [6]:
# Dos parámetros: desde el primer valor (incluido) hasta el segundo valor (no incluido)
array_secuencia_2 = np.arange(5, 10)
array_secuencia_2

array([5, 6, 7, 8, 9])

In [7]:
# Tres parámetros: desde el primer valor (incluido) hasta el segundo (no incluido) con saltos del tercer valor
array_secuencia_3 = np.arange(5, 20, 2)
array_secuencia_3

array([ 5,  7,  9, 11, 13, 15, 17, 19])

## Creación con una secuencia estática

**np.array(secuencia_estática)**

In [8]:
# Unidimensional
array_basico = np.array([1, 2, 3, 4, 5])
array_basico

array([1, 2, 3, 4, 5])

In [9]:
# Multidimensional
array_basico_multidimensional = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])
array_basico_multidimensional

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

# Características que definen un ndarray

- **dtype**: **Tipo de dato de los elementos** del ndarray.

- **ndim**: Número de **dimensiones/ejes del ndarray**.

- **shape**: Estructura/forma del ndarray, es decir, número de elementos en cada uno de los ejes/dimensiones (**como dimensión matricial en álgebra**).

- **size**: **Número total de elementos** en el ndarray.

In [13]:
array = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
array

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

In [11]:
# Tipo de dato (único)
array.dtype

dtype('int32')

In [12]:
# Número de dimensiones
array.ndim

2

In [14]:
# Forma/Dimensiones
array.shape

(3, 4)

In [15]:
# Número total de elementos
array.size

12

# Operaciones aritméticas entre ndarrays y escalares

**El escalar opera con todos los elementos del ndarray**

In [16]:
array = np.array([1, 2, 3, 4, 5, 6], dtype=np.float64)

In [17]:
# Suma
array + 5

array([ 6.,  7.,  8.,  9., 10., 11.])

In [18]:
# Resta
array - 2

array([-1.,  0.,  1.,  2.,  3.,  4.])

In [19]:
# Multiplicación
array * 3

array([ 3.,  6.,  9., 12., 15., 18.])

In [20]:
# División
1 / array

array([1.        , 0.5       , 0.33333333, 0.25      , 0.2       ,
       0.16666667])

In [21]:
# División entera
array // 2

array([0., 1., 1., 2., 2., 3.])

In [22]:
# Potencia
array ** 2

array([ 1.,  4.,  9., 16., 25., 36.])

# Operaciones aritméticas entre ndarrays

**Los dos ndarrays deben tener las mismas dimensiones y forma**.
(existe el **concepto de broadcasting** que, bajo ciertas circunstancias, puede modificar la dimensión de uno de los elementos para hacer congruente la operación. Sin embargo, como se comentaba en la definición del número de elementos de un ndarray, aquí también es aconsejable mantener el control de las dimensiones de las matrices para evitar posibles cálculos y resultados no deseados)

**La operación se aplica elemento a elemento.** 

In [23]:
array = np.array([1, 2, 3, 4, 5, 6], dtype=np.float64)
array

array([1., 2., 3., 4., 5., 6.])

In [24]:
# Suma (elemento a elemento)
array + array

array([ 2.,  4.,  6.,  8., 10., 12.])

In [25]:
# Resta (elemento a elmento)
array - array

array([0., 0., 0., 0., 0., 0.])

In [26]:
# Multiplicación (elemento a elmento)
array * array

array([ 1.,  4.,  9., 16., 25., 36.])

In [27]:
# División (elemento a elmento)
array / array

array([1., 1., 1., 1., 1., 1.])

In [28]:
# Suma de ndarrays de distinto tamaño
array1 = np.array([1, 2,3 ,4, 5])
array + array1

ValueError: operands could not be broadcast together with shapes (6,) (5,) 

# Indexación

## Indexación en ndarrays unidimensionales

**array[a]** Se direcciona un **elemento**

**array[a:b]** Se direcciona un **segmento** del vector

**array[a:b:salto]** Se direcciona un **segmento** del vector ([a,b]) pero **con saltos** determinados por 'salto'

**array[:-b]** Se direcciona un **segmento** del vector en sentido inverso.

In [29]:
array = np.arange(1, 11)
array

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [30]:
# Indexación con primer parámetro
array[2]

3

In [32]:
# Indexación con primer y segundo parámetro
array[2:5]

array([3, 4, 5])

In [33]:
# Indexación con tercer parámetro
array[::2]

array([1, 3, 5, 7, 9])

In [34]:
# Indexación con negativos
array[::-1]

array([10,  9,  8,  7,  6,  5,  4,  3,  2,  1])

## Indexación en ndarrays multidimensionales

**Dos** posibles **formas** de realizar el acceso:<br/>

Mediante indexación **recursiva: array[a:b:c] [a:b:c]...[a:b:c]** en dim_1, dim_2, .....

Mediante indexación con **comas: array[a:b:c,a:b:c, ...a:b:c]** en dim_1, dim_2, ..... 


In [36]:
array = np.array([[[1, 2, 3, 4], [5, 6, 7, 8]], [[9, 10, 11, 12], [13, 14, 15, 16]]])
array

array([[[ 1,  2,  3,  4],
        [ 5,  6,  7,  8]],

       [[ 9, 10, 11, 12],
        [13, 14, 15, 16]]])

In [37]:
# Forma de la matriz
array.shape

(2, 2, 4)

In [38]:
# Indexación recursiva primer nivel
array[1]

array([[ 9, 10, 11, 12],
       [13, 14, 15, 16]])

In [39]:
# Indexación recursiva segundo nivel
array[1][0]

array([ 9, 10, 11, 12])

In [40]:
# Indexación recursiva tercer nivel
array[1][0][3]

12

In [42]:
# Indexación con comas segundo nivel
array[1, 0]

array([ 9, 10, 11, 12])

In [138]:
# Indexación con comas tercer nivel
array[1, 0, 3]

12

In [186]:
# Indexación recursiva tercer nivel con slice
array[0][0][:2]

array([1, 2])

In [187]:
# Indexación recursiva tercer nivel con slice de índice negativo
array[1][0][::-1]

array([12, 11, 10,  9])

## Fancy indexing (con secuencias de enteros)

**array[[a,b,c]], a,b y c son referencias a la primera dimensión.**

**array[[a,b,c],[d,e,f]] a,b y c son referencias a la primera dimensión y d,e,f a la segunda.**


In [43]:
array = np.empty((8, 4))
for i in range(8):
    array[i] = i
array    

array([[0., 0., 0., 0.],
       [1., 1., 1., 1.],
       [2., 2., 2., 2.],
       [3., 3., 3., 3.],
       [4., 4., 4., 4.],
       [5., 5., 5., 5.],
       [6., 6., 6., 6.],
       [7., 7., 7., 7.]])

In [44]:
array.shape

(8, 4)

In [145]:
# Indexación con un conjunto (arbitrario) de elementos
array[[2, 5]] # [2,5] es un set, en realidad estamos indexando primero array[2] y después array[5]


array([[2., 2., 2., 2.],
       [5., 5., 5., 5.]])

In [146]:
# Indexación con un conjunto (arbitrario) de elementos (índices negativos)
array[[-2, -5]]

array([[6., 6., 6., 6.],
       [3., 3., 3., 3.]])

In [166]:
# Indexación/slicing con una secuencia de varios niveles (elemento a elemento)
array[[1, 5, 7, 2], [0, 3, 1, 2]]  #Primera entrada seleciona fila y segunda entrada la columna dentro del vector (fila)

array([1., 5., 7., 2.])

# Modificación de un ndarray con slicing

Del mismo modo a como ocurre en Python básico, se puede utilizar la indexación/slicing para **modificar secciones del contenido de un ndarray**.

In [45]:
array = np.array([[1, 2, 3, 4],[5, 6, 7, 8]])
array

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [58]:
# Modificación de una posición
array[0][1] = 50
array

array([[ 1, 50,  3,  4],
       [ 5,  6,  7,  8]])

In [191]:
# Modificación de un slice
array[0][::2] = 30
array

array([[30, 50, 30,  4],
       [ 5,  6,  7,  8]])

# Filtros

## Selección con filtros

In [46]:
datos = np.random.randn(4, 4) # Valores aleatorios según distribución normal estándar.
datos

array([[ 0.59027691, -1.04978276, -0.97004303,  1.24247569],
       [ 0.91737593, -1.64617687, -0.38300603, -0.36418897],
       [ 0.81960594, -1.28932227, -0.7199263 ,  0.09839805],
       [ 0.30085718,  0.17960408,  1.4843223 ,  0.16119963]])

In [47]:
# Filtro
datos[datos < 0]

array([-1.04978276, -0.97004303, -1.64617687, -0.38300603, -0.36418897,
       -1.28932227, -0.7199263 ])

In [48]:
personas = np.array(['Miguel', 'Pedro', 'Juan', 'Miguel'])
personas

array(['Miguel', 'Pedro', 'Juan', 'Miguel'], dtype='<U6')

In [49]:
personas[personas=='Miguel'] #Filtro

array(['Miguel', 'Miguel'], dtype='<U6')

## Modificación de matrices usando filtros

In [50]:
array = np.random.randn(7, 4)
array

array([[-0.94980012, -0.58468086, -0.79324952, -1.7541171 ],
       [ 0.87552599,  1.03453192, -0.06389733,  0.04587848],
       [ 0.94072132,  1.30346163, -0.7832257 ,  0.40753669],
       [ 0.38369387,  0.50247546, -1.3804124 , -1.37755969],
       [-0.14426789, -0.54737426,  0.73117845, -0.14892715],
       [ 0.4859368 , -1.23997947,  0.8062052 , -0.29315534],
       [-0.11841661,  1.76460595, -0.56973625, -1.67545084]])

In [51]:
# Eliminación de valores negativos mediante un filtro
array[array < 0] = 0 #Solo se asigna el valor cero a aquellos valores que cumplen el filtro.
array

array([[0.        , 0.        , 0.        , 0.        ],
       [0.87552599, 1.03453192, 0.        , 0.04587848],
       [0.94072132, 1.30346163, 0.        , 0.40753669],
       [0.38369387, 0.50247546, 0.        , 0.        ],
       [0.        , 0.        , 0.73117845, 0.        ],
       [0.4859368 , 0.        , 0.8062052 , 0.        ],
       [0.        , 1.76460595, 0.        , 0.        ]])

# Reshape

**La dimensión (shape) de los ndarrays se pueden modificar, aunque el número total de elementos permanece invariante**

In [52]:
array = np.arange(32)
array

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31])

In [53]:
array=array.reshape((8, 4))
array

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])

# Transposición 

In [54]:
array = np.arange(15)
array

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

In [55]:
# Modificación de ejes/dimensiones
array = array.reshape(3, 5)
array

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [56]:
array.shape

(3, 5)

In [57]:
# Trasposición de ejes/dimensiones"
array=array.T
array

array([[ 0,  5, 10],
       [ 1,  6, 11],
       [ 2,  7, 12],
       [ 3,  8, 13],
       [ 4,  9, 14]])

In [58]:
array.shape

(5, 3)

# Axis (importante en aplicación de funciones)

Valor **0**: Aplicará la función **por columnas**


Valor **1**: Aplicará la función **por filas**

In [59]:
array.sum(axis=1)

array([15, 18, 21, 24, 27])

In [60]:
array.sum(axis=0)

array([10, 35, 60])