## Manipulación de arrays

Además de los métodos de indexado en arrays, numpy también ofrece funcionalidad para insertar, eliminar o agregar elementos a un array. En todas estás operaciones tendremos que tener especial cuidado con las dimensiones del array. 

***
### Ejes (axis) en un array

Algunas de las operaciones en un array se hacen a través de un eje (axis) determinado del array. En un array n-dimensional la última dimension serán las columnas del array. Por ejemplo en un array bidimensional la primera dimensión serán las filas (axis=0) y la segunda las columnas (axis=1). En un array tridimensional, la primera dimensión será la profundidad (axis=0), la segunda las filas (axis=1) y la última las columnas (axis=2).

Por ejemplo para un array 2D:
- Realizar una operación a través del eje 0 implicará realizar la operación a traves de las filas, o sea, para cada columna. 
- Realizar una operación a través del eje 1 implicará realizar la operación a traves de las columnas, o sea, para cada fila. 

![](data/arr_axis.jpg)

Especificar **axis=None**, implica que la operación se realiza sobre la version **unidimensional** del array

In [None]:
# Importamos los módulos necesarios
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# Crea un array de (3, 3) con valores de 1, 2 y 3 para todos los elementos de las filas 1, 2 y 3
# Imprime el array resultante
lista = [[n+1]*3 for n in range(3)]
arr = np.array(lista)
print arr

In [None]:
# Realiza la media de todos los elementos del array
# Imprime el resutado
media = arr.mean()
print media

In [None]:
# Realiza la media para cada columna (a traves de las filas)
# Imprime el resultado
media = arr.mean(axis = 0)
print media

In [None]:
# Realiza la media para cada fila (a traves de las columnas)
media = arr.mean(axis = 1)
print media

In [None]:
# Crea un array de (2, 3, 4) con valores enteros aleatorios entre [0, 10)
# Imprime el array resultante
np.random.seed(111) # Usamos una semilla para que todos obtengamos los mismos valores
arr = np.random.randint(0, 10, (2, 3, 4))
print arr

In [None]:
# Suma todos los elementos del array
# Imprime el resultado
suma = arr.sum()
print suma

In [None]:
# Suma los elementos del array a través de su primer eje (axis=0)
# Suma los elementos del array a través de su primer eje (axis=1)
# Suma los elementos del array a través de su primer eje (axis=2)
# Imprime los arrays resultantes
suma0 = arr.sum(axis=0)
suma1 = arr.sum(axis=1)
suma2 = arr.sum(axis=2)
print suma0
print "-"*15
print suma1
print "-"*15
print suma2

***
### Dimensiones de un array
Algunas de las operaciones de concatenación, insertar o añadir valores, requieren que los arrays tengan el mismo número de dimensiones y formas compatibles.

In [None]:
# Crea un array unidimensional con 10 valores consecutivos de [0, 9)
# A partir del primer array, crea un segundo array de (10, 1)
# A partir del primer array, crea un segundo array de (1, 10)
# Imprime los tres arrays, su número de dimensiones y sus dimensiones
arr1 = np.arange(10)
arr2 = arr1.reshape((10, 1))
arr3 = arr1.reshape((1, 10))

for idx, arr in enumerate((arr1, arr2, arr3)):
    print "Array {0}".format(idx)
    print arr
    print arr.ndim
    print arr.shape
    print "-" * 20

***
### Intercambio de las dimensiones de un array (traspuesta de un array)

Tenemos dos opciones principales para transponer un array:
1. La propiedad **array.T**, devuelve un array con las dimensiones intercambiadas (su traspuesta)
2. El método **array.transpose()**, devuelve un array con las dimensiones intercambiadas (su traspuesta)

Ambos arrays son "vistas" del array original *(comparten memoria con el array inicial)*

In [None]:
# Crea dos listas x e y con valores aleatorios entre 0 y 10
x = [np.random.randint(0, 10) for n in range(10)]
y = [np.random.randint(0, 10) for n in range(10)]

# Crea un array de (10, 2) con los valores creados
# Imprime el array resultante
arr = np.array((x, y))
print arr

In [None]:
# Crea un array transponiendo el array anterior
# Crea un segundo array de (10, 2) mediante el método reshape
# Imprime los dos arrays y observa las diferencias
print "\nTRANSPONEMOS EL ARRAY\n" + "-"*22
arr1 = arr.T
print arr1

print "\nMETODO RESHAPE\n" + "-"*22
print arr.reshape((10,2))

***
### Iterar los elementos de un array

La iteración en un array multidimensional se realiza **a lo largo de su primer eje (axis=0)**. Para iterar todos los elementos de un array, podemos hacerlo sobre su versión unidimensional. Esta versión 1D se puede conseguir con la función ravel de numpy, el método flatten, o utilizando la propiedad reshape(-1)

> `numpy.ravel(arr, order='C')`

> Función de numpy que devuelve una versión unidimensional del array 'arr'. El párametro order, puede ser 'C' (defecto) o 'F', para devovler los elementos ordenados según las columnas o según las filas

***
> `array.flatten(order='C')`

> Método de un array que devuelve un array unidimensional. El párametro order, puede ser 'C' (defecto) o 'F', para devovler los elementos ordenados según las columnas o según las filas

***
> `array.reshape(-1)`

>Este método devuelve una **vista unidimensional** del array (se comparte memoria con el array original)


In [None]:
# Crea un array unidimensional con 5 valores consecutivos entre [0, 5)
# Itera los elementos del array e imprime cada iteración
arr = np.arange(5)
for elemento in arr:
    print elemento

In [None]:
# Crea un array de (2, 6) con valores consecutivos entre [10, 21]
# Itera los elementos de este array e imprime cada iteración
arr = np.arange(10, 22).reshape(2, 6)
for elemento in arr:
    print elemento

In [None]:
# Crea un array de (2, 3, 7) con numeros aleatorios entre [0, 10)
# Imprime el array resultante
# Itera los elementos de este array e imprime cada iteración 
# Itera los elemento de un array 3-D (la iteración se hace para su primer eje)
np.random.seed(1111)
arr = np.random.randint(0,10,(2,3,7))
print arr
print "=" * 25
for elemento in arr:
    print elemento
    print "-" * 25

***
### numpy.unravel_index
> `numpy.unravel_index(index, shape, order='C')`

> Función de numpy que devuelve los índices de las dimensiones de shape, a partir de un índice de la versión unidimensional del array
>- *index*: Índice (o lista de índices) de la versión unidimensional del array
>- *shape*: Tupla con la forma del array</li>
>- *order*: Especifica si "aplanamiento" fue en función de columnas ("C") o filas ("F")





In [None]:
# Itera todos los elementos del array anterior
# Obten las posiciones de los valores pares mayores o iguales que 6
# Imprime los valores y las posiciones
posiciones = []
ind = 0
for elemento in arr.ravel():
    if elemento >= 6 and elemento%2==0:
        posiciones.append(ind)
    ind += 1
pos = np.unravel_index(posiciones, arr.shape)
print arr[pos]
print pos

In [None]:
# Repite la operación anterior
# Pero ahora cambia los valores pares mayores de 6 por 0
ind = 0
for elemento in arr.ravel():
    if elemento % 2 == 0 and elemento >= 6:
        pos = np.unravel_index(ind, arr.shape)
        arr[pos] = 0
    ind += 1    

print arr

***
### 1. Agregar elementos en un array

#### numpy.append

> `numpy.append(arr, values, axis=None)`

>Agrega elementos al final de un array a lo largo del eje establecido por axis. Si axis no se especifica (axis = None), se agregan elementos a una version unidimensional del array. Los valores a agregar tienen que tener la forma correcta. Esta función **retorna un array** con los elementos agregados

>- *arr*: Array de entrada
>- *values*: Valores a agregar. Array con las mismas dimensiones que arr (excepto en eje donde se agregan los datos).
>- *axis*: Eje donde se agregarán los valores

In [None]:
# Crea un array de (4, 3) con numeros consecutivos
# Imprime el array y sus dimensiones
arr = np.arange(12).reshape((4,3))
print arr
print arr.shape

In [None]:
# Añade los valores [5, 5, 5] al final del array sin especificar el eje
# Imprime el array resultante
valores = np.array([5, 5, 5])
res = np.append(arr, valores)
print res

In [None]:
# Añade los valores [5, 5, 5] al final del array especificando el eje 0
# Ten en cuenta que las dimensiones deben de ser compatibles
# Imprime el array resultante
valores = np.array([5, 5, 5]).reshape(1, 3)
res = np.append(arr, valores, axis=0)
print res

In [None]:
# Añade los valores [5, 5, 5, 5] al final del array especificando el eje 1
# Ten en cuenta que las dimensiones deben de ser compatibles
# Imprime el array resultante
valores = np.array([5, 5, 5, 5]).reshape(4, 1)
res = np.append(arr, valores, axis=1)
print res

***
### 2. Insertar elementos en un array
#### numpy.insert
>`numpy.insert(arr, obj, values, axis=None)`

>Inserta elementos en una posición concreta de un array (especificada por obj) en el eje establecido por axis. Si axis no se especifica (axis = None), se insertan elementos a una version unidimensional del array. Los valores a agregar tienen que tener la forma correcta. Esta función **retorna un array** con los elementos insertados
>- *arr*: Array de entrada
>- *obj*: Objeto que especifica el índice antes del cual los elementos de values van a ser insertados<
>- *values*: Valores a insertar. Debe de ser un array con las **mismas dimensiones que arr**. Las dimensiones de los valores a insertar deben de ser correctas.
>- *axis*: Eje donde se agregarán los valores

In [None]:
# Crea un array de (2, 7) con numeros consecutivos
# Imprime el array y sus dimensiones
arr = np.arange(14).reshape((2, 7))
print arr
print arr.shape

In [None]:
# Inserta dos columnas con valores de 88 y 99 despues de la 3ª columna
# Imprime el resultado
valores = np.array([88, 88, 99, 99]).reshape(2,2)
res = np.insert(arr, 2, valores, axis=1)
print res

In [None]:
# Inserta una fila con valores de 88 en la primera posición del array
# Imprime el resultado
valores = np.array([99]*7).reshape(1,7)
res = np.insert(arr, 0, valores, axis=0)
print res

In [None]:
# Inserta dos columnas con valores de 88 en la primera, tercera y quinta columna
# Imprime el resultado
valores = np.array([88, 88]).reshape(2, 1)
res = np.insert(arr, (0, 2, 3), valores, axis = 1)
print res

***
### 3. Eliminar elementos en un array
#### numpy.delete
>`numpy.delete(arr, obj, axis=None)`

>Elimina elementos de un array de una posición concreta (especificada por obj) en el eje establecido por axis. Si axis no se especifica (axis = None), se insertan elementos a una version unidimensional del array. Esta función **retorna un array** con los elementos eliminados

>- *arr*: Array de entrada
>- *obj*: Objeto que especifica el índice antes del cual los elementos de values van a ser insertados
>- *axis*: Eje donde se agregarán los valores

In [None]:
# Crea un array (4, 4) con enteros aleatorios de 0 a 10
np.random.seed(1111)
arr = np.random.randint(0, 10, (4,4))
print arr

In [None]:
# Elimina la segunda columna
# Imprime el array original y el array con la columna eliminada
res = np.delete(arr, 1, axis = 1)
print res
print arr

In [None]:
# Elimina la tercera fila
# Imprime el resultado
res = np.delete(arr, 2, axis = 0)
print res

In [None]:
# Elimina las filas 0 y 3
# Imprime el resultado
res = np.delete(arr, (0, 3), axis = 0)
print res

***
### 4. Concatenar arrays
#### numpy.concatenate
>`numpy.concatenate((a1, a2, a3,...), axis=None)`

>Concatena una secuencia de arrays a1, a2, a3 ... según el eje especificado por axis. Si no se especifica eje (axis = 0), la concatenación se hace para las versiones 1D de los arrays

In [None]:
# Crea un array de tipo entero con 10 coordenadas x e y aleatorias entre 0 y 100
# Crea un segundo array de tipo entero con 10 valores de elevación entre 650 y 800
# Concatena ambos arrays para tener un array de (10, 3)
np.random.seed(12345)
xy_values = np.random.randint(0, 100, (10,2))
z_values = np.random.randint(650, 800, (10,1))
datos = np.concatenate((xy_values, z_values), axis = 1)
print datos

In [None]:
# Añade los dos siguientes datos al array anterior (usa concatenate)
# dato --> [30, 40, 790]
# dato --> [70, 20, 640]
# Imprime el resultados
dato1 = np.array([30, 40, 790]).reshape(1, 3)
dato2 = np.array([70, 20, 640]).reshape(1, 3)
res = np.concatenate((datos, dato1, dato2), axis = 0)
print res

***
### 5. Unir arrays

Para unir arrays tenemos varias funciones:

>`numpy.stack((a1, a2, a3,...), axis=0)`

> Une diferentes arrays a lo largo de un nuevo eje.

***
>`numpy.vstack((a1, a2, a3,...))`

>Une diferentes arrays verticalmente. 

***
>`numpy.hstack((a1, a2, a3,...))`

> Une diferentes arrays horizontalmente

In [None]:
# Crea tres arrays de (4, 4) con valores de 1, 2 y 3
# Une los tres arrays en un array de tres dimensiones
# Imprime el resultado y sus dimensiones
arr1 = np.ones((4,4))
arr2 = np.ones((4,4))
arr3 = np.ones((4,4))
arr1.fill(1)
arr2.fill(2)
arr3.fill(3)

res = np.stack((arr1, arr2, arr3), axis=0)
print res
print res.shape

In [None]:
# Une los tres arrays verticalmente
# Imprime el resultado
res = np.vstack((arr1, arr2, arr3))
print res

In [None]:
# Une los tres arrays horizontalmente
# Imprime el resultado
res = np.hstack((arr1, arr2, arr3))
print res