# Acceso y recorrido de arrays

El acceso a los elementos (o subarrays) de un array se realiza de forma similar a como se hace en el caso de listas, es decir, usamos la notación de corchetes. En general, la expresión entre corchetes es una tupla, donde cada elemento de la tupla impone las condiciones de selección para cada una de las dimensiones del array.

## Arrays de una dimensión

En el caso de arrays de una dimensión, es posible seleccionar elementos individauales inidicando el índice (__comenzando desde el 0__). Si queremos seleccionar una partición del array, la expresión entre corchetes es de la forma `m:n:p`. Dicha expresión selecciona elementos entre las posiciones `m` y `n-1` con incremento `p`. Si `p` es un valor negativo, se seleccionan los elementos en orden inverso. 

A continuación mostramos algunos ejemplos. Partimos de un array de una dimensión que contiene elementos entre el 3 y el 11:

In [1]:
import numpy as np     

In [4]:
arr = np.arange(3,12)
arr

array([ 3,  4,  5,  6,  7,  8,  9, 10, 11])

Para seleccionar el primer elemento, el tercero y el último, escribimos lo siguiente:

In [5]:
arr[0]        

3

In [6]:
arr[2]      

5

In [7]:
arr[-1]

11

Para seleccionar un rango de elementos, por ejemplo los elementos entre el segundo y quinto elemento,  o  los tres últimos elementos, escribimos los siguiente:

In [8]:
arr[1:4]

array([4, 5, 6])

In [9]:
arr[-3:]

array([ 9, 10, 11])

Para seleccionar todos los elementos en órden inverso, o todos los elementos en orden inverso con incremento 2, escribimos lo siguiente:

In [10]:
arr[::-1]

array([11, 10,  9,  8,  7,  6,  5,  4,  3])

In [11]:
arr[::2]

array([ 3,  5,  7,  9, 11])

## Arrays multidimensionales

El acceso a los elementos de un array multidimensional se realiza aplicando a cada una de sus dimensiones, el procedimiento visto para arrays de una dimensión. 

A continuación creamos un array bidimensinal y mostramos algunos ejemplos.

In [12]:
arr = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]], dtype = 'int')
arr

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

In [13]:
e = arr[2, 0]
e

9

In [14]:
fila1 = arr[0, :]
fila1

array([1, 2, 3, 4])

Para seleccionar la segunda fila escribimos lo siguiente: 

In [15]:
arr[1,:]       

array([5, 6, 7, 8])

Para seleccionar la segunda columna:

In [16]:
arr[:,1]     

array([ 2,  6, 10])

Para seleccionar el subarray resultado de eliminar la primera columna y la última fila escribimos lo siguiente:

In [17]:
arr[:2, 2:]   

array([[3, 4],
       [7, 8]])

Una diferencia importante con respecto a las listas, es que las particiones de un array en NumPy mediante la notación `m:n:p` son __vistas del array original__. Todos los cambios realizados en las vistas, afectan al array original. En el siguiente ejemplo creamos un array `a` mediante el rango de valores entre 1 y 10. Posteriormente creamos el array `b` a partir de `a`:

In [18]:
a = np.arange(1, 11)
a

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [19]:
b = a[:4]
b

array([1, 2, 3, 4])

Los elementos en el array `b` no son una copia de los cuatro primeros elementos de `a`, sino que ambos arrays hacen referencia a los mismos elementos en memoria, lo que implica que todos los cambios en `b` afectan también al array `a`:

In [20]:
b[::] = 0
a

array([ 0,  0,  0,  0,  5,  6,  7,  8,  9, 10])

In [21]:
a[2] = 7
b

array([0, 0, 7, 0])

Hay que recordar que NumPy ha sido diseñado para manejar grandes cantidades de datos y este comportamiento evita problemas de memoria. En cualquier caso, si es necesario realizar la copia de un array o de partes de él, podemos usar la función  `np.copy`:

In [22]:
c = np.copy(a[5:])
c

array([ 6,  7,  8,  9, 10])

En este caso, los cambios en el array `c` no tienen efecto en el array `a`:

In [23]:
c[:] = 1
c

array([1, 1, 1, 1, 1])

In [24]:
a

array([ 0,  0,  7,  0,  5,  6,  7,  8,  9, 10])

## Selección mediante filtros

Otra forma de seleccionar partes de un array es mediante el uso de arrays de elementos de tipo `bool`. En este caso, cada elemento del array (con valores `True` o `False`) indica si el elemento del array original con el mismo índice, se selecciona o no. 

Veamos un ejemplo de selección de valores mediante filtros:

In [25]:
importes = np.array([1500, 3000, 400, 34, 330, 2300])
importes

array([1500, 3000,  400,   34,  330, 2300])

__Ejemplo1:__

In [26]:
# sleccionar los importes mayores de 1000
# paso 1: crear el filtro
filtro1 = importes > 1000
# paso 2 : aplicar el filtro con [ ]
resultado = importes[filtro1]
resultado

array([1500, 3000, 2300])

__Ejemplo2:__

In [27]:
# selecionar los mayores de 1000 y menores de 2000   (and &)
# Paso 1: Crear los filtros
f1 = importes > 1000
f2 = importes < 2000
# Paso 2: Aplicar los filtros con [ ]
resultado = importes[ f1 & f2 ]     # and
resultado

array([1500])

__Ejemplo3:__

In [23]:
# seleccionar los mayores de 1000 o menores de 100    (or |)
filtro1= importes > 1000
filtro2= importes < 100

resultado = importes[filtro1 | filtro2]
resultado

array([1500, 3000,   34, 2300])

## Manipular la forma de un array

Cuando trabajamos con arrays de datos, puede ser útil modificar la forma de un array sin cambiar los datos que contiene. Por ejemplo, un array de 2 filas y 2 columnas se puede transformar en un array unidimensional de 4 elementos. En NumPy,  la función `np.reshape`  permite cambiar las dimensiones de un array sin modificar los datos que contiene. Veamos un ejemplo:


In [27]:
arr = np.array([[2,4,6],[1,2,3]], dtype = 'int')
arr

array([[2, 4, 6],
       [1, 2, 3]])

In [28]:
np.reshape(arr, 6)       # función reshape definida en el módulo Numpy

array([2, 4, 6, 1, 2, 3])

Esta operación también se encuentra definida como una operación de los arrays, por lo que también puede invocarse sobre una variable de tipo array sando la notación punto `. `, seguido del nombre de la operación:

In [29]:
arr.reshape(6)          # operación (o método) reshape definida para ser ejecutada sobre un array

array([2, 4, 6, 1, 2, 3])

La función `np.reshape` recibe como argumentos un array y la nueva dimensión. Por supuesto, es necesario que la dimensión del array sea compatible con el número de elementos del array.

In [30]:
np.reshape(arr,(3,2))

array([[2, 4],
       [6, 1],
       [2, 3]])

Un caso particular de la función `np.reshape` es la función `np.ravel` (y la correspondiente operación  `ravel` de los arrays) que premite transformar un array multidimensional en un array de una dimensión con tantos elementos como el array original.   

In [31]:
m = np.array([[2,4,6],[1,2,3]], dtype = 'int')
m

array([[2, 4, 6],
       [1, 2, 3]])

In [32]:
m.ravel() # operación (o método) ravel definida para ser ejecutada sobre un array

array([2, 4, 6, 1, 2, 3])

In [33]:
np.ravel(arr)  # función ravel definida en el módulo Numpy

array([2, 4, 6, 1, 2, 3])

Hay que tener en cuenta que las funciones `np.reshape` y `np.ravel` devuelven como resultado una vista del array original, mientras que la función `np.flatten` devuelve una copia. 

In [34]:
t = m.flatten()
t

array([2, 4, 6, 1, 2, 3])

En el caso de necesitar construir un array a partir de otros arrays existentes, NumPy proporciona las funciones `np.vstack` y `np.hstack`. La función `np.vstack` permite concatenar una secuencia de arrays verticalmente, mientras que la función `np.vstack` lo hace horizontalmente. Para que ambas operaciones tengan éxito, las dimensiones de los arrays involucrados han de ser compatibles. Veamos algunos ejemplos:


In [31]:
a = np.random.randint(0,9, (2,4))
a

array([[6, 2, 8, 6],
       [7, 0, 2, 4]])

In [32]:
b = np.random.randint(0,2 ,(2,2))
b

array([[0, 1],
       [1, 0]])

In [33]:
c = np.random.randint(5,9 ,(2,2))
c

array([[5, 6],
       [5, 5]])

Los arrays `a` y `b` pueden concatenarse  horizontalmente pero no verticalmente, mientras que los arrays `b` y `c` pueden concatenarse verticalmente pero no horizontalmente.

In [34]:
np.hstack((a,b))

array([[6, 2, 8, 6, 0, 1],
       [7, 0, 2, 4, 1, 0]])

In [39]:
np.vstack((b,c))


array([[1, 1],
       [0, 1],
       [8, 5],
       [5, 8]])

El número de elementos del array no puede cambiar una vez ha sido creado. Para insertar y eliminar elementos de un array, NumPy proporciona las funciones `np.insert`, `np.append` y `np.delete`. Todas ellas devuelven una copia del array original. 

## Referencias

[Big Data. Análisis de datos con Python. Sarasa Cabezuelo, Antonio; García Ruiz, Yolanda
Aditorial Garceta. ISBN: 978-84-1622-883-6](http://www.garceta.es/libro.php?ISBN=978-84-1622-883-6)

Libro del autor de NumPy:  http://csc.ucdavis.edu/~chaos/courses/nlp/Software/NumPyBook.pdf


-----------