![logo.png](attachment:logo.png)

#### Módulo 1: Python para la ciencia de datos

# 4. NumPy

#### Contenidos:
* [Introducción](#1)
* [Tipo ndarray](#2)
* [Creación de arrays](#3)
    * [A partir de listas](#4)
    * [Ceros, unos y rangos](#5)
    * [Números aleatorios](#6)
* [Entrada/salida](#7)
* [Operaciones algebraicas sobre matrices](#8)
* [Cambio de forma](#9)
* [Indexación](#10)
* [Operaciones sobre los elementos](#11)
    * [Vectorización de operaciones](#12)
    * [Funciones universales](#13)
    * [Agregaciones/reducciones](#14)
    * [Broadcasting](#15)
* [Concatenación de arrays](#16)
* [Vistas y copias de datos](#17)
    


# Introducción <a class="anchor" id="1"></a>
NumPy (Numerical Python) es una librería diseñada para trabajar con arrays multidimensionales. Este paquete es fundamental para la computación científica y el análisis de datos de altas prestaciones.

Sus principales características incluyen:
* el tipo ndarray, un array multidimensional rápido y eficiente en coste de almacenamiento
* funciones matemáticas implementadas para aplicar sobre arrays sin necesidad de bucles
* Lectura / escritura de arrays
* Integración de C, C++, Fortran

Para poder trabajar con este paquete es necesario importarlo (utilizamos la importación con seudónimo):

In [2]:
import numpy as np

# Tipo ndarray <a class="anchor" id="2"></a>
El objeto más importante que ofrece numpy el es tipo ndarray. Esta estructura de datos es un array multidimensional homogéneo, es decir, todos los elementos almacenados en él tienen que ser del <font color=red>**mismo tipo**</font>.
![ndarrays.PNG](attachment:ndarrays.PNG)
Estos objetos tienen varias propiedades interesantes. Las propiedades del array son accesibles como métodos del propio objeto, o como funciones del módulo
* **dtype**: tipo de los datos almacenados en el array
* **ndim**: número de dimensiones
* **shape**: número de elementos en cada dimensión. Lo devuelve en una tupla
* **size**: número de elementos en el array

Los tipos de datos de los elementos del array pueden ser:
* int (int8, int16, int32, int64)
* uint8, uint16, uint32, uint64
* float (float16, float32, float64)
* bool
* complex (complex64, complex128)

En las matrices, el eje vertical (filas) es el *axis 0* y el eje horizontal (columnas) es el *axis 1*. Conforme aumentan las dimensiones del ndarray, se van añadiendo *axis* consecutivos.

In [1]:
#Mostramos las propiedades de un array
array=np.array([[2,4,7],[1,3,8],[3,5,6],[4,2,7]])
print("Método del objeto array")
print("Tipo de datos: {}".format(array.dtype))
print("Numero de dimensiones: {}".format(array.ndim))
print("Tamaño de las dimensiones: {}".format(array.shape))
print("Numero de elementos: {}".format(array.size))
print()
print("Función del módulo numpy")
print("Numero de dimensiones: {}".format(np.ndim(array)))
print("Tamaño de las dimensiones: {}".format(np.shape(array)))

NameError: name 'np' is not defined

# Creación de arrays <a class="anchor" id="3"></a>
# A partir de listas <a class="anchor" id="4"></a>

Podemos **crear ndarrays a partir de listas**, mediante la función array:
* Si los elementos de la lista son simples, creamos un ndarray de una dimensión
* Si los elementos de la lista son listas, creamos un ndarray de dos dimensiones, donde cada lista es una fila de la matriz
* Si los elementos de la lista son listas de listas, creamos un ndarray de tres dimensiones

In [5]:
#Definimos tres ndarrays
array1=np.array([3.5,4.2,7.4])
array2=np.array([[2,4,7],[1,3,8],[3,5,6],[4,2,7]])
array3=np.array([[[5,6,5,1],[7,8,3,4]],[[3,0,9,1],[1,1,1,1]],[[3,1,2,6],[2,2,2,2]]])
print(array1)
print(array2)
print(array3)

[3.5 4.2 7.4]
[[2 4 7]
 [1 3 8]
 [3 5 6]
 [4 2 7]]
[[[5 6 5 1]
  [7 8 3 4]]

 [[3 0 9 1]
  [1 1 1 1]]

 [[3 1 2 6]
  [2 2 2 2]]]


In [6]:
#Atención a las dimensiones cuando tenemos más de dos
array3v2=np.array([[[5,3,3],[6,0,1],[5,9,2],[1,1,6]],[[7,1,1],[8,1,1],[3,1,1],[4,1,3]]])
print("Segunda versión de array3:")
print("Tipo de datos: {}".format(array3v2.dtype))
print("Numero de dimensiones: {}".format(array3v2.ndim))
print("Tamaño de las dimensiones: {}".format(array3v2.shape))

Segunda versión de array3:
Tipo de datos: int32
Numero de dimensiones: 3
Tamaño de las dimensiones: (2, 4, 3)


# Inicializados con ceros, unos o rangos <a class="anchor" id="5"></a>
Además de utilizando listas, podemos crear ndarrays de un tamaño especificado y con valores rellenados de diferentes formas:
* zeros / zeros_like
* ones / ones_like
* arange / linspace (para vectores)
* empty

La función zeros nos permite crear un array lleno de ceros de las dimensiones especificadas. Opcionalmente, podemos indicar el tipo de datos de los elementos, y si queremos que trabaje por filas (C) o por columnas (F) - nosotros siempre vamos a trabajar por filas. La dimensión puede ser un único valor para un array unidimensional, o una tupla de valores

**numpy.zeros(shape[, dtype = float, order = 'C'])**

In [None]:
#Creación de arrays mediante la función zeros
a=np.zeros(3)
b=np.zeros(3,dtype=int)
c=np.zeros((2,5))
print(a)
print(b)
print(c)

La función zeros_like nos permite crear un array de ceros cuyas dimensiones y tipo de datos coincidan con el array que le pasamos

**numpy.zeros_like(a, dtype=None, order='K', subok=True)**

In [7]:
#Creación de arrays mediante la función zeros_like
forma_base=np.array([[1,2,3],[4,5,6]])
d=np.zeros_like(forma_base)
print(d)
forma_base2=np.array([1.1,2.2,3.3])
e=np.zeros_like(forma_base2)
print(e)

[[0 0 0]
 [0 0 0]]
[0. 0. 0.]


Las funciones ones y ones_like son análogas a las anteriores, pero los arrays creados están llenos de unos.

**numpy.ones(shape, dtype = None, order = 'C')**

**numpy.ones_like(a, dtype=None, order='K', subok=True)**

In [None]:
#Creación de arrays mediante la función ones
a=np.ones(3)
b=np.ones(3,dtype=int)
c=np.ones((2,5))
print(a)
print(b)
print(c)

In [None]:
#Creación de arrays mediante la función ones_like
forma_base=np.array([[1,2,3],[4,5,6]])
d=np.ones_like(forma_base)
print(d)
forma_base2=np.array([1.1,2.2,3.3])
e=np.ones_like(forma_base2)
print(e)

Con las funciones arange, linspace y logspace podemos crear arrays unidimensionales que contengan valores en un rango dado. En la función arange debemos especificar la distancia entre un elemento y el siguiente. Es similar al range de Python, pero permite también trabajar con números reales.

**numpy.arange(start, stop, step, dtype)**

In [None]:
#Creación de arrays mediante la función arange
a=np.arange(6)
print(a)
b=np.arange(3,7)
print(b)
c=np.arange(1,100,10)
print(c)

En la función linspace debemos especificar cuántos números queremos muestrear del rango y se crean equidistantes. En linspace, el argumento endpoint es verdadero por defecto, por lo que se incluye en el array el valor stop.

**numpy.linspace(start, stop, num, endpoint, retstep, dtype)**

La función logspace es similar, pero trabaja en escala logarítmica.

**numpy.logspace(start, stop, num, endpoint, base=10.0, dtype)**

In [None]:
#Creación de arrays mediante la función linspace
d=np.linspace(10,100,10)
print(d)
e=np.linspace(10,100,10, endpoint=False)
print(e)

In [None]:
#Creación de arrays mediante la función logspace
f=np.logspace(1,5,3)
print(f)

La función empty me permite crear arrays vacíos de un tamaño especificado y del tipo de datos indicados. Cuidado, porque realmente el array no está vacío, sino que está sin inicializar.

**numpy.empty(shape, dtype = float, order = 'C')**

In [None]:
#Creación de arrays mediante la función empty
a=np.empty((2,5))
b=np.empty([3,4],dtype=int)
print(a)
print(b)

# Inicializados con números aleatorios <a class="anchor" id="6"></a>
A la hora de crear ndarrays, que podemos llenarlos de números aleatorios. Existen algunas funciones para crear números aleatorios de diferentes tipos que nos pueden resultar interesantes:
* np.random.rand: números en [0,1] según una distribución uniforme
* np.random.normal: números en [0,1] según una distribución normal
* np.random.randint: números enteros en un rango determinado

La función random.rand() recibe las dimensiones del array a crear.

**random.rand(d0, d1, ..., dn)**

La función random.normal() recibe la media y la desviación, y el tamaño del array. Por defecto, la media es 0 y la desviación 1.

**random.normal(loc=0.0, scale=1.0, size=None)**

La función random.randint() recibe los extremos del intervalo semicerrado en el que genera los números [low, high) y el tamaño del array. Si no se pasa valor superior, entonces el intervalo es [0, low).

**random.randint(low, high=None, size=None, dtype=int)**

In [None]:
#Creación de arrays mediante la función random.rand
a=np.random.rand(3)
b=np.random.rand(2,6)
print(a)
print(b)

In [None]:
#Creación de arrays mediante la función random.normal
a=np.random.normal(size=1000)
print("La media es {} y la desviación {}".format(np.mean(a),np.std(a)))
b=np.random.normal(10,3,1000)
print("La media es {} y la desviación {}".format(np.mean(b),np.std(b)))

Además, podemos fijar la semilla a la hora de generar números aleatorios. Este paso es muy importante a la hora de realizar nuestros experimentos, para que éstos sean reproducibles.
* np.random.seed: fijar la semilla en la generación de números aleatorios

In [None]:
#Obtengo dos veces, 8 números aleatorios entre 5 (incluido) y 50 (excluido)
print(np.random.randint(5,50,8))
print(np.random.randint(5,50,8))
#Si fijo la semilla, puedo repetir la generación de los mismos números aleatorios
np.random.seed(321)
print(np.random.randint(5,50,8))
np.random.seed(321)
print(np.random.randint(5,50,8))

# Entrada / salida <a class="anchor" id="7"></a>

Desde numpy, también podemos trabajar con ficheros de texto. Para leer los datos e importarlos directamente a un ndarray, utilizamos la función loadtxt(). Para guardar nuestro array en un fichero de texto, utilizamos la función savetxt().

**np.loadtext('nombre_fichero', delimiter = ',')**

**np.savetext('nombre_fichero', array)**

# Operaciones algebraicas sobre matrices <a class="anchor" id="8"></a>

Cuando tenemos arrays de 2 dimensiones (matrices), podemos realizar mediante numpy las operaciones básicas algebraicas sobre matrices:
![operacionesAlgebraicas.PNG](attachment:operacionesAlgebraicas.PNG)

In [None]:
#Multiplicación de dos matrices (de manera algebraica, no elemento a elemento)
m1=np.array([[1,2,3],[4,5,6]])
m2=np.array([[1,2],[3,4],[5,6]])
mult=np.dot(m1,m2)
print(mult) 

# Cambio de forma <a class="anchor" id="9"></a>

Una vez que tenemos un array, podemos cambiar sus dimensiones de diferentes formas.

Podemos **transponer** la matriz, de tal forma que el nuevo número de filas será igual al número de columnas antiguo y el nuevo número de columnas será igual que el número de filas antiguo. Los números almacenados en la matriz también se transponen. El calcular la transpuesta no modifica la matriz. Sin embargo, este método devuelve una vista de los datos, por lo que los cambios que hagamos sobre la transpuesta se hacen sobre la matriz original.

In [None]:
#Transponer una matriz
a=np.array([[1,2,3],[4,5,6]])
print(a)
a.T
print(a)
b=a.T
print(b)

In [None]:
b[0,0]=100
print(a)
print(b)

También podemos cambiar las dimensiones del array (siempre que el número de elementos sea adecuado) sin necesidad de copiar los datos que tenemos almacenados, lo que hace que sea una operación muy rápida incluso con matrices grandes. Para ello, utilizamos los métodos reshape() y resize(). El método reshape() no modifica el array mientras que el método resize() sí lo hace, si se llama como método de la variable ndarray

**reshape(a, newshape, order='C')**

**resize(a, new_shape)**

In [None]:
#Cambiar las dimensiones con reshape()
a=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
print(a.reshape((2,6)))
print(np.reshape(a,(2,6)))
print(a)

In [None]:
#Cambiar las dimensiones con resize()
a=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
a.resize((2,6))
print(a)
b=np.resize(a,(6,2))
print(b)
print(a)

Puedo "aplanar" arrays multidimensionales y convertirlos en vectores, manteniendo todos los elementos que estaban almacenados. Para ello utilizo las funciones flatten() y ravel(). 

* **flatten()** es un método del ndarray. Devuelve una copia, por lo que los cambios hechos sobre ella no afectan al array original
* **ravel()** es una función de numpy. Devuelve una vista, por lo que los cambios hechos sobre ella sí afectan al array original. 

In [None]:
#"Aplanar" un array mediante flatten()
a=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
b=a.flatten()
print(a)
print(b)
#Cambiamos el valor del primer valor (vemos más adelante cómo se hace)
b[0]=100
print(a)
print(b)

In [None]:
#"Aplanar" un array mediante ravel()
a=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
b=a.ravel()
c=np.ravel(a)
print(a)
print(b)
print(c)
#Cambiamos el valor del primer valor (vemos más adelante cómo se hace)
b[0]=100
print(a)
print(b)
print(c)

# Indexación <a class="anchor" id="10"></a>
Podemos acceder y modificar (los arrays son mutables) solo algunos elementos del array. Para ello, utilizamos los índices del elemento en las n dimensiones. Los índices en cada una de las dimensiones comienzan a numerarse desde 0.

**Arrays unidimensionales**
* Para acceder a un elemento de un array unidimensional, escribimos entre cochetes su índice. 
* Al igual que en las listas de Python, los índices negativos cuentan desde el final del array
* Si queremos acceder a varios elementos consecutivos, podemos indicar el índice del primer y el último elemento separados por el símbolo de dos puntos(:). 
* Si queremos acceder a todos los elementos desde el principio hasta un índice dado, podemos eliminar el cero y escribir solo [:indice]. 
* De forma similar, si queremos acceder a todos los elementos desde un índice hasta el final, basta con escribir [indice:].
* Si a una porción del vector le asigno un único valor, éste sobreescribe cada uno de los valores de ese subvector

In [None]:
#Acceso a elementos de un array unidimensional
v=np.array([0,1,2,3,4,5,6,7,8,9])
print(v[3])
print(v[-1])
print(v[3:5])
print(v[0:4])
print(v[:4])
print(v[7:10]) #Si escribo el final, necesito poner la siguiente posición al último
print(v[7:])

In [None]:
#Modificación de elementos de un array unidimensional
v=np.array([0,1,2,3,4,5,6,7,8,9])
v[1]=11
v[3:5]=[13,14]
v[7:]=20
print(v)

**Arrays de más de una dimensión**

* Para acceder a un elemento tengo que indicar su índice correspondiente en cada dimensión entre corchetes. Puedo hacerlo con un corchete para cada dimensión o con un único corchete y los índices separados por comas (m[1,2] = m[1][2]).
* Para acceder a un subarray, indico el rango de cada uno de los elementos en cada dimensión
* Para acceder a todos los elementos en una dimensión, pongo [:]
* Para acceder a uno de cada x elementos, escribo [ : : x]

In [None]:
#Acceso a elementos de un array bidimensional
m=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12],[13,14,15]])
print(m[0,0])
print(m[1][1])
print(m[0:2,1:2])
print(m[0,1:])
print(m[0,:])
print(m[::2,:])
#Modificación de elementos de un array bidimensional
m[0,0]=100
m[0][1:]=[101,102]
m[3:,1:]=500
print(m)

Cuando solo indico una dimensión, si en el array existen más dimensiones se tratan todos los elementos de esas dimensiones.
* Si indico un índice en un vector, obtengo un elemento
* Si indico un índice en una matriz, ontengo todos los elementos de una fila

In [None]:
#Acceso a elementos indicando solo una dimensión
v=np.array([0,1,2,3,4,5,6,7,8,9])
m=np.array([[1,2,3],[4,5,6],[7,8,9]])
print(v[0])
print(m[0])

Hay que tener cuidado con las indexaciones sobre los arrays. Todas las formas de indexar que hemos visto hasta ahora crean <font color=red>**vistas**</font> del array original. Por ello, cualquier cambio que hagamos en nuevas variables obtenidas mediante esta indexación también afectan al array original.

In [None]:
#Modificación sobre vistas de un array
m=np.array([[1,2,3,4,5,6],[11,12,13,14,15,16],[21,22,23,24,25,26],[31,32,33,34,35,36]])
impares=m[:,::2]
pares=m[:,1::2]
print(impares)
print(pares)
impares[0,:]=impares[0,:]+2
pares[1,:]=pares[1,:]+5
print("Nuevos impares")
print(impares)
print("Nuevos pares")
print(pares)
print("Matriz original")
print(m)

**Indexación booleana**

Podemos acceder a los elementos de un array que cumplen una determinada condición. 

Si aplicamos una comparación a un ndarray obtenemos otro ndarray de las mismas dimensiones pero con valores verdadero y falso: verdader donde se cumple la condición y falso donde no.

Podemos utilizar este ndarray de verdaderos y falsos como índice, para acceder (o modificar) solo los vaores del array que cumplan esa condición. Si accedemos a los elementos que cumplen una condición y los queremos guardar/imprimir, éstos se almacenarán como un vector, ya que no tienen por qué mantener la estructura original.

Si necesitamos concatenar condiciones, lo podemos hacer mediante las operaciones lógicas de numpy (numpy.logical_and, numpy.logical_or).

In [None]:
#Condiciones sobre ndarrays
v=np.array([1,5,3,3,8,2,3,6,9])
treses=v==3
print(treses)
menor5=v<5
print(menor5)
pares=v%2==0
print(pares)

In [None]:
#Acceso a elementos que cumplen una condición
m=np.array([[1,2,3],[4,5,6],[7,8,9]])
print(m[m>5])

In [None]:
#Modificación de elementos que cumplen una condición
m=np.array([[1,2,3],[4,5,6],[7,8,9]])
m[m%2==0]=0
print(m)

In [None]:
#Modificación de elementos que cumplen dos codiciones
m=np.array([[1,2,3],[4,5,6],[7,8,9]])
m[np.logical_and(m%2==0, m>5)]=m[np.logical_and(m%2==0, m>5)]+100
print(m)

**Fancy indexing**

Podemos indexar matrices a partir de arrays. En este caso, el resultado obtenido es una copia, por lo que las modificaciones no afectan a la matriz original.

In [None]:
#Indexación mediante arrays
m=np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]])
aux1=m[[1,3]] #Matriz con las filas 1 y 3
aux2=m[:,[1,3]] #Matriz con las columnas 1 y 3
aux3=m[[0,2],[1,3]] #Matriz con los elementos [0,1] y [2,3]
print(aux1)
print(aux2)
print(aux3)
aux3[:]=100
print(aux3)
print(m)

# Operaciones sobre los elementos <a class="anchor" id="11"></a>
# Vectorización <a class="anchor" id="12"></a>

Una de las grandes ventajas de los ndarrays es que podemos trabajar con todos los elementos del array sin necesidad de utilizar bucles.

**Operaciones elemento a elemento**

* Si hacemos una operación entre un ndarray y en escalar, esta operación se lleva a cabo sobre cada uno de los elementos del array y el escalar.
* Cuando hacemos una operación entre dos ndarrays de las mismas dimensiones, la operación se ejecuta sobre cada elemento del primer ndarray con el elemento del segundo ndarray en la misma posición.

In [None]:
#Operación entre un array y un escalar
v=np.array([1,2,3,4])
masUno=v+1
print(masUno)

In [None]:
#Operación entre dos ndarrays de las mismas dimensiones
m1=np.array([[1,2,3],[4,5,6]])
m2=np.array([[1,1,2],[3,3,4]])
suma=m1+m2
print(suma)

# Funciones universales <a class="anchor" id="13"></a>

Son funciones que se aplican elemento a elemento en un ndarray. Pueden ser tanto funciones unitarias como binarias.

Toman como argumento uno o dos escalares / vectores / matrices / hipermatrices y devuelven un escalar / vector / matriz / hipermatriz.

Funciones unitarias:
![funcionesUnitarias.PNG](attachment:funcionesUnitarias.PNG)

Funciones binarias:
![funcionesBinarias.PNG](attachment:funcionesBinarias.PNG)

In [None]:
#Funciones universales unitarias
v=np.array([1,2,3,4,5,6])
print(np.square(v))
print(np.sign(v))
print(np.log(v))

In [None]:
#Funciones universales binarias
m1=np.array([[5,8],[6,16]])
m2=np.array([[2,3],[3,4]])
print(np.add(m1,m2))
print(np.maximum(m1,m2))
print(np.mod(m1,m2))

# Agregaciones / reducciones <a class="anchor" id="14"></a>

También podemos operar sobre todos los elementos del array:
* np.sum(x): suma todos los elementos
* np.mean(x): calcula la media aritmética
* np.std(x): calcula la desviación estándar
* np.var(x): calcula la varianza
* np.min(x): devuelve el mínimo
* np.max(x): devuelve el máximo
* np.argmin(x): devuelve el índice del elemento de mínimo valor
* np.argmax(x): devuelve el índice del elemento de máximo valor
* np.cumsum(x): calcula la suma acumulada
* np.cumprod(x): calcula el producto acumulado

In [None]:
#Agregaciones o reducciones sobre una matriz
m=np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print(np.sum(m))
print(np.max(m))
print(np.argmax(m))
print(np.cumsum(m))

In [None]:
#Si quiero obtener la fila y la columna donde se encuentra el máximo, puedo usar np.where() o np.unravel_index()
[fila,columna]=np.where(m==np.max(m))
print(fila)
print(columna)

[fila,columna]=np.unravel_index(np.argmax(m),m.shape)
print(fila)
print(columna)

Estas operaciones de reducción también podemos aplicarlas solo en una dimensión del array. Para ello, le indicamos el **axis** sobre el que queremos trabajar. En matrices, si axis=0, trabajo con todos los elementos de una columna a la vez. Si axis=1, trabajo con todos los elementos de una fila a la vez.

In [None]:
#Agregaciones sobre una matriz en una única dimensión
m=[[1,2,3,4],[5,6,7,8],[9,10,11,12]]
#Axis=0 (sumo cada columna). El resultado es un vector
print(np.sum(m,axis=0))
#Axis=1 (sumo cada fila). El resultado es un vector
print(np.sum(m,axis=1))

# Broadcasting <a class="anchor" id="15"></a>

Hemos visto cómo operar con un ndarray y un escalar, o con dos ndarrays de las mismas dimensiones. Pero numpy también puede trabajar de manera efectiva con ndarrays de diferentes dimensiones, siempre que éstas seaen compatibles.

Dos arrays son compatibles para operar mediante propagación (broadcasting) si, para todas las dimensiones empezando desde la última, la longitud de la dimensión coincide o bien en alguno de los dos es 1. La propagación se hará por la dimensión que falta o bien la de dimensión 1.

In [None]:
#Suma entre una matriz de 4x3 elementos y un vector de 3 elementos 
#se suma cada fila de la matriz (3 elementos) con el vector, elemento a elemento
m=np.array([[1,1,1],[2,2,2],[3,3,3],[4,4,4]])
v=np.array([1,2,3])
suma=m+v
print(suma)

In [None]:
#Suma entre una matriz de 3x4 elementos y un vector de 3x1 elementos 
#se suma cada columna de la matriz (3 elementos) con el vector, elemento a elemento
m=np.array([[1,1,1,1],[2,2,2,2],[3,3,3,3]])
v=np.array([[1],[2],[3]])
suma=m+v
print(suma)

# Concatenación <a class="anchor" id="16"></a>
A partir de uno o varios arrays, podemos crear arrays más grandes mediante repetición o concatenación. Para ello tenemos las siguientes funciones:
* repeat: crea un vector con todos los elementos, cada uno repetido tantas veces como le indiquemos
* tile: replica el array completo tantas veces como le indiquemos (podemos replicar en varias dimensiones)
* concatenate: une dos arrays bien a la derecha o abajo (indicar con axis)
* hstack: une dos arrays a la derecha (equivalente a concatenate con axis=1)
* vstack: une dos arrays hacia abajo (equivalente a concatenate con axis=0) 

In [None]:
a=np.array([[1,2],[3,4]])
#Vector con todos los elementos de la matriz repetidos 2 veces
print("Repetir cada elemento")
print(np.repeat(a,2))
print("Replico la matriz hacia la derecha")
print(np.tile(a,2))
print("Replico la matriz hacia abajo")
print(np.tile(a,(2,1)))
print("Replico la matriz hacia la derecha y hacia abajo")
print(np.tile(a,(2,2)))

In [None]:
a=np.array([[1,2],[3,4]])
b=np.array([[5,6]])
#concateno hacia la derecha con concatenate
print(np.concatenate((a,b.T),axis=1))
#concateno hacia la derecha con hstack
print(np.hstack((a,b.T)))
#concateno hacia abajo con concatenate
print(np.concatenate((a,b),axis=0))
#concateno hacia abajo con vstack
print(np.vstack((a,b)))

# Vistas y copias de datos <a class="anchor" id="17"></a>
Como ya hemos visto anteriormente, para que numpy sea realmente rápido, las asignaciones generalmente no copian los datos de los objetos (de esta forma, también evitamos sobrecargar la memoria). Sin embargo, hay veces que necesitamos mantener los datos y, por tanto, trabajar sobre una copia. Para crear copias usamos la función **copy()**.

In [None]:
a=np.array([[1,2],[3,4]])
b=a
b[0,0]=100
print("matriz original después de cambiar la copia con igual")
print(a)
a=np.array([[1,2],[3,4]])
c=np.copy(a)
c[0,0]=100
print("matriz original después de cambiar la copia con copy")
print(a)