# Introducción a Numpy y algunas operaciones básicas

<img src="https://upload.wikimedia.org/wikipedia/commons/1/1a/NumPy_logo.svg" width="30%">

Numpy es una biblioteca para el lenguaje de programación Python que da soporte para crear matrices multidimensionales, junto con una gran colección de funciones de alto nivel para operar con ellas.

Su uso es muy sencillo, lo primero es convertir un vector o lista a un array numpy

In [1]:
import numpy as np

In [2]:
np.cos([2.4, 4.5])

array([-0.73739372, -0.2107958 ])

Crear un array 1-d

In [3]:
V = np.array([1,2,3,4,5], dtype=float)
V

array([1., 2., 3., 4., 5.])

In [4]:
[1, 2, 3, 4, 5]

[1, 2, 3, 4, 5]

In [5]:
type(V), type([1, 2, 3])

(numpy.ndarray, list)

Se puede acceder elemento a elemento igual que a una lista

In [6]:
V

array([1., 2., 3., 4., 5.])

In [7]:
# V.append([1,2])
V = np.concatenate((V, [1,2]))

Incluso a varios valores a la vez

In [8]:
V

array([1., 2., 3., 4., 5., 1., 2.])

In [9]:
V[2]

np.float64(3.0)

In [10]:
V[[1, 3, 4]]  # Las listas no lo permiten

array([2., 4., 5.])

In [11]:
V[1:3] # Igual las listas

array([2., 3.])

In [12]:
V[2:5]

array([3., 4., 5.])

Crear un array 1-d a partir de una lista de Python

In [13]:
L = [1, 2, 3, 4, 5, 6]

V = np.array(L)
len(V)

6

In [14]:
M1 = [[1,2,3],[4,5,6]]
M2 = np.array(M1)
M2

array([[1, 2, 3],
       [4, 5, 6]])

In [15]:
print(len(V), len(M2))

6 2


In [16]:
M2.shape, V.shape

((2, 3), (6,))

In [17]:
print("Filas: ", M2.shape[0])

Filas:  2


In [18]:
print("Columnas: ", M2.shape[1])

Columnas:  3


In [19]:
M2.sum()

np.int64(21)

In [20]:
M2

array([[1, 2, 3],
       [4, 5, 6]])

# Tipos de vector

A diferencia de las listas, un vector o matriz Numpy sólo tener valores del mismo tipo.

In [21]:
np.array([1, 2, "hola"])

array(['1', '2', 'hola'], dtype='<U21')

Normalmente de tipo numérico

In [22]:
np.array([1, 2, 3.5])

array([1. , 2. , 3.5])

Se puede indicar el tipo al construirlo, con dtype {np.int, np.float32, np.float64})

In [23]:
A=np.array(L, dtype=np.float32)
A

array([1., 2., 3., 4., 5., 6.], dtype=float32)

In [24]:
np.array([1,0, 1], dtype=int)

array([1, 0, 1])

In [25]:
np.array([1, 0, 6], dtype=np.bool)

array([ True, False,  True])

In [26]:
np.array([True, False])

array([ True, False])

In [27]:
A.tolist()

[1.0, 2.0, 3.0, 4.0, 5.0, 6.0]

# Ventaja de vector de tipo numpy

La principal ventaja es el tiempo, las operaciones en listas son muy lentas, y Numpy están implementadas eficientemente en C++. 

In [28]:
def norm1(vector):
    if len(vector)==0:
        return []
    
    maxv = minv = vector[0]
    
    for val in vector:
        if val > maxv:
            maxv = val
        elif val < minv:
            minv = val
    
    norm = len(vector)*[None]
    
    for i, val in enumerate(vector):
        norm[i] = (val-minv)/(maxv-minv)
        
    return norm    

In [29]:
# Creo un vector aleatorio
v = np.random.rand(5_000_000)*10-5
v_list = v.tolist()

In [30]:
v

array([-0.50653066,  2.25877815, -2.92453497, ...,  4.57010431,
        0.29491198, -2.24685315], shape=(5000000,))

In [31]:
%time sal1=norm1(v)

CPU times: user 1.01 s, sys: 49.7 ms, total: 1.06 s
Wall time: 1.06 s


In [32]:
np.min(sal1)

np.float64(0.0)

Lo implementamos ahora con numpy

In [33]:
def norm2(vector):
    minv = vector.min()
    maxv = vector.max()
    return (vector-minv)/(maxv-minv)

In [34]:
%time sal2=norm2(v)

CPU times: user 12.4 ms, sys: 4.07 ms, total: 16.5 ms
Wall time: 15.9 ms


In [35]:
assert np.all(sal1 == sal2)

In [36]:
np.where([True, False], [1, 2], [3, 4])

array([1, 4])

# Operaciones vectoriales

Se puede sumar, restar, dividir, ... un vector por un escalar, y hace la operación elemento a elemento.

In [37]:
A/5

array([0.2, 0.4, 0.6, 0.8, 1. , 1.2], dtype=float32)

In [38]:
np.array([1.0,2,3,4,5]) / 5

array([0.2, 0.4, 0.6, 0.8, 1. ])

También se puede operar con vectores de igual tamaño, y hace la operación elemento a elemento

In [39]:
L

[1, 2, 3, 4, 5, 6]

In [40]:
M = np.array([2, 3, 4, 5, 6, 7])

P = L * M
P

array([ 2,  6, 12, 20, 30, 42])

También posee operaciones que trabajan con todos los elementos de un vector

In [41]:
P.sum()

np.int64(112)

In [42]:
# Desordeno
np.random.shuffle(P)

In [43]:
print(P)

[20 30  6 12  2 42]


In [44]:
print(P.min(), P.max())

2 42


In [45]:
print(P.min(), np.argmin(P), P[np.argmin(P)])

2 4 2


También posee operaciones con vectores 

Producto escalar de dos vectores

In [46]:
np.dot(L, M)

np.int64(112)

# Crear un array 2-d

In [47]:
A = np.array([[1,2,3],[4,5,6],[7,8,9],[8,7,6]])
A

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9],
       [8, 7, 6]])

shape da el tamaño (filas, columnas)

In [48]:
A.shape

(4, 3)

In [49]:
A[0,1]

np.int64(2)

In [50]:
A[2,1]

np.int64(8)

In [51]:
A[[0,1], :]

array([[1, 2, 3],
       [4, 5, 6]])

También se puede acceder a una fila o columna concreta

In [52]:
A[1,:]

array([4, 5, 6])

In [53]:
A[:,1]

array([2, 5, 8, 7])

Se puede acceder a un subconjunto

In [54]:
A[1:,1:]

array([[5, 6],
       [8, 9],
       [7, 6]])

In [55]:
A[1:3,1:]

array([[5, 6],
       [8, 9]])

In [56]:
A[1:,0:2]

array([[4, 5],
       [7, 8],
       [8, 7]])

También es fácil obtener los valores que cumplen un criterio

In [57]:
V = np.array([1, 2, 3, 4, 5, 6])

In [58]:
V > 3

array([False, False, False,  True,  True,  True])

In [59]:
V[V > 3]

array([4, 5, 6])

In [60]:
Ind = (V % 2 == 0) & (V < 6)
print(Ind)
V[Ind]

[False  True False  True False False]


array([2, 4])

# Creación

Numpy posee muchos métodos de generación aleatoria, normal, ..., muy útiles.

In [61]:
np.random.randint(10)

0

In [62]:
np.random.rand(10)

array([0.05981833, 0.04680321, 0.81287097, 0.75399007, 0.24990758,
       0.7398869 , 0.4810226 , 0.5825895 , 0.2078518 , 0.73883546])

In [63]:
np.random.randint(-10, 10, 5)

array([ 2,  8,  0, -7,  8])

También hay otros métodos útiles

In [64]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [65]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [66]:
3*np.ones(10)

array([3., 3., 3., 3., 3., 3., 3., 3., 3., 3.])

In [67]:
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

# Ejercicio Numpy

1. Crear una función que calcule la distancia euclídea entre dos vectores.

In [68]:
def disteuc(vector1, vector2):
    dist = numpy.linalg.norm(vector1-vector2)
    # Poner aquí el código
    return dist

In [69]:
def test():
    assert 5 == disteuc(np.zeros(25), np.ones(25))
    assert 0 == disteuc(np.arange(30), np.arange(30))
    
test()

AssertionError: 