# Repaso y motivación de arrays

**Ejercicio**. Define una función para calcular la distancia entre dos puntos de $\mathbb R ^2$ (representados mediante 2-tuplas).

In [None]:
import numpy as np

La siguiente solución no responde del todo a la pregunta, porque las coordenadas de los puntos son argumentos individuales.

In [None]:
def dist_c(px, py, qx, qy):
    return np.sqrt( (px-qx)**2 + (py-qy)**2 )

In [None]:
dist_c(1, 2, 3, 3)

Lo que queremos es guardar los puntos cada uno con su nombre:

In [None]:
u = (1, 2)
v = (3, 3)

In [None]:
def dist2(P, Q):
    return np.sqrt( (P[0]-Q[0])**2 + (P[1]-Q[1])**2 )

In [None]:
dist2(u, v)

En la definción hemos expresado la suma explícitamente, indexando los componentes. Otra forma de hacerlo es desestructurando los argumentos:

In [None]:
def dist2_b(P, Q):
    px, py = P
    qx, qy = Q
    return np.sqrt( (px-qx)**2 + (py-qy)**2)

In [None]:
dist2_b(u,v)

El ejercicio podría darse ya por terminado.

Pero las definiciones anteriores son muy poco generales. Si las invocamos con puntos 3D el resultado es incorrecto pero no da error:

In [None]:
r = (2, 5, 3)
s = (0, -2, 7)

In [None]:
dist2(r, s)

Podríamos definir una distancia para puntos 3D:

In [None]:
def dist3(P, Q):
    return np.sqrt( (P[0]-Q[0])**2 + (P[1]-Q[1])**2 + (P[2]-Q[2])**2)

In [None]:
dist3(s, r)

Por supuesto, esta última función no admite puntos 2D.

In [None]:
# si descomentas la línea siguiente y ejecutas, dará un error "tuple index out of range"
# dist3(u,v)

Es mejor definir una función que admita puntos de cualquier dimensión. Por ejemplo, con un bucle acumulador:

In [None]:
def dist_l(P, Q):
    s = 0
    for k in range(len(P)):
        s += (P[k]-Q[k])**2
    return np.sqrt(s)

In [None]:
dist_l(u, v)

In [None]:
dist_l(r, s)

O con un bucle implícito (*list comprehension*):

In [None]:
def dist_lc(P, Q):
    return np.sqrt( sum ( [(P[k]-Q[k])**2 for k in range(len(P))] ) )

In [None]:
dist_lc(u, v)

In [None]:
dist_lc(r, s)

Esto mismo puede expresarse de forma más clara mediante el emparejamiento de contenedores con la función `zip`:

In [None]:
def dist_z(P, Q):
    return np.sqrt( sum ( [(a-b)**2 for a,b in zip(P,Q)] ) )

In [None]:
dist_z(u, v)

In [None]:
dist_z(r, s)

Como los arrays son contenedores, las funciones anteriores pueden trabajar con ellos:

In [None]:
u = np.array( [1,2] )
v = np.array( [3,2] )

r = np.array( [2,5,3] )
s = np.array( [0,-2,7] )

In [None]:
dist_z(r, s), dist_z(u, v)

Los arrays permiten una definición más simple todavía, aprovechando que con ellos las operaciones matemáticas se efectúan automáticamente elemento a elemento. Por ejemplo:

In [None]:
2*r-3*s

In [None]:
r**2

De modo que podemos escribir:

In [None]:
def dist(P, Q):
    return np.sqrt( np.sum( (P-Q)**2 ) )

In [None]:
dist(r, s), dist(u, v)

Esto funciona en cualquier dimensión:

In [None]:
x = np.array([1, 2, 3, 4])
y = np.array([0, 2, 3, 5])

dist(x ,y)

Y se puede simplificar mucho más usando las herramientas de álgebra lineal que proporciona numpy:

In [None]:
def dist_n(P, Q):
    return np.linalg.norm(P-Q)

In [None]:
dist_n(x, y)

Como ejemplo final poemos definir nosotros mismos el módulo de un vector usando las herramientas básicas de manejo de arrays:

In [None]:
def modul(P):
    return np.sqrt( np.sum( P**2 ) )

In [None]:
modul(x-y)

Lo más elegante es usar `dot`:

In [None]:
def modul_d(P):
    return np.sqrt( P @ P )

In [None]:
modul_d(x-y)