# repaso y motivación de arrays

**Ejercicio**. Define una función para calcular la distancia entre dos puntos de $\mathbb R ^2$ (representados mediante 2-tuplas).

In [1]:
from math import sqrt

La siguiente solución no responde del todo a la pregunta, porque las coordenadas de los puntos son argumentos individuales.

In [2]:
def distc(px,py,qx,qy):
    return sqrt( (px-qx)**2 + (py-qy)**2 )

In [3]:
distc(1,2,3,3)

2.23606797749979

Lo que queremos es guardar los puntos cada uno con su nombre:

In [4]:
p = (1,2)
q = (3,3)

In [5]:
def dist2(P,Q):
    return sqrt( (P[0]-Q[0])**2 + (P[1]-Q[1])**2 )

In [6]:
dist2(p,q)

2.23606797749979

En la definción hemos expresado la suma explícitamente, indexando los componentes.

La definición es muy poco general. Si la invocamos con puntos 3D el resultado es erróneo.

In [7]:
r = (2,5,3)
s = (0,-2,7)

In [8]:
dist2(p,r)

3.1622776601683795

Podríamos definir una distancia para puntos 3D:

In [9]:
def dist3(P,Q):
    return sqrt( (P[0]-Q[0])**2 + (P[1]-Q[1])**2 + (P[2]-Q[2])**2)

In [10]:
dist3(s,r)

8.306623862918075

Otra forma de hacerlo, "desestructurando" los argumentos:

In [11]:
def dist3(P,Q):
    px,py,pz = P
    qx,qy,qz = Q
    return sqrt( (px-qx)**2 + (py-qy)**2 + (pz-qz)**2)

In [12]:
dist3(r,s)

8.306623862918075

Por supuesto, esta última función no admite puntos 2D.

In [13]:
# dist3(p,q)

Podemos definir una función que admita puntos de dimensión arbitraria. Usando un bucle acumulador:

In [14]:
def distl(P,Q):
    s = 0
    for k in range(len(P)):
        s += (P[k]-Q[k])**2
    return sqrt(s)

In [15]:
distl(p,q)

2.23606797749979

In [16]:
distl(r,s)

8.306623862918075

O un consstructor de listas con bucle implícito (*list comprehension*).

In [17]:
def distl(P,Q):
    return sqrt( sum ( [(P[k]-Q[k])**2 for k in range(len(P))] ) )

In [18]:
distl(p,q)

2.23606797749979

In [19]:
distl(r,s)

8.306623862918075

Esto mismo se define de forma más clara mediante el emparejamiento de contenedores:

In [20]:
def distz(P,Q):
    return sqrt( sum ( [(a-b)**2 for a,b in zip(P,Q)] ) )

In [21]:
distz(p,q)

2.23606797749979

In [22]:
distz(r,s)

8.306623862918075

Los arrays nos permiten una definición más directa.

In [23]:
import numpy as np

In [24]:
p = np.array( [1,2] )
q = np.array( [3,2] )

r = np.array( [2,5,3] )
s = np.array( [0,-2,7] )

Como los arrays son contenedores, las funciones anteriores pueden trabajar con ellos:

In [25]:
distz(r,s), distz(p,q)

(8.306623862918075, 2.0)

Lo interesante es que las operaciones matemáticas se efectúan automáticamente elemento a elemento:

In [35]:
2*r-3*s

array([  4,  16, -15])

In [36]:
r**2

array([ 4, 25,  9])

De modo que podemos escribir:

In [26]:
def dist(P,Q):
    return np.sqrt( np.sum( (P-Q)**2 ) )

In [27]:
dist(r,s), dist(p,q)

(8.306623862918075, 2.0)

Funciona en cualquier dimensión:

In [28]:
u = np.array([1,2,3,4])
v = np.array([0,2,3,5])

dist(u,v)

1.4142135623730951

Esto se puede simplificar muchísimo más usando las herramientas de álgebra lineal:

In [29]:
def distn(P,Q):
    return np.linalg.norm(P-Q)

In [30]:
distn(u,v)

1.4142135623730951

Veamos como podríamos definir nosostros mismso el módulo de un vector usando las herramientas básicas de manejo de arrays:

In [31]:
def modul(P):
    return np.sqrt( np.sum( P**2 ) )

In [32]:
modul(u-v)

1.4142135623730951

In [33]:
def modul(P):
    return np.sqrt( P @ P )

In [34]:
modul(u-v)

1.4142135623730951