# Medidas de distancia en datos



---



Por: Ángela Daniela Córdoba Álvarez



---

Este notebook va a tratar sobre el tema de *medidas de distancias en datos*.

In [None]:
# Cargar librerías

import math
import numpy as np
from numpy.linalg import norm

### Distancia euclidiana (manual y en Python):

In [None]:
from scipy.spatial import distance

# Manual
coordenada1 = int(input("Ingrese la coordenada x_1: "))
coordenada3 = int(input("Ingrese la coordenada y_1: "))
coordenada2 = int(input("Ingrese la coordenada x_2: "))
coordenada4 = int(input("Ingrese la coordenada y_2: "))

def distancia_euclidiana(coordenada1, coordenada2, coordenada3, coordenada4):
  return math.sqrt((coordenada1-coordenada2)**2 + (coordenada3-coordenada4)**2)

print("La distancia euclidiana calculada manualmente es: ", distancia_euclidiana(coordenada1, coordenada2, coordenada3, coordenada4))

# Python
distancia_euclidiana_python = distance.euclidean((coordenada1, coordenada3), (coordenada2, coordenada4))
print("La distancia euclidiana en Python es: ", distancia_euclidiana_python)

Ingrese la coordenada x_1: 5 
Ingrese la coordenada y_1: 9 
Ingrese la coordenada x_2: 2
Ingrese la coordenada y_2: 7
La distancia euclidiana calculada manualmente es:  3.605551275463989
La distancia euclidiana en Python es:  3.605551275463989


### Distancia de Manhattan:

In [None]:
from scipy.spatial.distance import cityblock

# Manual
def distancia_manhattan(coordenada1, coordenada2, coordenada3, coordenada4):
  return abs(coordenada1-coordenada2) + abs(coordenada3-coordenada4)

print("La distancia Manhattan manual es: ", distancia_manhattan(coordenada1, coordenada2, coordenada3, coordenada4))

# Python
distancia_manhattan_python = cityblock((coordenada1, coordenada3), (coordenada2, coordenada4))
print("La distancia Manhattan en Python es: ", distancia_manhattan_python)

La distancia Manhattan manual es:  5
La distancia Manhattan en Python es:  5


### Distancia del Coseno:

In [None]:
from scipy.spatial.distance import cosine

# Manual
def distancia_coseno(coordenada1, coordenada2, coordenada3, coordenada4):
    dot_product = coordenada1 * coordenada2 + coordenada3 * coordenada4
    norm_p = math.sqrt(coordenada1**2 + coordenada3**2)
    norm_q = math.sqrt(coordenada2**2 + coordenada4**2)
    return 1 - (dot_product / (norm_p * norm_q))

print("La distancia del coseno manual es: ", distancia_coseno(coordenada1, coordenada2, coordenada3, coordenada4))

# Python
distancia_coseno_python = cosine((coordenada1, coordenada3), (coordenada2, coordenada4))
print("La distancia del coseno en Python es: ", distancia_coseno_python)

La distancia del coseno manual es:  0.02606047119588728
La distancia del coseno en Python es:  0.02606047119588728


### Distancia de Hamming:

In [None]:
from scipy.spatial.distance import hamming

cadena1= input("Ingrese la cadena 1: ")
cadena2= input("Ingrese la cadena 2: ")

# Manual
def distancia_hamming(cadena1, cadena2):
    if len(cadena1) != len(cadena2):
        raise ValueError("Las cadenas deben tener la misma longitud")

    d = sum(1 for i in range(len(cadena1)) if cadena1[i] != cadena2[i])
    porcentaje = d / len(cadena1)

    return porcentaje

porcentaje_manual = distancia_hamming(cadena1, cadena2)
print(f"La distancia Hamming manual es = {porcentaje_manual:.2f}")

# Python
distancia_hamming_python = hamming(list(cadena1), list(cadena2))
print("La distancia Hamming en Python es: ", distancia_hamming_python)

Ingrese la cadena 1: 1 2 6
Ingrese la cadena 2: 1 7 9
La distancia Hamming manual es = 0.40
La distancia Hamming en Python es:  0.4


### Distancia de Chebyshev:

In [None]:
from scipy.spatial.distance import chebyshev

# Manual
def distancia_chebyshev(coordenada1, coordenada2, coordenada3, coordenada4):
    return max(abs(coordenada1 - coordenada2), abs(coordenada3 - coordenada4))

print("La distancia Chebyshev manual es: ", distancia_chebyshev(coordenada1, coordenada2, coordenada3, coordenada4))

# Python
distancia_chebyshev_python = chebyshev((coordenada1, coordenada3), (coordenada2, coordenada4))
print("La distancia Chebyshev en Python es: ", distancia_chebyshev_python)

La distancia Chebyshev manual es:  3
La distancia Chebyshev en Python es:  3


### Distancia de Canberra:

In [None]:
from scipy.spatial.distance import canberra

# Manual
def distancia_canberra(vector1, vector2):
    if len(vector1) != len(vector2):
        raise ValueError("Los vectores deben tener la misma longitud")

    n = len(vector1)
    distancia = sum(abs(vector1[i] - vector2[i]) / (abs(vector1[i]) + abs(vector2[i])) for i in range(n))
    return distancia

vector1 = [float(x) for x in input("Ingrese el primer vector separado por espacios: ").split()]
vector2 = [float(x) for x in input("Ingrese el segundo vector separado por espacios: ").split()]

distancia_manual = distancia_canberra(vector1, vector2)
print("La distancia de Canberra calculada manualmente es:", distancia_manual)

# Python
coordenada1 = tuple(vector1)
coordenada2 = tuple(vector2)
distancia_canberra_python = canberra(coordenada1, coordenada2)
print("La distancia de Canberra en Python utilizando scipy es:", distancia_canberra_python)


Ingrese el primer vector separado por espacios: 1 5 9
Ingrese el segundo vector separado por espacios: 2 7 8
La distancia de Canberra calculada manualmente es: 0.5588235294117647
La distancia de Canberra en Python utilizando scipy es: 0.5588235294117647


### Distancia de Jaccard:

In [None]:
from scipy.spatial.distance import jaccard
import numpy as np

# Manual
def distancia_jaccard(x1, x2):
    interseccion = sum([u and v for u, v in zip(x1, x2)])
    union = sum([u or v for u, v in zip(x1, x2)])
    distancia = 1 - (interseccion / union) if union != 0 else 0
    return distancia

conjunto1 = input("Ingrese elementos del primer conjunto separados por espacios: ").split()
conjunto2 = input("Ingrese elementos del segundo conjunto separados por espacios: ").split()

vector1 = np.array(list(map(int, conjunto1)))
vector2 = np.array(list(map(int, conjunto2)))

distancia_manual = distancia_jaccard(vector1, vector2)
print("La distancia de Jaccard calculada manualmente es:", distancia_manual)

# Python
distancia_jaccard_python = jaccard(vector1, vector2)
print("La distancia de Jaccard en Python es:", distancia_jaccard_python)


Ingrese elementos del primer conjunto separados por espacios: 1 0 1 1 1 0
Ingrese elementos del segundo conjunto separados por espacios: 0 1 1 0 1 0
La distancia de Jaccard calculada manualmente es: 0.6
La distancia de Jaccard en Python es: 0.6
