<a href="https://colab.research.google.com/github/CrodriguezCode/TalentoTech/blob/main/ActividadDistanciaDatos_Clustering_ipyn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Distancia euclidiana

In [None]:
# distancia entre dos puento de un espacio euclidiano
#Es la distancia entre dos puntos de un espacio euclidiano. Para
#dos puntos (x1, y1) y (x2, y2) la distancia se calcula como:
import sympy as sp
import matplotlib.pyplot as plt

x1, y1, x2, y2 = sp.symbols('x1 y1 x2 y2')
distancia = sp.sqrt((x2 - x1)**2 + (y2 - y1)**2)
sp.pprint(distancia)


   ___________________________
  ╱           2             2 
╲╱  (-x₁ + x₂)  + (-y₁ + y₂)  


In [None]:


def distancia(p1,p2):
    return ((p1[0]-p2[0])**2 + (p1[1]-p2[1])**2)**0.5
p1 = (1,2)
p2 = (3,4)
print("La distancia euclidiana entre p1 y p2 es:",distancia(p1,p2))

La distancia euclidiana entre p1 y p2 es: 2.8284271247461903


# Distancia Manhattan

In [None]:
# Distancia Manhattan:
#Esta distancia se calcula teniendo en cuenta las diferencias
#absolutas entre las coordenadas de dos puntos, es decir, se
#inspira en las ciudades que están construidas por cuadras y
#para ir de un punto a otro se debe recorrer externamente cada
#cuadra en lugar de pasar en medio de ellas (lo que se calcularía
#con la distancia euclidiana).

def distancia_manhattan(p1,p2):
    return abs(p1[0]-p2[0]) + abs(p1[1]-p2[1])

p1 = (1,2)
p2 = (3,4)
print("La distancia Manhattan entre p1 y p2 es:",distancia_manhattan(p1,p2))

La distancia Manhattan entre p1 y p2 es: 4


# Distancia de Hamming

In [None]:
# Distancia de Hamming:
#Es empleada para calcular la diferencia entre dos secuencias de
#igual longitud. Se cuenta el número de posiciones en las cuales
#los símbolos correspondientes son diferentes.

def hamming_distance(str1, str2):
  """Calcula la distancia de Hamming entre dos cadenas de igual longitud.

  Args:
    str1: La primera cadena.
    str2: La segunda cadena.

  Returns:
    La distancia de Hamming.
  """

  if len(str1) != len(str2):
    raise ValueError("Las cadenas deben tener la misma longitud.")

  return sum(c1 != c2 for c1, c2 in zip(str1, str2))

# Ejemplo de uso:
str1 = "karolin"
str2 = "kathrin"
distance = hamming_distance(str1, str2)
print(distance)  # Output: 3

3


# Distancia de Chebyshev

In [None]:
#Esta distancia se define como la mayor diferencia entre las
#coordenadas de los puntos en cada dimensión. Para dos puntos
#(x1, y1), (x2, y2) se calcula como

#max(|x1-x2|, |y1-y2|)

def distancia_chebyshev(p1,p2):
    return max(abs(p1[0]-p2[0]), abs(p1[1]-p2[1]))

p1 = (1,2)
p2 = (3,4)
print("La distancia de Chebyshev entre p1 y p2 es:",distancia_chebyshev(p1,p2))
#

La distancia de Chebyshev entre p1 y p2 es: 2


# Distancia de Canberra

In [None]:
#es una medida ponderada que se emplea en análisis
#multivariado. Permite estimar diferencias cuando las variables
#tienen diferentes escalas. Para dos vectores X y Y, la distancia
#se calcula como:

def distancia_canberra(p1,p2):
    return sum(abs(p1[i]-p2[i])/(abs(p1[i])+abs(p2[i])) for i in range(len(p1)))

p1 = (1,2)
p2 = (10,20)
print("La distancia de Canberra entre p1 y p2 es:",distancia_canberra(p1,p2))


La distancia de Canberra entre p1 y p2 es: 1.6363636363636365


# Distancia Coseno

In [None]:
#Mide el coseno del ángulo entre dos vectores en un espacio
#multidimensional. Se emplea para calcular la diferencia entre
#conceptos en modelos de análisis de textos. Por ejemplo, con la
#distancia coseno es posible calcular las diferencias que hay
#entre ideas como hombre – mujer, y esta distancia debe ser
#similar a la que existe entre rey – reina. Con esto, los modelos
#de lenguaje tienen una codificación que ayuda al entendimiento
#de las palabras. Se calcula como:

import numpy as np

def cosine_similarity(v1, v2):
  """
  Calcula la similitud del coseno entre dos vectores.

  Args:
    v1: El primer vector.
    v2: El segundo vector.

  Returns:
    La similitud del coseno entre los dos vectores.
  """

  # Calcula el producto punto de los vectores
  dot_product = np.dot(v1, v2)

  # Calcula las normas (magnitudes) de los vectores
  norm_v1 = np.linalg.norm(v1)
  norm_v2 = np.linalg.norm(v2)

  # Calcula la similitud del coseno
  cosine_similarity = dot_product / (norm_v1 * norm_v2)

  return cosine_similarity

# Ejemplo de uso:
vector1 = np.array([1, 2, 3])
vector2 = np.array([4, 5, 6])

similarity = cosine_similarity(vector1, vector2)
print("La similitud del coseno es:", similarity)

La similitud del coseno es: 0.9746318461970762


# Distancia de Jaccard

In [None]:
#Se emplea para medir qué tan similares son dos conjuntos,
#generalmente binarios. Es la relación entre el número de
#elementos comunes entre dos conjuntos y el número total de
#elementos en los conjuntos.

def jaccard_distance(set1, set2):
  """
  Calcula la distancia de Jaccard entre dos conjuntos binarios.

  Args:
    set1: El primer conjunto binario (un objeto set en Python).
    set2: El segundo conjunto binario (un objeto set en Python).

  Returns:
    La distancia de Jaccard entre los dos conjuntos.
  """

  # Intersección de los conjuntos
  intersection = set1.intersection(set2)
  # Unión de los conjuntos
  union = set1.union(set2)

  # Calculamos la distancia de Jaccard
  jaccard_distance = 1 - (len(intersection) / len(union))
  return jaccard_distance

# Ejemplo de uso:
set_A = {1, 2, 3}
set_B = {8, 2, 3}

distance = jaccard_distance(set_A, set_B)
print("La distancia de Jaccard es:", distance)


La distancia de Jaccard es: 0.5
