# Unidad 1: Programación Orientada a Objetos (POO)
La POO es un paradigma que organiza el software en torno a "objetos", que son instancias de "clases".
### Tema 1.1: Fundamentos de la POO
#### Clases y Objetos:
- Clase: Es una plantilla o molde para crear objetos. Define atributos (datos) y métodos (comportamientos).
- Objeto: Es una instancia de una clase. Tiene su propio estado (valores de atributos) y comportamiento (métodos).
- Atributos: Variables que almacenan datos del objeto.
- Métodos: Funciones que pertenecen a la clase y operan sobre los datos del objeto. El primer parámetro suele ser self, que representa la instancia del objeto.
- Constructor (__init__): Un método especial que se llama automáticamente cuando se crea un objeto. Se usa para inicializar los atributos del objeto.

In [None]:
# Definición de una clase Automovil
class Automovil:
    # Constructor: se ejecuta al crear un objeto Automovil
    # Inicializa los atributos del objeto
    def __init__(self, marca, modelo, color, kilometraje=0):
        self.marca = marca  # Atributo: marca del automóvil
        self.modelo = modelo # Atributo: modelo del automóvil
        self.color = color   # Atributo: color del automóvil
        self.kilometraje = kilometraje # Atributo: kilometraje, con valor por defecto
        self.encendido = False # Atributo: estado del motor

    # Método para arrancar el automóvil
    def arrancar(self):
        if not self.encendido:
            self.encendido = True
            print(f"El {self.marca} {self.modelo} ha arrancado.")
        else:
            print(f"El {self.marca} {self.modelo} ya estaba encendido.")

    # Método para detener el automóvil
    def detener(self):
        if self.encendido:
            self.encendido = False
            print(f"El {self.marca} {self.modelo} se ha detenido.")
        else:
            print(f"El {self.marca} {self.modelo} ya estaba detenido.")

    # Método para mostrar información del automóvil
    def mostrar_info(self):
        print(f"Automóvil: {self.marca} {self.modelo}, Color: {self.color}, Kilometraje: {self.kilometraje} km")

# Creación de objetos (instancias) de la clase Automovil
mi_auto_1 = Automovil("Toyota", "Corolla", "Rojo", 15000)
mi_auto_2 = Automovil("Honda", "Civic", "Azul") # Kilometraje tomará el valor por defecto 0

# Usar los métodos de los objetos
mi_auto_1.mostrar_info() # Automóvil: Toyota Corolla, Color: Rojo, Kilometraje: 15000 km
mi_auto_1.arrancar()     # El Toyota Corolla ha arrancado.
mi_auto_1.detener()      # El Toyota Corolla se ha detenido.

mi_auto_2.mostrar_info() # Automóvil: Honda Civic, Color: Azul, Kilometraje: 0 km
mi_auto_2.arrancar()     # El Honda Civic ha arrancado.

### 2. Pilares de la POO

- Encapsulamiento: Agrupar datos (atributos) y métodos que operan sobre esos datos dentro de una clase. Permite ocultar el estado interno y proteger los datos de modificaciones externas no deseadas (control de acceso). En Python, se usan convenciones: _nombre (protegido) o __nombre (privado, con name mangling).

In [None]:
class CuentaBancaria:
    def __init__(self, titular, saldo_inicial=0):
        self.titular = titular
        # Atributo "privado" (por convención con _), encapsula el saldo
        self._saldo = saldo_inicial

    def depositar(self, cantidad):
        if cantidad > 0:
            self._saldo += cantidad
            print(f"Depósito de ${cantidad} realizado. Saldo actual: ${self._saldo}")
        else:
            print("La cantidad a depositar debe ser positiva.")

    def retirar(self, cantidad):
        if 0 < cantidad <= self._saldo:
            self._saldo -= cantidad
            print(f"Retiro de ${cantidad} realizado. Saldo actual: ${self._saldo}")
        else:
            print("Fondos insuficientes o cantidad inválida.")

    # Método para acceder al saldo de forma controlada (getter)
    def obtener_saldo(self):
        return self._saldo

mi_cuenta = CuentaBancaria("Ana Pérez", 1000)
mi_cuenta.depositar(500)
mi_cuenta.retirar(200)
# No se debería acceder directamente a mi_cuenta._saldo desde fuera
print(f"El saldo de {mi_cuenta.titular} es: ${mi_cuenta.obtener_saldo()}")
# mi_cuenta._saldo = -500 # ¡Esto se podría hacer, pero rompe la encapsulación!

- Abstracción: Ocultar los detalles complejos de implementación y mostrar solo la funcionalidad esencial al usuario. El usuario interactúa con una interfaz simple sin preocuparse por cómo funciona internamente.

In [None]:
# Continuando con CuentaBancaria
# El usuario de la clase CuentaBancaria no necesita saber cómo se almacena
# o actualiza internamente el saldo. Solo usa los métodos depositar(), retirar(), obtener_saldo().
# Esos métodos son la abstracción.

# Otro ejemplo:
class Televisor:
    def __init__(self):
        self._canal_actual = 1
        self._volumen = 10
        # ... muchos otros detalles internos complejos (manejo de señal, decodificación, etc.)

    def cambiar_canal(self, nuevo_canal):
        # Lógica interna para sintonizar el canal
        self._canal_actual = nuevo_canal
        print(f"Canal cambiado a: {self._canal_actual}")

    def subir_volumen(self):
        # Lógica interna para el audio
        if self._volumen < 100:
            self._volumen += 1
        print(f"Volumen: {self._volumen}")

mi_tv = Televisor()
mi_tv.cambiar_canal(5) # El usuario solo llama al método, no conoce la complejidad interna
mi_tv.subir_volumen()

- Herencia: Permite crear nuevas clases (subclases o clases derivadas) que reutilizan, extienden o modifican el comportamiento de clases existentes (superclases o clases base). Fomenta la reutilización de código. super() se usa para llamar a métodos de la clase padre.

In [None]:
class Vehiculo: # Superclase o Clase Base
    def __init__(self, marca, modelo):
        self.marca = marca
        self.modelo = modelo

    def describir(self):
        return f"Vehículo: {self.marca} {self.modelo}"

# Subclase Coche hereda de Vehiculo
class Coche(Vehiculo):
    def __init__(self, marca, modelo, numero_puertas):
        super().__init__(marca, modelo) # Llama al constructor de la clase padre (Vehiculo)
        self.numero_puertas = numero_puertas

    # Sobrescribe el método describir de la clase padre
    def describir(self):
        descripcion_padre = super().describir() # Puede usar el método del padre
        return f"{descripcion_padre}, Puertas: {self.numero_puertas}"

    def tocar_bocina(self):
        return "¡Beep beep!"

mi_coche = Coche("Ford", "Fiesta", 4)
print(mi_coche.describir()) # Vehículo: Ford Fiesta, Puertas: 4
print(mi_coche.tocar_bocina()) # ¡Beep beep!

- Herencia Múltiple: Una clase puede heredar de varias clases base.

In [None]:
class Terrestre:
    def desplazar_tierra(self):
        return "Moviéndose por tierra."

class Acuatico:
    def desplazar_agua(self):
        return "Navegando por agua."

class VehiculoAnfibio(Terrestre, Acuatico): # Hereda de Terrestre y Acuatico
    def __init__(self, nombre):
        self.nombre = nombre

    def mostrar_capacidades(self):
        print(f"{self.nombre}:")
        print(f"  - {self.desplazar_tierra()}")
        print(f"  - {self.desplazar_agua()}")

mi_anfibio = VehiculoAnfibio("AquaRover")
mi_anfibio.mostrar_capacidades()

- Polimorfismo: Significa "muchas formas". Permite que objetos de diferentes clases respondan al mismo mensaje (llamada a método) de manera diferente, según su propia implementación.

In [None]:
class Animal:
    def __init__(self, nombre):
        self.nombre = nombre
    def hacer_sonido(self): # Método que será sobrescrito
        raise NotImplementedError("La subclase debe implementar este método")

class Perro(Animal):
    def hacer_sonido(self): # Implementación específica para Perro
        return "¡Guau!"

class Gato(Animal):
    def hacer_sonido(self): # Implementación específica para Gato
        return "¡Miau!"

class Vaca(Animal):
    def hacer_sonido(self):
        return "¡Muuu!"

# Lista de animales (objetos de diferentes clases, pero todas heredan de Animal)
animales = [Perro("Fido"), Gato("Misi"), Vaca("Lola")]

# Polimorfismo en acción:
# Cada animal responde a hacer_sonido() de su propia manera
for animal in animales:
    print(f"{animal.nombre} dice: {animal.hacer_sonido()}")
# Fido dice: ¡Guau!
# Misi dice: ¡Miau!
# Lola dice: ¡Muuu!

### Tema 1.2: Estructuras de programación utilizando los pilares de la POO

#### Clases Abstractas (y Métodos Abstractos):
- Una clase abstracta no puede ser instanciada directamente. Sirve como una plantilla para otras clases.
- Puede contener métodos abstractos, que son declarados pero no implementados en la clase abstracta. Las subclases concretas deben implementar estos métodos.
- En Python, se usa el módulo abc (Abstract Base Classes).

In [None]:
from abc import ABC, abstractmethod # Importar ABC y abstractmethod

class Forma(ABC): # Hereda de ABC para ser una clase abstracta
    def __init__(self, nombre):
        self.nombre = nombre

    @abstractmethod # Decorador para marcar un método como abstracto
    def calcular_area(self):
        pass # Los métodos abstractos no tienen implementación aquí

    @abstractmethod
    def describir(self):
        pass

# Si intentas instanciar Forma directamente, dará error:
# forma_generica = Forma("gen") # TypeError: Can't instantiate abstract class Forma...

class Rectangulo(Forma):
    def __init__(self, nombre, base, altura):
        super().__init__(nombre)
        self.base = base
        self.altura = altura

    # DEBE implementar los métodos abstractos de Forma
    def calcular_area(self):
        return self.base * self.altura

    def describir(self):
        return f"Soy un {self.nombre} con área {self.calcular_area()}"

class Circulo(Forma):
    def __init__(self, nombre, radio):
        super().__init__(nombre)
        self.radio = radio

    def calcular_area(self):
        import math
        return math.pi * (self.radio ** 2)

    def describir(self):
        return f"Soy un {self.nombre} con área {self.calcular_area():.2f}"


rect = Rectangulo("Rectángulo A", 10, 5)
circ = Circulo("Círculo B", 7)

formas = [rect, circ]
for forma in formas:
    print(forma.describir())
# Soy un Rectángulo A con área 50
# Soy un Círculo B con área 153.94

### Unidad 2: Manejo Eficiente de Arreglos Multidimensionales (NumPy)
NumPy (Numerical Python) es la biblioteca fundamental para la computación científica en Python. Proporciona un objeto de arreglo multidimensional de alto rendimiento y herramientas para trabajar con estos arreglos.

#### 2.1: Introducción a Arreglos Multidimensionales
#### 1. Creación de Arreglos:
- np.array(): Crea un arreglo a partir de una lista o tupla.
- np.zeros(), np.ones(): Crean arreglos llenos de ceros o unos.
- np.arange(): Similar a range() pero devuelve un arreglo.
- np.linspace(): Crea arreglos con valores espaciados uniformemente.

In [None]:
import numpy as np # Convención para importar NumPy

# Arreglo 1D desde una lista
arr1d = np.array([1, 2, 3, 4, 5])
print("Arreglo 1D:\n", arr1d)

# Arreglo 2D (matriz) desde una lista de listas
arr2d = np.array([[1, 2, 3], [4, 5, 6]])
print("Arreglo 2D:\n", arr2d)

# Arreglo de ceros
zeros_arr = np.zeros((2, 3)) # Tupla (2,3) especifica la forma (2 filas, 3 columnas)
print("Arreglo de ceros:\n", zeros_arr)

# Arreglo de unos
ones_arr = np.ones((3, 2))
print("Arreglo de unos:\n", ones_arr)

# Arreglo con arange
range_arr = np.arange(0, 10, 2) # De 0 a 10 (excluyente), en pasos de 2
print("Arreglo con arange:\n", range_arr) # [0 2 4 6 8]

# Arreglo con linspace
linspace_arr = np.linspace(0, 1, 5) # 5 números espaciados uniformemente entre 0 y 1 (inclusive)
print("Arreglo con linspace:\n", linspace_arr) # [0.   0.25 0.5  0.75 1.  ]

#### 2. Atributos de Arreglos:
- ndim: Número de dimensiones.
- shape: Tupla que indica el tamaño del arreglo en cada dimensión.
- size: Número total de elementos.
- dtype: Tipo de datos de los elementos.

In [None]:
print(f"arr2d dimensiones: {arr2d.ndim}") # 2
print(f"arr2d forma: {arr2d.shape}")     # (2, 3)
print(f"arr2d tamaño: {arr2d.size}")      # 6
print(f"arr2d tipo de datos: {arr2d.dtype}") # int64 o int32 dependiendo del sistema

#### 3. Indexación y Segmentación (Slicing):
- Acceso a elementos individuales usando índices (comienzan en 0).
- Segmentación para obtener sub-arreglos usando [inicio:fin:paso].
- Indexación Booleana: Usar un arreglo de booleanos para seleccionar elementos.
- Fancy Indexing: Usar un arreglo de índices para seleccionar elementos.

In [None]:
arr = np.arange(10, 20) # [10 11 12 13 14 15 16 17 18 19]
print("Arreglo original:", arr)

# Indexación básica
print("Elemento en índice 3:", arr[3]) # 13
print("Último elemento:", arr[-1]) # 19

# Segmentación (Slicing)
print("Desde índice 2 hasta 5 (excluyente):", arr[2:5]) # [12 13 14]
print("Desde inicio hasta índice 4 (excluyente):", arr[:4]) # [10 11 12 13]
print("Desde índice 5 hasta el final:", arr[5:]) # [15 16 17 18 19]
print("Cada segundo elemento:", arr[::2]) # [10 12 14 16 18]

arr2d_idx = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("Arreglo 2D para indexar:\n", arr2d_idx)
print("Elemento en fila 1, columna 2:", arr2d_idx[1, 2]) # 6
print("Primera fila completa:", arr2d_idx[0, :]) # [1 2 3] o arr2d_idx[0]
print("Primera columna completa:\n", arr2d_idx[:, 0]) # [1 4 7] (como arreglo 1D)

# Indexación Booleana
arr_bool = np.array([1, 5, 2, 8, 3, 7])
condicion = arr_bool > 4
print("Condición booleana:", condicion) # [False  True False  True False  True]
print("Elementos > 4:", arr_bool[condicion]) # [5 8 7]

# Fancy Indexing
arr_fancy = np.array([10, 20, 30, 40, 50])
indices = [0, 2, 4]
print("Elementos en índices [0, 2, 4]:", arr_fancy[indices]) # [10 30 50]

#### 4. Cambio de Forma, Combinar y Separar:
- reshape(): Cambia la forma de un arreglo sin cambiar sus datos (el nuevo tamaño debe ser compatible).
- concatenate(): Une una secuencia de arreglos a lo largo de un eje existente.
- vstack(), hstack(): Formas especializadas de concatenar vertical u horizontalmente.
- split(), array_split(): Divide un arreglo en múltiples sub-arreglos.

In [None]:
arr_reshape = np.arange(1, 13) # 12 elementos
print("Arreglo original para reshape:", arr_reshape)

# Reshape a una matriz 3x4
reshaped_arr = arr_reshape.reshape((3, 4))
print("Reshape (3,4):\n", reshaped_arr)
# También puede ser -1 en una dimensión, NumPy infiere el tamaño
# reshaped_arr_auto = arr_reshape.reshape((3, -1))

arr_a = np.array([[1, 2], [3, 4]])
arr_b = np.array([[5, 6]]) # Tiene que tener el mismo número de columnas para concatenar por filas (axis=0)

# Concatenar por filas (axis=0 por defecto)
concatenated_rows = np.concatenate((arr_a, arr_b), axis=0)
print("Concatenado por filas (axis=0):\n", concatenated_rows)

arr_c = np.array([[5], [6]]) # Mismo número de filas que arr_a para concatenar por columnas
concatenated_cols = np.concatenate((arr_a, arr_c), axis=1)
print("Concatenado por columnas (axis=1):\n", concatenated_cols)

# vstack y hstack
# print("vstack:\n", np.vstack((arr_a, arr_b))) # Similar a concatenate axis=0
# print("hstack:\n", np.hstack((arr_a, arr_c))) # Similar a concatenate axis=1

arr_split = np.arange(10)
print("Arreglo original para split:", arr_split)
# Dividir en 5 partes iguales (si es posible)
split_arrs = np.split(arr_split, 5)
print("Arreglo dividido en 5 partes:", split_arrs)
# [array([0, 1]), array([2, 3]), array([4, 5]), array([6, 7]), array([8, 9])]

# array_split puede dividir en partes no iguales si es necesario
split_uneven = np.array_split(arr_split, 3)
print("Arreglo dividido en 3 partes (array_split):", split_uneven)
# [array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8, 9])]

### Tema 2.2: Operaciones con Arreglos Multidimensionales
#### 1. Operaciones Matemáticas y Estadísticas:
- Operaciones elemento a elemento (vectorizadas): +, -, *, /, ** (potencia).
- Funciones universales (ufuncs): np.sqrt(), np.exp(), np.sin(), np.log(), etc.
- Funciones de agregación/reducción: sum(), mean(), std(), min(), max(), prod(), cumsum(), cumprod(). Pueden operar sobre todo el arreglo o a lo largo de un eje (axis).
- Multiplicación de matrices: np.dot(A, B) o A @ B.

In [None]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

print("a:", a)
print("b:", b)
print("a + b =", a + b)       # [5 7 9]
print("a * 2 =", a * 2)       # [2 4 6]
print("a ** 2 =", a ** 2)     # [1 4 9]
print("np.sqrt(a) =", np.sqrt(a)) # [1.  1.41421356 1.73205081]

mat = np.array([[1, 2], [3, 4]])
print("Matriz original:\n", mat)
print("Suma de todos los elementos:", mat.sum()) # 10
print("Media de todos los elementos:", mat.mean()) # 2.5
print("Suma por columnas (axis=0):", mat.sum(axis=0)) # [4 6] (1+3, 2+4)
print("Suma por filas (axis=1):", mat.sum(axis=1))   # [3 7] (1+2, 3+4)

# Multiplicación de matrices
mat_A = np.array([[1, 2], [3, 4]])
mat_B = np.array([[5, 6], [7, 8]])
dot_product = np.dot(mat_A, mat_B)
# O usando el operador @ (Python 3.5+)
# dot_product_op = mat_A @ mat_B
print("Producto punto (multiplicación de matrices):\n", dot_product)
# [[1*5+2*7, 1*6+2*8], [3*5+4*7, 3*6+4*8]] = [[19, 22], [43, 50]]

#### 2. Manipulación de Arreglos:
- Transposición: arr.T o np.transpose(arr). Intercambia filas y columnas.
- Copia vs. Vista:
    - Una vista (view()) comparte los mismos datos que el arreglo original. Cambios en la vista afectan al original y viceversa. Slicing generalmente crea vistas.
    - Una copia (copy()) crea un nuevo arreglo con sus propios datos. Cambios en la copia no afectan al original.
- Ordenamiento: np.sort(arr) (devuelve una copia ordenada) o arr.sort() (ordena in-place).

In [None]:
mat_t = np.array([[1, 2, 3], [4, 5, 6]])
print("Matriz original:\n", mat_t)
print("Matriz transpuesta (T):\n", mat_t.T)
# [[1 4]
#  [2 5]
#  [3 6]]

original = np.array([1, 2, 3, 4])
vista = original[1:3] # Slicing crea una vista
copia = original[1:3].copy() # .copy() crea una copia explícita

print("Original:", original) # [1 2 3 4]
print("Vista:", vista)       # [2 3]
print("Copia:", copia)       # [2 3]

vista[0] = 99 # Modificar la vista
print("--- Después de modificar la vista ---")
print("Original:", original) # [ 1 99  3  4] ¡El original cambió!
print("Vista:", vista)       # [99  3]
print("Copia:", copia)       # [ 2  3] ¡La copia no cambió!

copia[0] = 77 # Modificar la copia
print("--- Después de modificar la copia ---")
print("Original:", original) # [ 1 99  3  4] ¡El original NO cambió!
print("Vista:", vista)       # [99  3]
print("Copia:", copia)       # [77  3]

arr_sort = np.array([3, 1, 4, 1, 5, 9, 2, 6])
sorted_arr_copy = np.sort(arr_sort) # Devuelve una copia ordenada
print("Arreglo original para ordenar:", arr_sort)
print("Copia ordenada:", sorted_arr_copy)
print("Arreglo original después de np.sort:", arr_sort) # No cambia

arr_sort.sort() # Ordena in-place (modifica el arreglo original)
print("Arreglo original después de arr.sort():", arr_sort)

#### 3. Broadcasting:
- Describe cómo NumPy trata arreglos con diferentes formas durante operaciones aritméticas.
- Reglas:
    1. Si los arreglos no tienen el mismo ndim, se anteponen 1s a la forma del arreglo de menor dimensión hasta que tengan el mismo ndim.
    2. Si la forma de dos arreglos no coincide en alguna dimensión, el arreglo con forma igual a 1 en esa dimensión se "extiende" (estira o duplica) para que coincida con la forma del otro.
    3. Si en alguna dimensión los tamaños son diferentes y ninguno es 1, se produce un error.

In [None]:
# Ejemplo 1: Arreglo + escalar
arr_bc = np.array([1, 2, 3])
escalar = 5
resultado_bc1 = arr_bc + escalar # El escalar 5 se "extiende" a [5, 5, 5]
print("Broadcasting (arreglo + escalar):", resultado_bc1) # [6 7 8]

# Ejemplo 2: Matriz (2x3) + Vector fila (1x3) que se extiende a (2x3)
matriz = np.array([[1, 2, 3],
                   [4, 5, 6]])
vector_fila = np.array([10, 20, 30]) # Forma (3,), se trata como (1,3) para broadcasting
resultado_bc2 = matriz + vector_fila
print("Matriz:\n", matriz)
print("Vector fila:", vector_fila)
print("Broadcasting (matriz + vector fila):\n", resultado_bc2)
# [[11 22 33]
#  [14 25 36]]
# El vector_fila [10, 20, 30] se aplica a cada fila de la matriz.

# Ejemplo 3: Matriz (2x3) + Vector columna (2x1) que se extiende a (2x3)
vector_columna = np.array([[100], [200]]) # Forma (2,1)
resultado_bc3 = matriz + vector_columna
print("Vector columna:\n", vector_columna)
print("Broadcasting (matriz + vector columna):\n", resultado_bc3)
# [[101 102 103]
#  [204 205 206]]
# El vector_columna [[100], [200]] se aplica a cada columna de la matriz.

### Algoritmo KNN (K-Nearest Neighbors / K Vecinos más Cercanos)

KNN es un algoritmo de aprendizaje supervisado simple pero potente, utilizado tanto para clasificación como para regresión. No está explícitamente en tus PDFs, pero aquí te lo explico:

##### Concepto Principal:
La idea es que objetos similares tienden a estar cerca unos de otros. Para un nuevo punto de datos, KNN busca los 'K' puntos de datos más cercanos (vecinos) en el conjunto de entrenamiento y utiliza la información de estos vecinos para hacer una predicción.

##### Funcionamiento (para Clasificación):
    1. Elegir K: Se selecciona un número entero 'K' (por ejemplo, K=3, K=5).
    2. Calcular Distancias: Para un nuevo punto de datos que se quiere clasificar, se calcula la distancia entre este nuevo punto y TODOS los puntos en el conjunto de entrenamiento. Las métricas de distancia comunes son:
        - Distancia Euclidiana: La más común, la "línea recta" entre dos puntos.
        Para dos puntos P=(p1, p2) y Q=(q1, q2) en 2D: sqrt((p1-q1)^2 + (p2-q2)^2)
        - Distancia de Manhattan, Minkowski, etc.
    3. Encontrar los K Vecinos: Se seleccionan los K puntos del conjunto de entrenamiento que tienen las menores distancias al nuevo punto.
    4. Votación (Mayoría de Clases): Se observa la clase de cada uno de estos K vecinos. La clase que aparece con más frecuencia entre los K vecinos se asigna como la clase predicha para el nuevo punto. En caso de empate, se puede resolver aleatoriamente, o usando K impar, o ponderando por distancia.

##### Funcionamiento (para Regresión):
En lugar de votar por la clase mayoritaria, se toma el promedio (o mediana) de los valores de los K vecinos para predecir el valor del nuevo punto.
Puntos Clave y Consideraciones:
"Lazy Learner" o Basado en Instancias: KNN no "aprende" un modelo explícito durante el entrenamiento. Simplemente almacena todo el conjunto de datos de entrenamiento. La computación real ocurre durante la predicción.

##### Importancia de K:
- Un K pequeño (ej. K=1) puede hacer que el modelo sea muy sensible al ruido y a outliers.
- Un K grande suaviza las predicciones, pero puede hacer que el modelo ignore características locales importantes.
- K se suele elegir mediante validación cruzada.
- Escalado de Características: Es MUY importante escalar las características (ej. normalización o estandarización) antes de aplicar KNN. Si las características tienen diferentes rangos (ej. edad vs. salario), las que tienen rangos más grandes dominarán el cálculo de la distancia.
- Coste Computacional: Calcular distancias a todos los puntos de entrenamiento puede ser costoso para conjuntos de datos grandes.
Ejemplo de Código con Scikit-learn (para clasificación):
Scikit-learn es la biblioteca estándar de Machine Learning en Python.

In [None]:
import numpy as np
from collections import Counter # Para contar la frecuencia de las clases en los vecinos

# --- Funciones Auxiliares ---

def distancia_euclidiana(punto1, punto2):
    """
    Calcula la distancia euclidiana entre dos puntos.
    Ambos puntos deben ser iterables (listas, tuplas, arrays de NumPy)
    de la misma longitud.
    """
    # Asegurarse de que los puntos son arrays de NumPy para operaciones vectorizadas
    punto1 = np.array(punto1)
    punto2 = np.array(punto2)
    return np.sqrt(np.sum((punto1 - punto2)**2))

def encontrar_vecinos(X_entrenamiento, y_entrenamiento, punto_prueba, k):
    """
    Encuentra los k vecinos más cercanos a un punto de prueba
    dentro del conjunto de entrenamiento.

    Args:
        X_entrenamiento (list of lists or np.array): Características del conjunto de entrenamiento.
        y_entrenamiento (list or np.array): Etiquetas de clase del conjunto de entrenamiento.
        punto_prueba (list or np.array): El punto para el cual se quieren encontrar los vecinos.
        k (int): El número de vecinos a encontrar.

    Returns:
        list: Una lista de las etiquetas de clase de los k vecinos más cercanos.
    """
    distancias = []
    for i, punto_entrenamiento in enumerate(X_entrenamiento):
        dist = distancia_euclidiana(punto_entrenamiento, punto_prueba)
        # Guardamos la distancia y la etiqueta de clase original del punto de entrenamiento
        distancias.append((y_entrenamiento[i], dist))

    # Ordenar las distancias en orden ascendente (de menor a mayor)
    # Se ordena por el segundo elemento de la tupla (la distancia)
    distancias.sort(key=lambda tupla: tupla[1])

    # Seleccionar las etiquetas de los k vecinos más cercanos
    vecinos_etiquetas = []
    for i in range(k):
        vecinos_etiquetas.append(distancias[i][0]) # distancias[i][0] es la etiqueta de clase

    return vecinos_etiquetas

def predecir_clasificacion_knn(X_entrenamiento, y_entrenamiento, punto_prueba, k):
    """
    Predice la clase de un punto de prueba usando el algoritmo KNN.

    Args:
        X_entrenamiento (list of lists or np.array): Características del conjunto de entrenamiento.
        y_entrenamiento (list or np.array): Etiquetas de clase del conjunto de entrenamiento.
        punto_prueba (list or np.array): El punto cuya clase se quiere predecir.
        k (int): El número de vecinos a considerar.

    Returns:
        La clase predicha para el punto de prueba.
    """
    # 1. Encontrar los k vecinos más cercanos
    etiquetas_vecinos = encontrar_vecinos(X_entrenamiento, y_entrenamiento, punto_prueba, k)

    # 2. Votación: encontrar la clase más común entre los vecinos
    # Counter cuenta la frecuencia de cada elemento en la lista
    conteo_clases = Counter(etiquetas_vecinos)
    # most_common(1) devuelve una lista de tuplas [(clase_mas_comun, frecuencia)],
    # por lo que tomamos el primer elemento de la lista y luego el primer elemento de la tupla.
    clase_predicha = conteo_clases.most_common(1)[0][0]

    return clase_predicha

# --- Ejemplo de Uso ---

if __name__ == "__main__":
    # 1. Datos de entrenamiento (ejemplo simple)
    # Características: [altura (cm), peso (kg)]
    # Clases: 0 (persona A), 1 (persona B)
    X_entrenamiento = np.array([
        [160, 60],  # Persona A
        [165, 65],  # Persona A
        [158, 58],  # Persona A
        [175, 70],  # Persona B
        [180, 75],  # Persona B
        [178, 72]   # Persona B
    ])
    y_entrenamiento = np.array([0, 0, 0, 1, 1, 1])

    # 2. Punto de prueba (nuevos datos para clasificar)
    punto_prueba_1 = np.array([170, 68]) # ¿A qué clase pertenece esta persona?
    punto_prueba_2 = np.array([155, 55])

    # 3. Establecer el valor de k (número de vecinos)
    k = 3

    # 4. Realizar la predicción para punto_prueba_1
    prediccion_1 = predecir_clasificacion_knn(X_entrenamiento, y_entrenamiento, punto_prueba_1, k)
    print(f"Para el punto de prueba {punto_prueba_1}:")
    print(f"  Los {k} vecinos más cercanos tienen etiquetas: {encontrar_vecinos(X_entrenamiento, y_entrenamiento, punto_prueba_1, k)}")
    print(f"  La clase predicha es: {prediccion_1} (0=Persona A, 1=Persona B)\n")

    # Realizar la predicción para punto_prueba_2
    prediccion_2 = predecir_clasificacion_knn(X_entrenamiento, y_entrenamiento, punto_prueba_2, k)
    print(f"Para el punto de prueba {punto_prueba_2}:")
    print(f"  Los {k} vecinos más cercanos tienen etiquetas: {encontrar_vecinos(X_entrenamiento, y_entrenamiento, punto_prueba_2, k)}")
    print(f"  La clase predicha es: {prediccion_2} (0=Persona A, 1=Persona B)")

    # --- Consideraciones importantes NO implementadas aquí (pero cruciales en la práctica) ---
    # - Escalado de características: Si las características tienen diferentes rangos (ej., altura en cm y
    #   edad en años), las características con rangos mayores dominarán la distancia.
    #   Deberías implementar funciones para normalizar (min-max scaling) o estandarizar (z-score)
    #   tus datos ANTES de calcular las distancias.
    # - Manejo de empates en la votación: Si hay un empate en el número de vecinos por clase,
    #   esta implementación simple tomará una de ellas (la que `Counter.most_common()` devuelva primero).
    #   Se pueden usar estrategias como reducir k, ponderar por distancia, o elegir aleatoriamente.
    # - Elección de k: El valor de k es un hiperparámetro. Un k pequeño puede ser sensible al ruido,
    #   uno grande puede suavizar demasiado. Se suele usar validación cruzada para encontrar un buen k.
    # - Eficiencia: Para datasets grandes, calcular todas las distancias es computacionalmente intensivo.
    #   Existen estructuras de datos más avanzadas (como KD-Trees o Ball Trees) para acelerar
    #   la búsqueda de vecinos, pero son más complejas de implementar.