# Procesamiento digital de imágenes con aprendizaje automático

El aprendizaje automático (*Machine Learning*) es una disciplina que se enfoca
en el desarrollo de algoritmos que permiten generalizar comportamientos a partir
de muchos ejemplos.
Combina conceptos de matemáticas, estadística y computación; y se puede dividir
en dos grandes categorías: aprendizaje supervisado y no supervisado.


## 1.1. El problema del agrupamiento y la posterización de imágenes

In [None]:
from sklearn import datasets

datos_iris = datasets.load_iris()
datos_iris.keys()

In [None]:
X, y = datos_iris["data"], datos_iris["target"]

In [None]:
import random
indices = random.sample(range(len(X)), k=3)
centroides = X[indices]
centroides

In [None]:
import math
import numpy as np


def distancia(vec_x, vec_y):
    return math.sqrt(sum((vec_x - vec_y)**2))

def encontar_centroide(X, centroides):
    def distancia_a_centroide(i):
        return distancia(vec_x, centroides[i])
    
    indices = range(len(centroides))
    etiquetas = [None]*len(X)
    for i, vec_x in enumerate(X):
        etiquetas[i] = min(indices, key=distancia_a_centroide)
    
    return etiquetas

def centro_de_masa(X):
    return sum(X)/len(X)

def inercia(X, centroides):
    etiquetas = np.array(encontar_centroide(X, centroides))
    total = 0.0
    for i in range(len(centroides)):
        seleccion = X[etiquetas == i]
        distancias = [distancia(vec_x, centroides[i]) for vec_x in seleccion]
        total += sum(d**2 for d in distancias)
    return total

In [None]:

indices = random.sample(range(len(X)), k=3)
centroides = X[indices]
print("Inercia inicial:", inercia(X, centroides))

for t in range(15):
    etiquetas = np.array(encontar_centroide(X, centroides))
    for i in range(len(centroides)):
        seleccion = X[etiquetas == i]
        centroides[i] = centro_de_masa(seleccion)
    print(f"Inercia al tiempo {t}: {inercia(X, centroides)}")


In [None]:
from sklearn.cluster import KMeans

# PASO 1: Definir el modelo
modelo = KMeans(n_clusters=3)
# PASO 2: Realizar entrenamiento
modelo.fit(X)

In [None]:
modelo.labels_

In [None]:
datos_iris["target"]

In [None]:
modelo.inertia_

In [None]:
import skimage as ski
from materiales.sipi import ejemplo_sipi 

In [None]:
img = ski.io.imread("sipi/misc/4.2.03.tiff")
img[0, :2]

In [None]:
alto, ancho, canales = img.shape
X = img.reshape((alto*ancho, canales))

modelo = KMeans(4)
modelo.fit(X)

In [None]:
modelo.cluster_centers_

In [None]:
poster = np.array([modelo.cluster_centers_[etiqueta] for etiqueta in modelo.labels_])
poster = poster.reshape((alto, ancho, canales))/255

In [None]:
ski.io.imshow(poster)