# Obtención de dibujos mediante el procesamiento digital de imágenes
### Basado en el artículo "Combining Sketch and Tone for Pencil Drawing Production" por Cewu Lu, Li Xu y Jiaya Jia
La web del proyecto se puede encontrar aquí: 
http://www.cse.cuhk.edu.hk/leojia/projects/pencilsketch/pencil_drawing.htm

PDF del artículo: 
http://www.cse.cuhk.edu.hk/leojia/projects/pencilsketch/npar12_pencil.pdf

En este notebook, vamos a implementar en python un algoritmo que siga el planteamiento de este artículo. Para ello, vamos a dividir el flujo de trabajo en cuatro etapas:
1. Obtener el trazado/boceto de la imagen.
2. Generar un mapa de tonalidades de la imagen.
3. Aplicar la textura de lápiz al mapa de tonalidades.
4. Fusionar el boceto con el mapa de tonalidades texturizado para obtener el dibujo final.

Para la primera etapa, necesitamos obtener los bordes del objeto/s que resalten más en la imagen. Ese sería nuestro punto de partida para obtener el trazo principal del boceto.
Para ello, primero debemos suavizar la imagen para evitar que se resalten bordes innecesarios, como puede ser ruido que tenga la imagen o bien detalles de la imagen que, para nuestro procesado, son irrelevantes o incluso pueden alterar el resultado final.

Seguidamente obtenemos el gradiente de la imagen sobre el eje X y el eje Y. El operador gradiente nos devolverá un vector con la dirección de máxima variabilidad de intensidad y su nivel de variación. Para calcular el gradiente nos ayudamos de una máscara, que será un filtro que procesará cada pixel para determinar si el pixel compone parte de un borde o no. Usaremos la máscara de Sobel, pero se podrían usar otras como la de Prewitt o Roberts:

$$ G = \sqrt{(\partial_xI)^2 + (\partial_yI)^2} $$

Después de obtener los bordes, tenemos lo necesario para procesar esos bordes y convertirlos en pequeños trazos, simulando los trazos a mano alzada de un dibujante. Para ello, vamos a descomponer nuestra imagen gradiente y a clasificar los bordes según la dirección que tienen. Para este proceso nos ayudaremos de unas máscaras con una línea recta en su centro y dispuesta en diferentes direcciones, denotadas por:

$ L_i, i \in [1..8] $. 

Usaremos el operador de convolución para aplicar cada máscara a nuestra imagen gradiente y así obtener como resultado una lista de matrices con la superposición de cada máscara con la imagen gradiente.

$$ G_i = L_i \otimes G $$

Iteraremos sobre cada elemento de cada matriz resultante evaluando qué matriz tiene el mayor valor para ese elemento i-ésimo, para así obtener un "mapa" donde cada elemento del mapa nos indicará la dirección o el ángulo que tiene que tomar el pixel en esa posición.
La Clasificación final será una lista de n matrices, que corresponderán a las n direcciones o ángulos dados y dentro de cada una de ellas estarán los pixeles de la imagen gradiente que tengan la posición de los elementos del mapa de direcciones que tengan el mismo valor que la dirección de la matriz. En otro caso los pixeles tendrán valor 0.

$$ C_i(p) =
  \begin{cases}
    G(p)       & \quad \text{if } argmax_i(G_i(p))=i \\
    0  & \quad \text{else}
  \end{cases}
$$

Cada una de las i matrices guardadas en la clasificación tiene guardados los pixeles y la posición que en el gradiente tienen una dirección i.
Para, finalmente, obtener el boceto procesado, solo tenemos que realizar de nuevo la operación de convolución a las diferentes matrices de la clasificación por la máscara con la dirección correspondiente.

$$ S' = \sum_{i=1}^{8} L_i \otimes C_i $$

Esto hará que los trazos que se generen tengan un poco más de grosor. Finalmente se suman todas las matrices de la clasificación, se normalizan para que tengan valores entre [0-1] y se invierte para que los trazos se vean en negro sobre un fondo blanco. 

In [1]:
# Librerías
import cv2
import numpy as np
from matplotlib import pyplot as plt
from skimage import transform, exposure
from scipy import signal, sparse

In [2]:
def obtener_trazado(img,tamkernel,num_direcciones=8,tam_masc_suavizado=5):
#Suavizado de la imagen
    img = cv2.GaussianBlur(img,(tam_masc_suavizado,tam_masc_suavizado),0)
#Cálculo del gradiente usando Sobel
    scale = 1
    delta = 0
    ddepth = cv2.CV_16S
    altura = img.shape[0] #Número de filas 
    anchura = img.shape[1] #Número de columnas


    grad_x = cv2.Sobel(img, ddepth, 1, 0, 1, scale=scale, delta=delta, borderType=cv2.BORDER_DEFAULT)

    grad_y = cv2.Sobel(img, ddepth, 0, 1, 1, scale=scale, delta=delta, borderType=cv2.BORDER_DEFAULT)


    abs_grad_x = cv2.convertScaleAbs(grad_x)
    abs_grad_y = cv2.convertScaleAbs(grad_y)

    #Obtención de la imagen gradiente final
    G = cv2.addWeighted(abs_grad_x, 0.5, abs_grad_y, 0.5, 0) #Este es el valor G en la Fig. 2 del artículo

    cv2.imshow('original', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    cv2.imshow('gradiente', G)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
#A partir de G calcularemos el clasificador C y posteriormente la forma en pinceladas S de nuestra imagen 
#Primero aplicaremos unas máscaras de tamaño tamkernel * 2 + 1. Esas máscaras consisten en una línea centrada
#En diferentes ángulos

    tamkernel = tamkernel * 2 + 1 
    midkernel = tamkernel // 2
    kernel = (tamkernel,tamkernel)
    kernelh = np.zeros(kernel)
    kernelh[midkernel,:] = 1 #Máscara línea horizontal
    
    #Aquí guardaremos las distintas convoluciones de las máscaras con nuestra  imagen procesada
    res_map = np.zeros((altura, anchura, num_direcciones))     
    for i in range(num_direcciones):
        ker = transform.rotate(kernelh, (180 * i)/num_direcciones)
        res_map[:,:,i] = signal.convolve2d(G,ker,mode ='same')
        
    #Aquí devuelve una matriz donde indicará el indice de la dirección donde se guarda el pixel de mayor valor
    mapa_indices_maximo_pixel = np.argmax(res_map, axis=2)

    C = np.zeros_like(res_map)

    for i in range(num_direcciones):
        #Aquí creamos las distintas clasificaciones del gradiente según la dirección que toma cada pixel
        #Guardaremos en Ci los pixeles de G en las posiciones donde nuestro mapa de direcciones tenga el valor de la direccion i
        #En otro caso será 0
        C[:,:,i] = G * (mapa_indices_maximo_pixel == i)
    
    S_prima_separado = np.zeros_like(C)

    #De nuevo volvemos a realizar la operación de convolución de nuestros Ci por la máscara de dirección i correspondiente
    #Esto dará el aspecto de pequeños trazos a los bordes de nuestra imagen
    for i in range(num_direcciones):
        ker = transform.rotate(kernelh, (i * 180) / num_direcciones)
        S_prima_separado[:,:,i] = signal.convolve2d(C[:,:,i], ker, mode='same')
    
    #Sumamos los resultados
    S_prima = np.sum(S_prima_separado, axis=2)
    
    #Normalizamos el resultado para que los pixeles se muevan en el rango[0,1]
    S_prima_normalizada = (S_prima - np.min(S_prima.ravel())) / (np.max(S_prima.ravel()) - np.min(S_prima.ravel()))
    
    #Invertimos nuestra imagen para que los trazos se vean negros sobre un fondo blanco, como si fuese un boceto
    S = 1 - S_prima_normalizada
    return S

In [3]:
img = cv2.imread('trafico.png',0)
S = obtener_trazado(img,8,8)
cv2.imshow('Trazado de la imagen', S)
cv2.waitKey(0)
cv2.destroyAllWindows()

Ahora que ya tenemos nuestro boceto, procedemos a hacer un ajuste en las tonalidades de nuestra imagen. Esto se hace para que los tonos de gris(claro,medio,oscuro) sean lo más parecidos a los tonos de gris que tiene un dibujo. Los investigadores del artículo argumentan que los dibujos hechos a mano, si se procesan y se observa el histograma, se puede ver como repiten un patrón concreto. Esto se debe a que, los dibujos hechos a mano alzada siempre tienen un factor común que afecta al histograma, un fondo blanco(el papel) que da una luminancia mayor, y los trazos hechos con lápices de grafito que dan ese tono de gris característico.

Proponen entonces crear un modelo paramétrico con el cual ajustar la distribución de tonos de la imagen original para que tenga parecido a la distribución de tonos de un dibujo. Esto lo hacen uniendo 3 distribuciones de probabilidad distintas p1, p2 y p3, cada una enfocándose respectivamente en los tonos claro, medio y oscuro:

$$ p(v) = \frac{1}{Z}\sum_{i=1}^{3}\omega_ip_i(v) $$

* Para los tonos claros, se usa una distribución Laplaciana: $$ p_1(v) =
   \begin{cases}
       \frac{1}{\sigma_b}e^{-\frac{1 - v}{\sigma_b}}       & \quad \text{if } v \leq 1 \\
       0  & \quad \text{else}
   \end{cases} 
$$ Donde $\sigma_b$ es la escala de la distribución.$$ $$

* Para la capa media, se usan distribuciones uniformes: $$ p_2(v) =
  \begin{cases}
    \frac{1}{u_b - u_a}       & \quad \text{if } u_a \leq v \leq u_b \\
    0  & \quad \text{else}
  \end{cases}
$$ donde $u_a$, $u_b$ son los rangos de la distribución. $$ $$

* Para los tonos oscuros, usamos una distribución Gaussiana: $$ p_3(v) = \frac{1}{\sqrt{2\pi\sigma_d}}e^{-\frac{(v-\mu_d)^2}{2\sigma_d^2}} $$ donde $\sigma_d$ es la escala de la distribución

El resultado será un histograma del cual obtendremos(junto con el histograma de la imagen) una LUT(Look-Up Table), y procesaremos nuestra imagen con esa LUT, que no es más que ajustar los valores de los pixeles de la imagen según lo indique la tabla de valores.

In [4]:
def ajustar_tonalidad(img, w_group=0,pesos_prueba=None):
    # Grupos de pesos para las diferentes tonalidades. 1ª fila tonalidad clara, 2ª tonalidad media, 3ª tonalidad oscura
    #Estos pesos son los pesos ya definidos en el artículo.
    if pesos_prueba != None:
        w = pesos_prueba
    else:
        w_mat = np.array([[11, 37, 52],
                     [29, 29, 42],
                     [2, 22, 76]])
        w = w_mat[w_group,:]
    
    #Parámetros definidos en el artículo
    
    u_b = 225
    u_a = 105
    sigma_b = 9
    mu_d = 90
    sigma_d = 11
    
    img = cv2.GaussianBlur(img,(5,5),0)
    
    # Cálculo del nuevo histograma p(v)
    num_pixel_vals = 256
    p = np.zeros(num_pixel_vals)
    for v in range(num_pixel_vals):
        p1 = (1 / sigma_b) * np.exp(-(255 - v) / sigma_b) #Función de distribución para tonos claros
        if (u_a <= v <= u_b):
            p2 = 1 / (u_b - u_a)
        else:                         #Función de distribución para tonos medios
            p2 = 0
            
            #Función de distribución para tonos oscuros
        p3 = (1 / np.sqrt(2 * np.pi * sigma_d)) * np.exp( (-np.square(v - mu_d)) / (2 * np.square(sigma_d)) )
        
        #Sumamos las distribuciones multiplicadas por los distintos pesos
        p[v] = w[0] * p1 + w[1] * p2 + w[2] * p3 * 1/100
    
    p_normalizado = p/np.sum(p)
    P = np.cumsum(p_normalizado)
    h = cv2.calcHist([img],[0],None,[256],[0,256])
    H = np.cumsum(h / np.sum(h))
    lut = np.zeros_like(p)
    for v in range(num_pixel_vals):
        dist = np.abs(P - H[v])
        argmin_dist = np.argmin(dist)
        lut[v] = argmin_dist
    lut_normalized = lut / num_pixel_vals
    J = cv2.LUT(img,lut_normalized)
    return J

In [8]:
img = cv2.imread('trafico.png',0)
J1 = ajustar_tonalidad(img,w_group=0)
J2 = ajustar_tonalidad(img,w_group=1)
J3 = ajustar_tonalidad(img,w_group=2)

cv2.imshow('Imagen original', img)
cv2.imshow('J1', J1)
cv2.imshow('J2', J2)
cv2.imshow('J3', J3)
cv2.waitKey(0)
cv2.destroyAllWindows()

Después de haber obtenido nuestro mapa de tonos ajustado, el paso siguiente es dar textura a esos tonos. Como si fuera un dibujante, para que un dibujo a lápiz pueda conseguir una tonalidad concreta de gris, repiten un patrón de trazos sobre una zona concreta x veces. Los trazos del lápiz superpuestos generan el tono más oscuro o más claro que necesitemos y además dan cierta textura al dibujo.

Para ello, los investigadores plantearon 

In [10]:
def obtener_textura_lapiz(img, H, J):
    
    lamda = 0.2
    altura = img.shape[0]
    anchura = img.shape[1]
    dim = (anchura,altura)
    # Ajustamos nuestra H (textura de lápiz) y nuestra J(tonalidades) para que tengan el mismo tamaño y forma que nuestra imagen
    H_res = cv2.resize(H,dim, interpolation=cv2.INTER_CUBIC)
    H_res_reshaped = np.reshape(H_res, (altura * anchura, 1))
    logH = np.log(H_res_reshaped)
    
    J_res = cv2.resize(J,dim, interpolation=cv2.INTER_CUBIC)
    J_res_reshaped = np.reshape(J_res, (altura * anchura, 1))
    logJ = np.log(J_res_reshaped)
    
    # Para poder realizar el conjugado del gradiente, primero necesitamos unas matrices dispersas
    
    logH_sparse = sparse.spdiags(logH.ravel(), 0, altura*anchura, altura*anchura) 
    e = np.ones((altura * anchura, 1))
    ee = np.concatenate((-e,e), axis=1)
    diags_x = [0, altura*anchura]
    diags_y = [0, 1]

    dx = sparse.spdiags(ee.T, diags_x, altura*anchura, altura*anchura)
    dy = sparse.spdiags(ee.T, diags_y, altura*anchura, altura*anchura)
    
    # Calculamos A y b (para poder resolver nuestra ecuación lineal Ax = b)
    A = lamda * ((dx @ dx.T) + (dy @ dy.T)) + logH_sparse.T @ logH_sparse
    b = logH_sparse.T @ logJ
    
    # Procedemos a calcular el conjugado del gradiente
    beta = sparse.linalg.cg(A, b, tol=1e-6, maxiter=60)
    
    # Ajustamos el resultado al tamaño de la imagen original
    beta_reshaped = np.reshape(beta[0], (altura, anchura))
    
    # The final pencil texture map T
    T = np.power(H_res, beta_reshaped)
    
    return T

In [11]:
img = cv2.imread("trafico.png",0)
H = cv2.imread("pencil1.jpg",0)
S = obtener_trazado(img,8,8)
J = ajustar_tonalidad(img,w_group=2)
T = obtener_textura_lapiz(img,H,J)
cv2.imshow('Dibujo final', T)
cv2.waitKey(0)
cv2.destroyAllWindows()

In [6]:
def obtener_textura_lapiz2(img, H, J,num_betas):
    
    altura = img.shape[0]
    anchura = img.shape[1]
    dim = (anchura,altura)
    print(img.shape)

    # Ajustamos nuestra H (textura de lápiz) y nuestra J(tonalidades) para que tengan el mismo tamaño y forma que nuestra imagen
    H_res = cv2.resize(H,dim, interpolation=cv2.INTER_CUBIC)
    print(H_res.shape)
    H_normalizada = (H_res - np.min(H_res.ravel())) / (np.max(H_res.ravel()) - np.min(H_res.ravel()))
    rows,cols = H_normalizada.shape
    n=0.7
    r=np.max(H_normalizada)
    c=r/pow(r,n)
    imgRaiz = np.zeros_like(H_normalizada)
    for i in range(rows):
        for j in range(cols):
            imgRaiz[i,j]=c*(pow(H_normalizada[i,j],n))
    
    h_res = cv2.GaussianBlur(imgRaiz,(3,3),0)
    cv2.imshow('Raiz',imgRaiz)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    cv2.imshow('H_normalizada', H_normalizada)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    J_res = cv2.resize(J,dim, interpolation=cv2.INTER_CUBIC)
    cv2.imshow('J', J_res)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    
    res_map = np.zeros((altura, anchura, num_betas))
    algo = np.ones_like(res_map)
    
    for i in range(1,num_betas):
        beta = 1 - i/num_betas
        res_map[:,:,i] = h_res**beta
        algo[:,:,i] = np.abs(J_res - res_map[:,:,i])
        
    mapa_indices = np.argmin(algo,axis=2)

    C = np.zeros_like(res_map)
    for i in range(1,num_betas):
        #Aquí creamos las distintas clasificaciones del gradiente según la dirección que toma cada pixel
        #Guardaremos en Ci los pixeles de G en las posiciones donde nuestro mapa de direcciones tenga el valor de la direccion i
        #En otro caso será 0
        C[:,:,i] = res_map[:,:,i] * (mapa_indices == i)
        
    
    T = np.sum(C, axis = 2)
    
    return T

In [7]:
img = cv2.imread("trafico.png",0)
J = ajustar_tonalidad(img,w_group=2)
H = cv2.imread("pencil1.jpg",0)
T = obtener_textura_lapiz2(img,H,J,100)
T2 = obtener_textura_lapiz(img,H,J)
cv2.imshow('Texturas', T)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.imshow('Texturas2', T2)
cv2.waitKey(0)
cv2.destroyAllWindows()
S = obtener_trazado(img,8,8)
R = np.multiply(S,T)
R2 = np.multiply(S,T2)
cv2.imshow('Dibujo final', R)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.imshow('Dibujo final 2', R2)
cv2.waitKey(0)
cv2.destroyAllWindows()

(760, 1140)
(760, 1140)
