# Introdução

Atividade produzida para a disciplina EBM116 – Tópicos Avançados em Imagens Médicas do programa de pós-graduação em Engenharia Biomédica da Universidade Federal do ABC (UFABC). O objetivo da atividade foi explorar diferentes medidas relacionadas à segmentação e à textura de imagens.

Autor: Leonardo Alves Ferreira

# Sumário

1. Segmentação <br>
    1.1 [Sobreposição de Volume e Medida de Similaridade de Dice](#ex1) <br>
    1.2 [Distância de Hausdorff](#ex2) <br>
2. Textura <br>
    2.1 [Matriz de Coocorrência](#ex3) <br>
    2.2 [Contraste](#ex4) <br>

# Segmentação

## Sobreposição de Volume e Medida de Similaridade de Dice <a name="ex1"></a>

Iremos analisar as medidas de sobreposição de volume (VOE, do inglês <i>Volume Overlap</i>) e de medida de similaridade de Dice (DSM, do inglês <i>Dice Similarity Measura</i>) para a seguinte imagem:

<img src="img_voe_dsm.png" width="300">

Nela, os pixeis em vermelho correspondem exclusivamente à máscara obtida em uma segmentação manual; os em azul correspondem exclusivamente à máscara obtida em uma segmentação automática; e os em amarelo correspondem à area em que as duas máscaras se sobrepoem. Nesse caso, considerando que a máscara obtida na segmentação manual é nosso <i>ground truth</i>, podemos utilizar as medidas VOE e DSM para avaliar a efetividade do algoritmo de segmentação automática.

A VOE é dada por:

\begin{equation*}
VOE = 100\% \frac{V_m \cap V_a}{V_m \cup V_a},
\end{equation*}

onde $V_m$ é o volume da região segmentada manualmente e $V_a$ o da segmentada pelo algoritmo automático. Contando os pixeis da imagem, temos que:
* $V_m \cap V_a = 5$
* $V_m \cup V_a = 16$

Logo:

In [1]:
print(f"VOE = {100*5/16} %")

VOE = 31.25 %


Já a DSM é dada por:

\begin{equation*}
DSM = 2\frac{V_m \cap V_a}{V_m + V_a}.
\end{equation*}

Contando os pixeis da imagem, temos que:
* $V_m + V_a = 14 + 7 = 21$

Logo:

In [2]:
print(f"DSM = {2*5/21:.2f}")

DSM = 0.48


## Distância de Hausdorff <a name="ex2"></a>

Dado dois conjuntos de pontos, A e B, a distância de Hausdorff de A para B é a distância máxima dos pontos de A para o ponto mais próximo de B. Essa medida é dada pela equação:

\begin{equation*}
h(A,B) = max_{a \in A}[ min_{b \in B}[d(a,b)]],
\end{equation*}

onde $d(a,b)$ é alguma medida de distância escolhida, como por exemplo a distância Euclidiana.

Iremos calcular h(A,B) e h(B,A) para os conjuntos de pontos da seguinte figura:

<img src="hausdorff_1.png" width="300">

Nela, os pontos em vermelho pertencem ao conjunto A, enquanto os em azul ao conjunto B. Para calcular a distância de Hausdorff manualmente, um passo que pode facilitar é a organização dos valores de distância em uma tabela, conforme a construida a seguir:

| $d$      | $b_1$        | $b_2$        | $min(a)$ |
|----------|--------------|--------------|----------|
| $a_1$    | $d(a_1,b_1)$ | $d(a_1,b_2)$ |          |
| $a_2$    | $d(a_2,b_1)$ | $d(a_2,b_2)$ |          |
| $a_3$    | $d(a_3,b_1)$ | $d(a_3,b_2)$ |          |
| $min(b)$ |              |              |          |

Pegando as coordenadas da imagem, temos:
* $a_1 = (0,1)$
* $a_2 = (0,2)$
* $a_3 = (1,4)$
* $b_1 = (2,1)$
* $b_2 = (4,3)$

Utilizando a fórmula da distância Euclidiana, podemos calcular as distâncias da tabela:

In [3]:
import numpy as np

print(f"d(a1,b1) = {np.sqrt((0-2)**2 + (1-1)**2):.2f}")
print(f"d(a1,b2) = {np.sqrt((0-4)**2 + (1-3)**2):.2f}")
print(f"d(a2,b1) = {np.sqrt((0-2)**2 + (2-1)**2):.2f}")
print(f"d(a2,b2) = {np.sqrt((0-4)**2 + (2-3)**2):.2f}")
print(f"d(a3,b1) = {np.sqrt((1-2)**2 + (4-1)**2):.2f}")
print(f"d(a3,b2) = {np.sqrt((1-4)**2 + (4-3)**2):.2f}")

d(a1,b1) = 2.00
d(a1,b2) = 4.47
d(a2,b1) = 2.24
d(a2,b2) = 4.12
d(a3,b1) = 3.16
d(a3,b2) = 3.16


Substituindo esses valores na tabela, temos:

| $d$      | $b_1$   | $b_2$   | $min(a)$ |
|----------|---------|---------|----------|
| $a_1$    | $2.00$  | $4.47$  | $2.00$   |
| $a_2$    | $2.24$  | $4.12$  | $2.24$   |
| $a_3$    | $3.16$  | $3.16$  | $3.16$   |
| $min(b)$ | $2.00$  | $3.16$  |          |

Com isso, temos que as distâncias de Hausdorff são:

* h(A,B) = max(min(a)) = 3.16
* h(B,A) = max(min(b)) = 3.16

Podemos também criar uma função para automatizar esses cálculos, como demonstrado a seguir:

In [4]:
def hausdorff(a,b):
    min_a=[]

    for c_a in a:
        d_ca = []
        
        for c_b in b:
            d_ca.append(np.sqrt((c_a[0]-c_b[0])**2 + (c_a[1]-c_b[1])**2))
            
        min_a.append(np.min(np.array(d_ca)))
        
    h = np.max(np.array(min_a))
    
    return h

Usando essa função nas coordenadas do exemplo, obtemos:

In [5]:
# Codificar as coordenadas
a = np.array([(0,1),(0,2),(1,4)])
b = np.array([(2,1),(4,3)])

# Realizar os cálculos das distâncias de Hausdorff
h_ab = hausdorff(a,b)
h_ba = hausdorff(b,a)

print(f"h(A,B) = {h_ab:.2f}")
print(f"h(B,A) = {h_ba:.2f}")

h(A,B) = 3.16
h(B,A) = 3.16


Como pode ser visto, obtivemos o mesmo resultado dos cálculos manuais. Para garantir que os dois estão corretos, podemos verificar usando a função directed_hausdorff implementada na biblioteca Scipy:

In [6]:
from scipy.spatial.distance import directed_hausdorff

# Realizar os cálculos das distâncias de Hausdorff
h_ab = directed_hausdorff(a,b)
h_ba = directed_hausdorff(b,a)

print(f"h(A,B) = {h_ab[0]:.2f}")
print(f"h(B,A) = {h_ba[0]:.2f}")

h(A,B) = 3.16
h(B,A) = 3.16


Novamente, os mesmos resultados foram obtidos.

Considerando a adição de um novo ponto (-1,3) no conjunto A, teriamos a figura:

<img src="hausdorff_2.png" width="300">

Realizando novamente os cálculos para esse novo conjunto A obtemos, utilizando a função que implementamos, os seguintes resultados:

In [7]:
# Codificar o novo conjunto A
a = np.array([(-1,3),(0,1),(0,2),(1,4)])

# Realizar os cálculos das distâncias de Hausdorff
h_ab = hausdorff(a,b)
h_ba = hausdorff(b,a)

print(f"h(A,B) = {h_ab:.2f}")
print(f"h(B,A) = {h_ba:.2f}")

h(A,B) = 3.61
h(B,A) = 3.16


Como pode ser visto, essa alteração no conjunto A resultou em alteração apenas na distância de Hausdorff de A para B. Isso ocorreu porque o ponto adicionado é o novo mais distante dos pontos do conjunto B. Logo, a nova distância de Hausdorff foi a distância entre ele e o ponto de B mais próximo a ele, resultando em um novo valor. 

Já no caso da distância de Hausdorff de B para A, esse novo ponto não afeta o cálculo, uma vez que são consideradas a distância dos pontos de B para os pontos mais próximos deles em A, e, como dito anteriormente, esse novo ponto é o mais distante de todos os pontos de B. 

# Textura

## Matriz de Coocorrência <a name="ex3"></a>

Para calcular a matriz de coocorrência, iremos utilizar de exemplo a a imagem dada pela matriz:

\begin{equation*}
I=\begin{bmatrix}
1 & 2 & 1 & 8 & 7 & 6\\ 
1 & 4 & 7 & 3 & 8 & 2\\ 
8 & 8 & 4 & 5 & 4 & 3\\ 
4 & 3 & 4 & 5 & 5 & 1\\ 
7 & 8 & 6 & 2 & 6 & 2\\ 
8 & 7 & 8 & 7 & 6 & 2
\end{bmatrix}
\end{equation*}

Primeiramente, iremos reduzir o número de níveis de cinza da imagem de 3 bit para 2 bit utilizando a regra: {1,2} -> {1}; {3,4} -> {2}; {5,6} -> {3}; {7,8} -> {4}. Com isso, obtemos a matriz:

\begin{equation*}
J=\begin{bmatrix}
1 & 1 & 1 & 4 & 4 & 3\\ 
1 & 2 & 4 & 2 & 4 & 1\\ 
4 & 4 & 2 & 3 & 2 & 2\\ 
2 & 2 & 2 & 3 & 3 & 1\\ 
4 & 4 & 3 & 1 & 3 & 1\\ 
4 & 4 & 4 & 4 & 3 & 1
\end{bmatrix}
\end{equation*}

Para calcular a matriz de coocorrência, devemos escolher uma regra $Q=[l,c]$, onde $l$ é a distância do pixel para o seu vizinho nas linhas, e $c$ a distância nas colunas. Escolhendo uma regra $Q=[1,0]$, por exemplo, o elemento $G(1,2)$ da matriz de coocorrência será o número de pixels 1 na imagem que tem o pixel 2 na linha imediatamente abaixo. Aplicando essa regra para a imagem toda, obtemos a matriz apresentada na seguinte figura (elaborada pelo autor):

<img src="glcm_1.png" width="300">

Nessa figura, a matriz é dada pela região dentro das bordas vermelhas, e os números em cinza no exterior são os índices para facilitar o cálculo.

A matriz de probabilidade correspondente a essa matriz de coocorrência pode ser calculando, com o elemento $P(i,j)$ sendo dado por $\frac{G(i,J)}{N}$, onde $N$ é a somatória de todos os valores da matriz G. Somando os valores da matriz apresentada na imagem acima, temos que $N=30$. Logo, a matriz de propabilidade é:



In [11]:
# Matriz de coocorrência
G = np.array([[3,2,0,3],[1,1,3,2],[2,0,3,1],[0,5,0,3]])

N = 3+2+0+3+1+1+3+2+2+0+3+1+0+5+0+3

# Matriz de probabilidade
P = G/N
print("O resultado da matriz P é:\n")
print(np.round(P,2))

O resultado da matriz P é:

[[0.1  0.07 0.   0.1 ]
 [0.03 0.03 0.1  0.07]
 [0.07 0.   0.1  0.03]
 [0.   0.17 0.   0.1 ]]


Podemos checar esses cálculos utilizando as funções greycomatrix e greycoprops, implementadas na biblioteca Skimage. Para definir a regra Q na função greycomatrix, é preciso definir um número de distância e um número de ângulo. Como estamos utilizando a regra do pixel imediatamente abaixo, isso corresponde a uma distância de 1 e um ângulo de 90º (porque em imagens, a linha de baixo é considerada como sendo a direção indo para cima no eixo y), conforme feito abaixo:

In [10]:
from skimage.feature import greycomatrix

# Codificação da matriz original
I = np.array([[1,2,1,8,7,6],[1,4,7,3,8,2],[8,8,4,5,4,3],[4,3,4,5,5,1],[7,8,6,2,6,2],[8,7,8,7,6,2]])
print("I = \n")
print(I)

# Diminuição do número de levels da matriz
J = (I+1) // 2
print("\nJ = \n")
print(J)

# Cálculo da matriz de coocorrência
G = greycomatrix(J,distances=[1],angles=[np.pi/2],levels=5)
G = np.squeeze(G) # Remover dimensão singleton
G = G[1:,1:] # Remover a linha e coluna correpondendo ao índice 0
print("\nG = \n")
print(G)

# Cálculo da matriz de probabilidade
P = G / np.sum(G)
print("\nP = \n")
print(np.round(P,2))

I = 

[[1 2 1 8 7 6]
 [1 4 7 3 8 2]
 [8 8 4 5 4 3]
 [4 3 4 5 5 1]
 [7 8 6 2 6 2]
 [8 7 8 7 6 2]]

J = 

[[1 1 1 4 4 3]
 [1 2 4 2 4 1]
 [4 4 2 3 2 2]
 [2 2 2 3 3 1]
 [4 4 3 1 3 1]
 [4 4 4 4 3 1]]

G = 

[[3 2 0 3]
 [1 1 3 3]
 [2 0 3 1]
 [0 5 0 3]]

P = 

[[0.1  0.07 0.   0.1 ]
 [0.03 0.03 0.1  0.1 ]
 [0.07 0.   0.1  0.03]
 [0.   0.17 0.   0.1 ]]


Como pode ser visto, os resultados da função são os mesmos obtidos pelos cálculos manuais, mostrando que os procedimentos foram realizados corretamente.

## Contraste <a name="ex4"></a>

Iremos agora calcular o contraste para a imagem dada pela matriz:

\begin{equation*}
I=\begin{bmatrix}
0 & 1 & 0 & 3 \\ 
2 & 0 & 1 & 1 \\ 
0 & 3 & 3 & 2 \\ 
3 & 2 & 2 & 1 
\end{bmatrix}
\end{equation*}

Para isso, utilizaremos duas regras distintas:
* $Q_1:$ q é o pixel diretamente ao lado direito.
* $Q_2:$ q é o pixel abaixo.

No primeiro caso, contabilizando os elementos obtemos a matriz:

<img src="glcm_21.png" width="300">

Já no segundo caso, o resultado é de:

<img src="glcm_22.png" width="300">

Os valores de contraste podem ser calculados por meio da equação:

\begin{equation*}
C = \sum_{i=1}^{K} \sum_{j=1}^{K} (i-j)^2 p_{ij} = \frac{1}{N}\sum_{i=1}^{K} \sum_{j=1}^{K} (i-j)^2 g_{ij},
\end{equation*}

onde $K$ é o número de levels de cinza da imagem, $p_{ij}$ é a probabilidade da matriz de coocorrência e N é a soma dos valores das matrizes de coocorrência. Nesse caso, somando todos os elementos, temos que $N=12$. Logo, calculando o contraste de cada caso obtemos que:

In [7]:
N=12

# Cálculo de C1, explicitando apenas os termos diferentes de 0
C1 = (1/N)*((0-1)**2*2 + (0-3)**2*2 + (1-0)**2*1 + (2-0)**2*1 + (2-1)**2*1 + (3-2)**2*1)

# Cálculo de C2, explicitando apenas os termos diferentes de 0
C2 = (1/N)*((0-1)**2*1 + (0-2)**2*2 + (0-3)**2*2 + (1-0)**2*1 + (1-2)**2*1 + (1-3)**2*1 + (2-0)**2*1 \
            + (2-1)**2*1 + (3-1)**2*1 + (3-2)**2*2)

print(f"O contraste da imagem utilizando a regra 1 é C1 = {C1:.2f} e o considerando a regra 2 é C2 = {C2:.2f}.")

O contraste da imagem utilizando a regra 1 é C1 = 2.25 e o considerando a regra 2 é C2 = 3.67.


Como pode-se ver, o primeiro caso resultou em um contraste menor. Isso ocorreu porque, ao considerar a regra do vizinho ao lado, surgiram alguns casos de elementos que são vizinhos de pixeis do mesmo valor, o que não ocorreu quando consideramos a regra do vizinho de baixo. Isso pode ser visto pela diagonal da matriz $G_1$, que tem valores diferentes de 0 em algumas posições, enquanto a de $G_2$ só possui valores nulos.

Na equação do contraste esses termos não alteram a somatória, uma vez que quando $i=j$ temos que $(i-j)^2g_{ij}=0$. Com isso, a o valor da soma no primeiro caso foi menor que no segundo. 