Métricas de assertividade dos modelos

|             |  CNN    |  MobileNet    |  ViT    |  BEiT    |  ResNet    |  ResNetXt    |
|-------------|---------|---------|---------|---------|---------|---------|
|Precisão     | 0.12   | 0.14   | 0.76   | 0.79   | 0.84   | 0.66   |
|Acurácia     | 0.21   | 0.26   | 0.75   | 0.80   | 0.78   | 0.65   |
|Recall       | 0.16    | 0.20    | 0.72    | 0.82    | 0.73    | 0.60    |
|F1-score     | 0.15    | 0.14    | 0.73    | 0.79    | 0.76    | 0.62    |



Métricas de Custo dos modelos

|             |  CNN    |  MobileNet    |  ViT    |  BEiT    |  ResNet    |  ResNetXt    |
|-------------|---------|---------|---------|---------|---------|---------|
|IPS     | 193   | 59   | 4       | 4       | 9       | 8       |
|MTP     |   8   | 4    | 86      | 86      | 26      | 25      |
|TPI     | 5     | 17   | 264     | 279     | 115     | 126     |
|MS      | 96    | 7    | 327     | 330     | 90      | 88     |

### <b> Abordagem 1: Avaliação de Classificadores no Reconhecimento de Formas Geométricas Tridimensionais </b>

#### <b> Objetivos </b>

*   Aprimorar o processo de ensino e aprendizagem da Matemática no Brasil, esse trabalho apresenta uma metodologia para o treinamento e avaliação de modelos de IA para integração futura com uma aplicação de apoio Ensino de Geometria Tridimensional no Metaverso;
*   Avaliação dos modelos diretamente baseada nas métricas de Machine Learning e desempenho de inferência;
*   Selecionar o modelo de maior assertividade e eficiência computacional, garantindo ao mesmo tempo a mais alta qualidade na experiência futura do usuário por meio de um aplicativo, denominado Geometa.
*   Reprodução do trabalho enviado para o LA-CCI em 2023 com a diferença de avaliar somente os modelos ResNet, BEiT e ViT por meio de duas métricas de Machine Learning e três métricas de desempenho de inferência.

#### <b> Método </b>

*   Treinar modelos para o Reconhecimento de Formas Geométricas Tridimensionais por meio de imagens do mundo real;
*   Avaliar os modelos com base nas métricas de Machine Learning:

<br>
  
$$
  \text{Precisão} = \frac{\text{Verdadeiros Positivos}}{\text{Verdadeiros Positivos} + \text{Falsos Positivos}}
$$

<br>

$$
  \text{F1-Score} = \frac{\text{Verdadeiros Positivos}}{\text{Verdadeiros Positivos} + \frac{1}{2}(\text{Falsos Positivos + Falsos Negativos})}
$$

<br>

*   Avaliar os modelos com base nas métricas de Desempenho de Inferência:

<br>

$$
\text{Total de Parâmetros} = N
$$

<br>

$$
\text{Conv Multiply-Accumulate Operations (MACs)} = F \times Kx \times Ky \times Cin \times Wout \times Hout \\
\text{Dense Multiply-Accumulate Operations (MACs)} = N_{in} \times N_{out}
$$

<br>

$$
\text{Giga Float Point Operations per Second (GFLOPs)} = \frac{2 \cdot \text{MACs}}{10^{9}}
$$

<br>

*   Selecionar o modelo de melhor desempenho.



### <b> Abordagem II: Avaliação de Desempenho $S\phi$ em Assertividade e Custo Computacional</b>
#### <b>Estudo de caso: Reconhecimento de Formas Geométricas Tridimensionais</b>

#### <b> Modelagem do problema </b>

Considere um problema de otimização multiobjetivo que envolve tanto a maximização da assertividade de um modelo de Deep Learning, denotada por $A(m)$, quanto a minimização do custo computacional, denotada por $C(m)$. A formulação proposta busca encontrar um modelo $m$ que ofereça um equilíbrio ótimo entre assertividade e eficiência computacional. Para tal, introduzimos um parâmetro $\lambda$, que balanceia esses dois objetivos, controlando a importância relativa de cada um.

<br>

  $$
  \underset{m}{\text{maximizar}} \quad {S\phi(m)} = \lambda \cdot A(m) + (1 - \lambda) \cdot C(m) \\
  A(m) = \sum_{i}{w_i^a \cdot a_i(m)} \\
  C(m) = -\sum_{j}{w_j^c \cdot c_j(m)} \\
  \quad \text{sujeito a} \space \space \quad m \in M \text{(conjunto de modelos)} \quad \quad \quad \\
  \frac{1}{2} \leq \lambda \leq 1 \quad \quad \quad \quad \quad \\
  \quad \quad \space 0 \leq w_i^a, w_j^c \leq 1, \quad \forall i,j \in \mathbb{N}
  $$

#### <b> Implementação </b>
A implementação deste modelo de problema envolve avaliar e comparar o desempenho de modelos de Inteligência Artificial por meio de um conjunto de métricas quaisquer. O método visa considerar tanto a assertividade quanto o custo computacional dos modelos na classificação.

In [1]:
import numpy as np
from pyDecision.algorithm import ahp_method
import json
import pandas as pd
import matplotlib.pyplot as plt

In [2]:
# Parameters
weight_derivation = 'geometric' # 'mean'; 'geometric' or 'max_eigen'

# Dataset for assertiveness metrics (P -> A -> R)
dataset = np.array([
  #P      A      R
  [1  ,   5,     7   ],   #P
  [1/5,   1,     3   ],   #A
  [1/7,   1/3,   1   ],   #R
])

In [3]:
# Parameters
weight_derivation = 'geometric' # 'mean'; 'geometric' or 'max_eigen'

# Dataset for cost metrics (MTP -> TPI -> MS)
dataset = np.array([
  #MTP    TPI    MS
  [  1,     5,   7   ],   #MTP
  [1/5,     1,   3   ],   #TPI
  [1/7,   1/3,   1   ],   #MS
])

In [4]:
# Call AHP Function
weights, rc = ahp_method(dataset, wd = weight_derivation)

In [6]:
w1, w2, w3 = weights[0], weights[1], weights[2]

In [7]:
print(f"{w1}, {w2}, {w3}")

0.7306446713611295, 0.1883940966391198, 0.0809612319997507


In [5]:
# Weigths
for i in range(0, weights.shape[0]):
  print('w('+str(i+1)+'): ', round(weights[i], 3))

w(1):  0.731
w(2):  0.188
w(3):  0.081


In [6]:
# Consistency Ratio
print('RC: ' + str(round(rc, 2)))
if (rc > 0.10):
  print('The solution is inconsistent, the pairwise comparisons must be reviewed')
else:
  print('The solution is consistent')

RC: 0.06
The solution is consistent


Exemplos de casos envolvendo conjuntos de métricas obtidas pela avaliação de modelos.

In [8]:
cnn = {"assertividade": {
                            "precision":0.12,
                            "accuracy":0.21,
                            "recall":0.16,
                           },
                 "custo": {
                            "mtp":8, # model total parameters
                            "tpi":5, # time per inference
                            "ms":96 # model size
                          }
                }
mobileNet = {"assertividade": {
                            "precision":0.14,
                            "accuracy":0.26,
                            "recall":0.20,
                           },
                 "custo": {
                            "mtp":4, # model total parameters
                            "tpi":17, # time per inference
                            "ms":7 # model size
                          }
                }
vit = {"assertividade": {
                            "precision":0.76,
                            "accuracy":0.75,
                            "recall":0.72,
                           },
                 "custo": {
                            "mtp":86, # model total parameters
                            "tpi":264, # time per inference
                            "ms":327 # model size
                          }
                }
beit = {"assertividade": {
                            "precision":0.79,
                            "accuracy":0.80,
                            "recall":0.82,
                           },
                 "custo": {
                            "mtp":86, # model total parameters
                            "tpi":279, # time per inference
                            "ms":330 # model size
                          }
                }
resnet = {"assertividade": {
                            "precision":0.84,
                            "accuracy":0.78,
                            "recall":0.73,
                           },
                 "custo": {
                            "mtp":26, # model total parameters
                            "tpi":115, # time per inference
                            "ms":90 # model size
                          }
                }
resnetXt = {"assertividade": {
                            "precision":0.66,
                            "accuracy":0.65,
                            "recall":0.60,
                           },
                 "custo": {
                            "mtp":25, # model total parameters
                            "tpi":126, # time per inference
                            "ms":88 # model size
                          }
                }

caso_modelos = [cnn, mobileNet, vit, beit, resnet, resnetXt]
modelos = caso_modelos
modelos

[{'assertividade': {'precision': 0.12, 'accuracy': 0.21, 'recall': 0.16},
  'custo': {'mtp': 8, 'tpi': 5, 'ms': 96}},
 {'assertividade': {'precision': 0.14, 'accuracy': 0.26, 'recall': 0.2},
  'custo': {'mtp': 4, 'tpi': 17, 'ms': 7}},
 {'assertividade': {'precision': 0.76, 'accuracy': 0.75, 'recall': 0.72},
  'custo': {'mtp': 86, 'tpi': 264, 'ms': 327}},
 {'assertividade': {'precision': 0.79, 'accuracy': 0.8, 'recall': 0.82},
  'custo': {'mtp': 86, 'tpi': 279, 'ms': 330}},
 {'assertividade': {'precision': 0.84, 'accuracy': 0.78, 'recall': 0.73},
  'custo': {'mtp': 26, 'tpi': 115, 'ms': 90}},
 {'assertividade': {'precision': 0.66, 'accuracy': 0.65, 'recall': 0.6},
  'custo': {'mtp': 25, 'tpi': 126, 'ms': 88}}]

Definição dos pesos de cada uma das métricas de assertividade e custo computacional.

In [9]:
wa = [0.731, 0.188, 0.081] # Precision, Acuraccy, Recall
wc = [0.731, 0.188, 0.081] #

Definição as funções de acesso às métricas de cálculo da assertividade e custo do modelo, além do parâmetro de controle $\lambda$.

In [10]:
a = lambda modelo: modelo["assertividade"].values() # assertividade
c = lambda modelo: modelo["custo"].values() # custo

In [11]:
c(caso_modelos[4])

dict_values([26, 115, 90])

Definição das métricas utilizadas para a avaliação dos modelos.

In [12]:
metricas_a = ["precision", "accuracy", "recall"]
metricas_c = ["mtp", "tpi", "ms"]
epsilon = 1e-5 # Parâmetro da padronização para evitar divisão por zero

**Normalização Min-Max**

In [13]:
maximo_a = lambda modelos, metrica: np.max([modelo["assertividade"][metrica] for modelo in modelos]) # maximo da métrica de assertividade
minimo_a = lambda modelos, metrica: np.min([modelo["assertividade"][metrica] for modelo in modelos]) # minimo da métrica de assertividade

maximo_c = lambda modelos, metrica: np.max([modelo["custo"][metrica] for modelo in modelos]) # maximo da métrica de custo
minimo_c = lambda modelos, metrica: np.min([modelo["custo"][metrica] for modelo in modelos]) # minimo da métrica de custo

maximos_a = lambda modelos: [maximo_a(modelos, metrica) for metrica in metricas_a]
maximos_c = lambda modelos: [maximo_c(modelos, metrica) for metrica in metricas_c]

minimos_a = lambda modelos: [minimo_a(modelos, metrica) for metrica in metricas_a]
minimos_c = lambda modelos: [minimo_c(modelos, metrica) for metrica in metricas_c]

N = lambda a_i, maximo, minimo: (a_i - minimo) / (maximo - minimo) # Min-Max

**Valor Agregado de Assertividade (A) e Eficiência (C)**

Os valores normalizados e reduzidos são ponderados pelos pesos e somados para obter o valor agregado para assertividade e custo:
  $$
  Assertiveness(model, w_a^i) = \sum_{i=1}^{n} R(S(a_i, \mu_a, \sigma_a)) \times w_a^i
  $$
  $$
  Cost(model, w_c^i) = \sum_{i=1}^{n} R(S(c_i, \mu_c, \sigma_c)) \times w_c^i
  $$

<div align="center">
  onde $a_i$ e $c_i$ são os valores das métricas de assertividade e custo do modelo, respectivamente.

In [14]:
A = lambda modelo, wa: sum([N(a_i, maximo, minimo) * wa_i for a_i, maximo, minimo, wa_i in zip(a(modelo), maximos_a(modelos), minimos_a(modelos), wa)])
C = lambda modelo, wc: sum([N(c_i, maximo, minimo) * wc_i for c_i, maximo, minimo, wc_i in zip(c(modelo), maximos_c(modelos), minimos_c(modelos), wc)])

**Pontuação $S\phi$**

Os valores agregados de assertividade e eficiência são combinados usando um parâmetro $\lambda\$ (lambda) que define o peso relativo de assertividade versus custo:
  $$
  S\phi(\text{model}) = \lambda \times Assertiveness(model, w_a^i) - (1 - \lambda) \times Cost(model, w_c^i)
  $$

In [15]:
F = lambda modelo: lbd * A(modelo, wa) - (1 - lbd) * C(modelo, wc)

**Execução do método para um caso definido**

In [16]:
maximos_a_values = maximos_a(caso_modelos)
minimos_a_values = minimos_a(caso_modelos)
maximos_c_values = maximos_c(caso_modelos)
minimos_c_values = minimos_c(caso_modelos)
print(f"max_a: {maximos_a_values}, max_c: {maximos_c_values}, min_a: {minimos_a_values}, min_c: {minimos_c_values}")

max_a: [np.float64(0.84), np.float64(0.8), np.float64(0.82)], max_c: [np.int64(86), np.int64(279), np.int64(330)], min_a: [np.float64(0.12), np.float64(0.21), np.float64(0.16)], min_c: [np.int64(4), np.int64(5), np.int64(7)]


Resultados

In [52]:
lbd = 0.85

In [53]:
# Resultado para a assertividade e custo do caso de modelo 1
a1 = A(caso_modelos[0], wa)
c1 = C(caso_modelos[0], wc)
f1 = F(caso_modelos[0])
print(f"a1: {a1}, c1: {c1}, f1: {f1}")

a1: 0.0, c1: 0.05797742203428226, f1: -0.00869661330514234


In [54]:
# Resultado para a assertividade e custo do caso de modelo 2
a2 = A(caso_modelos[1], wa)
c2 = C(caso_modelos[1], wc)
f2 = F(caso_modelos[1])
print(f"a2: {a2}, c2: {c2}, f2: {f2}")

a2: 0.041146849854476995, c2: 0.008233576642335767, f2: 0.03373978587995508


In [55]:
a3 = A(caso_modelos[2], wa)
c3 = C(caso_modelos[2], wc)
f3 = F(caso_modelos[2])
print(f"a3: {a3}, c3: {c3}, f3: {f3}")

a3: 0.89057284711522, c3: 0.9889557072156561, f3: 0.6086435639655885


In [56]:
a4 = A(caso_modelos[3], wa)
c4 = C(caso_modelos[3], wc)
f4 = F(caso_modelos[3])
print(f"a4: {a4}, c4: {c4}, f4: {f4}")

a4: 0.9492361111111112, c4: 1.0, f4: 0.6568506944444444


In [57]:
a5 = A(caso_modelos[4], wa)
c5 = C(caso_modelos[4], wc)
f5 = F(caso_modelos[4])
print(f"a5: {a5}, c5: {c5}, f5: {f5}")

a5: 0.9825816640986132, c5: 0.2924106452603249, f5: 0.7913328176947725


In [58]:
a6 = A(caso_modelos[5], wa)
c6 = C(caso_modelos[5], wc)
f6 = F(caso_modelos[5])
print(f"a6: {a6}, c6: {c6}, f6: {f6}")

a6: 0.7424533898305086, c6: 0.2905419083818417, f6: 0.587504095098656


### TESTES

lambda 0.85

In [59]:
dados = {
    "Modelo": ["CNN", "MobileNet", "ViT", "BEiT", "ResNet", "ResNetXt"],
    "F": [f1, f2, f3, f4, f5, f6],
    "A": [a1, a2, a3, a4, a5, a6],
    "C": [c1, c2, c3, c4, c5, c6]
}
df = pd.DataFrame(dados)
df.sort_values(by="F", ascending=False)

Unnamed: 0,Modelo,F,A,C
4,ResNet,0.791333,0.982582,0.292411
3,BEiT,0.656851,0.949236,1.0
2,ViT,0.608644,0.890573,0.988956
5,ResNetXt,0.587504,0.742453,0.290542
1,MobileNet,0.03374,0.041147,0.008234
0,CNN,-0.008697,0.0,0.057977


lambda 0.8

In [51]:
dados = {
    "Modelo": ["CNN", "MobileNet", "ViT", "BEiT", "ResNet", "ResNetXt"],
    "F": [f1, f2, f3, f4, f5, f6],
    "A": [a1, a2, a3, a4, a5, a6],
    "C": [c1, c2, c3, c4, c5, c6]
}
df = pd.DataFrame(dados)
df.sort_values(by="F", ascending=False)

Unnamed: 0,Modelo,F,A,C
4,ResNet,0.727583,0.982582,0.292411
3,BEiT,0.559389,0.949236,1.0
5,ResNetXt,0.535854,0.742453,0.290542
2,ViT,0.514667,0.890573,0.988956
1,MobileNet,0.031271,0.041147,0.008234
0,CNN,-0.011595,0.0,0.057977


lambda = 0.75

In [43]:
dados = {
    "Modelo": ["CNN", "MobileNet", "ViT", "BEiT", "ResNet", "ResNetXt"],
    "F": [f1, f2, f3, f4, f5, f6],
    "A": [a1, a2, a3, a4, a5, a6],
    "C": [c1, c2, c3, c4, c5, c6]
}
df = pd.DataFrame(dados)
df.sort_values(by="F", ascending=False)

Unnamed: 0,Modelo,F,A,C
4,ResNet,0.663834,0.982582,0.292411
5,ResNetXt,0.484205,0.742453,0.290542
3,BEiT,0.461927,0.949236,1.0
2,ViT,0.420691,0.890573,0.988956
1,MobileNet,0.028802,0.041147,0.008234
0,CNN,-0.014494,0.0,0.057977


lambda 0.5

In [35]:
dados = {
    "Modelo": ["CNN", "MobileNet", "ViT", "BEiT", "ResNet", "ResNetXt"],
    "F": [f1, f2, f3, f4, f5, f6],
    "A": [a1, a2, a3, a4, a5, a6],
    "C": [c1, c2, c3, c4, c5, c6]
}
df = pd.DataFrame(dados)
df.sort_values(by="F", ascending=False)

Unnamed: 0,Modelo,F,A,C
4,ResNet,0.345086,0.982582,0.292411
5,ResNetXt,0.225956,0.742453,0.290542
1,MobileNet,0.016457,0.041147,0.008234
3,BEiT,-0.025382,0.949236,1.0
0,CNN,-0.028989,0.0,0.057977
2,ViT,-0.049191,0.890573,0.988956


Lambda 0.25

In [26]:
dados = {
    "Modelo": ["CNN", "MobileNet", "ViT", "BEiT", "ResNet", "ResNetXt"],
    "F": [f1, f2, f3, f4, f5, f6],
    "A": [a1, a2, a3, a4, a5, a6],
    "C": [c1, c2, c3, c4, c5, c6]
}
df = pd.DataFrame(dados)
df

Unnamed: 0,Modelo,F,A,C
0,CNN,-0.043483,0.0,0.057977
1,MobileNet,0.004112,0.041147,0.008234
2,ViT,-0.519074,0.890573,0.988956
3,BEiT,-0.512691,0.949236,1.0
4,ResNet,0.026337,0.982582,0.292411
5,ResNetXt,-0.032293,0.742453,0.290542
