# Trabalho Final - Visualização da Informação

## Visualização de múltiplas métricas de modelos de Machine Learning

**Aluna:** Vitória Guardieiro

A ideia deste projeto é representar visualmente valores obtidos para múltiplas métricas extraídas de um conjunto de modelos de Machine Learning com o objetivo de consguir compará-los e identificar padrões neles. Ela surgiu a partir de experimentos que realizei no meu Trabalho de Conclusão de Curso, onde propus duas estratégias para o treinamento de modelos de Machine Learning minimizando a discriminação gerada por eles ao mesmo tempo maximizando desempenho.

Como um dos experimentos feitos para avaliar as estratégias propostas, comparei os resultados obtidos para quatro métricas diferentes, sendo uma de desempenho (acurácia) e três de discriminação (paridade demográfica, igualdade de oportunidade e coeficiente de variação), ao tentar otimizar individualmente cada uma das métricas, comparando os resultados obtidos para o mesmo conjunto de dados para cinco outras estratégias mais utilizadas da área de discriminação em inteligência artificial.

Em geral, os trabalhos que realizam comparações desta forma reportam os resultados apenas em tabelas e, por conta disso, pensei que poderia fazer da mesma forma para o meu TCC. Entretanto, no fim do experimento eu estava comparando  28  modelos diferentes  ((2 meus+5 comparados)⋅4 métricas otimizadas para cada um)  e cada um dos  28  possuindo  4  valores diferentes, um para cada métrica. A seguir apresento a tabela com eles.

Com tantos valores assim a serem comparados, é bastante cansativo e até mesmo difícil conseguir comparar e extrair padrões dos dados em tabela, então precisei encontrar alguma forma de representar esses dados num formato mais digerível.

Para conhecer um pouco mais sobre as pesquisas que focam na discriminação de modelos de machine learning, sugiro o artigo: https://towardsdatascience.com/a-tutorial-on-fairness-in-machine-learning-3ff8ba1040cb

# 1. Os dados

Como explicado na introdução, os dados que serão visualizados estão nessa tabela 7x4x4, contendo 7 estratégias de modelagem, cada uma com 4 modelos diferentes e para cada modelo, 4 valores que são os resultados obtidos para cada métrica escolhida.

In [3]:
import pandas as pd

german_result_metrics = pd.read_csv('Dados/german_result_metrics.csv')
german_result_metrics = german_result_metrics.rename(columns={'Unnamed: 0':'method', 'Unnamed: 1':'metric'})
german_result_metrics = german_result_metrics.set_index(['method', 'metric'])

german_result_metrics

Unnamed: 0_level_0,Unnamed: 1_level_0,accuracy,equal_opportunity,p_percent,c_variation
method,metric,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
LogReg,accuracy,0.613333,0.950782,0.809045,0.840284
LogReg,equal_opportunity,0.598095,0.933886,0.812121,0.793304
LogReg,p_percent,0.592381,0.949041,0.91148,0.724168
LogReg,c_variation,0.575238,0.961212,0.991262,0.54228
RegEqual,accuracy,0.613333,0.935186,0.806791,0.857412
RegEqual,equal_opportunity,0.594286,0.9767,0.92101,0.659565
RegEqual,p_percent,0.586667,0.956499,0.910672,0.672421
RegEqual,c_variation,0.567619,0.961341,0.990279,0.586062
RegDemo,accuracy,0.601905,0.899665,0.775477,0.866606
RegDemo,equal_opportunity,0.571429,0.995455,0.997101,0.494407


Dentre as quatros métricas, em três delas queremos maximizar o valor obtido, enquanto que em uma (coeficiente de variação) o objetivo é minimizar.

# 2. Visualizações

## 2.1. Gráficos de coordenadas paralelas

A primeira tentativa de visualização foi a seguinte, utilizando do formato de coordenadas paralelas. 

Nela, cada linha representa um dos 28 modelos e os eixos representam os valores obtidos para as métricas, assim como qual métrica foi otimizada pelo modelo e qual a estratégia foi utilizada para gerá-lo.


![Coordenadas Paralelas - Tentativa 1](Visualizações/CoordParalelas1.png)

Alguns problemas que foram percebidos nessa visualização foram:

- Informações duplicadas no eixo "Modelo" e na cor
- Dá a impressão errada de que as métricas P porcento e Coeficiente de variação são conflitantes, já que em uma queremos maximizar e na outra queremos minimizar
- Não é possível observar os resultados de um único modelo, por conta das linhas se encontrarem nos eixos
- É difícil identificar até mesmo os padrões entre as estratégias, devido à escolha de cores

Por conta disso, refiz a visualização mudando algumas coisas:


![Coordenadas Paralelas - Tentativa 2](Visualizações/CoordParalelas2.png)

Nela foram resolvidos os problemas de duplicação de informação e da proporcionalidade entre as métricas, mas continua difícil ideentificar um único modelo, assim como o conjunto de modelos de uma estratégia.

Assim, gerei uma terceira visualização, tentando resolver os problemas restantes.

![Coordenadas Paralelas - Tentativa 3](Visualizações/CoordParalelas3.png)

Nessa visualização alterei as cores de forma que os modelos propostos no trabalho (ProbMO e ErroMO) ficassem com as cores mais fortes, enquando que os demais modelos ficaram com cores mais claras. Isso facilitou identificar o conjunto de modelos por estratégia, mas não permite a identificação de um único modelo.

Com o problema de identificação de um único modelo não tendo sido solucionada ainda, decidi testar outro tipo de gráfico para representá-los.

## 2.2. Gráficos de Radares

Assim, tentei abordar a representação por radares. Na primeira visualização, coloquei todos os modelos juntos e removi o eixo que indicava qual métrica era otimizada, substituindo ele pelo estilo da linha.

![Radares - Tentativa 1](Visualizações/Radar1.jpg)

Desta forma facilita a identificação de um único modelo, desde que ele esteja nas cores mais fortes.

Uma vantagem bastante importante que reparei nessa visualização em relação à de coordenadas paralelas é que o formato e área dos radares me indicam coisas novas sobre os modelos que a visualização anterior não conseguia indicar. 

O formato indica o conflito (ou *tradeoof*) entre as métricas para cada modelo, por exemplo o modelo MoProb que otimiza cVar tem quase que a forma de um triângulo, tendo valores para as métricas de discriminação bastante bons, mas o valor para acurácia é bastante baixo, enquanto que o modelo MoProb que otimiza Acc tem uma forma mais parecida com um trapézio, sendo bom em acurácia, mediano em cVar e bastante ruim para as duas outras métricas.

Já a área, e não me refiro ao valor dá área, mas sim na comparação entre áreas maiores e menores, me indica o quão diverso um modelo é, o que é uma vantagem bastante importante para os modelos.

Entretanto, nesse formato de radar com todos os modelos juntos não consigo identificar direito os modelos de cores mais claras. Assim, gerei uma nova visualização, agora separada em quatro radares diferentes, onde cada radar apresenta os melhores modelos em cada uma das métricas.

![Radares - Tentativa 2](Visualizações/Radar2.PNG)

Com essa visualização, como objetivo foi consguir identificar exatamente cada modelo, tive que mudar as cores novamente, já que as cores claras dificultavam muito a identificação dos modelos.

Nessa visualização, embora consiga identificar um único modelo, não consigo identificar padrões entre as estratégias, ou mesmo geral dos modelos. Assim, tentei mais uma visualização.

![Radares - Tentativa 3](Visualizações/MOProb.png)

Nessa última visualização separei cada modelo em um radar, fazendo uma matriz de radares, com a linha indicando qual a métrica otimizada e qual a estratégia utilizada para o treinamento do modelo. Tive que mudar a cor dos modelos EqOp, que estavam em amarelo e não era possível identificar os limites dos radares. Decidi colorir o interior dos radares, ao contrário da visuzalição anterior, por isso não atrapalhar na visualização dos demais modelos e, principalmente, por ressaltar as características de forma e área. 

Removi as informações de eixo por elas poluírem bastante a visualização, além de serem repetitivas. No TCC em si coloquei separado um único radar com os labels nos eixos para ser usado como guia para todos os demais.

Aqui consigo identificar cada modelo, mas não perco a informação e o padrão gerado por todos os modelos e pelos modelos de cada estratégia.

No fim, utilizei os dois últimos gráficos no meu TCC, por mostrarem tanto a comparação direta entre os melhores modelos para cada métrica e também os padrões dos modelos.

## 3. Para não desperdiçar trabalho

Embora não tenha utilizado os gráficos de coordenadas paralelas para comparar os modelos da forma que mostrei acima, no meu projeo realizei outros dois experimentos que me permitiram utilizar os gráficos de coordenadas paralelas.

Em um deles, quis mostrar a diversidade de modelos que cada estratégia conseguia produzir para uma mesma base de dados. Assim, utilizei o gráfico de coordenadas paralelas para mostrar a diversidade nas métricas, colocando uma estratégia por gráfico.

![CoordParExp2](Visualizações/CoordParExp2.PNG)

Como o objetivo aqui não era identificar ou comparar os modelos, mas sim visualizar o conjunto deles, essa visualização me permitiu fazer isso de forma melhor que os radares, por ficar mais clara a visualização dos conjuntos.

Por fim, no último experimento utilizei tanto de coordenadas paralelas quanto de radares. Nele explorei uma estratégia de ensemble de modelos de machine learning, que basicamente cria um novo modelo a partir de um conjunto de modelos mais simples, fazendo uma votação entre eles. O gráfico de coordenadas paralelas me permite selecionar os modelos de acordo com intervalos das métricas, então testei isso com o ensemble.

Na primeira parte, gerei o ensemble utilizando todos os modelos da estratégia multi-objetiva de erros. Comperei ele com os melhores modelos para cada métrica.

![Ensemble1](Visualizações/Ensemble1.PNG)

Depois, selecionei os modelos com melhores valores de acurácia, para ver se o ensemble melhorava nessa métrica.

![Ensemble2](Visualizações/Ensemble2.PNG)

Por fim, selecionei os melhores modelos tanto em acurácia quanto em Igualdade de Oportunidade, o que me permitiu ter um modelo de ensemble bom em todas as métricas.

![Ensemble1](Visualizações/Ensemble3.PNG)

# 4. Conclusões

Este trabalho foi bastante interessante para explorar as vantagens e desvantagens de dois tipos de gráficos que parecem simples e que, inicialmente, possuem poucas diferentes entre eles, mas que podem apresentar informações bastante diferentes com essa simples diferença de um ser o polar do outro. Embora seja uma aplicação muito específica, muito provavelmente utilizarei as estratégias de visualização que explorei aqui em outros trabalhos futuros.

Uma conclusão que obtive com este trabalho é que os gráficos de coordenadas paralelas parecem ser melhores para identificar padrões presentes em um conjunto de dados, mas não para visualizar um único modelo ou comparar dois modelos, sendo o gráfico de radar melhor para esse objtivo. Além disso, percebi como, em algumas situações, gerar gráficos separados para cada dado pode nos dar mais informações sobre o coletivo deles do que gerar um único gráfico com todos os dados.