In [1]:
import pandas as pd

In [2]:
told = pd.read_csv('svm-told.csv', index_col=0)
hate = pd.read_csv('svm-hate.csv', index_col=0)
bert_told = pd.read_csv('bert-told.csv', index_col=0)
bert_hate = pd.read_csv('bert-hate.csv', index_col=0)

In [3]:
def acertos(dados: pd.DataFrame) -> int:
    acertos : int = 0

    for predicao, real in zip(dados['predicao'], dados['discursoDeOdio']):
        if predicao == real:
            acertos += 1

    return acertos, float("{:.2f}".format((acertos / dados.shape[0])*100))

In [4]:
def acertos_categoria(dados: pd.DataFrame, plot: bool = False) -> pd.DataFrame:
    acertos_categoria = {}

    for categoria in range(1, 30):
        dados_cat = dados[dados['idCategoria'] == categoria]
        nome_categoria = dados_cat['categoria'].iloc[0]
        qtd_frases = dados_cat.shape[0]
        qtd_acertos, porcentagem = acertos(dados_cat)
        acertos_categoria[nome_categoria] = { 'qtd_frases': qtd_frases, 'acertos': qtd_acertos, 'porcentagem': porcentagem}
    
    acertos_categoria = pd.DataFrame.from_dict(acertos_categoria, orient='index')
    
    if plot:
        acertos_categoria.plot.bar( y=['qtd_frases', 'acertos'], figsize=(20, 10))

    return acertos_categoria

In [5]:
def acertos_grupoAlvo(dados: pd.DataFrame, plot: bool = False) -> pd.DataFrame:
    acertos_grupoAlvo = {}

    for grupoAlvo in hate['grupoAlvo'].unique():
        dados_grupoAlvo = dados[dados['grupoAlvo'] == grupoAlvo]
        nome_grupoAlvo = grupoAlvo
        qtd_frases = dados_grupoAlvo.shape[0]
        qtd_acertos, porcentagem = acertos(dados_grupoAlvo)
        acertos_grupoAlvo[nome_grupoAlvo] = { 'qtd_frases': qtd_frases, 'acertos': qtd_acertos, 'porcentagem': porcentagem}

    acertos_grupoAlvo = pd.DataFrame.from_dict(acertos_grupoAlvo, orient='index')

    if plot:
        acertos_grupoAlvo.plot.bar( y=['qtd_frases', 'acertos'], figsize=(20, 10))

    return acertos_grupoAlvo
        

In [11]:
hate.head()

Unnamed: 0.1,Unnamed: 0,idCategoria,categoria,idTemplate,template,frase,grupoAlvo,discursoDeOdio,predicao
0,0,1,depre_neg_op_o,1,Eu odeio {IDENTIDADE_P}.,Eu odeio mulheres.,mulheres,1,0
1,1,1,depre_neg_op_o,1,Eu odeio {IDENTIDADE_P}.,Eu odeio pessoas trans.,pessoas trans,1,1
2,2,1,depre_neg_op_o,1,Eu odeio {IDENTIDADE_P}.,Eu odeio gays.,gays,1,1
3,3,1,depre_neg_op_o,1,Eu odeio {IDENTIDADE_P}.,Eu odeio negros.,negros,1,0
4,4,1,depre_neg_op_o,1,Eu odeio {IDENTIDADE_P}.,Eu odeio pretos.,negros,1,0


## Total de frases:

In [6]:
qtd_frases = told.shape[0]
qtd_frases

9615

## Quantidade de Acertos e Porcentagem

In [86]:
acertos(told)

(3656, 38.02)

In [87]:
acertos(hate)

(5077, 52.8)

In [7]:
acertos(bert_told)

(4881, 50.76)

In [8]:
acertos(bert_hate)

(5837, 60.71)

## Análise por categoria

In [88]:
acertos_categoria(hate)

Unnamed: 0,qtd_frases,acertos,porcentagem
depre_neg_op_o,420,140,33.33
depre_neg_atrib_o,420,213,50.71
depre_desum_o,420,379,90.24
depre_impl_o,420,237,56.43
ameaca_dir_o,399,17,4.26
ameaca_norm_o,420,126,30.0
insulto_o,200,117,58.5
insulto_homonimo_no,17,5,29.41
insulto_ressig_no,15,13,86.67
palavrao_o,399,298,74.69


In [9]:
acertos_categoria(bert_hate)

Unnamed: 0,qtd_frases,acertos,porcentagem
depre_neg_op_o,420,133,31.67
depre_neg_atrib_o,420,318,75.71
depre_desum_o,420,329,78.33
depre_impl_o,420,168,40.0
ameaca_dir_o,399,191,47.87
ameaca_norm_o,420,228,54.29
insulto_o,200,177,88.5
insulto_homonimo_no,17,1,5.88
insulto_ressig_no,15,8,53.33
palavrao_o,399,398,99.75


In [10]:
acertos_categoria(told)

Unnamed: 0,qtd_frases,acertos,porcentagem
depre_neg_op_o,420,53,12.62
depre_neg_atrib_o,420,79,18.81
depre_desum_o,420,117,27.86
depre_impl_o,420,58,13.81
ameaca_dir_o,399,33,8.27
ameaca_norm_o,420,75,17.86
insulto_o,200,94,47.0
insulto_homonimo_no,17,11,64.71
insulto_ressig_no,15,11,73.33
palavrao_o,399,274,68.67


In [11]:
acertos_categoria(bert_told)

Unnamed: 0,qtd_frases,acertos,porcentagem
depre_neg_op_o,420,63,15.0
depre_neg_atrib_o,420,319,75.95
depre_desum_o,420,298,70.95
depre_impl_o,420,47,11.19
ameaca_dir_o,399,119,29.82
ameaca_norm_o,420,163,38.81
insulto_o,200,134,67.0
insulto_homonimo_no,17,13,76.47
insulto_ressig_no,15,10,66.67
palavrao_o,399,359,89.97


## Acertos por Grupo Alvo

In [12]:
acertos_grupoAlvo(hate)

Unnamed: 0,qtd_frases,acertos,porcentagem
mulheres,525,249,47.43
pessoas trans,441,266,60.32
gays,546,303,55.49
negros,945,427,45.19
pessoas com deficiências,546,300,54.95
indígenas,441,229,51.93
religiões de matriz africana,861,475,55.17
nortistas,420,232,55.24
sulistas,1260,610,48.41
paulistas,420,234,55.71


In [13]:
acertos_grupoAlvo(bert_hate)

Unnamed: 0,qtd_frases,acertos,porcentagem
mulheres,525,312,59.43
pessoas trans,441,276,62.59
gays,546,351,64.29
negros,945,572,60.53
pessoas com deficiências,546,330,60.44
indígenas,441,246,55.78
religiões de matriz africana,861,649,75.38
nortistas,420,254,60.48
sulistas,1260,726,57.62
paulistas,420,250,59.52


In [90]:
acertos_grupoAlvo(told)

Unnamed: 0,qtd_frases,acertos,porcentagem
mulheres,525,205,39.05
pessoas trans,441,127,28.8
gays,546,217,39.74
negros,945,347,36.72
pessoas com deficiências,546,210,38.46
indígenas,441,158,35.83
religiões de matriz africana,861,322,37.4
nortistas,420,157,37.38
sulistas,1260,510,40.48
paulistas,420,150,35.71


In [14]:
acertos_grupoAlvo(bert_told)

Unnamed: 0,qtd_frases,acertos,porcentagem
mulheres,525,232,44.19
pessoas trans,441,196,44.44
gays,546,322,58.97
negros,945,484,51.22
pessoas com deficiências,546,256,46.89
indígenas,441,179,40.59
religiões de matriz africana,861,476,55.28
nortistas,420,210,50.0
sulistas,1260,709,56.27
paulistas,420,210,50.0
