# Data loader

In [158]:
import pandas as pd

from sklearn.model_selection import RepeatedStratifiedKFold
rskf = RepeatedStratifiedKFold(n_splits=10, n_repeats=1, random_state=1410)

class DatasetLoader:
    def get(self, name):
        print(f"loading {name}")
        if name == "fnkdd":
            data = pd.read_csv("/home/rkozik/Desktop/swarog_exp_disk/datasets/fakenewskdd/train.csv",sep="\t")
            data.head()
            body = data["text"].values
            labels = 1-data["label"].values
            total_number_of_claims = data.shape[0]
            print("total_number_of_claims=",total_number_of_claims)
            print("labels fake=",sum(labels),"real=", len(labels)-sum(labels))
        
        if name == "mmcovid":
            data = pd.read_csv("/media/rkozik/02FF-A831/data/swarog/datasets/mmcovid/news_collection.csv",sep="\t")
            data["label"] = [ 1 if v =="fake" else 0 for v in data["label"]]
            data["text"] = [ str(v) for v in data["text"]]
            data = data[data["lang"] == "en"]

            body = data["text"].values
            labels = data["label"].values
            total_number_of_claims = data.shape[0]
            print("total_number_of_claims=",total_number_of_claims)
            print("labels fake=",sum(labels),"real=", len(labels)-sum(labels))
        
        if name == "liar":
            data = pd.read_csv("/media/rkozik/02FF-A831/data/swarog/datasets/liar.csv", sep="\t",encoding="utf-8")
            def mpx(x):
                if x in [0,2]:
                    return 0
                elif x in [4,5]:
                    return 1
                else:
                    return -1
            data["text"] = data["statement"]
            data["label"] = [mpx(x) for x in data["label"]]
            data=data[ data["label"] != -1] 
            body = data["text"].values
            labels = data["label"].values
            total_number_of_claims = data.shape[0]
            print("total_number_of_claims=",total_number_of_claims)
            print("labels fake=",sum(labels),"real=", len(labels)-sum(labels))

        if name == "covidfn":
            data = pd.read_csv("covid_fake_news.csv", sep=",")
            body = data["headlines"].values
            labels = 1 - data["outcome"].values
            total_number_of_claims = data.shape[0]
            print("total_number_of_claims=",total_number_of_claims)
            print("labels fake=",sum(labels),"real=", len(labels)-sum(labels))
        
        return body, labels, total_number_of_claims

# Utility functions

In [159]:
from tqdm import tqdm
from sklearn.metrics import accuracy_score, balanced_accuracy_score, f1_score, precision_score, recall_score, roc_auc_score
from imblearn.metrics import geometric_mean_score
from IPython.display import clear_output



class Metrics:
    def __init__(self):
        self.scores = {
            'Accuracy': {'func': accuracy_score},
            'Balanced Accuracy': {'func': balanced_accuracy_score},
            'F1': {'func': f1_score},
            'Precision': {'func': precision_score},
            'Recall': {'func': recall_score},
            'G-mean': {'func': geometric_mean_score}
        }
        
        for score_name, score_dict in self.scores.items():
            score_dict["list"] = []
            score_dict["lab"] = []

    def update(self, actual, prediction):
        for score_name, score_dict in self.scores.items():
            if score_name in ["F1","Precision","Recall","G-mean"]:
                scorvaln = score_dict['func'](actual, prediction, average=None)
                score_dict['lab'].append(scorvaln)
                scorval = score_dict['func'](actual, prediction, average="weighted")
                score_dict['list'].append(scorval)
                #print(score_name, scorval, scorvaln)  
            else:
                scorval=score_dict['func'](actual, prediction)
                score_dict['list'].append(scorval)
                
    def print_table(self, labels=None):
        # Print stats
        scores = self.scores
        numlabels = scores["F1"]["lab"][0].shape[0]
        scores["F1"]["lab"][0].shape[0] 
        head = "  %-20s  %-10s  " +  numlabels * " %-10s  " 
        headv = ["Score", "Average"]
        if labels:
            headv.extend([labels[i] for i in range(numlabels)])
        else:
            headv.extend(["Lab:"+str(i+1) for i in range(numlabels)])
        row=head % tuple(headv)
        # table header
        print("―"*len(row))
        print(row)
        print("―"*len(row))
        # table rows
        for score_name, score_dict in sorted(scores.items()) :
            headv = [score_name, np.mean(score_dict['list'])*100, np.std(score_dict['list'])*100]
            for i in range(numlabels):
                if score_name in ["F1","Precision","Recall", "G-mean"]:
                    head = "  %-20s  %4.1f ± %4.1f  " + numlabels* "%4.1f ± %4.1f  "
                    vals = [v[i] for v in scores[score_name]["lab"]]
                    headv.append(np.mean(vals)*100)
                    headv.append(np.std(vals)*100)
                else:
                    head = "  %-20s  %4.1f ± %4.1f  " + numlabels * "%-11s  " 
                    headv.append("-")
            print(head % tuple(headv))
        print("―"*len(row))


# Training

In [None]:
def get_graph_node_stats(vec, nearestDocIDs, y_train, bodyTrainTFIDF):   
    vecdense = vec.toarray()[0]
    docids = nearestDocIDs
    trlabels = np.array(y_train)
    labsum = trlabels[docids].sum()
    
    ivec = []
    labmask = []
    for hitdocid in docids:
        value=bodyTrainTFIDF[hitdocid].toarray()[0]
        intersection = (vecdense>0)*(value>0)
        ivec.append(intersection.sum())
        labmask.append(trlabels[hitdocid])
        
    masked_ivec =  np.array(ivec)*np.array(labmask)   
    masked_ivec_neg =  np.array(ivec)*(-1*(np.array(labmask)-1)) 
    ivec = np.array(ivec)
    masked_ivec = np.array(masked_ivec)
    masked_ivec_neg = np.array(masked_ivec_neg)
    
    newvec = [labsum, (vecdense>0).sum(),ivec.max(), ivec.max(), masked_ivec.max(), masked_ivec.min(), masked_ivec_neg.max(), masked_ivec_neg.min()]
    return newvec

## Swarog Model

In [362]:
import numpy as np
import bentoml
from bentoml.io import NumpyNdarray
from bentoml.io import JSON
from annoy import AnnoyIndex
import re

import transformers
transformers.logging.set_verbosity_error()
from torch.utils.data import DataLoader 

from transformers import AutoTokenizer
from transformers import AutoModel
from transformers import TFDistilBertModel, DistilBertTokenizerFast
import torch
from scipy.sparse import csr_matrix

from sklearn.feature_extraction.text import TfidfVectorizer
from nltk import word_tokenize          
from nltk.stem import WordNetLemmatizer
import nltk
from nltk.corpus import stopwords
import pickle5 as pickle
import sqlite3
from tqdm import tqdm
 
device = torch.device('cuda') if torch.cuda.is_available() else torch.device('cpu')
print("using device:", device)

if "disilbert_model" not in locals():
    disilbert_tokenizer =  AutoTokenizer.from_pretrained("distilbert-base-uncased")
    disilbert_model = AutoModel.from_pretrained("distilbert-base-uncased")
    handle = disilbert_model.to(device)

class SwarogModel:
    def __init__(self):
        self.tokenizer =  disilbert_tokenizer
        self.model = disilbert_tokenizer
        self.max_length = 256
        self.model_name = disilbert_model

    def fit(self, X=None, y=None):
        pass
    
    def encode(self, txt):
        return self.tokenizer(txt, max_length=self.max_length, 
                              truncation=True, padding=True, return_tensors="pt")

    def transform(self, X=None):
        dataloader = DataLoader(X, batch_size=4, shuffle=False)
        allembeds = []
        for batch in tqdm(dataloader):
            batchenc = disilbert_tokenizer(batch, max_length=256, 
                                           truncation=True, padding=True, return_tensors="pt")
            input_ids = batchenc['input_ids'].to(device)
            attention_mask = batchenc['attention_mask'].to(device)
            batchout = disilbert_model(input_ids, attention_mask=attention_mask, 
                                       output_hidden_states=True)
            embeds = [vec[0].cpu().detach().numpy() for vec in batchout[1][-1]]
            allembeds.extend(embeds)
        return np.array(allembeds)
    
    def train(self, body, labels):
        embeddings = self.transform(body)
        self.cls = LogisticRegression(max_iter=1000)
        self.cls.fit(embeddings, labels)
        self.train_prob = self.cls.predict_proba(embeddings)
        
    def predict(self, body):
        embeddings = self.transform(body)
        self.test_prob = self.cls.predict_proba(embeddings)
        return  self.cls.predict(embeddings) 

using device: cuda


## Graph Model

In [431]:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel
from nltk import word_tokenize          
from nltk.stem import WordNetLemmatizer
import nltk
from nltk.corpus import stopwords
import numpy as np
from sklearn.neighbors import NearestNeighbors
from sklearn.linear_model import LogisticRegression

# Download stopwords list
nltk.download('wordnet')
nltk.download('punkt')
stop_words = set(stopwords.words('english')) 
    
def call_it2(instance, name, arg):
    return getattr(instance, name)(arg)

class TrustexModel:
    def __init__(self):
        # Lemmatize the stop words
        self.wnl = WordNetLemmatizer()
        self.ignore_tokens = [',', '.', ';', ':', '"', '``', "''", '`', "'"]
        
    def tfidf(self,body):
        self.tfidf_vectorizer = TfidfVectorizer(stop_words=stop_words)
        self.tfidf_vectorizer.fit(body)
        self.bodyTrainTFIDF = self.tfidf_vectorizer.transform(body)
        
    def calc_node_stats(self, item):
        id, topIDs = item
        vec = self.bodyTrainTFIDF[id]
        newvec = get_graph_node_stats(vec, topIDs[1:], self.train_labels, self.bodyTrainTFIDF)
        return newvec
        
    def create_graph(self, body, labels):
        self.nn = NearestNeighbors(n_neighbors=10)
        self.nn.fit(self.bodyTrainTFIDF)
        knn_d,knn_idx = self.nn.kneighbors(self.bodyTrainTFIDF)
        self.graph_knn = []
        self.train_labels = labels
        from tqdm import tqdm
        
        with mp.Pool(processes=mp.cpu_count()) as pool:
            func_call_it = functools.partial(call_it2, self, 'calc_node_stats')
            self.graph_knn = list(tqdm(pool.imap(func_call_it, enumerate(knn_idx),chunksize=64), 
                                total=knn_idx.shape[0]))
        print("avg. nodes sim.=",np.mean([x[2]/(x[1]+0.00001) for x in self.graph_knn]))

    def calc_node_stats_test(self, item):
        id, topIDs = item
        vec = self.bodyTestTFIDF[id]
        newvec = get_graph_node_stats(vec, topIDs, self.train_labels, self.bodyTrainTFIDF)
        return newvec
    
    def graph_transform_test_data(self, body):
        
        self.bodyTestTFIDF = self.tfidf_vectorizer.transform(body) 
        knn_test_d,knn_test_idx = self.nn.kneighbors(self.bodyTestTFIDF)
        
        with mp.Pool(processes=mp.cpu_count()) as pool:
            func_call_it = functools.partial(call_it2, self, 'calc_node_stats_test')
            self.graph_test_knn = list(tqdm(pool.imap(func_call_it, enumerate(knn_test_idx),chunksize=64), 
                                total=knn_test_idx.shape[0]))
        
    def train(self, body, labels):
        print("Building similarity graph")
        self.tfidf(body)
        self.create_graph(body, labels)
          
        self.cls = LogisticRegression(max_iter=10000)
        self.cls.fit(self.graph_knn, labels)
        self.trainX = self.graph_knn

    def predict(self, body):
        print("Create test data")
        self.graph_transform_test_data(body)
        y_pred = self.cls.predict(self.graph_test_knn)
        self.testX = self.graph_test_knn
        return y_pred
    


[nltk_data] Downloading package wordnet to /home/rkozik/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package punkt to /home/rkozik/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


## Semantics  

In [365]:
import os
os.environ["TOKENIZERS_PARALLELISM"] = "false"


In [472]:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel
from nltk import word_tokenize          
from nltk.stem import WordNetLemmatizer
import nltk
from nltk.corpus import stopwords
import numpy as np
from sklearn.neighbors import NearestNeighbors
from sklearn.linear_model import LogisticRegression
from subject_verb_object_extract import findSVOs, nlp
# Download stopwords list
nltk.download('wordnet')
nltk.download('punkt')
stop_words = set(stopwords.words('english')) 

from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("english")

    
    
def call_it2(instance, name, arg):
    return getattr(instance, name)(arg)

class Semantics:
    def __init__(self):
        # Lemmatize the stop words
        self.wnl = WordNetLemmatizer()
        self.ignore_tokens = [',', '.', ';', ':', '"', '``', "''", '`', "'"]
        self.token_stop = self.transform_sentence(' '.join(stop_words))
        
    def transform_sentence(self, doc):
        tokens = nlp(doc)
        svos = findSVOs(tokens)
        x = []
        for s in svos:
            x.extend(s)
            
        if len(x) == 0:
            return ["empty"]
        return x

    def tfidf(self,body):
        with mp.Pool(processes=mp.cpu_count()) as pool:
            func_call_it = functools.partial(call_it2, self, 'transform_sentence')
            tok_body = list(tqdm(pool.imap(func_call_it, body,chunksize=64), 
                                total=len(body)))
        vectors = [" ".join(x) for x in tok_body]

        self.tfidf_vectorizer = TfidfVectorizer(stop_words=stop_words)
        self.tfidf_vectorizer.fit(vectors)
        self.bodyTrainTFIDF = self.tfidf_vectorizer.transform(body)
        
    def calc_node_stats(self, item):
        id, topIDs = item
        vec = self.bodyTrainTFIDF[id]
        newvec = get_graph_node_stats(vec, topIDs[1:], self.train_labels, self.bodyTrainTFIDF)
        return newvec
        
    def create_graph(self, body, labels):
        self.nn = NearestNeighbors(n_neighbors=12)
        self.nn.fit(self.bodyTrainTFIDF)
        knn_d,knn_idx = self.nn.kneighbors(self.bodyTrainTFIDF)
        self.graph_knn = []
        self.train_labels = labels
        from tqdm import tqdm
        
        with mp.Pool(processes=mp.cpu_count()) as pool:
            func_call_it = functools.partial(call_it2, self, 'calc_node_stats')
            self.graph_knn = list(tqdm(pool.imap(func_call_it, enumerate(knn_idx),chunksize=64), 
                                total=knn_idx.shape[0]))
        print("avg. nodes sim.=",np.mean([x[2]/(x[1]+0.00001) for x in self.graph_knn]))

    def calc_node_stats_test(self, item):
        id, topIDs = item
        vec = self.bodyTestTFIDF[id]
        newvec = get_graph_node_stats(vec, topIDs, self.train_labels, self.bodyTrainTFIDF)
        return newvec
    
    def graph_transform_test_data(self, body):
        
        self.bodyTestTFIDF = self.tfidf_vectorizer.transform(body) 
        knn_test_d,knn_test_idx = self.nn.kneighbors(self.bodyTestTFIDF)
        
        with mp.Pool(processes=mp.cpu_count()) as pool:
            func_call_it = functools.partial(call_it2, self, 'calc_node_stats_test')
            self.graph_test_knn = list(tqdm(pool.imap(func_call_it, enumerate(knn_test_idx),chunksize=64), 
                                total=knn_test_idx.shape[0]))     
              
    def train(self, body, labels):
        print("Building similarity graph")
        self.tfidf(body)
        self.create_graph(body, labels)
          
        self.cls = LogisticRegression(max_iter=10000)
        self.cls.fit(self.graph_knn, labels)
        self.trainX = self.graph_knn

    def predict(self, body):
        self.graph_transform_test_data(body)
        y_pred = self.cls.predict(self.graph_test_knn)
        self.testX = self.graph_test_knn
        return y_pred
    


[nltk_data] Downloading package wordnet to /home/rkozik/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package punkt to /home/rkozik/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


In [468]:
bootstrap_size = 500
if bootstrap_size != 0:
    bootstrap_factor = bootstrap_size / len(body[train])
    bootstrap = np.random.uniform(size=len(body[train])) < bootstrap_factor
    print(bootstrap[:10])

[False False False False False False False False False  True]


In [473]:
sema = Semantics()
sema.train(body[train][bootstrap],labels[train][bootstrap])

Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 490/490 [00:10<00:00, 48.45it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 490/490 [00:00<00:00, 2616.42it/s]


avg. nodes sim.= 0.4060444801421384


In [474]:
ypred = sema.predict(body[test])

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 2081.06it/s]


In [475]:
met = Metrics()
met.update(labels[test], ypred)
met.print_table()

――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              73.3 ±  0.0  -            -            
  Balanced Accuracy     70.8 ±  0.0  -            -            
  F1                    72.7 ±  0.0  63.6 ±  0.0  78.9 ±  0.0  
  G-mean                70.7 ±  0.0  69.6 ±  0.0  69.6 ±  0.0  
  Precision             73.0 ±  0.0  70.7 ±  0.0  74.6 ±  0.0  
  Recall                73.3 ±  0.0  57.7 ±  0.0  83.8 ±  0.0  
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――



## Infrence 

In [367]:
from sklearn.ensemble import RandomForestClassifier

class Inference:
    def train(self,graph, content, semantics, labels):
        newX=[]
        for i,vec in enumerate(content):
            v2 = np.append(content[i], graph[i]) 
            if semantics:
                v2 = np.append(v2, semantics[i])
            newX.append(v2)
            
        self.inf = RandomForestClassifier(max_depth=12)
        self.inf.fit(newX, labels)
        
    def predict(self, graph, content, semantics):
        newTest=[]
        for i,vec in enumerate(content):
            v2 = np.append(content[i], graph[i]) 
            if semantics:
                v2 = np.append(v2, semantics[i])
            newTest.append(v2)
    
        return self.inf.predict(newTest)

# Experiments

In [368]:
loader = DatasetLoader()
body, labels, total_number_of_claims = loader.get("covidfn")
X=range(0,total_number_of_claims)
train, test = list(rskf.split(X, labels))[0]

loading covidfn
total_number_of_claims= 10201
labels fake= 9727 real= 474


## fnkdd

In [476]:
loader = DatasetLoader()

for dataset in ["fnkdd"]:
    body, labels, total_number_of_claims = loader.get(dataset)
    X=range(0,total_number_of_claims)
    
    trustex_quality = Metrics()
    swarog_quality = Metrics()
    semantics_quality = Metrics()
    inf3_quality = Metrics()
    inf2_quality = Metrics()
    

    for fold_idx, (train, test) in enumerate(rskf.split(X, labels)):
        print(f"fold-{fold_idx}")    
        
        bootstrap_size = 0
        if bootstrap_size != 0:
            bootstrap_factor = bootstrap_size / len(train)
            bootstrap = np.random.uniform(size=len(train)) < bootstrap_factor
            train=train[bootstrap]
        
        swarog = SwarogModel()
        trustex = TrustexModel()
        inference2 = Inference()
        inference3 = Inference()
        semantics = Semantics()
        
        print("semantic")
        semantics.train(body[train],labels[train])
        ypred = semantics.predict(body[test])
        semantics_quality.update(labels[test], ypred)
    
        print("trustex")
        trustex.train(body[train],labels[train])
        ypred = trustex.predict(body[test])
        trustex_quality.update(labels[test], ypred)
        
        print("swarog")
        swarog.train(body[train],labels[train])
        ypred = swarog.predict(body[test])
        swarog_quality.update(labels[test], ypred)

        print("inference")
        inference2.train(trustex.graph_knn, swarog.train_prob, None, labels[train])
        newpred = inference2.predict(trustex.graph_test_knn, swarog.test_prob, None)
        inf2_quality.update(labels[test], newpred)

        
        inference3.train(trustex.graph_knn, swarog.train_prob, semantics.trainX, labels[train])
        newpred = inference3.predict(trustex.graph_test_knn, swarog.test_prob, semantics.testX)
        inf3_quality.update(labels[test], newpred)

        

print("Semantic:")
semantics_quality.print_table()

print("Symbolic:")
trustex_quality.print_table()

print("Deep:")
swarog_quality.print_table()

print("Symb+Deep:")
inf2_quality.print_table()

print("ALL:")
inf3_quality.print_table()


loading fnkdd
total_number_of_claims= 4986
labels fake= 2972 real= 2014
fold-0
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [01:24<00:00, 53.18it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:02<00:00, 1503.28it/s]


avg. nodes sim.= 0.4704687141506022


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 629.34it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:03<00:00, 1159.23it/s]


avg. nodes sim.= 0.4404575174928806
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 588.58it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:18<00:00, 61.93it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:01<00:00, 64.60it/s]


inference
fold-1
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [01:25<00:00, 52.54it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:02<00:00, 1506.76it/s]


avg. nodes sim.= 0.47742000077297625


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:01<00:00, 364.79it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:04<00:00, 1110.84it/s]


avg. nodes sim.= 0.44698345618025653
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 580.75it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:18<00:00, 62.16it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:01<00:00, 62.74it/s]


inference
fold-2
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [01:22<00:00, 54.11it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:02<00:00, 1506.90it/s]


avg. nodes sim.= 0.47448571643374976


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 605.03it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:03<00:00, 1139.67it/s]


avg. nodes sim.= 0.4434671861528761
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 591.30it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:17<00:00, 62.45it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:02<00:00, 62.44it/s]


inference
fold-3
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [01:24<00:00, 52.86it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:03<00:00, 1468.74it/s]


avg. nodes sim.= 0.4784192118613257


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 649.48it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:04<00:00, 1056.82it/s]


avg. nodes sim.= 0.4469319565605302
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 581.49it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:18<00:00, 62.10it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:01<00:00, 64.27it/s]


inference
fold-4
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [01:23<00:00, 53.98it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:02<00:00, 1508.44it/s]


avg. nodes sim.= 0.474465563293773


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 649.00it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:03<00:00, 1152.49it/s]


avg. nodes sim.= 0.4442217812374032
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 587.77it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:17<00:00, 62.39it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:02<00:00, 61.46it/s]


inference
fold-5
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [01:23<00:00, 53.69it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:02<00:00, 1528.90it/s]


avg. nodes sim.= 0.4717592148265669


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 626.48it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4487/4487 [00:03<00:00, 1156.59it/s]


avg. nodes sim.= 0.4390752340438459
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 499/499 [00:00<00:00, 591.14it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:18<00:00, 62.23it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:02<00:00, 61.76it/s]


inference
fold-6
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [01:23<00:00, 53.73it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [00:02<00:00, 1526.09it/s]


avg. nodes sim.= 0.4754358005590211


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 650.45it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [00:03<00:00, 1133.95it/s]


avg. nodes sim.= 0.44295315279661407
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 596.06it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:17<00:00, 62.51it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:02<00:00, 60.14it/s]


inference
fold-7
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [01:23<00:00, 53.89it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [00:03<00:00, 1442.02it/s]


avg. nodes sim.= 0.47557511365115634


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 633.38it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [00:04<00:00, 1084.45it/s]


avg. nodes sim.= 0.44337905624213164
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 590.43it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:17<00:00, 62.54it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:02<00:00, 61.00it/s]


inference
fold-8
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [01:24<00:00, 53.20it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [00:03<00:00, 1423.85it/s]


avg. nodes sim.= 0.4794656604971294


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 635.08it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [00:03<00:00, 1170.15it/s]


avg. nodes sim.= 0.4489498006539761
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 592.26it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:18<00:00, 62.18it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:01<00:00, 63.14it/s]


inference
fold-9
semantic
Building similarity graph


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [01:22<00:00, 54.52it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [00:02<00:00, 1510.38it/s]


avg. nodes sim.= 0.46870250510898176


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 625.35it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 4488/4488 [00:04<00:00, 1063.75it/s]


avg. nodes sim.= 0.4409309824844639
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 498/498 [00:00<00:00, 597.29it/s]


swarog


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1122/1122 [00:17<00:00, 62.63it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:02<00:00, 58.32it/s]


inference
Semantic:
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              73.8 ±  2.2  -            -            
  Balanced Accuracy     70.8 ±  2.4  -            -            
  F1                    73.0 ±  2.4  63.0 ±  3.5  79.8 ±  1.6  
  G-mean                70.8 ±  2.5  69.1 ±  2.8  69.1 ±  2.8  
  Precision             73.8 ±  2.3  73.4 ±  3.1  74.0 ±  1.9  
  Recall                73.8 ±  2.2  55.2 ±  3.9  86.4 ±  1.5  
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
Symbolic:
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              73.4 ±  1.7  -            -            
  Balanced Accuracy     70.3 ±  1.9  -            -            
  F1             

## covidfn

In [442]:
loader = DatasetLoader()

for dataset in ["covidfn"]:
    body, labels, total_number_of_claims = loader.get(dataset)
    X=range(0,total_number_of_claims)
    
    trustex_quality = Metrics()
    swarog_quality = Metrics()
    semantics_quality = Metrics()
    inf3_quality = Metrics()
    inf2_quality = Metrics()
    

    for fold_idx, (train, test) in enumerate(rskf.split(X, labels)):
        print(f"fold-{fold_idx}")    
        
        bootstrap_size = 0
        if bootstrap_size != 0:
            bootstrap_factor = bootstrap_size / len(train)
            bootstrap = np.random.uniform(size=len(train)) < bootstrap_factor
            train=train[bootstrap]
        
        swarog = SwarogModel()
        trustex = TrustexModel()
        inference2 = Inference()
        inference3 = Inference()
        semantics = Semantics()
        
        print("semantic")
        semantics.train(body[train],labels[train])
        ypred = semantics.predict(body[test])
        semantics_quality.update(labels[test], ypred)
    
        print("trustex")
        trustex.train(body[train],labels[train])
        ypred = trustex.predict(body[test])
        trustex_quality.update(labels[test], ypred)
        
        print("swarog")
        swarog.train(body[train],labels[train])
        ypred = swarog.predict(body[test])
        swarog_quality.update(labels[test], ypred)

        print("inference")
        inference2.train(trustex.graph_knn, swarog.train_prob, None, labels[train])
        newpred = inference2.predict(trustex.graph_test_knn, swarog.test_prob, None)
        inf2_quality.update(labels[test], newpred)

        
        inference3.train(trustex.graph_knn, swarog.train_prob, semantics.trainX, labels[train])
        newpred = inference3.predict(trustex.graph_test_knn, swarog.test_prob, semantics.testX)
        inf3_quality.update(labels[test], newpred)

        

print("Semantic:")
semantics_quality.print_table()

print("Symbolic:")
trustex_quality.print_table()

print("Deep:")
swarog_quality.print_table()

print("Symb+Deep:")
inf2_quality.print_table()

print("ALL:")
inf3_quality.print_table()


loading covidfn
total_number_of_claims= 10201
labels fake= 9727 real= 474
fold-0
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9180/9180 [00:11<00:00, 804.83it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9180/9180 [00:02<00:00, 4027.81it/s]


avg. nodes sim.= 0.6416482573104035


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1021/1021 [00:01<00:00, 579.56it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9180/9180 [00:02<00:00, 3840.25it/s]


avg. nodes sim.= 0.6022464158873989
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1021/1021 [00:01<00:00, 577.40it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2295/2295 [00:11<00:00, 199.29it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 256/256 [00:01<00:00, 195.59it/s]


inference
fold-1
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:11<00:00, 783.91it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 4052.64it/s]


avg. nodes sim.= 0.6426120840712041


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 573.49it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3826.61it/s]


avg. nodes sim.= 0.603074574745465
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 579.66it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 201.53it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 199.12it/s]


inference
fold-2
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:11<00:00, 785.34it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 4026.85it/s]


avg. nodes sim.= 0.6433784806689707


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 586.15it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3817.15it/s]


avg. nodes sim.= 0.6039246746211283
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 580.71it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 199.52it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 196.19it/s]


inference
fold-3
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:11<00:00, 775.81it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 4013.07it/s]


avg. nodes sim.= 0.6427887549912531


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:03<00:00, 304.47it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3706.22it/s]


avg. nodes sim.= 0.60307345211235
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 558.94it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 199.46it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 197.42it/s]


inference
fold-4
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:12<00:00, 758.82it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3970.26it/s]


avg. nodes sim.= 0.6434609272152707


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 578.83it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3705.13it/s]


avg. nodes sim.= 0.6041686621461979
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 574.05it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 199.82it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 197.98it/s]


inference
fold-5
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:11<00:00, 769.44it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3984.58it/s]


avg. nodes sim.= 0.6436223643698211


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 577.04it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3674.39it/s]


avg. nodes sim.= 0.6038904451770066
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 575.53it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 201.15it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 200.17it/s]


inference
fold-6
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:11<00:00, 784.47it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3933.24it/s]


avg. nodes sim.= 0.6437427049479205


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 583.27it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3680.42it/s]


avg. nodes sim.= 0.6040509712926767
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 573.51it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 201.55it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 199.47it/s]


inference
fold-7
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:11<00:00, 765.74it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3959.41it/s]


avg. nodes sim.= 0.6446890674715492


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 563.47it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3695.81it/s]


avg. nodes sim.= 0.6054183837792178
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 569.07it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 201.82it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 199.90it/s]


inference
fold-8
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:12<00:00, 764.48it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3959.78it/s]


avg. nodes sim.= 0.6410904825624055


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 580.46it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3688.66it/s]


avg. nodes sim.= 0.6011515437532513
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 582.39it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 199.40it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 196.67it/s]


inference
fold-9
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:11<00:00, 775.08it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 4010.09it/s]


avg. nodes sim.= 0.641293988939949


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 576.09it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 9181/9181 [00:02<00:00, 3654.16it/s]


avg. nodes sim.= 0.6016977018324124
Create test data


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1020/1020 [00:01<00:00, 565.60it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 2296/2296 [00:11<00:00, 201.30it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 255/255 [00:01<00:00, 200.06it/s]


inference
Semantic:
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              97.4 ±  0.3  -            -            
  Balanced Accuracy     74.0 ±  2.0  -            -            
  F1                    97.0 ±  0.3  63.4 ±  4.0  98.7 ±  0.1  
  G-mean                70.1 ±  2.7  69.2 ±  2.8  69.2 ±  2.8  
  Precision             97.3 ±  0.4  93.4 ±  6.1  97.5 ±  0.2  
  Recall                97.4 ±  0.3  48.1 ±  4.0  99.8 ±  0.2  
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
Symbolic:
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              97.4 ±  0.4  -            -            
  Balanced Accuracy     73.1 ±  3.5  -            -            
  F1             

## liar

In [443]:
loader = DatasetLoader()

for dataset in ["liar"]:
    body, labels, total_number_of_claims = loader.get(dataset)
    X=range(0,total_number_of_claims)
    
    trustex_quality = Metrics()
    swarog_quality = Metrics()
    semantics_quality = Metrics()
    inf3_quality = Metrics()
    inf2_quality = Metrics()
    

    for fold_idx, (train, test) in enumerate(rskf.split(X, labels)):
        print(f"fold-{fold_idx}")    
        
        bootstrap_size = 0
        if bootstrap_size != 0:
            bootstrap_factor = bootstrap_size / len(train)
            bootstrap = np.random.uniform(size=len(train)) < bootstrap_factor
            train=train[bootstrap]
        
        swarog = SwarogModel()
        trustex = TrustexModel()
        inference2 = Inference()
        inference3 = Inference()
        semantics = Semantics()
        
        print("semantic")
        semantics.train(body[train],labels[train])
        ypred = semantics.predict(body[test])
        semantics_quality.update(labels[test], ypred)
    
        print("trustex")
        trustex.train(body[train],labels[train])
        ypred = trustex.predict(body[test])
        trustex_quality.update(labels[test], ypred)
        
        print("swarog")
        swarog.train(body[train],labels[train])
        ypred = swarog.predict(body[test])
        swarog_quality.update(labels[test], ypred)

        print("inference")
        inference2.train(trustex.graph_knn, swarog.train_prob, None, labels[train])
        newpred = inference2.predict(trustex.graph_test_knn, swarog.test_prob, None)
        inf2_quality.update(labels[test], newpred)

        
        inference3.train(trustex.graph_knn, swarog.train_prob, semantics.trainX, labels[train])
        newpred = inference3.predict(trustex.graph_test_knn, swarog.test_prob, semantics.testX)
        inf3_quality.update(labels[test], newpred)

        

print("Semantic:")
semantics_quality.print_table()

print("Symbolic:")
trustex_quality.print_table()

print("Deep:")
swarog_quality.print_table()

print("Symb+Deep:")
inf2_quality.print_table()

print("ALL:")
inf3_quality.print_table()


loading liar
total_number_of_claims= 8061
labels fake= 3554 real= 4507
fold-0
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7254/7254 [00:09<00:00, 740.35it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7254/7254 [00:02<00:00, 3364.88it/s]


avg. nodes sim.= 0.435177912552006


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 807/807 [00:01<00:00, 673.26it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7254/7254 [00:01<00:00, 3824.84it/s]


avg. nodes sim.= 0.3702723209734244
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 807/807 [00:01<00:00, 664.03it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:08<00:00, 201.98it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 199.85it/s]


inference
fold-1
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:09<00:00, 740.20it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3718.24it/s]


avg. nodes sim.= 0.43620986814729923


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 700.98it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3841.12it/s]


avg. nodes sim.= 0.3719920066395006
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 668.02it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:08<00:00, 201.71it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 199.66it/s]


inference
fold-2
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:09<00:00, 730.00it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3821.51it/s]


avg. nodes sim.= 0.43608186766336027


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 649.57it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3865.76it/s]


avg. nodes sim.= 0.3715081571067758
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 688.86it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:09<00:00, 199.70it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 197.16it/s]


inference
fold-3
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:09<00:00, 750.72it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3755.20it/s]


avg. nodes sim.= 0.4361113804485705


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 682.60it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3918.57it/s]


avg. nodes sim.= 0.3715639727317964
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 683.04it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:09<00:00, 200.94it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 197.47it/s]


inference
fold-4
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:10<00:00, 709.52it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3759.64it/s]


avg. nodes sim.= 0.43717518664249316


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 693.08it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3832.13it/s]


avg. nodes sim.= 0.37196019611223585
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 688.57it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:09<00:00, 201.47it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 199.77it/s]


inference
fold-5
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:10<00:00, 722.46it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3741.80it/s]


avg. nodes sim.= 0.43579897152982655


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 685.62it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3817.58it/s]


avg. nodes sim.= 0.37197240746819477
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 683.93it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:09<00:00, 200.99it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 196.15it/s]


inference
fold-6
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:09<00:00, 734.68it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3706.89it/s]


avg. nodes sim.= 0.4367373158491995


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 686.04it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3812.54it/s]


avg. nodes sim.= 0.37121661674174894
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 686.43it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:09<00:00, 199.40it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 197.05it/s]


inference
fold-7
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:10<00:00, 706.53it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3751.15it/s]


avg. nodes sim.= 0.43573975920937186


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 682.13it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3781.68it/s]


avg. nodes sim.= 0.3718538508523232
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 682.43it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:09<00:00, 201.53it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 199.14it/s]


inference
fold-8
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:10<00:00, 712.11it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3734.59it/s]


avg. nodes sim.= 0.43592668599671913


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 673.61it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3867.15it/s]


avg. nodes sim.= 0.37196753984636455
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 542.20it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:08<00:00, 201.73it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 199.86it/s]


inference
fold-9
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:09<00:00, 748.41it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3733.97it/s]


avg. nodes sim.= 0.4367811032652332


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 669.23it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 7255/7255 [00:01<00:00, 3841.21it/s]


avg. nodes sim.= 0.37203080815053874
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 806/806 [00:01<00:00, 699.27it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1814/1814 [00:08<00:00, 201.82it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 202/202 [00:01<00:00, 198.02it/s]


inference
Semantic:
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              63.3 ±  1.6  -            -            
  Balanced Accuracy     62.0 ±  1.6  -            -            
  F1                    62.9 ±  1.6  68.9 ±  1.4  55.2 ±  2.0  
  G-mean                62.0 ±  1.6  61.1 ±  1.7  61.1 ±  1.7  
  Precision             63.0 ±  1.6  65.4 ±  1.2  59.8 ±  2.2  
  Recall                63.3 ±  1.6  72.8 ±  1.8  51.2 ±  2.0  
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
Symbolic:
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              62.6 ±  0.8  -            -            
  Balanced Accuracy     61.4 ±  0.7  -            -            
  F1             

## mmcovid

In [444]:
loader = DatasetLoader()

for dataset in ["mmcovid"]:
    body, labels, total_number_of_claims = loader.get(dataset)
    X=range(0,total_number_of_claims)
    
    trustex_quality = Metrics()
    swarog_quality = Metrics()
    semantics_quality = Metrics()
    inf3_quality = Metrics()
    inf2_quality = Metrics()
    

    for fold_idx, (train, test) in enumerate(rskf.split(X, labels)):
        print(f"fold-{fold_idx}")    
        
        bootstrap_size = 0
        if bootstrap_size != 0:
            bootstrap_factor = bootstrap_size / len(train)
            bootstrap = np.random.uniform(size=len(train)) < bootstrap_factor
            train=train[bootstrap]
        
        swarog = SwarogModel()
        trustex = TrustexModel()
        inference2 = Inference()
        inference3 = Inference()
        semantics = Semantics()
        
        print("semantic")
        semantics.train(body[train],labels[train])
        ypred = semantics.predict(body[test])
        semantics_quality.update(labels[test], ypred)
    
        print("trustex")
        trustex.train(body[train],labels[train])
        ypred = trustex.predict(body[test])
        trustex_quality.update(labels[test], ypred)
        
        print("swarog")
        swarog.train(body[train],labels[train])
        ypred = swarog.predict(body[test])
        swarog_quality.update(labels[test], ypred)

        print("inference")
        inference2.train(trustex.graph_knn, swarog.train_prob, None, labels[train])
        newpred = inference2.predict(trustex.graph_test_knn, swarog.test_prob, None)
        inf2_quality.update(labels[test], newpred)

        
        inference3.train(trustex.graph_knn, swarog.train_prob, semantics.trainX, labels[train])
        newpred = inference3.predict(trustex.graph_test_knn, swarog.test_prob, semantics.testX)
        inf3_quality.update(labels[test], newpred)

        

print("Semantic:")
semantics_quality.print_table()

print("Symbolic:")
trustex_quality.print_table()

print("Deep:")
swarog_quality.print_table()

print("Symb+Deep:")
inf2_quality.print_table()

print("ALL:")
inf3_quality.print_table()


loading mmcovid
total_number_of_claims= 7332
labels fake= 2028 real= 5304
fold-0
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6598/6598 [00:38<00:00, 172.57it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6598/6598 [00:03<00:00, 2192.60it/s]


avg. nodes sim.= 0.32675068766867355


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 734/734 [00:01<00:00, 641.51it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6598/6598 [00:04<00:00, 1404.24it/s]


avg. nodes sim.= 0.5550252361631562
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 734/734 [00:01<00:00, 579.86it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 119.32it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 116.43it/s]


inference
fold-1
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6598/6598 [00:38<00:00, 170.96it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6598/6598 [00:02<00:00, 2267.66it/s]


avg. nodes sim.= 0.32444689380417124


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 734/734 [00:01<00:00, 617.63it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6598/6598 [00:04<00:00, 1516.33it/s]


avg. nodes sim.= 0.5565031603947783
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 734/734 [00:01<00:00, 591.80it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 120.23it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 116.10it/s]


inference
fold-2
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:38<00:00, 169.77it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:02<00:00, 2262.90it/s]


avg. nodes sim.= 0.3234717951063957


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 639.36it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:04<00:00, 1500.65it/s]


avg. nodes sim.= 0.5568051819431932
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 609.10it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 119.58it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 117.98it/s]


inference
fold-3
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:39<00:00, 165.99it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:02<00:00, 2209.69it/s]


avg. nodes sim.= 0.3248138965850563


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 648.83it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:04<00:00, 1522.31it/s]


avg. nodes sim.= 0.5572621228321133
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 596.88it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 118.58it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 124.74it/s]


inference
fold-4
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:38<00:00, 170.13it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:02<00:00, 2264.04it/s]


avg. nodes sim.= 0.32757259560131147


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 634.59it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:04<00:00, 1455.29it/s]


avg. nodes sim.= 0.5552816434285384
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 592.88it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 119.64it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 118.91it/s]


inference
fold-5
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:38<00:00, 170.72it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:02<00:00, 2281.85it/s]


avg. nodes sim.= 0.32241555395588106


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 635.93it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:04<00:00, 1388.95it/s]


avg. nodes sim.= 0.5578110461229404
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 590.89it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 119.80it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 117.36it/s]


inference
fold-6
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:38<00:00, 171.58it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:02<00:00, 2271.70it/s]


avg. nodes sim.= 0.32769245146765613


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 628.28it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:04<00:00, 1514.32it/s]


avg. nodes sim.= 0.5574498510708638
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 596.38it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 119.29it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 116.48it/s]


inference
fold-7
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:38<00:00, 170.67it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:02<00:00, 2222.66it/s]


avg. nodes sim.= 0.32016774306164425


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 630.79it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:04<00:00, 1512.88it/s]


avg. nodes sim.= 0.547680591730261
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 591.76it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 119.41it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 115.05it/s]


inference
fold-8
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:38<00:00, 169.80it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:02<00:00, 2231.42it/s]


avg. nodes sim.= 0.3259436177244116


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 633.92it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:04<00:00, 1490.97it/s]


avg. nodes sim.= 0.557178621463908
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 463.67it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 120.33it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 116.04it/s]


inference
fold-9
semantic
Building similarity graph


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:39<00:00, 165.36it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:02<00:00, 2310.76it/s]


avg. nodes sim.= 0.32504011167114216


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 631.39it/s]


trustex
Building similarity graph


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 6599/6599 [00:04<00:00, 1465.70it/s]


avg. nodes sim.= 0.55790444409433
Create test data


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 733/733 [00:01<00:00, 596.57it/s]


swarog


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 1650/1650 [00:13<00:00, 118.58it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [00:01<00:00, 121.06it/s]


inference
Semantic:
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              81.6 ±  1.0  -            -            
  Balanced Accuracy     68.8 ±  1.6  -            -            
  F1                    79.1 ±  1.3  88.4 ±  0.6  54.6 ±  3.2  
  G-mean                67.6 ±  1.8  62.5 ±  2.5  62.5 ±  2.5  
  Precision             82.3 ±  1.2  81.0 ±  0.8  85.7 ±  2.7  
  Recall                81.6 ±  1.0  97.4 ±  0.5  40.1 ±  3.1  
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
Symbolic:
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Score                 Average      Lab:1        Lab:2       
――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
  Accuracy              90.8 ±  1.0  -            -            
  Balanced Accuracy     86.5 ±  1.4  -            -            
  F1             