In [22]:
import random
from random import sample
import pandas as pd
from sklearn.model_selection import train_test_split
import pickle

In [23]:
path_dataset = "../dataset/"
path_train_test = "../dataset/train_test/"
path_pickle = "../pickle/"

In [24]:
def get_value_counts_of_classes(df, df_name):
    
    print(df_name.title())
    print()
    print("Classes")
    print(df['Class'].value_counts())

# Creazione dataset ridotti

In [25]:
def crea_dataset_ridotto(df):
    
    """Prendo 6000 esempi positivi e 6000 negativi, in modo da avere un dataset totale di 12000 frasi"""
    
    #lista_id da cui estrarre un campione di frasi non consecutive --> la frase 2 non segue la frase 1 --> Classe 1
    frasi_non_consecutive = list(df[df['Class'] == 1]['Id'])
    
    #lista_id da cui estrarre un campione di frasi consecutive --> la frase 2 segue la frase 1 --> Classe 0
    frasi_consecutive = list(df[df['Class'] == 0]['Id'])
    
    #campione di frasi non consecutive
    sample_frasi_non_consecutive = sample(frasi_non_consecutive, 6000)
    
    #campione di frasi consecutive
    sample_frasi_consecutive = sample(frasi_consecutive, 6000)
    
    #creo il dataset di frasi non consecutive
    df_frasi_non_consecutive = df[df.Id.isin(sample_frasi_non_consecutive)]
    
    #creo il dataset di frasi consecutive
    df_frasi_consecutive = df[df.Id.isin(sample_frasi_consecutive)]
    
    print("Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset")
    print("Dataset frasi non consecutive")
    print("Class")
    print(df_frasi_non_consecutive['Class'].value_counts())
    print()
    print("Dataset frasi consecutive")
    print("Class")
    print(df_frasi_consecutive['Class'].value_counts())
    
    #concateniamo i due dataset in modo da avere il dataset completo, non considerando gli indici,
    #in modo da mantenere comunque indici diversi fra i diversi eventi
    df_ridotto_finale = pd.concat([df_frasi_non_consecutive, df_frasi_consecutive], verify_integrity=True)
    
    print()
    print("Informazioni sulle classi del dataset ridotto")
    print(df_ridotto_finale['Class'].value_counts())
    
    return df_ridotto_finale

# Train and test extraction

In [26]:
def get_train_and_test(df):
    
    attributes = [col for col in df.columns if col != 'Class']
    X = df[attributes]
    y = df['Class']

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y)

    X_train['Class'] = y_train
    X_test['Class'] = y_test
    
    print("Dettaglio delle classi nel training")
    print(X_train['Class'].value_counts())
    print()
    print("Dettaglio delle classi nel test")
    print(X_test['Class'].value_counts())
    
    return X_train, X_test

In [27]:
def control_datasets_shape(list_of_dfs_train, list_of_dfs_test, list_of_dfs_names):
    
    for train, test, df_name in zip(list_of_dfs_train, list_of_dfs_test, list_of_dfs_names):
        print("{} train shape: {}".format(df_name, train.shape))
        print("{} test shape: {}".format(df_name, test.shape))
        print()

In [28]:
def controlla_integrita_id_train_test(df_train, df_test):
    
    set_ids_train = set(df_train.Id)
    set_ids_test = set(df_test.Id)
    
    intersection = set_ids_train.intersection(set_ids_test)
    
    if intersection:
        print("I due dataset contengono i seguenti id in comune: {}".format(", ".join(intersection)))
    else:
        print("Intersezione vuota")

In [29]:
def save_dataframe(file_name, dataframe_to_save, path):
    
    try:
        dataframe_to_save.to_csv(path+file_name+".csv", index = False, sep = "\t")
        print("File salvato correttamente")
        
    except:
        print("Errore nel salvataggio")
    
    return 

# Dataset originali

In [30]:
file_to_open = open(path_pickle + "dizionario_dataset_per_anno.pickle", "rb")

dizionario_dataset_per_anno = pickle.load(file_to_open)

In [31]:
for anno in dizionario_dataset_per_anno:
    print("Anno {}".format(anno))
    for dataset_name in dizionario_dataset_per_anno[anno]:
        if "with_ids" in dataset_name:
            print(dataset_name, dizionario_dataset_per_anno[anno][dataset_name].shape)
    print()

Anno 2013
df_dist_5_with_ids (52640, 4)
df_dist_10_with_ids (36170, 4)
df_dist_20_with_ids (18924, 4)
df_dist_30_with_ids (10026, 4)
df_random_speech_with_ids (95276, 4)

Anno 2014
df_dist_5_with_ids (80010, 4)
df_dist_10_with_ids (54660, 4)
df_dist_20_with_ids (28160, 4)
df_dist_30_with_ids (14626, 4)
df_random_speech_with_ids (140322, 4)

Anno 2015
df_dist_5_with_ids (86874, 4)
df_dist_10_with_ids (59158, 4)
df_dist_20_with_ids (30562, 4)
df_dist_30_with_ids (16412, 4)
df_random_speech_with_ids (146724, 4)

Anno 2017
df_dist_5_with_ids (79450, 4)
df_dist_10_with_ids (56764, 4)
df_dist_20_with_ids (30038, 4)
df_dist_30_with_ids (15750, 4)
df_random_speech_with_ids (126008, 4)

Anno 2019
df_dist_5_with_ids (57784, 4)
df_dist_10_with_ids (40012, 4)
df_dist_20_with_ids (20756, 4)
df_dist_30_with_ids (10912, 4)
df_random_speech_with_ids (92420, 4)

Anno 2020
df_dist_5_with_ids (51194, 4)
df_dist_10_with_ids (39316, 4)
df_dist_20_with_ids (24056, 4)
df_dist_30_with_ids (14400, 4)
df_random

**Possiamo estrarre 12000 campioni da tutti i dataset di tutti gli anni, tranne che dal dataset a distanza 30 deggli anni 2013, 2018, 2019**

In [32]:
lista_anni = sorted([anno for anno in dizionario_dataset_per_anno.keys()])
lista_anni

['2013', '2014', '2015', '2016', '2017', '2018', '2019', '2020']

**Leggiamo i dataset a tutte le distanze, di tutti gli anni, e formiamo un dizionario con all'interno sia il dataset ridotto, sia il training e il test**

In [33]:
diz_dataset_ridotti_e_train_test = {}

for anno in lista_anni:
    
    diz_dataset_ridotti_e_train_test[anno] = {}
    
    for dist in ['dist_5', 'dist_10', 'dist_20', 'dist_30', 'random_speech']:
        
        #if anno in ('2013', '2018', '2019') and dist == 'dist_30':
        #    continue
            
        diz_dataset_ridotti_e_train_test[anno][dist] = {}

        #leggo il dataset di un anno specifico e di una data distanza
        df = pd.read_csv(path_dataset + "{}_df_{}_with_ids.csv".format(anno, dist), sep = "\t")

        print("{}_df_{}_with_ids originale".format(anno, dist))
        display(df)

        print("~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~")

        #stampo i dati relativi alle classi
        get_value_counts_of_classes(df, "{}_df_{}_with_ids".format(anno, dist))

        print("~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~")

        #------------------------------------- Creazione dataset ridotti ----------------------------------------
        df_ridotto = ''

        if df.shape[0] >= 12000:
            df_ridotto = crea_dataset_ridotto(df)
        else:
            print()
            print("Il dataset per l'anno {} con distanza {} contiene {} righe, \
            non sufficienti per ridurre il dataset a 12000 campioni".format(anno, dist, df.shape[0]))
            print()
            df_ridotto = df.copy()

        print("{}_df_{}_with_ids ridotto".format(anno, dist))
        display(df_ridotto)

        print("~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~")

        #salvo il dataset ridotto nel dizionario
        diz_dataset_ridotti_e_train_test[anno][dist]['df_ridotto'] = df_ridotto

        #salvo il dataset ridotto
        save_dataframe("{}_df_{}_with_ids_ridotto".format(anno, dist), df_ridotto, path_dataset)
        print()

        #------------------------------------- Creazione train test --------------------------------------------

        df_ridotto_train, df_ridotto_test = get_train_and_test(df_ridotto)

        print("~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~")
        print("Train ridotto")
        display(df_ridotto_train)
        print()

        print("Test ridotto")
        display(df_ridotto_test)

        print("~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~")

        #------------------------------------- Controllo train test --------------------------------------------
        print("{} Train shape: {}".format("{}_df_{}_with_ids_ridotto".format(anno, dist), df_ridotto_train.shape))
        print("{} Test shape: {}".format("{}_df_{}_with_ids_ridotto".format(anno, dist), df_ridotto_test.shape))

        print("~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~")

        #controllo se sono presenti id duplicati fra train e test
        controlla_integrita_id_train_test(df_ridotto_train, df_ridotto_test)

        #salvo train
        save_dataframe("{}_df_{}_with_ids_ridotto_train".format(anno, dist), df_ridotto_train, path_train_test)
        print()

        #salvo test
        save_dataframe("{}_df_{}_with_ids_ridotto_test".format(anno, dist), df_ridotto_test, path_train_test)
        print()

        #salvo il train del dataset ridotto nel dizionario
        diz_dataset_ridotti_e_train_test[anno][dist]['df_ridotto_train'] = df_ridotto_train

        #salvo il test del dataset ridotto nel dizionario
        diz_dataset_ridotti_e_train_test[anno][dist]['df_ridotto_test'] = df_ridotto_test

        print()


        print("--------------------------------------------------------------------------------------------------")


    print()
    print('""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""')
    print()

2013_df_dist_5_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,859068,Da febbraio ad oggi la tratta non è mai stata ...,"Con questo intervento, preannuncio che present...",1
1,72902,"Tutto questo è vero, ma non è tutto il vero.",Ma questo è in qualche misura inaccettabile.,1
2,140240,Si è detto che il provvedimento al nostro esam...,Credo di non essere tendenzioso come sintetizz...,1
3,102109,"La legge 28 giugno 2012, n. 92, cosiddetta leg...",È evidente quindi che i programmi fino ad oggi...,1
4,499167,Non le condividiamo proprio per ragioni intern...,"Allora, l'argomento della collega mi sembra un...",1
...,...,...,...,...
52635,585060,"Signor Presidente, vorrei dire al signor Minis...","Siamo anche dell'idea che, lo si scriva o no i...",0
52636,834428,Per tutte queste ragioni pensiamo che questo p...,Noi pensiamo che non questo oggi l'Italia si a...,0
52637,137858,"L'Italia, nel partecipare a questo progetto, f...",Per tutte queste ragioni pensiamo che questo p...,0
52638,161936,"Come tutti sappiamo, peraltro, sono sempre mag...","L'Italia, nel partecipare a questo progetto, f...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_Df_Dist_5_With_Ids

Classes
1    26320
0    26320
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2013_df_dist_5_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,72902,"Tutto questo è vero, ma non è tutto il vero.",Ma questo è in qualche misura inaccettabile.,1
3,102109,"La legge 28 giugno 2012, n. 92, cosiddetta leg...",È evidente quindi che i programmi fino ad oggi...,1
4,499167,Non le condividiamo proprio per ragioni intern...,"Allora, l'argomento della collega mi sembra un...",1
9,732294,"Quindi, non esiste il rispetto dei parametri d...",Se vogliamo infatti analizzare bene il merito ...,1
10,830296,È sotto gli occhi di tutti che le politiche vo...,In tal senso si rileva che l'attuazione di pro...,1
...,...,...,...,...
52619,820189,Qualcuno ha parlato soltanto di Cameri: e vero...,A Cameri per lo più si provvederà al FACO - Fi...,0
52620,113799,Noi veniamo anche coinvolti - e l'aspetto econ...,Qualcuno ha parlato soltanto di Cameri: e vero...,0
52622,514871,E le strade per sostituirli sono sostanzialmen...,"Se guardiamo il pool, la joint venture costitu...",0
52623,466015,I casi sono due: o decidiamo che non ci intere...,È un ricambio importante: gli Harrier della Ma...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
22735,462720,Chi è che può andare a spiegare ora ai cittadi...,Nella legge sulla Protezione civile si dice in...,1
37958,699746,È quella «notte della Repubblica» che Sergio Z...,"È proprio in quegli anni, terribili per tutti,...",0
24985,9646,Noi stiamo soltanto sovvenendo agli interessi ...,È un mondo circolare.,1
15223,729750,Come ha affermato Angelino Alfano tracciando l...,"Nel merito, ribadiamo la nostra convinzione ci...",1
22337,730423,Quella di oggi potrebbe essere un'occasione fo...,"Ben venga se, con un Governo che recupera pien...",1
...,...,...,...,...
31407,64491,"Io sono convinto che debbano essere lenite, ch...",So benissimo - lo dico al senatore Compagnone ...,0
47065,635251,La tenuta riguarda principalmente l'impostazio...,"Vorrei ricordare a noi stessi, al Governo e a ...",0
2704,664320,"In questa situazione, e per le caratteristiche...",Il terzo capoverso del dispositivo rimarrebbe ...,1
11592,263701,Inizialmente l'Italia aveva appoggiato l'ITGI ...,Alcuni dati.,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
23274,290573,Si sta abusando...».,"La ringrazio per avermi concesso la parola, ci...",1
24130,530159,"L'Europa, invece, parla di equilibrio.","Insomma, cogliamo questa occasione per sottoli...",1
13705,360281,"Lo sottolineo, perché avevo la volontà di sost...","Penso, signor Presidente, che sia venuto il mo...",1
39283,736687,Dobbiamo intervenire sulle condizioni di svilu...,Dobbiamo sottrarre un'intera generazione di ra...,0
26077,114905,"Signor Presidente, colleghi senatori, ricorre ...",Tutto questo deve essere un monito affinché la...,1
...,...,...,...,...
47854,367497,Vorrei richiamare l'attenzione su un problema ...,Preannuncio che ho depositato un'interrogazion...,0
35865,492535,"Signor Presidente, onorevoli colleghi, il prov...","In questa prospettiva, sarebbe stato opportuno...",0
11313,778167,"Non solo: cara senatrice, e caro Presidente, v...","Prima della famosa votazione, che forse avverr...",1
50922,554414,Sarà ancora praticato il lavoro forzato?,Queste e tante altre domande ci vengono in men...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_df_dist_5_with_ids_ridotto Train shape: (9600, 4)
2013_df_dist_5_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2013_df_dist_10_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,141628,"Non ho dubbi, quindi, che anche sui due temi c...",Ecco perché credo che questo sia un tema oggi ...,1
1,664328,La seconda scelta è prevedere una forma abbast...,Non è in discussione - e non lo deve essere - ...,1
2,379054,"Un equilibrio tra scienza, etica e generosità,...",Credo che sia corretto il riferimento che è st...,1
3,359680,"In fondo, anche per quanto riguarda l'articolo...",Voglio ricordare che già nel mese di maggio sc...,1
4,847242,"Credo che, rispetto a questo sbocco, tutti i p...",L'altra sollecitazione che la discussione gene...,1
...,...,...,...,...
36165,210118,"In pratica, vengono confermate come suscettibi...",La misura della detrazione per le spese sosten...,0
36166,684167,Sulla necessità di reintrodurre questa possibi...,"In pratica, vengono confermate come suscettibi...",0
36167,370834,Mi permetto di chiedere al Presidente del Sena...,Vorrei ringraziare il Presidente del Consiglio...,0
36168,175219,L'articolo 14 del decreto - legge prevede la p...,Sulla necessità di reintrodurre questa possibi...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_Df_Dist_10_With_Ids

Classes
1    18085
0    18085
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2013_df_dist_10_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,664328,La seconda scelta è prevedere una forma abbast...,Non è in discussione - e non lo deve essere - ...,1
2,379054,"Un equilibrio tra scienza, etica e generosità,...",Credo che sia corretto il riferimento che è st...,1
3,359680,"In fondo, anche per quanto riguarda l'articolo...",Voglio ricordare che già nel mese di maggio sc...,1
12,356158,In tutto il mondo l'accesso alle cure è strett...,"La vera speranza, infatti, è che, nel momento ...",1
14,129033,Credo che l'articolazione pluralistica delle p...,"Credo che, rispetto a questo sbocco, tutti i p...",1
...,...,...,...,...
36158,532729,"Quindi, non vorrei che si pensasse alla discip...","Certamente anche da lì si può distruggerla, ma...",0
36159,429156,Ciò è giustificato dal fatto che la volontà co...,La detrazione è ripartita in dieci annualità d...,0
36160,369612,"Certamente anche da lì si può distruggerla, ma...","In secondo luogo, l'Europa, le politiche europ...",0
36161,820371,Va anche sottolineato che le procedure per ott...,L'articolo 14 del decreto - legge prevede la p...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
8376,438401,"Egregio Presidente, signori senatori, siamo og...","Abbiamo dunque coniugato coerenza e realismo, ...",1
19090,361672,Sarebbe un errore altrettanto pesante proceder...,Se non realizziamo le riforme fondamentali che...,0
17460,674389,Ricordo il comprensibile imbarazzo della maggi...,Vorrei anzitutto dire che ci soddisfa il fatto...,1
8011,51081,"Quindi, anzitutto ringrazio il Sottosegretario...","Nella mia interrogazione, come lei ben saprà, ...",1
21371,712467,Troppi Comuni sono stati sciolti negli ultimi ...,Quante economie criminali abbiamo visto prospe...,0
...,...,...,...,...
20575,97003,"Insomma, ce n'è abbastanza per guardare agevol...","In sede di dichiarazione di voto, però, sono a...",0
21382,873,", da leggersi «Viva Vittorio Emanuele Re D'Ita...",", scritto per la prima volta sulle mura di Rom...",0
27684,346580,E come hanno detto i nostri colleghi alla Came...,Diamo spinta al Governo perché finalmente si a...,0
7871,811777,È stato previsto che il certificato per l'atti...,"Il decreto - legge, nel testo derivante dalle ...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
7922,279566,"Quello muscolare, cioè chi ha gli amici con pi...","Mi sembra un provvedimento equilibrato, che ga...",1
23021,486340,"Una clausola esclude, peraltro, alcuni benefic...",Capite che per San Marino questo significa il ...,0
3890,363194,"Tra l'altro, nella relazione che accompagna il...","Nel caso in esame, però, per un provvedimento ...",1
1675,633890,Questo serve per integrare al meglio le questi...,A Bruxelles ce ne occuperemo in quattro declin...,1
18148,758342,"No, è colpa nostra.",Vorrei che questa fosse la consapevolezza prof...,0
...,...,...,...,...
25145,213186,Sono infatti Gruppi parlamentari.,Nella loro costituzione rispondono a regole.,0
19654,469961,Un'altra italianata.,Un altro modo di risolvere i problemi non in m...,0
10104,654127,"Nel nostro Paese, i dati pubblicati di recente...","A tale riguardo, ritengo che il limite massimo...",1
7477,887047,L'inserimento di limiti a garanzia della quali...,"Quindi, una rete di controlli carenti, spesso ...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_df_dist_10_with_ids_ridotto Train shape: (9600, 4)
2013_df_dist_10_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2013_df_dist_20_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,331836,"Signora Presidente, al contrario dei colleghi,...","Mi dichiaro quindi doppiamente soddisfatto, na...",1
1,3455,Questa è la sintesi.,"Questa, probabilmente, è la politica industria...",1
2,749200,"Secondo i dati ISTAT aggiornati a marzo 2013, ...",Non dobbiamo fare l'elemosina ai cittadini.,1
3,195674,Da qui il ruolo che il settore del gas svolge ...,Nulla toglie che sarà essenziale garantire la ...,1
4,479614,"Signora Presidente, il Gruppo Lega Nord ha già...",Non ci sono soluzioni.,1
...,...,...,...,...
18919,220037,"Quella concordia, quella pace sociale di cui i...","Domani è l'anniversario dell'Unità d'Italia, q...",0
18920,865607,"Domani è l'anniversario dell'Unità d'Italia, q...","Nei 152 anni della nostra storia, soprattutto ...",0
18921,889297,"Nei 152 anni della nostra storia, soprattutto ...",Il primo pensiero va sicuramente alla fase cos...,0
18922,857893,Il primo pensiero va sicuramente alla fase cos...,Lasciatemi in questo momento ricordare Teresa ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_Df_Dist_20_With_Ids

Classes
1    9462
0    9462
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2013_df_dist_20_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,331836,"Signora Presidente, al contrario dei colleghi,...","Mi dichiaro quindi doppiamente soddisfatto, na...",1
1,3455,Questa è la sintesi.,"Questa, probabilmente, è la politica industria...",1
2,749200,"Secondo i dati ISTAT aggiornati a marzo 2013, ...",Non dobbiamo fare l'elemosina ai cittadini.,1
3,195674,Da qui il ruolo che il settore del gas svolge ...,Nulla toglie che sarà essenziale garantire la ...,1
4,479614,"Signora Presidente, il Gruppo Lega Nord ha già...",Non ci sono soluzioni.,1
...,...,...,...,...
18914,393518,Il Paese mai come oggi ha bisogno di risposte ...,"Mai come ora, la storia italiana si intreccia ...",0
18917,120825,Quando ieri sono entrato per la prima volta da...,"Riporta quattro parole, che sono state sempre ...",0
18918,172287,"Riporta quattro parole, che sono state sempre ...","Quella concordia, quella pace sociale di cui i...",0
18919,220037,"Quella concordia, quella pace sociale di cui i...","Domani è l'anniversario dell'Unità d'Italia, q...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1004,270245,Mi pare che le parole della presidente Finocch...,Mi fermo qui.,1
338,14350,"Se - ed è il se più importante, più sofferto -...","Non è così in Romania, e alla Romania per pote...",1
15620,235941,Ma l'inerzia di fronte al dovere derivante dal...,Proprio in ragione dei citati profili di costi...,0
9634,592306,Si tratta dell'ennesimo affossamento del princ...,Questo è un problema di prima grandezza per no...,0
6035,720761,"Vedete, questa Nota di aggiornamento è appunto...","Non di certo nel duro biennio del 1973 - 1974,...",1
...,...,...,...,...
11420,513695,"Il percorso non sarà semplice, anzi sarà molto...",Condividiamo anche l'obiettivo del nuovo Gover...,0
6953,270012,È una forzatura per accelerare un processo leg...,"Per tale ragione chiederemo, in sede di approv...",1
1919,622135,"Tra l'altro, il disegno di legge di stabilità ...","Se poi alla fine di questa semplice addizione,...",1
15704,574511,Primo fra tutti è quello del nostro debito pub...,La spesa per il pagamento di interessi rischia...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5071,794461,Il ruolo di Maccanico era quello di mediatore ...,Vorrei ricordare uno scritto di Maccanico inti...,1
3824,426528,"Ognuno la racconta come vuole, ma la vera ragi...","In assenza di questi requisiti di base, le leg...",1
13461,675893,L'assicurazione è una cosa che tutti i cittadi...,Siccome ho sentito dire che non c'è la possibi...,0
9068,860442,Abbiamo apprezzato molto le parole del preside...,Ma se un Ministro non è informato dalla sua ca...,1
9814,439678,Lo diciamo a testimonianza di un mondo che - è...,Si è scelta questa strada - lo abbiamo detto -...,0
...,...,...,...,...
1870,248555,L'aspetto inoltre che si continua a sottovalut...,"Invito, infatti, i colleghi a rileggere la dic...",1
3525,214517,Ribadiremo un orientamento su cui insistiamo d...,"Intanto, è partito lo schema di incentivazione...",1
16654,27614,Mediterraneo e politiche di asilo e immigrazio...,Tornando ai temi che precedentemente erano il ...,0
10334,809805,Tutti noi sappiamo cosa sia la stampa estera e...,E quando noi forniamo materiale come quello ch...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_df_dist_20_with_ids_ridotto Train shape: (9600, 4)
2013_df_dist_20_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2013_df_dist_30_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,847519,"Ancora, secondo noi il Consiglio dovrà dare l'...",Nei giorni scorsi abbiamo assistito a un rinno...,1
1,369828,Cito questo punto perché l'ho considerato un p...,In questa chiave vanno letti gli incontri bila...,1
2,234394,"Signor Presidente del Consiglio, a nome del Gr...","Presidente Letta, lei oggi ha detto che nei co...",1
3,845908,Attuazione e verifica.,"Dai suoi racconti, dalle sue parole affiora fo...",1
4,738236,A questi messaggi si è associata l'Unione euro...,Negli occhi di Quirico ho letto la sofferenza ...,1
...,...,...,...,...
10021,300725,Penso al decreto - legge n. 11 del 2009 contro...,"Trattandosi di gravidanza, non si poteva non f...",0
10022,267751,Recentemente sono state approvate norme che po...,Penso al decreto - legge n. 11 del 2009 contro...,0
10023,839746,A cosa sono servite le armi?,Avremo sentito dai nostri nonni cosa è success...,0
10024,866639,"Non è una banalità, non è una questione semant...",Recentemente sono state approvate norme che po...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_Df_Dist_30_With_Ids

Classes
1    5013
0    5013
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Il dataset per l'anno 2013 con distanza dist_30 contiene 10026 righe,             non sufficienti per ridurre il dataset a 12000 campioni

2013_df_dist_30_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,847519,"Ancora, secondo noi il Consiglio dovrà dare l'...",Nei giorni scorsi abbiamo assistito a un rinno...,1
1,369828,Cito questo punto perché l'ho considerato un p...,In questa chiave vanno letti gli incontri bila...,1
2,234394,"Signor Presidente del Consiglio, a nome del Gr...","Presidente Letta, lei oggi ha detto che nei co...",1
3,845908,Attuazione e verifica.,"Dai suoi racconti, dalle sue parole affiora fo...",1
4,738236,A questi messaggi si è associata l'Unione euro...,Negli occhi di Quirico ho letto la sofferenza ...,1
...,...,...,...,...
10021,300725,Penso al decreto - legge n. 11 del 2009 contro...,"Trattandosi di gravidanza, non si poteva non f...",0
10022,267751,Recentemente sono state approvate norme che po...,Penso al decreto - legge n. 11 del 2009 contro...,0
10023,839746,A cosa sono servite le armi?,Avremo sentito dai nostri nonni cosa è success...,0
10024,866639,"Non è una banalità, non è una questione semant...",Recentemente sono state approvate norme che po...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4010
1    4010
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1003
1    1003
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
8354,381911,Sono passati sette anni: dovevamo passare ai d...,Questi sono i controsensi che viviamo noi oper...,0
5167,32555,Questo è un elemento positivo.,Nonostante il grosso lavoro della 7ᵃ Commissio...,0
2137,748285,E abbiamo ricordato - lo ha fatto chi oggi sta...,Il Governo ha rivolto l'invito a fare presto e...,1
1958,297216,Appare inconcepibile che fino a questo momento...,"Ma non è finita, dopo il rendiconto, ci occupi...",1
8546,180765,"Le mozioni, su cui in mattinata è stata avviat...","La questione o, meglio, il problema della tute...",0
...,...,...,...,...
321,687146,"Ovviamente, siamo arrivati forti del lavoro e ...","Il G20 ha lanciato un chiaro messaggio, chiede...",1
671,680134,"Signor Presidente, signori rappresentanti del ...",La Germania ha quasi raggiunto la piena occupa...,1
5905,54896,"Inoltre, vengono date a pioggia.","Nulla si fa per prevenire, per impedire che qu...",0
8795,333782,Sappiamo bene che il settore è in crisi e che ...,A fronte di ciò sarebbe stato ragionevole prev...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5068,49319,"Il vostro articolo è incostituzionale, perché ...","Quanto agli articoli 5 e 6, sinceramente siamo...",0
5754,68001,"Intendo richiamarne qui, pertanto, soltanto gl...","Relativamente al Programma di stabilità, si ev...",0
669,76717,È quella di un'economia che compie un passo im...,"In qualche maniera, questo risulterà il nostro...",1
9591,63941,La terza priorità italiana era la regolazione ...,La dichiarazione finale include una tabella di...,0
1465,511323,"Oggi è il 16 marzo, e non posso che ringraziar...","Penso alle istituzioni sul territorio, ai sind...",1
...,...,...,...,...
2148,269198,Per gli enti di ricerca è stata prevista la po...,"Certamente, alcune modifiche sarebbero suscett...",1
9033,333886,Ho trovato molto forte il messaggio dato stama...,"La nostra Costituzione è la più robusta, la mi...",0
8377,850119,Sul concetto che potesse essere stata definita...,Dobbiamo avere ben presente non solo l'articol...,0
8444,213310,Tale era la sua fedeltà repubblicana da far em...,Proprio nella chiarezza dei rispettivi ambiti ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_df_dist_30_with_ids_ridotto Train shape: (8020, 4)
2013_df_dist_30_with_ids_ridotto Test shape: (2006, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2013_df_random_speech_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,140048,È una via cruciale per lo sviluppo del territo...,L'ordine del giorno ribadisce tali fattispecie...,1
1,516064,"È responsabilità, quindi, del Parlamento espri...",Passiamo alla votazione dell'emendamento 1.219.,1
2,116623,Ho avuto più volte occasione di ribadire in qu...,Tra pareri che rimbalzano e documenti in peren...,1
3,349037,Premesso che l'Italia partecipa con un numero ...,Capisco e conosco le problematiche interne al ...,1
4,673800,"Faccio riferimento al tribunale di Modica, del...","Con il passare dei giorni, la ricostruzione di...",1
...,...,...,...,...
95271,400980,"Voce libera e sapiente, per la quale l'informa...","Esiste pertanto un diritto d'informare, ma par...",0
95272,352903,"Esiste pertanto un diritto d'informare, ma par...",Questo è il senso profondo delle parole del se...,0
95273,865769,Questo è il senso profondo delle parole del se...,Racconto e allo stesso tempo appello contro og...,0
95274,418365,Racconto e allo stesso tempo appello contro og...,Informare e comunicare sono prospettive irrinu...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_Df_Random_Speech_With_Ids

Classes
1    47638
0    47638
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2013_df_random_speech_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
44,283713,I risparmi ottenuti in qualsiasi settore della...,Ricordo che il Senato tornerà a riunirsi in se...,1
52,403776,È iscritta a parlare la senatrice Bisinella.,"Signor Presidente, poiché non ho più la certez...",1
53,403488,Allora la risposta deve essere muscolare e mas...,"Le mozioni, interpellanze e interrogazioni per...",1
65,559814,Non vedo come possa ledere le prerogative dell...,"Passiamo all'emendamento 1.6, su cui la 5ᵃ Com...",1
66,361321,È stata una manifestazione molto civile e molt...,Non essendovi iscritti a parlare nella discuss...,1
...,...,...,...,...
95244,348008,Missione pervicacemente perseguita nei sei ann...,In un contesto di grande trasformazione di que...,0
95258,444294,"Le mozioni, interpellanze e interrogazioni per...",Il Senato tornerà a riunirsi in seduta pubblic...,0
95261,797455,Avverto che nel corso della seduta odierna pot...,Pertanto decorre da questo momento il termine ...,0
95263,665510,"Comunico che, d'intesa con il Presidente della...","Comunico inoltre che, d'intesa con il Presiden...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
586,143542,"Signor Presidente, pur essendo presente, non s...",Sapete bene che il decreto - legge sul cuneo f...,1
35007,262976,Ho avuto la fortuna di conoscere personalmente...,"Metto ai voti l'emendamento 2.2, presentato da...",1
63390,32784,Spesso gli aiuti conferiti dai Paesi donatori ...,"Molti aiuti hanno comunque, e nonostante le de...",0
49546,883,"Tale ipotetico scenario, peraltro, dovrebbe di...","Supponiamo, comunque, che in un momento di dif...",0
31876,822831,"Signor Presidente, intervengo solo per precisa...",Entrambi immersi nella concretezza del dramma ...,1
...,...,...,...,...
38752,91231,"Proprio per questo, dovrebbe essere configurat...",Procediamo all'esame degli emendamenti e degli...,1
41430,638256,Proseguiamo quindi con l'illustrazione degli e...,Quest'opera ha conosciuto sette analisi costi ...,1
55883,771642,Ci sarà un motivo perché in Italia l'ambiental...,Aggiungiamo poi che lei ha declinato decine di...,0
75693,65623,"Quella del Vajont è una storia tremenda, un av...",Il Vajont è uno spaventoso dramma e il suo pos...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
31546,86730,Salutiamo gli studenti e i docenti dell'Istitu...,"Questo intervento, allora, altro non vuole ess...",1
80902,690900,"Probabilmente sbaglieremmo e gravemente, se af...",Ma siccome facciamo i conti con un problema st...,0
79550,187482,Noi invece intendiamo votare una legge che dia...,"Signor Presidente, premetto che il Gruppo del ...",0
93908,610271,"Senatore D'Ambrosio Lettieri, desidero informa...",Speriamo di poter ottenere l'effetto desiderato.,0
4955,56224,Il Governo ha presentato al Parlamento una leg...,"Signor Presidente, intervengo per chiedere che...",1
...,...,...,...,...
57034,870176,Serve per nascondere la debolezza o l'inconsis...,Serve ad evitare di dover rispondere con credi...,0
6202,31190,L'elenco dei senatori in congedo e assenti per...,"Non facendosi osservazioni, la richiesta si in...",1
26093,153483,"L'Italia, da sola, ha contribuito con 35, 9 mi...","Signora Presidente, in merito alle decisioni a...",1
20475,205140,"Se vuole, Presidente, vengo di persona e le in...","Quindi, alla fine ci si ritrova sempre non sui...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2013_df_random_speech_with_ids_ridotto Train shape: (9600, 4)
2013_df_random_speech_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

2014_df_dist_5_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,145025,La Giunta ha esaminato la domanda in varie sed...,"La richiesta di autorizzazione in esame, trasm...",1
1,113645,Due sono però gli argomenti che voglio meglio ...,Si tratta di agire su elementi che possono ess...,1
2,208751,Io vi avviso che quando un Regolamento viene p...,Io le ho detto che l'articolo 92 dice espressa...,1
3,242100,"È una spirale che finisce con il disastro, per...",Questa parte del Regolamento oggi viene violat...,1
4,103634,"Siccome già ieri era stata fatta tale domanda,...","Quindi, da adesso, quando si chiederà di inter...",1
...,...,...,...,...
80005,233620,"Quando non potete fare una TAC velocemente, pe...","Ditecelo, perché se è così, noi non abbiamo ca...",0
80006,709444,La seduta è ripresa.,La Conferenza dei Capigruppo ha proceduto all'...,0
80007,319579,"Ditecelo, perché se è così, noi non abbiamo ca...",Ma se anche voi avete qualche perplessità sul ...,0
80008,194170,Ma se anche voi avete qualche perplessità sul ...,Visto che ci vogliono far credere che senza ri...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_Df_Dist_5_With_Ids

Classes
1    40005
0    40005
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2014_df_dist_5_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
4,103634,"Siccome già ieri era stata fatta tale domanda,...","Quindi, da adesso, quando si chiederà di inter...",1
7,103912,"Signor Presidente, se mi uniformassi alla filo...","Però, signor Presidente, ho ascoltato anche un...",1
9,842640,"Ma questo appartiene alla prassi parlamentare,...",Non è consentito a nessuno intervenire sull'ut...,1
16,858379,Ora rileviamo che il Ministro viene in Aula.,"Ricordo, tra l'altro, la disponibilità dimostr...",1
32,538233,"Signor Presidente, Ennio Flaiano sosteneva che...","Come cambiano, in una prospettiva in cui la fu...",1
...,...,...,...,...
79975,438019,"Ma non basta, bisogna che lo facciano tutti i ...",Gli abbiamo chiesto di togliere i vitalizi ai ...,0
79977,21086,Ci ha annunciato che il nuovo Senato sarà meno...,In questo nuovo Senato - è giusto che lo sappi...,0
79984,413150,"Sì, avete capito bene, cittadini: quei consigl...",Il Movimento 5 Stelle ha chiesto un Parlamento...,0
79998,617179,Questa triste storia comincia con la bufala di...,Renzi ci ha detto che servono le riforme per f...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
48938,230386,Per quanto riguarda i criteri di riorganizzazi...,Noi abbiamo intenzione di riorganizzare il sis...,0
63707,309848,"Soprattutto, però, mi pare che ci stiamo avvia...","In questi mesi, ragionando sulla riforma, abbi...",0
44098,841763,"Noi siamo un popolo di santi, artisti, navigat...",Non c'è nulla in questo benedetto Paese che no...,0
470,295503,"Aggiungo anche, signor Presidente e signori se...","Questo è, in sintesi, ciò che è accaduto in Co...",1
250,736418,L'impianto generale di questa riforma è stato ...,"Quindi, lei ha dovuto trovare un altro escamot...",1
...,...,...,...,...
23266,71520,Sinceramente quindi non ci capisce come con un...,Diceva Rimini che siamo l'unico Paese al mondo.,1
5228,642308,Invito il senatore Segretario a verificare se ...,Indìco la votazione nominale con scrutinio sim...,1
53619,565976,"Non è colpa sua, lo sappiamo benissimo, ma il ...","Altrettanto vergognosa penso sia l'esistenza, ...",0
70895,646956,ministro della difesa.,"Signor Presidente, come è noto, anch'io, insie...",0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
79407,636590,Il nostro sistema pubblico ha bisogno di rifor...,"Sul nuovo Senato, sulle nuove competenze tra S...",0
31570,817981,"Voi invece non le riducete: andate a minare, a...","E ve lo dico, non con la voce di qualcuno che ...",1
50712,55350,"Innanzitutto, va sottolineato l'ampliamento de...",Credo inoltre che in questo provvedimento vada...,0
4848,267652,Si voterebbero dunque gli articoli della legge...,Conta il merito.,1
26287,717271,La proposta del Sottosegretario è di accettare...,Non ci interessa l'aspetto politico con le luc...,1
...,...,...,...,...
69302,119192,"Signor Presidente, vorrei rispondere anche al ...",Il senatore Romani ha detto che non sa se è na...,0
4803,550029,Con tale previsione sapremo quanta pioggia dov...,"Mi dispiace non poterlo dire al Governo, che f...",1
48581,390456,"Colleghi, se il Paese rimane così com'è, non u...",Se rimarrà fermo nel suo sistema di fondo non ...,0
25514,501572,La disastrata situazione economica italiana no...,"C'è da dire, però, signora Presidente, che cer...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_df_dist_5_with_ids_ridotto Train shape: (9600, 4)
2014_df_dist_5_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2014_df_dist_10_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,680567,"Nel settore suinicolo, ad esempio, c'è un prob...","Il nostro, in conclusione, è un richiamo al Go...",1
1,342239,Un fallimento micidiale che non ha aiutato la ...,Quando l'associazione è costituita per commett...,1
2,177472,"Si parla di 12, 4 miliardi per il 2016, di 17,...","E mentre Confindustria è contenta, intanto i p...",1
3,750059,"Ecco perché questo decreto - legge, che interv...","Pertanto, cari colleghi, il messaggio che dobb...",1
4,347453,Voi scrivete che in particolare la legge di st...,Questa è la verità.,1
...,...,...,...,...
54655,734190,"Certo, abbiamo allargato la possibilità di far...","Infatti, il decreto mette in rilievo anche uno...",0
54656,632665,"Il mio Gruppo si è battuto, in queste settiman...","Certo, abbiamo allargato la possibilità di far...",0
54657,450212,"Di questo parliamo, non é solo onestà intellet...","Il mio Gruppo si è battuto, in queste settiman...",0
54658,422501,"Ebbene, di questo parliamo: significa che se n...","Di questo parliamo, non é solo onestà intellet...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_Df_Dist_10_With_Ids

Classes
1    27330
0    27330
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2014_df_dist_10_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
9,577308,È necessario guardare di più all'evoluzione de...,"Colleghi, si sta molto discutendo, invece, sul...",1
18,531285,Con questo decreto - legge non si cancella l'a...,"Tale fattispecie drammatica, organizzata in mo...",1
21,875078,Con l'articolo 74 si colpiscono le associazion...,"Quando, invece, ci troviamo di fronte alle con...",1
22,823019,Il presidente Azzollini parlava di quattro ric...,"Veniamo a questa bellissima relazione, con la ...",1
29,805868,È chiaro che voi già conoscete bene questi num...,Così come in questi anni siete stati indiffere...,1
...,...,...,...,...
54646,847914,"Signor Presidente, onorevoli colleghi, ho chie...","Alle ore 22, 59 del 7 maggio 2013 il cargo «Jo...",0
54647,818948,«Noi che siamo i custodi del più grande patrim...,E questa buona pratica dovremmo esportarla».,0
54649,422494,Perché tutti diciamo che aspettiamo la delega?,Perché la delega del Governo metterà insieme q...,0
54655,734190,"Certo, abbiamo allargato la possibilità di far...","Infatti, il decreto mette in rilievo anche uno...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
10705,136043,Risultano addirittura cento funzionari che pre...,"Di certo, la diffusione dei mezzi di informazi...",1
23555,274694,"Non voglio dire che è una bugia, ma è un error...",Alla Camera hanno fatto un'altra scelta: al ri...,1
49575,285272,Il disegno di legge all'attenzione dell'Aula è...,"In particolare, si è provveduto ad integrare i...",0
6028,315137,Oggi la questione curda è tremendamente di att...,"Questo candidato non era del PKK, ma appartene...",1
10512,431666,Questo squilibrio consente a chi vince le elez...,Nel 2007 la riduzione fu approvata per iniziat...,1
...,...,...,...,...
49316,295303,"È il primo passo, solo il primo passo, ma fors...","Finalmente anche in Italia, in un clima di leg...",0
53889,893308,"Restituire dignità agli insegnanti, espression...","Penso alla SSIS, al TFA e ai PAS, sistemi che ...",0
120,112086,Se consideriamo il livello attuale di disoccup...,Per questo motivo noi voteremo contro la risol...,1
45402,80672,L'elemento che riguarda la popolazione dell'Em...,"Non è questo, ovviamente, lo spirito con cui q...",0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
30078,583153,"Arrivati in Parlamento, la pratica di ogni gio...",Indicazioni precise arrivavano dall'alto e non...,0
25842,358168,Se una volta tanto la politica riesce ad esser...,"A me piacerebbe, colleghi del centrodestra, ch...",1
37118,71586,I paletti posti a presidio dell'indipendenza d...,"Guardate, quando parlo di soggetto pubblico, m...",0
42370,833670,Questo decreto non ha questo scopo: questo dec...,"Certo, si poteva fare di più, e vengo immediat...",0
39563,827983,Perché si è perduta la millenaria cultura dell...,Come potranno giustificarsi i troppi fondi spe...,0
...,...,...,...,...
20062,359240,"Il secondo è la modernizzazione dei servizi, a...",La riorganizzazione in atto non è affatto a fa...,1
28351,237280,"Dopo un lungo lavoro, infatti, erano state ind...",Non è stato possibile salvare quei posti di la...,0
49285,729600,In quest'Aula abbiamo visto solo un Ministro c...,"Qui, invece, parliamo della Costituzione: quan...",0
44704,51933,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_df_dist_10_with_ids_ridotto Train shape: (9600, 4)
2014_df_dist_10_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2014_df_dist_20_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,387528,Cerchiamo di non far calare anche questo gradi...,"Il nostro, in conclusione, è un richiamo al Go...",1
1,580775,Noi siamo nati per riformare questo Paese.,"Le aspettative però, signor Presidente, hanno ...",1
2,349118,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,1
3,524560,Il nuovo commissario subentrato ha fatto un co...,Noi chiediamo dunque al Governo un impegno mol...,1
4,83877,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,1
...,...,...,...,...
28155,83016,Il Governo in questo senso si è opportunamente...,Le norme che sono state introdotte alla Camera...,0
28156,222035,"Sinceramente, mi sembra che entrambe le carica...",Il Governo in questo senso si è opportunamente...,0
28157,850768,"Così come, dall'altro lato, da parte di Forza ...","Sinceramente, mi sembra che entrambe le carica...",0
28158,267339,"Mi sembra, oltroché inverosimile, perfino ridi...","Così come, dall'altro lato, da parte di Forza ...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_Df_Dist_20_With_Ids

Classes
1    14080
0    14080
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2014_df_dist_20_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,387528,Cerchiamo di non far calare anche questo gradi...,"Il nostro, in conclusione, è un richiamo al Go...",1
1,580775,Noi siamo nati per riformare questo Paese.,"Le aspettative però, signor Presidente, hanno ...",1
4,83877,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,1
5,356017,Crediamo talmente tanto alle riforme che duran...,Una fretta sospetta e la volontà di dettare i ...,1
9,343318,Il Senato non approva.,Il Senato non approva.,1
...,...,...,...,...
28149,171029,"Non poteva essere altrimenti, visto che la dis...","È un problema, questo, che non si affronta e n...",0
28152,153494,La prima caricatura è quella secondo cui il si...,"Mi sembra, oltroché inverosimile, perfino ridi...",0
28153,481788,Voglio ricordare le correzioni e le integrazio...,Mi riferisco in primis alla diminuzione delle ...,0
28154,870959,Le norme che sono state introdotte alla Camera...,Voglio ricordare le correzioni e le integrazio...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
176,359213,"Dobbiamo legittimare, non certamente per la no...",In aggiunta - questo lo abbiamo evidenziato co...,1
3756,508037,Lo scorso 17 ottobre la Commissione europea ha...,Ricordo anche che durante il vertice bilateral...,1
14314,513570,"Ma non è attraverso un decreto - legge, oltret...",Perché dico «ulteriori margini»?,0
16340,125533,"Anzi, la multa prevista era sicuramente molto ...","Di questo dobbiamo essere ben coscienti, per c...",0
9902,498451,"Circa l'articolo 6, si è proceduto a ridefinir...",Altre novità consistono nella facoltà di ricor...,1
...,...,...,...,...
1115,752006,Questo si deve a quello che in America viene c...,"In primo luogo, intervenire ora su liste il cu...",1
23976,416736,Non c'è bisogno di una legge o di una regola p...,Questo è lo scopo con cui vengono scritti i Re...,0
3572,381438,Si è parlato di opportunità della sua sussiste...,"Posto, infine, che la rappresentanza parlament...",1
6547,858151,È ora di ricostruire intorno a loro un sistema...,"Qui, signor Ministro, c'è il tratto costituent...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
23532,430528,"Rievoca la satura lanx, il piatto misto di pri...","Purtroppo, questo provvedimento non riguarda l...",0
28146,894127,Si tratta di quei settori che rappresentano un...,Sono settori nei quali la flessibilità è conna...,0
26333,884142,Questo perché?,Per venire incontro al Governo.,0
27343,586515,Dopo sedici anni in cui non hanno mai più vist...,Ma il procuratore generale di Bologna ha detto...,0
16984,537027,"Sottolineo peraltro come, di questi 780 milion...",Faccio alcune riflessioni in merito agli artic...,0
...,...,...,...,...
4960,143976,A me sembra - nel solco ovviamente della tradi...,"È l'Italia, nel suo insieme, che sta lavorando...",1
17987,531593,"Dobbiamo sapere, quindi, che questo cambiament...","È chiaro infatti che, se valuteremo solo il fa...",0
19503,722607,Sono anni che i cittadini e l'opinione pubblic...,Si è parlato più volte di dimezzamento.,0
11103,473351,"Per consentire il recupero, si istituisce un f...",Lo stesso avremmo voluto fare per vedere appli...,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_df_dist_20_with_ids_ridotto Train shape: (9600, 4)
2014_df_dist_20_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2014_df_dist_30_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,44280,Mi riferisco al caso Mannino perché è stato em...,Abbiamo visto dispendi enormi di energie sul n...,1
1,506179,"Al contrario, è l'ennesimo annuncio che, alla ...",Peccato però che alla prova dei fatti - ovvero...,1
2,865351,Nemmeno il più spregiudicato e accanito sosten...,"Ebbene, il provvedimento in esame è l'ennesimo...",1
3,92711,"Nel testo ci sono altre due perle, cari colleg...","Se la democrazia ha ancora un senso in Italia,...",1
4,581913,"Anzitutto, il passaggio in cui si specifica ch...",Per tutto quanto detto il Gruppo GAL voterà co...,1
...,...,...,...,...
14621,36095,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
14622,817095,"Signor Presidente, colleghi senatori, non è un...","La riforma, in particolare quella del Senato, ...",0
14623,427709,"Se pensi, magari non voti in linea con il mano...",Canguro: se hai troppe idee non puoi intralcia...,0
14624,443551,Il Senato non approva.,Risultano pertanto preclusi la restante parte ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_Df_Dist_30_With_Ids

Classes
1    7313
0    7313
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2014_df_dist_30_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,44280,Mi riferisco al caso Mannino perché è stato em...,Abbiamo visto dispendi enormi di energie sul n...,1
1,506179,"Al contrario, è l'ennesimo annuncio che, alla ...",Peccato però che alla prova dei fatti - ovvero...,1
2,865351,Nemmeno il più spregiudicato e accanito sosten...,"Ebbene, il provvedimento in esame è l'ennesimo...",1
3,92711,"Nel testo ci sono altre due perle, cari colleg...","Se la democrazia ha ancora un senso in Italia,...",1
5,749562,"Signor Presidente, sarò brevissimo: utilizzerò...","Lo dice la scienza: non c'è tempo da perdere, ...",1
...,...,...,...,...
14620,819553,"La riforma, in particolare quella del Senato, ...","I fatti, purtroppo, anzi le cifre, confermano ...",0
14621,36095,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
14622,817095,"Signor Presidente, colleghi senatori, non è un...","La riforma, in particolare quella del Senato, ...",0
14623,427709,"Se pensi, magari non voti in linea con il mano...",Canguro: se hai troppe idee non puoi intralcia...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
404,219925,"Ormai credo che, storicamente, ciò che è succe...",Questi sono fatti reali che incidono pesanteme...,1
6666,114435,Questi sono modi per delegittimare e togliere ...,Noi riteniamo che comunque questo provvediment...,1
162,647387,Punti diversi di pensiero che in alcune situaz...,Auspico che prima del voto ci possa essere un'...,1
14622,817095,"Signor Presidente, colleghi senatori, non è un...","La riforma, in particolare quella del Senato, ...",0
3248,22719,"Infatti, grazie all'impegno e al sostegno del ...","Ricordo, in particolare, che nel cosiddetto de...",1
...,...,...,...,...
13350,193014,"Ma oggi più nessuno, in questo Paese, crede al...",Intanto continuiamo a sprecare soldi utilissim...,0
11476,58222,Proprio di misure e di parità siamo stati trop...,«Il terribilismo dei futurologi» - gli ricorda...,0
8834,673928,Nella seduta del 20 novembre 2013 la Giunta av...,Nella memoria depositata dall'ex senatore Dell...,0
5383,407476,Togliere il lavoro alle persone non significa ...,I numeri della crisi di Meridiana sono nel bil...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
10009,739849,"Avremo, infatti, circa 400 persone in meno e n...",Allora ho proposto di tenere conto di una grad...,0
10085,722170,"In particolare, al fine di agevolare l'iscrizi...","Nel giugno del 2007 si è svolta, pertanto, la ...",0
10462,126908,"Peraltro, questa fiducia interviene dopo che i...",Ci sarebbero stati i tempi tecnici per un'appr...,0
10051,713722,Vogliamo essere negoziatori difficili ed esige...,Queste sono le due coordinate attorno alle qua...,0
13612,144245,"E questo, se è un vantaggio per chi conferisce...",Il pacchetto dell'Unione europea guarda nettam...,0
...,...,...,...,...
13286,206797,Anche in questo caso ci si è trovati di nuovo ...,Nella giornata di ieri abbiamo convocato di nu...,0
2598,286336,Altri 400 milioni di euro di riserva sono anco...,Con tali criteri sono state listate 24 persone.,1
986,18619,"L'Europa ha molti gravi limiti, primo fra tutt...",Il Partito Democratico è impegnato a non ripet...,1
10956,833304,Stiamo discutendo della riforma costituzionale...,Se le opposizioni chiedono maggiore approfondi...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_df_dist_30_with_ids_ridotto Train shape: (9600, 4)
2014_df_dist_30_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2014_df_random_speech_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,585019,"Per questo riteniamo, signora Presidente, che ...","Onorevoli colleghi, in relazione a quanto rife...",1
1,889362,"Senatore Crimi, le vorrei segnalare che ritira...",Che non sia un numero falso lo certifica anche...,1
2,195833,"Allora ritiro l'emendamento 1.0.4, per consent...","Signor Presidente, esprimo parere conforme a q...",1
3,491053,"Sì, perché per l'emendamento 1.0.4 è prevista ...",Comunico all'Assemblea che è stato riassegnato...,1
4,877454,L'emendamento 1.0.4 preclude l'emendamento 1.0.6?,Con l'emendamento 2 - ter.1 chiediamo di cambi...,1
...,...,...,...,...
140317,504409,"Si impegnò nel Movimento Sociale Italiano, div...",Nel 1958 fu poi eletto nel collegio di Milano ...,0
140318,473587,Se la Camera dei deputati valuterà necessario ...,"Vivi, prolungati.",0
140319,872490,"Ma servono quattro letture, quattro approvazio...",Se la Camera dei deputati valuterà necessario ...,0
140320,781282,Nel 1958 fu poi eletto nel collegio di Milano ...,Successivamente fece anche due legislature al ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_Df_Random_Speech_With_Ids

Classes
1    70161
0    70161
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2014_df_random_speech_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,889362,"Senatore Crimi, le vorrei segnalare che ritira...",Che non sia un numero falso lo certifica anche...,1
33,89992,"Gli emendamenti da 1.0.10 a 1.0.20, fatta ecce...",È iscritto a parlare il senatore Lucidi.,1
53,173749,"Credo che questo vada stigmatizzato, perché la...","Signora Presidente, anch'io non ho potuto vota...",1
54,590371,Hanno avuto un occhio di riguardo per il colle...,"Signora Presidente, rinnoviamo la richiesta di...",1
60,186110,"Allora che il Senato, quale che sia, partecipi...","Signor Presidente, il parere è contrario su tu...",1
...,...,...,...,...
140304,216394,Il cammino della riforma è ancora lungo e il P...,I senatori che oggi approveranno la riforma lo...,0
140308,571929,Servello è stato un protagonista nel Movimento...,"Servello era nato nel 1921 negli Stati Uniti, ...",0
140309,245039,Davvero il lavoro parlamentare - lo sappiamo t...,Quindi voglio ringraziare innanzitutto i colle...,0
140318,473587,Se la Camera dei deputati valuterà necessario ...,"Vivi, prolungati.",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
85954,366303,Abbiamo peraltro sostenuto più volte la necess...,Vorremmo allora sapere come si può pensare che...,0
126678,192634,Noi non possiamo svicolare da un punto essenzi...,"Su questo non possiamo svicolare, perché viene...",0
33541,530937,Voglio ricordare - si tratta di una consideraz...,È approvata.,1
116767,708262,"In una canzone del 1993, intitolata «Tuttappos...",Il problema però è sempre lo stesso.,0
12345,791633,Si poteva ragionare su competenze diverse tra ...,"Il voto di Forza Italia, pertanto, sarà certam...",1
...,...,...,...,...
648,298263,"Infatti, lei prima, indirettamente, parlando d...","Le mozioni, interpellanze e interrogazioni per...",1
64932,551827,Penso allora ad una sessione dedicata - come f...,Il Senato tornerà a riunirsi in seduta pubblic...,1
53629,232193,I cittadini non possono pagare con stratosferi...,Il Governo questo problema non se lo è posto: ...,1
7775,328633,È un tema che riproponiamo in molti casi anche...,Il senatore Magorno ha facoltà di illustrare l...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
59674,269160,È un atteggiamento di cui purtroppo tanti di n...,"Nemo propheta in patria, forse, ma quello che ...",1
31761,552211,È iscritto a parlare il senatore Piccoli.,Il Senato non approva.,1
67459,438079,"Signora Presidente, sottoscrivo anche l'emenda...","Continua così, con posizioni che possiamo defi...",1
16138,651053,Con questo disegno di legge si vuole invece im...,È iscritto a parlare il senatore Napolitano.,1
34323,509000,A queste vanno aggiunte le manifestazioni di f...,Indìco la votazione nominale con scrutinio sim...,1
...,...,...,...,...
25545,333470,"Per quanto riguarda gli ordini del giorno, ci ...","Dopo la lettura del calendario, proseguiranno ...",1
40840,161480,"Tali dati sono di fondamentale importanza, in ...","Non potendo più assicurare, durante il prossim...",1
53194,302171,"Signor Ministro, la ringrazio per le sue rispo...","Tuttavia, proseguire con questo inquinamento, ...",1
80206,202981,"E ancora, ricordiamo il controverso articolo 1...","Eppure, proprio questo articolo è stato oggett...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2014_df_random_speech_with_ids_ridotto Train shape: (9600, 4)
2014_df_random_speech_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

2015_df_dist_5_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,712139,Si pone però innanzitutto una questione fondam...,Se quindi si accedesse per concorso - e lo dic...,1
1,651168,"Ad esempio, da diverso tempo ritengo che la mi...","Servirebbe capire cioè, nelle aree d'intervent...",1
2,553969,"È vero che, nell'ambito della coalizione a gui...","È giusto chiedere, come ha fatto il nostro Pre...",1
3,155246,È vero anche che abbiamo oltre mille soldati i...,"Questa è una situazione in divenire, in cui no...",1
4,95574,È vero che i curdi che combattono contro l'ISI...,"E dunque, lasciare a Francia e Regno Unito, an...",1
...,...,...,...,...
86869,388607,"Diciamo allora che, vista la batosta subita da...",L'Italia sconta un ulteriore gap di produzione...,0
86870,732634,"Signor Presidente, se lei è d'accordo, esprimo...","Negli emendamenti 01.200, 01.201 e 01.202 - sc...",0
86871,47402,L'Italia sconta un ulteriore gap di produzione...,Nel decreto - legge sono inoltre presenti alcu...,0
86872,255385,Nel decreto - legge sono inoltre presenti alcu...,"Secondo noi, le quote latte sono diventate obs...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_Df_Dist_5_With_Ids

Classes
1    43437
0    43437
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2015_df_dist_5_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,651168,"Ad esempio, da diverso tempo ritengo che la mi...","Servirebbe capire cioè, nelle aree d'intervent...",1
18,451051,Voglio partire dalla difficoltà di esprimere u...,"Al ministro Pinotti, qui presente, dico però c...",1
26,632505,Proprio la situazione internazionale e le cose...,Il fatto di non poter avere una discussione si...,1
46,92032,"Annuncia di voler far parte del nostro blocco,...",Dobbiamo combattere un mostro che sta preoccup...,1
51,769195,Dobbiamo combattere un mostro che sta preoccup...,"Non li possiamo lasciare così ""polverizzati"" e...",1
...,...,...,...,...
86821,564390,Ed è un errore confinare all'interesse territo...,Anche qui vi sono state alcune risposte con il...,0
86836,227787,Legato al superamento del contingentamento del...,Quindi lo è il riconoscimento delle organizzaz...,0
86860,479242,"Signor Presidente, onorevoli colleghi, rappres...","A nostra modesta valutazione, queste misure ap...",0
86863,248460,"Lo Stato deve, quindi, intervenire per fare in...",Anche ieri abbiamo avuto segnali che indicano ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
70878,658342,Perché mai intorbidire le acque in una questio...,"Ci si rivolge al Comune, all'autorità civile o...",0
70787,132931,"Signor Presidente, colleghi, anche se invero l...","Concordo con quanto ha detto la relatrice, qua...",0
48255,94786,La scelta della maggioranza di un'operazione d...,"La Costituzione del 1947 - quella vigente, la ...",0
30261,299412,"In questi giorni, infatti, i membri del Govern...",Come - per inciso - ci appare assolutamente in...,1
11440,50183,"Non lo sapete, vero?",Con questo disegno di legge spingete ancora di...,1
...,...,...,...,...
68655,77743,"Sì, perché questo provvedimento non ha avuto v...",Ricordo infatti che è stato licenziato dalla C...,0
36607,457381,Nel corso di questo primo anno di Governo Renz...,Questa mattina ci siamo astenuti nella votazio...,1
71990,504403,Il Senato non approva.,L'emendamento 16.2010 e gli emendamenti da 16....,0
14114,528772,L'articolo 8 pone un rigido principio di riser...,Una rapida approvazione di questo accordo rapp...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
53164,698711,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
18516,316028,L'Italia è un Paese che deve fare forza comune...,Invito quindi a fare una discussione approfond...,1
71541,438548,"È vero, come è stato detto, che è un momento p...",Siamo ridotti male se ci deve essere qualcuno ...,0
16399,655464,"Ma quello che ora ci viene proposto, onorevoli...","Inoltre, non sono previste soglie di sbarramen...",1
4481,178649,Innanzitutto nell'emendamento 9.317 propongo d...,L'avvocato cosa risponde?,1
...,...,...,...,...
70482,729877,Siamo ormai a metà legislatura - sempre che no...,Questa è la realtà dei fatti.,0
83688,797269,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,0
15208,556380,"In altri termini, in Commissione giustizia si ...","Il Governo presenta l'emendamento 1.702, si ap...",1
45630,206737,Si prevede altresì l'aggiunta dei nuovi reati ...,"Si consente inoltre, anche per l'omicidio stra...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_df_dist_5_with_ids_ridotto Train shape: (9600, 4)
2015_df_dist_5_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2015_df_dist_10_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,215696,"Insomma, indennità dimezzata e precarietà radd...","Ministro, chiedo che questo Governo prenda una...",1
1,3624,"Nello specifico, coloro che sono risultati ido...",Allargando l'analisi sul piano delle assunzion...,1
2,302499,"Ciò non fa venir meno, però, la mia possibilit...",Scorporando dal totale predetto coloro che all...,1
3,14709,Ringrazio ancora il Presidente e il signor Sot...,"Inoltre, abbiamo ricordato come tale selezione...",1
4,119629,"Il mio compito, come dicevo prima, sarebbe que...","Con questa interpellanza, il sottoscritto e Fo...",1
...,...,...,...,...
59153,763429,Sul malcostume normativo della decretazione d'...,Ancora: si dice di una riforma che aspettiamo ...,0
59154,553125,Gli incidenti stradali sono la prima causa di ...,"L'educazione, prima di essere educazione alla ...",0
59155,183391,"Tuttavia, le innovazioni apportate alle norme ...",Gli incidenti stradali sono la prima causa di ...,0
59156,259622,Ancora: si dice di una riforma che aspettiamo ...,"A me pare strano, forse mi sono informato da q...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_Df_Dist_10_With_Ids

Classes
1    29579
0    29579
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2015_df_dist_10_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,215696,"Insomma, indennità dimezzata e precarietà radd...","Ministro, chiedo che questo Governo prenda una...",1
7,477166,Tra i punti qualificanti del provvedimento si ...,"Durante l' iter parlamentare, a seguito delle ...",1
10,251487,Allargando l'analisi sul piano delle assunzion...,Colgo l'occasione per suggerirle di usare altr...,1
13,183625,"Inoltre, abbiamo ricordato come tale selezione...","Infatti, come ho più volte ricordato e come fa...",1
15,30647,Quello appena riassunto era il quadro che si p...,"Ad oggi, invece, la percentuale degli atti che...",1
...,...,...,...,...
59146,53483,"Infatti, l'attuale previsione dell'omicidio st...",La previsione ha fallito perché non ha fermato...,0
59150,84701,Diciamolo allora chiaramente e chiediamocelo: ...,Sul malcostume normativo della decretazione d'...,0
59151,786515,"L'educazione alla salute, oltre che all'ordine...","Per questo, si è ritenuto necessario procedere...",0
59153,763429,Sul malcostume normativo della decretazione d'...,Ancora: si dice di una riforma che aspettiamo ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
25030,465357,Abbiamo posto con forza la stessa questione ri...,Il senso è molto chiaro: sottrarre la RAI ai p...,1
44631,552463,"Signor Presidente, nella votazione di questa r...",Voglio fare chiarezza sulla questione.,0
51039,716644,"Signor Presidente, ho ritenuto doveroso - non ...",Esprimo apprezzamento soprattutto per aver pro...,0
6174,608909,Comincerò quindi con il dire che 25 sono gli e...,Si tratta di una materia delicatissima e impor...,1
17029,325111,"Da un lato, questo spiegherebbe come mai nella...",E come la farà?,1
...,...,...,...,...
19361,54322,Questa probabilmente è stata la settimana più ...,Vorremo quindi vederle calendarizzate.,1
22856,764778,"Quindi, l'ultima parola spetta al Parlamento.",E questo è un motivo di riflessione ulteriore ...,1
21167,699061,Il relatore ha detto che ci vogliono ventiquat...,Ma non è tutto.,1
22156,560119,Ricordo che quando ascoltai quelle parole rima...,Racconti di persone deportate dai campi di ste...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
8332,873353,"Tutti questi morti, signor Presidente, erano n...",Come può l'Europa non capire che questi morti ...,1
15629,45827,In seguito - ma solo dopo - si sarebbe dovuta ...,"Noi non ve lo diciamo, ma state certi che tra ...",1
26263,534112,Questo è un provvedimento di spesa che non dov...,Ma questo - ahimè - non dipende da noi.,1
8533,165703,"Signor Presidente, noi voteremo questa pregiud...","Con la legge di stabilità, approvata a dicembr...",1
5289,170441,"Il tasso di indebitamento è passato dal 2, 2 a...","Vede signora Presidente, se volessi essere cau...",1
...,...,...,...,...
46399,130237,Qual è il criterio direttivo che deve seguire ...,"Oggi è questo Governo, domani magari ve ne sar...",0
51454,354806,Si segnalò alla fine degli anni Sessanta come ...,"Era già un capace imprenditore liberale, insof...",0
53793,643017,"Ebbene, avremo un consiglio d'amministrazione ...","È evidente, quindi, che la sentenza in cui la ...",0
41421,286928,Non possiamo perderci raddoppiando strutture b...,Siamo però ancora in tempo per salvare la Tuni...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_df_dist_10_with_ids_ridotto Train shape: (9600, 4)
2015_df_dist_10_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2015_df_dist_20_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,741072,"A San Nicola Varco c'erano tanti immigrati, ch...",Ci viene detto che bisogna andare in Europa.,1
1,577727,Per me un'opera pubblica fatta con soldi priva...,Penso a quella famosa borsa di un signore in u...,1
2,389679,"Allora, ancora una volta, è vero che l'opera v...","Posso capire la posizione dei relatori, ma non...",1
3,61664,Abbiamo dovuto inserire una norma in base alla...,Questa è la nostra posizione su questo punto.,1
4,423457,"Allora, noi dobbiamo far sì che tutte le cose ...","Non possiamo dare ai privati, che ci mettono i...",1
...,...,...,...,...
30557,668389,"Come ho detto, quindi, a seguito del confronto...",Altri hanno auspicato un sistema sanzionatorio...,0
30558,460629,Altri hanno auspicato un sistema sanzionatorio...,Questo problema in Commissione è stato affront...,0
30559,633995,"Chiariamo anche questo punto, caro presidente ...",Questo penso lo si possa dire.,0
30560,508044,Questo problema in Commissione è stato affront...,Non c'è una preclusione di tipo pregiudiziale ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_Df_Dist_20_With_Ids

Classes
1    15281
0    15281
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2015_df_dist_20_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,577727,Per me un'opera pubblica fatta con soldi priva...,Penso a quella famosa borsa di un signore in u...,1
2,389679,"Allora, ancora una volta, è vero che l'opera v...","Posso capire la posizione dei relatori, ma non...",1
3,61664,Abbiamo dovuto inserire una norma in base alla...,Questa è la nostra posizione su questo punto.,1
5,462733,"C'è, quindi, un surplus del 20 per cento, e vo...",Sicuramente siamo tutte persone oneste - per c...,1
9,93363,C'è un problema di approccio generale.,"Ora, però, iniziamo a fare delle deroghe e non...",1
...,...,...,...,...
30548,725983,Ecco perché da più parti si è levato un grido ...,Ha fatto bene il Parlamento a rompere gli indu...,0
30550,29207,"Signora Presidente, mi dispiace moltissimo che...",Noi abbiamo presentato diversi emendamenti su ...,0
30553,650131,Purtroppo le elezioni ci sono sempre e ci sono...,"Speriamo che proseguano le elezioni, nei ritmi...",0
30556,473277,Questo penso lo si possa dire.,Purtroppo le elezioni ci sono sempre e ci sono...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
27935,26232,"E ciò è accaduto perché, per entrambe quelle r...","Anche rispetto al passato, il tentativo che st...",0
11815,280706,"Ecco, questo è uno di quei casi lì.","Ciò aumenterà sicuramente l'""impiccio"" del con...",1
11764,327937,La realtà sarà che i patteggiamenti non ci sar...,"Ci troviamo, quindi, di fronte ad una disparit...",1
4995,890919,È un'azienda dove si sperpera e si ruba tra es...,"Non c'è scampo, farete il peggio, ne sono cert...",1
27970,315253,"Infatti, in caso di fuga, è previsto un aument...","Si determinerebbe quindi, nelle ipotesi di min...",0
...,...,...,...,...
7992,499980,Le mozioni colgono un punto: una sensibilità c...,Il punto sul quale abbiamo registrato la maggi...,1
13815,325169,Questa è l'affermazione che si ricava da una g...,Non si tratta certo di togliere nulla a quella...,1
27871,616510,"Signor Sottosegretario, per suo tramite rivolg...","Non glielo dice il senatore Caliendo, ma gliel...",0
17636,503628,"Ho dato, inoltre, il massimo impulso per utili...",Nelle prossime settimane saranno indetti gli s...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
21617,286219,"Tuttavia, per la verità - mi rivolgo alla sena...",Questa volta è stato anticipato e prima dell'a...,0
27728,206732,Lo svelamento in che cosa è consistito?,"Siamo partiti da uno slogan, «fuori i partiti ...",0
2709,112505,"Il divorzio infatti è una rottura, ma di che c...","Inoltre, il discorso di fondare la società su ...",1
27720,573580,"È ovvio che, poiché in passato ci si sposava e...","Adesso l'amore non è eterno e, quindi, è norma...",0
13123,484516,Il Senato non approva.,Invito il senatore Segretario a verificare se ...,1
...,...,...,...,...
29654,117926,"Per quanto riguarda il settore civile, ad esem...",L'aumento dell'importo del contributo unificat...,0
21800,70849,Ma la governabilità cosa è se non il frutto di...,"La governabilità, che anima le ansie peggiori,...",0
17693,615523,È sempre nell'ottica della tutela del cittadin...,"Ciò premesso, sarebbe davvero auspicabile una ...",0
2870,569568,"Tuttavia, quel prefetto è stato rimosso, mentr...",Noi abbiamo consapevolezza del fatto che quest...,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_df_dist_20_with_ids_ridotto Train shape: (9600, 4)
2015_df_dist_20_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2015_df_dist_30_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,506629,"Non me la prendo con lei, vice ministro Oliver...",Mi dichiaro quindi insoddisfatto e preso in gi...,1
1,682257,"Noi del Movimento 5 Stelle riteniamo, come d'a...",Le pensioni calcolate con il sistema attuale n...,1
2,93878,"Io non capisco invece, cari colleghi, quali si...",Io credo che equità non debba corrispondere al...,1
3,770030,Il 3 dicembre 1993 è stata istituita la Giorna...,Questa è la realtà del sostegno scolastico in ...,1
4,667985,Tale parere ha espresso una serie di osservazi...,Le diverse posizioni nascono proprio perché de...,1
...,...,...,...,...
16407,356830,Se queste cose fossero successe una decina di ...,Mi riferisco al silenzio all'esterno e all'int...,0
16408,764437,Mi riferisco al silenzio all'esterno e all'int...,"Eppure è estremamente reale, come lo è la sudd...",0
16409,575171,"Eppure è estremamente reale, come lo è la sudd...","Oggi la satira è imbavagliata, è scomparsa dai...",0
16410,570154,"Oggi la satira è imbavagliata, è scomparsa dai...",Giannini è al palo.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_Df_Dist_30_With_Ids

Classes
1    8206
0    8206
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2015_df_dist_30_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,682257,"Noi del Movimento 5 Stelle riteniamo, come d'a...",Le pensioni calcolate con il sistema attuale n...,1
2,93878,"Io non capisco invece, cari colleghi, quali si...",Io credo che equità non debba corrispondere al...,1
3,770030,Il 3 dicembre 1993 è stata istituita la Giorna...,Questa è la realtà del sostegno scolastico in ...,1
5,451502,"E il Governo, invece, non pone la questione re...","Altrimenti fate i socialisti, se lo volete far...",1
6,852354,Questo non ha impedito alla Commissione agrico...,Io credo che ci siano le condizioni per approf...,1
...,...,...,...,...
16405,571513,Pensate un po'.,"I tempi cambiano, i ducetti si evolvono e si è...",0
16407,356830,Se queste cose fossero successe una decina di ...,Mi riferisco al silenzio all'esterno e all'int...,0
16408,764437,Mi riferisco al silenzio all'esterno e all'int...,"Eppure è estremamente reale, come lo è la sudd...",0
16409,575171,"Eppure è estremamente reale, come lo è la sudd...","Oggi la satira è imbavagliata, è scomparsa dai...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
2418,446534,Non può aversi innovazione senza un'attenzione...,"Infatti, pur dovendosi apportare i tagli richi...",1
6080,615295,"Nel complesso, dunque, leggendo i tre dati più...","Una volta fatta nostra, l'abbiamo replicata in...",1
8457,103096,Lo Stato in questi anni ha svolto un'attività ...,Peccato che non ne abbia prevista l'applicazio...,0
8083,203431,Non mi impegno sulle scelte politiche.,È stato fatto riferimento anche all'articolo 1...,1
8768,616082,Nell'ambito dei lavori della Giunta è emersa l...,Di tali circostanze si è discusso con chiarezz...,0
...,...,...,...,...
15678,323563,Il Senato non approva.,"Passiamo all'emendamento 2.0.4, su cui la 5ᵃ C...",0
4054,239921,"Tuttavia, non credo a ciò perché lo conosco e ...",Gli aerei volano a tutte le ore; ce ne sono ta...,1
2723,178101,Per questo cancelliamo il massimo ribasso anch...,"Arriviamo ora ad un tema che, naturalmente, è ...",1
15471,302344,"Per questa ragione vorrei dare alcune cifre, a...",È stata recuperata l'esenzione dei terreni par...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5500,116105,Il Senato non approva.,Risultano pertanto preclusi la restante parte ...,1
9426,229739,"Sennonché, questa impostazione viene smentita ...","La critica non è ai modi di gestione, ma all'a...",0
7693,354624,"Pertanto, nel ringraziare per il lavoro fatto ...",Sottolineo che la Convenzione dell'Aja si è re...,1
4771,339681,Indìco la votazione nominale con scrutinio sim...,Indìco la votazione nominale con scrutinio sim...,1
10166,333654,"Signor Presidente, è vero che delle riforme si...",Noi di Area Popolare abbiamo agito secondo una...,0
...,...,...,...,...
3756,658340,"Signor Presidente, vorrei fare alcune consider...",Nel corso degli ultimi anni tutto il sistema p...,1
6518,869096,"Noi, Presidente del Consiglio, oltre a ringraz...",Che cosa farete per evitare che i mercanti di ...,1
5042,501660,"L'emendamento Finocchiaro, signori, è una pres...",Riducendo l'elettorato ai consiglieri regional...,1
343,664657,"E sarà anche complicato e difficile, perché no...","Abbiamo un anno di tempo per approfondire, aff...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_df_dist_30_with_ids_ridotto Train shape: (9600, 4)
2015_df_dist_30_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2015_df_random_speech_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,98418,L'ipotesi di progetto dovrà prevedere anche in...,Personalmente non seguo mai questa pratica che...,1
1,880876,"Mi sembra che, da quando se n'è andato Giovana...","In secondo luogo, la mozione impegna il Govern...",1
2,448629,"In primo luogo, dove è finito il progetto per ...",Vorrei anche sottolineare che nel 2015 l' expo...,1
3,364044,Altrimenti trasformiamo questo organismo in qu...,"L'aggressione violenta, vile, in disprezzo del...",1
4,833596,Chiedo pertanto al Governo di riformulare l'em...,Invito il relatore e il rappresentante del Gov...,1
...,...,...,...,...
146719,268063,"Signor Presidente, colleghi, il Gruppo Autonom...",Le misure adottate sono sicuramente necessarie...,0
146720,421124,Passiamo alla votazione dell'emendamento 1.700...,"Signor Presidente, colleghi, il Gruppo Autonom...",0
146721,668830,Salutiamo le studentesse e gli studenti dell'I...,Passiamo alla votazione dell'emendamento 1.700...,0
146722,676651,Ve lo dico come madre e come donna.,Salutiamo le studentesse e gli studenti dell'I...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_Df_Random_Speech_With_Ids

Classes
1    73362
0    73362
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2015_df_random_speech_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5,170703,Dove è finito il progetto di una commissione n...,Proclamo il risultato della votazione nominale...,1
26,565633,La seduta è ripresa.,Il Protocollo è lo strumento operativo del Pro...,1
43,718498,Invito il relatore ed il rappresentante del Go...,Benvenute e benvenuti in Senato.,1
45,41885,"Signora Presidente, aggiungo la firma all'emen...","Rivolgo il benvenuto, a nome dell'Assemblea, a...",1
47,229367,"Signor Presidente, colleghi, intervengo per ri...",L'elenco dei senatori in congedo e assenti per...,1
...,...,...,...,...
146660,695596,Il nostro Paese non può fare a meno della side...,"È certamente vero, ma non si può più, al conte...",0
146676,219975,"Mancando un'economia forte, sicuramente gli el...","Concludendo, rinnovo il voto di fiducia a ques...",0
146681,485283,"Su un totale di 3, 6 ettari, lo 0, 1 per cento...",Saranno sostituiti i primi 30 centimetri di te...,0
146688,454348,"L'acciaieria produce morte, ma non importa: è ...","Si va avanti cosi, mesi, giorni e ore, in una ...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
112385,851122,Anche qui si chiedeva di utilizzare parte dell...,Questo può essere fatto solo se si crea la cul...,0
57094,59096,Chi vuole fermare questa politica di austerità...,Passiamo alla votazione dell'emendamento 1.209.,1
50168,717084,Non è infatti neanche pensabile che i due corr...,"Passiamo all'esame dell'articolo 47, sul quale...",1
12585,26857,D'altronde è la stessa situazione che stiamo v...,"Quanto all'ordine del giorno G3 - quater.100, ...",1
106337,422176,Passiamo quindi alla votazione.,"Onorevoli colleghi, dato che l'argomento al no...",0
...,...,...,...,...
125128,573854,Tale metodologia rappresenta un deterrente tro...,"Serve cultura e, quindi, una giusta educazione.",0
46692,33622,La strada intrapresa in questo momento dalla N...,"Sì, Presidente.",1
12194,790748,Ma affinché qualcuno non abbia a dire che noi ...,Lei va troppo veloce e non dà modo di capire c...,1
132931,117019,"In particolare, la direzione generale della pr...","Conseguentemente, in data 24 luglio 2014, sull...",0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
77614,113956,"Avendo ragionato, durante il periodo della dis...",Consegno i testi riformulati per una migliore ...,0
73535,441692,"Ora, su questa strada, sono stati compiuti alc...",Bisogna essere chiari: è impossibile immaginar...,0
83491,140121,Ci sono stati ormai circa una trentina di decr...,Anche il decreto - legge sulle banche popolari...,0
88556,509732,Volete riaprire un cantiere delle riforme seri...,"Se fossimo stati tutti d'accordo, in nome dell...",0
129422,386295,"Poi, quanto alla pena per l'indebita induzione...","Quei sei mesi, per l'appunto, riflettono un se...",0
...,...,...,...,...
106464,743999,"Essendo stato accolto dal Governo, l'ordine de...","Passiamo all'emendamento 1.81, su cui la 5ᵃ Co...",0
31118,891127,La dimostrazione della volontà della maggioran...,Non vi sono iscritti a parlare nella discussio...,1
45732,856660,"Senatrice Bottici, il tempo a disposizione del...",Non avremmo mai più preso in considerazione la...,1
97421,451322,Desideriamo aggiungere delle parole a quelle d...,Ciò è assai grave.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2015_df_random_speech_with_ids_ridotto Train shape: (9600, 4)
2015_df_random_speech_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

2016_df_dist_5_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,8324,Invito il senatore Segretario a verificare se ...,Indìco la votazione nominale con scrutinio sim...,1
1,220260,Il capo d'accusa dice infatti che «sfruttando ...,"E poi è stata detta un'altra cosa non vera, ov...",1
2,629686,Si tratta dell'imputazione più grave che sia m...,"Ora, non tocca a noi entrare nel merito delle ...",1
3,69176,Si tratta di un'accusa ai sensi dell'articolo ...,"Ci sono avvocati bravissimi, magistrati compet...",1
4,815138,"No, non c'è alcun concorso esterno e - come ha...",Noi del Movimento 5 Stelle dobbiamo però dire ...,1
...,...,...,...,...
79105,415718,Più le progettualità sono complesse e farragin...,Anche stavolta siamo di fronte all'ennesimo ca...,0
79106,222721,Anche stavolta siamo di fronte all'ennesimo ca...,Se qualcuno avesse tenuto conto semplicemente ...,0
79107,762664,"Fu un uomo modernissimo, da questo punto di vi...",Il teatro è stato il centro della sua esistenz...,0
79108,262708,Se qualcuno avesse tenuto conto semplicemente ...,"Io stesso, in occasione della discussione sul ...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_Df_Dist_5_With_Ids

Classes
1    39555
0    39555
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2016_df_dist_5_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
2,629686,Si tratta dell'imputazione più grave che sia m...,"Ora, non tocca a noi entrare nel merito delle ...",1
12,72206,Altro che poveri disoccupati!,"I fatti sono gravi, sono attuali e costanti.",1
15,685905,"Tra costoro, sempre secondo l'ordinanza, ci so...",Si dice che le norme che presiedono a questo p...,1
16,347852,Ci sono pagine intere di questi nomi: si tratt...,"Ebbene, leggendo l'ordinanza del gip, si capis...",1
17,291364,"E poi è stata detta un'altra cosa non vera, ov...","Certo, ne avevano il controllo.",1
...,...,...,...,...
79036,309037,"Anche in seguito, nonostante avesse questa sor...",Ricordiamolo: è stato compagno di strada dei r...,0
79038,654934,Dispongo la controprova.,Ordino la chiusura delle porte.,0
79043,324627,"Mi viene in mente quel Leautaud, di cui mise m...",Voglio poi ricordare Luchino Visconti.,0
79088,683662,"Stare anche in questo tipo di spettacolo, sper...","Fu un uomo modernissimo, da questo punto di vi...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
22716,406449,Sembrano molto lontani i tempi in cui i colleg...,Ci sarà un motivo per cui questo Governo conti...,1
38323,483200,"Arriva il giorno della liberazione, ma quello ...",I bimbi da accogliere con premura sono finiti ...,1
74341,132630,Il governo dell'ambiente è questione difficili...,Capisco che lei abbia la piena lucidità dei pr...,0
30927,382716,Lavoriamo per rispondere ad eventuali richiest...,"Poi, bisognerà includere altri settori e altre...",1
44098,197692,"Signor Presidente, sicuramente le maggioranze ...","È però chiaro a tutti che, purtroppo, tra allu...",0
...,...,...,...,...
45344,819114,"Si tratti di un progetto, di una missione, di ...",Pensate alle conseguenze sul piano dei versame...,0
12962,336601,Un numero necessario per compensare la riduzio...,"A questo proposito, io credo che di fronte all...",1
37963,420730,L'analisi dei dati sugli atti intimidatori den...,Sono presi di mira soprattutto i Comuni con pi...,1
22430,509398,E appare sempre più in salita - devo essere mo...,Adesso abbiamo in piedi con la Turchia un acco...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
18660,719509,"Signor Presidente, ringrazio il Ministro perch...","Purtroppo al - Nusra, per quello scenario, è c...",1
16996,649337,Certamente sono stati compiuti molti progressi...,L'effettivo arresto della perdita di biodivers...,1
70230,91121,Questo è lo stato di fatto.,Dobbiamo considerare anche tutta una serie di ...,0
8927,500673,Si tratta quindi di un impegno di spesa che an...,"In questo modo, ci troviamo una sovrastima del...",1
24494,546715,"Se questo non avviene, non si ha il riconoscim...",Era stato presentato un emendamento che voleva...,1
...,...,...,...,...
64948,19960,"Non si comprenderebbe Pannella, però, senza co...","Provengono da Oltreoceano la non violenza, l'u...",0
71633,285233,L'Unione europea non è una istituzione neutra.,"Ci sono delle maggioranze, anche politiche.",0
43147,807546,Sono previste agevolazioni tributarie per i tr...,Finalmente un trust non per evadere le tasse m...,0
27031,594757,"Il 29 agosto a Seregno, in provincia di Monza,...","Signora Presidente, con questo intervento di f...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_df_dist_5_with_ids_ridotto Train shape: (9600, 4)
2016_df_dist_5_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2016_df_dist_10_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,576301,Invito il senatore Segretario a verificare se ...,Il Senato approva.,1
1,184262,"Il problema è un altro, ed è quello dell'uguag...",Ecco la ragione di questo ignobile privilegio ...,1
2,522952,Ho già citato l'articolo 68 della Costituzione...,"Non voglio sprecare altro tempo perché, se i f...",1
3,784956,Trascuro di entrare in certi dettagli già affr...,È il contrario: tanti ragionamenti e pochi fat...,1
4,66925,L'articolo 68 non tutela solo i singoli deputa...,Ho solo questo da dirvi: se c'è una coscienza ...,1
...,...,...,...,...
55193,293866,"Signora Presidente, ringrazio il sottosegretar...",Sono contento e soddisfatto della sua sensibil...,0
55194,577015,Nella mozione quella di Gerusalemme è una real...,Queste sono questioni di capitale importanza.,0
55195,715114,È come se a Gerusalemme non ci fosse stata mai...,Nella mozione quella di Gerusalemme è una real...,0
55196,312907,Sono contento e soddisfatto della sua sensibil...,Sgombro subito il campo da ogni intenzione che...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_Df_Dist_10_With_Ids

Classes
1    27599
0    27599
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2016_df_dist_10_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,576301,Invito il senatore Segretario a verificare se ...,Il Senato approva.,1
1,184262,"Il problema è un altro, ed è quello dell'uguag...",Ecco la ragione di questo ignobile privilegio ...,1
19,446453,La scena ha luogo dopo la condanna a morte di ...,"Per lui hanno garantito la sua vita civile, la...",1
29,378994,"Il deterrente è la derisione popolare, la cond...",Trascuro di entrare in certi dettagli già affr...,1
34,321135,Questo era il senso che aveva.,"Dunque, questa inchiesta non è ridicola come l...",1
...,...,...,...,...
55180,475840,"Ebbene, il nostro Governo, su una mozione di q...",L'ignavia è peggio della malvagità; e non c'è ...,0
55182,664074,Quel tempio ebraico non era un tempio ebraico ...,"Ebbene, il nostro Governo, su una mozione di q...",0
55187,324363,Questa normativa è nata dopo eventi noti alla ...,"Quanto al vigente sistema normativo, procedere...",0
55192,302385,Queste sono questioni di capitale importanza.,Non sfugge a nessuno che questa è una propagan...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
35702,458060,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
973,528937,"Ma condividiamo, con la parte più avanzata del...",Ricordo anche gli emendamenti presentati dal r...,1
15688,105618,"Signor Presidente, credo che, con la scomparsa...","Il collega Maurizio Sacconi, allora brillante ...",1
8457,212475,La Dover si era sempre dichiarata irremovibile...,Speriamo che il nuovo titolare del Ministero d...,1
21153,299704,Se invece le infrazioni del codice stradale so...,Ho visto i colleghi del PD applaudire frenetic...,1
...,...,...,...,...
8161,535806,"E lei mi insegna che, dopo l'approvazione dell...","Questo non lo dico io, ma lo dicono i costituz...",1
35392,791015,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
45086,379037,"In ogni caso, la prospettiva è che si estenda ...",Con una piccola norma viene fatto attentato a ...,0
23522,690158,"Il candidato, al quale è stato conferito l'inc...",Passando poi alle specifiche domande degli ono...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
19366,114145,Il secondo appello è rivolto ai media: si smet...,È stata poi avvolta in un telone di plastica e...,1
30276,38622,"Questo è solo un inciso, per dire che noi vogl...","Per quanto riguarda il processo telematico, ci...",0
17006,541046,"Passato agosto, avremo settembre: i nostri rag...",Io voto assolutamente no alla fiducia a questo...,1
49290,224930,"Quindi, l'elefante ha partorito un topolino, m...","Quindi noi esprimeremo un voto favorevole, anc...",0
17079,823556,C'è quest'altro e risolvo in questo modo.,"Abbiamo, infatti, troppe norme introdotte in m...",1
...,...,...,...,...
28722,582096,"Questi i fatti, dai quali si evince che alla b...",In risposta ad altro quesito formulato dagli o...,0
26785,887116,Ma faceva tanto comodo a qualcuno: vedi specul...,Vi fa comodo governare persone sempre sotto ri...,1
15270,647179,"Nel cargo ferroviario però, purtroppo, di più ...","In questo senso, per le motivazioni richiamate...",1
50056,544245,Le linee guida sono un discrimen fondamentale ...,Il sistema che si intende implementare con que...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_df_dist_10_with_ids_ridotto Train shape: (9600, 4)
2016_df_dist_10_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2016_df_dist_20_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,652552,Il Senato approva.,Il Senato approva.,1
1,456439,E per quale ragione?,Non è un atteggiamento possibile.,1
2,386908,"Il fatto che, relatore Stefano, ci sia una imp...","Tuttavia, poiché non ci è stato consentito di ...",1
3,346630,"Ma è in Giunta, e noi non possiamo negare l'ev...",Questo è il lavoro che avrebbe dovuto fare la ...,1
4,22928,Questo interrogatorio è agli atti della Giunta...,Viceversa è nostro compito dire che c'è il fum...,1
...,...,...,...,...
28845,737729,Andarsene per finta e scrivere letterine su Fa...,La stragrande maggioranza dei giovani ha votat...,0
28846,541515,"La scelta europeista e atlantica dell'Italia, ...",Oggi abbiamo un problema che deriva dai nuovi ...,0
28847,364388,"Signora Presidente, prima di entrare nel merit...",Mi chiedo se questo nostro Paese non sia in ca...,0
28848,497509,"L'ex sottosegretario Lotti, braccio destro del...",Andarsene per finta e scrivere letterine su Fa...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_Df_Dist_20_With_Ids

Classes
1    14425
0    14425
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2016_df_dist_20_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,456439,E per quale ragione?,Non è un atteggiamento possibile.,1
2,386908,"Il fatto che, relatore Stefano, ci sia una imp...","Tuttavia, poiché non ci è stato consentito di ...",1
3,346630,"Ma è in Giunta, e noi non possiamo negare l'ev...",Questo è il lavoro che avrebbe dovuto fare la ...,1
5,700076,"Era presente lì il signor Paolone Caponera, di...","Da questo punto di vista, sostenere seriamente...",1
7,456654,È scritto a pagina 11 dell'interrogatorio del ...,"Noi dobbiamo riconoscere che c'è un fumus, per...",1
...,...,...,...,...
28840,158172,"Cari colleghi, Gasparri prima e Quagliariello ...","Noi abbiamo il problema, come Paese aderente a...",0
28841,557683,"Noi abbiamo il problema, come Paese aderente a...",Dobbiamo stare attenti nel fare questo dibatti...,0
28843,449306,Dobbiamo stare attenti nel fare questo dibatti...,"Se non avessimo aderito alla NATO, saremmo sem...",0
28844,223645,"Se non avessimo aderito alla NATO, saremmo sem...","La scelta europeista e atlantica dell'Italia, ...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
16685,492180,Non hanno il timore di perdere il posto di lav...,La sinistra ha risolto il problema non affront...,0
17043,327562,Per ragioni di calendario dei lavori - l'ho de...,"Mi illudo, ritengo e spero che anche il nostro...",0
10869,86310,"Il Governo, nel corso di questi anni, come sem...",E ciò mi fa venire in mente un'altra cosa.,1
19326,769234,"Il presidente, dottor Renzi, ha parlato di dati.","Quando si parla di dati, effettivamente, bisog...",0
19636,275358,È infatti solo Palazzo Chigi che vuole confron...,Proprio il numero di fiducie costituisce uno d...,0
...,...,...,...,...
11561,777002,Le altre violazioni riguardano l'articolo 47 d...,"Per questo motivo il legislatore ordinario, co...",1
7631,581362,Dunque è stato previsto lo stanziamento di 5 m...,"Vogliamo, infatti, far crescere il pubblico di...",1
26498,346763,"Già in Commissione lavori pubblici, a gennaio ...",Parliamo delle cosa guardandole negli occhi.,0
8946,450497,Temo che l'auspicio del Presidente del Consigl...,"Signor Presidente, la nostra è un'alleanza com...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
10393,506177,"C'erano stati dei segnali premonitori, che con...","Cellule organizzate o lupi solitari, gruppi lo...",1
13323,740486,"Le banche di credito cooperativo, come è stato...",Il 70 per cento almeno degli utili dovrà andar...,1
23107,174968,Da qualche mese in Italia fatti di questa ampi...,Per fortuna gli europei non sono stati funesta...,0
16945,671972,Milioni di italiani sono stati depistati: Renz...,Il Movimento 5 Stelle e tanti nostri simpatizz...,0
3431,569512,Non c'entra niente con la tortura come è stata...,Risposta del Senato della Repubblica: se quand...,1
...,...,...,...,...
3587,369214,Ci hanno fatto vedere anche il filmato molto e...,Errani era il presidente di quella Conferenza ...,1
27863,426376,In tre passaggi possiamo sintetizzare i tre gr...,"In primo luogo, al comma 3 dell'articolo 1, da...",0
22014,289682,"Per proprie finalità, il gruppo dei sequestrat...",Voglio infine chiarire che non è stato pagato ...,0
10157,619468,Al fine di dare effettività a tutte le misure ...,Il lavoro di questi anni ha consentito di ragg...,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_df_dist_20_with_ids_ridotto Train shape: (9600, 4)
2016_df_dist_20_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2016_df_dist_30_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,598706,Il Senato approva.,Invito il senatore Segretario a verificare se ...,1
1,467622,"E poi è stata detta un'altra cosa non vera, ov...",Oppure dobbiamo ricordare nostri eroi sicilian...,1
2,482667,"La prima cosa è che le accuse non sono ""poca r...",Riportiamoci allora al nostro dovere.,1
3,30207,"Vedete, si parla di un sistema intero, in cui ...","Colleghi, il nostro dovere è valutare se l'att...",1
4,290829,Il capo d'accusa dice infatti che «sfruttando ...,Ma ci dobbiamo mettere d'accordo.,1
...,...,...,...,...
14949,704052,Nella nostra discussione alcuni senatori hanno...,Io credo che le cose siano molto chiare e lo s...,0
14950,256345,I cittadini di Taranto pagano l'irresponsabili...,"Signor Presidente, i problemi ambientali e san...",0
14951,295049,"Noi, come Gruppo della Lega Nord, riteniamo ch...",I cittadini di Taranto pagano l'irresponsabili...,0
14952,32950,Io credo che le cose siano molto chiare e lo s...,"Si è dimesso il Presidente del Consiglio, si è...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_Df_Dist_30_With_Ids

Classes
1    7477
0    7477
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2016_df_dist_30_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,598706,Il Senato approva.,Invito il senatore Segretario a verificare se ...,1
2,482667,"La prima cosa è che le accuse non sono ""poca r...",Riportiamoci allora al nostro dovere.,1
4,290829,Il capo d'accusa dice infatti che «sfruttando ...,Ma ci dobbiamo mettere d'accordo.,1
5,411003,Altro che poveri disoccupati!,"Se qualcuno, infatti, lamenta di essere stato ...",1
6,315247,"Eppure, in questa sede vi hanno detto che si t...",Non può venirlo a dire.,1
...,...,...,...,...
14949,704052,Nella nostra discussione alcuni senatori hanno...,Io credo che le cose siano molto chiare e lo s...,0
14950,256345,I cittadini di Taranto pagano l'irresponsabili...,"Signor Presidente, i problemi ambientali e san...",0
14951,295049,"Noi, come Gruppo della Lega Nord, riteniamo ch...",I cittadini di Taranto pagano l'irresponsabili...,0
14952,32950,Io credo che le cose siano molto chiare e lo s...,"Si è dimesso il Presidente del Consiglio, si è...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
13968,756438,Davanti a queste posizioni comprensibili per i...,Noi prendiamo uno di questi punti e in termini...,0
11490,583362,È una giornata importante per tutti coloro che...,"Ecco, quindi, che è utile in questa sede anali...",0
4325,196212,Se davvero dobbiamo prendere degli spazi econo...,"Cambiare la politica economica europea, puntar...",1
12395,51873,Già dall'inizio della discussione in Commissio...,Il Ministro ha parlato di sole 34 iscrizioni p...,0
8642,845549,Vi è poi la presenza e la selezione nei festiv...,"Va bene, però attenzione: questi criteri vanno...",0
...,...,...,...,...
6739,636850,Si tagliano i fondi pubblici già esigui di per...,"Signor Presidente, è la prima volta che mi cap...",1
11513,637432,Il Senato approva.,Indìco la votazione nominale con scrutinio sim...,0
5411,809303,Un ulteriore aspetto riguarda l'emendamento 2....,"Anche in questo caso, sono stati accettati div...",1
927,79422,"Si è creato un clima profondamente positivo, d...","Da ultimo, merita di essere menzionata la norm...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
13630,15230,Non si è mai verificato che la disciplina inte...,"La ratifica di un trattato internazionale, anc...",0
2233,42540,Non è certo l'amicizia tra l'Europa e il Regno...,"L'Italia, contraddicendo una sua tradizione mo...",1
5744,609118,"Quindi, essi avevano scelto un Paese e un sett...",Si spara quindi nel mucchio e si spara nel muc...,1
6625,270286,Avete stabilito la dose minima di anatocismo a...,"In Europa, poi, il sistema bancario si regge s...",1
1634,185486,"Signor Presidente, è apprezzabile la partecipa...",Ci sono costruzioni che devono essere demolite...,1
...,...,...,...,...
1531,326038,Si sta andando incontro a un nuovo scadenziari...,"In altre parole, occorre una riduzione fiscale...",1
11077,403372,Noi siamo intervenuti per dire che quando c'è ...,"Dunque, non siamo intervenuti a creare un nuov...",0
5197,209197,Vi avevamo proposto di fare il bene dell'Itali...,"Signora Presidente, come Gruppo siamo contenti...",1
6199,43948,Dobbiamo condividere fino in fondo una politic...,"A cinque anni dalle rivolte di piazza, culmina...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_df_dist_30_with_ids_ridotto Train shape: (9600, 4)
2016_df_dist_30_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2016_df_random_speech_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,144820,Il pericolo è l'indebolimento della coscienza ...,Lei può ritenere quello che vuole.,1
1,823267,"Il Governo ha, quindi, previsto un primo stanz...",Questo Governo e questo Parlamento dovevano in...,1
2,70885,La capienza regolamentare è aumentata in due a...,Gli emendamenti 7.8 e 7.9 sono improponibili.,1
3,879858,Questo non può essere addebitato esclusivament...,Invito le relatrici e il rappresentante del Go...,1
4,421058,"Noi possiamo fare finta di non sentire, ma le ...","Signora Presidente, mi scusi se intervengo nuo...",1
...,...,...,...,...
129635,325449,La preoccupazione più forte è che il suo decre...,Ricordiamo che la Corte costituzionale ha da t...,0
129636,563204,I pareri espressi dalla Commissioni affari cos...,La preoccupazione più forte è che il suo decre...,0
129637,79676,"Gentile Ministra, il parere del Consiglio di S...",I pareri espressi dalla Commissioni affari cos...,0
129638,126313,Le chiedo quindi se non si stia perdendo un'oc...,"Gentile Ministra, il parere del Consiglio di S...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_Df_Random_Speech_With_Ids

Classes
1    64820
0    64820
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2016_df_random_speech_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
4,421058,"Noi possiamo fare finta di non sentire, ma le ...","Signora Presidente, mi scusi se intervengo nuo...",1
9,499795,Una volta di più la scuola viene lasciata sola.,Saluto a nome dell'Assemblea gli studenti dell...,1
12,411982,Sulla scuola è piombata una cappa di disintere...,È stato infatti dimostrato che già la legge de...,1
20,319346,Sei anni fa i detenuti erano 67.971 e 21.494 l...,Il Senato approva.,1
36,288016,Capisco che il mondo della scuola non ha gli s...,Invito il senatore Segretario a verificare se ...,1
...,...,...,...,...
129562,68696,Non basta solo stabilire come si seleziona; è ...,La dirigenza pubblica va monitorata sistematic...,0
129563,404739,La dirigenza pubblica ha un compito molto impo...,Non basta solo stabilire come si seleziona; è ...,0
129579,666779,"Sapere che c'è un Governo, ma anche un Parlame...","Signor Ministro, tengo a ribadire che sulla le...",0
129598,302501,"Cito il caso Carrai, che si voleva mettere a c...",Secondo noi era più importante parlare di cost...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
124922,782617,Pensateci bene la prossima volta.,"Signor Presidente, il dibattito questa mattina...",0
58449,248817,La Conferenza dei Presidenti dei Gruppi parlam...,Con l'emendamento 5.3 si chiede almeno di lasc...,1
111240,484711,Gli studi sull'influenza dei mass media nella ...,Il 1980 è stato l'anno dell'esordio nel campo ...,0
101012,727382,Meno ancora è stato avvisato - e non posso cre...,Lo stesso sento che è capitato alla senatrice ...,0
10178,569772,"Prova ne è che, dagli ultimi sondaggi, il cent...","Nel rinnovare, pertanto, la vicinanza del Sena...",1
...,...,...,...,...
42988,15118,Ci sono molti buchi neri.,"Esprimo parere conforme alla relatrice, signor...",1
10406,494137,Stiamo assistendo a un' escalation spaventosa ...,"Senatore Airola, ho recepito.",1
87830,11227,"Signora Presidente, non ho compreso bene il pa...",Non ho capito se il parere del relatore era fa...,0
95641,20013,L'ordine del giorno reca la discussione del di...,"Il relatore, senatore Lai, ha chiesto l'autori...",0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
101629,618011,Questo non è dovuto alla pigrizia degli italia...,Una famiglia che abbia un bambino riceve una d...,0
92804,701084,Bisogna però monitorare che queste misure funz...,Riproponiamo perciò con convinzione il nostro ...,0
19760,235676,"Sappiamo, infatti, che molte misure sono state...",Comunico che sono state presentate alcune ques...,1
24123,764904,"Infatti, non si parla più di sesso maschile e ...",La trasparenza dei comportamenti di Alfredo Bi...,1
37244,331702,"Nel frattempo, la Presidenza è già in contatto...","Un grande sardo, artista di formazione europea...",1
...,...,...,...,...
78245,723011,Noi in Commissione di vigilanza ci esprimemmo ...,"È chiaro - come ho detto stamattina - che, se ...",0
41843,749901,Esprimo parere conforme.,"Nei limiti che le appartengono, la nostra uman...",1
16529,773714,È la richiesta più invocata da parte di quelle...,Ci pare che si risponda - come dicevo - alle e...,1
4402,622234,"Pertanto, se era estraneo al provvedimento che...","Ai sensi dell'articolo 120, comma 3, del Regol...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2016_df_random_speech_with_ids_ridotto Train shape: (9600, 4)
2016_df_random_speech_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

2017_df_dist_5_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,352501,Salgono così a 49 le donne che ricordiamo in q...,Un appello al Governo tutto e alla Sottosegret...,1
1,698303,"Ciò detto, il provvedimento al nostro esame ha...",Questo è il primo grande blocco del decreto - ...,1
2,233217,Il reddito di cittadinanza vuole liberare gli ...,Il disegno di legge del Governo che volete cal...,1
3,58443,"Le persone, pur di sopravvivere, si rivolgono ...","Si parla si e no di 320 euro al mese, solo se ...",1
4,773769,"Presidente, il disegno di legge n. 1148 sul re...","Signor Presidente, il reddito di cittadinanza ...",1
...,...,...,...,...
79445,10675,Voglio dirlo in questa replica con chiarezza.,Sappiamo che senza il contributo del sistema b...,0
79446,700223,La garanzia di un reddito minimo è compresa ne...,"Inoltre, nell'allegato alla comunicazione dell...",0
79447,344650,Sappiamo che senza il contributo del sistema b...,Lo faremo certamente sviluppando un confronto ...,0
79448,121358,Lo faremo certamente sviluppando un confronto ...,La seconda scelta molto significativa del Sena...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_Df_Dist_5_With_Ids

Classes
1    39725
0    39725
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2017_df_dist_5_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,352501,Salgono così a 49 le donne che ricordiamo in q...,Un appello al Governo tutto e alla Sottosegret...,1
6,387443,Siamo stanchi di essere presi in giro da una c...,"Per questo, signor Presidente, la ringrazio pe...",1
27,279369,"A maggior ragione, ciò avviene questa settimana.","Mi scusi se lo ribadisco, ma questa è una cosa...",1
33,606093,Credo che l'eliminazione di questa formula dar...,"Signor Presidente, chiedo per l'ennesima volta...",1
38,788942,"Signor Presidente, mi perdoni, gliel'ho detto ...","Se, infatti, sui provvedimenti voi ponete cont...",1
...,...,...,...,...
79433,245642,"Questi sono naturalmente, per loro definizione...","Se quindi l'economia ha questa caratteristica,...",0
79438,346039,Il secondo aggiustamento significativo ai marg...,"L'Italia prende l'iniziativa, rompe gli indugi...",0
79440,218800,"In riferimento agli ultimi due punti, il Movim...",La garanzia di un reddito minimo è compresa ne...,0
79447,344650,Sappiamo che senza il contributo del sistema b...,Lo faremo certamente sviluppando un confronto ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
50782,21131,Dopo quarantacinque anni nel corso dei quali l...,"Certo, a questo risultato ha contribuito anche...",0
74941,603835,"In particolare, si dovrà normare il lavoro int...",Mi preme fare chiarezza su una cosa: noi non a...,0
15797,595120,"Signor Presidente, le dichiarazioni del minist...","No, signor Presidente.",1
42375,367318,Ai sensi dell'articolo 102 - bis del Regolamen...,Il Senato non approva.,0
78131,817869,Si tratta senza dubbio di un passo importante ...,Quanto alla celerità dei bandi che saranno eme...,0
...,...,...,...,...
37993,622035,"Sappiamo benissimo che, volendo, potremmo crit...","Andiamoci piano, dunque, con le condanne e gua...",1
5468,434675,"Signor Presidente, aspetto un attimo perché il...",Tante volte è successo che il maxiemendamento ...,1
57062,486810,Questa disciplina trova applicazione anche con...,"Molto importante, a nostro avviso, è anche l'a...",0
25274,415982,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
79247,765168,Perché si adotta il provvedimento?,Solo ed esclusivamente perché un sindacato alz...,0
26965,695685,"Signora Presidente, vorrei concludere con alcu...","In particolare, vengono ridotte da 5 a 2 milia...",1
35100,70683,Quello che è dispiaciuto è che in questo dibat...,Forse questo provvedimento sarebbe dovuto nasc...,1
22411,355418,Non è serio da parte vostra ricattare minoranz...,Perché i risparmiatori di Monte dei Paschi di ...,1
77775,100537,"Signor Presidente, mi domando se chi ha redatt...",Mi riferisco al fatto di prevedere che il bene...,0
...,...,...,...,...
65946,870409,La questione della chiusura di alcune sezioni ...,"Il piano è ancora in attesa di definizione, an...",0
52878,194672,Una volta Renzi disse che non sarebbe successo...,"Lo disse Renzi e, infatti, non è stato fatto.",0
25903,333164,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,1
39247,570053,Indìco la votazione nominale con scrutinio sim...,Indìco la votazione nominale con scrutinio sim...,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_df_dist_5_with_ids_ridotto Train shape: (9600, 4)
2017_df_dist_5_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2017_df_dist_10_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,529812,"Qui abbiamo tre milioni di tossicodipendenti, ...","Ricordo, a tal proposito, che esistono relazio...",1
1,808259,Ai sensi dell'articolo 102 - bis del Regolamen...,Indìco la votazione nominale con scrutinio sim...,1
2,103500,"Ma l'Italia, che vuole presentarsi come il Pae...","Ebbene, se la maggiore tutela nel servizio ele...",1
3,404230,Ai sensi dell'articolo 102 - bis del Regolamen...,Il Senato non approva.,1
4,243559,"Ciò detto, non possiamo non lasciare alla pros...",Faccio un solo esempio: il superamento della m...,1
...,...,...,...,...
56759,510054,Senza contare - dato di non poco conto - che m...,Ma torniamo a quei giorni.,0
56760,203737,Ma torniamo a quei giorni.,Nessuno mi disse niente di questo problema fin...,0
56761,150119,Nessuno mi disse niente di questo problema fin...,In due lettere fornì due risposte diverse: nel...,0
56762,572172,In due lettere fornì due risposte diverse: nel...,Vorrei sottolineare che - a differenza di altr...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_Df_Dist_10_With_Ids

Classes
1    28382
0    28382
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2017_df_dist_10_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
2,103500,"Ma l'Italia, che vuole presentarsi come il Pae...","Ebbene, se la maggiore tutela nel servizio ele...",1
4,243559,"Ciò detto, non possiamo non lasciare alla pros...",Faccio un solo esempio: il superamento della m...,1
5,245274,O tale volontà si forma perché almeno la maggi...,"Personalmente, aggiungo che in taluni punti il...",1
6,671731,Il Senato non approva.,"Passiamo all'emendamento 1.98, identico all'em...",1
7,167150,"Ecco, la volontà politica proconcorrenziale no...",È stato raggiunto un accordo anche con forze d...,1
...,...,...,...,...
56736,159158,Lo feci solo per una questione di orgoglio: es...,"Tant'è che diedi indietro tutta la somma, senz...",0
56745,618906,E una semplice segnalazione avrebbe risolto su...,"Sia pure indignato, decisi, senza batter cigli...",0
56746,564053,Non vi nascondo il mio disappunto per il volta...,Tra l'altro scrissi al direttore generale: «Di...,0
56747,891597,Dico questo perché la vicenda giudiziaria in c...,"Io arrivai in Rai nel giugno del 2009, dopo av...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
12923,811148,L'articolo 10 prevede che il Dipartimento per ...,Il piano deve avere particolare riferimento al...,1
41842,153337,Dico questo perché nel decreto - legge vi sono...,Di più: il Governo ha inserito in questo decre...,0
21238,894145,Si tratta semplicemente di correggere le cose ...,"Presidente, dal momento che quando le cose si ...",1
27749,747097,Non potevano essere messi a disposizione di qu...,"Purtroppo, però vista l'accelerazione data al ...",1
1887,23879,Nella comunità internazionale è ormai maturata...,Questo lo abbiamo già fatto presente alle auto...,1
...,...,...,...,...
36211,880144,"In realtà, sappiamo bene che la misura consist...",Il problema è che sappiamo qual è la situazion...,0
50063,848368,"Signor Presidente, onorevoli colleghi, gentili...",Essi sono stati ampiamente richiamati nel ricc...,0
2745,708207,"Credo non sia accettabile, tanto più se il ris...",Noi in materia di lotta alla corruzione e alla...,1
49686,1896,Anche gli interventi economici a sostegno dell...,Un secondo aspetto è nell'obiettivo del rilanc...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
24810,41296,La normalità d'ora in poi sarà questa: un test...,Tenendo conto delle considerazioni riportate d...,1
28713,681941,Si è molto rafforzata la crescita riducendo - ...,Sono molto positivi i dati sull'occupazione ch...,0
21786,16857,Le norme di contenimento delle spese - la spen...,È questo il concetto.,1
41880,149578,"Un'esasperazione, signor Presidente, che nasce...",Avrà letto anche lei le dichiarazioni di rappr...,0
27649,253500,Abbiamo dunque il dovere di difendere la nostr...,"Questa persona, che tra l'altro è un impiegato...",1
...,...,...,...,...
45863,91784,Sono loro che hanno condotto in questa direzio...,Mi pare un po' paradossale.,0
21819,78808,"Avete allora fatto la norma populista, consape...","Siamo l'unico Paese, insieme alla Spagna, ad a...",1
37307,767451,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
11158,543843,Chiedo anche al presidente Zanda se si ha paur...,"Ancora, ricordiamo a tutti come nasce la Consi...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_df_dist_10_with_ids_ridotto Train shape: (9600, 4)
2017_df_dist_10_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2017_df_dist_20_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,806393,E la storia delle indagini conoscitive e delle...,"D'altro canto, il Parlamento e il Governo hann...",1
1,80947,Ci rammarichiamo oltretutto di arrivare a conc...,Stessa aspettativa era lecito coltivare per i ...,1
2,294435,"Signora Presidente, dichiaro il voto favorevol...",L'obiettivo è quello far saltare la rendita e ...,1
3,777117,"Rispetto a queste finalità, sono state numeros...","Per queste ragioni, il voto sulla fiducia del ...",1
4,497598,"La direzione, quindi, è sicuramente giusta.","In ultima analisi e concludo, signora Presiden...",1
...,...,...,...,...
30033,871868,Ulteriori ricerche hanno determinato che dietr...,I pazienti con bassa risposta sono coloro che ...,0
30034,610130,I pazienti con bassa risposta sono coloro che ...,Questi individui montano una debole risposta i...,0
30035,541908,Ho anche avuto uno scontro molto vivace in una...,Non voglio qui alimentare la polemica perché i...,0
30036,623836,Questi individui montano una debole risposta i...,La rivaccinazione non riesce a correggere una ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_Df_Dist_20_With_Ids

Classes
1    15019
0    15019
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2017_df_dist_20_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,806393,E la storia delle indagini conoscitive e delle...,"D'altro canto, il Parlamento e il Governo hann...",1
3,777117,"Rispetto a queste finalità, sono state numeros...","Per queste ragioni, il voto sulla fiducia del ...",1
4,497598,"La direzione, quindi, è sicuramente giusta.","In ultima analisi e concludo, signora Presiden...",1
5,135457,La legge annuale per il mercato e la concorren...,"Una piccola modifica, si dirà, che però avrebb...",1
6,376638,Infatti le dinamiche sociali ed economiche in ...,A questo fine volevamo impegnare il Governo a ...,1
...,...,...,...,...
30021,27244,La popolazione generale è vulnerabile alla mal...,La discriminazione contro i bambini non vaccin...,0
30030,221628,"A tal proposito, cito l'articolo di Poland e J...",Il paradosso apparente è che quando i tassi di...,0
30033,871868,Ulteriori ricerche hanno determinato che dietr...,I pazienti con bassa risposta sono coloro che ...,0
30034,610130,I pazienti con bassa risposta sono coloro che ...,Questi individui montano una debole risposta i...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
27947,48055,Andiamo però a vedere soprattutto gli elementi...,La Commissione ha lavorato in un clima di gran...,0
29215,154708,"Indubbiamente è una scelta discutibile, ma per...","Poi, naturalmente, da lì ciascuno potrà trarre...",0
3724,38096,"Signor Presidente, vorrei poi soffermarmi sull...",Dichiarando il voto favorevole del nostro Grup...,1
3279,91509,"Signora Presidente, mi avvio a concludere.",Non sarà l'ultimo sul tema di questo enorme te...,1
26996,296179,Considero questo incarico di relatore il più s...,Pur nella consapevolezza della modestia del mi...,0
...,...,...,...,...
12506,718394,La società ha investito centinaia di milioni d...,"Dal decreto legislativo n. 35 del 2017, da lei...",1
29850,752118,Le Brigate Rosse erano rosse.,Un altro aspetto della vicenda è quello di una...,0
17736,145994,"Insomma il cittadino, per far fronte a questo ...","Insomma, come fa materialmente un malato a pro...",0
5736,91107,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
21206,111354,"E le genti vivono il territorio, il loro paesa...",È qui che entra in gioco il concetto di domini...,0
11705,678434,Questi documenti potevano consentire al blocco...,"Ma il punto è che le Brigate Rosse non erano ""...",1
13494,8992,Qui di gravissimo c'è solo il fatto che sia st...,"Signor Presidente, colleghi, parliamo di un ar...",1
27847,742470,Perciò non crediamo a una sola delle vostre di...,"Si parla di crescita, ma cosa vogliamo fare?",0
466,439863,Ciò significa che in Italia una persona o una ...,Lo si fa solo se rafforziamo questi interventi...,1
...,...,...,...,...
29596,612291,"Signor Presidente, rappresentanti del Governo,...",Questo è un provvedimento che in qualche modo ...,0
21409,852274,"Per tutti, citerei Salvatore Pugliatti e Filip...","Questi studiosi, che sono stati seguiti da num...",0
12133,308002,Per loro c'è solo onore.,"Limitatamente al caso dei presidenti, si stabi...",1
20781,642916,Si è voluto in questo modo dare ulteriore forz...,Si potrebbe obiettare che l'istituzione di una...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_df_dist_20_with_ids_ridotto Train shape: (9600, 4)
2017_df_dist_20_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2017_df_dist_30_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,476185,"E orientava tali flussi verso le periferie, cr...",Questa è la verità.,1
1,381685,Grazie a questo disegno di legge unificato l'o...,Si potrà inoltre autorizzare la concessione di...,1
2,358690,Ma non divenne retore: si sentì da subito incl...,Devo dire grazie a tutta la Commissione perché...,1
3,795898,"Dopo una visita ad Atene, nelle città dell'Asi...",Si tratta di un altro tassello importante per ...,1
4,529563,"Produsse allora opere come gli Amores, le Hero...","Non vanno mai dimenticate, anche in queste sedi.",1
...,...,...,...,...
15745,206306,"Di particolare rilievo, in questo ambito, è un...",Secondo tale informativa le Brigate Rosse avre...,0
15746,13485,"I banchieri infedeli la faranno franca, perché...",Hanno avuto una mano dalle autorità di control...,0
15747,302929,Ma non sarebbero stati sufficienti per realizz...,"I banchieri infedeli la faranno franca, perché...",0
15748,189472,Secondo tale informativa le Brigate Rosse avre...,"Tale notizia confermerebbe, quindi, un uso pol...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_Df_Dist_30_With_Ids

Classes
1    7875
0    7875
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2017_df_dist_30_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,381685,Grazie a questo disegno di legge unificato l'o...,Si potrà inoltre autorizzare la concessione di...,1
2,358690,Ma non divenne retore: si sentì da subito incl...,Devo dire grazie a tutta la Commissione perché...,1
3,795898,"Dopo una visita ad Atene, nelle città dell'Asi...",Si tratta di un altro tassello importante per ...,1
4,529563,"Produsse allora opere come gli Amores, le Hero...","Non vanno mai dimenticate, anche in queste sedi.",1
7,858805,Egli è profondo conoscitore della lingua latin...,"D'altra parte, questo disegno di legge si inse...",1
...,...,...,...,...
15744,612123,Hanno avuto una mano dalle autorità di control...,Lo abbiamo visto in Commissione bicamerale d'i...,0
15745,206306,"Di particolare rilievo, in questo ambito, è un...",Secondo tale informativa le Brigate Rosse avre...,0
15746,13485,"I banchieri infedeli la faranno franca, perché...",Hanno avuto una mano dalle autorità di control...,0
15747,302929,Ma non sarebbero stati sufficienti per realizz...,"I banchieri infedeli la faranno franca, perché...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
3528,190771,Ma andiamo a vedere: la riforma degli 80 euro?,"Presidente, serve un'azione incessante e prolu...",1
14332,618878,Siamo intervenuti sulla cornice sanzionatoria ...,Siamo intervenuti sull'articolo 625 del codice...,0
3086,661974,Il whistleblowing è ampiamente conosciuto e re...,L'articolo 2 del disegno di legge estende al s...,1
8039,126129,"Incredibile, ma voi grillini vi siete opposti ...","No, non ci siamo.",0
8441,158156,Abbiamo visto qua dentro come è stata modifica...,"A quanto pare però il Governo, che è la fotoco...",0
...,...,...,...,...
6184,856450,"Anzi, se non vado errata, si tratta della quin...",Le spese sono state ridotte di circa un miliardo.,1
6032,42630,Queste indagini confermano l'allarme lanciato ...,Non si deve fare soltanto un'azione da pronto ...,1
11518,800672,"Pertanto, l'obbligatorietà che questa legge in...",Nessun Paese europeo vincola un medico a soddi...,0
4689,335347,"Il ministro Zarif, che dovrei peraltro risenti...","Per essere ancora più espliciti, se l'Europa n...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
2631,834997,Questo era un vaccino che tra qualche mese pot...,C'è qualche medico o qualche scienziato qua de...,1
10866,392293,"Signor Presidente, onorevoli colleghi, il decr...",È un testo di centrodestra che i colleghi di F...,0
87,786572,Lo ringrazio per quanto ha fatto con il suo Go...,Egli è tenuto a fare gli approfondimenti scien...,1
14989,813932,Questo è il percorso che hanno fatto questi ba...,"Io invoco innanzitutto il rispetto, il rispett...",0
9823,583047,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
...,...,...,...,...
1108,119479,La vaccinazione per la difterite non può alter...,Sono considerati indizi sufficienti da parte d...,1
14028,574405,"Le ragioni, naturalmente, possono essere varie...",Macron ha vinto le elezioni sostenendo di mett...,0
7093,776692,Non siamo completamente contrari alla prima pa...,Si tratta di una categoria di lavoratori che h...,1
2392,496693,"Ecco, tutto ciò ha bisogno di una regolamentaz...","Vi è un'applicazione, che non è quella di Uber...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_df_dist_30_with_ids_ridotto Train shape: (9600, 4)
2017_df_dist_30_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2017_df_random_speech_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,346112,Ma nessuna iniziativa intrapresa ha finora avu...,Il cambiamento però è in atto alla Regione Laz...,1
1,24645,Se vogliamo consolidare la novità difficilment...,"Considerate che, quando comincia a lampeggiare...",1
2,426003,"In tema di salute, vorrei ricordare che viene ...","Questo, naturalmente, significa che si può tro...",1
3,773274,"Cosa pensate, che nell'eventualità in cui io s...","Per queste ragioni, io penso che il contributo...",1
4,91862,Si estende all'anno 2017 la validità dei limit...,Le clausole sono un azzardo perché nessuno può...,1
...,...,...,...,...
126003,384238,"Signor Presidente, credo sia necessario avere ...",I lavori in Commissione sono fermi; i pareri d...,0
126004,492064,"Nulla osta, pertanto, al ritorno del provvedim...","Signor Presidente, credo sia necessario avere ...",0
126005,586223,Siamo certi - lo ha detto prima anche il senat...,"Nulla osta, pertanto, al ritorno del provvedim...",0
126006,402011,Diciamo subito che ci auspichiamo che la discu...,Siamo certi - lo ha detto prima anche il senat...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_Df_Random_Speech_With_Ids

Classes
1    63004
0    63004
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2017_df_random_speech_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
24,881217,Pertanto ricordo gli emendamenti di cui era st...,"Signor Presidente, accetto la riformulazione p...",1
29,772972,"C'è poi una variazione, riferita non ad una ri...","Signora Presidente, esprimo parere conforme a ...",1
34,594750,"Le chiedo conferma di questo, dopodiché eventu...",L'ordine del giorno reca il seguito della disc...,1
37,578563,"Pertanto, ben venga l'emendamento 1.14 come ri...",È iscritto a parlare il senatore Zuffada.,1
53,219191,"In particolare, si interviene sull'articolo 22...",Dichiaro chiusa la discussione generale.,1
...,...,...,...,...
125970,404887,Apprendiamo che c'è il parere della Commission...,È quindi opportuno che il provvedimento comple...,0
125975,204781,"Senatore D'Alì, il provvedimento non ha un con...",Sono stati fissati termini temporali per la pr...,0
125993,481327,Non ho inteso fissare un momento specifico; mi...,È una legge delega ed è stringente.,0
126000,206066,"Pertanto, mi sembra chiaro che la responsabili...",Accolgo anche il discorso del senatore D'Alì.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
12087,381790,Quello che vorrei però evidenziare in questi d...,"Passiamo all'esame dell'articolo 5, sul quale ...",1
105782,525044,"In realtà, oggi, il numero delle procedure a c...","La media europea, nei medesimi periodi, è più ...",0
46829,682640,"La seconda soluzione prospettata, quella appen...",Reciterebbe dunque: «Le iniziative di cui al c...,1
13708,552649,La mia proposta è che questo provvedimento non...,Il parere è favorevole anche sugli ordini del ...,1
98259,673105,"Signora Presidente, Ministri, colleghi, intend...",Puntare oggi sul Mezzogiorno significa interve...,0
...,...,...,...,...
19154,660937,Provvedimenti di questo tipo rimangono solo un...,"Infine, esprimo parere è favorevole sull'ordin...",1
31114,279711,Questo funzionario avrà fatto lo stesso con tu...,Dichiaro chiusa la discussione sulla questione...,1
45291,531753,"Numerosi senatori del Senatore Ferrari, può di...","Quando sento parlare di semplificazioni, mi si...",1
17865,351466,E quel decreto - legge è stato emanato nel per...,Passiamo alla votazione dell'emendamento 11.100.,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
26554,209918,Questa è la realtà dei fatti.,"Signor Presidente, accogliamo anche noi con fa...",1
42558,636220,Finalmente giunge ad approvazione una legge es...,"Signor Presidente, esprimo parere contrario su...",1
45283,153369,Abbiamo sempre contestato e avvertito che nel ...,Ha facoltà di parlare il relatore.,1
58863,552758,sottosegretario di Stato per l'economia e le f...,Ben sei autoveicoli - praticamente il parco ma...,1
4143,306313,"Almeno in questo caso, l'emendamento corregge ...","È stato ritirato l'emendamento 10.67, identico...",1
...,...,...,...,...
120874,73325,Possiamo dire che ha tentato di cambiare l'Ita...,La morte di Alfredo Reichlin è per molti di no...,0
105288,897913,"Signor Presidente, esprimo parere contrario su...",Invito poi il Governo ad accogliere gli ordini...,0
57120,154740,L'elenco dei senatori in congedo e assenti per...,E allora la mente corre ai buoni studi passati...,1
120908,234970,Ci troviamo quindi di fronte ad un professore ...,"Tutto questo non viola alcuna norma, non viola...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2017_df_random_speech_with_ids_ridotto Train shape: (9600, 4)
2017_df_random_speech_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

2018_df_dist_5_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,399624,"Presidente, aggiungo che noi stiamo insistendo...",Quando il ministro Di Maio darà una data per q...,1
1,514918,"In primo luogo, la Farnesina ha fissato in due...",Gli uffici commerciali dell'ambasciata in loco...,1
2,367015,La necessità di investitori e imprenditori est...,"Dal Continente africano, dal Sud Est asiatico,...",1
3,66554,"In particolare, la richiesta di un visto per c...",Accolgo quindi con favore l'apertura del Minis...,1
4,267810,"Signor Presidente, membri del Governo, collegh...",Tutti avrebbero beneficio nell'apertura di can...,1
...,...,...,...,...
35661,379085,Le persone con il tumore vivono infatti più a ...,Tumori che una volta erano invariabilmente mor...,0
35662,629293,In Italia il numero di persone ammalate di tum...,Le persone con il tumore vivono infatti più a ...,0
35663,252269,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
35664,744396,"Signor Presidente, colleghi, da medico vorrei ...",In Italia il numero di persone ammalate di tum...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_Df_Dist_5_With_Ids

Classes
1    17833
0    17833
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2018_df_dist_5_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,514918,"In primo luogo, la Farnesina ha fissato in due...",Gli uffici commerciali dell'ambasciata in loco...,1
6,435134,Gli uffici commerciali dell'ambasciata in loco...,"In considerazione della struttura, dell'estens...",1
7,322698,"A livello procedurale, i visti per affari segu...","Per stabilirsi in Italia, gli imprenditori str...",1
10,627438,Si tratta della tipologia di visto d'ingresso ...,Tale lista è condivisa con il corrispondente u...,1
13,686019,"Signor Presidente, il Ministero degli affari e...",Da una ricognizione dei dati in possesso dell'...,1
...,...,...,...,...
35655,552388,Questo è un ulteriore motivo per cui è importa...,Vorrei sottolineare gli aspetti positivi del p...,0
35656,649570,Un altro aspetto da evidenziare riguarda il fa...,Questo è un ulteriore motivo per cui è importa...,0
35659,217142,Tumori che una volta erano invariabilmente mor...,"Da qui, l'importanza dell'attenzione a questo ...",0
35663,252269,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
25770,319379,"Per favore, i senatori Questori tolgano tutti ...",Il fatto di mostrare la schiena alla Presidenz...,0
21408,880244,"Il primo è il reddito di cittadinanza, che ha ...",Ciò avverrà attraverso la ristrutturazione e i...,0
19243,400266,"All'improvviso, però, il muro d'acqua e le ond...","Purtroppo, come sappiamo, non è possibile prev...",0
34142,334329,Si definivano poi le modalità di collaborazion...,L'apporto e l'aiuto della Procura nazionale an...,0
17467,797152,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,1
...,...,...,...,...
27273,186261,"Anzi, correggendo alcuni piccoli errori, abbia...","E soprattutto, attraverso un apposito fondo, d...",0
5086,190124,"Parliamo di un Paese che produce e che lavora,...",L'emendamento è stato dichiarato inammissibile...,1
32835,711231,"Credo, quindi, che dalle elezioni del 4 marzo ...",Spetterà chiaramente al prossimo Governo la no...,0
575,215285,Noi riteniamo che tale comportamento sia lesiv...,"Questo perché, signor Presidente, è successo q...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
15710,219862,L'ho detto anche in Commissione.,Avere respinto l'emendamento che chiedeva di n...,1
33183,614606,"Nemmeno la peggior dabbenaggine, che è caratte...",Nessuna giustificazione è accettabile di front...,0
1950,72086,Il Senato non approva.,Poiché l'emendamento e gli ordini del giorno r...,1
11418,161096,Purtroppo è avvenuta una seconda esplosione me...,Ritengo che dopo episodi e sciagure del genere...,1
5179,94669,"Signor Presidente, anch'io questa sera purtrop...","Cominciò subito la sua opera di volontariato, ...",1
...,...,...,...,...
18775,409087,"Naturalmente non ho il tempo che, giustamente,...","Mi concentrerò, pertanto, sugli aspetti che ci...",0
13758,281030,"Passiamo all'emendamento 20.0.64, su cui la 5ᵃ...","Passiamo all'emendamento 20.0.208, su cui la 5...",1
2383,187439,"Badate, colleghi, il condono non è una novità ...",Che si parli di condono è del tutto evidente; ...,1
34394,45148,"Le dico tre parole: legalità, diritti e coesio...",In questo modo si governa seriamente il fenome...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_df_dist_5_with_ids_ridotto Train shape: (9600, 4)
2018_df_dist_5_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2018_df_dist_10_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,137843,"Passiamo all'emendamento 9.55, su cui la 5ᵃ Co...","Passiamo all'emendamento 9.58, su cui la 5ᵃ Co...",1
1,141162,"A tal fine, negli ultimi anni sono stati adott...","Per stabilirsi in Italia, gli imprenditori str...",1
2,788172,Non credo che la loro importanza sia minimamen...,"Dalla documentazione che riuscì a produrre, er...",1
3,585681,"Anzi, la volontà di istituire in tempi celeri ...",Mi fu risposto che vi erano tutti gli elementi...,1
4,738480,"Oggi, nella mia dichiarazione di voto, è a voi...","Eppure le Commissioni ecomafie e antimafia, no...",1
...,...,...,...,...
24201,841947,Istituiremo una rete che avrà funzioni di coor...,La Rete nazionale dei registri dei tumori rapp...,0
24202,85946,Siamo certi dell'impegno che il suo Ministero ...,Siamo certi dell'impegno che il suo Governo me...,0
24203,681802,La Rete nazionale dei registri dei tumori rapp...,Con l'istituzione di un referto epidemiologico...,0
24204,582154,Con l'istituzione di un referto epidemiologico...,"Con l'approvazione di questo testo, cari colle...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_Df_Dist_10_With_Ids

Classes
1    12103
0    12103
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2018_df_dist_10_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
3,585681,"Anzi, la volontà di istituire in tempi celeri ...",Mi fu risposto che vi erano tutti gli elementi...,1
5,517427,Le inchieste che la Commissione dovrà effettua...,"Studiando un caso del genere, si può comprende...",1
8,844464,"L'ultimo, in ordine di tempo, è avvenuto a Cai...",Come mai nessun controllo è stato effettuato?,1
9,242792,Credo che le immagini di questo incendio siano...,"Come mai, nonostante i numerosi sequestri avve...",1
10,573926,"Una richiesta però sento di avanzarla, e di fa...","Gli unici a essere puniti, giorno dopo giorno,...",1
...,...,...,...,...
24200,617846,"Approvando questo testo, metteremo in rete i d...",Istituiremo una rete che avrà funzioni di coor...,0
24201,841947,Istituiremo una rete che avrà funzioni di coor...,La Rete nazionale dei registri dei tumori rapp...,0
24203,681802,La Rete nazionale dei registri dei tumori rapp...,Con l'istituzione di un referto epidemiologico...,0
24204,582154,Con l'istituzione di un referto epidemiologico...,"Con l'approvazione di questo testo, cari colle...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
12354,448876,"Io non sono mai stato d'accordo, ma ricordo ch...",Ora siamo all'arrivo dei prefetti nelle funzio...,0
6329,52709,Ma avevamo anche chiesto al Governo di destina...,La risposta rispetto a questa nostra posizione...,1
15103,270786,Non basterà l'adeguamento della dotazione dei ...,"All'articolo 4 manca la visione di insieme, co...",0
1535,815537,"Avrebbe dovuto essere, questo, il provvediment...",Abbiamo presentato emendamenti per aumentare l...,1
16122,504841,"Essendone stata avanzata richiesta, indìco la ...",Il Senato non approva.,0
...,...,...,...,...
2928,161900,Questa legge non l'hanno fatta i malati.,Avete detto che con un taglio di oltre 10 mili...,1
18735,270488,"Signori senatori, domani ricorre un triste e d...",Domani ricorre il ventiseiesimo anniversario d...,0
8644,481634,È per questa ragione e per quelle illustrate n...,Questa è la vera emergenza e spero che non il ...,1
723,60033,"È ancor più grave, perché essere incompetente ...","Dopodiché chiedo, in particolare ai colleghi d...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
7238,548848,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,1
8154,408659,"Non si può certamente prescindere, come scritt...",Siamo certi che l'operato di questo Governo e ...,1
8468,397100,Indìco la votazione nominale con scrutinio sim...,Indìco la votazione nominale con scrutinio sim...,1
12949,701926,Auspichiamo un'Italia che intervenga attivamen...,L'articolato del provvedimento fotografa esatt...,0
14960,757964,"La politica in generale e noi politici, donne ...",La lotta alla criminalità organizzata deve com...,0
...,...,...,...,...
15506,346581,Oggi ci occupiamo della legittima difesa abita...,Di questo abbiamo traccia non solo e non tanto...,0
17638,821524,"Consentitemi, dunque, un ringraziamento di cuo...",Questo significa anche fare squadra.,0
16823,853950,"Spero che nella prossima legge di bilancio, pi...",La normativa in Italia contro la violenza sull...,0
10475,350930,"In un'epoca così veloce, sarebbe stato opportu...","Anche con questo provvedimento, purtroppo, ave...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_df_dist_10_with_ids_ridotto Train shape: (9600, 4)
2018_df_dist_10_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2018_df_dist_20_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,559918,"Ma come, volete negoziare con gli autori di qu...",Non c'è stagione sovranista che possa portare ...,1
1,87568,Indìco la votazione nominale con scrutinio sim...,Indìco la votazione nominale con scrutinio sim...,1
2,467101,Ciò permette ovviamente una duplice chiave di ...,"Relativamente alle testimonianze, vengono adat...",1
3,611621,"Nel merito, la Commissione parlamentare d'inch...",L'articolo 2 disciplina la composizione della ...,1
4,524867,"Questo, da un lato, ha reso celeri i tempi di ...","L'articolo 1, comma 3, prevede che la Commissi...",1
...,...,...,...,...
12317,301595,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
12318,74832,"Il cancro non è questione di nomenclatura, non...",Per vincere il cancro non possiamo concedere a...,0
12319,884968,E allora riaccendiamola in tutti noi questa sp...,"Il cancro non è questione di nomenclatura, non...",0
12320,611264,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_Df_Dist_20_With_Ids

Classes
1    6161
0    6161
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2018_df_dist_20_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,559918,"Ma come, volete negoziare con gli autori di qu...",Non c'è stagione sovranista che possa portare ...,1
1,87568,Indìco la votazione nominale con scrutinio sim...,Indìco la votazione nominale con scrutinio sim...,1
2,467101,Ciò permette ovviamente una duplice chiave di ...,"Relativamente alle testimonianze, vengono adat...",1
3,611621,"Nel merito, la Commissione parlamentare d'inch...",L'articolo 2 disciplina la composizione della ...,1
4,524867,"Questo, da un lato, ha reso celeri i tempi di ...","L'articolo 1, comma 3, prevede che la Commissi...",1
...,...,...,...,...
12317,301595,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
12318,74832,"Il cancro non è questione di nomenclatura, non...",Per vincere il cancro non possiamo concedere a...,0
12319,884968,E allora riaccendiamola in tutti noi questa sp...,"Il cancro non è questione di nomenclatura, non...",0
12320,611264,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
7556,41496,Il Governo deve chiarirsi prima di andare al C...,Qual è la visione del Governo in materia di im...,0
6129,639894,Ieri il senatore Caliendo ha affermato che in ...,"Siamo di esempio nel mondo, in questo.",1
7781,272363,Mi sembra una follia anche il fatto che il sot...,"Ma da giugno, da quando si è insediato il nuov...",0
913,320388,"Essendone stata avanzata richiesta, indìco la ...","Passiamo all'emendamento 39 - ter.0.11, su cui...",1
5139,210967,Sappiamo benissimo che uno dei problemi di Ali...,Non mi soffermerò sulla storia degli ultimi an...,1
...,...,...,...,...
2531,534941,Soltanto in un clima di solida amicizia e reci...,Vi ringrazio per l'attenzione.,1
9247,720483,"Infine, Presidente, vengo alla questione dei v...",Come ho già detto in Commissione e l'altro gio...,0
4942,320608,Che senso ha intervenire così sulla prescrizione?,Oggi si dice che questa è la prima legge antic...,1
10810,662717,In sede di assestamento possono essere modific...,I margini di flessibilità in sede di assestame...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
10032,876079,"Un saluto va al mio predecessore, il senatore ...",Un saluto cordialissimo al presidente emerito ...,0
5814,546351,"Nella stragrande maggioranza dei casi, probabi...","Cari colleghi della Lega, voi state prendendo ...",1
4753,154637,Noi ci saremmo augurati il cambiamento radical...,"Ogni giorno - anche ieri, durante l'audizione ...",1
8184,757282,"Signor Presidente, colleghe e colleghi, rappre...",So bene qual è il clima nel Paese e riconosco ...,0
9376,133680,"Eppure, in questa circostanza, le disposizioni...","Prosegue, quindi, una disorganica e dannosa so...",0
...,...,...,...,...
6524,409405,Stiamo andando verso quel tipo di società.,Ce la metteremo tutta per non permetterlo nel ...,0
9375,403520,Noi suggeriamo caldamente lo spirito di Pratic...,Tutte le volte che è in gioco l'interesse dell...,0
12219,502864,"Quindi, le parti di volume edificato in modo a...",Ribadisco: che cosa succede se non c'è l'artic...,0
778,265466,Abbiamo presentato emendamenti per estendere l...,"Onorevoli colleghi, questo è il dato di fatto ...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_df_dist_20_with_ids_ridotto Train shape: (9600, 4)
2018_df_dist_20_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2018_df_dist_30_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,441687,Perché la buona propaganda insegna che solo se...,"Colleghi, in conclusione vorrei condividere co...",1
1,632244,Dalle immagini registrate dalle telecamere di ...,"Infine, vorrei sottolineare che non consento a...",1
2,315539,Se nella pubblica amministrazione avanza l'ill...,Voi ne avete scelto un'altra: quella basata so...,1
3,643265,"Signor Presidente, egregi colleghi, mi si perm...","Non c'è tempo per parlare di altre cose, ma ci...",1
4,465756,Il nostro sarà un voto convintamente contrario...,La vostra è la strada più facile; purtroppo pe...,1
...,...,...,...,...
6447,108084,Queste reazioni hanno mostrato quanto poco ave...,"In termini politici generali, ha contato molto...",0
6448,528688,"In termini politici generali, ha contato molto...",Tutto ciò va messo in relazione con il tempo c...,0
6449,140842,Tutto ciò va messo in relazione con il tempo c...,"Da qui, l'inquietudine che è dilagata tra gli ...",0
6450,719292,"Signor Presidente, la ringrazio a nome del Gru...",Quindi era giusto che il Parlamento vi dedicas...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_Df_Dist_30_With_Ids

Classes
1    3226
0    3226
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Il dataset per l'anno 2018 con distanza dist_30 contiene 6452 righe,             non sufficienti per ridurre il dataset a 12000 campioni

2018_df_dist_30_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,441687,Perché la buona propaganda insegna che solo se...,"Colleghi, in conclusione vorrei condividere co...",1
1,632244,Dalle immagini registrate dalle telecamere di ...,"Infine, vorrei sottolineare che non consento a...",1
2,315539,Se nella pubblica amministrazione avanza l'ill...,Voi ne avete scelto un'altra: quella basata so...,1
3,643265,"Signor Presidente, egregi colleghi, mi si perm...","Non c'è tempo per parlare di altre cose, ma ci...",1
4,465756,Il nostro sarà un voto convintamente contrario...,La vostra è la strada più facile; purtroppo pe...,1
...,...,...,...,...
6447,108084,Queste reazioni hanno mostrato quanto poco ave...,"In termini politici generali, ha contato molto...",0
6448,528688,"In termini politici generali, ha contato molto...",Tutto ciò va messo in relazione con il tempo c...,0
6449,140842,Tutto ciò va messo in relazione con il tempo c...,"Da qui, l'inquietudine che è dilagata tra gli ...",0
6450,719292,"Signor Presidente, la ringrazio a nome del Gru...",Quindi era giusto che il Parlamento vi dedicas...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    2581
0    2580
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    646
1    645
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
2740,553233,Bisogna mettere in opera subito politiche inno...,"In effetti, nel vostro programma ci sono eleme...",1
4020,264657,Il Governo del cambiamento ha chiaro il ruolo ...,La nostra azione politica è all'interno dell'U...,0
682,413108,L'Italia intende farsi portatrice di una visio...,"Mi riferisco alle misure di equità sociale, di...",1
3476,855881,Non è un caso che il tema viene affrontato in ...,"Nello stesso tempo, considero assolutamente im...",0
3717,633806,Non è che questo sia un augurio che anche l'at...,Ho provato allora a cercare nel provvedimento ...,0
...,...,...,...,...
3663,827119,"Nell'esaminare il decreto - legge, emergono in...",Non è infatti sufficiente la mera dichiarazion...,0
6268,656293,L'attività legislativa è diventata sempre più ...,Il contratto di riproduzione digitale ha ridot...,0
471,142888,"Signor Presidente, senatrici e senatori, quest...",Le informazioni successive indicano un deterio...,1
1089,248595,"Può sembrare una debolezza, un cedimento, una ...","Sono dei cliché che non aiutano nessuno, perch...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1345,168050,Quelle case infatti sono state abitate da giov...,Mi auguro che il provvedimento tornerà dalla C...,1
3271,174171,"Peccato che, cari colleghi, avete tolto la mas...",Questo dobbiamo dircelo con estrema chiarezza.,0
2119,404634,"Nella contabilità di uno Stato, o meglio di un...",Il Paese ha bisogno di perseguire un programma...,1
5905,476235,"Signor Presidente, colleghi, il provvedimento ...","Avrebbe dovuto essere, questo, il provvediment...",0
2875,79015,"Nessuno ricorda, però, che quel terremoto ha a...","Il primo concerne l'articolo 44, sul trattamen...",1
...,...,...,...,...
162,517846,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,1
3775,32774,« ovvero al fine di impedire od ostacolare il ...,"Veniva punito il mafioso, non veniva punito l'...",0
3796,823531,"Mettiamo dei fondi, metà del Governo nazionale...",È appena stato bandito dal Ministero dell'inte...,0
2311,843232,Pensate un po' meno alle prossime elezioni eur...,"E chi oggi pensa di difendere l'Italia, andand...",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_df_dist_30_with_ids_ridotto Train shape: (5161, 4)
2018_df_dist_30_with_ids_ridotto Test shape: (1291, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2018_df_random_speech_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,288403,Passiamo alla votazione dell'emendamento 8.0.1.,Passiamo alla votazione dell'emendamento 1.700.,1
1,170445,"Infatti, sottolineo che, a ventisei anni di di...","Signor Presidente, anche il mio Gruppo è d'acc...",1
2,60479,"Tornando alla nostra Commissione d'inchiesta, ...",Esprimo parere conforme a quello del relatore.,1
3,776565,Sappiamo bene purtroppo che il Mezzogiorno è l...,E le responsabilità stanno non soltanto nella ...,1
4,632284,"Una cosa è certa, com'è stato ricordato: la ne...","Ad esempio, l'assessore regionale si è present...",1
...,...,...,...,...
58989,86787,Sostengo convintamente il provvedimento al nos...,"Signor Presidente, onorevoli senatori, il prov...",0
58990,42994,Procediamo dunque.,Sostengo convintamente il provvedimento al nos...,0
58991,856054,"Vi è da dire, però - e lo faccio con grande se...",Noi tutti sappiamo che determinate frasi - con...,0
58992,139547,L'idea secondo la quale si può fare il salto d...,Procediamo dunque.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_Df_Random_Speech_With_Ids

Classes
1    29497
0    29497
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2018_df_random_speech_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,288403,Passiamo alla votazione dell'emendamento 8.0.1.,Passiamo alla votazione dell'emendamento 1.700.,1
3,776565,Sappiamo bene purtroppo che il Mezzogiorno è l...,E le responsabilità stanno non soltanto nella ...,1
4,632284,"Una cosa è certa, com'è stato ricordato: la ne...","Ad esempio, l'assessore regionale si è present...",1
10,419618,Che la Commissione ecomafie sia utile al Paese...,"Faccio, quindi, una raccomandazione e lo dico ...",1
40,127847,Grazie al lavoro svolto in passato e avendo fa...,Vorrei conoscere poi le previsioni rispetto al...,1
...,...,...,...,...
58972,141372,I registri tumori operano già da molto tempo s...,"In effetti, c'è stata un'accelerazione dal mom...",0
58977,574287,Nel tempo abbiamo anche avuto strumenti signif...,Abbiamo una storia importante: chi può non ric...,0
58983,796825,Ho visto che gli articoli sono stati approvati...,"Sembra impossibile che il nostro Paese, così a...",0
58986,736320,Ci occupiamo di un tema che tocca profondament...,Il testo che oggi ci apprestiamo a votare per ...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
23523,41923,La situazione occupazionale che si viene a cre...,Con questi due ordini del giorno chiediamo al ...,1
25771,318879,Passiamo alla votazione dell'emendamento 12.103.,Rinuncio a intervenire.,1
43709,338391,Questa interlocuzione ci ha richiesto inesorab...,"In queste settimane, durante le quali i canali...",0
49509,367159,Questi ragazzi erano obbligati ad avere rappor...,Erano obbligati ad avere rapporti con gli anim...,0
4254,53149,"Allora noi, con la Rete che oggi il provvedime...",Ieri è andato in onda un servizio televisivo a...,1
...,...,...,...,...
55233,490723,"In effetti, questo, in qualche modo, sta succe...","Una l'ho vista oggi, quando mi sono sentito ri...",0
16959,617855,"Occorre poi tener presente che, per l'iscrizio...",La banca dati dei beni culturali sottratti ill...,1
56580,64337,L'istituzione della Commissione bicamerale ant...,"In buona sostanza, nei compiti previsti dall'a...",0
40559,310334,Per semplificare lo svolgimento delle operazio...,I colleghi senatori transiteranno sotto il ban...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
50535,222129,Passiamo all'esame dell'emendamento e degli or...,"Signor Presidente, l'emendamento e gli ordini ...",0
4515,285111,Vogliamo veramente fare questo?,"Con lui perdiamo, come unanimemente riconosciu...",1
55381,346638,"Essendone stata avanzata richiesta, indìco la ...",Il Senato non approva.,0
14972,161084,Con il punto 1 impegniamo il Governo a difende...,"Signor Presidente, come per i soldati, quando ...",1
6572,827441,Le richieste di poter proseguire con un'inform...,Qui noi chiediamo che sia vietato il finanziam...,1
...,...,...,...,...
29924,215279,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
40327,134598,Siamo ostaggio di un'approssimazione politica ...,"A fronte di tale forzatura, noi abbiamo chiuso...",0
38758,695105,Questo vuol dire solo una parola: assumetevi l...,Saluto a nome dell'Assemblea i docenti e gli s...,0
12178,30140,"Signori, l'Europa come la ricordavate voi non ...",Indìco la votazione nominale con scrutinio sim...,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2018_df_random_speech_with_ids_ridotto Train shape: (9600, 4)
2018_df_random_speech_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

2019_df_dist_5_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,469993,"Il sindaco di Ferrara, ovviamente del PD, per ...","Quei malviventi, che non hanno diritto di star...",1
1,779181,"Questa serie di ritardi, cari colleghi, che il...",E potremmo continuare con esempi specifici ed ...,1
2,106936,"Passiamo all'emendamento 24.0.1, su cui la 5ᵃ ...","Essendone stata avanzata richiesta, indìco la ...",1
3,800691,"Gli emendamenti 24.0.851/101, 24.0.851/100 e 2...","Passiamo all'emendamento 24.0.3, su cui la 5ᵃ ...",1
4,253453,"È un patto d'onore, che difendiamo per amor di...",Per noi vale quanto dichiarato dal presidente ...,1
...,...,...,...,...
57779,964,"Infatti, non è vero che il contributo verrà as...","Quindi, intanto la carta prepagata verrà asseg...",0
57780,423557,"Quindi, intanto la carta prepagata verrà asseg...",Assistiamo qui al rovesciamento logico di un p...,0
57781,299463,Assistiamo qui al rovesciamento logico di un p...,Non avviene il contrario.,0
57782,36881,Non avviene il contrario.,"In questo caso, invece, l'urgenza è quella di ...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_Df_Dist_5_With_Ids

Classes
1    28892
0    28892
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2019_df_dist_5_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,779181,"Questa serie di ritardi, cari colleghi, che il...",E potremmo continuare con esempi specifici ed ...,1
3,800691,"Gli emendamenti 24.0.851/101, 24.0.851/100 e 2...","Passiamo all'emendamento 24.0.3, su cui la 5ᵃ ...",1
6,770907,L'emendamento 24.0.850/100 è decaduto.,Il Senato non approva.,1
21,799542,Il Senato non approva.,"Essendone stata avanzata richiesta, indìco la ...",1
32,568729,"Essendone stata avanzata richiesta, indìco la ...",Il Senato non approva.,1
...,...,...,...,...
57768,711461,"Ebbene, mi permetto di dire che questa è un'af...",Nel corso della discussione generale abbiamo a...,0
57771,692203,Prendiamo un singolo senza nucleo familiare ch...,Invece una persona che si attesti a 8.000 euro...,0
57775,841858,Nel corso della discussione generale abbiamo a...,"Ho percepito una retorica manichea, che separa...",0
57776,720976,"In questo caso, invece, l'urgenza è quella di ...",Ciò avverrà dopo che avremo assunto 10.000 nav...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4800
1    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
33200,643300,"Se la protezione viene meno, se lo Stato denun...","La soluzione, a nostro avviso, sarebbe stata s...",0
4609,629715,"Non c'è il professore di educazione civica, ma...","Lo ha fatto, però, proponendoci un insieme di ...",1
34015,74228,"Perché, allora, Ministra, il dirigente scolast...","Se volete fare una cosa del genere, contrattua...",0
34340,196212,Abbiamo ancora gli annosi problemi della Xylel...,"Manca quindi un modello di agricoltura, per un...",0
33561,331985,"Signor Presidente, colleghi, signori rappresen...",Norma che contrasta palesemente con l'articolo...,0
...,...,...,...,...
3176,287235,Ci vorrebbero più investimenti e il taglio del...,Chi creerà lavoro?,1
39753,73554,"Lei, presidente Conte, ha misurato, anche rece...",Non voglio alimentare un dibattito che rischia...,0
28301,519100,Mi sta particolarmente a cuore anche il bando ...,Questo è un modo per accelerare la ricostruzione.,1
22424,505960,Il Senato approva.,Il Senato non approva.,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
46933,766863,"Le graduatorie sono esaurite, soprattutto nell...","Pensate che a Torino, Milano e Roma sono esaur...",0
2920,341287,"Insomma, si trascurano le vere emergenze pur d...","Ministro, non anticipi rispetto al 2021.",1
23747,508333,"Credo che in quest'Aula, soprattutto quando pa...","Innanzitutto, si vorrebbe capire se c'è la vol...",1
18399,357147,Come sottolineato anche da rappresentanti del ...,Questo lo dobbiamo al nostro straordinario pat...,1
9586,721189,Non è però ancora finita.,Sono immagini che pesano su tutti; pesano su c...,1
...,...,...,...,...
25613,629041,"Diamo al popolo un tozzo di pane, se non possi...","E la burocrazia è cresciuta, non è diminuita.",1
11989,76159,"In questo caso, siamo abbastanza perplessi, no...",Per queste ragioni non possiamo che astenerci ...,1
38417,826034,È una riflessione che non può fermarsi a quest...,"Infatti, anche laddove c'è quel problema di ri...",0
29087,498263,Il Protocollo al Trattato del Nord Atlantico s...,"Con l'entrata in vigore di questo Protocollo, ...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_df_dist_5_with_ids_ridotto Train shape: (9600, 4)
2019_df_dist_5_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2019_df_dist_10_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,694900,"Signor Presidente, ho chiesto di intervenire s...","Quei malviventi, che non hanno diritto di star...",1
1,820339,Non so se adesso abbia ancora intenzione di pr...,Poi non dite che non sapevate che ci vogliono ...,1
2,325540,"Passiamo all'emendamento 22.6, su cui la 5ᵃ Co...","Essendone stata avanzata richiesta, indìco la ...",1
3,51435,Serve una legge che faciliti il suo funzioname...,"Molta roba introdotta alla Camera, che è davve...",1
4,83081,Il Senato approva.,"Passiamo all'emendamento 22.10, su cui la 5ᵃ C...",1
...,...,...,...,...
40007,802685,"Essendone stata avanzata richiesta, indìco la ...",Il Senato non approva.,0
40008,725486,"Passiamo all'emendamento 2.570, su cui la 5ᵃ C...","Essendone stata avanzata richiesta, indìco la ...",0
40009,512765,Il Senato non approva.,"Passiamo all'emendamento 2.570, su cui la 5ᵃ C...",0
40010,688581,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_Df_Dist_10_With_Ids

Classes
1    20006
0    20006
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2019_df_dist_10_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
1,820339,Non so se adesso abbia ancora intenzione di pr...,Poi non dite che non sapevate che ci vogliono ...,1
6,719810,Non si tolgono risorse da settori vitali dall'...,"È un dato già acclarato e pacifico, ma si risc...",1
8,870291,Indìco la votazione nominale con scrutinio sim...,"Passiamo all'emendamento 22.8, identico all'em...",1
21,629883,"Essendone stata avanzata richiesta, indìco la ...",Il Senato non approva.,1
28,543985,"Essendone stata avanzata richiesta, indìco la ...","Passiamo all'emendamento 22.16, su cui la 5ᵃ C...",1
...,...,...,...,...
39994,496649,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,0
39998,375792,Se tutto il Gruppo non sente che era già stato...,A noi interessa più che rimanga agli atti l'ar...,0
40001,493134,Il Senato non approva.,"Passiamo all'emendamento 2.573, su cui la 5ᵃ C...",0
40002,388927,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
6412,437666,"Nel caso del decreto - legge crescita, non ho ...",Ormai da un po' di tempo si usa attribuire cer...,1
4293,433892,Lo saluto; è una persona che fa bene a venire ...,"Chi mai investirà in Italia, se si potrà pensa...",1
4013,633104,Il Senato non approva.,Gli articoli 16 e 17 sono identici rispettivam...,1
3929,6454,Vogliamo risposte dalla Regione Emilia - Romag...,Questa scossa colpì le persone mentre erano al...,1
937,230664,Pertanto in questa sede è stata fatta un po' d...,"Credo che, come è stato fatto in quest'Aula, o...",1
...,...,...,...,...
32654,276970,Secondo il rapporto «Worldwide investments in ...,"Il report redatto dall'associazione PAX, membr...",0
37903,866362,Nel racconto alla fine sarà un'oca a salvare i...,A quel punto anche il capo branco comprende ch...,0
36057,357354,La Commissione ha inoltre evidenziato che l'It...,La Commissione era sostanzialmente tenuta a pr...,0
39201,762772,"Non fateci ridere, per favore.",Con il reddito di cittadinanza non facciamo al...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
22555,6426,Colgo l'occasione per riaffermare che l'Italia...,"Nella discussione, se non nelle conclusioni de...",0
30787,554543,"Stupisce, anche se fino a un certo punto, che ...",Non mi si dica che le sedute sono già in diret...,0
23636,513733,"Lo faccio, lo dico e lo dichiaro formulando un...","Vede, Presidente, per me le due questioni stan...",0
15821,242675,La possiamo bandire oggi in tempi rapidi.,Si pone ancora l'esigenza di spiegare al servi...,1
30878,316598,"Essendone stata avanzata richiesta, indìco la ...",Il Senato non approva.,0
...,...,...,...,...
16776,24072,"Altrimenti qui non se ne sarebbe discusso, sen...",È stata citata la proroga della zona franca ur...,1
32550,114864,Sono convinto che in questa legislatura le dif...,Desidero anzitutto ringraziare la senatrice Bi...,0
38565,608927,C'è un paradosso assolutamente incredibile - i...,"Nel momento in cui ci si occupa del lavoro e, ...",0
14259,287529,"Alla fine, quando si può pagare solo il 15 per...",Si dice banalmente di reinvestire nella propri...,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_df_dist_10_with_ids_ridotto Train shape: (9600, 4)
2019_df_dist_10_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2019_df_dist_20_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,390099,Per dare un senso a questo nostro intervento n...,"Kelsen si ricollega, si riannoda al pensiero d...",1
1,106851,Se un tempo lo scontro tra potenze si misurava...,"Devo registrare, con un certo favore, un atteg...",1
2,412993,Reputo essenziale - a maggior ragione in quest...,Dobbiamo continuare a lavorare affinché l'Euro...,1
3,735367,"Infatti, solo grazie agli emendamenti presenta...",Questo perché sarebbe stato più utile avere un...,1
4,356595,Certo - come ha avuto modo di dire il Sottoseg...,Non si può dire di affrontarla e neppure si af...,1
...,...,...,...,...
20751,720777,È giusto individuare una finestra per una pens...,Il rischio altrimenti è di farlo in maniera am...,0
20752,792977,Il rischio altrimenti è di farlo in maniera am...,Con una mano voi state trasformando in realtà ...,0
20753,407638,Con una mano voi state trasformando in realtà ...,E poi - lasciatemelo dire - per offrire lavoro...,0
20754,352289,E poi - lasciatemelo dire - per offrire lavoro...,E lasciatemelo dire in particolare al ministro...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_Df_Dist_20_With_Ids

Classes
1    10378
0    10378
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2019_df_dist_20_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,390099,Per dare un senso a questo nostro intervento n...,"Kelsen si ricollega, si riannoda al pensiero d...",1
1,106851,Se un tempo lo scontro tra potenze si misurava...,"Devo registrare, con un certo favore, un atteg...",1
2,412993,Reputo essenziale - a maggior ragione in quest...,Dobbiamo continuare a lavorare affinché l'Euro...,1
3,735367,"Infatti, solo grazie agli emendamenti presenta...",Questo perché sarebbe stato più utile avere un...,1
4,356595,Certo - come ha avuto modo di dire il Sottoseg...,Non si può dire di affrontarla e neppure si af...,1
...,...,...,...,...
20749,376014,Però siamo profondamente contro le modalità co...,I 38 miliardi che utilizzate a sostegno di que...,0
20752,792977,Il rischio altrimenti è di farlo in maniera am...,Con una mano voi state trasformando in realtà ...,0
20753,407638,Con una mano voi state trasformando in realtà ...,E poi - lasciatemelo dire - per offrire lavoro...,0
20754,352289,E poi - lasciatemelo dire - per offrire lavoro...,E lasciatemelo dire in particolare al ministro...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
114,151052,Torno però al punto politico: perché si fa una...,"Tuttavia, nella discussione di oggi ci sono al...",1
465,751355,"Signor Presidente del Consiglio, nell'esprimer...","Non serve la propaganda di chi lascia donne, u...",1
12354,41021,Gli emendamenti 1.56 e 1.57 sono stati ritirati.,Indìco la votazione nominale con scrutinio sim...,0
3036,350542,"I veneziani, però, non si sono pianti addosso.",Il Governo ha già convocato il comitato per la...,1
14083,162207,Soprattutto a seguito degli accordi che si son...,Con questa scelta l'operatore o gli operatori ...,0
...,...,...,...,...
13173,59847,Approviamo la decisione della Commissione di d...,"Tuttavia, non possiamo assolutamente accettare...",0
5071,121321,"L'accesso al reddito minimo garantito, secondo...",Abbiamo fatto i banchetti nelle piazze.,1
17637,137205,"Negli ultimi giorni, una notizia ha colpito me...",Una madre ha denunciato alle autorità un grupp...,0
17882,854170,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
10451,382872,"Da lì emergono queste stime, ma guardando le t...",È tanto perché comprende anche i lavoratori au...,0
17890,47046,Il Senato non approva.,L'emendamento 11.2 è improponibile.,0
19589,825585,"Poi, via via vengono Paesi come la Francia, la...",Il quantitativo totale di oro detenuto dell'Is...,0
14851,671046,"Signor Presidente, l'Italia si presenta al Con...","Mi riferisco alla prima partita, quella degli ...",0
15957,417101,La Protezione civile italiana è un fiore all'o...,Dobbiamo essere più capaci di affrontare il te...,0
...,...,...,...,...
17180,842299,"Secondo le parole dei due Vice Premier, è un d...",A me dispiace dover dire in Assemblea che non ...,0
14988,860690,Come nella nebbia si perdono i contorni esatti...,Il piccolo lupo di fatto è diverso dagli altri...,0
1930,197355,"Per queste ragioni, ci auguriamo con tutte le ...","Evidentemente, non si è stati attenti alla dis...",1
16033,832001,Ciò che mi lascia veramente perplessa e a volt...,"Queste misure saranno pure, come avete detto v...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_df_dist_20_with_ids_ridotto Train shape: (9600, 4)
2019_df_dist_20_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2019_df_dist_30_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,829427,Non è neutro cambiare i numeri.,Questa è la funzione del Senato in tutte le de...,1
1,299805,Il Senato non approva.,Il Senato non approva.,1
2,174220,"Tutto questo è documentato, signora Ministro.",È un valore assoluto per chi sta in quest'Aula...,1
3,442881,Il Senato non approva.,Il Senato non approva.,1
4,207016,Indìco la votazione nominale con scrutinio sim...,Gli emendamenti 1.7 /387 e 1.7 /388 risultano ...,1
...,...,...,...,...
10907,889015,Il Senato non approva.,"Passiamo all'emendamento 22.11, su cui la 5ᵃ C...",0
10908,451171,"Essendone stata avanzata richiesta, indìco la ...",Il Senato non approva.,0
10909,114734,"Passiamo all'emendamento 22.10, su cui la 5ᵃ C...","Essendone stata avanzata richiesta, indìco la ...",0
10910,446041,Il Senato non approva.,"Passiamo all'emendamento 22.10, su cui la 5ᵃ C...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_Df_Dist_30_With_Ids

Classes
1    5456
0    5456
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Il dataset per l'anno 2019 con distanza dist_30 contiene 10912 righe,             non sufficienti per ridurre il dataset a 12000 campioni

2019_df_dist_30_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,829427,Non è neutro cambiare i numeri.,Questa è la funzione del Senato in tutte le de...,1
1,299805,Il Senato non approva.,Il Senato non approva.,1
2,174220,"Tutto questo è documentato, signora Ministro.",È un valore assoluto per chi sta in quest'Aula...,1
3,442881,Il Senato non approva.,Il Senato non approva.,1
4,207016,Indìco la votazione nominale con scrutinio sim...,Gli emendamenti 1.7 /387 e 1.7 /388 risultano ...,1
...,...,...,...,...
10907,889015,Il Senato non approva.,"Passiamo all'emendamento 22.11, su cui la 5ᵃ C...",0
10908,451171,"Essendone stata avanzata richiesta, indìco la ...",Il Senato non approva.,0
10909,114734,"Passiamo all'emendamento 22.10, su cui la 5ᵃ C...","Essendone stata avanzata richiesta, indìco la ...",0
10910,446041,Il Senato non approva.,"Passiamo all'emendamento 22.10, su cui la 5ᵃ C...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
0    4365
1    4364
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1092
0    1091
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5838,367995,Il primo motivo è dovuto al fatto che c'è un'e...,"Non lo dicono i giornali e i media, ma ce lo r...",0
4065,102319,"Ricordiamo, infine, quanto deve essere il live...","Vorrei aprire una parentesi anche su questo, p...",1
10088,6509,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
5739,331514,Nulla di tutto questo: le dichiarazioni del Go...,Ciò è anche comprensibile.,0
9048,693014,Conosciamo infatti la peculiarità dei lavorato...,Lo avete fatto voi ed eravamo tutti d'accordo;...,0
...,...,...,...,...
8851,564258,"Nelle intenzioni di chi l'aveva ideata, la chi...","Se non ci fossero riusciti, ci avrebbe pensato...",0
9558,375446,"Mi riferisco, soprattutto, all'immotivata scel...",Che tale azione sia immotivata non lo dice chi...,0
9935,145535,Noi dell'opposizione abbiamo avuto la cortesia...,Cosa ha ottenuto l'Italia da questa manovra?,0
4263,487523,Indìco la votazione nominale con scrutinio sim...,Indìco la votazione nominale con scrutinio sim...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
9496,391964,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
3664,822504,"Quanto alla politica commerciale, è fondamenta...",Abbiamo ritenuto che occorresse un diverso app...,1
3844,798814,"La stessa cosa vale a livello dei Comuni, dove...","Signor Presidente, potrei sintetizzare l'inter...",1
2524,229590,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,1
2965,369417,"Lo stesso 21 gennaio, nel pomeriggio inoltrato...","Sarebbe bene che gli amici della Lega, che ora...",1
...,...,...,...,...
4646,752112,Maduro è un comunista che sta facendo di una d...,Dov'è la flat tax che avevate promesso?,1
5657,439982,Il Senato non approva.,Gli emendamenti 1.72 e 1.73 sono stati ritirati.,0
6407,885977,"Colleghi, lo hanno detto negli interventi che ...","Sta crescendo il debito pubblico, il deficit, ...",0
4821,310122,Ma cosa volete che interessi all'elettore del ...,"E la burocrazia è cresciuta, non è diminuita.",1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_df_dist_30_with_ids_ridotto Train shape: (8729, 4)
2019_df_dist_30_with_ids_ridotto Test shape: (2183, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2019_df_random_speech_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,351958,Siamo di fronte al sommo disprezzo del ridicol...,Su un miliardo e 600 milioni di euro di capita...,1
1,422711,Questo Governo fa questa scelta: sceglie di la...,Formulo un invito al ritiro di tutti gli emend...,1
2,537748,"In quel tardo pomeriggio estivo Filomena, apre...","In caso contrario, invito il Governo e la rela...",1
3,535558,Sono confermate le detrazioni fiscali per la r...,"Signor Presidente, vorrei annunciare il voto c...",1
4,53690,"Tutto è accaduto in pochi minuti, in quella pa...",Il Senato non approva.,1
...,...,...,...,...
92415,302146,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
92416,86624,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,0
92417,139646,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
92418,585175,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_Df_Random_Speech_With_Ids

Classes
1    46210
0    46210
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2019_df_random_speech_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5,246694,Ci si è dovuti confrontare con la necessità di...,Sulla proposta di risoluzione n. 1 del senator...,1
18,487469,Mi riferisco all'emergenza climatica.,Saluto a nome dell'Assemblea i docenti e gli s...,1
37,551244,"Egli ha poi aggiunto che, se un «fatto specifi...",L'elenco dei senatori in congedo e assenti per...,1
52,72528,"Signor Presidente, non possiamo essere soddisf...",Ed il tutto per emergenza e compiacenza.,1
53,636922,Informo l'Assemblea che all'inizio della sedut...,Ha facoltà di parlare il presidente della 7ᵃ C...,1
...,...,...,...,...
92395,287794,"Esprimo, infine, parere favorevole sull'ordine...","Signor Presidente, sugli emendamenti esprimo p...",0
92401,205806,Il Senato non approva.,Passiamo alla votazione dell'emendamento 5.800...,0
92408,599894,"Questa è un po' una situazione orwelliana, da ...","Con quest'emendamento chiediamo, quindi, di in...",0
92410,787794,È un consiglio che diamo a tutela delle person...,Indìco la votazione nominale con scrutinio sim...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
16334,642129,"Ce n'è un ultimo, però, col quale vorrei chiud...",Si è andati contro quanto la direttiva comunit...,1
59842,845735,"Di questo passo, senza un cambio di rotta, le ...",Bisogna quindi battersi per modificare l'atteg...,0
31647,237821,"Vi è uno strumento, quello che è stato corrett...","Quindi, signor Presidente, non mi dilungherò, ...",1
21172,239083,"Essendone stata avanzata richiesta, indìco la ...",Abbiamo la fortuna di avere il sottosegretario...,1
35046,493169,Avverto che nel corso della seduta odierna pot...,Qui si vuole soltanto attuare una strategia: q...,1
...,...,...,...,...
30627,116229,Vorrei inoltre precisare che non è presente il...,"Soprattutto, ciò avviene nella cornice di una ...",1
61482,536045,"Siamo ancora molto critici, ad esempio, rispet...","Consentitemi, signor Presidente e colleghi, di...",0
24840,399976,"Perché, allora, scavalcare l'organo deputato a...",L'Ufficio di Venezia privilegia attività sui t...,1
59594,717094,"Con l'approvazione dell'emendamento 3.0.100, l...",L'articolo 4 modifica la disciplina sull'impie...,0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
38678,667131,"Abbiamo lavorato in queste tristi condizioni, ...","Signor Presidente, esprimo parere contrario al...",1
43366,874109,Il Senato tornerà a riunirsi in seduta pubblic...,Nei giorni scorsi ho avuto uno scambio di valu...,1
56441,689673,Il 6 giugno deliberammo la proroga della parte...,"Né, oltre a questi ritardi, la seduta del 31 m...",0
52341,442552,Il Senato approva.,Mi pare che tutti i Gruppi siano d'accordo a p...,0
48412,332588,Il Senato approva.,"Passiamo all'esame dell'articolo 8, sul quale ...",0
...,...,...,...,...
75265,711080,Il Senato approva.,Indìco la votazione nominale con scrutinio sim...,0
12048,620106,"Signor Presidente, è stato espresso parere con...","Francamente, la trasformazione in ordine del g...",1
72919,878545,"Infine, signor Presidente, ritengo che gli eff...","Di recente una donna illuminata, Luisa Muraro,...",0
37688,339206,Ringrazio il ministro per le riforme costituzi...,È iscritto a parlare il senatore Malan.,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2019_df_random_speech_with_ids_ridotto Train shape: (9600, 4)
2019_df_random_speech_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

2020_df_dist_5_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,298292,Come avremmo potuto intercettarli?,"Questo ci darebbe la possibilità, infatti, di ...",1
1,568183,Non è così; purtroppo il virus è ancora fra di...,Voglio ricordare nuovamente la capacità straor...,1
2,122438,"Non tutte le attività lavorative hanno, infatt...",Questi impegni sono utili per farci capire com...,1
3,303466,"Per l'indagine, pertanto, sono stati individua...","Devo davvero ringraziare tutti i colleghi, la ...",1
4,387846,È stata fatta con il Ministero della salute in...,Vi è quindi necessità di collaborazione fra le...,1
...,...,...,...,...
51189,103804,"Signor Presidente del Consiglio, in quelle pia...","E se dobbiamo parlare di rimborsi, visto che i...",0
51190,715412,Queste persone sono convinte che la situazione...,"Signor Presidente del Consiglio, in quelle pia...",0
51191,406291,Sarà indispensabile graduare la riduzione dell...,La fase di convivenza con il virus andrà gesti...,0
51192,789021,"E questi ultimi non sono più disposti, come av...",Queste persone sono convinte che la situazione...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_Df_Dist_5_With_Ids

Classes
1    25597
0    25597
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2020_df_dist_5_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
7,37377,"Abbiamo detto che bisogna tracciare, identific...","Non tutte le attività lavorative hanno, infatt...",1
8,163937,L'Organizzazione mondiale della sanità ci ha d...,"Per l'indagine, pertanto, sono stati individua...",1
11,789625,Voglio ricordare nuovamente la capacità straor...,Il 25 maggio - lo abbiamo trattato anche in Co...,1
19,441858,Tutta questa situazione ci ha portato a compli...,Le misure di distanziamento sociale sono impor...,1
20,149239,Abbiamo visto tanti esperti dire cose che si s...,Questo dimostra che dobbiamo stare molto atten...,1
...,...,...,...,...
51176,163205,Non possiamo e non dobbiamo abbassare la guardia.,Il nostro primo obiettivo deve essere quello d...,0
51178,156360,Questo perché raccogliete quello che avete sem...,"Signor presidente Conte, rappresentanti del Go...",0
51189,103804,"Signor Presidente del Consiglio, in quelle pia...","E se dobbiamo parlare di rimborsi, visto che i...",0
51190,715412,Queste persone sono convinte che la situazione...,"Signor Presidente del Consiglio, in quelle pia...",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
11664,749412,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,1
18737,480758,Cosa sta facendo?,Ha fatto qualcosa?,1
47611,538619,"Sono alcuni mesi che una parte della politica,...",A marzo l'Italia era stata investita da un TIR...,0
25490,599542,Ma cosa c'è di urgente?,Siamo al monocameralismo vero e proprio e abbi...,1
24759,295519,"Credo che questo sia un impegno, non formale, ...",Impegnativa al 23 e spesa al 26 sono un obiett...,1
...,...,...,...,...
33270,236217,"Tutto è in divenire, appunto, tutto è da verif...","Tra l'altro, mi rivolgo ai colleghi della magg...",0
40580,758794,"Voglio, allora, parlare della cultura delle ga...",Penso sia sbagliato contrapporre garantismo a ...,0
44376,23925,"C'è infine un contesto politico, quello dell'a...",In tutta la Colombia si susseguono omicidi mir...,0
10166,252136,"La giustizia significa, in sede civile, ripara...",La domanda è la seguente: siamo oggi agli stes...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
9380,733879,"È successo, come sappiamo, nel 2006, con la ri...","Questo non mi sembra, oggettivamente, un atteg...",1
18036,604757,Il Senato non approva.,Indìco la votazione nominale con scrutinio sim...,1
30642,100447,I tre modelli erano pressappoco i seguenti: le...,Mi soffermo sui riscontri ottenuti non da tutt...,0
47148,631229,"Quindi, confusione, arroganza e approssimazion...",Io non sempre sono stato d'accordo con il prof...,0
3968,731269,Segnala anche - e questa è la cosa più grave a...,Ciò in aperto contrasto con il dettato dell'ar...,1
...,...,...,...,...
22902,255539,Tale diversa contabilizzazione produrrebbe un ...,L'assenza del Programma nazionale di riforma i...,1
17074,631061,"Allo stato attuale, un elemento stabilizzatore...",Tra i fondi di coesione avanza lo strumento di...,1
46366,654858,"Signor Presidente, a distanza di un mese dalle...",Esso prevede che il Governo si confronti con i...,0
4450,523396,"Vogliamo sapere quanti sono gli asintomatici, ...",È dal 7 luglio che lo chiediamo: dov'è?,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_df_dist_5_with_ids_ridotto Train shape: (9600, 4)
2020_df_dist_5_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2020_df_dist_10_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,297288,"Finito il suo mandato di senatore, rimase qui ...","È giusto rendergli omaggio qui in Senato, dove...",1
1,691229,Spesso in Italia accade che nei momenti più di...,"Il secondo tema, signor Ministro, riguarda anc...",1
2,144500,"Grazie, comunque, da parte mia.",Per cui lo dico sin d'ora: più volte abbiamo d...,1
3,530693,"Non scherzerei sul tema del negazionismo, perc...","Dobbiamo interrogarci su questo, perché è un p...",1
4,253558,È molto semplice: siamo chiamati a convivere c...,Un altro punto: sono un sincero regionalista e...,1
...,...,...,...,...
39311,188249,Non cito il professor Clementi e il professor ...,"Dedico loro un pensiero di Mark Twain, che scr...",0
39312,803218,L'emergenza c'è solo nella vostra testa ed è u...,Non cito il professor Clementi e il professor ...,0
39313,292072,Cari parlamentari che volete dimostrare il con...,L'emergenza c'è solo nella vostra testa ed è u...,0
39314,382415,Chi sostiene il contrario vada a farsi un giro...,Cari parlamentari che volete dimostrare il con...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_Df_Dist_10_With_Ids

Classes
1    19658
0    19658
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2020_df_dist_10_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
2,144500,"Grazie, comunque, da parte mia.",Per cui lo dico sin d'ora: più volte abbiamo d...,1
3,530693,"Non scherzerei sul tema del negazionismo, perc...","Dobbiamo interrogarci su questo, perché è un p...",1
5,657747,Questa litigiosità e il non trovare la quadra ...,Parlo per esempio dei voucher nel turismo e in...,1
10,824864,"Tuttavia - cito solo questo esempio, ma è stat...",Non si può fare: cancellato.,1
12,881844,"Il primo: il lockdown, che ha prodotto e porta...","Diciamo la verità, colleghi, in questi dibatti...",1
...,...,...,...,...
39304,323107,"In una giornata media di quest'anno, i morti e...","Questi sono i dati che ci fanno ritenere che, ...",0
39310,640655,"Dedico loro un pensiero di Mark Twain, che scr...",In questo periodo storico stiamo assolutamente...,0
39311,188249,Non cito il professor Clementi e il professor ...,"Dedico loro un pensiero di Mark Twain, che scr...",0
39314,382415,Chi sostiene il contrario vada a farsi un giro...,Cari parlamentari che volete dimostrare il con...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5369,56554,"Visto come c'eravamo lasciati il giorno prima,...","La mafia, che vive di segnali, non sarebbe and...",1
15547,141900,Si deve pensare subito a un piano di riapertur...,Il 4 maggio il 75 per cento dei lavoratori che...,1
1726,586340,Io mi ero ripromesso di parlare nel caso che i...,Ce lo spieghino.,1
3426,705889,"Pertanto, colleghi, occorre fare attenzione pe...",La pressione fiscale nel 2020 è prevista collo...,1
7081,55193,Si fideranno ancora?,Può darsi che il sistema autostradale possa es...,1
...,...,...,...,...
16976,302728,Vorrebbe indicare all'Esecutivo e al Parlament...,Non basta avere i requisiti minimi: noi chiedi...,1
7985,474794,In quest'ottica di condivisione e di coordinam...,Mi avvio alla conclusione.,1
15380,770881,"Inoltre, nelle famiglie italiane le donne si f...",Stiamo fortunatamente andando verso la bella s...,1
30719,188001,"A questo punto, signor Presidente, delle due l...","Ma, accanto a questo, l'appello va a quella pa...",0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
8768,248526,"Quindi, non ci meravigliamo se questo test inv...",In concreto però il risultato che porta è asso...,1
8795,836105,"Governo, ora è più che mai nodale la questione...",La situazione di crisi che stiamo vivendo può ...,1
36251,687683,"La Lombardia ha vissuto un dramma vero, e io n...","Io per primo non sono in grado di dirlo, e fac...",0
27628,741578,"Signor Presidente, onorevoli colleghi, la ripr...","«Per opportuna, fattiva conoscenza»: così reci...",0
20549,754772,"È stata una necessità, una urgenza, per non la...","Quanto ai soldi destinati alle scuole, ieri qu...",0
...,...,...,...,...
11558,118980,L'onda emotiva è stata alla base dell'approvaz...,L'Italia è stata e sarà presente in tutti i fo...,1
24785,725583,C'è stato poi il passaggio dalla Prima alla Se...,Nel terzo millennio abbiamo conosciuto un nuov...,0
1728,165641,"Come in un paradosso, viviamo in un Paese dove...","«Lavoretto», come se potessero aspirare soltan...",1
7600,149806,"Ma non soltanto Banca d'Italia, anche Consob r...",Vorrei però ricordare che la Commissione della...,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_df_dist_10_with_ids_ridotto Train shape: (9600, 4)
2020_df_dist_10_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2020_df_dist_20_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,114462,"La sua biografia è quella di una certa Italia,...","È giusto rendergli omaggio qui in Senato, dove...",1
1,111542,"Ebbene speriamo di riuscire, con questo, a far...","In quest'Aula, proprio nelle scorse ore, è suc...",1
2,840749,"Il tema è che da marzo ad aprile, grazie anche...",Il tema quindi non è dare una delega in bianco.,1
3,862935,La situazione è davvero triste.,Queste attività maggiormente patiscono le rest...,1
4,786978,"Non c'è dubbio, c'è stata una discussione molt...",All'interno del Governo si partiva - non è un ...,1
...,...,...,...,...
24051,385124,Uno stato di emergenza non previsto dalla Cost...,Ricordo che durante gli studi universitari il ...,0
24052,634257,Ricordo che durante gli studi universitari il ...,E la Costituzione ci dice esattamente che lo s...,0
24053,569744,E la Costituzione ci dice esattamente che lo s...,"Quindi, purtroppo, lei va contro la Costituzio...",0
24054,700091,"Quindi, purtroppo, lei va contro la Costituzio...",Cosa ha prodotto lo stato d'emergenza finora?,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_Df_Dist_20_With_Ids

Classes
1    12028
0    12028
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2020_df_dist_20_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,114462,"La sua biografia è quella di una certa Italia,...","È giusto rendergli omaggio qui in Senato, dove...",1
2,840749,"Il tema è che da marzo ad aprile, grazie anche...",Il tema quindi non è dare una delega in bianco.,1
4,786978,"Non c'è dubbio, c'è stata una discussione molt...",All'interno del Governo si partiva - non è un ...,1
5,422952,Sicuramente nessuno quest'estate era nelle con...,"Quindi, per loro dobbiamo fare qualcosa verame...",1
6,544114,Penso che le parole del ministro Speranza - e ...,"A questo proposito, per quanto riguarda il tem...",1
...,...,...,...,...
24043,138019,Questa accusa si fonda su un evidente equivoco.,"Contrariamente a quanto spesso si sente dire, ...",0
24045,344895,Lo stato di emergenza è il presupposto di fatt...,"Il potere, in particolare, di adottare ed eman...",0
24049,399996,Il partito della cadrega ha paura di andare a ...,Lei viene a proporre uno stato di emergenza pe...,0
24054,700091,"Quindi, purtroppo, lei va contro la Costituzio...",Cosa ha prodotto lo stato d'emergenza finora?,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
1    1200
0    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5419,42202,"Al di là di questo, però, inizialmente è stata...",Andate fino in fondo.,1
6913,689878,"Allo stato attuale, un elemento stabilizzatore...",Vengono poi esplicitate le risorse da destinar...,1
8398,151388,Indìco la votazione nominale con scrutinio sim...,Indìco la votazione nominale con scrutinio sim...,1
22651,182650,"Vorrei rincuorare, per quanto possibile, i col...","In realtà, vorrei ricordare a loro e al presid...",0
4206,896120,Sono state proprio le Regioni che hanno chiest...,Questa è una indagine ragionata.,1
...,...,...,...,...
23728,815023,Sono tre pilastri veri e propri su cui tutta l...,"La mia opinione, quindi, è che su questo non d...",0
4048,637547,Qual è la finalità?,Anche noi della maggioranza avremmo migliorato...,1
17668,662864,La reazione dell'Italia tutta non è certo manc...,"Ecco perché oggi, in quest'Assemblea, abbiamo ...",0
4784,509841,"Dove sono i campioni della trasparenza, dopo c...","No, perché il piano non c'è, altrimenti sarest...",1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
3226,107838,"Penso che la prima linea guida, la più forte, ...",Dentro la risoluzione presentata dai Gruppi ch...,1
19125,618334,Per me non è mai stata la chiave securitaria q...,Penso che la democrazia e le sue regole rappre...,0
21324,569199,La riconversione in chiave ecologica dell'econ...,Abbiamo fatto tutto questo mettendo al primo p...,0
3627,824182,"Dovremo discutere, ragionare e capire ciò che ...",Ritengo che dovremmo fare tutti uno sforzo per...,1
13610,578622,Soprattutto non dobbiamo mai favorire lo scena...,"Questa metafora, questa immagine di separazion...",0
...,...,...,...,...
20572,268084,Purtroppo lo schema adottato è sempre lo stesso.,Alla fine si tratta di dare 20 euro; la maggio...,0
11504,635372,Rileviamo tuttavia che non è questo lo strumen...,Diamo oggi atto al Governo nel suo insieme che...,1
3880,300748,Bene farà il Governo nei prossimi giorni a pre...,"Noi, è ovvio, paghiamo uno scotto altissimo pe...",1
5799,362911,Da qui dobbiamo partire.,Non possiamo averlo.,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_df_dist_20_with_ids_ridotto Train shape: (9600, 4)
2020_df_dist_20_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2020_df_dist_30_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,88841,Ho cercato con un po' di fatica di andare a ve...,"Come ho detto poc'anzi, il nostro sarà un voto...",1
1,720044,"La crisi però etimologicamente, dal greco, sig...",La sanità pubblica si è dimostrata assolutamen...,1
2,306112,"Tuttavia, non credo che dobbiamo guardare ai g...",Riprendendo e parafrasando di nuovo il grande ...,1
3,41420,Se oggi saremo disposti ad affrontare questi p...,Allo stesso scopo viene estesa la durata della...,1
4,713200,Dobbiamo sforzarci tutti di ridurre le occasio...,I contraccolpi della crisi sono ancora forti e...,1
...,...,...,...,...
14395,732403,Favoriscono l'arricchimento dei trafficanti.,E noi siamo costretti a organizzare la quarant...,0
14396,217703,E noi siamo costretti a organizzare la quarant...,Noi siamo solidali con i cittadini di Lampedus...,0
14397,47195,Noi siamo solidali con i cittadini di Lampedus...,Forse per questo non è venuto.,0
14398,556780,Forse per questo non è venuto.,Speriamo che faccia delle cose buone e che dia...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_Df_Dist_30_With_Ids

Classes
1    7200
0    7200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2020_df_dist_30_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,88841,Ho cercato con un po' di fatica di andare a ve...,"Come ho detto poc'anzi, il nostro sarà un voto...",1
2,306112,"Tuttavia, non credo che dobbiamo guardare ai g...",Riprendendo e parafrasando di nuovo il grande ...,1
3,41420,Se oggi saremo disposti ad affrontare questi p...,Allo stesso scopo viene estesa la durata della...,1
4,713200,Dobbiamo sforzarci tutti di ridurre le occasio...,I contraccolpi della crisi sono ancora forti e...,1
5,631538,"Signor Presidente, il tema di cui discutiamo è...",Per questo voteremo la mozione a prima firma d...,1
...,...,...,...,...
14393,221612,Oggi hanno mandato la nave ospedale Allegra pe...,Noi non condividiamo - forse questa è la parte...,0
14394,819874,Noi non condividiamo - forse questa è la parte...,Favoriscono l'arricchimento dei trafficanti.,0
14396,217703,E noi siamo costretti a organizzare la quarant...,Noi siamo solidali con i cittadini di Lampedus...,0
14397,47195,Noi siamo solidali con i cittadini di Lampedus...,Forse per questo non è venuto.,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
5877,762091,Voi avete dimezzato i vostri consensi dimostra...,La Lega - Salvini Premier voterà no alla fiduc...,1
11039,384233,Pressoché unanime è stata la voce dei partner ...,Abbiamo poi proceduto a mirati contatti bilate...,0
1095,744050,"Noi stiamo chiedendo soldi ai nostri figli, pe...","Perché, se si dice che si chiudono delle Regio...",1
6868,684315,"Per meglio capire, voglio fare un altro esempio.",Dichiaro il voto favorevole del MoVimento 5 St...,1
5878,432557,Questo è l'intervento che abbiamo fatto e pert...,"Signor Presidente, come ben sanno tutti i coll...",1
...,...,...,...,...
5240,4261,Lo vuole capire una volta per tutte che dall'i...,Nel regime contista - bis si azzerano i lavori...,1
12264,681274,Il salto di qualità da compiere non è tanto ne...,"Tutti sappiamo, ad esempio, che le strutture o...",0
9677,450922,"D'altra parte, è vero che facciamo debito, ma ...","Sì, facciamo debito e lo facciamo per tenere s...",0
753,225423,"Alcuni hanno ricordato anche Zizzi, Iozzino, R...",Voglio anche ricordare che il senatore a vita ...,1



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
9792,153252,Qualcuno terrorizza il Paese».,"Quattro mesi dopo, nel mondo vengono quotidian...",0
6020,364335,"Confidiamo che questa sequenza parta, fin dal ...",Un'attenzione cruciale sarà dedicata alla valo...,1
10925,764099,"Presidente Conte, mi spiace che quello che cit...","Mi può spiegare, cosa vi sia di urgente, ai se...",0
2858,75549,Purtroppo nelle ultime settimane la recrudesce...,"Inoltre, ricordo che il personale sanitario mi...",1
4169,274842,"In breve, ecco cos'è accaduto ai nostri conti:...",Una stima piuttosto prudenziale porta a ritene...,1
...,...,...,...,...
4292,714402,Ricordo che il primo caso di paziente italiano...,Ieri ho ricordato alla Camera una lettera di M...,1
7249,180800,Possiamo però trarne comunque un elemento: le ...,"Lo vedo con i miei figli, i quali, con l'iPad,...",0
10563,174584,"Per quanto riguarda gli investimenti pubblici,...","La sostenibilità ambientale, attraverso la rid...",0
2864,301527,"Inoltre, ricordo che il personale sanitario mi...",L'inserimento di una Regione all'interno di un...,1


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_df_dist_30_with_ids_ridotto Train shape: (9600, 4)
2020_df_dist_30_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------
2020_df_random_speech_with_ids originale


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,561768,Mancherà alla sua città.,Passiamo alla votazione dell'emendamento 1.76.,1
1,159543,Io però mi auguro - ed era questo l'appello la...,Invito i relatori e il rappresentante del Gove...,1
2,553854,Allora non deve apparire un fuor d'opera il fa...,Abbiamo cercato di dare un contributo positivo...,1
3,473594,Se lo proroghiamo infatti per eventi verificat...,Ho il telefono in tasca.,1
4,102062,Come ho già detto in quest'Aula - ripeto sempr...,"Signor Presidente, signor Ministro, la ringraz...",1
...,...,...,...,...
73007,505097,"Senatrice Faggi, le chiedo scusa, ma sono già ...",Quindi adesso procedo alla votazione.,0
73008,650478,Quindi adesso procedo alla votazione.,Indìco la votazione nominale con scrutinio sim...,0
73009,655619,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
73010,509637,Il Senato non approva.,Passiamo alla votazione dell'ordine del giorno...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_Df_Random_Speech_With_Ids

Classes
1    36506
0    36506
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Controlliamo che ci siano soltanto esempi positivi e negativi nei rispettivi dataset
Dataset frasi non consecutive
Class
1    6000
Name: Class, dtype: int64

Dataset frasi consecutive
Class
0    6000
Name: Class, dtype: int64

Informazioni sulle classi del dataset ridotto
1    6000
0    6000
Name: Class, dtype: int64
2020_df_random_speech_with_ids ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
0,561768,Mancherà alla sua città.,Passiamo alla votazione dell'emendamento 1.76.,1
13,755313,"Il risultato, Ministro, Presidente, è un caos ...",Troppe volte nel passato anche recente abbiamo...,1
20,489984,"Quindi, lo stato d'emergenza è previsto da una...",Ci sono delle considerazioni da fare a proposi...,1
27,768194,Non si rispettano nemmeno le procedure previst...,"D'altra parte il populismo, che non è una mala...",1
28,412784,"Signor Presidente, gentili senatrici e gentili...","Signor Presidente, esprimo parere conforme al ...",1
...,...,...,...,...
72985,281622,Indìco la votazione nominale con scrutinio sim...,Il Senato non approva.,0
72990,37485,"Signor Presidente, l'ordine del giorno G15.101...",È importante che si aderisca alla Strategia eu...,0
72991,711114,Passiamo alla votazione dell'ordine del giorno...,"Signor Presidente, l'ordine del giorno G15.101...",0
72999,268574,"Se non ci fosse un nesso, quest'ordine del gio...","Visto che è stato ammesso, il nesso c'è.",0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
File salvato correttamente

Dettaglio delle classi nel training
1    4800
0    4800
Name: Class, dtype: int64

Dettaglio delle classi nel test
0    1200
1    1200
Name: Class, dtype: int64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Train ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
17677,374129,L'Istat - che ha una competenza della quale no...,Passiamo alla votazione dell'emendamento 1.1.,1
28309,240194,Invito l'Assemblea ad osservare un minuto di s...,Vi sono sicuramente gli ammortizzatori sociali...,1
62450,743257,"Va bene preoccuparsi della barca, la nautica è...","Nel frattempo, se riusciste a pagare la cassa ...",0
62357,184563,Il Senato tornerà a riunirsi in seduta pubblic...,L'elenco dei senatori in congedo e assenti per...,0
9744,822076,Ha facoltà di parlare il rappresentante del Go...,Chiediamo che la votazione venga effettuata a ...,1
...,...,...,...,...
914,88295,"Per esempio, tante volte abbiamo sentito parla...",Sospendo pertanto la seduta.,1
24369,40017,Venne mandato nei Paesi dell'Est.,Consentiteci di lavorare ancora: vorremmo pote...,1
72568,864809,"Quindi, le richieste di interessamento della C...","Occorre che adesso mi soffermi brevemente, per...",0
57316,206103,Quanto all'accesso dei familiari degli ospiti ...,"La Regione Lombardia esclude, inoltre, di aver...",0



Test ridotto


Unnamed: 0,Id,Sentence_1,Sentence_2,Class
71541,263306,"In quest'Aula non è possibile fotografare, lo ...",Chi sta fotografando?,0
16412,390082,Questo Governo non si è mai sottratto e mai si...,Esso stabilisce che i genitori o il tutore ese...,1
23510,43917,"Così come ho cercato di dire in precedenza, è ...",Indìco la votazione nominale con scrutinio sim...,1
52923,887224,Accanto al tema del risanamento dei conti pubb...,Le fonti su cui si fonda una buona parte dell'...,0
49798,385172,"Non serve, infatti, aggiungere burocrazia alla...","Questa è complicazione, non è semplificazione.",0
...,...,...,...,...
49706,634209,I commissari facciano il loro lavoro e guidino...,"Nell'interesse di tutti e della collettività, ...",0
8302,491716,Uno era il Trattato sulla doppia imposizione f...,"Prevenendo un intervento che già immagino, pre...",1
38315,541348,"In qualche modo, però, è come se quest'emergen...",Quando ci si accorge che l'aria è importante?,0
61266,479511,I test sierologici devono essere effettuati da...,Nella prima settimana del contagio la risposta...,0


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020_df_random_speech_with_ids_ridotto Train shape: (9600, 4)
2020_df_random_speech_with_ids_ridotto Test shape: (2400, 4)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Intersezione vuota
File salvato correttamente

File salvato correttamente


--------------------------------------------------------------------------------------------------

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""



**Salvo il dizionario che contiene, per ogni anno e per ogni distanza, il dataset ridotto, il train e il test**

In [34]:
with open(path_pickle + 'diz_dataset_ridotti_e_train_test', 'wb') as handle:
    pickle.dump(diz_dataset_ridotti_e_train_test, handle)

In [54]:
diz_dataset_ridotti_e_train_test['2013']['dist_5']['df_ridotto_test'].iloc[211].Sentence_1

'« La Commissione programmazione economica, bilancio, esaminato il disegno di legge in titolo e preso atto dei chiarimenti forniti dal Governo, in base ai quali: - risulta confermata la disponibilità delle risorse del Fondo di rotazione per le politiche europee, utilizzate a copertura delle misure di cui agli articoli 1, comma 12, lettera a, e 3, commi 1 e 2; - per quanto attiene all\'impatto sull\'indebitamento netto e sul fabbisogno delle spese da sostenersi con le predette risorse, viene confermata la relativa neutralità, in quanto l\'articolazione temporale della spesa prevista per i nuovi interventi è la medesima di quella stimata nei tendenziali per le misure definanziate; - con riferimento all\'articolo 2, comma 9, che estende il periodo di utilizzo del credito di imposta per nuove assunzioni a tempo indeterminato nel Mezzogiorno, si fa presente che tale disposizione non incide sui limiti del finanziamento, risultando esclusivamente finalizzata a consentire ai beneficiari l\'eff