In [1]:
import os, sys
import unidecode
import re
import json
import gc

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

Ce notebook analyse les réponses aux questions en cherchant des liens entre les mots les plus utilisés, dans le but de comprendre les demandes les plus récurrentes des francais.

Dans un premier temps, les réponses sont préprocessées et transformées en liste de mots-clés. Puis, pour chaque réponse, úne analyse basique de la proximité des mots est réalisée. Bien que simple, cette methode permet de faire apparaitre des thèmes récurrents et de comprendre la teneur générale de ces demandes.

Les trois métriques utilisées sont :
+ co-occurence des mots : $co-occurence(i, j) = \sum_{users} 1_{i \in user} 1_{j \in user}$
+ confiance : $confiance(i -> j) = P(j | i)$
+ lift : $lift(i, j) = \frac{P(i \cap j)}{P(i)P(j)}$

La co-occurence permet d'évaluer les mots présents de manière commune, et donne une première idée des thèmes généraux.

La confiance donne une idée de la présence de $j$ quand $i$ est déjà présent : il surpondère les mots peu présents par rapport à la co-occurence.

Le lift estime le surplus de présence commune de $i$ et $j$ par rapport au cas où $i$ et $j$ sont indépendants. Cela permet de trouver des relations de causalité plus intéressantes, notamment dans des cas où certains mots sont peu présents mais très liés.

Pour chaque question :
+ On récupère les mots les plus employés sur ce thème
+ Pour chacun de ces mots, on regarde pour chaque métrique les mots les plus liés, ce qui donne une bonne idée des liens et des demandes

On peut ensuite raffiner l'analyse sur des mots moins présents mais porteurs de sens.

In [2]:
# function definitions

def compute_similarities(question_name, df_res):
    qu = df_res[question_name].dropna()
    df_qu_one_hot = compute_one_hot(qu)
    df_cov = compute_covariance(df_qu_one_hot)
    df_confidence = compute_confidence(df_cov)
    df_lift = compute_lift(df_cov, df_qu_one_hot)
    
    return qu, df_qu_one_hot, df_cov, df_confidence, df_lift
    
def compute_one_hot(qu):
    qu_words = []
    for i in qu:
        qu_words.extend(i)
    qu_words = list(set(qu_words))
    dic_qu_words = {word:i for i, word in enumerate(qu_words)}
    dic_qu_words_inverse = {i:word for i, word in enumerate(qu_words)}
    
    qu_one_hot = np.zeros((len(qu), len(qu_words)), dtype=bool)
    for i, li_word in enumerate(qu):
        for word in li_word:
            qu_one_hot[i, dic_qu_words[word]] = True
            
    df_qu_one_hot = pd.DataFrame(columns=qu_words, data=qu_one_hot).to_sparse(fill_value=False)

    
    temp_mask = np.sum(df_qu_one_hot.values, axis=0, dtype=np.uint16) > 250
    words_enough = df_qu_one_hot.columns.values[temp_mask]
    df_qu_one_hot = df_qu_one_hot[words_enough].to_sparse(fill_value=0)
    
    del temp_mask
    del qu_one_hot
    gc.collect()
    
    return df_qu_one_hot

def compute_covariance(df_qu_one_hot):
    N = df_qu_one_hot.shape[1]
    
    cov = np.zeros((N, N), dtype=np.uint16)
    np.matmul(df_qu_one_hot.values.T, df_qu_one_hot.values, out=cov)
    
    df_cov = pd.DataFrame(columns=df_qu_one_hot.columns, index=df_qu_one_hot.columns, data=cov) * (cov > 100)
    del cov
    gc.collect()
    
    return df_cov

def compute_confidence(df_cov):
    df_confidence = np.diag(1 / np.diag(df_cov)).dot(df_cov).astype(np.float32)
    df_confidence = pd.DataFrame(index=df_cov.index, columns=df_cov.index, data=df_confidence)
    return df_confidence

def compute_lift(df_cov, df_qu_one_hot):
    inv_diag_cov = 1 / np.diag(df_cov.values)
    lift = inv_diag_cov.reshape((-1, 1)) * df_cov.values * inv_diag_cov.reshape((1, -1))
    df_lift = pd.DataFrame(columns=df_qu_one_hot.columns,
                             index=df_qu_one_hot.columns,
                             data=lift).replace(0.0, np.nan).astype(np.float32)
    del lift
    del inv_diag_cov
    gc.collect()
    
    return df_lift

# Loading of files and preprocessing

In [3]:
PATH_TO_FILE = "./proposals_cleaned/democratie.json"

In [4]:
with open(PATH_TO_FILE, "r") as f:
    raw_json = [s.strip() for s in f.readlines()]
    
parsed_json = [json.loads(raw_json[i]) for i in range(len(raw_json))]
del raw_json

In [5]:
col = ["titre"]
for ques in parsed_json[0]["responses"]:
    col.append(ques["question"]["id"]) 
        
data = []
for elt in parsed_json:
    resp = {"titre" : elt["titre"]}
    for ques in elt["responses"]:
        if ques["question"]["title"] == "Si oui, comment ?":
            if ques["question"]["id"] == "121":
                ques["question"]["title"] += "_RIP"
            else:
                ques["question"]["title"] += "_Senat"
        try:
            text = json.loads((ques["value"]))
            resp[ques["question"]["title"]] = ''
            if text["labels"] != []:
                resp[ques["question"]["title"]] += ", ".join(text["labels"])
            if text["other"] is not None:
                resp[ques["question"]["title"]] += ", " + text["other"]
            if resp[ques["question"]["title"]] == '':
                resp[ques["question"]["title"]] = np.nan
        except:
            if ques["value"] is not None and ques["value"][0] != "{":
                resp[ques["question"]["title"]] = ques["value"]
            else:
                resp[ques["question"]["title"]] = np.nan
    data.append(resp)

In [6]:
res = pd.DataFrame.from_dict(data)
del data
gc.collect()

0

In [7]:
res.notna().mean(axis=0).sort_values(ascending=False)

titre                                                                                                                                                                                                             1.000000
Le non-cumul des mandats instauré en 2017 pour les parlementaires (députés et sénateurs) est :                                                                                                                    0.859542
Faut-il prendre en compte le vote blanc ?                                                                                                                                                                         0.853150
En dehors des élus politiques, faut-il donner un rôle plus important aux associations et aux organisations syndicales et professionnelles ?                                                                       0.835577
Faut-il faciliter le déclenchement du référendum d'initiative partagée (le RIP est organisé à l'initiative de membres du Par

# Find important words

In [8]:
li_word_count = []
for elt in res.values:
    for item in elt:
        if type(item) == str:
            li_word_count.extend([unidecode.unidecode(x.lower()) for x in re.findall(r'\w+', item)])

In [9]:
dic_word_count = {}
for i in li_word_count:
    if len(i) > 0:
        if i in dic_word_count.keys():
            dic_word_count[i] +=1
        else:
            dic_word_count[i] = 1

In [10]:
df_word_count = pd.DataFrame.from_dict(dic_word_count, orient="index")
df_word_count.sort_values(0, ascending=False)
df_word_count.columns = ["freq_in_debate"]

In [11]:
del li_word_count
del dic_word_count

gc.collect()

202

In [12]:
df_word_count = df_word_count[df_word_count["freq_in_debate"] > 100]

In [13]:
li_stopwords = [unidecode.unidecode(x.strip().lower()) for x in open("french_stopwords.txt", 'r').readlines()]
li_stopwords = set(li_stopwords)
li_stopwords.remove("aucun")
li_stopwords.remove("tout")
li_stopwords.remove("tous")
li_stopwords.remove("non")

In [14]:
new_data = []
for i, elt in enumerate(res.index):
    temp_res = []
    for col in res.columns:
        item = res.loc[elt, col]
        if type(item) == str:
            li_item = [unidecode.unidecode(x.lower()) for x in re.findall(r'\w+', item) if unidecode.unidecode(x.lower()) not in li_stopwords]
            temp_res.append(li_item)
        else:
            temp_res.append(None)
    new_data.append(temp_res)

In [15]:
new_res = pd.DataFrame(new_data, columns=res.columns).to_sparse()
del new_data
gc.collect()

0

# Question 1 :  En qui faites-vous le plus confiance pour vous faire représenter dans la société et pourquoi ?

In [16]:
question_1 = "En qui faites-vous le plus confiance pour vous faire représenter dans la société et pourquoi ?"
qu_1,df_qu_1_one_hot,df_cov_1,df_confidence_1,df_lift_1 = compute_similarities(question_1,new_res)

In [17]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_1[i].sort_values(ascending=False).head(10))

elus


elus             7797
locaux           1284
confiance        1119
citoyens          891
deputes           843
tous              659
maire             653
maires            588
politiques        587
representants     571
Name: elus, dtype: uint16

maire


maire        7340
depute       1393
proximite     772
commune       736
citoyens      706
elus          653
elu           546
president     484
terrain       412
connait       399
Name: maire, dtype: uint16

confiance


confiance        3148
elus             1119
faire             616
politiques        443
politique         415
citoyens          368
maire             352
representants     317
representer       314
elu               312
Name: confiance, dtype: uint16

depute


depute       2938
maire        1393
elu           361
elus          309
president     270
citoyens      212
vote          204
confiance     194
proximite     166
faire         149
Name: depute, dtype: uint16

citoyens


citoyens      2830
elus           891
maire          706
confiance      368
maires         334
politique      314
deputes        309
faire          288
tous           270
politiques     268
Name: citoyens, dtype: uint16

deputes


deputes       2662
elus           843
maires         751
senateurs      410
maire          370
president      337
citoyens       309
confiance      287
republique     224
faire          192
Name: deputes, dtype: uint16

maires


maires       2361
deputes       751
elus          588
proches       346
citoyens      334
proximite     197
terrain       195
confiance     192
communes      186
president     186
Name: maires, dtype: uint16

elu


elu           2094
maire          546
president      413
depute         361
elus           337
confiance      312
republique     289
citoyens       251
politique      221
faire          195
Name: elu, dtype: uint16

president


president     1933
republique    1039
maire          484
elu            413
elus           405
deputes        337
depute         270
confiance      227
vote           201
maires         186
Name: president, dtype: uint16

politique


politique     1808
elus           537
confiance      415
citoyens       314
faire          286
non            271
vie            265
parti          265
politiques     258
maire          253
Name: politique, dtype: uint16

politiques


politiques    1747
elus           587
confiance      443
citoyens       268
partis         265
politique      258
hommes         257
tous           246
faire          239
non            210
Name: politiques, dtype: uint16

associations


associations    1534
elus             462
syndicats        330
citoyens         206
politiques       170
non              139
maire            133
confiance        128
locaux           113
maires           108
Name: associations, dtype: uint16

tous


tous          1529
elus           659
confiance      308
citoyens       270
faire          264
politiques     246
politique      228
tout           221
pouvoir        204
maire          196
Name: tous, dtype: uint16

faire


faire        1511
confiance     616
elus          516
citoyens      288
politique     286
tout          268
tous          264
pouvoir       264
faut          247
non           241
Name: faire, dtype: uint16

locaux


locaux       1455
elus         1284
citoyens      197
proches       177
maire         159
deputes       147
terrain       144
nationaux     136
maires        125
confiance     121
Name: locaux, dtype: uint16

republique


republique    1422
president     1039
elus           410
elu            289
maire          262
deputes        224
confiance      188
citoyens       151
suffrage       147
depute         147
Name: republique, dtype: uint16

vote


vote          1376
elus           486
confiance      257
depute         204
president      201
elu            182
citoyens       177
faire          170
tous           165
democratie     162
Name: vote, dtype: uint16

proximite


proximite    1341
maire         772
elus          384
maires        197
elu           171
depute        166
citoyens      144
deputes       106
terrain       106
tout            0
Name: proximite, dtype: uint16

peuple


peuple           1288
elus              452
confiance         227
democratie        185
representants     178
deputes           176
pouvoir           174
citoyens          166
faire             161
politique         155
Name: peuple, dtype: uint16

tout


tout          1250
elus           413
confiance      306
faire          268
politique      239
tous           221
monde          211
citoyens       209
pouvoir        205
politiques     202
Name: tout, dtype: uint16

In [18]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_1[i].sort_values(ascending=False).head(10))

elus


elus                1.000000
locaux              0.882474
nationaux           0.765625
democratiquement    0.687003
suffrage            0.559356
municipaux          0.558065
representent        0.553360
universel           0.527187
elections           0.519588
democratique        0.519231
Name: elus, dtype: float32

maire


maire          1.000000
accessible     0.822006
commune        0.765073
connait        0.726776
administres    0.673611
habitants      0.588679
proximite      0.575690
concitoyens    0.520000
quotidien      0.492239
contact        0.491176
Name: maire, dtype: float32

confiance


confiance         1.000000
difficile         0.459559
faire             0.407677
hommes            0.339726
representer       0.310584
question          0.298755
systeme           0.271429
societe           0.270179
aucun             0.262500
representation    0.260536
Name: confiance, dtype: float32

depute


depute        1.000000
national      0.293556
lois          0.283784
local         0.230903
assemblee     0.199686
nationale     0.194085
niveau        0.193457
maire         0.189782
elu           0.172397
represente    0.157585
Name: depute, dtype: float32

citoyens


citoyens          1.000000
sort              0.513089
exemple           0.315789
nombre            0.297587
decisions         0.289538
proches           0.283447
compte            0.270872
temps             0.255274
representation    0.249042
place             0.243437
Name: citoyens, dtype: float32

deputes


deputes         1.000000
senateurs       0.816733
conseillers     0.331492
lois            0.318533
maires          0.318086
nombre          0.276139
nationale       0.253235
gouvernement    0.248299
representent    0.245059
assemblee       0.243711
Name: deputes, dtype: float32

maires


maires         1.000000
petites        0.492013
communes       0.430556
proches        0.392290
conseillers    0.359116
deputes        0.282119
senateurs      0.270916
terrain        0.180556
proximite      0.146905
citoyens       0.118021
Name: maires, dtype: float32

elu


elu          1.000000
universel    0.356974
suffrage     0.336016
programme    0.310000
local        0.288194
aucun        0.262500
mandat       0.249531
majorite     0.240891
election     0.229759
president    0.213658
Name: elu, dtype: float32

president


president       1.000000
republique      0.730661
universel       0.385343
suffrage        0.358149
programme       0.342500
gouvernement    0.304422
election        0.262582
france          0.235714
pays            0.211650
francais        0.211538
Name: president, dtype: float32

politique


politique    1.000000
parti        0.475763
ans          0.295580
temps        0.253165
aucun        0.243750
pays         0.242718
vie          0.231846
france       0.230357
faut         0.228235
partis       0.223656
Name: politique, dtype: float32

politiques


politiques    1.000000
hommes        0.704110
partis        0.569892
france        0.208929
interet       0.184739
syndicats     0.184721
francais      0.174451
non           0.170732
interets      0.169697
faut          0.162353
Name: politiques, dtype: float32

associations


associations    1.000000
syndicats       0.376283
non             0.113008
politiques      0.097310
locaux          0.077663
citoyens        0.072792
elus            0.059254
maires          0.045743
confiance       0.040661
maire           0.018120
Name: associations, dtype: float32

tous


tous        1.000000
ans         0.350829
france      0.253571
pays        0.248544
temps       0.238397
francais    0.234890
cas         0.233871
faut        0.214118
compte      0.211503
systeme     0.208929
Name: tous, dtype: float32

faire


faire      1.000000
loi        0.358974
exemple    0.307479
temps      0.303797
travail    0.302452
ans        0.298343
pays       0.293204
faut       0.290588
nombre     0.278820
place      0.260143
Name: faire, dtype: float32

locaux


locaux          1.000000
nationaux       0.531250
proches         0.200680
problemes       0.172767
elus            0.164679
terrain         0.133333
associations    0.073664
citoyens        0.069611
deputes         0.055222
maires          0.052944
Name: locaux, dtype: float32

republique


republique      1.000000
president       0.537506
universel       0.316785
suffrage        0.295775
france          0.212500
francais        0.193681
gouvernement    0.175170
elu             0.138013
democratie      0.119228
pouvoir         0.099919
Name: republique, dtype: float32

vote


vote          1.000000
elections     0.274227
lois          0.260618
election      0.227571
compte        0.224490
majorite      0.212551
democratie    0.136020
faut          0.134118
non           0.120325
faire         0.112508
Name: vote, dtype: float32

proximite


proximite    1.000000
maire        0.105177
terrain      0.098148
maires       0.083439
elu          0.081662
depute       0.056501
citoyens     0.050883
elus         0.049250
deputes      0.039820
france       0.000000
Name: proximite, dtype: float32

peuple


peuple           1.000000
francais         0.173077
faut             0.165882
democratie       0.155332
representants    0.142514
pouvoir          0.140210
representer      0.126607
non              0.117886
faire            0.106552
tout             0.096800
Name: peuple, dtype: float32

tout


tout        1.000000
cas         0.292339
monde       0.280959
temps       0.280591
pays        0.266019
france      0.255357
place       0.250597
faut        0.224706
systeme     0.196429
francais    0.193681
Name: tout, dtype: float32

In [19]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_1[i].sort_values(ascending=False).head(10))

elus


elus                0.000128
locaux              0.000113
nationaux           0.000098
democratiquement    0.000088
suffrage            0.000072
municipaux          0.000072
representent        0.000071
universel           0.000068
elections           0.000067
democratique        0.000067
Name: elus, dtype: float32

maire


maire          0.000136
accessible     0.000112
commune        0.000104
connait        0.000099
administres    0.000092
habitants      0.000080
proximite      0.000078
concitoyens    0.000071
quotidien      0.000067
contact        0.000067
Name: maire, dtype: float32

confiance


confiance         0.000318
difficile         0.000146
faire             0.000130
hommes            0.000108
representer       0.000099
question          0.000095
systeme           0.000086
societe           0.000086
aucun             0.000083
representation    0.000083
Name: confiance, dtype: float32

depute


depute        0.000340
national      0.000100
lois          0.000097
local         0.000079
assemblee     0.000068
nationale     0.000066
niveau        0.000066
maire         0.000065
elu           0.000059
represente    0.000054
Name: depute, dtype: float32

citoyens


citoyens          0.000353
sort              0.000181
exemple           0.000112
nombre            0.000105
decisions         0.000102
proches           0.000100
compte            0.000096
temps             0.000090
representation    0.000088
place             0.000086
Name: citoyens, dtype: float32

deputes


deputes         0.000376
senateurs       0.000307
conseillers     0.000125
lois            0.000120
maires          0.000119
nombre          0.000104
nationale       0.000095
gouvernement    0.000093
representent    0.000092
assemblee       0.000092
Name: deputes, dtype: float32

maires


maires         0.000424
petites        0.000208
communes       0.000182
proches        0.000166
conseillers    0.000152
deputes        0.000119
senateurs      0.000115
terrain        0.000076
proximite      0.000062
citoyens       0.000050
Name: maires, dtype: float32

elu


elu          0.000478
universel    0.000170
suffrage     0.000160
programme    0.000148
local        0.000138
aucun        0.000125
mandat       0.000119
majorite     0.000115
election     0.000110
president    0.000102
Name: elu, dtype: float32

president


president       0.000517
republique      0.000378
universel       0.000199
suffrage        0.000185
programme       0.000177
gouvernement    0.000157
election        0.000136
france          0.000122
pays            0.000109
francais        0.000109
Name: president, dtype: float32

politique


politique    0.000553
parti        0.000263
ans          0.000163
temps        0.000140
aucun        0.000135
pays         0.000134
vie          0.000128
france       0.000127
faut         0.000126
partis       0.000124
Name: politique, dtype: float32

politiques


politiques    0.000572
hommes        0.000403
partis        0.000326
france        0.000120
interet       0.000106
syndicats     0.000106
francais      0.000100
non           0.000098
interets      0.000097
faut          0.000093
Name: politiques, dtype: float32

associations


associations    0.000652
syndicats       0.000245
non             0.000074
politiques      0.000063
locaux          0.000051
citoyens        0.000047
elus            0.000039
maires          0.000030
confiance       0.000027
maire           0.000012
Name: associations, dtype: float32

tous


tous        0.000654
ans         0.000229
france      0.000166
pays        0.000163
temps       0.000156
francais    0.000154
cas         0.000153
faut        0.000140
compte      0.000138
systeme     0.000137
Name: tous, dtype: float32

faire


faire      0.000662
loi        0.000238
exemple    0.000203
temps      0.000201
travail    0.000200
ans        0.000197
pays       0.000194
faut       0.000192
nombre     0.000185
place      0.000172
Name: faire, dtype: float32

locaux


locaux          0.000687
nationaux       0.000365
proches         0.000138
problemes       0.000119
elus            0.000113
terrain         0.000092
associations    0.000051
citoyens        0.000048
deputes         0.000038
maires          0.000036
Name: locaux, dtype: float32

republique


republique      0.000703
president       0.000378
universel       0.000223
suffrage        0.000208
france          0.000149
francais        0.000136
gouvernement    0.000123
elu             0.000097
democratie      0.000084
pouvoir         0.000070
Name: republique, dtype: float32

vote


vote          0.000727
elections     0.000199
lois          0.000189
election      0.000165
compte        0.000163
majorite      0.000154
democratie    0.000099
faut          0.000097
non           0.000087
faire         0.000082
Name: vote, dtype: float32

proximite


proximite    0.000746
maire        0.000078
terrain      0.000073
maires       0.000062
elu          0.000061
depute       0.000042
citoyens     0.000038
elus         0.000037
deputes      0.000030
habitants         NaN
Name: proximite, dtype: float32

peuple


peuple           0.000776
francais         0.000134
faut             0.000129
democratie       0.000121
representants    0.000111
pouvoir          0.000109
representer      0.000098
non              0.000092
faire            0.000083
tout             0.000075
Name: peuple, dtype: float32

tout


tout        0.000800
cas         0.000234
monde       0.000225
temps       0.000224
pays        0.000213
france      0.000204
place       0.000200
faut        0.000180
systeme     0.000157
francais    0.000155
Name: tout, dtype: float32

In [20]:
gc.collect()

147

# Question 2 : En dehors des élus politiques, faut-il donner un rôle plus important aux associations et aux organisations syndicales et professionnelles ?

In [21]:
question_2 = "En dehors des élus politiques, faut-il donner un rôle plus important aux associations et aux organisations syndicales et professionnelles ?"
qu_2,df_qu_2_one_hot,df_cov_2,df_confidence_2,df_lift_2 = compute_similarities(question_2,new_res)

In [22]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_2[i].sort_values(ascending=False).head(10))

oui


oui    19384
non        0
Name: oui, dtype: uint16

non


non    13948
oui        0
Name: non, dtype: uint16

In [23]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_2[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [24]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_2[i].sort_values(ascending=False).head(10))

oui


oui    0.000052
non         NaN
Name: oui, dtype: float32

non


non    0.000072
oui         NaN
Name: non, dtype: float32

In [25]:
gc.collect()

14

# Question 3 :  Si oui, à quel type d'associations ou d'organisations ? Et avec quel rôle ?

In [26]:
question_3 = "Si oui, à quel type d'associations ou d'organisations ? Et avec quel rôle ?"
qu_3,df_qu_3_one_hot,df_cov_3,df_confidence_3,df_lift_3 = compute_similarities(question_3, new_res)

In [27]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_3[i].sort_values(ascending=False).head(10))

associations


associations        8786
syndicats           2549
organisations       1603
role                1456
citoyens            1021
non                  956
syndicales           953
consommateurs        651
faire                648
professionnelles     570
Name: associations, dtype: uint16

syndicats


syndicats         5467
associations      2549
role               791
non                588
salaries           570
organisations      486
faut               446
representatifs     435
citoyens           429
pouvoir            400
Name: syndicats, dtype: uint16

organisations


organisations       3310
syndicales          1776
associations        1603
professionnelles     784
role                 607
syndicats            486
non                  427
citoyens             327
faut                 274
representatives      254
Name: organisations, dtype: uint16

role


role             2710
associations     1456
syndicats         791
organisations     607
consultatif       559
syndicales        361
citoyens          330
important         319
non               277
faut              249
Name: role, dtype: uint16

syndicales


syndicales          2062
organisations       1776
associations         953
professionnelles     438
role                 361
non                  251
salaries             201
citoyens             181
representatives      175
faut                 173
Name: syndicales, dtype: uint16

citoyens


citoyens         1961
associations     1021
syndicats         429
role              330
organisations     327
faire             222
association       211
elus              201
sort              199
non               198
Name: citoyens, dtype: uint16

non


non              1769
associations      956
syndicats         588
organisations     427
but               335
role              277
lucratif          274
syndicales        251
oui               221
citoyens          198
Name: non, dtype: uint16

association


association      1500
associations      277
role              226
citoyens          211
syndicats         209
non               144
organisation      137
consommateurs     125
faire             116
tout              105
Name: association, dtype: uint16

faut


faut             1194
associations      515
syndicats         446
organisations     274
role              249
donner            191
faire             187
pouvoir           175
syndicales        173
non               161
Name: faut, dtype: uint16

faire


faire            1168
associations      648
syndicats         392
organisations     236
remonter          229
citoyens          222
role              220
faut              187
non               156
pouvoir           153
Name: faire, dtype: uint16

professionnelles


professionnelles    1123
organisations        784
associations         570
syndicales           438
syndicats            296
role                 226
non                  135
connaissent            0
adhesion               0
terrain                0
Name: professionnelles, dtype: uint16

pouvoir


pouvoir          1098
associations      535
syndicats         400
organisations     241
role              225
faut              175
citoyens          170
syndicales        154
donner            153
faire             153
Name: pouvoir, dtype: uint16

tous


tous             978
associations     442
syndicats        317
organisations    187
role             180
citoyens         176
non              126
faire            119
faut             116
salaries         114
Name: tous, dtype: uint16

tout


tout             941
associations     437
syndicats        308
organisations    215
role             200
type             134
syndicales       133
faut             126
citoyens         121
faire            118
Name: tout, dtype: uint16

elus


elus             902
associations     458
syndicats        245
organisations    204
citoyens         201
role             197
non              117
faire            112
syndicales       109
faut             105
Name: elus, dtype: uint16

salaries


salaries         900
syndicats        570
associations     349
organisations    247
syndicales       201
entreprises      167
role             155
faut             124
non              121
tous             114
Name: salaries, dtype: uint16

ong


ong              894
associations     353
syndicats        327
role             131
organisations    110
sort               0
conseil            0
remonter           0
important          0
syndicat           0
Name: ong, dtype: uint16

politiques


politiques       853
associations     474
syndicats        312
organisations    222
role             174
non              170
syndicales       149
citoyens         119
elus             102
faut             102
Name: politiques, dtype: uint16

consommateurs


consommateurs    839
associations     651
defense          253
syndicats        235
role             136
association      125
organisations    119
citoyens         114
environnement    108
connaissent        0
Name: consommateurs, dtype: uint16

defense


defense          789
associations     521
consommateurs    253
environnement    224
syndicats        186
droits           161
organisations    144
role             133
citoyens         128
association      104
Name: defense, dtype: uint16

In [28]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_3[i].sort_values(ascending=False).head(10))

associations


associations     1.000000
caritatives      0.871854
reconnues        0.853147
humanitaires     0.828479
locales          0.798805
consommateurs    0.775924
utilite          0.757895
lucratif         0.751613
but              0.740484
citoyennes       0.739224
Name: associations, dtype: float32

syndicats


syndicats         1.000000
representatifs    0.864811
professionnels    0.651214
salaries          0.633333
travailleurs      0.618012
adhesion          0.582031
representent      0.565674
entreprises       0.552672
obligatoire       0.549632
dialogue          0.521595
Name: syndicats, dtype: float32

organisations


organisations       1.000000
syndicales          0.861300
professionnelles    0.698130
representatives     0.534737
adherents           0.322684
representativite    0.312139
condition           0.305851
representent        0.304729
travail             0.304012
important           0.300926
Name: organisations, dtype: float32

role


role            1.000000
consultatif     0.787324
important       0.738426
proposition     0.443804
conseil         0.363218
donner          0.339181
controle        0.332248
decision        0.327485
propositions    0.284330
decisions       0.247278
Name: role, dtype: float32

syndicales


syndicales          1.000000
organisations       0.536556
professionnelles    0.390027
representatives     0.368421
travail             0.225309
salaries            0.223333
entreprises         0.218321
representent        0.208406
oui                 0.191682
organisation        0.190678
Name: syndicales, dtype: float32

citoyens


citoyens        1.000000
sort            0.610429
elus            0.222838
faire           0.190068
vie             0.188841
tous            0.179959
propositions    0.172859
defense         0.162231
pouvoir         0.154827
politique       0.151773
Name: citoyens, dtype: float32

non


non           1.000000
lucratif      0.883871
but           0.579585
oui           0.399638
politique     0.207092
politiques    0.199297
interet       0.177273
faut          0.134841
salaries      0.134444
faire         0.133562
Name: non, dtype: float32

association


association      1.000000
type             0.233410
organisation     0.193503
consommateurs    0.148987
defense          0.131812
tout             0.111583
citoyens         0.107598
faire            0.099315
role             0.083395
non              0.081402
Name: association, dtype: float32

faut


faut          1.000000
donner        0.279240
faire         0.160103
pouvoir       0.159381
exemple       0.153274
salaries      0.137778
tout          0.133900
politiques    0.119578
tous          0.118609
elus          0.116408
Name: faut, dtype: float32

faire


faire           1.000000
remonter        0.665698
propositions    0.221325
politique       0.157447
faut            0.156616
exemple         0.150298
pouvoir         0.139344
terrain         0.136774
tout            0.125399
elus            0.124169
Name: faire, dtype: float32

professionnelles


professionnelles    1.000000
organisations       0.236858
syndicales          0.212415
role                0.083395
non                 0.076314
associations        0.064876
syndicats           0.054143
protection          0.000000
terrain             0.000000
domaine             0.000000
Name: professionnelles, dtype: float32

pouvoir


pouvoir        1.000000
donner         0.223684
devraient      0.188563
entreprises    0.160305
faut           0.146566
faire          0.130993
elus           0.114191
tout           0.110521
citoyens       0.086690
role           0.083026
Name: pouvoir, dtype: float32

tous


tous             1.000000
salaries         0.126667
faire            0.101884
faut             0.097152
citoyens         0.089750
non              0.071227
role             0.066421
syndicats        0.057984
organisations    0.056495
syndicales       0.052376
Name: tous, dtype: float32

tout


tout             1.000000
type             0.306636
faut             0.105528
faire            0.101027
pouvoir          0.094718
role             0.073801
association      0.070000
non              0.066139
organisations    0.064955
syndicales       0.064500
Name: tout, dtype: float32

elus


elus             1.000000
politiques       0.119578
citoyens         0.102499
faire            0.095890
pouvoir          0.093807
faut             0.087940
role             0.072694
non              0.066139
organisations    0.061631
syndicales       0.052861
Name: elus, dtype: float32

salaries


salaries         1.000000
entreprise       0.276650
entreprises      0.254962
obligatoire      0.187500
syndicat         0.130937
tous             0.116564
syndicats        0.104262
faut             0.103853
syndicales       0.097478
organisations    0.074622
Name: salaries, dtype: float32

ong


ong              1.000000
syndicats        0.059813
role             0.048339
associations     0.040178
organisations    0.033233
sort             0.000000
conseil          0.000000
remonter         0.000000
important        0.000000
syndicat         0.000000
Name: ong, dtype: float32

politiques


politiques       1.000000
elus             0.113082
non              0.096099
faut             0.085427
syndicales       0.072260
organisations    0.067069
role             0.064207
citoyens         0.060683
syndicats        0.057070
associations     0.053949
Name: politiques, dtype: float32

consommateurs


consommateurs    1.000000
defense          0.320659
environnement    0.173355
association      0.083333
associations     0.074095
citoyens         0.058134
role             0.050185
syndicats        0.042985
organisations    0.035952
propositions     0.000000
Name: consommateurs, dtype: float32

defense


defense          1.000000
environnement    0.359551
droits           0.356984
consommateurs    0.301549
association      0.069333
citoyens         0.065273
associations     0.059299
role             0.049077
organisations    0.043505
syndicats        0.034022
Name: defense, dtype: float32

In [29]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_3[i].sort_values(ascending=False).head(10))

associations


associations     0.000114
caritatives      0.000099
reconnues        0.000097
humanitaires     0.000094
locales          0.000091
consommateurs    0.000088
utilite          0.000086
lucratif         0.000086
but              0.000084
citoyennes       0.000084
Name: associations, dtype: float32

syndicats


syndicats         0.000183
representatifs    0.000158
professionnels    0.000119
salaries          0.000116
travailleurs      0.000113
adhesion          0.000106
representent      0.000103
entreprises       0.000101
obligatoire       0.000101
dialogue          0.000095
Name: syndicats, dtype: float32

organisations


organisations       0.000302
syndicales          0.000260
professionnelles    0.000211
representatives     0.000162
adherents           0.000097
representativite    0.000094
condition           0.000092
representent        0.000092
travail             0.000092
important           0.000091
Name: organisations, dtype: float32

role


role            0.000369
consultatif     0.000291
important       0.000272
proposition     0.000164
conseil         0.000134
donner          0.000125
controle        0.000123
decision        0.000121
propositions    0.000105
decisions       0.000091
Name: role, dtype: float32

syndicales


syndicales          0.000485
organisations       0.000260
professionnelles    0.000189
representatives     0.000179
travail             0.000109
salaries            0.000108
entreprises         0.000106
representent        0.000101
oui                 0.000093
organisation        0.000092
Name: syndicales, dtype: float32

citoyens


citoyens        0.000510
sort            0.000311
elus            0.000114
faire           0.000097
vie             0.000096
tous            0.000092
propositions    0.000088
defense         0.000083
pouvoir         0.000079
politique       0.000077
Name: citoyens, dtype: float32

non


non           0.000565
lucratif      0.000500
but           0.000328
oui           0.000226
politique     0.000117
politiques    0.000113
interet       0.000100
faut          0.000076
salaries      0.000076
faire         0.000076
Name: non, dtype: float32

association


association      0.000667
type             0.000156
organisation     0.000129
consommateurs    0.000099
defense          0.000088
tout             0.000074
citoyens         0.000072
faire            0.000066
role             0.000056
non              0.000054
Name: association, dtype: float32

faut


faut          0.000838
donner        0.000234
faire         0.000134
pouvoir       0.000133
exemple       0.000128
salaries      0.000115
tout          0.000112
politiques    0.000100
tous          0.000099
elus          0.000097
Name: faut, dtype: float32

faire


faire           0.000856
remonter        0.000570
propositions    0.000189
politique       0.000135
faut            0.000134
exemple         0.000129
pouvoir         0.000119
terrain         0.000117
tout            0.000107
elus            0.000106
Name: faire, dtype: float32

professionnelles


professionnelles    0.000890
organisations       0.000211
syndicales          0.000189
role                0.000074
non                 0.000068
associations        0.000058
syndicats           0.000048
caritatives              NaN
representatifs           NaN
sujets                   NaN
Name: professionnelles, dtype: float32

pouvoir


pouvoir        0.000911
donner         0.000204
devraient      0.000172
entreprises    0.000146
faut           0.000133
faire          0.000119
elus           0.000104
tout           0.000101
citoyens       0.000079
role           0.000076
Name: pouvoir, dtype: float32

tous


tous             0.001022
salaries         0.000130
faire            0.000104
faut             0.000099
citoyens         0.000092
non              0.000073
role             0.000068
syndicats        0.000059
organisations    0.000058
syndicales       0.000054
Name: tous, dtype: float32

tout


tout             0.001063
type             0.000326
faut             0.000112
faire            0.000107
pouvoir          0.000101
role             0.000078
association      0.000074
non              0.000070
organisations    0.000069
syndicales       0.000069
Name: tout, dtype: float32

elus


elus             0.001109
politiques       0.000133
citoyens         0.000114
faire            0.000106
pouvoir          0.000104
faut             0.000097
role             0.000081
non              0.000073
organisations    0.000068
syndicales       0.000059
Name: elus, dtype: float32

salaries


salaries         0.001111
entreprise       0.000307
entreprises      0.000283
obligatoire      0.000208
syndicat         0.000145
tous             0.000130
syndicats        0.000116
faut             0.000115
syndicales       0.000108
organisations    0.000083
Name: salaries, dtype: float32

ong


ong               0.001119
syndicats         0.000067
role              0.000054
associations      0.000045
organisations     0.000037
caritatives            NaN
representatifs         NaN
sujets                 NaN
citoyens               NaN
coeur                  NaN
Name: ong, dtype: float32

politiques


politiques       0.001172
elus             0.000133
non              0.000113
faut             0.000100
syndicales       0.000085
organisations    0.000079
role             0.000075
citoyens         0.000071
syndicats        0.000067
associations     0.000063
Name: politiques, dtype: float32

consommateurs


consommateurs    0.001192
defense          0.000382
environnement    0.000207
association      0.000099
associations     0.000088
citoyens         0.000069
role             0.000060
syndicats        0.000051
organisations    0.000043
caritatives           NaN
Name: consommateurs, dtype: float32

defense


defense          0.001267
environnement    0.000456
droits           0.000452
consommateurs    0.000382
association      0.000088
citoyens         0.000083
associations     0.000075
role             0.000062
organisations    0.000055
syndicats        0.000043
Name: defense, dtype: float32

In [30]:
gc.collect()

147

# Question 4 :  Que faudrait-il faire pour renouer le lien entre les citoyens et les élus qui les représentent ?

In [31]:
question_4 = "Que faudrait-il faire pour renouer le lien entre les citoyens et les élus qui les représentent ?"
qu_4,df_qu_4_one_hot,df_cov_4,df_confidence_4,df_lift_4 = compute_similarities(question_4, new_res)

In [32]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_4[i].sort_values(ascending=False).head(10))

elus


elus         11882
citoyens      3704
faire         1627
tous          1495
non           1447
politique     1282
vie           1266
tout          1215
faut          1188
elu           1152
Name: elus, dtype: uint16

citoyens


citoyens     7054
elus         3704
faire        1231
tous          932
non           851
politique     846
faut          811
tout          742
elu           738
vie           714
Name: citoyens, dtype: uint16

faire


faire        3612
elus         1627
citoyens     1231
politique     658
tous          581
tout          573
faut          536
non           529
elu           521
vie           431
Name: faire, dtype: uint16

tous


tous         2836
elus         1495
citoyens      932
faire         581
tout          476
non           470
politique     460
vie           436
faut          431
deputes       424
Name: tous, dtype: uint16

non


non          2723
elus         1447
citoyens      851
faire         529
politique     527
tous          470
elu           443
mandats       439
tout          409
mandat        398
Name: non, dtype: uint16

politique


politique    2651
elus         1282
citoyens      846
faire         658
vie           614
non           527
tout          474
tous          460
faut          451
elu           441
Name: politique, dtype: uint16

elu


elu          2511
elus         1152
citoyens      738
mandat        528
faire         521
tout          491
non           443
politique     441
tous          415
vie           379
Name: elu, dtype: uint16

tout


tout         2390
elus         1215
citoyens      742
faire         573
elu           491
tous          476
politique     474
faut          415
non           409
vie           392
Name: tout, dtype: uint16

deputes


deputes      2352
elus         1013
citoyens      699
senateurs     683
assemblee     504
faire         424
tous          424
nombre        339
mandat        337
non           337
Name: deputes, dtype: uint16

vie


vie          2317
elus         1266
citoyens      714
politique     614
tous          436
faire         431
tout          392
elu           379
mandat        356
non           328
Name: vie, dtype: uint16

mandat


mandat       2202
elus         1149
citoyens      556
elu           528
politique     414
non           398
faire         389
tout          386
tous          367
vie           356
Name: mandat, dtype: uint16

faut


faut         2159
elus         1188
citoyens      811
faire         536
politique     451
tous          431
tout          415
non           386
elu           374
pouvoir       308
Name: faut, dtype: uint16

vote


vote           2027
elus            756
citoyens        613
obligatoire     516
blanc           473
elu             351
non             348
faire           333
compte          326
tous            320
Name: vote, dtype: uint16

transparence


transparence    1971
elus             796
citoyens         377
tous             239
faire            220
depenses         218
elu              209
vie              190
tout             189
politique        187
Name: transparence, dtype: uint16

pouvoir


pouvoir      1897
elus          948
citoyens      631
faire         401
tous          343
politique     341
elu           330
non           322
tout          322
faut          308
Name: pouvoir, dtype: uint16

compte


compte      1781
elus         838
citoyens     608
vote         326
faire        293
prendre      276
tous         269
elu          253
mandat       228
prise        210
Name: compte, dtype: uint16

exemple


exemple      1706
elus          877
citoyens      595
faire         392
tous          336
tout          303
elu           295
politique     277
faut          275
non           272
Name: exemple, dtype: uint16

mandats


mandats      1652
elus          833
cumul         602
limiter       465
non           439
nombre        423
2             384
politique     362
mandat        348
citoyens      326
Name: mandats, dtype: uint16

politiques


politiques    1649
elus           685
citoyens       549
politique      393
faire          344
tous           325
non            314
tout           270
vie            268
faut           255
Name: politiques, dtype: uint16

assemblee


assemblee    1634
nationale     752
elus          743
citoyens      561
deputes       504
senat         398
faire         319
vote          295
tous          289
non           271
Name: assemblee, dtype: uint16

In [33]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_4[i].sort_values(ascending=False).head(10))

elus


elus            1.000000
exemplaires     0.818182
respectent      0.802920
rendent         0.748503
representent    0.745938
ecoutent        0.743494
devraient       0.715385
fassent         0.703791
frais           0.684669
nationaux       0.682741
Name: elus, dtype: float32

citoyens


citoyens        1.000000
tires           0.819106
sort            0.636455
participer      0.627219
puissent        0.553444
pourraient      0.544803
democratique    0.507463
consulter       0.501567
tirage          0.490741
avis            0.490272
Name: citoyens, dtype: float32

faire


faire           1.000000
sorte           0.742297
participer      0.437870
choses          0.417323
passer          0.360465
carriere        0.335664
metier          0.334171
comprendre      0.316883
propositions    0.310463
vivre           0.300578
Name: faire, dtype: float32

tous


tous              1.000000
niveaux           0.666667
6                 0.424125
ans               0.375130
mois              0.354086
ministres         0.351351
5                 0.348730
droits            0.328076
fonctionnaires    0.319261
suppression       0.313433
Name: tous, dtype: float32

non


non         1.000000
cumul       0.400229
parti       0.328358
service     0.316629
interets    0.298077
interet     0.277354
general     0.269231
mandats     0.265738
respect     0.244141
fonction    0.240642
Name: non, dtype: float32

politique


politique         1.000000
classe            0.608696
metier            0.560301
carriere          0.540793
professionnels    0.520767
parti             0.374793
eviter            0.282714
partie            0.270089
vie               0.264998
jamais            0.264108
Name: politique, dtype: float32

elu


elu             1.000000
programme       0.300000
judiciaire      0.296610
casier          0.281513
aucun           0.278646
vierge          0.277635
fonction        0.274866
metier          0.273869
representant    0.273563
representer     0.265442
Name: elu, dtype: float32

tout


tout            1.000000
monde           0.487627
simplement      0.486989
interdire       0.259169
systeme         0.246269
representant    0.245977
pays            0.244496
france          0.242091
retraite        0.241252
frais           0.240418
Name: tout, dtype: float32

deputes


deputes            1.000000
senateurs          0.855890
ministres          0.437838
presidents         0.417293
circonscription    0.406114
maires             0.392132
senat              0.321871
assemblee          0.308446
presents           0.303665
president          0.297436
Name: deputes, dtype: float32

vie


vie               1.000000
vraie             0.416918
publique          0.334906
fonctionnaires    0.298153
retraite          0.268877
metier            0.256281
realite           0.252723
judiciaire        0.241525
casier            0.237395
politique         0.231611
Name: vie, dtype: float32

mandat


mandat          1.000000
duree           0.434911
fin             0.395270
cours           0.379747
5               0.357968
4               0.351724
legislatives    0.338816
ans             0.321244
cumul           0.291284
1               0.288732
Name: mandat, dtype: float32

faut


faut            1.000000
renouer         0.325153
france          0.236589
pays            0.225956
lien            0.221878
majorite        0.213311
monde           0.209607
gouvernement    0.207418
sens            0.203125
francais        0.199048
Name: faut, dtype: float32

vote


vote           1.000000
blanc          0.863139
obligatoire    0.596532
candidats      0.392857
voter          0.300836
votes          0.260163
5              0.258660
election       0.250758
loi            0.242461
majorite       0.242321
Name: vote, dtype: float32

transparence


transparence    1.000000
totale          0.630508
depenses        0.316401
honnetete       0.282967
frais           0.229965
exemplarite     0.209139
controle        0.195612
actions         0.167251
avantages       0.140366
confiance       0.125203
Name: transparence, dtype: float32

pouvoir


pouvoir       1.000000
donner        0.231518
controle      0.199269
republique    0.198007
devraient     0.192308
president     0.191795
majorite      0.184300
loi           0.183353
cas           0.182353
france        0.181568
Name: pouvoir, dtype: float32

compte


compte           1.000000
rendent          0.562874
prise            0.503597
blanc            0.339416
prendre          0.271120
action           0.268836
avis             0.228275
regulierement    0.226562
votes            0.205962
actions          0.204678
Name: compte, dtype: float32

exemple


exemple      1.000000
frais        0.193380
retraite     0.191529
1            0.181690
3            0.172414
pays         0.169177
grand        0.168869
president    0.166154
public       0.160436
2            0.157303
Name: exemple, dtype: float32

mandats


mandats       1.000000
cumul         0.690367
limiter       0.622490
maximum       0.461818
duree         0.411243
2             0.359551
interdire     0.327628
nombre        0.295391
metier        0.258794
indemnites    0.253968
Name: mandats, dtype: float32

politiques


politiques    1.000000
hommes        0.701439
partis        0.455036
france        0.162311
politique     0.148246
ans           0.144041
pays          0.141367
francais      0.141158
cas           0.130392
place         0.124598
Name: politiques, dtype: float32

assemblee


assemblee          1.000000
nationale          0.743818
senat              0.547455
presence           0.307914
tires              0.274390
presents           0.269634
sort               0.236657
proportionnelle    0.229860
3                  0.218891
citoyenne          0.217391
Name: assemblee, dtype: float32

In [34]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_4[i].sort_values(ascending=False).head(10))

elus


elus            0.000084
exemplaires     0.000069
respectent      0.000068
rendent         0.000063
representent    0.000063
ecoutent        0.000063
devraient       0.000060
fassent         0.000059
frais           0.000058
nationaux       0.000057
Name: elus, dtype: float32

citoyens


citoyens        0.000142
tires           0.000116
sort            0.000090
participer      0.000089
puissent        0.000078
pourraient      0.000077
democratique    0.000072
consulter       0.000071
tirage          0.000070
avis            0.000070
Name: citoyens, dtype: float32

faire


faire           0.000277
sorte           0.000206
participer      0.000121
choses          0.000116
passer          0.000100
carriere        0.000093
metier          0.000093
comprendre      0.000088
propositions    0.000086
vivre           0.000083
Name: faire, dtype: float32

tous


tous              0.000353
niveaux           0.000235
6                 0.000150
ans               0.000132
mois              0.000125
ministres         0.000124
5                 0.000123
droits            0.000116
fonctionnaires    0.000113
suppression       0.000111
Name: tous, dtype: float32

non


non         0.000367
cumul       0.000147
parti       0.000121
service     0.000116
interets    0.000109
interet     0.000102
general     0.000099
mandats     0.000098
respect     0.000090
fonction    0.000088
Name: non, dtype: float32

politique


politique         0.000377
classe            0.000230
metier            0.000211
carriere          0.000204
professionnels    0.000196
parti             0.000141
eviter            0.000107
partie            0.000102
vie               0.000100
jamais            0.000100
Name: politique, dtype: float32

elu


elu             0.000398
programme       0.000119
judiciaire      0.000118
casier          0.000112
aucun           0.000111
vierge          0.000111
fonction        0.000109
metier          0.000109
representant    0.000109
representer     0.000106
Name: elu, dtype: float32

tout


tout            0.000418
monde           0.000204
simplement      0.000204
interdire       0.000108
systeme         0.000103
representant    0.000103
pays            0.000102
france          0.000101
retraite        0.000101
frais           0.000101
Name: tout, dtype: float32

deputes


deputes            0.000425
senateurs          0.000364
ministres          0.000186
presidents         0.000177
circonscription    0.000173
maires             0.000167
senat              0.000137
assemblee          0.000131
presents           0.000129
president          0.000126
Name: deputes, dtype: float32

vie


vie               0.000432
vraie             0.000180
publique          0.000145
fonctionnaires    0.000129
retraite          0.000116
metier            0.000111
realite           0.000109
judiciaire        0.000104
casier            0.000102
politique         0.000100
Name: vie, dtype: float32

mandat


mandat          0.000454
duree           0.000198
fin             0.000180
cours           0.000172
5               0.000163
4               0.000160
legislatives    0.000154
ans             0.000146
cumul           0.000132
1               0.000131
Name: mandat, dtype: float32

faut


faut            0.000463
renouer         0.000151
france          0.000110
pays            0.000105
lien            0.000103
majorite        0.000099
monde           0.000097
gouvernement    0.000096
sens            0.000094
francais        0.000092
Name: faut, dtype: float32

vote


vote           0.000493
blanc          0.000426
obligatoire    0.000294
candidats      0.000194
voter          0.000148
votes          0.000128
5              0.000128
election       0.000124
loi            0.000120
majorite       0.000120
Name: vote, dtype: float32

transparence


transparence    0.000507
totale          0.000320
depenses        0.000161
honnetete       0.000144
frais           0.000117
exemplarite     0.000106
controle        0.000099
actions         0.000085
avantages       0.000071
confiance       0.000064
Name: transparence, dtype: float32

pouvoir


pouvoir       0.000527
donner        0.000122
controle      0.000105
republique    0.000104
devraient     0.000101
president     0.000101
majorite      0.000097
loi           0.000097
cas           0.000096
france        0.000096
Name: pouvoir, dtype: float32

compte


compte           0.000561
rendent          0.000316
prise            0.000283
blanc            0.000191
prendre          0.000152
action           0.000151
avis             0.000128
regulierement    0.000127
votes            0.000116
actions          0.000115
Name: compte, dtype: float32

exemple


exemple      0.000586
frais        0.000113
retraite     0.000112
1            0.000107
3            0.000101
pays         0.000099
grand        0.000099
president    0.000097
public       0.000094
2            0.000092
Name: exemple, dtype: float32

mandats


mandats       0.000605
cumul         0.000418
limiter       0.000377
maximum       0.000280
duree         0.000249
2             0.000218
interdire     0.000198
nombre        0.000179
metier        0.000157
indemnites    0.000154
Name: mandats, dtype: float32

politiques


politiques    0.000606
hommes        0.000425
partis        0.000276
france        0.000098
politique     0.000090
ans           0.000087
pays          0.000086
francais      0.000086
cas           0.000079
place         0.000076
Name: politiques, dtype: float32

assemblee


assemblee          0.000612
nationale          0.000455
senat              0.000335
presence           0.000188
tires              0.000168
presents           0.000165
sort               0.000145
proportionnelle    0.000141
3                  0.000134
citoyenne          0.000133
Name: assemblee, dtype: float32

In [35]:
gc.collect()

105

# Question 5 :   Le non-cumul des mandats instauré en 2017 pour les parlementaires (députés et sénateurs) est :

In [36]:
question_5 = "Le non-cumul des mandats instauré en 2017 pour les parlementaires (députés et sénateurs) est :"
qu_5,df_qu_5_one_hot,df_cov_5,df_confidence_5,df_lift_5 = compute_similarities(question_5, new_res)

In [37]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_5[i].sort_values(ascending=False).head(10))

chose


chose       30760
bonne       25881
mauvaise     4879
sais            0
Name: chose, dtype: uint16

bonne


bonne       25881
chose       25881
sais            0
mauvaise        0
Name: bonne, dtype: uint16

mauvaise


chose       4879
mauvaise    4879
sais           0
bonne          0
Name: mauvaise, dtype: uint16

sais


sais        3528
bonne          0
chose          0
mauvaise       0
Name: sais, dtype: uint16

In [38]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_5[i].sort_values(ascending=False).head(10))

chose


bonne       1.0
chose       1.0
mauvaise    1.0
sais        0.0
Name: chose, dtype: float32

bonne


bonne       1.000000
chose       0.841385
sais        0.000000
mauvaise    0.000000
Name: bonne, dtype: float32

mauvaise


mauvaise    1.000000
chose       0.158615
sais        0.000000
bonne       0.000000
Name: mauvaise, dtype: float32

sais


sais        1.0
bonne       0.0
chose       0.0
mauvaise    0.0
Name: sais, dtype: float32

In [39]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_5[i].sort_values(ascending=False).head(10))

chose


bonne       0.000033
chose       0.000033
mauvaise    0.000033
sais             NaN
Name: chose, dtype: float32

bonne


bonne       0.000039
chose       0.000033
mauvaise         NaN
sais             NaN
Name: bonne, dtype: float32

mauvaise


mauvaise    0.000205
chose       0.000033
bonne            NaN
sais             NaN
Name: mauvaise, dtype: float32

sais


sais        0.000283
mauvaise         NaN
chose            NaN
bonne            NaN
Name: sais, dtype: float32

In [40]:
gc.collect()

182

# Question 6 :   Pourquoi ?

In [41]:
question_6 = "Pourquoi ?"
qu_6,df_qu_6_one_hot,df_cov_6,df_confidence_6,df_lift_6 = compute_similarities(question_6, new_res)

In [42]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_6[i].sort_values(ascending=False).head(10))

mandat


mandat     4531
temps      1023
elu         974
cumul       967
mandats     824
elus        803
local       729
depute      629
maire       605
faut        585
Name: mandat, dtype: uint16

cumul


cumul      4512
mandats    1971
non        1573
mandat      967
elus        909
maire       858
temps       789
depute      774
faut        683
elu         614
Name: cumul, dtype: uint16

mandats


mandats    4363
cumul      1971
elus        933
temps       911
non         876
mandat      824
faut        669
elu         659
2           629
maire       618
Name: mandats, dtype: uint16

elus


elus        4349
mandats      933
cumul        909
mandat       803
temps        674
non          613
faut         587
terrain      509
faire        488
citoyens     459
Name: elus, dtype: uint16

temps


temps      4279
mandat     1023
mandats     911
travail     883
faire       854
cumul       789
elus        674
depute      643
elu         627
faut        556
Name: temps, dtype: uint16

faire


faire        3384
temps         854
travail       815
mandats       573
mandat        548
cumul         537
faut          507
elus          488
tout          478
politique     450
Name: faire, dtype: uint16

depute


depute      3112
maire       2103
senateur     947
cumul        774
temps        643
mandat       629
mandats      606
terrain      528
faire        435
elu          417
Name: depute, dtype: uint16

elu


elu          3100
mandat        974
mandats       659
temps         627
cumul         614
faire         443
elus          439
depute        417
travail       400
consacrer     395
Name: elu, dtype: uint16

faut


faut         2929
cumul         683
mandats       669
elus          587
mandat        585
temps         556
faire         507
politique     428
non           392
elu           378
Name: faut, dtype: uint16

politique


politique    2905
metier        551
mandats       550
vie           521
cumul         494
elus          453
faire         450
mandat        433
faut          428
non           403
Name: politique, dtype: uint16

maire


maire       2902
depute      2103
cumul        858
senateur     655
mandats      618
mandat       605
temps        503
terrain      499
deputes      388
elus         387
Name: maire, dtype: uint16

travail


travail         2483
temps            883
faire            815
mandat           512
mandats          430
elu              400
cumul            389
elus             385
depute           362
correctement     308
Name: travail, dtype: uint16

non


non          2478
cumul        1573
mandats       876
elus          613
mandat        541
temps         504
politique     403
faut          392
elu           377
depute        351
Name: non, dtype: uint16

terrain


terrain    2062
depute      528
elus        509
maire       499
cumul       462
deputes     394
mandat      344
mandats     314
temps       266
faut        253
Name: terrain, dtype: uint16

deputes


deputes      1986
senateurs     665
cumul         416
maires        415
terrain       394
elus          389
maire         388
mandats       366
mandat        313
depute        305
Name: deputes, dtype: uint16

citoyens


citoyens    1687
elus         459
cumul        373
mandats      318
depute       310
mandat       306
maire        287
temps        272
elu          248
deputes      244
Name: citoyens, dtype: uint16

pouvoir


pouvoir      1600
mandats       320
mandat        308
cumul         301
elus          299
elu           270
maire         235
temps         234
depute        232
politique     211
Name: pouvoir, dtype: uint16

tout


tout       1549
faire       478
temps       370
cumul       346
mandats     327
mandat      299
elus        274
faut        246
elu         238
depute      233
Name: tout, dtype: uint16

consacrer


consacrer     1535
mandat         541
temps          487
elu            395
pleinement     343
tache          289
elus           268
mandats        209
mission        199
cumul          175
Name: consacrer, dtype: uint16

chose


chose      1461
bonne       912
cumul       397
mandats     297
faire       289
maire       268
depute      264
elus        249
temps       238
non         236
Name: chose, dtype: uint16

In [43]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_6[i].sort_values(ascending=False).head(10))

mandat


mandat        1.000000
local         0.521459
national      0.509044
1             0.398876
municipal     0.393502
exercer       0.391858
conseiller    0.367978
consacrer     0.352443
pleinement    0.334591
elu           0.314194
Name: mandat, dtype: float32

cumul


cumul            1.000000
remunerations    0.660714
non              0.634786
indemnites       0.576531
retraites        0.571970
remuneration     0.516216
probleme         0.496894
mandats          0.451753
salaires         0.444005
revenus          0.405316
Name: cumul, dtype: float32

mandats


mandats         1.000000
maximum         0.572414
3               0.568365
2               0.561607
limiter         0.534332
nombre          0.476440
cumul           0.436835
ans             0.393491
remuneration    0.389189
faudrait        0.373580
Name: mandats, dtype: float32

elus


elus              1.000000
nationaux         0.760000
locaux            0.518851
deconnectes       0.368966
devraient         0.340694
realites          0.328395
nombre            0.314136
permettre         0.288927
citoyens          0.272081
renouvellement    0.271484
Name: elus, dtype: float32

temps


temps         1.000000
emploi        0.471223
emplois       0.466667
demande       0.430657
activite      0.427007
occuper       0.395349
3             0.364611
travail       0.355618
exercer       0.340967
travailler    0.326019
Name: temps, dtype: float32

faire


faire           1.000000
remonter        0.710317
choses          0.655971
veut            0.417553
correctement    0.401961
travail         0.328232
tout            0.308586
mal             0.288828
carriere        0.276405
2               0.202679
Name: faire, dtype: float32

depute


depute             1.000000
senateur           0.895085
maire              0.724673
ville              0.541787
conseiller         0.530899
commune            0.484407
municipal          0.469314
remonter           0.452381
exemple            0.413793
circonscription    0.408060
Name: depute, dtype: float32

elu


elu           1.000000
national      0.299742
local         0.257511
consacrer     0.257329
pleinement    0.244025
electeurs     0.237443
mission       0.231006
tache         0.224886
100           0.220557
mandat        0.214964
Name: elu, dtype: float32

faut


faut              1.000000
aller             0.490141
loin              0.380220
limiter           0.310861
nombre            0.229319
professionnels    0.220374
place             0.216216
cas               0.199643
tous              0.195391
indemnites        0.177296
Name: faut, dtype: float32

politique


politique               1.000000
classe                  0.935154
professionnels          0.661123
carriere                0.656180
personnel               0.610942
metier                  0.537037
professionnalisation    0.532872
renouveler              0.459547
renouvellement          0.392578
vie                     0.376173
Name: politique, dtype: float32

maire


maire         1.000000
depute        0.675771
ville         0.668588
conseiller    0.651685
commune       0.621622
senateur      0.619093
president     0.592255
municipal     0.462094
exemple       0.443350
remonter      0.432540
Name: maire, dtype: float32

travail


travail          1.000000
charge           0.458204
correctement     0.301961
veut             0.295213
parlementaire    0.250844
faire            0.240839
temps            0.206357
cumuler          0.175479
assemblee        0.172996
senateur         0.142722
Name: travail, dtype: float32

non


non              1.000000
cumul            0.348626
indemnites       0.210459
remunerations    0.204365
mandats          0.200779
faudrait         0.197443
interet          0.193309
bonne            0.189492
exemple          0.185550
nombre           0.184293
Name: non, dtype: float32

terrain


terrain         1.000000
connaissance    0.524528
realites        0.429630
realite         0.388385
contact         0.382677
deconnectes     0.355172
lien            0.228519
deputes         0.198389
maires          0.191304
senateurs       0.183777
Name: terrain, dtype: float32

deputes


deputes            1.000000
senateurs          0.842839
maires             0.515528
sol                0.363636
circonscription    0.274559
lois               0.271820
assemblee          0.233474
locaux             0.206463
terrain            0.191077
realite            0.188748
Name: deputes, dtype: float32

citoyens


citoyens          1.000000
contact           0.177953
vie               0.132130
maires            0.131677
deputes           0.122860
nombre            0.106806
parlementaires    0.105677
elus              0.105542
senateur          0.103970
tous              0.102204
Name: citoyens, dtype: float32

pouvoir


pouvoir      1.000000
consacrer    0.110749
cumuler      0.103448
elu          0.087097
eviter       0.086801
local        0.084406
maire        0.080979
citoyens     0.078838
non          0.077078
depute       0.074550
Name: pouvoir, dtype: float32

tout


tout       1.000000
monde      0.384615
faire      0.141253
cumuler    0.094253
temps      0.086469
faut       0.083988
elu        0.076774
cumul      0.076684
travail    0.076520
mandats    0.074948
Name: tout, dtype: float32

consacrer


consacrer     1.000000
pleinement    0.431447
tache         0.329909
mission       0.204312
elu           0.127419
mandat        0.119400
fonction      0.116230
temps         0.113812
mieux         0.111328
pouvoir       0.106250
Name: consacrer, dtype: float32

chose


chose       1.000000
bonne       0.785530
mauvaise    0.750929
non         0.095238
maire       0.092350
deputes     0.092145
cumul       0.087988
faire       0.085402
depute      0.084833
terrain     0.077110
Name: chose, dtype: float32

In [44]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_6[i].sort_values(ascending=False).head(10))

mandat


mandat        0.000221
local         0.000115
national      0.000112
1             0.000088
municipal     0.000087
exercer       0.000086
conseiller    0.000081
consacrer     0.000078
pleinement    0.000074
elu           0.000069
Name: mandat, dtype: float32

cumul


cumul            0.000222
remunerations    0.000146
non              0.000141
indemnites       0.000128
retraites        0.000127
remuneration     0.000114
probleme         0.000110
mandats          0.000100
salaires         0.000098
revenus          0.000090
Name: cumul, dtype: float32

mandats


mandats         0.000229
maximum         0.000131
3               0.000130
2               0.000129
limiter         0.000122
nombre          0.000109
cumul           0.000100
ans             0.000090
remuneration    0.000089
faudrait        0.000086
Name: mandats, dtype: float32

elus


elus              0.000230
nationaux         0.000175
locaux            0.000119
deconnectes       0.000085
devraient         0.000078
realites          0.000076
nombre            0.000072
permettre         0.000066
citoyens          0.000063
renouvellement    0.000062
Name: elus, dtype: float32

temps


temps         0.000234
emploi        0.000110
emplois       0.000109
demande       0.000101
activite      0.000100
occuper       0.000092
3             0.000085
travail       0.000083
exercer       0.000080
travailler    0.000076
Name: temps, dtype: float32

faire


faire           0.000296
remonter        0.000210
choses          0.000194
veut            0.000123
correctement    0.000119
travail         0.000097
tout            0.000091
mal             0.000085
carriere        0.000082
2               0.000060
Name: faire, dtype: float32

depute


depute             0.000321
senateur           0.000288
maire              0.000233
ville              0.000174
conseiller         0.000171
commune            0.000156
municipal          0.000151
remonter           0.000145
exemple            0.000133
circonscription    0.000131
Name: depute, dtype: float32

elu


elu           0.000323
national      0.000097
local         0.000083
consacrer     0.000083
pleinement    0.000079
electeurs     0.000077
mission       0.000075
tache         0.000073
100           0.000071
mandat        0.000069
Name: elu, dtype: float32

faut


faut              0.000341
aller             0.000167
loin              0.000130
limiter           0.000106
nombre            0.000078
professionnels    0.000075
place             0.000074
cas               0.000068
tous              0.000067
indemnites        0.000061
Name: faut, dtype: float32

politique


politique               0.000344
classe                  0.000322
professionnels          0.000228
carriere                0.000226
personnel               0.000210
metier                  0.000185
professionnalisation    0.000183
renouveler              0.000158
renouvellement          0.000135
vie                     0.000129
Name: politique, dtype: float32

maire


maire         0.000345
depute        0.000233
ville         0.000230
conseiller    0.000225
commune       0.000214
senateur      0.000213
president     0.000204
municipal     0.000159
exemple       0.000153
remonter      0.000149
Name: maire, dtype: float32

travail


travail          0.000403
charge           0.000185
correctement     0.000122
veut             0.000119
parlementaire    0.000101
faire            0.000097
temps            0.000083
cumuler          0.000071
assemblee        0.000070
senateur         0.000057
Name: travail, dtype: float32

non


non              0.000404
cumul            0.000141
indemnites       0.000085
remunerations    0.000082
mandats          0.000081
faudrait         0.000080
interet          0.000078
bonne            0.000076
exemple          0.000075
nombre           0.000074
Name: non, dtype: float32

terrain


terrain         0.000485
connaissance    0.000254
realites        0.000208
realite         0.000188
contact         0.000186
deconnectes     0.000172
lien            0.000111
deputes         0.000096
maires          0.000093
senateurs       0.000089
Name: terrain, dtype: float32

deputes


deputes            0.000504
senateurs          0.000424
maires             0.000260
sol                0.000183
circonscription    0.000138
lois               0.000137
assemblee          0.000118
locaux             0.000104
terrain            0.000096
realite            0.000095
Name: deputes, dtype: float32

citoyens


citoyens          0.000593
contact           0.000105
vie               0.000078
maires            0.000078
deputes           0.000073
nombre            0.000063
parlementaires    0.000063
elus              0.000063
senateur          0.000062
tous              0.000061
Name: citoyens, dtype: float32

pouvoir


pouvoir      0.000625
consacrer    0.000069
cumuler      0.000065
elu          0.000054
eviter       0.000054
local        0.000053
maire        0.000051
citoyens     0.000049
non          0.000048
depute       0.000047
Name: pouvoir, dtype: float32

tout


tout       0.000646
monde      0.000248
faire      0.000091
cumuler    0.000061
temps      0.000056
faut       0.000054
elu        0.000050
cumul      0.000050
travail    0.000049
mandats    0.000048
Name: tout, dtype: float32

consacrer


consacrer     0.000651
pleinement    0.000281
tache         0.000215
mission       0.000133
elu           0.000083
mandat        0.000078
fonction      0.000076
temps         0.000074
mieux         0.000073
pouvoir       0.000069
Name: consacrer, dtype: float32

chose


chose       0.000684
bonne       0.000538
mauvaise    0.000514
non         0.000065
maire       0.000063
deputes     0.000063
cumul       0.000060
faire       0.000058
depute      0.000058
terrain     0.000053
Name: chose, dtype: float32

In [45]:
gc.collect()

147

# Question 7 :  Que faudrait-il faire pour mieux représenter les différentes sensibilités politiques ?

In [46]:
question_7 = "Que faudrait-il faire pour mieux représenter les différentes sensibilités politiques ?"
qu_7,df_qu_7_one_hot,df_cov_7,df_confidence_7,df_lift_7 = compute_similarities(question_7, new_res)

In [47]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_7[i].sort_values(ascending=False).head(10))

proportionnelle


proportionnelle    15443
dose                4092
elections           2297
integrale           1425
assemblee           1376
instaurer           1301
introduire          1244
legislatives        1242
vote                1040
majorite             917
Name: proportionnelle, dtype: uint16

dose


dose               4528
proportionnelle    4092
elections           734
introduire          685
legislatives        543
instaurer           447
assemblee           436
petite              402
majorite            378
republique          292
Name: dose, dtype: uint16

elections


elections          3283
proportionnelle    2297
legislatives        826
dose                734
introduire          351
vote                347
instaurer           342
politiques          258
integrale           256
mettre              240
Name: elections, dtype: uint16

politiques


politiques         2282
sensibilites        927
partis              751
proportionnelle     596
politique           343
faut                337
citoyens            322
faire               277
tous                264
elections           258
Name: politiques, dtype: uint16

vote


vote               2282
proportionnelle    1040
blanc               799
obligatoire         457
compte              420
elections           347
election            202
assemblee           202
citoyens            200
votes               197
Name: vote, dtype: uint16

assemblee


assemblee          2018
proportionnelle    1376
nationale          1041
dose                436
senat               328
deputes             258
elus                243
elections           239
majorite            237
politiques          233
Name: assemblee, dtype: uint16

partis


partis             1816
politiques          751
proportionnelle     653
politique           299
tous                282
elections           225
parti               220
faut                215
faire               209
citoyens            206
Name: partis, dtype: uint16

politique


politique          1802
proportionnelle     522
politiques          343
partis              299
parti               290
faire               268
citoyens            262
sensibilite         253
faut                244
sensibilites        242
Name: politique, dtype: uint16

instaurer


instaurer          1615
proportionnelle    1301
dose                447
elections           342
legislatives        190
assemblee           151
vote                139
integrale           120
part                106
nationale           102
Name: instaurer, dtype: uint16

legislatives


legislatives       1536
proportionnelle    1242
elections           826
dose                543
introduire          194
instaurer           190
assemblee           146
vote                136
election            132
part                130
Name: legislatives, dtype: uint16

integrale


integrale          1521
proportionnelle    1425
elections           256
assemblee           179
dose                159
nationale           138
legislatives        125
election            121
instaurer           120
deputes             113
Name: integrale, dtype: uint16

sensibilites


sensibilites       1500
politiques          927
proportionnelle     403
representees        267
representer         262
faut                252
politique           242
partis              195
citoyens            188
faire               182
Name: sensibilites, dtype: uint16

citoyens


citoyens           1493
proportionnelle     452
politiques          322
sort                310
politique           262
elus                234
assemblee           216
faire               209
partis              206
vote                200
Name: citoyens, dtype: uint16

elus


elus               1482
proportionnelle     716
deputes             294
assemblee           243
citoyens            234
politiques          224
elections           217
partis              200
faire               195
politique           190
Name: elus, dtype: uint16

introduire


introduire         1452
proportionnelle    1244
dose                685
elections           351
legislatives        194
assemblee           153
part                150
majorite            119
france                0
prendre               0
Name: introduire, dtype: uint16

majorite


majorite           1392
proportionnelle     917
dose                378
elections           239
assemblee           237
faut                221
tout                220
politiques          187
politique           164
republique          162
Name: majorite, dtype: uint16

faut


faut               1380
proportionnelle     606
politiques          337
sensibilites        252
politique           244
majorite            221
partis              215
dose                210
elections           185
faire               185
Name: faut, dtype: uint16

faire


faire              1342
proportionnelle     447
politiques          277
politique           268
citoyens            209
partis              209
elus                195
faut                185
sensibilites        182
elections           177
Name: faire, dtype: uint16

tous


tous               1297
proportionnelle     552
partis              282
politiques          264
politique           208
elections           187
elus                179
citoyens            174
assemblee           167
vote                159
Name: tous, dtype: uint16

proportionnel


proportionnel       1239
scrutin              268
elections            175
dose                 173
vote                 164
assemblee            102
voix                   0
voter                  0
gauche                 0
proportionnalite       0
Name: proportionnel, dtype: uint16

In [48]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_7[i].sort_values(ascending=False).head(10))

proportionnelle


proportionnelle    1.000000
integrale          0.936884
dose               0.903710
petite             0.887097
introduire         0.856749
25                 0.845272
totale             0.837209
15                 0.834842
prime              0.832817
20                 0.815661
Name: proportionnelle, dtype: float32

dose


dose            1.000000
petite          0.810484
introduire      0.471763
bonne           0.411911
15              0.411765
20              0.401305
stabilite       0.392523
25              0.363897
legislatives    0.353516
30              0.311047
Name: dose, dtype: float32

elections


elections         1.000000
legislatives      0.537760
tour              0.307971
candidats         0.303318
presidentielle    0.301449
mandat            0.288509
1                 0.260771
5                 0.254808
introduire        0.241736
mettre            0.224090
Name: elections, dtype: float32

politiques


politiques      1.000000
sensibilites    0.618000
partis          0.413546
representer     0.370140
idees           0.350649
mieux           0.344464
representees    0.315447
question        0.311798
francais        0.261986
france          0.258993
Name: politiques, dtype: float32

vote


vote           1.000000
blanc          0.938895
obligatoire    0.868821
prise          0.501845
compte         0.480549
prendre        0.383698
candidats      0.353081
voter          0.280778
votes          0.280228
electeurs      0.271845
Name: vote, dtype: float32

assemblee


assemblee       1.000000
nationale       0.847030
senat           0.514107
president       0.263617
sort            0.244032
2               0.232742
1               0.229025
gouvernement    0.224528
deputes         0.213753
nombre          0.212290
Name: assemblee, dtype: float32

partis


partis          1.000000
politiques      0.329097
representes     0.322129
idees           0.298701
parti           0.239391
france          0.219424
tous            0.217425
nombre          0.210894
gouvernement    0.200000
mieux           0.195079
Name: partis, dtype: float32

politique


politique       1.000000
sensibilite     0.589744
vie             0.421053
parti           0.315560
francais        0.231164
idees           0.222635
france          0.221223
gouvernement    0.218868
mieux           0.212654
faudrait        0.202020
Name: politique, dtype: float32

instaurer


instaurer          1.000000
legislatives       0.123698
elections          0.104173
dose               0.098719
part               0.090059
proportionnelle    0.084245
nationale          0.082994
integrale          0.078895
assemblee          0.074827
vote               0.060911
Name: instaurer, dtype: float32

legislatives


legislatives    1.000000
elections       0.251599
tour            0.186594
introduire      0.133609
scrutin         0.127767
dose            0.119920
instaurer       0.117647
election        0.115385
part            0.110450
deputes         0.101906
Name: legislatives, dtype: float32

integrale


integrale          1.000000
nationale          0.112286
election           0.105769
deputes            0.093621
proportionnelle    0.092275
assemblee          0.088702
legislatives       0.081380
elections          0.077977
majorite           0.076868
instaurer          0.074303
Name: integrale, dtype: float32

sensibilites


sensibilites      1.000000
representees      0.434146
representer       0.407465
politiques        0.406223
mieux             0.298770
idees             0.191095
faut              0.182609
representation    0.177451
pays              0.141250
faire             0.135618
Name: sensibilites, dtype: float32

citoyens


citoyens       1.000000
tires          0.685824
sort           0.411141
representer    0.228616
mieux          0.177504
senat          0.166144
nombre         0.162011
elus           0.157895
faire          0.155738
politique      0.145394
Name: citoyens, dtype: float32

elus


elus             1.000000
senateurs        0.342767
1                0.258503
nombre           0.252793
deputes          0.243579
2                0.226824
elu              0.225862
representants    0.208247
senat            0.194357
non              0.178265
Name: elus, dtype: float32

introduire


introduire         1.000000
dose               0.151281
part               0.127443
legislatives       0.126302
elections          0.106914
majorite           0.085489
proportionnelle    0.080554
assemblee          0.075818
france             0.000000
prendre            0.000000
Name: introduire, dtype: float32

majorite


majorite        1.000000
gouverner       0.431611
gouvernement    0.250943
tout            0.185029
elu             0.177586
pays            0.176250
pouvoir         0.171801
systeme         0.162637
faut            0.160145
republique      0.160079
Name: majorite, dtype: float32

faut


faut            1.000000
representer     0.220840
pays            0.181250
sensibilites    0.168000
pouvoir         0.158768
majorite        0.158764
republique      0.149209
politiques      0.147677
faire           0.137854
systeme         0.136264
Name: faut, dtype: float32

faire


faire        1.000000
politique    0.148724
pouvoir      0.144550
non          0.140133
citoyens     0.139987
tout         0.137931
pays         0.136250
faut         0.134058
parti        0.132753
elus         0.131579
Name: faire, dtype: float32

tous


tous           1.000000
ans            0.340845
representes    0.285714
francais       0.184932
partis         0.155286
elus           0.120783
citoyens       0.116544
parti          0.116431
non            0.116301
politiques     0.115688
Name: tous, dtype: float32

proportionnel


proportionnel       1.000000
scrutin             0.269618
vote                0.071867
elections           0.053305
assemblee           0.050545
dose                0.038207
debat               0.000000
referendum          0.000000
gauche              0.000000
proportionnalite    0.000000
Name: proportionnel, dtype: float32

In [49]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_7[i].sort_values(ascending=False).head(10))

proportionnelle


proportionnelle    0.000065
integrale          0.000061
dose               0.000059
petite             0.000057
introduire         0.000055
25                 0.000055
totale             0.000054
15                 0.000054
prime              0.000054
20                 0.000053
Name: proportionnelle, dtype: float32

dose


dose            0.000221
petite          0.000179
introduire      0.000104
bonne           0.000091
15              0.000091
20              0.000089
stabilite       0.000087
25              0.000080
legislatives    0.000078
30              0.000069
Name: dose, dtype: float32

elections


elections         0.000305
legislatives      0.000164
tour              0.000094
candidats         0.000092
presidentielle    0.000092
mandat            0.000088
1                 0.000079
5                 0.000078
introduire        0.000074
mettre            0.000068
Name: elections, dtype: float32

politiques


politiques      0.000438
sensibilites    0.000271
partis          0.000181
representer     0.000162
idees           0.000154
mieux           0.000151
representees    0.000138
question        0.000137
francais        0.000115
france          0.000113
Name: politiques, dtype: float32

vote


vote           0.000438
blanc          0.000411
obligatoire    0.000381
prise          0.000220
compte         0.000211
prendre        0.000168
candidats      0.000155
voter          0.000123
votes          0.000123
electeurs      0.000119
Name: vote, dtype: float32

assemblee


assemblee       0.000496
nationale       0.000420
senat           0.000255
president       0.000131
sort            0.000121
2               0.000115
1               0.000113
gouvernement    0.000111
deputes         0.000106
nombre          0.000105
Name: assemblee, dtype: float32

partis


partis          0.000551
politiques      0.000181
representes     0.000177
idees           0.000164
parti           0.000132
france          0.000121
tous            0.000120
nombre          0.000116
gouvernement    0.000110
mieux           0.000107
Name: partis, dtype: float32

politique


politique       0.000555
sensibilite     0.000327
vie             0.000234
parti           0.000175
francais        0.000128
idees           0.000124
france          0.000123
gouvernement    0.000121
mieux           0.000118
faudrait        0.000112
Name: politique, dtype: float32

instaurer


instaurer          0.000619
legislatives       0.000077
elections          0.000065
dose               0.000061
part               0.000056
proportionnelle    0.000052
nationale          0.000051
integrale          0.000049
assemblee          0.000046
vote               0.000038
Name: instaurer, dtype: float32

legislatives


legislatives    0.000651
elections       0.000164
tour            0.000121
introduire      0.000087
scrutin         0.000083
dose            0.000078
instaurer       0.000077
election        0.000075
part            0.000072
deputes         0.000066
Name: legislatives, dtype: float32

integrale


integrale          0.000657
nationale          0.000074
election           0.000070
deputes            0.000062
proportionnelle    0.000061
assemblee          0.000058
legislatives       0.000054
elections          0.000051
majorite           0.000051
instaurer          0.000049
Name: integrale, dtype: float32

sensibilites


sensibilites      0.000667
representees      0.000289
representer       0.000272
politiques        0.000271
mieux             0.000199
idees             0.000127
faut              0.000122
representation    0.000118
pays              0.000094
faire             0.000090
Name: sensibilites, dtype: float32

citoyens


citoyens       0.000670
tires          0.000459
sort           0.000275
representer    0.000153
mieux          0.000119
senat          0.000111
nombre         0.000109
elus           0.000106
faire          0.000104
politique      0.000097
Name: citoyens, dtype: float32

elus


elus             0.000675
senateurs        0.000231
1                0.000174
nombre           0.000171
deputes          0.000164
2                0.000153
elu              0.000152
representants    0.000141
senat            0.000131
non              0.000120
Name: elus, dtype: float32

introduire


introduire         0.000689
dose               0.000104
part               0.000088
legislatives       0.000087
elections          0.000074
majorite           0.000059
proportionnelle    0.000055
assemblee          0.000052
citoyens                NaN
presidentielle          NaN
Name: introduire, dtype: float32

majorite


majorite        0.000718
gouverner       0.000310
gouvernement    0.000180
tout            0.000133
elu             0.000128
pays            0.000127
pouvoir         0.000123
systeme         0.000117
faut            0.000115
republique      0.000115
Name: majorite, dtype: float32

faut


faut            0.000725
representer     0.000160
pays            0.000131
sensibilites    0.000122
pouvoir         0.000115
majorite        0.000115
republique      0.000108
politiques      0.000107
faire           0.000100
systeme         0.000099
Name: faut, dtype: float32

faire


faire        0.000745
politique    0.000111
pouvoir      0.000108
non          0.000104
citoyens     0.000104
tout         0.000103
pays         0.000102
faut         0.000100
parti        0.000099
elus         0.000098
Name: faire, dtype: float32

tous


tous           0.000771
ans            0.000263
representes    0.000220
francais       0.000143
partis         0.000120
elus           0.000093
citoyens       0.000090
parti          0.000090
non            0.000090
politiques     0.000089
Name: tous, dtype: float32

proportionnel


proportionnel     0.000807
scrutin           0.000218
vote              0.000058
elections         0.000043
assemblee         0.000041
dose              0.000031
citoyens               NaN
presidentielle         NaN
senat                  NaN
20                     NaN
Name: proportionnel, dtype: float32

In [50]:
gc.collect()

147

# Question 8 : Pensez-vous qu'il serait souhaitable de réduire le nombre d'élus (hors députés et sénateurs) ?

In [51]:
question_8 = "Pensez-vous qu'il serait souhaitable de réduire le nombre d'élus (hors députés et sénateurs) ?"
qu_8,df_qu_8_one_hot,df_cov_8,df_confidence_8,df_lift_8 = compute_similarities(question_8, new_res)

In [52]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_8[i].sort_values(ascending=False).head(10))

oui


oui    24164
non        0
Name: oui, dtype: uint16

non


non    8770
oui       0
Name: non, dtype: uint16

In [53]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_8[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [54]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_8[i].sort_values(ascending=False).head(10))

oui


oui    0.000041
non         NaN
Name: oui, dtype: float32

non


non    0.000114
oui         NaN
Name: non, dtype: float32

In [55]:
gc.collect()

14

# Question 9 :  Si oui, lesquels ?

In [56]:
question_9 = "Si oui, lesquels ?"
qu_9,df_qu_9_one_hot,df_cov_9,df_confidence_9,df_lift_9 = compute_similarities(question_9, new_res)

In [57]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_9[i].sort_values(ascending=False).head(10))

deputes


deputes        5683
senateurs      4352
nombre         1504
reduire        1072
elus            941
senat           862
faut            666
supprimer       653
communes        480
conseillers     476
Name: deputes, dtype: uint16

senateurs


senateurs      5591
deputes        4352
nombre         1209
reduire         937
elus            866
faut            624
supprimer       467
conseillers     453
tous            450
communes        432
Name: senateurs, dtype: uint16

elus


elus              4436
nombre            1409
communes          1020
deputes            941
senateurs          866
reduire            820
regionaux          795
departementaux     774
regions            641
faut               629
Name: elus, dtype: uint16

communes


communes        3890
communautes     1061
nombre          1036
elus            1020
regions          929
departements     905
supprimer        766
maires           689
petites          622
departement      615
Name: communes, dtype: uint16

nombre


nombre         3794
reduire        1602
deputes        1504
elus           1409
senateurs      1209
communes       1036
faut            776
supprimer       666
conseillers     510
senat           510
Name: nombre, dtype: uint16

conseillers


conseillers       3022
regionaux         1559
departementaux    1488
municipaux         662
generaux           578
communes           528
nombre             510
deputes            476
senateurs          453
elus               444
Name: conseillers, dtype: uint16

departementaux


departementaux    2803
regionaux         1617
conseillers       1488
elus               774
conseils           694
communes           490
supprimer          426
nombre             419
municipaux         393
deputes            378
Name: departementaux, dtype: uint16

regionaux


regionaux         2797
departementaux    1617
conseillers       1559
elus               795
conseils           582
deputes            472
nombre             442
senateurs          415
municipaux         398
generaux           389
Name: regionaux, dtype: uint16

supprimer


supprimer       2769
communes         766
nombre           666
deputes          653
senat            637
elus             593
departements     587
reduire          556
regions          528
faut             492
Name: supprimer, dtype: uint16

reduire


reduire        2590
nombre         1602
deputes        1072
senateurs       937
elus            820
faut            727
communes        610
supprimer       556
regions         312
departement     304
Name: reduire, dtype: uint16

tous


tous         2331
elus          518
deputes       472
senateurs     450
nombre        301
communes      271
reduire       248
niveaux       239
supprimer     212
faut          209
Name: tous, dtype: uint16

regions


regions         2308
departements    1062
communes         929
elus             641
supprimer        528
nombre           485
departement      371
communautes      367
deputes          356
reduire          312
Name: regions, dtype: uint16

departement


departement    2302
region         1159
communes        615
elus            529
commune         471
deputes         458
supprimer       413
nombre          407
senateurs       378
regions         371
Name: departement, dtype: uint16

departements


departements    2043
regions         1062
communes         905
supprimer        587
elus             538
nombre           414
communautes      317
deputes          311
suppression      272
region           269
Name: departements, dtype: uint16

faut


faut           1962
nombre          776
reduire         727
deputes         666
elus            629
senateurs       624
communes        507
supprimer       492
regions         298
departement     290
Name: faut, dtype: uint16

senat


senat          1961
deputes         862
supprimer       637
nombre          510
assemblee       443
suppression     421
senateurs       335
elus            305
reduire         302
nationale       246
Name: senat, dtype: uint16

region


region          1949
departement     1159
communes         542
elus             500
commune          481
nombre           344
supprimer        321
communaute       316
departements     269
deputes          258
Name: region, dtype: uint16

conseils


conseils          1392
departementaux     694
regionaux          582
communes           355
generaux           332
supprimer          331
elus               325
nombre             265
municipaux         240
regions            189
Name: conseils, dtype: uint16

maires


maires            1382
communes           689
elus               331
nombre             324
conseillers        306
deputes            287
senateurs          258
petites            211
reduire            203
departementaux     202
Name: maires, dtype: uint16

conseil


conseil          1327
departemental     403
regional          356
supprimer         302
elus              288
economique        280
communes          270
social            259
general           253
deputes           231
Name: conseil, dtype: uint16

In [58]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_9[i].sort_values(ascending=False).head(10))

deputes


deputes      1.000000
justement    0.867232
senateurs    0.778394
europeens    0.639456
100          0.614286
moitie       0.574018
question     0.538941
3            0.505643
1            0.492832
senateur     0.444700
Name: deputes, dtype: float32

senateurs


senateurs    1.000000
justement    0.881356
deputes      0.765793
100          0.528571
question     0.526480
moitie       0.456193
1            0.408602
3            0.401806
oui          0.371739
francais     0.370748
Name: senateurs, dtype: float32

elus


elus            1.000000
locaux          0.752874
territoriaux    0.443182
depenses        0.437262
politique       0.416107
autant          0.408759
citoyens        0.395924
non             0.394922
travail         0.390728
france          0.384615
Name: elus, dtype: float32

communes


communes        1.000000
petites         0.894964
communautes     0.822481
regroupement    0.811881
regrouper       0.801008
communaute      0.635183
habitants       0.630339
000             0.559727
fusion          0.504425
metropoles      0.504399
Name: communes, dtype: float32

nombre


nombre            1.000000
diminuer          0.693053
reduire           0.618533
reduction         0.554924
parlementaires    0.441805
grand             0.424437
habitants         0.407953
000               0.395904
faut              0.395515
moyens            0.388693
Name: nombre, dtype: float32

conseillers


conseillers       1.000000
municipaux        0.644596
generaux          0.602083
regionaux         0.557383
departementaux    0.530860
maires            0.221418
presidents        0.210728
habitants         0.172312
petites           0.164029
communautes       0.143411
Name: conseillers, dtype: float32

departementaux


departementaux       1.000000
regionaux            0.578119
conseils             0.498563
conseillers          0.492389
municipaux           0.382668
fusionner            0.264935
elus                 0.174482
intercommunalites    0.168289
suppression          0.160558
supprimer            0.153846
Name: departementaux, dtype: float32

regionaux


regionaux         1.000000
departementaux    0.576882
conseillers       0.515884
conseils          0.418103
generaux          0.405208
municipaux        0.387537
elus              0.179216
communautes       0.131783
maires            0.128075
nombre            0.116500
Name: regionaux, dtype: float32

supprimer


supprimer       1.000000
echelon         0.418651
economique      0.353293
social          0.342949
regrouper       0.340050
cese            0.333333
senat           0.324834
departements    0.287323
competences     0.283505
fusionner       0.267532
Name: supprimer, dtype: float32

reduire


reduire          1.000000
nombre           0.422246
faut             0.370540
moitie           0.329305
faudrait         0.316695
feuille          0.301075
administratif    0.295566
3                0.232506
question         0.232087
exemple          0.213873
Name: reduire, dtype: float32

tous


tous           1.000000
niveaux        0.476096
faire          0.129231
elus           0.116772
faut           0.106524
maires         0.096237
reduire        0.095753
commune        0.094806
communautes    0.089147
deputes        0.083055
Name: tous, dtype: float32

regions


regions              1.000000
departements         0.519824
grandes              0.507645
metropoles           0.404692
cantons              0.383838
fusion               0.362832
competences          0.358247
intercommunalites    0.308762
communautes          0.284496
regroupement         0.267327
Name: regions, dtype: float32

departement


departement         1.000000
region              0.594664
metropole           0.415020
commune             0.388293
1                   0.387097
communaute          0.364817
intercommunalite    0.342799
senateur            0.338710
depute              0.313576
echelon             0.259921
Name: departement, dtype: float32

departements


departements         1.000000
regions              0.460139
cantons              0.370370
metropoles           0.307918
competences          0.280928
intercommunalites    0.273992
fusionner            0.262338
communautes          0.245736
suppression          0.237347
communes             0.232648
Name: departements, dtype: float32

faut


faut        1.000000
reduire     0.280695
diminuer    0.261712
pouvoir     0.226293
faire       0.218462
tout        0.216667
question    0.216511
france      0.214990
nombre      0.204533
non         0.196051
Name: faut, dtype: float32

senat


senat          1.000000
nationale      0.618090
assemblee      0.538275
sert           0.523649
cese           0.368254
suppression    0.367365
social         0.326923
economique     0.326347
pouvoir        0.241379
supprimer      0.230047
Name: senat, dtype: float32

region


region              1.000000
departement         0.503475
metropole           0.490119
commune             0.396538
communaute          0.373081
intercommunalite    0.348884
strates             0.233708
niveaux             0.211155
echelon             0.206349
niveau              0.201031
Name: region, dtype: float32

conseils


conseils          1.000000
generaux          0.345833
departementaux    0.247592
municipaux        0.233690
regionaux         0.208080
suppression       0.141361
communautes       0.127132
supprimer         0.119538
communes          0.091260
conseil           0.088922
Name: conseils, dtype: float32

maires


maires         1.000000
petites        0.303597
habitants      0.220913
presidents     0.193487
communes       0.177121
municipaux     0.141188
communautes    0.120155
conseillers    0.101257
commune        0.100577
nombre         0.085398
Name: maires, dtype: float32

conseil


conseil          1.000000
economique       0.838323
social           0.830128
general          0.664042
departemental    0.503121
regional         0.478495
communaute       0.155844
suppression      0.123037
commune          0.122836
supprimer        0.109065
Name: conseil, dtype: float32

In [59]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_9[i].sort_values(ascending=False).head(10))

deputes


deputes      0.000176
justement    0.000153
senateurs    0.000137
europeens    0.000113
100          0.000108
moitie       0.000101
question     0.000095
3            0.000089
1            0.000087
senateur     0.000078
Name: deputes, dtype: float32

senateurs


senateurs    0.000179
justement    0.000158
deputes      0.000137
100          0.000095
question     0.000094
moitie       0.000082
1            0.000073
3            0.000072
oui          0.000066
francais     0.000066
Name: senateurs, dtype: float32

elus


elus            0.000225
locaux          0.000170
territoriaux    0.000100
depenses        0.000099
politique       0.000094
autant          0.000092
citoyens        0.000089
non             0.000089
travail         0.000088
france          0.000087
Name: elus, dtype: float32

communes


communes        0.000257
petites         0.000230
communautes     0.000211
regroupement    0.000209
regrouper       0.000206
communaute      0.000163
habitants       0.000162
000             0.000144
fusion          0.000130
metropoles      0.000130
Name: communes, dtype: float32

nombre


nombre            0.000264
diminuer          0.000183
reduire           0.000163
reduction         0.000146
parlementaires    0.000116
grand             0.000112
habitants         0.000108
000               0.000104
faut              0.000104
moyens            0.000102
Name: nombre, dtype: float32

conseillers


conseillers       0.000331
municipaux        0.000213
generaux          0.000199
regionaux         0.000184
departementaux    0.000176
maires            0.000073
presidents        0.000070
habitants         0.000057
petites           0.000054
communautes       0.000047
Name: conseillers, dtype: float32

departementaux


departementaux       0.000357
regionaux            0.000206
conseils             0.000178
conseillers          0.000176
municipaux           0.000137
fusionner            0.000095
elus                 0.000062
intercommunalites    0.000060
suppression          0.000057
supprimer            0.000055
Name: departementaux, dtype: float32

regionaux


regionaux         0.000358
departementaux    0.000206
conseillers       0.000184
conseils          0.000149
generaux          0.000145
municipaux        0.000139
elus              0.000064
communautes       0.000047
maires            0.000046
nombre            0.000042
Name: regionaux, dtype: float32

supprimer


supprimer       0.000361
echelon         0.000151
economique      0.000128
social          0.000124
regrouper       0.000123
cese            0.000120
senat           0.000117
departements    0.000104
competences     0.000102
fusionner       0.000097
Name: supprimer, dtype: float32

reduire


reduire          0.000386
nombre           0.000163
faut             0.000143
moitie           0.000127
faudrait         0.000122
feuille          0.000116
administratif    0.000114
3                0.000090
question         0.000090
exemple          0.000083
Name: reduire, dtype: float32

tous


tous           0.000429
niveaux        0.000204
faire          0.000055
elus           0.000050
faut           0.000046
maires         0.000041
reduire        0.000041
commune        0.000041
communautes    0.000038
deputes        0.000036
Name: tous, dtype: float32

regions


regions              0.000433
departements         0.000225
grandes              0.000220
metropoles           0.000175
cantons              0.000166
fusion               0.000157
competences          0.000155
intercommunalites    0.000134
communautes          0.000123
regroupement         0.000116
Name: regions, dtype: float32

departement


departement         0.000434
region              0.000258
metropole           0.000180
commune             0.000169
1                   0.000168
communaute          0.000158
intercommunalite    0.000149
senateur            0.000147
depute              0.000136
echelon             0.000113
Name: departement, dtype: float32

departements


departements         0.000489
regions              0.000225
cantons              0.000181
metropoles           0.000151
competences          0.000138
intercommunalites    0.000134
fusionner            0.000128
communautes          0.000120
suppression          0.000116
communes             0.000114
Name: departements, dtype: float32

faut


faut        0.000510
reduire     0.000143
diminuer    0.000133
pouvoir     0.000115
faire       0.000111
tout        0.000110
question    0.000110
france      0.000110
nombre      0.000104
non         0.000100
Name: faut, dtype: float32

senat


senat          0.000510
nationale      0.000315
assemblee      0.000274
sert           0.000267
cese           0.000188
suppression    0.000187
social         0.000167
economique     0.000166
pouvoir        0.000123
supprimer      0.000117
Name: senat, dtype: float32

region


region              0.000513
departement         0.000258
metropole           0.000251
commune             0.000203
communaute          0.000191
intercommunalite    0.000179
strates             0.000120
niveaux             0.000108
echelon             0.000106
niveau              0.000103
Name: region, dtype: float32

conseils


conseils          0.000718
generaux          0.000248
departementaux    0.000178
municipaux        0.000168
regionaux         0.000149
suppression       0.000102
communautes       0.000091
supprimer         0.000086
communes          0.000066
conseil           0.000064
Name: conseils, dtype: float32

maires


maires         0.000724
petites        0.000220
habitants      0.000160
presidents     0.000140
communes       0.000128
municipaux     0.000102
communautes    0.000087
conseillers    0.000073
commune        0.000073
nombre         0.000062
Name: maires, dtype: float32

conseil


conseil          0.000754
economique       0.000632
social           0.000626
general          0.000500
departemental    0.000379
regional         0.000361
communaute       0.000117
suppression      0.000093
commune          0.000093
supprimer        0.000082
Name: conseil, dtype: float32

In [60]:
gc.collect()

147

# Question 10 :  Que pensez-vous de la participation des citoyens aux élections et comment les inciter à y participer davantage ?

In [61]:
question_10 = "Que pensez-vous de la participation des citoyens aux élections et comment les inciter à y participer davantage ?"
qu_10,df_qu_10_one_hot,df_cov_10,df_confidence_10,df_lift_10 = compute_similarities(question_10, new_res)

In [62]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_10[i].sort_values(ascending=False).head(10))

vote


vote             15408
obligatoire       9752
blanc             4461
compte            2404
voter             1837
citoyens          1750
faut              1675
participation     1540
elections         1488
non               1037
Name: vote, dtype: uint16

obligatoire


obligatoire      10505
vote              9752
blanc             1957
compte            1125
participation     1038
faut               983
voter              924
elections          850
citoyens           803
amende             779
Name: obligatoire, dtype: uint16

citoyens


citoyens         5109
vote             1750
elections        1192
elus             1186
participation    1112
faut             1039
voter            1035
politique         958
obligatoire       803
politiques        733
Name: citoyens, dtype: uint16

blanc


blanc          4632
vote           4461
compte         1992
obligatoire    1957
prendre         832
prise           639
voter           616
citoyens        599
faut            563
elections       547
Name: blanc, dtype: uint16

voter


voter            3809
vote             1837
citoyens         1035
obligatoire       924
faut              736
blanc             616
aller             611
elections         605
faire             530
participation     516
Name: voter, dtype: uint16

participation


participation    3662
vote             1540
citoyens         1112
obligatoire      1038
faible           1029
elections         973
faut              630
elus              600
voter             516
blanc             507
Name: participation, dtype: uint16

elections


elections        3408
vote             1488
citoyens         1192
participation     973
obligatoire       850
voter             605
faut              599
blanc             547
elus              531
compte            445
Name: elections, dtype: uint16

faut


faut             3404
vote             1675
citoyens         1039
obligatoire       983
voter             736
participation     630
elections         599
elus              563
blanc             563
politique         559
Name: faut, dtype: uint16

compte


compte         3179
vote           2404
blanc          1992
obligatoire    1125
prendre        1048
prise           825
citoyens        604
votes           528
elections       445
blancs          440
Name: compte, dtype: uint16

elus


elus             3025
citoyens         1186
vote              819
participation     600
faut              563
elections         531
confiance         505
voter             470
politique         440
faire             372
Name: elus, dtype: uint16

politique


politique        2496
citoyens          958
vote              794
faut              559
participation     495
vie               448
elections         443
elus              440
voter             434
faire             396
Name: politique, dtype: uint16

faire


faire            2189
vote              889
citoyens          677
voter             530
faut              464
elections         441
obligatoire       400
politique         396
elus              372
participation     343
Name: faire, dtype: uint16

non


non              2057
vote             1037
obligatoire       575
citoyens          546
participation     498
voter             445
elections         368
faut              363
politique         337
elus              331
Name: non, dtype: uint16

politiques


politiques       1983
citoyens          733
vote              520
politique         396
faut              380
participation     354
voter             352
confiance         341
elections         340
elus              315
Name: politiques, dtype: uint16

faible


faible           1847
participation    1029
vote              788
citoyens          453
obligatoire       446
elections         350
faut              334
elus              316
voter             256
blanc             248
Name: faible, dtype: uint16

votes


votes            1632
blancs            863
vote              852
obligatoire       574
compte            528
blanc             312
citoyens          284
voter             247
elections         246
comptabiliser     229
Name: votes, dtype: uint16

confiance


confiance        1617
citoyens          602
elus              505
vote              375
faut              366
politique         362
politiques        341
participation     333
voter             270
redonner          268
Name: confiance, dtype: uint16

prendre


prendre        1479
compte         1048
vote           1013
blanc           832
obligatoire     447
citoyens        290
faut            252
votes           224
voter           216
elections       203
Name: prendre, dtype: uint16

tous


tous             1449
vote              647
citoyens          498
obligatoire       339
voter             321
faut              304
elus              296
elections         287
politique         257
participation     246
Name: tous, dtype: uint16

citoyen


citoyen          1414
vote              760
obligatoire       450
voter             357
citoyens          289
faut              282
elections         262
devoir            260
participation     252
politique         230
Name: citoyen, dtype: uint16

In [63]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_10[i].sort_values(ascending=False).head(10))

vote


vote              1.000000
electronique      0.972376
blanc             0.963083
reconnaissance    0.950185
obligatoire       0.928320
reconnaitre       0.925170
sanction          0.875000
belgique          0.863874
amende            0.823869
prise             0.822951
Name: vote, dtype: float32

obligatoire


obligatoire    1.000000
belgique       0.824607
rendant        0.812500
sanction       0.777174
amende         0.749759
peine          0.717228
vote           0.632918
semaine        0.573123
droits         0.519139
cas            0.510204
Name: obligatoire, dtype: float32

citoyens


citoyens       1.000000
participent    0.635514
sentent        0.566532
representes    0.546828
sort           0.492228
davantage      0.491987
sentiment      0.462428
inciter        0.457819
impression     0.453216
decisions      0.443775
Name: citoyens, dtype: float32

blanc


blanc             1.000000
reconnaissance    0.911439
reconnaitre       0.896259
prise             0.698361
compte            0.626612
pris              0.583178
comptabiliser     0.574109
prendre           0.562542
50                0.406061
majoritaire       0.364516
Name: blanc, dtype: float32

voter


voter          1.000000
aller          0.822342
obliger        0.503401
envie          0.500000
inciter        0.425926
sert           0.397163
devoir         0.363057
obligation     0.360864
ensuite        0.359673
possibilite    0.358333
Name: voter, dtype: float32

participation


participation    1.000000
faible           0.557120
insuffisante     0.502506
taux             0.492958
manque           0.381074
elections        0.285505
citoyenne        0.281319
inciter          0.264403
niveau           0.262931
non              0.242100
Name: participation, dtype: float32

elections


elections          1.000000
presidentielles    0.657534
legislatives       0.637500
presidentielle     0.435294
participent        0.404206
tour               0.345238
taux               0.323944
devraient          0.312312
participer         0.304278
jour               0.287206
Name: elections, dtype: float32

faut


faut           1.000000
redonner       0.327473
inciter        0.302469
participent    0.278037
president      0.262500
sens           0.254042
exprimer       0.243499
participer     0.240517
vie            0.237417
donner         0.235723
Name: faut, dtype: float32

compte


compte      1.000000
prise       0.901639
pris        0.809346
prendre     0.708587
blanc       0.430052
blancs      0.421860
voix        0.330218
votes       0.323529
avis        0.283333
majorite    0.245902
Name: compte, dtype: float32

elus


elus             1.000000
mandat           0.402715
deputes          0.328076
promesses        0.326019
confiance        0.312307
electeurs        0.297352
president        0.260000
interet          0.255083
representants    0.254673
nombre           0.254335
Name: elus, dtype: float32

politique


politique    1.000000
vie          0.425451
parti        0.393836
redonner     0.351648
monde        0.292906
sens         0.284065
manque       0.258312
systeme      0.257716
peuple       0.252793
partis       0.249548
Name: politique, dtype: float32

faire


faire         1.000000
mieux         0.191450
participer    0.183212
tout          0.176816
choix         0.175368
promesses     0.172414
temps         0.171053
exemple       0.168998
peuple        0.162011
pouvoir       0.161687
Name: faire, dtype: float32

non


non          1.000000
votants      0.412338
cas          0.293651
promesses    0.238245
amende       0.187680
peuple       0.168994
choix        0.168675
elu          0.166870
exemple      0.153846
candidats    0.150255
Name: non, dtype: float32

politiques


politiques    1.000000
hommes        0.839080
partis        0.424955
confiance     0.210884
promesses     0.206897
peuple        0.175978
francais      0.160878
politique     0.158654
electeurs     0.157841
inciter       0.153292
Name: politiques, dtype: float32

faible


faible           1.000000
participation    0.280994
faudrait         0.129800
inciter          0.129630
electeurs        0.116090
confiance        0.107607
elus             0.104463
elections        0.102700
faut             0.098120
politique        0.097756
Name: faible, dtype: float32

votes


votes            1.000000
blancs           0.827421
comptabiliser    0.429644
compte           0.166090
prendre          0.151454
prise            0.148634
election         0.124633
candidats        0.106112
tous             0.102830
non              0.079728
Name: votes, dtype: float32

confiance


confiance     1.000000
redonner      0.589011
manque        0.312020
politiques    0.171962
elus          0.166942
politique     0.145032
francais      0.130713
electeurs     0.123218
citoyens      0.117831
inciter       0.116255
Name: confiance, dtype: float32

prendre


prendre      1.000000
compte       0.329663
blanc        0.179620
blancs       0.170662
votes        0.137255
election     0.083578
faire        0.075834
faut         0.074031
vote         0.065745
elections    0.059566
Name: prendre, dtype: float32

tous


tous         1.000000
ans          0.280066
francais     0.150823
elu          0.133983
vie          0.133903
tout         0.124725
candidats    0.123939
pouvoir      0.122144
exemple      0.120047
pays         0.116505
Name: tous, dtype: float32

citoyen


citoyen       1.000000
devoir        0.276008
droits        0.246411
droit         0.153318
tout          0.150404
elu           0.138855
vie           0.132004
democratie    0.120513
pays          0.112190
pouvoir       0.101933
Name: citoyen, dtype: float32

In [64]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_10[i].sort_values(ascending=False).head(10))

vote


vote              0.000065
electronique      0.000063
blanc             0.000063
reconnaissance    0.000062
obligatoire       0.000060
reconnaitre       0.000060
sanction          0.000057
belgique          0.000056
amende            0.000053
prise             0.000053
Name: vote, dtype: float32

obligatoire


obligatoire    0.000095
belgique       0.000078
rendant        0.000077
sanction       0.000074
amende         0.000071
peine          0.000068
vote           0.000060
semaine        0.000055
droits         0.000049
cas            0.000049
Name: obligatoire, dtype: float32

citoyens


citoyens       0.000196
participent    0.000124
sentent        0.000111
representes    0.000107
sort           0.000096
davantage      0.000096
sentiment      0.000091
inciter        0.000090
impression     0.000089
decisions      0.000087
Name: citoyens, dtype: float32

blanc


blanc             0.000216
reconnaissance    0.000197
reconnaitre       0.000193
prise             0.000151
compte            0.000135
pris              0.000126
comptabiliser     0.000124
prendre           0.000121
50                0.000088
majoritaire       0.000079
Name: blanc, dtype: float32

voter


voter          0.000263
aller          0.000216
obliger        0.000132
envie          0.000131
inciter        0.000112
sert           0.000104
devoir         0.000095
obligation     0.000095
ensuite        0.000094
possibilite    0.000094
Name: voter, dtype: float32

participation


participation    0.000273
faible           0.000152
insuffisante     0.000137
taux             0.000135
manque           0.000104
elections        0.000078
citoyenne        0.000077
inciter          0.000072
niveau           0.000072
non              0.000066
Name: participation, dtype: float32

elections


elections          0.000293
presidentielles    0.000193
legislatives       0.000187
presidentielle     0.000128
participent        0.000119
tour               0.000101
taux               0.000095
devraient          0.000092
participer         0.000089
jour               0.000084
Name: elections, dtype: float32

faut


faut           0.000294
redonner       0.000096
inciter        0.000089
participent    0.000082
president      0.000077
sens           0.000075
exprimer       0.000072
participer     0.000071
vie            0.000070
donner         0.000069
Name: faut, dtype: float32

compte


compte      0.000315
prise       0.000284
pris        0.000255
prendre     0.000223
blanc       0.000135
blancs      0.000133
voix        0.000104
votes       0.000102
avis        0.000089
majorite    0.000077
Name: compte, dtype: float32

elus


elus             0.000331
mandat           0.000133
deputes          0.000108
promesses        0.000108
confiance        0.000103
electeurs        0.000098
president        0.000086
interet          0.000084
representants    0.000084
nombre           0.000084
Name: elus, dtype: float32

politique


politique    0.000401
vie          0.000170
parti        0.000158
redonner     0.000141
monde        0.000117
sens         0.000114
manque       0.000103
systeme      0.000103
peuple       0.000101
partis       0.000100
Name: politique, dtype: float32

faire


faire         0.000457
mieux         0.000087
participer    0.000084
tout          0.000081
choix         0.000080
promesses     0.000079
temps         0.000078
exemple       0.000077
peuple        0.000074
pouvoir       0.000074
Name: faire, dtype: float32

non


non          0.000486
votants      0.000200
cas          0.000143
promesses    0.000116
amende       0.000091
peuple       0.000082
choix        0.000082
elu          0.000081
exemple      0.000075
candidats    0.000073
Name: non, dtype: float32

politiques


politiques    0.000504
hommes        0.000423
partis        0.000214
confiance     0.000106
promesses     0.000104
peuple        0.000089
francais      0.000081
politique     0.000080
electeurs     0.000080
inciter       0.000077
Name: politiques, dtype: float32

faible


faible           0.000541
participation    0.000152
faudrait         0.000070
inciter          0.000070
electeurs        0.000063
confiance        0.000058
elus             0.000057
elections        0.000056
faut             0.000053
politique        0.000053
Name: faible, dtype: float32

votes


votes            0.000613
blancs           0.000507
comptabiliser    0.000263
compte           0.000102
prendre          0.000093
prise            0.000091
election         0.000076
candidats        0.000065
tous             0.000063
non              0.000049
Name: votes, dtype: float32

confiance


confiance     0.000618
redonner      0.000364
manque        0.000193
politiques    0.000106
elus          0.000103
politique     0.000090
francais      0.000081
electeurs     0.000076
citoyens      0.000073
inciter       0.000072
Name: confiance, dtype: float32

prendre


prendre      0.000676
compte       0.000223
blanc        0.000121
blancs       0.000115
votes        0.000093
election     0.000057
faire        0.000051
faut         0.000050
vote         0.000044
elections    0.000040
Name: prendre, dtype: float32

tous


tous         0.000690
ans          0.000193
francais     0.000104
elu          0.000092
vie          0.000092
tout         0.000086
candidats    0.000086
pouvoir      0.000084
exemple      0.000083
pays         0.000080
Name: tous, dtype: float32

citoyen


citoyen       0.000707
devoir        0.000195
droits        0.000174
droit         0.000108
tout          0.000106
elu           0.000098
vie           0.000093
democratie    0.000085
pays          0.000079
pouvoir       0.000072
Name: citoyen, dtype: float32

In [65]:
gc.collect()

147

# Question 11 :  Faut-il prendre en compte le vote blanc ?

In [66]:
question_11 = "Faut-il prendre en compte le vote blanc ?"
qu_11,df_qu_11_one_hot,df_cov_11,df_confidence_11,df_lift_11 = compute_similarities(question_11, new_res)

In [67]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_11[i].sort_values(ascending=False).head(10))

oui


oui    28021
non        0
Name: oui, dtype: uint16

non


non    6012
oui       0
Name: non, dtype: uint16

In [68]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_11[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [69]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_11[i].sort_values(ascending=False).head(10))

oui


oui    0.000036
non         NaN
Name: oui, dtype: float32

non


non    0.000166
oui         NaN
Name: non, dtype: float32

In [70]:
gc.collect()

14

# Question 12 : Si oui, de quelle manière ?

In [71]:
question_12 = "Si oui, de quelle manière ?"
qu_12,df_qu_12_one_hot,df_cov_12,df_confidence_12,df_lift_12 = compute_similarities(question_12, new_res)

In [72]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_12[i].sort_values(ascending=False).head(10))

vote


vote           11815
blanc           8851
election        3412
candidats       2473
compte          1808
votes           1753
majoritaire     1464
candidat        1454
elections       1420
blancs          1299
Name: vote, dtype: uint16

blanc


blanc          9948
vote           8851
election       3295
candidats      2371
compte         1621
votes          1565
majoritaire    1417
elections      1403
candidat       1334
faut           1151
Name: blanc, dtype: uint16

election


election       5718
vote           3412
blanc          3295
votes          1558
candidats      1477
blancs         1350
50              987
majoritaire     797
candidat        752
compte          733
Name: election, dtype: uint16

votes


votes          5090
blancs         3090
vote           1753
blanc          1565
election       1558
exprimes       1095
candidats       929
compte          823
50              741
pourcentage     671
Name: votes, dtype: uint16

blancs


blancs         3832
votes          3090
election       1350
vote           1299
blanc           787
candidats       785
exprimes        640
compte          634
50              629
pourcentage     564
Name: blancs, dtype: uint16

candidats


candidats      3704
vote           2473
blanc          2371
election       1477
votes           929
blancs          785
elections       708
candidat        598
majoritaire     580
compte          546
Name: candidats, dtype: uint16

compte


compte       3043
vote         1808
blanc        1621
prendre       875
votes         823
election      733
blancs        634
pris          563
candidats     546
prise         458
Name: compte, dtype: uint16

elections


elections    2527
vote         1420
blanc        1403
candidats     708
votes         628
blancs        535
compte        390
election      370
refaire       369
candidat      352
Name: elections, dtype: uint16

candidat


candidat     2382
vote         1454
blanc        1334
election      752
votes         639
candidats     598
blancs        529
elu           511
aucun         419
compte        407
Name: candidat, dtype: uint16

exprimes


exprimes     2298
suffrages    1185
votes        1095
vote          830
blanc         721
blancs        640
election      518
compte        401
50            399
elu           325
Name: exprimes, dtype: uint16

50


50           2215
vote         1245
blanc        1143
election      987
votes         741
blancs        629
candidats     531
elu           404
exprimes      399
elections     314
Name: 50, dtype: uint16

majorite


majorite     2178
vote         1197
blanc        1116
election      731
votes         653
blancs        552
candidats     484
compte        396
elu           385
elections     348
Name: majorite, dtype: uint16

pourcentage


pourcentage    2092
vote            972
blanc           829
election        679
votes           671
blancs          564
candidats       370
compte          312
elections       257
elu             251
Name: pourcentage, dtype: uint16

faut


faut         1921
vote         1260
blanc        1151
election      563
votes         491
candidats     473
compte        449
blancs        388
elections     312
candidat      269
Name: faut, dtype: uint16

elu


elu         1892
vote         971
blanc        894
votes        600
blancs       513
candidat     511
election     487
compte       425
50           404
majorite     385
Name: elu, dtype: uint16

majoritaire


majoritaire    1823
vote           1464
blanc          1417
election        797
candidats       580
elections       333
candidat        232
compte          229
faut            219
votes           213
Name: majoritaire, dtype: uint16

comptabiliser


comptabiliser    1662
vote              639
blanc             483
votes             444
blancs            310
election          284
exprimes          215
faut              203
candidats         179
candidat          165
Name: comptabiliser, dtype: uint16

tour


tour         1555
vote          945
blanc         890
election      591
candidats     529
second        457
votes         409
candidat      376
blancs        363
compte        325
Name: tour, dtype: uint16

suffrages


suffrages    1437
exprimes     1185
vote          601
blanc         524
blancs        400
votes         371
election      356
compte        278
50            263
elu           241
Name: suffrages, dtype: uint16

exprime


exprime      1432
vote          996
blanc         724
suffrage      585
election      242
compte        235
candidats     220
votes         193
candidat      170
majorite      143
Name: exprime, dtype: uint16

In [73]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_12[i].sort_values(ascending=False).head(10))

vote


vote           1.000000
obligatoire    0.966637
blanc          0.889727
considere      0.831461
emporte        0.822981
majoritaire    0.803072
signifie       0.793103
arrive         0.790409
citoyen        0.767386
annule         0.752860
Name: vote, dtype: float32

blanc


blanc          1.000000
emporte        0.922360
signifie       0.782759
majoritaire    0.777290
arrive         0.769094
considere      0.767790
bulletin       0.758242
vote           0.749132
tete           0.710375
citoyen        0.707434
Name: blanc, dtype: float32

election


election          1.000000
invalidee         0.988142
annulee           0.970183
nouvelle          0.851419
invalider         0.715686
presidentielle    0.662835
annuler           0.638333
representer       0.538585
refaire           0.536032
refait            0.524528
Name: election, dtype: float32

votes


votes           1.000000
blancs          0.806367
nuls            0.668421
exprimes        0.476501
total           0.457031
nombre          0.407381
exemple         0.367123
25              0.359517
20              0.359060
pourcentages    0.351421
Name: votes, dtype: float32

blancs


blancs       1.000000
nuls         0.629825
votes        0.607073
bulletins    0.551643
nombre       0.381331
exemple      0.342466
20           0.342282
40           0.340176
25           0.329305
30           0.301099
Name: blancs, dtype: float32

candidats


candidats      1.000000
representer    0.641479
presenter      0.606383
programmes     0.532300
aucun          0.456760
tous           0.453503
emporte        0.440994
arrive         0.417407
nouvelle       0.415693
2              0.408602
Name: candidats, dtype: float32

compte


compte        1.000000
prise         0.940452
pris          0.924466
prendre       0.827032
calcul        0.300699
abstention    0.259629
faudrait      0.251656
second        0.249520
politiques    0.241685
faut          0.233732
Name: compte, dtype: float32

elections


elections      1.000000
nouvelles      0.716327
refaire        0.298785
recommencer    0.267677
second         0.226488
cas            0.207743
tete           0.203170
arrive         0.200710
tour           0.193569
candidats      0.191145
Name: elections, dtype: float32

candidat


candidat    1.000000
aucun       0.510353
score       0.375465
second      0.309021
tete        0.302594
arrive      0.291297
elu         0.270085
entiere     0.264484
tour        0.241801
2           0.238710
Name: candidat, dtype: float32

exprimes


exprimes     1.000000
suffrages    0.824635
bulletins    0.238263
nuls         0.221053
votes        0.215128
comptant     0.192453
50           0.180135
elu          0.171776
exemple      0.167123
blancs       0.167015
Name: exprimes, dtype: float32

50


50            1.000000
inscrits      0.330754
1             0.306792
annulee       0.279817
depasse       0.273622
votants       0.242820
annulation    0.233058
atteint       0.226640
superieur     0.224432
elu           0.213531
Name: 50, dtype: float32

majorite


majorite       1.000000
absolue        0.964968
second         0.257198
cas            0.255902
calcul         0.242424
elu            0.203488
tour           0.202572
aucun          0.185140
electeurs      0.174917
representer    0.163987
Name: majorite, dtype: float32

pourcentage


pourcentage    1.000000
partir         0.299087
definir        0.283372
superieur      0.176136
votants        0.172324
exemple        0.161644
blancs         0.147182
elus           0.143892
voix           0.141296
elu            0.132664
Name: pourcentage, dtype: float32

faut


faut           1.000000
recommencer    0.305556
revoter        0.292683
prendre        0.238185
aucun          0.196102
voter          0.174107
refaire        0.166802
faire          0.164370
citoyens       0.157303
choix          0.152146
Name: faut, dtype: float32

elu


elu          1.000000
president    0.548223
voix         0.265418
inscrits     0.255319
second       0.241843
2            0.234409
candidat     0.214526
electeurs    0.207921
exemple      0.205479
tour         0.199357
Name: elu, dtype: float32

majoritaire


majoritaire    1.000000
nouvelle       0.237062
nouvelles      0.224490
scrutin        0.211435
representer    0.196141
cas            0.169972
candidats      0.156587
refaire        0.156275
blanc          0.142441
election       0.139384
Name: majoritaire, dtype: float32

comptabiliser


comptabiliser    1.000000
faut             0.105674
exprimes         0.093560
resultats        0.092917
suffrages        0.089770
votes            0.087230
blancs           0.080898
nombre           0.073082
candidat         0.069270
pourcentage      0.062141
Name: comptabiliser, dtype: float32

tour


tour              1.000000
second            0.877159
1er               0.784946
presidentielle    0.436782
2                 0.393548
tete              0.243516
arrive            0.236234
exemple           0.224658
elu               0.163848
cas               0.163362
Name: tour, dtype: float32

suffrages


suffrages    1.000000
exprimes     0.515666
elu          0.127378
50           0.118736
scrutin      0.117584
tour         0.109968
nombre       0.106368
blancs       0.104384
majorite     0.092287
compte       0.091357
Name: suffrages, dtype: float32

exprime


exprime         1.000000
suffrage        0.768725
comptabilise    0.148344
compter         0.131227
vote            0.084300
compte          0.077226
elu             0.073467
blanc           0.072778
candidat        0.071369
tour            0.068810
Name: exprime, dtype: float32

In [74]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_12[i].sort_values(ascending=False).head(10))

vote


vote           0.000085
obligatoire    0.000082
blanc          0.000075
considere      0.000070
emporte        0.000070
majoritaire    0.000068
signifie       0.000067
arrive         0.000067
citoyen        0.000065
annule         0.000064
Name: vote, dtype: float32

blanc


blanc          0.000101
emporte        0.000093
signifie       0.000079
majoritaire    0.000078
arrive         0.000077
considere      0.000077
bulletin       0.000076
vote           0.000075
tete           0.000071
citoyen        0.000071
Name: blanc, dtype: float32

election


election          0.000175
invalidee         0.000173
annulee           0.000170
nouvelle          0.000149
invalider         0.000125
presidentielle    0.000116
annuler           0.000112
representer       0.000094
refaire           0.000094
refait            0.000092
Name: election, dtype: float32

votes


votes           0.000196
blancs          0.000158
nuls            0.000131
exprimes        0.000094
total           0.000090
nombre          0.000080
exemple         0.000072
25              0.000071
20              0.000071
pourcentages    0.000069
Name: votes, dtype: float32

blancs


blancs       0.000261
nuls         0.000164
votes        0.000158
bulletins    0.000144
nombre       0.000100
exemple      0.000089
20           0.000089
40           0.000089
25           0.000086
30           0.000079
Name: blancs, dtype: float32

candidats


candidats      0.000270
representer    0.000173
presenter      0.000164
programmes     0.000144
aucun          0.000123
tous           0.000122
emporte        0.000119
arrive         0.000113
nouvelle       0.000112
2              0.000110
Name: candidats, dtype: float32

compte


compte        0.000329
prise         0.000309
pris          0.000304
prendre       0.000272
calcul        0.000099
abstention    0.000085
faudrait      0.000083
second        0.000082
politiques    0.000079
faut          0.000077
Name: compte, dtype: float32

elections


elections      0.000396
nouvelles      0.000283
refaire        0.000118
recommencer    0.000106
second         0.000090
cas            0.000082
tete           0.000080
arrive         0.000079
tour           0.000077
candidats      0.000076
Name: elections, dtype: float32

candidat


candidat    0.000420
aucun       0.000214
score       0.000158
second      0.000130
tete        0.000127
arrive      0.000122
elu         0.000113
entiere     0.000111
tour        0.000102
2           0.000100
Name: candidat, dtype: float32

exprimes


exprimes     0.000435
suffrages    0.000359
bulletins    0.000104
nuls         0.000096
votes        0.000094
comptant     0.000084
50           0.000078
elu          0.000075
exemple      0.000073
blancs       0.000073
Name: exprimes, dtype: float32

50


50            0.000451
inscrits      0.000149
1             0.000139
annulee       0.000126
depasse       0.000124
votants       0.000110
annulation    0.000105
atteint       0.000102
superieur     0.000101
elu           0.000096
Name: 50, dtype: float32

majorite


majorite       0.000459
absolue        0.000443
second         0.000118
cas            0.000117
calcul         0.000111
elu            0.000093
tour           0.000093
aucun          0.000085
electeurs      0.000080
representer    0.000075
Name: majorite, dtype: float32

pourcentage


pourcentage    0.000478
partir         0.000143
definir        0.000135
superieur      0.000084
votants        0.000082
exemple        0.000077
blancs         0.000070
elus           0.000069
voix           0.000068
elu            0.000063
Name: pourcentage, dtype: float32

faut


faut           0.000521
recommencer    0.000159
revoter        0.000152
prendre        0.000124
aucun          0.000102
voter          0.000091
refaire        0.000087
faire          0.000086
citoyens       0.000082
choix          0.000079
Name: faut, dtype: float32

elu


elu          0.000529
president    0.000290
voix         0.000140
inscrits     0.000135
second       0.000128
2            0.000124
candidat     0.000113
electeurs    0.000110
exemple      0.000109
tour         0.000105
Name: elu, dtype: float32

majoritaire


majoritaire    0.000549
nouvelle       0.000130
nouvelles      0.000123
scrutin        0.000116
representer    0.000108
cas            0.000093
candidats      0.000086
refaire        0.000086
blanc          0.000078
election       0.000076
Name: majoritaire, dtype: float32

comptabiliser


comptabiliser    0.000602
faut             0.000064
exprimes         0.000056
resultats        0.000056
suffrages        0.000054
votes            0.000052
blancs           0.000049
nombre           0.000044
candidat         0.000042
pourcentage      0.000037
Name: comptabiliser, dtype: float32

tour


tour              0.000643
second            0.000564
1er               0.000505
presidentielle    0.000281
2                 0.000253
tete              0.000157
arrive            0.000152
exemple           0.000144
elu               0.000105
cas               0.000105
Name: tour, dtype: float32

suffrages


suffrages    0.000696
exprimes     0.000359
elu          0.000089
50           0.000083
scrutin      0.000082
tour         0.000077
nombre       0.000074
blancs       0.000073
majorite     0.000064
compte       0.000064
Name: suffrages, dtype: float32

exprime


exprime         0.000698
suffrage        0.000537
comptabilise    0.000104
compter         0.000092
vote            0.000059
compte          0.000054
elu             0.000051
blanc           0.000051
candidat        0.000050
tour            0.000048
Name: exprime, dtype: float32

In [75]:
gc.collect()

147

# Question 13 : Que faudrait-il faire aujourd'hui pour mieux associer les citoyens aux grandes orientations et à la décision publique ? Comment mettre en place une démocratie plus participative ?

In [76]:
question_13 = "Que faudrait-il faire aujourd'hui pour mieux associer les citoyens aux grandes orientations et à la décision publique ? Comment mettre en place une démocratie plus participative ?"
qu_13,df_qu_13_one_hot,df_cov_13,df_confidence_13,df_lift_13 = compute_similarities(question_13, new_res)

In [77]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_13[i].sort_values(ascending=False).head(10))

referendum


referendum    7479
initiative    1541
citoyens      1341
citoyenne     1013
sujets         870
faire          806
questions      788
place          775
vote           670
decisions      617
Name: referendum, dtype: uint16

citoyens


citoyens      6859
sort          1574
referendum    1341
elus          1240
faire         1231
tires          949
decisions      904
place          811
tous           777
vote           751
Name: citoyens, dtype: uint16

faire


faire          3564
citoyens       1231
referendum      806
elus            544
faut            491
debat           453
decisions       433
tous            408
referendums     402
participer      383
Name: faire, dtype: uint16

elus


elus          2873
citoyens      1240
faire          544
referendum     509
sort           378
non            374
democratie     366
decisions      362
faut           352
tous           350
Name: elus, dtype: uint16

referendums


referendums    2740
citoyens        568
sujets          419
faire           402
locaux          392
questions       346
place           315
referendum      303
organiser       289
initiative      272
Name: referendums, dtype: uint16

ric


ric           2530
referendum     536
place          389
citoyens       386
mettre         253
initiative     222
citoyenne      208
sujets         203
faire          194
tout           189
Name: ric, dtype: uint16

place


place         2526
mettre        1425
citoyens       811
referendum     775
mise           580
ric            389
initiative     383
faire          364
citoyenne      350
elus           326
Name: place, dtype: uint16

vote


vote           2510
citoyens        751
referendum      670
obligatoire     489
faire           359
elus            308
place           305
tous            278
non             275
internet        272
Name: vote, dtype: uint16

debat


debat         2456
grand         1340
citoyens       676
faire          453
referendum     398
national       344
tous           296
internet       294
exemple        265
sujets         262
Name: debat, dtype: uint16

sort


sort          2356
citoyens      1574
tires         1091
tirage         807
assemblee      546
elus           378
referendum     346
faire          337
participer     277
place          264
Name: sort, dtype: uint16

decisions


decisions     2190
citoyens       904
referendum     617
grandes        505
faire          433
elus           362
prendre        317
niveau         274
sort           263
prises         258
Name: decisions, dtype: uint16

sujets


sujets         2157
referendum      870
citoyens        623
referendums     419
grands          410
tous            382
faire           350
societe         343
debat           262
exemple         261
Name: sujets, dtype: uint16

internet


internet         2041
citoyens          523
referendum        377
faire             325
debat             294
vote              272
site              258
avis              251
consultations     223
place             220
Name: internet, dtype: uint16

tous


tous          2040
citoyens       777
referendum     546
faire          408
sujets         382
ans            359
elus           350
debat          296
place          286
faut           281
Name: tous, dtype: uint16

initiative


initiative     1939
referendum     1541
citoyenne      1009
populaire       506
citoyens        501
place           383
mettre          278
referendums     272
ric             222
elus            204
Name: initiative, dtype: uint16

faut


faut          1933
citoyens       727
faire          491
referendum     472
democratie     382
elus           352
tout           295
tous           281
place          271
debat          258
Name: faut, dtype: uint16

democratie


democratie       1932
participative     995
citoyens          605
faut              382
referendum        370
elus              366
faire             342
place             277
niveau            271
tout              250
Name: democratie, dtype: uint16

niveau


niveau        1896
local          908
citoyens       627
national       564
referendum     472
faire          357
elus           279
decisions      274
democratie     271
place          253
Name: niveau, dtype: uint16

debats


debats        1852
citoyens       658
organiser      393
faire          313
elus           283
referendum     264
grands         242
sujets         208
niveau         207
locaux         202
Name: debats, dtype: uint16

mettre


mettre         1827
place          1425
citoyens        574
referendum      520
faire           280
initiative      278
ric             253
faut            235
elus            232
referendums     228
Name: mettre, dtype: uint16

In [78]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_13[i].sort_values(ascending=False).head(10))

referendum


referendum      1.000000
initiative      0.794740
recours         0.772853
populaire       0.743553
signatures      0.662745
citoyenne       0.633125
constitution    0.575540
resultat        0.564477
soumettre       0.468310
importantes     0.459610
Name: referendum, dtype: float32

citoyens


citoyens      1.000000
tires         0.850358
associer      0.696466
tirer         0.685259
sort          0.668082
puissent      0.627820
pourraient    0.592105
participer    0.584541
ensemble      0.546713
senat         0.539062
Name: citoyens, dtype: float32

faire


faire           1.000000
remonter        0.704000
participer      0.370048
propositions    0.317661
ensuite         0.311392
sens            0.294798
confiance       0.292683
expliquer       0.286458
maniere         0.276995
moyens          0.275676
Name: faire, dtype: float32

elus


elus             1.000000
terrain          0.387833
confiance        0.349593
electeurs        0.313620
representants    0.305743
role             0.292952
locaux           0.284272
devraient        0.273902
mandat           0.260805
travail          0.244726
Name: elus, dtype: float32

referendums


referendums    1.000000
nationaux      0.381062
locaux         0.329689
organiser      0.221286
questions      0.200231
sujets         0.194251
suisse         0.163362
societe        0.157841
grands         0.147638
choix          0.140547
Name: referendums, dtype: float32

ric


ric             1.000000
rip             0.317680
instaurer       0.200361
constitution    0.190647
mise            0.172460
place           0.153998
peuple          0.140845
mettre          0.138478
citoyenne       0.130000
tout            0.115526
Name: ric, dtype: float32

place


place           1.000000
mettre          0.779967
mise            0.775401
systeme         0.246468
citoyenne       0.218750
initiative      0.197525
pouvoir         0.184292
constitution    0.183453
populaire       0.181948
nationale       0.175708
Name: place, dtype: float32

vote


vote            1.000000
obligatoire     0.645119
electronique    0.574144
droit           0.336562
majorite        0.241597
voter           0.232833
votes           0.228482
parlement       0.224401
loi             0.216270
lois            0.204392
Name: vote, dtype: float32

debat


debat       1.000000
grand       0.815581
public      0.373016
bonne       0.352622
type        0.315789
national    0.271080
idee        0.235294
exprimer    0.216169
idees       0.208413
site        0.198291
Name: debat, dtype: float32

sort


sort           1.000000
tires          0.977599
tirage         0.975816
tirer          0.824701
cese           0.463320
senat          0.458984
electorales    0.427509
assemblees     0.421875
assemblee      0.397959
conseil        0.302505
Name: sort, dtype: float32

decisions


decisions      1.000000
prises         0.704918
importantes    0.434540
grandes        0.335771
prendre        0.322154
associer       0.274428
publiques      0.247842
locales        0.235207
prise          0.230263
participer     0.216425
Name: decisions, dtype: float32

sujets


sujets         1.000000
importants     0.686901
grands         0.403543
societe        0.349287
tous           0.187255
locaux         0.172414
vie            0.165824
exemple        0.159829
referendums    0.152920
organiser      0.140123
Name: sujets, dtype: float32

internet


internet         1.000000
site             0.441026
mairie           0.289062
utiliser         0.223214
consultation     0.201746
consultations    0.195786
votes            0.186228
avis             0.159669
voter            0.139485
propositions     0.120413
Name: internet, dtype: float32

tous


tous        1.000000
niveaux     0.550562
ans         0.490437
mois        0.357320
5           0.311653
2           0.253968
3           0.246988
france      0.227979
vie         0.206269
francais    0.201772
Name: tous, dtype: float32

initiative


initiative      1.000000
populaire       0.724928
citoyenne       0.630625
signatures      0.427451
constitution    0.262590
instaurer       0.225632
referendum      0.206044
nombre          0.187209
1               0.181149
possibilite     0.179661
Name: initiative, dtype: float32

faut


faut             1.000000
democratie       0.197723
participative    0.195455
france           0.184801
temps            0.184244
tout             0.180318
politique        0.178324
population       0.177258
elu              0.176012
representants    0.170608
Name: faut, dtype: float32

democratie


democratie        1.000000
participative     0.904545
representative    0.739683
france            0.208981
faut              0.197620
pays              0.185606
representants     0.175676
cas               0.174342
mieux             0.165289
temps             0.165184
Name: democratie, dtype: float32

niveau


niveau           1.000000
local            0.618108
regional         0.560091
national         0.444444
commune          0.335341
communes         0.312812
region           0.291566
participative    0.167273
participation    0.145861
projets          0.145518
Name: niveau, dtype: float32

debats


debats        1.000000
publics       0.431373
organiser     0.300919
grands        0.238189
locaux        0.169891
publiques     0.149199
reunions      0.134091
participer    0.128502
politiques    0.109290
niveau        0.109177
Name: debats, dtype: float32

mettre


mettre          1.000000
place           0.564133
oeuvre          0.446565
systeme         0.186813
initiative      0.143373
faudrait        0.141711
citoyenne       0.141250
faut            0.121573
propositions    0.119266
nombre          0.118605
Name: mettre, dtype: float32

In [79]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_13[i].sort_values(ascending=False).head(10))

referendum


referendum      0.000134
initiative      0.000106
recours         0.000103
populaire       0.000099
signatures      0.000089
citoyenne       0.000085
constitution    0.000077
resultat        0.000075
soumettre       0.000063
importantes     0.000061
Name: referendum, dtype: float32

citoyens


citoyens      0.000146
tires         0.000124
associer      0.000102
tirer         0.000100
sort          0.000097
puissent      0.000092
pourraient    0.000086
participer    0.000085
ensemble      0.000080
senat         0.000079
Name: citoyens, dtype: float32

faire


faire           0.000281
remonter        0.000198
participer      0.000104
propositions    0.000089
ensuite         0.000087
sens            0.000083
confiance       0.000082
expliquer       0.000080
maniere         0.000078
moyens          0.000077
Name: faire, dtype: float32

elus


elus             0.000348
terrain          0.000135
confiance        0.000122
electeurs        0.000109
representants    0.000106
role             0.000102
locaux           0.000099
devraient        0.000095
mandat           0.000091
travail          0.000085
Name: elus, dtype: float32

referendums


referendums    0.000365
nationaux      0.000139
locaux         0.000120
organiser      0.000081
questions      0.000073
sujets         0.000071
suisse         0.000060
societe        0.000058
grands         0.000054
choix          0.000051
Name: referendums, dtype: float32

ric


ric             0.000395
rip             0.000126
instaurer       0.000079
constitution    0.000075
mise            0.000068
place           0.000061
peuple          0.000056
mettre          0.000055
citoyenne       0.000051
tout            0.000046
Name: ric, dtype: float32

place


place           0.000396
mettre          0.000309
mise            0.000307
systeme         0.000098
citoyenne       0.000087
initiative      0.000078
pouvoir         0.000073
constitution    0.000073
populaire       0.000072
nationale       0.000070
Name: place, dtype: float32

vote


vote            0.000398
obligatoire     0.000257
electronique    0.000229
droit           0.000134
majorite        0.000096
voter           0.000093
votes           0.000091
parlement       0.000089
loi             0.000086
lois            0.000081
Name: vote, dtype: float32

debat


debat       0.000407
grand       0.000332
public      0.000152
bonne       0.000144
type        0.000129
national    0.000110
idee        0.000096
exprimer    0.000088
idees       0.000085
site        0.000081
Name: debat, dtype: float32

sort


sort           0.000424
tires          0.000415
tirage         0.000414
tirer          0.000350
cese           0.000197
senat          0.000195
electorales    0.000181
assemblees     0.000179
assemblee      0.000169
conseil        0.000128
Name: sort, dtype: float32

decisions


decisions      0.000457
prises         0.000322
importantes    0.000198
grandes        0.000153
prendre        0.000147
associer       0.000125
publiques      0.000113
locales        0.000107
prise          0.000105
participer     0.000099
Name: decisions, dtype: float32

sujets


sujets         0.000464
importants     0.000318
grands         0.000187
societe        0.000162
tous           0.000087
locaux         0.000080
vie            0.000077
exemple        0.000074
referendums    0.000071
organiser      0.000065
Name: sujets, dtype: float32

internet


internet         0.000490
site             0.000216
mairie           0.000142
utiliser         0.000109
consultation     0.000099
consultations    0.000096
votes            0.000091
avis             0.000078
voter            0.000068
propositions     0.000059
Name: internet, dtype: float32

tous


tous        0.000490
niveaux     0.000270
ans         0.000240
mois        0.000175
5           0.000153
2           0.000124
3           0.000121
france      0.000112
vie         0.000101
francais    0.000099
Name: tous, dtype: float32

initiative


initiative      0.000516
populaire       0.000374
citoyenne       0.000325
signatures      0.000220
constitution    0.000135
instaurer       0.000116
referendum      0.000106
nombre          0.000097
1               0.000093
possibilite     0.000093
Name: initiative, dtype: float32

faut


faut             0.000517
democratie       0.000102
participative    0.000101
france           0.000096
temps            0.000095
tout             0.000093
politique        0.000092
population       0.000092
elu              0.000091
representants    0.000088
Name: faut, dtype: float32

democratie


democratie        0.000518
participative     0.000468
representative    0.000383
france            0.000108
faut              0.000102
pays              0.000096
representants     0.000091
cas               0.000090
mieux             0.000086
temps             0.000085
Name: democratie, dtype: float32

niveau


niveau           0.000527
local            0.000326
regional         0.000295
national         0.000234
commune          0.000177
communes         0.000165
region           0.000154
participative    0.000088
participation    0.000077
projets          0.000077
Name: niveau, dtype: float32

debats


debats        0.000540
publics       0.000233
organiser     0.000162
grands        0.000129
locaux        0.000092
publiques     0.000081
reunions      0.000072
participer    0.000069
politiques    0.000059
niveau        0.000059
Name: debats, dtype: float32

mettre


mettre          0.000547
place           0.000309
oeuvre          0.000244
systeme         0.000102
initiative      0.000078
faudrait        0.000078
citoyenne       0.000077
faut            0.000067
propositions    0.000065
nombre          0.000065
Name: mettre, dtype: float32

In [80]:
gc.collect()

147

# Question 14 : Faut-il faciliter le déclenchement du référendum d'initiative partagée (le RIP est organisé à l'initiative de membres du Parlement soutenu par une partie du corps électoral) qui est applicable depuis 2015 ?

In [81]:
question_14 = "Faut-il faciliter le déclenchement du référendum d'initiative partagée (le RIP est organisé à l'initiative de membres du Parlement soutenu par une partie du corps électoral) qui est applicable depuis 2015 ?"
qu_14,df_qu_14_one_hot,df_cov_14,df_confidence_14,df_lift_14 = compute_similarities(question_14, new_res)

In [82]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_14[i].sort_values(ascending=False).head(10))

oui


oui     17588
sais        0
non         0
Name: oui, dtype: uint16

non


non     8904
sais       0
oui        0
Name: non, dtype: uint16

sais


sais    6835
oui        0
non        0
Name: sais, dtype: uint16

In [83]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_14[i].sort_values(ascending=False).head(10))

oui


oui     1.0
sais    0.0
non     0.0
Name: oui, dtype: float32

non


non     1.0
sais    0.0
oui     0.0
Name: non, dtype: float32

sais


sais    1.0
oui     0.0
non     0.0
Name: sais, dtype: float32

In [84]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_14[i].sort_values(ascending=False).head(10))

oui


oui     0.000057
non          NaN
sais         NaN
Name: oui, dtype: float32

non


non     0.000112
oui          NaN
sais         NaN
Name: non, dtype: float32

sais


sais    0.000146
non          NaN
oui          NaN
Name: sais, dtype: float32

In [85]:
gc.collect()

21

# Question 15 : Si oui, comment ? (RIP)

In [86]:
question_15 = "Si oui, comment ?_RIP"
qu_15,df_qu_15_one_hot,df_cov_15,df_confidence_15,df_lift_15 = compute_similarities(question_15, new_res)

In [88]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_15[i].sort_values(ascending=False).head(10))

referendum


referendum    3288
initiative     887
citoyens       772
nombre         557
faut           509
non            416
citoyenne      400
question       393
questions      349
vote           331
Name: referendum, dtype: uint16

citoyens


citoyens          2871
nombre             839
referendum         772
initiative         621
rip                473
elus               447
parlementaires     433
faut               391
ric                304
parlement          263
Name: citoyens, dtype: uint16

nombre


nombre            2432
citoyens           839
referendum         557
signatures         491
parlementaires     417
elus               330
initiative         321
rip                291
necessaires        286
declenchement      253
Name: nombre, dtype: uint16

rip


rip              1999
ric               520
citoyens          473
faut              319
referendum        311
nombre            291
initiative        280
declenchement     228
parlement         208
non               201
Name: rip, dtype: uint16

initiative


initiative        1754
referendum         887
citoyens           621
citoyenne          433
parlement          340
nombre             321
rip                280
faut               258
parlementaires     253
populaire          240
Name: initiative, dtype: uint16

ric


ric           1599
rip            520
referendum     316
citoyens       304
faut           288
initiative     234
non            186
place          163
tout           146
elus           138
Name: ric, dtype: uint16

faut


faut          1544
referendum     509
citoyens       391
rip            319
ric            288
initiative     258
nombre         207
faire          180
non            173
elus           156
Name: faut, dtype: uint16

declenchement


declenchement    1309
citoyens          254
nombre            253
seuil             250
referendum        237
rip               228
seuils            226
conditions        183
initiative        151
faut              141
Name: declenchement, dtype: uint16

elus


elus          1158
citoyens       447
nombre         330
referendum     297
initiative     202
rip            185
non            159
faut           156
ric            138
signatures     122
Name: elus, dtype: uint16

non


non           1150
referendum     416
oui            309
citoyens       235
initiative     203
rip            201
question       193
ric            186
faut           173
elus           159
Name: non, dtype: uint16

parlementaires


parlementaires    1098
citoyens           433
nombre             417
referendum         263
initiative         253
rip                199
1                  145
faut               140
signatures         134
necessaires        127
Name: parlementaires, dtype: uint16

signatures


signatures        1077
nombre             491
referendum         274
citoyens           245
000                210
petition           178
initiative         173
1                  163
rip                134
parlementaires     134
Name: signatures, dtype: uint16

sujets


sujets        1061
referendum     318
citoyens       209
tous           192
societe        147
faut           141
non            131
rip            129
nombre         128
exemple        125
Name: sujets, dtype: uint16

vote


vote          1036
referendum     331
citoyens       214
nombre         135
faut           134
non            128
internet       127
rip            123
faire          122
question       118
Name: vote, dtype: uint16

faire


faire         1016
referendum     331
citoyens       234
faut           180
rip            152
ric            132
nombre         127
tout           125
vote           122
question       120
Name: faire, dtype: uint16

parlement


parlement     996
initiative    340
membres       291
referendum    289
citoyens      263
rip           208
nombre        182
faut          152
corps         135
electoral     130
Name: parlement, dtype: uint16

question


question      971
referendum    393
citoyens      198
non           193
rip           153
faut          151
questions     138
oui           135
faire         120
reponse       120
Name: question, dtype: uint16

questions


questions     950
referendum    349
citoyens      179
non           157
question      138
oui           133
faut          128
rip           126
voir            0
prendre         0
Name: questions, dtype: uint16

exemple


exemple       858
referendum    318
citoyens      238
nombre        194
initiative    143
rip           133
sujets        125
faut          121
tous          108
signatures    102
Name: exemple, dtype: uint16

tout


tout          812
referendum    299
citoyens      167
faut          150
ric           146
rip           136
faire         125
non           113
nombre        112
initiative    109
Name: tout, dtype: uint16

In [89]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_15[i].sort_values(ascending=False).head(10))

referendum


referendum      1.000000
citoyenne       0.693241
populaire       0.676737
president       0.535714
national        0.520231
initiative      0.505701
constitution    0.473373
choix           0.439216
gouvernement    0.437824
proposition     0.428571
Name: referendum, dtype: float32

citoyens


citoyens          1.000000
parlementaires    0.394353
elus              0.386010
possibilite       0.377698
millions          0.376106
declenche         0.366559
demande           0.355828
initiative        0.354048
avis              0.350993
pouvoir           0.350904
Name: citoyens, dtype: float32

nombre


nombre         1.000000
necessaires    0.709677
signataires    0.602113
reduire        0.591479
diminuer       0.566667
signature      0.504918
signatures     0.455896
minimum        0.453376
definir        0.400000
baisser        0.400000
Name: nombre, dtype: float32

rip


rip           1.000000
declenche     0.337621
ric           0.325203
jamais        0.277162
declencher    0.233926
pouvoir       0.212349
parlement     0.208835
faut          0.206606
conditions    0.206490
electoral     0.192537
Name: rip, dtype: float32

initiative


initiative       1.000000
citoyenne        0.750433
populaire        0.725076
membres          0.417143
parlementaire    0.360704
parlement        0.341365
referendum       0.269769
electoral        0.262687
corps            0.262626
peuple           0.231520
Name: initiative, dtype: float32

ric


ric          1.000000
rip          0.260130
place        0.206853
citoyenne    0.199307
faut         0.186529
mettre       0.182310
peuple       0.181311
tout         0.179803
non          0.161739
oui          0.143766
Name: ric, dtype: float32

faut


faut           1.000000
mettre         0.194946
referendums    0.192453
citoyenne      0.187175
tout           0.184729
ric            0.180113
peuple         0.178522
faire          0.177165
pouvoir        0.171687
rip            0.159580
Name: faut, dtype: float32

declenchement


declenchement     1.000000
seuil             0.317259
seuils            0.315202
abaisser          0.292308
conditions        0.269911
rip               0.114057
parlementaires    0.113843
nombre            0.104030
faut              0.091321
citoyens          0.088471
Name: declenchement, dtype: float32

elus


elus          1.000000
pouvoir       0.158133
peuple        0.157601
citoyens      0.155695
non           0.138261
nombre        0.135691
initiative    0.115165
signatures    0.113278
faire         0.106299
faut          0.101036
Name: elus, dtype: float32

non


non           1.000000
oui           0.393130
question      0.198764
peuple        0.181311
questions     0.165263
tous          0.146724
tout          0.139163
elus          0.137306
referendum    0.126521
vote          0.123552
Name: non, dtype: float32

parlementaires


parlementaires    1.000000
necessaires       0.315136
10                0.265487
1                 0.194110
electeurs         0.185693
nombre            0.171464
electoral         0.164179
corps             0.161616
citoyens          0.150819
initiative        0.144242
Name: parlementaires, dtype: float32

signatures


signatures        1.000000
000               0.423387
million           0.285714
necessaires       0.277916
petition          0.257225
millions          0.245575
1                 0.218206
nombre            0.201891
declencher        0.151847
parlementaires    0.122040
Name: signatures, dtype: float32

sujets


sujets        1.000000
societe       0.381818
tous          0.273504
exemple       0.145688
tout          0.126847
non           0.113913
faire         0.112205
referendum    0.096715
faut          0.091321
citoyens      0.072797
Name: sujets, dtype: float32

vote


vote          1.000000
internet      0.187040
loi           0.165584
question      0.121524
faire         0.120079
non           0.111304
parlement     0.101406
referendum    0.100669
faut          0.086788
citoyens      0.074538
Name: vote, dtype: float32

faire


faire         1.000000
tout          0.153941
tous          0.150997
question      0.123584
vote          0.117761
faut          0.116580
sujets        0.107446
referendum    0.100669
elus          0.093264
non           0.089565
Name: faire, dtype: float32

parlement


parlement     1.000000
membres       0.831429
corps         0.194805
electoral     0.194030
initiative    0.193843
loi           0.167208
rip           0.104052
non           0.100000
faut          0.098446
vote          0.097490
Name: parlement, dtype: float32

question


question       1.000000
reponse        0.376176
referendums    0.192453
oui            0.171756
non            0.167826
questions      0.145263
referendum     0.119526
faire          0.118110
vote           0.113900
faut           0.097798
Name: question, dtype: float32

questions


questions     1.000000
oui           0.169211
question      0.142122
non           0.136522
referendum    0.106144
faut          0.082902
rip           0.063032
citoyens      0.062348
voir          0.000000
mise          0.000000
Name: questions, dtype: float32

exemple


exemple       1.000000
tous          0.153846
1             0.136546
sujets        0.117813
referendum    0.096715
signatures    0.094708
citoyens      0.082898
initiative    0.081528
nombre        0.079770
faut          0.078368
Name: exemple, dtype: float32

tout


tout          1.000000
faire         0.123031
non           0.098261
faut          0.097150
sujets        0.097078
ric           0.091307
referendum    0.090937
rip           0.068034
initiative    0.062144
citoyens      0.058168
Name: tout, dtype: float32

In [90]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_15[i].sort_values(ascending=False).head(10))

referendum


referendum      0.000304
citoyenne       0.000211
populaire       0.000206
president       0.000163
national        0.000158
initiative      0.000154
constitution    0.000144
choix           0.000134
gouvernement    0.000133
proposition     0.000130
Name: referendum, dtype: float32

citoyens


citoyens          0.000348
parlementaires    0.000137
elus              0.000134
possibilite       0.000132
millions          0.000131
declenche         0.000128
demande           0.000124
initiative        0.000123
avis              0.000122
pouvoir           0.000122
Name: citoyens, dtype: float32

nombre


nombre         0.000411
necessaires    0.000292
signataires    0.000248
reduire        0.000243
diminuer       0.000233
signature      0.000208
signatures     0.000187
minimum        0.000186
baisser        0.000164
definir        0.000164
Name: nombre, dtype: float32

rip


rip           0.000500
declenche     0.000169
ric           0.000163
jamais        0.000139
declencher    0.000117
pouvoir       0.000106
parlement     0.000104
faut          0.000103
conditions    0.000103
electoral     0.000096
Name: rip, dtype: float32

initiative


initiative       0.000570
citoyenne        0.000428
populaire        0.000413
membres          0.000238
parlementaire    0.000206
parlement        0.000195
referendum       0.000154
electoral        0.000150
corps            0.000150
peuple           0.000132
Name: initiative, dtype: float32

ric


ric          0.000625
rip          0.000163
place        0.000129
citoyenne    0.000125
faut         0.000117
mettre       0.000114
peuple       0.000113
tout         0.000112
non          0.000101
oui          0.000090
Name: ric, dtype: float32

faut


faut           0.000648
mettre         0.000126
referendums    0.000125
citoyenne      0.000121
tout           0.000120
ric            0.000117
peuple         0.000116
faire          0.000115
pouvoir        0.000111
rip            0.000103
Name: faut, dtype: float32

declenchement


declenchement     0.000764
seuil             0.000242
seuils            0.000241
abaisser          0.000223
conditions        0.000206
rip               0.000087
parlementaires    0.000087
nombre            0.000079
faut              0.000070
citoyens          0.000068
Name: declenchement, dtype: float32

elus


elus          0.000864
pouvoir       0.000137
peuple        0.000136
citoyens      0.000134
non           0.000119
nombre        0.000117
initiative    0.000099
signatures    0.000098
faire         0.000092
faut          0.000087
Name: elus, dtype: float32

non


non           0.000870
oui           0.000342
question      0.000173
peuple        0.000158
questions     0.000144
tous          0.000128
tout          0.000121
elus          0.000119
referendum    0.000110
vote          0.000107
Name: non, dtype: float32

parlementaires


parlementaires    0.000911
necessaires       0.000287
10                0.000242
1                 0.000177
electeurs         0.000169
nombre            0.000156
electoral         0.000150
corps             0.000147
citoyens          0.000137
initiative        0.000131
Name: parlementaires, dtype: float32

signatures


signatures        0.000929
000               0.000393
million           0.000265
necessaires       0.000258
petition          0.000239
millions          0.000228
1                 0.000203
nombre            0.000187
declencher        0.000141
parlementaires    0.000113
Name: signatures, dtype: float32

sujets


sujets        0.000943
societe       0.000360
tous          0.000258
exemple       0.000137
tout          0.000120
non           0.000107
faire         0.000106
referendum    0.000091
faut          0.000086
citoyens      0.000069
Name: sujets, dtype: float32

vote


vote          0.000965
internet      0.000181
loi           0.000160
question      0.000117
faire         0.000116
non           0.000107
parlement     0.000098
referendum    0.000097
faut          0.000084
citoyens      0.000072
Name: vote, dtype: float32

faire


faire         0.000984
tout          0.000152
tous          0.000149
question      0.000122
vote          0.000116
faut          0.000115
sujets        0.000106
referendum    0.000099
elus          0.000092
non           0.000088
Name: faire, dtype: float32

parlement


parlement     0.001004
membres       0.000835
corps         0.000196
electoral     0.000195
initiative    0.000195
loi           0.000168
rip           0.000104
non           0.000100
faut          0.000099
vote          0.000098
Name: parlement, dtype: float32

question


question       0.001030
reponse        0.000387
referendums    0.000198
oui            0.000177
non            0.000173
questions      0.000150
referendum     0.000123
faire          0.000122
vote           0.000117
faut           0.000101
Name: question, dtype: float32

questions


questions     0.001053
oui           0.000178
question      0.000150
non           0.000144
referendum    0.000112
faut          0.000087
rip           0.000066
citoyens      0.000066
sujets             NaN
seuil              NaN
Name: questions, dtype: float32

exemple


exemple       0.001166
tous          0.000179
1             0.000159
sujets        0.000137
referendum    0.000113
signatures    0.000110
citoyens      0.000097
initiative    0.000095
nombre        0.000093
faut          0.000091
Name: exemple, dtype: float32

tout


tout          0.001232
faire         0.000152
non           0.000121
faut          0.000120
sujets        0.000120
ric           0.000112
referendum    0.000112
rip           0.000084
initiative    0.000077
citoyens      0.000072
Name: tout, dtype: float32

In [91]:
gc.collect()

420

# Question 16 : Que faudrait-il faire pour consulter plus directement les citoyens sur l'utilisation de l'argent public, par l'Etat et les collectivités ?

In [92]:
question_16 = "Que faudrait-il faire pour consulter plus directement les citoyens sur l'utilisation de l'argent public, par l'Etat et les collectivités ?"
qu_16,df_qu_16_one_hot,df_cov_16,df_confidence_16,df_lift_16 = compute_similarities(question_16, new_res)

In [93]:
for i in df_qu_16_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_16[i].sort_values(ascending=False).head(10))

citoyens


citoyens       5015
faire           800
argent          788
elus            677
public          671
consulter       617
depenses        615
comptes         595
utilisation     554
sort            547
Name: citoyens, dtype: uint16

referendum


referendum    2977
citoyens       348
local          285
initiative     271
faire          226
citoyenne      208
internet       177
depenses       164
budget         154
vote           154
Name: referendum, dtype: uint16

faire


faire       2817
citoyens     800
argent       384
elus         372
depenses     368
comptes      349
public       310
faut         290
budget       289
tous         272
Name: faire, dtype: uint16

comptes


comptes     2661
cour        1364
citoyens     595
argent       373
public       355
faire        349
pouvoir      334
cours        314
depenses     309
donner       300
Name: comptes, dtype: uint16

argent


argent         2591
public         1618
utilisation    1088
citoyens        788
faire           384
comptes         373
depenses        356
elus            312
consulter       295
faut            287
Name: argent, dtype: uint16

internet


internet        2571
site             458
citoyens         428
consultation     276
faire            270
depenses         246
avis             211
argent           207
tous             203
vote             196
Name: internet, dtype: uint16

depenses


depenses        2507
citoyens         615
publiques        467
faire            368
argent           356
public           323
transparence     321
comptes          309
tous             298
recettes         285
Name: depenses, dtype: uint16

public


public         2116
argent         1618
utilisation     927
citoyens        671
comptes         355
depenses        323
faire           310
elus            264
consulter       240
faut            230
Name: public, dtype: uint16

elus


elus        2010
citoyens     677
faire        372
argent       312
comptes      271
depenses     267
public       264
faut         217
tous         205
tout         196
Name: elus, dtype: uint16

utilisation


utilisation     1751
argent          1088
public           927
citoyens         554
faire            252
transparence     248
comptes          246
depenses         196
consulter        192
elus             189
Name: utilisation, dtype: uint16

tous


tous        1672
citoyens     500
depenses     298
comptes      276
faire        272
argent       247
ans          235
public       217
elus         205
internet     203
Name: tous, dtype: uint16

budget


budget           1629
citoyens          506
vote              313
faire             289
depenses          260
collectivites     173
argent            171
public            162
citoyen           161
referendum        154
Name: budget, dtype: uint16

transparence


transparence    1587
depenses         321
argent           271
citoyens         263
utilisation      248
public           220
comptes          202
elus             166
tous             143
internet         143
Name: transparence, dtype: uint16

vote


vote            1531
citoyens         398
budget           313
internet         196
faire            194
referendum       154
electronique     152
depenses         140
elus             133
citoyen          132
Name: vote, dtype: uint16

faut


faut         1403
citoyens      461
faire         290
argent        287
consulter     258
public        230
elus          217
depenses      202
comptes       186
tout          181
Name: faut, dtype: uint16

avis


avis        1403
citoyens     528
demander     310
donner       288
comptes      252
internet     211
faire        201
compte       189
argent       182
cour         170
Name: avis, dtype: uint16

cour


cour        1399
comptes     1364
citoyens     315
compte       247
pouvoir      245
rapports     212
donner       209
argent       190
faire        186
public       184
Name: cour, dtype: uint16

consulter


consulter      1377
citoyens        617
argent          295
faut            258
public          240
utilisation     192
depenses        181
informer        176
elus            176
faire           172
Name: consulter, dtype: uint16

tout


tout        1377
citoyens     370
argent       271
faire        264
public       225
monde        206
depenses     198
elus         196
faut         181
citoyen      176
Name: tout, dtype: uint16

consultation


consultation    1330
citoyens         329
internet         276
faire            157
referendum       131
argent           127
public           115
ligne            111
niveau           109
depenses         106
Name: consultation, dtype: uint16

In [94]:
for i in df_qu_16_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_16[i].sort_values(ascending=False).head(10))

citoyens


citoyens         1.000000
tires            0.864608
sort             0.695044
pourraient       0.538194
participer       0.498534
exprimer         0.498069
consulter        0.448076
representants    0.431677
assemblees       0.428571
permettre        0.413534
Name: citoyens, dtype: float32

referendum


referendum    1.000000
initiative    0.687817
citoyenne     0.416000
local         0.329861
national      0.230000
questions     0.206395
grands        0.198113
locaux        0.168994
choix         0.149051
projets       0.145612
Name: referendum, dtype: float32

faire


faire         1.000000
participer    0.445748
confiance     0.419672
voter         0.411074
ensuite       0.279778
francais      0.224561
faut          0.206700
faudrait      0.202814
annee         0.196246
mieux         0.194585
Name: faire, dtype: float32

comptes


comptes     1.000000
cour        0.974982
rapports    0.714660
cours       0.679654
rapport     0.539759
publics     0.372905
pouvoir     0.352693
controle    0.339318
role        0.314634
publier     0.312860
Name: comptes, dtype: float32

argent


argent         1.000000
public         0.764650
utilise        0.761719
utilisation    0.621359
savoir         0.417763
depense        0.302687
expliquer      0.302326
publique       0.279898
faudrait       0.262603
francais       0.252632
Name: argent, dtype: float32

internet


internet         1.000000
site             0.437023
mairie           0.373832
acces            0.316754
mairies          0.275325
utiliser         0.256637
consultations    0.221485
questionnaire    0.215010
consultation     0.207519
grand            0.176697
Name: internet, dtype: float32

depenses


depenses          1.000000
recettes          0.858434
publiques         0.450772
fonctionnement    0.363636
pays              0.269430
publier           0.268714
annee             0.257679
collectivites     0.214475
depense           0.209335
transparence      0.202268
Name: depenses, dtype: float32

public


public           1.000000
argent           0.624469
utilisation      0.529412
utilise          0.425781
faudrait         0.207503
collectivites    0.187114
annee            0.182594
depense          0.181047
francais         0.177193
consulter        0.174292
Name: public, dtype: float32

elus


elus         1.000000
confiance    0.367213
mandat       0.335443
locaux       0.233240
decisions    0.177267
non          0.156842
faut         0.154669
pouvoir      0.146779
tout         0.142338
citoyens     0.134995
Name: elus, dtype: float32

utilisation


utilisation      1.000000
public           0.438091
argent           0.419915
publics          0.233240
faudrait         0.184056
impots           0.164506
informer         0.163832
publique         0.160305
transparence     0.156270
collectivites    0.146514
Name: utilisation, dtype: float32

tous


tous          1.000000
ans           0.588972
accessible    0.372549
francais      0.191228
publics       0.150838
exemple       0.123360
mettre        0.122151
impots        0.119641
depenses      0.118867
pouvoir       0.118268
Name: tous, dtype: float32

budget


budget           1.000000
annee            0.208191
vote             0.204442
voter            0.182886
collectivites    0.152692
exemple          0.129484
budgets          0.126526
citoyen          0.125000
projets          0.120540
niveau           0.117021
Name: budget, dtype: float32

transparence


transparence    1.000000
utilisation     0.141633
depenses        0.128041
publiques       0.112934
argent          0.104593
public          0.103970
tout            0.086420
faut            0.086244
tous            0.085526
elus            0.082587
Name: transparence, dtype: float32

vote


vote            1.000000
electronique    0.554745
budget          0.192142
budgets         0.113208
projets         0.104147
citoyen         0.102484
mettre          0.092981
niveau          0.090016
citoyens        0.079362
internet        0.076235
Name: vote, dtype: float32

faut


faut             1.000000
consulter        0.187364
tout             0.131445
informer         0.116383
pouvoir          0.111932
argent           0.110768
public           0.108696
non              0.108421
elus             0.107960
collectivites    0.107679
Name: faut, dtype: float32

avis


avis        1.000000
demander    0.439093
donner      0.261818
compte      0.151685
cour        0.121515
citoyens    0.105284
site        0.102099
citoyen     0.097826
exemple     0.096238
comptes     0.094701
Name: avis, dtype: float32

cour


cour        1.000000
rapports    0.554974
comptes     0.512589
rapport     0.412048
pouvoir     0.258712
role        0.248780
controle    0.219031
compte      0.198234
donner      0.190000
avis        0.121169
Name: cour, dtype: float32

consulter


consulter      1.000000
faut           0.183892
informer       0.157565
faudrait       0.138335
citoyens       0.123031
argent         0.113856
public         0.113422
utilisation    0.109652
tout           0.103849
citoyen        0.087733
Name: consulter, dtype: float32

tout


tout         1.000000
monde        0.795367
citoyen      0.136646
faut         0.129009
pouvoir      0.118268
impots       0.114656
public       0.106333
argent       0.104593
consulter    0.103849
exemple      0.102362
Name: tout, dtype: float32

consultation


consultation    1.000000
ligne           0.122652
internet        0.107351
niveau          0.089198
tout            0.074074
citoyens        0.065603
faire           0.055733
public          0.054348
elus            0.051741
argent          0.049016
Name: consultation, dtype: float32

In [95]:
for i in df_qu_16_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_16[i].sort_values(ascending=False).head(10))

citoyens


citoyens         0.000199
tires            0.000172
sort             0.000139
pourraient       0.000107
participer       0.000099
exprimer         0.000099
consulter        0.000089
representants    0.000086
assemblees       0.000085
permettre        0.000082
Name: citoyens, dtype: float32

referendum


referendum    0.000336
initiative    0.000231
citoyenne     0.000140
local         0.000111
national      0.000077
questions     0.000069
grands        0.000067
locaux        0.000057
choix         0.000050
projets       0.000049
Name: referendum, dtype: float32

faire


faire         0.000355
participer    0.000158
confiance     0.000149
voter         0.000146
ensuite       0.000099
francais      0.000080
faut          0.000073
faudrait      0.000072
annee         0.000070
mieux         0.000069
Name: faire, dtype: float32

comptes


comptes     0.000376
cour        0.000366
rapports    0.000269
cours       0.000255
rapport     0.000203
publics     0.000140
pouvoir     0.000133
controle    0.000128
role        0.000118
publier     0.000118
Name: comptes, dtype: float32

argent


argent         0.000386
public         0.000295
utilise        0.000294
utilisation    0.000240
savoir         0.000161
depense        0.000117
expliquer      0.000117
publique       0.000108
faudrait       0.000101
francais       0.000098
Name: argent, dtype: float32

internet


internet         0.000389
site             0.000170
mairie           0.000145
acces            0.000123
mairies          0.000107
utiliser         0.000100
consultations    0.000086
questionnaire    0.000084
consultation     0.000081
grand            0.000069
Name: internet, dtype: float32

depenses


depenses          0.000399
recettes          0.000342
publiques         0.000180
fonctionnement    0.000145
pays              0.000107
publier           0.000107
annee             0.000103
collectivites     0.000086
depense           0.000084
transparence      0.000081
Name: depenses, dtype: float32

public


public           0.000473
argent           0.000295
utilisation      0.000250
utilise          0.000201
faudrait         0.000098
collectivites    0.000088
annee            0.000086
depense          0.000086
francais         0.000084
consulter        0.000082
Name: public, dtype: float32

elus


elus         0.000498
confiance    0.000183
mandat       0.000167
locaux       0.000116
decisions    0.000088
non          0.000078
faut         0.000077
pouvoir      0.000073
tout         0.000071
citoyens     0.000067
Name: elus, dtype: float32

utilisation


utilisation      0.000571
public           0.000250
argent           0.000240
publics          0.000133
faudrait         0.000105
impots           0.000094
informer         0.000094
publique         0.000092
transparence     0.000089
collectivites    0.000084
Name: utilisation, dtype: float32

tous


tous          0.000598
ans           0.000352
accessible    0.000223
francais      0.000114
publics       0.000090
exemple       0.000074
mettre        0.000073
impots        0.000072
depenses      0.000071
pouvoir       0.000071
Name: tous, dtype: float32

budget


budget           0.000614
annee            0.000128
vote             0.000126
voter            0.000112
collectivites    0.000094
exemple          0.000079
budgets          0.000078
citoyen          0.000077
projets          0.000074
niveau           0.000072
Name: budget, dtype: float32

transparence


transparence    0.000630
utilisation     0.000089
depenses        0.000081
publiques       0.000071
argent          0.000066
public          0.000066
tout            0.000054
faut            0.000054
tous            0.000054
elus            0.000052
Name: transparence, dtype: float32

vote


vote            0.000653
electronique    0.000362
budget          0.000126
budgets         0.000074
projets         0.000068
citoyen         0.000067
mettre          0.000061
niveau          0.000059
citoyens        0.000052
internet        0.000050
Name: vote, dtype: float32

faut


faut             0.000713
consulter        0.000134
tout             0.000094
informer         0.000083
pouvoir          0.000080
argent           0.000079
public           0.000077
non              0.000077
elus             0.000077
collectivites    0.000077
Name: faut, dtype: float32

avis


avis        0.000713
demander    0.000313
donner      0.000187
compte      0.000108
cour        0.000087
citoyens    0.000075
site        0.000073
citoyen     0.000070
exemple     0.000069
comptes     0.000067
Name: avis, dtype: float32

cour


cour        0.000715
rapports    0.000397
comptes     0.000366
rapport     0.000295
pouvoir     0.000185
role        0.000178
controle    0.000157
compte      0.000142
donner      0.000136
avis        0.000087
Name: cour, dtype: float32

consulter


consulter      0.000726
faut           0.000134
informer       0.000114
faudrait       0.000100
citoyens       0.000089
argent         0.000083
public         0.000082
utilisation    0.000080
tout           0.000075
citoyen        0.000064
Name: consulter, dtype: float32

tout


tout         0.000726
monde        0.000578
citoyen      0.000099
faut         0.000094
pouvoir      0.000086
impots       0.000083
public       0.000077
argent       0.000076
consulter    0.000075
exemple      0.000074
Name: tout, dtype: float32

consultation


consultation    0.000752
ligne           0.000092
internet        0.000081
niveau          0.000067
tout            0.000056
citoyens        0.000049
faire           0.000042
public          0.000041
elus            0.000039
argent          0.000037
Name: consultation, dtype: float32

In [96]:
gc.collect()

140

# Question 17 :  Quel rôle nos assemblées, dont le Sénat et le Conseil économique, social et environnemental, doivent-elles jouer pour représenter nos territoires et la société civile ?

In [97]:
question_17 = "Quel rôle nos assemblées, dont le Sénat et le Conseil économique, social et environnemental, doivent-elles jouer pour représenter nos territoires et la société civile ?"
qu_17,df_qu_17_one_hot,df_cov_17,df_confidence_17,df_lift_17 = compute_similarities(question_17, new_res)

In [98]:
for i in df_qu_17_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_17[i].sort_values(ascending=False).head(10))

senat


senat          5568
cese           2139
assemblee      1499
conseil        1448
role           1324
economique     1217
social          987
supprimer       967
nationale       847
territoires     795
Name: senat, dtype: uint16

role


role          4156
senat         1324
cese           811
conseil        662
assemblee      560
citoyens       529
economique     514
social         439
pouvoir        402
assemblees     387
Name: role, dtype: uint16

cese


cese           3455
senat          2139
role            811
assemblee       692
supprimer       603
citoyens        491
sert            490
territoires     474
faut            404
nationale       403
Name: cese, dtype: uint16

citoyens


citoyens      2990
senat          670
role           529
cese           491
elus           462
sort           398
assemblee      369
assemblees     339
faire          328
tires          323
Name: citoyens, dtype: uint16

conseil


conseil            2558
economique         2024
social             1636
senat              1448
environnemental     845
role                662
supprimer           503
assemblee           490
sert                372
elus                312
Name: conseil, dtype: uint16

economique


economique         2188
conseil            2024
social             1661
senat              1217
environnemental     850
role                514
supprimer           444
assemblee           407
sert                337
elus                272
Name: economique, dtype: uint16

assemblee


assemblee     2144
senat         1499
nationale     1034
cese           692
role           560
conseil        490
economique     407
citoyens       369
pouvoir        358
social         354
Name: assemblee, dtype: uint16

elus


elus           1943
senat           666
citoyens        462
cese            382
role            359
assemblee       343
conseil         312
senateurs       286
economique      272
territoires     270
Name: elus, dtype: uint16

supprimer


supprimer     1904
senat          967
cese           603
faut           514
conseil        503
economique     444
social         357
sert           280
assemblee      252
role           223
Name: supprimer, dtype: uint16

social


social             1754
economique         1661
conseil            1636
senat               987
environnemental     847
role                439
supprimer           357
assemblee           354
sert                282
elus                227
Name: social, dtype: uint16

assemblees


assemblees     1716
role            387
citoyens        339
senat           332
faut            230
cese            230
elus            212
territoires     188
assemblee       187
conseil         165
Name: assemblees, dtype: uint16

territoires


territoires    1712
senat           795
cese            474
representer     432
societe         417
civile          374
assemblee       341
role            319
citoyens        273
elus            270
Name: territoires, dtype: uint16

faire


faire        1688
senat         413
citoyens      328
cese          280
role          259
elus          255
assemblee     225
conseil       206
remonter      205
faut          202
Name: faire, dtype: uint16

faut


faut          1678
senat          625
supprimer      514
cese           404
role           332
citoyens       267
assemblee      265
conseil        238
assemblees     230
elus           223
Name: faut, dtype: uint16

pouvoir


pouvoir       1472
senat          709
role           402
cese           375
assemblee      358
conseil        286
economique     236
citoyens       216
nationale      204
faut           200
Name: pouvoir, dtype: uint16

lois


lois          1241
senat          521
assemblee      343
role           292
cese           279
conseil        214
nationale      208
citoyens       202
faire          187
economique     181
Name: lois, dtype: uint16

non


non           1209
senat          335
citoyens       269
role           241
elus           238
cese           191
assemblee      174
conseil        165
economique     147
faire          135
Name: non, dtype: uint16

societe


societe        1204
civile          849
senat           445
territoires     417
cese            346
role            283
representer     259
assemblee       222
citoyens        217
elus            194
Name: societe, dtype: uint16

nationale


nationale      1155
assemblee      1034
senat           847
cese            403
role            333
conseil         268
economique      218
territoires     213
lois            208
pouvoir         204
Name: nationale, dtype: uint16

sert


sert          1127
senat          623
cese           490
conseil        372
economique     337
social         282
supprimer      280
assemblee      203
role           191
faut           140
Name: sert, dtype: uint16

In [99]:
for i in df_qu_17_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_17[i].sort_values(ascending=False).head(10))

senat


senat            1.000000
chambre          0.761488
nationale        0.733333
represente       0.706827
assemblee        0.699160
supprime         0.690789
mode             0.687023
inutile          0.664706
collectivites    0.657692
suppression      0.648094
Name: senat, dtype: float32

role


role              1.000000
jouer             0.880196
actuel            0.669841
consultatif       0.661058
controle          0.471729
actuellement      0.376582
executif          0.369085
fonctionnement    0.318713
representation    0.315582
cas               0.299169
Name: role, dtype: float32

cese


cese           1.000000
mode           0.465649
sert           0.434783
inutile        0.432353
supprime       0.429825
membres        0.425862
rapports       0.424581
represente     0.409639
chambre        0.407002
suppression    0.388563
Name: cese, dtype: float32

citoyens


citoyens       1.000000
tires          0.801489
sort           0.625786
debats         0.319620
ecoute         0.312614
ecouter        0.288360
prendre        0.254777
representer    0.240889
elus           0.237777
vie            0.237179
Name: citoyens, dtype: float32

conseil


conseil            1.000000
environnemental    0.948373
social             0.932725
economique         0.925046
sert               0.330080
supprime           0.315789
suppression        0.288856
utilite            0.269811
supprimer          0.264181
senat              0.260057
Name: conseil, dtype: float32

economique


economique         1.000000
environnemental    0.953984
social             0.946978
conseil            0.791243
sert               0.299024
supprime           0.287281
suppression        0.243402
utilite            0.235849
supprimer          0.233193
senat              0.218570
Name: economique, dtype: float32

assemblee


assemblee       1.000000
nationale       0.895238
loi             0.320826
vote            0.316770
sort            0.298742
chambre         0.295405
lois            0.276390
gouvernement    0.271722
senat           0.269217
tires           0.265509
Name: assemblee, dtype: float32

elus


elus             1.000000
locaux           0.641463
suffrage         0.428030
electeurs        0.334328
senateurs        0.292135
representants    0.287829
devraient        0.250000
membres          0.243103
deputes          0.228377
nombre           0.223176
Name: elus, dtype: float32

supprimer


supprimer          1.000000
faut               0.306317
sert               0.248447
nombre             0.211731
social             0.203535
economique         0.202925
servent            0.199673
conseil            0.196638
environnemental    0.180696
cese               0.174530
Name: supprimer, dtype: float32

social


social             1.000000
environnemental    0.950617
economique         0.759141
conseil            0.639562
supprime           0.258772
sert               0.250222
suppression        0.209677
utilite            0.200000
supprimer          0.187500
senat              0.177263
Name: social, dtype: float32

assemblees


assemblees     1.000000
2              0.270396
devraient      0.216912
civile         0.138090
faut           0.137068
societe        0.128738
representer    0.125333
tout           0.114198
citoyens       0.113378
nationale      0.112554
Name: assemblees, dtype: float32

territoires


territoires       1.000000
civile            0.430380
represente        0.407631
representer       0.384000
representation    0.370809
societe           0.346346
representent      0.284615
mieux             0.193277
nationale         0.184416
representants     0.167763
Name: territoires, dtype: float32

faire


faire           1.000000
remonter        0.702055
travail         0.280665
propositions    0.262956
politique       0.170370
gouvernement    0.161137
lois            0.150685
tous            0.145475
tout            0.131687
terrain         0.131351
Name: faire, dtype: float32

faut


faut         1.000000
supprimer    0.269958
donner       0.195423
nombre       0.184549
senateurs    0.159346
tous         0.156930
tout         0.151235
deputes      0.138970
pouvoir      0.135870
civile       0.135788
Name: faut, dtype: float32

pouvoir


pouvoir         1.000000
executif        0.359621
donner          0.288732
gouvernement    0.178515
controle        0.177706
nationale       0.176623
assemblee       0.166978
lois            0.129734
senat           0.127335
faut            0.119190
Name: pouvoir, dtype: float32

lois


lois            1.000000
voter           0.568106
vote            0.329193
propositions    0.241843
loi             0.219512
controle        0.218094
gouvernement    0.191153
nationale       0.180087
assemblee       0.159981
deputes         0.152575
Name: lois, dtype: float32

non


non            1.000000
peuple         0.135773
elus           0.122491
representer    0.118222
deputes        0.103013
lois           0.090250
citoyens       0.089967
societe        0.088040
assemblee      0.081157
faire          0.079976
Name: non, dtype: float32

societe


societe           1.000000
civile            0.976985
territoires       0.243575
representer       0.230222
representation    0.216963
representants     0.166118
nationale         0.112554
assemblee         0.103545
cese              0.100145
elus              0.099846
Name: societe, dtype: float32

nationale


nationale       1.000000
assemblee       0.482276
loi             0.196998
gouvernement    0.192733
lois            0.167607
senat           0.152119
deputes         0.139942
pouvoir         0.138587
territoires     0.124416
cese            0.116643
Name: nationale, dtype: float32

sert


sert               1.000000
chose              0.301724
social             0.160775
economique         0.154022
supprimer          0.147059
conseil            0.145426
cese               0.141823
environnemental    0.141414
senateurs          0.113381
senat              0.111889
Name: sert, dtype: float32

In [100]:
for i in df_qu_17_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_17[i].sort_values(ascending=False).head(10))

senat


senat            0.000180
chambre          0.000137
nationale        0.000132
represente       0.000127
assemblee        0.000126
supprime         0.000124
mode             0.000123
inutile          0.000119
collectivites    0.000118
suppression      0.000116
Name: senat, dtype: float32

role


role              0.000241
jouer             0.000212
actuel            0.000161
consultatif       0.000159
controle          0.000114
actuellement      0.000091
executif          0.000089
fonctionnement    0.000077
representation    0.000076
cas               0.000072
Name: role, dtype: float32

cese


cese           0.000289
mode           0.000135
sert           0.000126
inutile        0.000125
supprime       0.000124
membres        0.000123
rapports       0.000123
represente     0.000119
chambre        0.000118
suppression    0.000112
Name: cese, dtype: float32

citoyens


citoyens       0.000334
tires          0.000268
sort           0.000209
debats         0.000107
ecoute         0.000105
ecouter        0.000096
prendre        0.000085
representer    0.000081
elus           0.000080
vie            0.000079
Name: citoyens, dtype: float32

conseil


conseil            0.000391
environnemental    0.000371
social             0.000365
economique         0.000362
sert               0.000129
supprime           0.000123
suppression        0.000113
utilite            0.000105
supprimer          0.000103
senat              0.000102
Name: conseil, dtype: float32

economique


economique         0.000457
environnemental    0.000436
social             0.000433
conseil            0.000362
sert               0.000137
supprime           0.000131
suppression        0.000111
utilite            0.000108
supprimer          0.000107
senat              0.000100
Name: economique, dtype: float32

assemblee


assemblee       0.000466
nationale       0.000418
loi             0.000150
vote            0.000148
sort            0.000139
chambre         0.000138
lois            0.000129
gouvernement    0.000127
senat           0.000126
tires           0.000124
Name: assemblee, dtype: float32

elus


elus             0.000515
locaux           0.000330
suffrage         0.000220
electeurs        0.000172
senateurs        0.000150
representants    0.000148
devraient        0.000129
membres          0.000125
deputes          0.000118
nombre           0.000115
Name: elus, dtype: float32

supprimer


supprimer          0.000525
faut               0.000161
sert               0.000130
nombre             0.000111
social             0.000107
economique         0.000107
servent            0.000105
conseil            0.000103
environnemental    0.000095
cese               0.000092
Name: supprimer, dtype: float32

social


social             0.000570
environnemental    0.000542
economique         0.000433
conseil            0.000365
supprime           0.000148
sert               0.000143
suppression        0.000120
utilite            0.000114
supprimer          0.000107
senat              0.000101
Name: social, dtype: float32

assemblees


assemblees     0.000583
2              0.000158
devraient      0.000126
civile         0.000080
faut           0.000080
societe        0.000075
representer    0.000073
tout           0.000067
citoyens       0.000066
nationale      0.000066
Name: assemblees, dtype: float32

territoires


territoires       0.000584
civile            0.000251
represente        0.000238
representer       0.000224
representation    0.000217
societe           0.000202
representent      0.000166
mieux             0.000113
nationale         0.000108
representants     0.000098
Name: territoires, dtype: float32

faire


faire           0.000592
remonter        0.000416
travail         0.000166
propositions    0.000156
politique       0.000101
gouvernement    0.000095
lois            0.000089
tous            0.000086
tout            0.000078
terrain         0.000078
Name: faire, dtype: float32

faut


faut         0.000596
supprimer    0.000161
donner       0.000116
nombre       0.000110
senateurs    0.000095
tous         0.000094
tout         0.000090
deputes      0.000083
pouvoir      0.000081
civile       0.000081
Name: faut, dtype: float32

pouvoir


pouvoir         0.000679
executif        0.000244
donner          0.000196
gouvernement    0.000121
controle        0.000121
nationale       0.000120
assemblee       0.000113
lois            0.000088
senat           0.000087
faut            0.000081
Name: pouvoir, dtype: float32

lois


lois            0.000806
voter           0.000458
vote            0.000265
propositions    0.000195
loi             0.000177
controle        0.000176
gouvernement    0.000154
nationale       0.000145
assemblee       0.000129
deputes         0.000123
Name: lois, dtype: float32

non


non            0.000827
peuple         0.000112
elus           0.000101
representer    0.000098
deputes        0.000085
lois           0.000075
citoyens       0.000074
societe        0.000073
assemblee      0.000067
faire          0.000066
Name: non, dtype: float32

societe


societe           0.000831
civile            0.000811
territoires       0.000202
representer       0.000191
representation    0.000180
representants     0.000138
nationale         0.000093
assemblee         0.000086
cese              0.000083
elus              0.000083
Name: societe, dtype: float32

nationale


nationale       0.000866
assemblee       0.000418
loi             0.000171
gouvernement    0.000167
lois            0.000145
senat           0.000132
deputes         0.000121
pouvoir         0.000120
territoires     0.000108
cese            0.000101
Name: nationale, dtype: float32

sert


sert               0.000887
chose              0.000268
social             0.000143
economique         0.000137
supprimer          0.000130
conseil            0.000129
cese               0.000126
environnemental    0.000125
senateurs          0.000101
senat              0.000099
Name: sert, dtype: float32

In [101]:
gc.collect()

147

# Question 18 :  Faut-il les transformer ?

In [103]:
question_18 = "Faut-il les transformer ?"
qu_18,df_qu_18_one_hot,df_cov_18,df_confidence_18,df_lift_18 = compute_similarities(question_18, new_res)

In [104]:
for i in df_qu_18_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_18[i].sort_values(ascending=False).head(10))

oui


oui    22816
non        0
Name: oui, dtype: uint16

non


non    3381
oui       0
Name: non, dtype: uint16

In [105]:
for i in df_qu_18_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_18[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [106]:
for i in df_qu_18_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_18[i].sort_values(ascending=False).head(10))

oui


oui    0.000044
non         NaN
Name: oui, dtype: float32

non


non    0.000296
oui         NaN
Name: non, dtype: float32

In [107]:
gc.collect()

14

# Question 19 :  Si oui, comment ? (Senat)

In [108]:
question_19 = "Si oui, comment ?_Senat"
qu_19,df_qu_19_one_hot,df_cov_19,df_confidence_19,df_lift_19 = compute_similarities(question_19, new_res)

In [109]:
for i in df_qu_19_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_19[i].sort_values(ascending=False).head(10))

senat


senat          4950
cese           1422
supprimer      1415
assemblee      1122
suppression     836
conseil         826
nombre          751
elus            655
economique      654
citoyens        651
Name: senat, dtype: uint16

supprimer


supprimer     3575
senat         1415
cese           902
conseil        574
nombre         556
economique     496
senateurs      444
social         404
reduire        390
deputes        365
Name: supprimer, dtype: uint16

nombre


nombre       3267
reduire      1223
senateurs    1132
deputes       754
senat         751
diminuer      684
elus          680
cese          585
supprimer     556
assemblee     351
Name: nombre, dtype: uint16

cese


cese           2983
senat          1422
supprimer       902
senateurs       591
nombre          585
suppression     454
citoyens        445
assemblee       407
elus            364
sort            350
Name: cese, dtype: uint16

senateurs


senateurs    2273
nombre       1132
deputes       827
cese          591
senat         546
reduire       523
elus          445
supprimer     444
citoyens      311
conseil       298
Name: senateurs, dtype: uint16

elus


elus         2244
nombre        680
senat         655
citoyens      466
senateurs     445
cese          364
assemblee     361
deputes       334
reduire       316
supprimer     258
Name: elus, dtype: uint16

citoyens


citoyens     2230
sort          760
senat         651
tires         612
elus          466
cese          445
assemblee     423
senateurs     311
nombre        285
faire         259
Name: citoyens, dtype: uint16

assemblee


assemblee    1879
senat        1122
nationale     776
citoyens      423
cese          407
elus          361
nombre        351
deputes       339
sort          338
supprimer     306
Name: assemblee, dtype: uint16

conseil


conseil            1767
economique         1353
social             1103
senat               826
supprimer           574
environnemental     541
nombre              316
senateurs           298
suppression         258
citoyens            249
Name: conseil, dtype: uint16

reduire


reduire      1763
nombre       1223
senateurs     523
senat         404
supprimer     390
deputes       341
elus          316
cese          277
conseil       161
assemblee     159
Name: reduire, dtype: uint16

deputes


deputes      1643
senateurs     827
nombre        754
senat         602
supprimer     365
reduire       341
assemblee     339
elus          334
cese          306
citoyens      225
Name: deputes, dtype: uint16

suppression


suppression    1625
senat           836
cese            454
conseil         258
nombre          234
economique      221
senateurs       203
deputes         203
social          184
assemblee       176
Name: suppression, dtype: uint16

economique


economique         1459
conseil            1353
social             1109
senat               654
environnemental     535
supprimer           496
nombre              257
senateurs           244
suppression         221
citoyens            205
Name: economique, dtype: uint16

faut


faut         1325
senat         418
supprimer     348
nombre        243
elus          243
citoyens      219
cese          217
assemblee     216
senateurs     180
faire         178
Name: faut, dtype: uint16

faire


faire        1241
senat         354
citoyens      259
elus          230
cese          227
assemblee     213
nombre        209
senateurs     184
faut          178
supprimer     167
Name: faire, dtype: uint16

sort


sort         1240
citoyens      760
tires         729
senat         487
cese          350
assemblee     338
tirage        291
elus          228
senateurs     177
conseil       165
Name: sort, dtype: uint16

social


social             1183
economique         1109
conseil            1103
environnemental     533
senat               519
supprimer           404
nombre              204
senateurs           203
suppression         184
citoyens            163
Name: social, dtype: uint16

voir


voir          1051
senat          152
reponse        152
sort             0
loi              0
direct           0
terrain          0
niveau           0
republique       0
tirage           0
Name: voir, dtype: uint16

role


role          1004
senat          463
cese           291
assemblee      205
conseil        187
citoyens       168
supprimer      166
nombre         165
senateurs      161
economique     139
Name: role, dtype: uint16

assemblees


assemblees    984
nombre        218
senat         206
citoyens      184
elus          184
assemblee     148
faut          132
reduire       124
cese          117
supprimer     116
Name: assemblees, dtype: uint16

In [110]:
for i in df_qu_19_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_19[i].sort_values(ascending=False).head(10))

senat


senat          1.000000
nationale      0.690992
chambre        0.610329
assemblee      0.597126
remplacer      0.582133
fusion         0.574545
fusionner      0.554479
territoires    0.541096
universel      0.520249
loi            0.516304
Name: senat, dtype: float32

supprimer


supprimer          1.000000
sert               0.432900
servent            0.377163
remplacer          0.360231
social             0.341505
economique         0.339959
conseil            0.324844
environnemental    0.309735
cese               0.302380
commissions        0.292929
Name: supprimer, dtype: float32

nombre


nombre            1.000000
diminuer          0.805654
reduire           0.693704
reduction         0.626667
limiter           0.601562
parlementaires    0.524731
senateurs         0.498020
deputes           0.458917
senateur          0.448363
avantages         0.414216
Name: nombre, dtype: float32

cese


cese           1.000000
fusion         0.389091
fusionner      0.363196
sert           0.361472
chambre        0.335681
membres        0.318694
territoires    0.312785
suffrage       0.309979
avis           0.308585
1              0.305195
Name: cese, dtype: float32

senateurs


senateurs      1.000000
deputes        0.503348
universel      0.429907
suffrage       0.418259
departement    0.398785
electeurs      0.382759
direct         0.370492
3              0.360526
election       0.358932
reduction      0.357333
Name: senateurs, dtype: float32

elus


elus               1.000000
electeurs          0.424138
devraient          0.369718
universel          0.358255
suffrage           0.348195
direct             0.344262
ans                0.290258
proportionnelle    0.284091
tous               0.281360
territoires        0.273973
Name: elus, dtype: float32

citoyens


citoyens      1.000000
tires         0.817089
sort          0.612903
remplacer     0.414986
tirage        0.346939
chambre       0.260563
ans           0.254473
politiques    0.253333
1             0.244589
assemblee     0.225120
Name: citoyens, dtype: float32

assemblee


assemblee          1.000000
nationale          0.884835
citoyenne          0.573825
remplacer          0.391931
loi                0.380435
lois               0.349544
proportionnelle    0.305195
tires              0.301736
vote               0.288100
territoires        0.283105
Name: assemblee, dtype: float32

conseil


conseil            1.000000
environnemental    0.957522
social             0.932375
economique         0.927347
sert               0.290043
membres            0.191441
role               0.186255
donner             0.174727
senat              0.166869
supprimer          0.160559
Name: conseil, dtype: float32

reduire


reduire           1.000000
nombre            0.374350
avantages         0.276961
parlementaires    0.234409
senateurs         0.230092
deputes           0.207547
membres           0.174550
representants     0.145386
elus              0.140820
assemblees        0.126016
Name: reduire, dtype: float32

deputes


deputes            1.000000
senateurs          0.363836
departement        0.352227
3                  0.289474
1                  0.283550
reduction          0.269333
proportionnelle    0.259740
senateur           0.259446
lois               0.241641
2                  0.238024
Name: deputes, dtype: float32

suppression


suppression    1.000000
reduction      0.288000
senat          0.168889
social         0.155537
cese           0.152196
economique     0.151474
conseil        0.146010
deputes        0.123554
assemblee      0.093667
senateurs      0.089309
Name: suppression, dtype: float32

economique


economique         1.000000
environnemental    0.946903
social             0.937447
conseil            0.765705
sert               0.264069
membres            0.145270
supprimer          0.138741
role               0.138446
suppression        0.136000
senat              0.132121
Name: economique, dtype: float32

faut


faut          1.000000
tout          0.188267
faire         0.143433
non           0.142217
assemblees    0.134146
pouvoir       0.133264
nationale     0.131129
tous          0.128957
role          0.116534
assemblee     0.114955
Name: faut, dtype: float32

faire


faire        1.000000
lois         0.167173
tout         0.150068
tous         0.137163
faut         0.134340
non          0.127660
pouvoir      0.118802
citoyens     0.116143
assemblee    0.113358
role         0.112550
Name: faire, dtype: float32

sort


sort             1.000000
tirage           0.989796
tires            0.973298
remplacer        0.414986
citoyens         0.340807
ans              0.230616
1                0.222944
assemblee        0.179883
membres          0.167793
representants    0.145386
Name: sort, dtype: float32

social


social             1.000000
environnemental    0.943363
economique         0.760110
conseil            0.624222
role               0.123506
membres            0.122748
suppression        0.113231
supprimer          0.113007
senat              0.104848
senateurs          0.089309
Name: social, dtype: float32

voir


voir          1.000000
reponse       0.459215
senat         0.030707
sort          0.000000
loi           0.000000
direct        0.000000
terrain       0.000000
niveau        0.000000
republique    0.000000
tirage        0.000000
Name: voir, dtype: float32

role


role          1.000000
donner        0.165367
lois          0.159574
nationale     0.134550
pouvoir       0.121901
assemblee     0.109101
conseil       0.105829
social        0.104818
cese          0.097553
economique    0.095271
Name: role, dtype: float32

assemblees


assemblees    1.000000
faut          0.099623
citoyens      0.082511
elus          0.081996
assemblee     0.078765
reduire       0.070335
nombre        0.066728
senat         0.041616
cese          0.039222
supprimer     0.032448
Name: assemblees, dtype: float32

In [111]:
for i in df_qu_19_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_19[i].sort_values(ascending=False).head(10))

senat


senat          0.000202
nationale      0.000140
chambre        0.000123
assemblee      0.000121
remplacer      0.000118
fusion         0.000116
fusionner      0.000112
territoires    0.000109
universel      0.000105
loi            0.000104
Name: senat, dtype: float32

supprimer


supprimer          0.000280
sert               0.000121
servent            0.000106
remplacer          0.000101
social             0.000096
economique         0.000095
conseil            0.000091
environnemental    0.000087
cese               0.000085
commissions        0.000082
Name: supprimer, dtype: float32

nombre


nombre            0.000306
diminuer          0.000247
reduire           0.000212
reduction         0.000192
limiter           0.000184
parlementaires    0.000161
senateurs         0.000152
deputes           0.000140
senateur          0.000137
avantages         0.000127
Name: nombre, dtype: float32

cese


cese           0.000335
fusion         0.000130
fusionner      0.000122
sert           0.000121
chambre        0.000113
membres        0.000107
territoires    0.000105
suffrage       0.000104
avis           0.000103
1              0.000102
Name: cese, dtype: float32

senateurs


senateurs      0.000440
deputes        0.000221
universel      0.000189
suffrage       0.000184
departement    0.000175
electeurs      0.000168
direct         0.000163
3              0.000159
election       0.000158
reduction      0.000157
Name: senateurs, dtype: float32

elus


elus               0.000446
electeurs          0.000189
devraient          0.000165
universel          0.000160
suffrage           0.000155
direct             0.000153
ans                0.000129
proportionnelle    0.000127
tous               0.000125
territoires        0.000122
Name: elus, dtype: float32

citoyens


citoyens      0.000448
tires         0.000366
sort          0.000275
remplacer     0.000186
tirage        0.000156
chambre       0.000117
ans           0.000114
politiques    0.000114
1             0.000110
assemblee     0.000101
Name: citoyens, dtype: float32

assemblee


assemblee          0.000532
nationale          0.000471
citoyenne          0.000305
remplacer          0.000209
loi                0.000202
lois               0.000186
proportionnelle    0.000162
tires              0.000161
vote               0.000153
territoires        0.000151
Name: assemblee, dtype: float32

conseil


conseil            0.000566
environnemental    0.000542
social             0.000528
economique         0.000525
sert               0.000164
membres            0.000108
role               0.000105
donner             0.000099
senat              0.000094
supprimer          0.000091
Name: conseil, dtype: float32

reduire


reduire           0.000567
nombre            0.000212
avantages         0.000157
parlementaires    0.000133
senateurs         0.000131
deputes           0.000118
membres           0.000099
representants     0.000082
elus              0.000080
assemblees        0.000071
Name: reduire, dtype: float32

deputes


deputes            0.000609
senateurs          0.000221
departement        0.000214
3                  0.000176
1                  0.000173
reduction          0.000164
proportionnelle    0.000158
senateur           0.000158
lois               0.000147
2                  0.000145
Name: deputes, dtype: float32

suppression


suppression    0.000615
reduction      0.000177
senat          0.000104
social         0.000096
cese           0.000094
economique     0.000093
conseil        0.000090
deputes        0.000076
assemblee      0.000058
senateurs      0.000055
Name: suppression, dtype: float32

economique


economique         0.000685
environnemental    0.000649
social             0.000643
conseil            0.000525
sert               0.000181
membres            0.000100
supprimer          0.000095
role               0.000095
suppression        0.000093
senat              0.000091
Name: economique, dtype: float32

faut


faut          0.000755
tout          0.000142
faire         0.000108
non           0.000107
assemblees    0.000101
pouvoir       0.000101
nationale     0.000099
tous          0.000097
role          0.000088
assemblee     0.000087
Name: faut, dtype: float32

faire


faire        0.000806
lois         0.000135
tout         0.000121
tous         0.000111
faut         0.000108
non          0.000103
pouvoir      0.000096
citoyens     0.000094
assemblee    0.000091
role         0.000091
Name: faire, dtype: float32

sort


sort             0.000806
tirage           0.000798
tires            0.000785
remplacer        0.000335
citoyens         0.000275
ans              0.000186
1                0.000180
assemblee        0.000145
membres          0.000135
representants    0.000117
Name: sort, dtype: float32

social


social             0.000845
environnemental    0.000797
economique         0.000643
conseil            0.000528
role               0.000104
membres            0.000104
suppression        0.000096
supprimer          0.000096
senat              0.000089
senateurs          0.000075
Name: social, dtype: float32

voir


voir               0.000951
reponse            0.000437
senat              0.000029
environnemental         NaN
citoyens                NaN
nombre                  NaN
cas                     NaN
mandats                 NaN
conseils                NaN
travail                 NaN
Name: voir, dtype: float32

role


role          0.000996
donner        0.000165
lois          0.000159
nationale     0.000134
pouvoir       0.000121
assemblee     0.000109
conseil       0.000105
social        0.000104
cese          0.000097
economique    0.000095
Name: role, dtype: float32

assemblees


assemblees    0.001016
faut          0.000101
citoyens      0.000084
elus          0.000083
assemblee     0.000080
reduire       0.000071
nombre        0.000068
senat         0.000042
cese          0.000040
supprimer     0.000033
Name: assemblees, dtype: float32

In [112]:
gc.collect()

147

# Question 20:   Que proposez-vous pour renforcer les principes de la laïcité dans le rapport entre l'Etat et les religions de notre pays ?

In [113]:
question_20 = "Que proposez-vous pour renforcer les principes de la laïcité dans le rapport entre l'Etat et les religions de notre pays ?"
qu_20,df_qu_20_one_hot,df_cov_20,df_confidence_20,df_lift_20 = compute_similarities(question_20, new_res)

In [114]:
for i in df_qu_20_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_20[i].sort_values(ascending=False).head(10))

laicite


laicite      6271
religions    1760
religion     1695
faire        1026
france        973
loi           936
faut          864
tout          850
tous          836
religieux     835
Name: laicite, dtype: uint16

religions


religions    6170
laicite      1760
religion     1482
loi           979
faire         867
france        859
religieux     813
pays          761
tout          760
faut          720
Name: religions, dtype: uint16

religion


religion     5639
laicite      1695
religions    1482
religieux     882
tout          878
loi           865
france        865
faire         845
pays          783
faut          714
Name: religion, dtype: uint16

loi


loi            5202
1905           2990
appliquer      1362
religions       979
laicite         936
faire           930
religion        865
respecter       666
tout            563
application     521
Name: loi, dtype: uint16

religieux


religieux    3323
religion      882
signes        869
laicite       835
religions     813
tout          730
interdire     625
tous          624
signe         612
public        589
Name: religieux, dtype: uint16

faire


faire        3242
laicite      1026
respecter    1022
loi           930
religions     867
religion      845
appliquer     698
lois          603
tout          489
religieux     485
Name: faire, dtype: uint16

1905


1905           3151
loi            2990
appliquer       655
religions       621
laicite         511
religion        496
faire           420
application     352
respecter       339
tout            293
Name: 1905, dtype: uint16

tout


tout         2812
religion      878
laicite       850
religions     760
religieux     730
loi           563
faire         489
signe         488
france        484
interdire     473
Name: tout, dtype: uint16

france


france       2625
laicite       973
religion      865
religions     859
pays          739
tout          484
faire         480
faut          440
loi           427
islam         427
Name: france, dtype: uint16

appliquer


appliquer    2600
loi          1362
lois          717
faire         698
1905          655
laicite       566
religions     401
religion      338
tout          284
tous          273
Name: appliquer, dtype: uint16

tous


tous         2426
laicite       836
religion      714
religions     658
religieux     624
loi           459
faire         450
lieux         432
signes        402
france        387
Name: tous, dtype: uint16

lois


lois          2266
appliquer      717
republique     625
faire          603
religions      542
religion       511
laicite        496
respecter      454
existantes     350
loi            350
Name: lois, dtype: uint16

pays


pays         2227
religion      783
laicite       775
religions     761
france        739
tout          400
faire         386
faut          368
religieux     346
loi           318
Name: pays, dtype: uint16

faut


faut         2109
laicite       864
religions     720
religion      714
loi           482
faire         464
france        440
tout          415
pays          368
religieux     340
Name: faut, dtype: uint16

respecter


respecter     2024
faire         1022
loi            666
laicite        645
religions      550
religion       487
lois           454
1905           339
republique     292
tout           289
Name: respecter, dtype: uint16

republique


republique    1947
religions      698
laicite        637
lois           625
religion       616
loi            463
religieux      381
valeurs        370
faire          367
france         339
Name: republique, dtype: uint16

respect


respect       1860
laicite        728
religions      608
religion       524
loi            447
religieux      310
lois           309
republique     309
non            308
tous           286
Name: respect, dtype: uint16

lieux


lieux        1846
culte         710
religion      613
publics       592
religieux     537
laicite       514
religions     503
tous          432
cultes        378
interdire     363
Name: lieux, dtype: uint16

interdire


interdire    1825
religieux     625
religion      506
tout          473
religions     434
signes        399
lieux         363
tous          348
laicite       341
voile         320
Name: interdire, dtype: uint16

ecole


ecole        1786
laicite       604
religions     535
religion      435
religieux     363
faire         282
tous          259
tout          258
publique      230
education     223
Name: ecole, dtype: uint16

In [115]:
for i in df_qu_20_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_20[i].sort_values(ascending=False).head(10))

laicite


laicite      1.000000
principe     0.708839
principes    0.544796
veut         0.525526
sens         0.493939
faudrait     0.467262
probleme     0.464286
renforcer    0.455446
rappeler     0.448276
partout      0.447552
Name: laicite, dtype: float32

religions


religions        1.000000
representants    0.521523
respectent       0.512821
histoire         0.512162
adapter          0.509363
rapport          0.508600
maniere          0.483957
enseigner        0.479401
vis              0.472868
egalite          0.470687
Name: religions, dtype: float32

religion


religion        1.000000
affaire         0.823077
pratiquer       0.752809
musulmane       0.700809
privee          0.619737
prive           0.608939
appartenance    0.591623
libre           0.557740
choix           0.552980
pratique        0.543529
Name: religion, dtype: float32

loi


loi            1.000000
1905           0.948905
toucher        0.870206
application    0.616568
actuelle       0.581940
appliquer      0.523846
simplement     0.468599
stricte        0.420240
changer        0.407975
separation     0.371342
Name: loi, dtype: float32

religieux


religieux         1.000000
signes            0.584791
signe             0.549865
etablissements    0.411985
espace            0.410124
ostentatoires     0.394209
interdiction      0.387972
interdit          0.378007
ostentatoire      0.374286
croix             0.370031
Name: religieux, dtype: float32

faire


faire         1.000000
respecter     0.504941
existantes    0.350000
simplement    0.299517
appliquer     0.268462
lois          0.266108
femmes        0.245545
politique     0.245009
enfants       0.239336
musulmans     0.231667
Name: faire, dtype: float32

1905


1905           1.000000
toucher        0.764012
loi            0.574779
application    0.416568
alsace         0.312500
changer        0.309816
stricte        0.281304
appliquer      0.251923
separation     0.237134
eglise         0.232624
Name: 1905, dtype: float32

tout


tout            1.000000
monde           0.627540
signe           0.438455
ostentatoire    0.428571
simplement      0.413043
territoire      0.374396
etranger        0.278515
appartenance    0.277487
interdire       0.259178
lieu            0.257812
Name: tout, dtype: float32

france


france         1.000000
chretienne     0.474286
chretiennes    0.404321
catholique     0.376642
histoire       0.364865
francais       0.353879
islam          0.346310
imams          0.339726
traditions     0.338926
pays           0.331837
Name: france, dtype: float32

appliquer


appliquer     1.000000
existantes    0.567500
simplement    0.456522
lois          0.316417
loi           0.261822
faire         0.215299
1905          0.207871
regles        0.161905
principes     0.138340
voile         0.129258
Name: appliquer, dtype: float32

tous


tous             1.000000
jours            0.289238
citoyens         0.287829
signes           0.270525
publics          0.267168
ostentatoires    0.256125
lieux            0.234020
francais         0.229543
publiques        0.229446
cultes           0.228986
Name: tous, dtype: float32

lois


lois           1.000000
existantes     0.875000
republique     0.321007
appliquer      0.275769
respecter      0.224308
faire          0.185996
application    0.169231
respect        0.166129
cas            0.165663
port           0.161383
Name: lois, dtype: float32

pays


pays          1.000000
origine       0.395349
etrangers     0.365900
laic          0.345238
chretienne    0.329524
laique        0.304612
musulmans     0.300000
catholique    0.297810
culture       0.285714
france        0.281524
Name: pays, dtype: float32

faut


faut          1.000000
monde         0.234763
pouvoir       0.219713
probleme      0.217143
musulmans     0.216667
societe       0.213355
chretienne    0.213333
islam         0.210868
accepter      0.192884
culture       0.188235
Name: faut, dtype: float32

respecter


respecter     1.000000
faire         0.315238
lois          0.200353
regles        0.176190
republique    0.149974
valeurs       0.143665
imposer       0.143247
principes     0.133729
principe      0.130849
loi           0.128028
Name: respecter, dtype: float32

republique


republique    1.000000
valeurs       0.418552
francaise     0.282609
lois          0.275816
regles        0.230952
laique        0.213592
liberte       0.189837
droit         0.186398
islam         0.184104
egalite       0.180905
Name: republique, dtype: float32

respect


respect       1.000000
croyances     0.278515
liberte       0.207095
valeurs       0.201357
non           0.198838
tolerance     0.195841
regles        0.190476
vivre         0.171303
droit         0.164987
republique    0.158706
Name: respect, dtype: float32

lieux


lieux            1.000000
publics          0.556914
culte            0.468338
cultes           0.365217
construction     0.361486
publiques        0.332696
financement      0.245480
signe            0.230907
rue              0.229617
ostentatoires    0.224944
Name: lieux, dtype: float32

interdire


interdire        1.000000
port             0.314121
prieres          0.291429
etranger         0.283820
voile            0.279476
signes           0.268506
ostentatoires    0.262806
etrangers        0.245211
rue              0.242928
signe            0.230907
Name: interdire, dtype: float32

ecole


ecole           1.000000
enseigner       0.464419
civique         0.366120
cours           0.321127
enfants         0.315166
enseignement    0.298137
education       0.233753
publique        0.181531
laique          0.175971
histoire        0.171622
Name: ecole, dtype: float32

In [116]:
for i in df_qu_20_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_20[i].sort_values(ascending=False).head(10))

laicite


laicite      0.000159
principe     0.000113
principes    0.000087
veut         0.000084
sens         0.000079
faudrait     0.000075
probleme     0.000074
renforcer    0.000073
rappeler     0.000071
partout      0.000071
Name: laicite, dtype: float32

religions


religions        0.000162
representants    0.000085
respectent       0.000083
histoire         0.000083
adapter          0.000083
rapport          0.000082
maniere          0.000078
enseigner        0.000078
vis              0.000077
egalite          0.000076
Name: religions, dtype: float32

religion


religion        0.000177
affaire         0.000146
pratiquer       0.000134
musulmane       0.000124
privee          0.000110
prive           0.000108
appartenance    0.000105
libre           0.000099
choix           0.000098
pratique        0.000096
Name: religion, dtype: float32

loi


loi            0.000192
1905           0.000182
toucher        0.000167
application    0.000119
actuelle       0.000112
appliquer      0.000101
simplement     0.000090
stricte        0.000081
changer        0.000078
separation     0.000071
Name: loi, dtype: float32

religieux


religieux         0.000301
signes            0.000176
signe             0.000165
etablissements    0.000124
espace            0.000123
ostentatoires     0.000119
interdiction      0.000117
interdit          0.000114
ostentatoire      0.000113
croix             0.000111
Name: religieux, dtype: float32

faire


faire         0.000308
respecter     0.000156
existantes    0.000108
simplement    0.000092
appliquer     0.000083
lois          0.000082
femmes        0.000076
politique     0.000076
enfants       0.000074
musulmans     0.000071
Name: faire, dtype: float32

1905


1905           0.000317
toucher        0.000242
loi            0.000182
application    0.000132
alsace         0.000099
changer        0.000098
stricte        0.000089
appliquer      0.000080
separation     0.000075
eglise         0.000074
Name: 1905, dtype: float32

tout


tout            0.000356
monde           0.000223
signe           0.000156
ostentatoire    0.000152
simplement      0.000147
territoire      0.000133
etranger        0.000099
appartenance    0.000099
interdire       0.000092
lieu            0.000092
Name: tout, dtype: float32

france


france         0.000381
chretienne     0.000181
chretiennes    0.000154
catholique     0.000143
histoire       0.000139
francais       0.000135
islam          0.000132
imams          0.000129
traditions     0.000129
pays           0.000126
Name: france, dtype: float32

appliquer


appliquer     0.000385
existantes    0.000218
simplement    0.000176
lois          0.000122
loi           0.000101
faire         0.000083
1905          0.000080
regles        0.000062
principes     0.000053
voile         0.000050
Name: appliquer, dtype: float32

tous


tous             0.000412
jours            0.000119
citoyens         0.000119
signes           0.000112
publics          0.000110
ostentatoires    0.000106
lieux            0.000096
francais         0.000095
publiques        0.000095
cultes           0.000094
Name: tous, dtype: float32

lois


lois           0.000441
existantes     0.000386
republique     0.000142
appliquer      0.000122
respecter      0.000099
faire          0.000082
application    0.000075
respect        0.000073
cas            0.000073
port           0.000071
Name: lois, dtype: float32

pays


pays          0.000449
origine       0.000178
etrangers     0.000164
laic          0.000155
chretienne    0.000148
laique        0.000137
musulmans     0.000135
catholique    0.000134
culture       0.000128
france        0.000126
Name: pays, dtype: float32

faut


faut          0.000474
monde         0.000111
pouvoir       0.000104
probleme      0.000103
musulmans     0.000103
societe       0.000101
chretienne    0.000101
islam         0.000100
accepter      0.000091
culture       0.000089
Name: faut, dtype: float32

respecter


respecter     0.000494
faire         0.000156
lois          0.000099
regles        0.000087
republique    0.000074
valeurs       0.000071
imposer       0.000071
principes     0.000066
principe      0.000065
loi           0.000063
Name: respecter, dtype: float32

republique


republique    0.000514
valeurs       0.000215
francaise     0.000145
lois          0.000142
regles        0.000119
laique        0.000110
liberte       0.000098
droit         0.000096
islam         0.000095
egalite       0.000093
Name: republique, dtype: float32

respect


respect       0.000538
croyances     0.000150
liberte       0.000111
valeurs       0.000108
non           0.000107
tolerance     0.000105
regles        0.000102
vivre         0.000092
droit         0.000089
republique    0.000085
Name: respect, dtype: float32

lieux


lieux            0.000542
publics          0.000302
culte            0.000254
cultes           0.000198
construction     0.000196
publiques        0.000180
financement      0.000133
signe            0.000125
rue              0.000124
ostentatoires    0.000122
Name: lieux, dtype: float32

interdire


interdire        0.000548
port             0.000172
prieres          0.000160
etranger         0.000156
voile            0.000153
signes           0.000147
ostentatoires    0.000144
etrangers        0.000134
rue              0.000133
signe            0.000127
Name: interdire, dtype: float32

ecole


ecole           0.000560
enseigner       0.000260
civique         0.000205
cours           0.000180
enfants         0.000176
enseignement    0.000167
education       0.000131
publique        0.000102
laique          0.000099
histoire        0.000096
Name: ecole, dtype: float32

In [117]:
gc.collect()

147

# Question 21:  Comment garantir le respect par tous de la compréhension réciproque et des valeurs intangibles de la République ?

In [118]:
question_21 = "Comment garantir le respect par tous de la compréhension réciproque et des valeurs intangibles de la République ?"
qu_21,df_qu_21_one_hot,df_cov_21,df_confidence_21,df_lift_21 = compute_similarities(question_21, new_res)

In [119]:
for i in df_qu_21_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_21[i].sort_values(ascending=False).head(10))

education


education     6004
civique       2100
ecole         1683
valeurs        769
republique     638
cours          597
respect        539
tous           511
nationale      474
tout           414
Name: education, dtype: uint16

ecole


ecole          5382
education      1683
civique        1502
valeurs        1007
republique      792
instruction     600
respect         591
cours           551
primaire        532
faire           510
Name: ecole, dtype: uint16

valeurs


valeurs        4190
republique     2088
ecole          1007
respect         840
education       769
tous            625
faire           601
intangibles     564
tout            500
faut            462
Name: valeurs, dtype: uint16

republique


republique     3835
valeurs        2088
ecole           792
respect         677
tous            639
education       638
faire           578
tout            468
intangibles     429
lois            427
Name: republique, dtype: uint16

civique


civique        3582
education      2100
ecole          1502
instruction    1188
cours           724
service         654
obligatoire     457
valeurs         424
republique      382
tous            382
Name: civique, dtype: uint16

respect


respect       2569
valeurs        840
republique     677
ecole          591
education      539
non            511
tous           468
faire          305
civique        292
tout           275
Name: respect, dtype: uint16

faire


faire         2543
respecter      633
valeurs        601
republique     578
ecole          510
education      412
tous           410
loi            388
lois           361
faut           320
Name: faire, dtype: uint16

tous


tous          2512
republique     639
valeurs        625
education      511
ecole          479
respect        468
faire          410
civique        382
citoyens       299
faut           270
Name: tous, dtype: uint16

tout


tout          1896
valeurs        500
republique     468
education      414
ecole          408
faire          310
respect        275
civique        261
tous           258
faut           252
Name: tout, dtype: uint16

loi


loi            1824
appliquer       408
faire           388
respecter       291
republique      263
respect         248
tous            239
valeurs         202
education       199
application     179
Name: loi, dtype: uint16

faut


faut          1514
valeurs        462
republique     411
ecole          363
faire          320
education      318
tous           270
tout           252
respect        243
france         161
Name: faut, dtype: uint16

lois


lois          1496
republique     427
faire          361
respecter      313
appliquer      304
respect        272
tous           213
valeurs        194
tout           165
education      147
Name: lois, dtype: uint16

respecter


respecter     1351
faire          633
republique     387
valeurs        343
lois           313
loi            291
tous           202
ecole          167
tout           153
faut           147
Name: respecter, dtype: uint16

cours


cours          1340
civique         724
education       597
ecole           551
instruction     247
valeurs         219
republique      215
primaire        166
faire           162
tous            149
Name: cours, dtype: uint16

instruction


instruction    1325
civique        1188
ecole           600
cours           247
education       213
valeurs         164
primaire        152
service         147
obligatoire     146
republique      135
Name: instruction, dtype: uint16

non


non           1279
respect        511
valeurs        356
republique     320
ecole          248
education      243
faire          224
cas            212
tous           207
droit          170
Name: non, dtype: uint16

service


service        1272
civique         654
militaire       431
obligatoire     365
ecole           363
education       352
national        291
tous            238
mois            210
valeurs         208
Name: service, dtype: uint16

citoyens


citoyens      1178
republique     350
valeurs        306
tous           299
education      219
respect        200
ecole          198
faire          165
tout           159
faut           152
Name: citoyens, dtype: uint16

france


france        1174
valeurs        373
republique     312
tous           245
francais       243
pays           218
faire          214
ecole          205
tout           193
education      187
Name: france, dtype: uint16

exemple


exemple       1134
valeurs        289
republique     252
elus           220
tous           185
ecole          174
education      166
respect        163
faire          153
tout           130
Name: exemple, dtype: uint16

In [120]:
for i in df_qu_21_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_21[i].sort_values(ascending=False).head(10))

education


education    1.000000
nationale    0.788686
civique      0.586265
citoyenne    0.528571
parents      0.498534
renforcer    0.497382
cours        0.445522
college      0.427015
long         0.425606
scolaire     0.419865
Name: education, dtype: float32

ecole


ecole            1.000000
primaire         0.621495
apprentissage    0.553299
enseigner        0.550305
lycee            0.543956
commence         0.543396
role             0.538321
apprendre        0.499192
parents          0.497067
college          0.488017
Name: ecole, dtype: float32

valeurs


valeurs          1.000000
intangibles      0.952703
republicaines    0.801303
republique       0.544459
comprehension    0.504274
fraternite       0.458574
faudrait         0.423181
garantir         0.409091
respectent       0.405010
nationalite      0.388740
Name: valeurs, dtype: float32

republique


republique       1.000000
intangibles      0.724662
valeurs          0.498329
comprehension    0.403846
francaise        0.383792
respecte         0.380577
democratie       0.369231
principes        0.359498
fraternite       0.346821
representants    0.340764
Name: republique, dtype: float32

civique


civique        1.000000
instruction    0.896604
cours          0.540299
retablir       0.525773
service        0.514151
obligatoire    0.504415
remettre       0.488739
college        0.466231
mois           0.464945
morale         0.464380
Name: civique, dtype: float32

respect


respect          1.000000
garantir         0.436364
non              0.399531
cas              0.336676
comprehension    0.318376
tolerance        0.266979
regles           0.258693
sanctions        0.228519
societe          0.222011
apprendre        0.216478
Name: respect, dtype: float32

faire


faire         1.000000
respecter     0.468542
comprendre    0.363128
appliquer     0.315732
travail       0.255583
lois          0.241310
donner        0.219565
loi           0.212719
faut          0.211361
pays          0.206332
Name: faire, dtype: float32

tous


tous           1.000000
ans            0.332418
citoyens       0.253820
francais       0.247610
societe        0.235294
jeunes         0.224456
obligatoire    0.220751
egalite        0.218405
vie            0.214706
france         0.208688
Name: tous, dtype: float32

tout


tout         1.000000
long         0.844291
monde        0.595642
scolarite    0.451505
vie          0.222059
citoyen      0.211485
francais     0.175908
faut         0.166446
france       0.164395
droit        0.163324
Name: tout, dtype: float32

loi


loi            1.000000
appliquer      0.448845
application    0.427208
respecter      0.215396
faire          0.152576
non            0.110242
laicite        0.103083
respect        0.096536
tous           0.095143
tout           0.092827
Name: loi, dtype: float32

faut


faut        1.000000
pays        0.138646
france      0.137138
tout        0.132911
enfants     0.129630
citoyens    0.129032
faire       0.125836
francais    0.125239
egalite     0.123926
non         0.114152
Name: faut, dtype: float32

lois


lois           1.000000
application    0.336516
appliquer      0.334433
respecter      0.231680
faire          0.141958
pays           0.127729
republique     0.111343
non            0.107115
respect        0.105878
france         0.102215
Name: lois, dtype: float32

respecter


respecter     1.000000
faire         0.248919
lois          0.209225
loi           0.159539
regles        0.151599
france        0.103918
francais      0.101338
republique    0.100913
faut          0.097094
exemple       0.089065
Name: respecter, dtype: float32

cours


cours          1.000000
lycee          0.277473
college        0.272331
citoyennete    0.235426
civique        0.202122
primaire       0.193925
histoire       0.193443
instruction    0.186415
obligatoire    0.130243
ecoles         0.127078
Name: cours, dtype: float32

instruction


instruction    1.000000
civique        0.331658
cours          0.184328
primaire       0.177570
obligatoire    0.161148
ecoles         0.140143
service        0.115566
ecole          0.111483
tous           0.052946
respect        0.040093
Name: instruction, dtype: float32

non


non         1.000000
cas         0.303725
droit       0.243553
respect     0.198910
pays        0.118996
francais    0.112811
france      0.112436
citoyens    0.101019
faut        0.096433
lois        0.091578
Name: non, dtype: float32

service


service        1.000000
militaire      0.981777
mois           0.774908
national       0.684706
obligatoire    0.402870
jeunes         0.251256
remettre       0.234234
place          0.216430
civique        0.182580
citoyen        0.147059
Name: service, dtype: float32

citoyens


citoyens      1.000000
elus          0.150794
droits        0.132641
tous          0.119029
exemple       0.110229
francais      0.104207
faut          0.100396
non           0.093041
republique    0.091265
tout          0.083861
Name: citoyens, dtype: float32

france


france       1.000000
histoire     0.298361
etrangers    0.251208
pays         0.237991
francais     0.232314
vivre        0.222037
francaise    0.189602
faut         0.106341
non          0.103206
tout         0.101793
Name: france, dtype: float32

exemple


exemple      1.000000
elus         0.249433
donner       0.234783
egalite      0.125153
citoyens     0.106112
faut         0.082563
respecter    0.074759
tous         0.073646
valeurs      0.068974
tout         0.068565
Name: exemple, dtype: float32

In [121]:
for i in df_qu_21_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_21[i].sort_values(ascending=False).head(10))

education


education    0.000167
nationale    0.000131
civique      0.000098
citoyenne    0.000088
parents      0.000083
renforcer    0.000083
cours        0.000074
college      0.000071
long         0.000071
scolaire     0.000070
Name: education, dtype: float32

ecole


ecole            0.000186
primaire         0.000115
apprentissage    0.000103
enseigner        0.000102
lycee            0.000101
commence         0.000101
role             0.000100
apprendre        0.000093
parents          0.000092
college          0.000091
Name: ecole, dtype: float32

valeurs


valeurs          0.000239
intangibles      0.000227
republicaines    0.000191
republique       0.000130
comprehension    0.000120
fraternite       0.000109
faudrait         0.000101
garantir         0.000098
respectent       0.000097
nationalite      0.000093
Name: valeurs, dtype: float32

republique


republique       0.000261
intangibles      0.000189
valeurs          0.000130
comprehension    0.000105
francaise        0.000100
respecte         0.000099
democratie       0.000096
principes        0.000094
fraternite       0.000090
representants    0.000089
Name: republique, dtype: float32

civique


civique        0.000279
instruction    0.000250
cours          0.000151
retablir       0.000147
service        0.000144
obligatoire    0.000141
remettre       0.000136
college        0.000130
mois           0.000130
morale         0.000130
Name: civique, dtype: float32

respect


respect          0.000389
garantir         0.000170
non              0.000156
cas              0.000131
comprehension    0.000124
tolerance        0.000104
regles           0.000101
sanctions        0.000089
societe          0.000086
apprendre        0.000084
Name: respect, dtype: float32

faire


faire         0.000393
respecter     0.000184
comprendre    0.000143
appliquer     0.000124
travail       0.000101
lois          0.000095
donner        0.000086
loi           0.000084
faut          0.000083
pays          0.000081
Name: faire, dtype: float32

tous


tous           0.000398
ans            0.000132
citoyens       0.000101
francais       0.000099
societe        0.000094
jeunes         0.000089
obligatoire    0.000088
egalite        0.000087
vie            0.000085
france         0.000083
Name: tous, dtype: float32

tout


tout         0.000527
long         0.000445
monde        0.000314
scolarite    0.000238
vie          0.000117
citoyen      0.000112
francais     0.000093
faut         0.000088
france       0.000087
droit        0.000086
Name: tout, dtype: float32

loi


loi            0.000548
appliquer      0.000246
application    0.000234
respecter      0.000118
faire          0.000084
non            0.000060
laicite        0.000057
respect        0.000053
tous           0.000052
tout           0.000051
Name: loi, dtype: float32

faut


faut        0.000661
pays        0.000092
france      0.000091
tout        0.000088
enfants     0.000086
citoyens    0.000085
faire       0.000083
francais    0.000083
egalite     0.000082
non         0.000075
Name: faut, dtype: float32

lois


lois           0.000668
application    0.000225
appliquer      0.000224
respecter      0.000155
faire          0.000095
pays           0.000085
republique     0.000074
non            0.000072
respect        0.000071
france         0.000068
Name: lois, dtype: float32

respecter


respecter     0.000740
faire         0.000184
lois          0.000155
loi           0.000118
regles        0.000112
france        0.000077
francais      0.000075
republique    0.000075
faut          0.000072
exemple       0.000066
Name: respecter, dtype: float32

cours


cours          0.000746
lycee          0.000207
college        0.000203
citoyennete    0.000176
civique        0.000151
primaire       0.000145
histoire       0.000144
instruction    0.000139
obligatoire    0.000097
ecoles         0.000095
Name: cours, dtype: float32

instruction


instruction    0.000755
civique        0.000250
cours          0.000139
primaire       0.000134
obligatoire    0.000122
ecoles         0.000106
service        0.000087
ecole          0.000084
tous           0.000040
respect        0.000030
Name: instruction, dtype: float32

non


non         0.000782
cas         0.000237
droit       0.000190
respect     0.000156
pays        0.000093
francais    0.000088
france      0.000088
citoyens    0.000079
faut        0.000075
lois        0.000072
Name: non, dtype: float32

service


service        0.000786
militaire      0.000772
mois           0.000609
national       0.000538
obligatoire    0.000317
jeunes         0.000198
remettre       0.000184
place          0.000170
civique        0.000144
citoyen        0.000116
Name: service, dtype: float32

citoyens


citoyens      0.000849
elus          0.000128
droits        0.000113
tous          0.000101
exemple       0.000094
francais      0.000088
faut          0.000085
non           0.000079
republique    0.000077
tout          0.000071
Name: citoyens, dtype: float32

france


france       0.000852
histoire     0.000254
etrangers    0.000214
pays         0.000203
francais     0.000198
vivre        0.000189
francaise    0.000162
faut         0.000091
non          0.000088
tout         0.000087
Name: france, dtype: float32

exemple


exemple      0.000882
elus         0.000220
donner       0.000207
egalite      0.000110
citoyens     0.000094
faut         0.000073
respecter    0.000066
tous         0.000065
valeurs      0.000061
tout         0.000060
Name: exemple, dtype: float32

In [122]:
gc.collect()

147

# Question 22:  Que faudrait-il faire aujourd'hui pour renforcer l'engagement citoyen dans la société ?

In [123]:
question_22 = "Que faudrait-il faire aujourd'hui pour renforcer l'engagement citoyen dans la société ?"
qu_22,df_qu_22_one_hot,df_cov_22,df_confidence_22,df_lift_22 = compute_similarities(question_22, new_res)

In [124]:
for i in df_qu_22_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_22[i].sort_values(ascending=False).head(10))

service


service        3604
civique        1559
obligatoire    1243
militaire      1178
mois            696
national        641
jeunes          609
tous            561
citoyen         540
place           309
Name: service, dtype: uint16

citoyens


citoyens      3524
faire          533
tous           412
elus           388
engagement     360
citoyen        356
societe        345
donner         323
vie            300
faut           290
Name: citoyens, dtype: uint16

citoyen


citoyen        2983
engagement     1067
service         540
societe         410
faire           406
citoyens        356
tous            318
tout            312
faut            303
obligatoire     284
Name: citoyen, dtype: uint16

obligatoire


obligatoire    2616
service        1243
vote           1158
civique         716
militaire       408
tous            372
mois            336
citoyen         284
jeunes          258
national        189
Name: obligatoire, dtype: uint16

civique


civique        2366
service        1559
obligatoire     716
education       632
ecole           449
jeunes          345
instruction     343
tous            333
mois            308
militaire       308
Name: civique, dtype: uint16

faire


faire         2340
citoyens       533
citoyen        406
participer     324
tous           318
service        290
tout           267
engagement     258
societe        256
faut           232
Name: faire, dtype: uint16

engagement


engagement      2154
citoyen         1067
citoyens         360
societe          307
associations     289
service          259
faire            258
faut             234
valoriser        220
tout             192
Name: engagement, dtype: uint16

tous


tous           1921
service         561
citoyens        412
obligatoire     372
civique         333
faire           318
citoyen         318
jeunes          241
vie             208
mois            197
Name: tous, dtype: uint16

vote


vote           1689
obligatoire    1158
citoyens        216
citoyen         162
service         143
tous            134
faire           121
compte          112
droit           112
civique         109
Name: vote, dtype: uint16

education


education      1623
civique         632
ecole           383
service         271
faire           159
citoyen         155
citoyens        154
tout            141
obligatoire     141
engagement      131
Name: education, dtype: uint16

associations


associations    1572
engagement       289
service          275
citoyens         259
citoyen          237
faire            184
civique          172
jeunes           167
tous             154
benevolat        146
Name: associations, dtype: uint16

ecole


ecole          1517
civique         449
education       383
service         244
faire           194
citoyen         184
instruction     156
citoyens        152
enfants         149
engagement      144
Name: ecole, dtype: uint16

donner


donner          1481
citoyens         323
citoyen          228
faire            207
temps            173
envie            166
engagement       162
pouvoir          161
exemple          145
associations     123
Name: donner, dtype: uint16

societe


societe       1446
citoyen        410
citoyens       345
engagement     307
faire          256
faut           181
vie            180
service        175
tout           168
tous           162
Name: societe, dtype: uint16

tout


tout          1423
citoyen        312
faire          267
monde          265
citoyens       253
engagement     192
service        185
vie            175
societe        168
faut           165
Name: tout, dtype: uint16

elus


elus          1378
citoyens       388
citoyen        189
confiance      157
exemple        157
tous           141
faire          136
engagement     124
2                0
loi              0
Name: elus, dtype: uint16

vie


vie           1312
citoyens       300
citoyen        281
service        209
tous           208
faire          205
politique      189
societe        180
tout           175
engagement     173
Name: vie, dtype: uint16

militaire


militaire      1200
service        1178
obligatoire     408
civique         308
mois            275
tous            183
remettre        181
jeunes          168
retablir        167
citoyen         143
Name: militaire, dtype: uint16

faut


faut          1192
citoyen        303
citoyens       290
engagement     234
faire          232
societe        181
tout           165
tous           163
service        140
vie            127
Name: faut, dtype: uint16

exemple


exemple         1148
citoyens         231
citoyen          200
faire            181
engagement       173
elus             157
service          147
tous             146
donner           145
associations     120
Name: exemple, dtype: uint16

In [125]:
for i in df_qu_22_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_22[i].sort_values(ascending=False).head(10))

service


service      1.000000
militaire    0.981667
civil        0.962382
6            0.861765
mois         0.811189
national     0.776029
civique      0.658918
an           0.621170
remettre     0.583524
bonne        0.574924
Name: service, dtype: float32

citoyens


citoyens      1.000000
sort          0.483709
decisions     0.364286
avis          0.362613
impliquer     0.336257
participer    0.324015
davantage     0.315476
permettre     0.309890
prendre       0.302932
engager       0.302135
Name: citoyens, dtype: float32

citoyen


citoyen       1.000000
engagement    0.495357
devoirs       0.319502
societe       0.283541
faudrait      0.274600
droits        0.272727
renforcer     0.256881
faut          0.254195
permettre     0.243956
temps         0.236753
Name: citoyen, dtype: float32

obligatoire


obligatoire    1.000000
vote           0.685613
6              0.447059
civil          0.442006
mois           0.391608
service        0.344895
militaire      0.340000
an             0.339833
civique        0.302620
ans            0.296610
Name: obligatoire, dtype: float32

civique


civique        1.000000
instruction    0.924528
cours          0.508600
service        0.432575
6              0.394118
education      0.389402
mois           0.358974
jeunes         0.301573
ecole          0.295979
remettre       0.286041
Name: civique, dtype: float32

faire


faire         1.000000
participer    0.411690
respecter     0.232175
enfants       0.227848
pays          0.225434
faut          0.194631
prendre       0.193811
france        0.192953
decisions     0.191071
niveau        0.190476
Name: faire, dtype: float32

engagement


engagement      1.000000
associatif      0.447867
citoyen         0.357694
valoriser       0.319767
renforcer       0.313761
societe         0.212310
faut            0.196309
temps           0.191657
associations    0.183842
politique       0.169093
Name: engagement, dtype: float32

tous


tous        1.000000
impot       0.330247
ans         0.322034
mois        0.229604
jeunes      0.210664
france      0.179530
francais    0.163130
national    0.159806
vie         0.158537
service     0.155660
Name: tous, dtype: float32

vote


vote           1.000000
obligatoire    0.442661
droit          0.266033
compte         0.127418
tous           0.069755
citoyens       0.061294
citoyen        0.054308
faire          0.051709
civique        0.046069
service        0.039678
Name: vote, dtype: float32

education


education    1.000000
parents      0.407942
nationale    0.398649
cours        0.299754
civique      0.267118
enfants      0.253165
ecole        0.252472
renforcer    0.231193
jeunes       0.104021
tout         0.099086
Name: education, dtype: float32

associations


associations    1.000000
benevoles       0.478405
aider           0.370370
aide            0.270202
favoriser       0.252252
benevolat       0.249147
valoriser       0.190407
temps           0.148816
jeunes          0.145979
travail         0.144854
Name: associations, dtype: float32

ecole


ecole          1.000000
instruction    0.420485
apprendre      0.386667
enfants        0.314346
cours          0.302211
education      0.235983
valeurs        0.193980
civique        0.189772
jeunes         0.111888
tout           0.088545
Name: ecole, dtype: float32

donner


donner      1.000000
envie       0.470255
moyens      0.353846
pouvoir     0.252747
temps       0.195039
exemple     0.126307
faut        0.095638
citoyens    0.091657
faire       0.088462
vie         0.086128
Name: donner, dtype: float32

societe


societe       1.000000
engager       0.226601
faut          0.151846
travail       0.143583
engagement    0.142526
citoyen       0.137446
vie           0.137195
temps         0.124014
tout          0.118060
place         0.113730
Name: societe, dtype: float32

tout


tout          1.000000
monde         0.541922
faut          0.138423
vie           0.133384
societe       0.116183
faire         0.114103
citoyen       0.104593
exemple       0.094948
engagement    0.089136
education     0.086876
Name: tout, dtype: float32

elus


elus          1.000000
confiance     0.211306
exemple       0.136760
citoyens      0.110102
tous          0.073399
citoyen       0.063359
faire         0.058120
engagement    0.057567
2             0.000000
loi           0.000000
Name: elus, dtype: float32

vie


vie           1.000000
publique      0.274559
politique     0.211646
participer    0.208386
citoyenne     0.189420
temps         0.149944
societe       0.124481
tout          0.122980
tous          0.108277
faut          0.106544
Name: vie, dtype: float32

militaire


militaire      1.000000
remettre       0.414188
6              0.402941
retablir       0.371111
service        0.326859
mois           0.320513
obligatoire    0.155963
jeunes         0.146853
civique        0.130178
place          0.122951
Name: militaire, dtype: float32

faut


faut          1.000000
societe       0.125173
tout          0.115952
engagement    0.108635
citoyen       0.101576
faire         0.099145
vie           0.096799
exemple       0.091463
tous          0.084852
citoyens      0.082293
Name: faut, dtype: float32

exemple


exemple       1.000000
politiques    0.142098
temps         0.122886
elus          0.113933
donner        0.097907
faut          0.088087
vie           0.083079
engagement    0.080316
societe       0.078147
faire         0.077350
Name: exemple, dtype: float32

In [126]:
for i in df_qu_22_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_22[i].sort_values(ascending=False).head(10))

service


service      0.000277
militaire    0.000272
civil        0.000267
6            0.000239
mois         0.000225
national     0.000215
civique      0.000183
an           0.000172
remettre     0.000162
bonne        0.000160
Name: service, dtype: float32

citoyens


citoyens      0.000284
sort          0.000137
decisions     0.000103
avis          0.000103
impliquer     0.000095
participer    0.000092
davantage     0.000090
permettre     0.000088
prendre       0.000086
engager       0.000086
Name: citoyens, dtype: float32

citoyen


citoyen       0.000335
engagement    0.000166
devoirs       0.000107
societe       0.000095
faudrait      0.000092
droits        0.000091
renforcer     0.000086
faut          0.000085
permettre     0.000082
temps         0.000079
Name: citoyen, dtype: float32

obligatoire


obligatoire    0.000382
vote           0.000262
6              0.000171
civil          0.000169
mois           0.000150
service        0.000132
militaire      0.000130
an             0.000130
civique        0.000116
ans            0.000113
Name: obligatoire, dtype: float32

civique


civique        0.000423
instruction    0.000391
cours          0.000215
service        0.000183
6              0.000167
education      0.000165
mois           0.000152
jeunes         0.000127
ecole          0.000125
remettre       0.000121
Name: civique, dtype: float32

faire


faire         0.000427
participer    0.000176
respecter     0.000099
enfants       0.000097
pays          0.000096
faut          0.000083
prendre       0.000083
france        0.000082
decisions     0.000082
niveau        0.000081
Name: faire, dtype: float32

engagement


engagement      0.000464
associatif      0.000208
citoyen         0.000166
valoriser       0.000148
renforcer       0.000146
societe         0.000099
faut            0.000091
temps           0.000089
associations    0.000085
politique       0.000079
Name: engagement, dtype: float32

tous


tous        0.000521
impot       0.000172
ans         0.000168
mois        0.000120
jeunes      0.000110
france      0.000093
francais    0.000085
national    0.000083
vie         0.000083
service     0.000081
Name: tous, dtype: float32

vote


vote           0.000592
obligatoire    0.000262
droit          0.000158
compte         0.000075
tous           0.000041
citoyens       0.000036
citoyen        0.000032
faire          0.000031
civique        0.000027
service        0.000023
Name: vote, dtype: float32

education


education    0.000616
parents      0.000251
nationale    0.000246
cours        0.000185
civique      0.000165
enfants      0.000156
ecole        0.000156
renforcer    0.000142
jeunes       0.000064
tout         0.000061
Name: education, dtype: float32

associations


associations    0.000636
benevoles       0.000304
aider           0.000236
aide            0.000172
favoriser       0.000160
benevolat       0.000158
valoriser       0.000121
temps           0.000095
jeunes          0.000093
travail         0.000092
Name: associations, dtype: float32

ecole


ecole          0.000659
instruction    0.000277
apprendre      0.000255
enfants        0.000207
cours          0.000199
education      0.000156
valeurs        0.000128
civique        0.000125
jeunes         0.000074
tout           0.000058
Name: ecole, dtype: float32

donner


donner      0.000675
envie       0.000318
moyens      0.000239
pouvoir     0.000171
temps       0.000132
exemple     0.000085
faut        0.000065
citoyens    0.000062
faire       0.000060
vie         0.000058
Name: donner, dtype: float32

societe


societe       0.000692
engager       0.000157
faut          0.000105
travail       0.000099
engagement    0.000099
citoyen       0.000095
vie           0.000095
temps         0.000086
tout          0.000082
place         0.000079
Name: societe, dtype: float32

tout


tout          0.000703
monde         0.000381
faut          0.000097
vie           0.000094
societe       0.000082
faire         0.000080
citoyen       0.000074
exemple       0.000067
engagement    0.000063
education     0.000061
Name: tout, dtype: float32

elus


elus          0.000726
confiance     0.000153
exemple       0.000099
citoyens      0.000080
tous          0.000053
citoyen       0.000046
faire         0.000042
engagement    0.000042
benevolat          NaN
eduquer            NaN
Name: elus, dtype: float32

vie


vie           0.000762
publique      0.000209
politique     0.000161
participer    0.000159
citoyenne     0.000144
temps         0.000114
societe       0.000095
tout          0.000094
tous          0.000083
faut          0.000081
Name: vie, dtype: float32

militaire


militaire      0.000833
remettre       0.000345
6              0.000336
retablir       0.000309
service        0.000272
mois           0.000267
obligatoire    0.000130
jeunes         0.000122
civique        0.000108
place          0.000102
Name: militaire, dtype: float32

faut


faut          0.000839
societe       0.000105
tout          0.000097
engagement    0.000091
citoyen       0.000085
faire         0.000083
vie           0.000081
exemple       0.000077
tous          0.000071
citoyens      0.000069
Name: faut, dtype: float32

exemple


exemple       0.000871
politiques    0.000124
temps         0.000107
elus          0.000099
donner        0.000085
faut          0.000077
vie           0.000072
engagement    0.000070
societe       0.000068
faire         0.000067
Name: exemple, dtype: float32

In [127]:
gc.collect()

147

# Question 23:   Quels sont les comportements civiques qu'il faut promouvoir dans notre vie quotidienne ou collective ?

In [128]:
question_23 = "Quels sont les comportements civiques qu'il faut promouvoir dans notre vie quotidienne ou collective ?"
qu_23,df_qu_23_one_hot,df_cov_23,df_confidence_23,df_lift_23 = compute_similarities(question_23, new_res)

In [129]:
for i in df_qu_23_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_23[i].sort_values(ascending=False).head(10))

respect


respect          11683
politesse         1346
tolerance          998
solidarite         823
environnement      794
tous               704
lois               696
entraide           675
biens              657
institutions       605
Name: respect, dtype: uint16

politesse


politesse     1762
respect       1346
proprete       157
vivre          156
entraide       156
tolerance      145
courtoisie     130
savoir         125
regles         116
solidarite     105
Name: politesse, dtype: uint16

solidarite


solidarite        1711
respect            823
entraide           286
tolerance          160
fraternite         158
politesse          105
actions              0
responsabilite       0
france               0
publics              0
Name: solidarite, dtype: uint16

tous


tous             1648
respect           704
comportements     191
vie               141
faire             140
citoyens          126
tout              121
faut              116
lois              103
publics             0
Name: tous, dtype: uint16

entraide


entraide         1455
respect           675
solidarite        286
politesse         156
partage           105
droits              0
tolerance           0
france              0
publics             0
participation       0
Name: entraide, dtype: uint16

tolerance


tolerance         1401
respect            998
solidarite         160
politesse          145
ecoute             111
voter                0
responsabilite       0
france               0
publics              0
participation        0
Name: tolerance, dtype: uint16

vie


vie               1260
respect            508
regles             157
tous               141
societe            131
participation      121
tout               118
faut               107
comportement         0
responsabilite       0
Name: vie, dtype: uint16

tout


tout              1237
respect            533
monde              167
faire              146
tous               121
vie                118
faut               116
responsabilite       0
tolerance            0
france               0
Name: tout, dtype: uint16

faire


faire           1089
respect          356
respecter        194
faut             155
tout             146
tous             140
comportement       0
droits             0
france             0
publics            0
Name: faire, dtype: uint16

environnement


environnement    1082
respect           794
comportement        0
collectif           0
france              0
publics             0
participation       0
empathie            0
republique          0
associatif          0
Name: environnement, dtype: uint16

engagement


engagement       989
associatif       272
respect          217
associations     138
citoyen          104
comportements      0
tolerance          0
france             0
publics            0
participation      0
Name: engagement, dtype: uint16

respecter


respecter        966
respect          230
faire            194
lois             124
regles           109
comportement       0
collectif          0
france             0
publics            0
participation      0
Name: respecter, dtype: uint16

aide


aide             926
respect          273
agees            123
comportement       0
france             0
publics            0
participation      0
empathie           0
republique         0
associatif         0
Name: aide, dtype: uint16

comportements


comportements     907
respect           238
civiques          231
tous              191
promouvoir        134
faut              125
responsabilite      0
tolerance           0
france              0
publics             0
Name: comportements, dtype: uint16

education


education        896
respect          347
civique          195
ecole            154
parents          119
droits             0
tolerance          0
france             0
publics            0
participation      0
Name: education, dtype: uint16

vivre


vivre            891
ensemble         518
respect          483
savoir           283
politesse        156
regles           106
comportement       0
france             0
publics            0
participation      0
Name: vivre, dtype: uint16

lois


lois             889
respect          696
respecter        124
regles           113
tous             103
comportement       0
collectif          0
france             0
publics            0
participation      0
Name: lois, dtype: uint16

faut


faut             889
respect          252
promouvoir       213
faire            155
comportements    125
tout             116
tous             116
vie              107
societe          101
associatif         0
Name: faut, dtype: uint16

ecole


ecole            868
respect          387
civique          176
education        154
parents          111
droits             0
tolerance          0
france             0
publics            0
participation      0
Name: ecole, dtype: uint16

citoyens


citoyens         845
respect          285
tous             126
comportement       0
collectif          0
tolerance          0
france             0
publics            0
participation      0
empathie           0
Name: citoyens, dtype: uint16

In [130]:
for i in df_qu_23_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_23[i].sort_values(ascending=False).head(10))

respect


respect          1.000000
biens            0.874834
institutions     0.854520
difference       0.854406
differences      0.831579
autorite         0.815789
lois             0.782902
regles           0.769728
politesse        0.763905
environnement    0.733826
Name: respect, dtype: float32

politesse


politesse     1.000000
courtoisie    0.430464
savoir        0.280269
proprete      0.252412
vivre         0.175084
regles        0.150065
respect       0.115210
entraide      0.107216
tolerance     0.103498
solidarite    0.061368
Name: politesse, dtype: float32

solidarite


solidarite        1.000000
fraternite        0.206806
entraide          0.196564
tolerance         0.114204
respect           0.070444
politesse         0.059591
actions           0.000000
responsabilite    0.000000
france            0.000000
incivilites       0.000000
Name: solidarite, dtype: float32

tous


tous             1.000000
comportements    0.210584
citoyens         0.149112
faut             0.130484
faire            0.128558
lois             0.115861
vie              0.111905
tout             0.097817
respect          0.060258
publics          0.000000
Name: tous, dtype: float32

entraide


entraide         1.000000
partage          0.212551
solidarite       0.167154
politesse        0.088536
respect          0.057776
droits           0.000000
tolerance        0.000000
france           0.000000
publics          0.000000
participation    0.000000
Name: entraide, dtype: float32

tolerance


tolerance         1.000000
ecoute            0.150611
solidarite        0.093513
respect           0.085423
politesse         0.082293
voter             0.000000
responsabilite    0.000000
france            0.000000
incivilites       0.000000
publics           0.000000
Name: tolerance, dtype: float32

vie


vie               1.000000
participation     0.242972
societe           0.204688
regles            0.203105
faut              0.120360
tout              0.095392
tous              0.085558
respect           0.043482
comportement      0.000000
responsabilite    0.000000
Name: vie, dtype: float32

tout


tout              1.000000
monde             0.575862
faire             0.134068
faut              0.130484
vie               0.093651
tous              0.073422
respect           0.045622
responsabilite    0.000000
tolerance         0.000000
france            0.000000
Name: tout, dtype: float32

faire


faire           1.000000
respecter       0.200828
faut            0.174353
tout            0.118027
tous            0.084951
respect         0.030472
comportement    0.000000
droits          0.000000
france          0.000000
publics         0.000000
Name: faire, dtype: float32

environnement


environnement    1.000000
respect          0.067962
comportement     0.000000
collectif        0.000000
france           0.000000
publics          0.000000
participation    0.000000
empathie         0.000000
republique       0.000000
associatif       0.000000
Name: environnement, dtype: float32

engagement


engagement       1.000000
associatif       0.741144
citoyen          0.203922
associations     0.179454
respect          0.018574
comportements    0.000000
tolerance        0.000000
france           0.000000
publics          0.000000
participation    0.000000
Name: engagement, dtype: float32

respecter


respecter        1.000000
faire            0.178145
regles           0.141009
lois             0.139483
respect          0.019687
comportement     0.000000
collectif        0.000000
france           0.000000
publics          0.000000
participation    0.000000
Name: respecter, dtype: float32

aide


aide             1.000000
agees            0.335150
respect          0.023367
comportement     0.000000
france           0.000000
publics          0.000000
participation    0.000000
empathie         0.000000
republique       0.000000
associatif       0.000000
Name: aide, dtype: float32

comportements


comportements     1.000000
civiques          0.681416
promouvoir        0.184319
faut              0.140607
tous              0.115898
respect           0.020371
responsabilite    0.000000
tolerance         0.000000
france            0.000000
publics           0.000000
Name: comportements, dtype: float32

education


education        1.000000
parents          0.323370
civique          0.254569
ecole            0.177419
respect          0.029701
droits           0.000000
tolerance        0.000000
france           0.000000
publics          0.000000
participation    0.000000
Name: education, dtype: float32

vivre


vivre            1.000000
ensemble         0.853377
savoir           0.634529
regles           0.137128
politesse        0.088536
respect          0.041342
comportement     0.000000
france           0.000000
publics          0.000000
participation    0.000000
Name: vivre, dtype: float32

lois


lois             1.000000
regles           0.146184
respecter        0.128364
tous             0.062500
respect          0.059574
comportement     0.000000
collectif        0.000000
france           0.000000
publics          0.000000
participation    0.000000
Name: lois, dtype: float32

faut


faut             1.000000
promouvoir       0.292985
societe          0.157813
faire            0.142332
comportements    0.137817
tout             0.093775
vie              0.084921
tous             0.070388
respect          0.021570
associatif       0.000000
Name: faut, dtype: float32

ecole


ecole            1.000000
parents          0.301630
civique          0.229765
education        0.171875
respect          0.033125
droits           0.000000
tolerance        0.000000
france           0.000000
publics          0.000000
participation    0.000000
Name: ecole, dtype: float32

citoyens


citoyens         1.000000
tous             0.076456
respect          0.024394
comportement     0.000000
collectif        0.000000
tolerance        0.000000
france           0.000000
publics          0.000000
participation    0.000000
empathie         0.000000
Name: citoyens, dtype: float32

In [131]:
for i in df_qu_23_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_23[i].sort_values(ascending=False).head(10))

respect


respect          0.000086
biens            0.000075
institutions     0.000073
difference       0.000073
differences      0.000071
autorite         0.000070
lois             0.000067
regles           0.000066
politesse        0.000065
environnement    0.000063
Name: respect, dtype: float32

politesse


politesse     0.000568
courtoisie    0.000244
savoir        0.000159
proprete      0.000143
vivre         0.000099
regles        0.000085
respect       0.000065
entraide      0.000061
tolerance     0.000059
solidarite    0.000035
Name: politesse, dtype: float32

solidarite


solidarite       0.000584
fraternite       0.000121
entraide         0.000115
tolerance        0.000067
respect          0.000041
politesse        0.000035
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
Name: solidarite, dtype: float32

tous


tous             0.000607
comportements    0.000128
citoyens         0.000090
faut             0.000079
faire            0.000078
lois             0.000070
vie              0.000068
tout             0.000059
respect          0.000037
benevolat             NaN
Name: tous, dtype: float32

entraide


entraide         0.000687
partage          0.000146
solidarite       0.000115
politesse        0.000061
respect          0.000040
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
Name: entraide, dtype: float32

tolerance


tolerance        0.000714
ecoute           0.000108
solidarite       0.000067
respect          0.000061
politesse        0.000059
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
Name: tolerance, dtype: float32

vie


vie              0.000794
participation    0.000193
societe          0.000162
regles           0.000161
faut             0.000096
tout             0.000076
tous             0.000068
respect          0.000035
benevolat             NaN
bienveillance         NaN
Name: vie, dtype: float32

tout


tout             0.000808
monde            0.000466
faire            0.000108
faut             0.000105
vie              0.000076
tous             0.000059
respect          0.000037
benevolat             NaN
bienveillance         NaN
dechets               NaN
Name: tout, dtype: float32

faire


faire            0.000918
respecter        0.000184
faut             0.000160
tout             0.000108
tous             0.000078
respect          0.000028
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
Name: faire, dtype: float32

environnement


environnement    0.000924
respect          0.000063
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
laicite               NaN
commun                NaN
respecter             NaN
Name: environnement, dtype: float32

engagement


engagement       0.001011
associatif       0.000749
citoyen          0.000206
associations     0.000181
respect          0.000019
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
Name: engagement, dtype: float32

respecter


respecter        0.001035
faire            0.000184
regles           0.000146
lois             0.000144
respect          0.000020
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
Name: respecter, dtype: float32

aide


aide             0.001080
agees            0.000362
respect          0.000025
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
laicite               NaN
commun                NaN
Name: aide, dtype: float32

comportements


comportements    0.001103
civiques         0.000751
promouvoir       0.000203
faut             0.000155
tous             0.000128
respect          0.000022
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
Name: comportements, dtype: float32

education


education        0.001116
parents          0.000361
civique          0.000284
ecole            0.000198
respect          0.000033
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
Name: education, dtype: float32

vivre


vivre            0.001122
ensemble         0.000958
savoir           0.000712
regles           0.000154
politesse        0.000099
respect          0.000046
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
Name: vivre, dtype: float32

lois


lois             0.001125
regles           0.000164
respecter        0.000144
tous             0.000070
respect          0.000067
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
Name: lois, dtype: float32

faut


faut             0.001125
promouvoir       0.000330
societe          0.000178
faire            0.000160
comportements    0.000155
tout             0.000105
vie              0.000096
tous             0.000079
respect          0.000024
benevolat             NaN
Name: faut, dtype: float32

ecole


ecole            0.001152
parents          0.000348
civique          0.000265
education        0.000198
respect          0.000038
benevolat             NaN
bienveillance         NaN
dechets               NaN
citoyens              NaN
travail               NaN
Name: ecole, dtype: float32

citoyens


citoyens         0.001183
tous             0.000090
respect          0.000029
benevolat             NaN
bienveillance         NaN
dechets               NaN
travail               NaN
laicite               NaN
commun                NaN
respecter             NaN
Name: citoyens, dtype: float32

In [132]:
gc.collect()

147

# Question 24:  Que faudrait-il faire pour favoriser le développement de ces comportements civiques et par quels engagements concrets chacun peut-il y participer ?

In [133]:
question_24 = "Que faudrait-il faire pour favoriser le développement de ces comportements civiques et par quels engagements concrets chacun peut-il y participer ?"
qu_24,df_qu_24_one_hot,df_cov_24,df_confidence_24,df_lift_24 = compute_similarities(question_24, new_res)

In [134]:
for i in df_qu_24_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_24[i].sort_values(ascending=False).head(10))

education


education    3849
ecole         975
civique       887
parents       585
enfants       429
tout          372
nationale     315
faire         290
service       269
age           253
Name: education, dtype: uint16

ecole


ecole          3335
education       975
civique         742
parents         564
enfants         381
faire           349
tout            318
respect         309
service         278
instruction     271
Name: ecole, dtype: uint16

civique


civique        2396
service         959
education       887
ecole           742
instruction     458
obligatoire     402
tous            249
cours           247
jeunes          212
faire           209
Name: civique, dtype: uint16

faire


faire            1928
ecole             349
education         290
faut              247
tout              235
tous              222
civique           209
exemple           197
comportements     194
enfants           189
Name: faire, dtype: uint16

service


service        1784
civique         959
militaire       491
obligatoire     490
ecole           278
national        276
education       269
jeunes          256
tous            223
mois            219
Name: service, dtype: uint16

exemple


exemple          1717
montrer           255
donner            247
education         238
ecole             219
faire             197
elus              168
comportements     157
tous              157
tout              156
Name: exemple, dtype: uint16

tous


tous         1458
education     250
civique       249
ecole         238
service       223
faire         222
citoyens      163
exemple       157
vie           147
faut          146
Name: tous, dtype: uint16

tout


tout         1434
education     372
ecole         318
faire         235
monde         209
faut          195
civique       184
vie           164
exemple       156
parents       154
Name: tout, dtype: uint16

parents


parents      1301
education     585
ecole         564
enfants       510
role          163
faire         162
civique       156
tout          154
eduquer       151
faut          142
Name: parents, dtype: uint16

comportements


comportements    1269
civiques          435
ecole             262
education         219
faire             194
exemple           157
faut              142
tous              126
tout              123
civique           120
Name: comportements, dtype: uint16

associations


associations     1203
ecole             172
education         145
service           122
faire             122
valoriser           0
parents             0
comportements       0
tout                0
france              0
Name: associations, dtype: uint16

citoyens


citoyens         1192
faire             184
tous              163
ecole             136
education         135
exemple           129
faut              116
civique           114
comportements     110
prendre             0
Name: citoyens, dtype: uint16

enfants


enfants      1175
parents       510
education     429
ecole         381
faire         189
eduquer       181
respect       147
faut          144
civique       144
tout          134
Name: enfants, dtype: uint16

faut


faut             1146
ecole             252
faire             247
education         228
tout              195
tous              146
enfants           144
comportements     142
parents           142
exemple           140
Name: faut, dtype: uint16

respect


respect      1132
ecole         309
education     244
non           199
enfants       147
valeurs       132
tout          132
parents       130
tous          129
civique       120
Name: respect, dtype: uint16

vie


vie          1024
ecole         195
education     189
tout          164
civique       157
tous          147
faire         145
societe       112
service       110
respect       106
Name: vie, dtype: uint16

obligatoire


obligatoire      957
service          490
civique          402
vote             168
ecole            161
militaire        151
education        139
tous             137
comportements      0
tout               0
Name: obligatoire, dtype: uint16

jeunes


jeunes           872
service          256
civique          212
education        192
ecole            186
faire            140
tous             137
comportements      0
tout               0
france             0
Name: jeunes, dtype: uint16

donner


donner           866
exemple          247
faire            136
temps            129
education        122
moyens           111
ecole            108
publics            0
niveau             0
participation      0
Name: donner, dtype: uint16

non


non              831
respect          199
faire            139
ecole            134
education        134
tous             108
comportements    104
tout             104
valoriser          0
france             0
Name: non, dtype: uint16

In [135]:
for i in df_qu_24_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_24[i].sort_values(ascending=False).head(10))

education


education    1.000000
nationale    0.748219
parents      0.449654
renforcer    0.411552
cours        0.391225
scolaire     0.389034
famille      0.384106
civique      0.370200
enfants      0.365106
role         0.363083
Name: education, dtype: float32

ecole


ecole          1.000000
primaire       0.641667
enseigner      0.550943
morale         0.546075
instruction    0.508443
famille        0.500000
parents        0.433513
role           0.427992
cours          0.422303
apprendre      0.421505
Name: ecole, dtype: float32

civique


civique         1.000000
instruction     0.859287
service         0.537556
cours           0.451554
obligatoire     0.420063
morale          0.419795
mois            0.379603
primaire        0.355556
militaire       0.351190
comportement    0.333868
Name: civique, dtype: float32

faire


faire         1.000000
respecter     0.362110
participer    0.263653
faut          0.215532
travail       0.186630
societe       0.172414
non           0.167268
tout          0.163877
enfants       0.160851
jeunes        0.160550
Name: faire, dtype: float32

service


service        1.000000
militaire      0.974206
national       0.718750
mois           0.620397
obligatoire    0.512017
civique        0.400250
ans            0.339286
jeunes         0.293578
place          0.180428
citoyen        0.169927
Name: service, dtype: float32

exemple


exemple          1.000000
montrer          0.628079
donner           0.285219
politiques       0.283019
elus             0.264151
comportements    0.123719
faut             0.122164
tout             0.108787
citoyens         0.108221
tous             0.107682
Name: exemple, dtype: float32

tous


tous           1.000000
jeunes         0.157110
vie            0.143555
obligatoire    0.143156
citoyens       0.136745
non            0.129964
faut           0.127400
service        0.125000
faire          0.115145
respect        0.113958
Name: tous, dtype: float32

tout


tout             1.000000
monde            0.533163
faut             0.170157
vie              0.160156
non              0.125150
faire            0.121888
parents          0.118370
respect          0.116608
enfants          0.114043
comportements    0.096927
Name: tout, dtype: float32

parents


parents          1.000000
enfants          0.434043
role             0.330629
eduquer          0.262609
ecole            0.169115
education        0.151988
faut             0.123909
respect          0.114841
tout             0.107392
comportements    0.086682
Name: parents, dtype: float32

comportements


comportements    1.000000
civiques         0.605007
sanctionner      0.207143
favoriser        0.169463
mettre           0.135705
non              0.125150
faut             0.123909
faire            0.100622
citoyens         0.092282
exemple          0.091439
Name: comportements, dtype: float32

associations


associations     1.000000
service          0.068386
faire            0.063278
ecole            0.051574
education        0.037672
valoriser        0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
france           0.000000
Name: associations, dtype: float32

citoyens


citoyens         1.000000
tous             0.111797
faut             0.101222
faire            0.095436
comportements    0.086682
exemple          0.075131
civique          0.047579
ecole            0.040780
education        0.035074
prendre          0.000000
Name: citoyens, dtype: float32

enfants


enfants      1.000000
parents      0.392006
eduquer      0.314783
apprendre    0.227957
respect      0.129859
faut         0.125654
ecole        0.114243
education    0.111458
faire        0.098029
tout         0.093445
Name: enfants, dtype: float32

faut


faut             1.000000
tout             0.135983
faire            0.128112
enfants          0.122553
comportements    0.111899
parents          0.109147
respect          0.102473
vie              0.101562
tous             0.100137
citoyens         0.097315
Name: faut, dtype: float32

respect


respect      1.000000
regles       0.269430
non          0.239471
apprendre    0.223656
valeurs      0.186178
enfants      0.125106
vie          0.103516
faut         0.101222
parents      0.099923
ecole        0.092654
Name: respect, dtype: float32

vie


vie        1.000000
societe    0.175549
tout       0.114365
tous       0.100823
respect    0.093640
faut       0.090750
faire      0.075207
civique    0.065526
service    0.061659
ecole      0.058471
Name: vie, dtype: float32

obligatoire


obligatoire    1.000000
vote           0.506024
militaire      0.299603
service        0.274664
civique        0.167780
tous           0.093964
ecole          0.048276
education      0.036113
tout           0.000000
france         0.000000
Name: obligatoire, dtype: float32

jeunes


jeunes           1.000000
service          0.143498
tous             0.093964
civique          0.088481
faire            0.072614
ecole            0.055772
education        0.049883
tout             0.000000
comportements    0.000000
france           0.000000
Name: jeunes, dtype: float32

donner


donner           1.000000
moyens           0.335347
temps            0.194570
exemple          0.143856
faire            0.070539
ecole            0.032384
education        0.031697
publics          0.000000
niveau           0.000000
participation    0.000000
Name: donner, dtype: float32

non


non              1.000000
respect          0.175795
comportements    0.081954
tous             0.074074
tout             0.072524
faire            0.072095
ecole            0.040180
education        0.034814
valoriser        0.000000
france           0.000000
Name: non, dtype: float32

In [136]:
for i in df_qu_24_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_24[i].sort_values(ascending=False).head(10))

education


education    0.000260
nationale    0.000194
parents      0.000117
renforcer    0.000107
cours        0.000102
scolaire     0.000101
famille      0.000100
civique      0.000096
enfants      0.000095
role         0.000094
Name: education, dtype: float32

ecole


ecole          0.000300
primaire       0.000192
enseigner      0.000165
morale         0.000164
instruction    0.000152
famille        0.000150
parents        0.000130
role           0.000128
cours          0.000127
apprendre      0.000126
Name: ecole, dtype: float32

civique


civique         0.000417
instruction     0.000359
service         0.000224
cours           0.000188
obligatoire     0.000175
morale          0.000175
mois            0.000158
primaire        0.000148
militaire       0.000147
comportement    0.000139
Name: civique, dtype: float32

faire


faire         0.000519
respecter     0.000188
participer    0.000137
faut          0.000112
travail       0.000097
societe       0.000089
non           0.000087
tout          0.000085
enfants       0.000083
jeunes        0.000083
Name: faire, dtype: float32

service


service        0.000561
militaire      0.000546
national       0.000403
mois           0.000348
obligatoire    0.000287
civique        0.000224
ans            0.000190
jeunes         0.000165
place          0.000101
citoyen        0.000095
Name: service, dtype: float32

exemple


exemple          0.000582
montrer          0.000366
donner           0.000166
politiques       0.000165
elus             0.000154
comportements    0.000072
faut             0.000071
tout             0.000063
citoyens         0.000063
tous             0.000063
Name: exemple, dtype: float32

tous


tous           0.000686
jeunes         0.000108
vie            0.000098
obligatoire    0.000098
citoyens       0.000094
non            0.000089
faut           0.000087
service        0.000086
faire          0.000079
respect        0.000078
Name: tous, dtype: float32

tout


tout             0.000697
monde            0.000372
faut             0.000119
vie              0.000112
non              0.000087
faire            0.000085
parents          0.000083
respect          0.000081
enfants          0.000080
comportements    0.000068
Name: tout, dtype: float32

parents


parents          0.000769
enfants          0.000334
role             0.000254
eduquer          0.000202
ecole            0.000130
education        0.000117
faut             0.000095
respect          0.000088
tout             0.000083
comportements    0.000067
Name: parents, dtype: float32

comportements


comportements    0.000788
civiques         0.000477
sanctionner      0.000163
favoriser        0.000134
mettre           0.000107
non              0.000099
faut             0.000098
faire            0.000079
citoyens         0.000073
exemple          0.000072
Name: comportements, dtype: float32

associations


associations    0.000831
service         0.000057
faire           0.000053
ecole           0.000043
education       0.000031
benevolat            NaN
eduquer              NaN
sanctions            NaN
morale               NaN
citoyens             NaN
Name: associations, dtype: float32

citoyens


citoyens         0.000839
tous             0.000094
faut             0.000085
faire            0.000080
comportements    0.000073
exemple          0.000063
civique          0.000040
ecole            0.000034
education        0.000029
benevolat             NaN
Name: citoyens, dtype: float32

enfants


enfants      0.000851
parents      0.000334
eduquer      0.000268
apprendre    0.000194
respect      0.000111
faut         0.000107
ecole        0.000097
education    0.000095
faire        0.000083
tout         0.000080
Name: enfants, dtype: float32

faut


faut             0.000873
tout             0.000119
faire            0.000112
enfants          0.000107
comportements    0.000098
parents          0.000095
respect          0.000089
vie              0.000089
tous             0.000087
citoyens         0.000085
Name: faut, dtype: float32

respect


respect      0.000883
regles       0.000238
non          0.000212
apprendre    0.000198
valeurs      0.000164
enfants      0.000111
vie          0.000091
faut         0.000089
parents      0.000088
ecole        0.000082
Name: respect, dtype: float32

vie


vie        0.000977
societe    0.000171
tout       0.000112
tous       0.000098
respect    0.000091
faut       0.000089
faire      0.000073
civique    0.000064
service    0.000060
ecole      0.000057
Name: vie, dtype: float32

obligatoire


obligatoire    0.001045
vote           0.000529
militaire      0.000313
service        0.000287
civique        0.000175
tous           0.000098
ecole          0.000050
education      0.000038
benevolat           NaN
eduquer             NaN
Name: obligatoire, dtype: float32

jeunes


jeunes       0.001147
service      0.000165
tous         0.000108
civique      0.000101
faire        0.000083
ecole        0.000064
education    0.000057
benevolat         NaN
eduquer           NaN
sanctions         NaN
Name: jeunes, dtype: float32

donner


donner       0.001155
moyens       0.000387
temps        0.000225
exemple      0.000166
faire        0.000081
ecole        0.000037
education    0.000037
benevolat         NaN
eduquer           NaN
sanctions         NaN
Name: donner, dtype: float32

non


non              0.001203
respect          0.000212
comportements    0.000099
tous             0.000089
tout             0.000087
faire            0.000087
ecole            0.000048
education        0.000042
benevolat             NaN
eduquer               NaN
Name: non, dtype: float32

In [137]:
gc.collect()

147

# Question 25:  Que faudrait-il faire pour valoriser l'engagement citoyen dans les parcours de vie, dans les relations avec l'administration et les pouvoirs publics ?

In [138]:
question_25 = "Que faudrait-il faire pour valoriser l'engagement citoyen dans les parcours de vie, dans les relations avec l'administration et les pouvoirs publics ?"
qu_25,df_qu_25_one_hot,df_cov_25,df_confidence_25,df_lift_25 = compute_similarities(question_25, new_res)

In [139]:
for i in df_qu_25_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_25[i].sort_values(ascending=False).head(10))

citoyens


citoyens           1948
administration      370
publics             290
faire               243
pouvoirs            236
citoyen             207
vie                 183
administrations     178
engagement          178
tous                168
Name: citoyens, dtype: uint16

citoyen


citoyen           1895
engagement         838
administration     339
vie                226
service            214
publics            212
citoyens           207
faire              199
valoriser          190
pouvoirs           176
Name: citoyen, dtype: uint16

administration


administration    1711
publics            494
pouvoirs           481
citoyens           370
citoyen            339
service            229
faire              216
relations          213
engagement         165
faut               153
Name: administration, dtype: uint16

engagement


engagement        1509
citoyen            838
valoriser          262
citoyens           178
vie                167
administration     165
retraite           161
faire              151
publics            144
temps              136
Name: engagement, dtype: uint16

faire


faire             1349
citoyens           243
administration     216
citoyen            199
engagement         151
publics            148
tout               142
faut               141
vie                125
service            124
Name: faire, dtype: uint16

service


service           1241
civique            380
administration     229
public             217
citoyen            214
obligatoire        175
citoyens           167
publics            134
faire              124
jeunes             122
Name: service, dtype: uint16

publics


publics            1179
pouvoirs            693
administration      494
services            412
citoyens            290
citoyen             212
administrations     164
faire               148
engagement          144
relations           136
Name: publics, dtype: uint16

vie


vie               998
citoyen           226
citoyens          183
parcours          182
engagement        167
administration    146
faire             125
tout              124
service           106
compte              0
Name: vie, dtype: uint16

tout


tout              940
citoyen           160
administration    149
faire             142
citoyens          138
faut              132
vie               124
internet            0
pouvoirs            0
faudrait            0
Name: tout, dtype: uint16

services


services          841
publics           412
citoyens          162
administration    147
service           113
reconnaitre         0
faudrait            0
sais                0
engagement          0
internet            0
Name: services, dtype: uint16

valoriser


valoriser     835
engagement    262
citoyen       190
citoyens      104
compte          0
tout            0
pouvoirs        0
faudrait        0
sais            0
internet        0
Name: valoriser, dtype: uint16

pouvoirs


pouvoirs           813
publics            693
administration     481
citoyens           236
citoyen            176
administrations    127
relations          125
engagement         122
tout                 0
faudrait             0
Name: pouvoirs, dtype: uint16

tous


tous              808
citoyens          168
citoyen           123
faire             121
administration    118
service           116
internet            0
pouvoirs            0
faudrait            0
sais                0
Name: tous, dtype: uint16

administrations


administrations    796
citoyens           178
publics            164
pouvoirs           127
citoyen            122
faire              117
compte               0
internet             0
faudrait             0
sais                 0
Name: administrations, dtype: uint16

faut


faut              778
citoyen           167
administration    153
citoyens          150
faire             141
engagement        136
tout              132
publics           107
internet            0
pouvoirs            0
Name: faut, dtype: uint16

exemple


exemple           774
engagement        130
citoyen           126
citoyens          117
administration    110
compte              0
tout                0
faudrait            0
sais                0
internet            0
Name: exemple, dtype: uint16

donner


donner        723
citoyens      136
citoyen       108
temps         101
internet        0
relations       0
pouvoirs        0
faudrait        0
sais            0
engagement      0
Name: donner, dtype: uint16

temps


temps         702
travail       157
engagement    136
citoyen       134
retraite      121
citoyens      101
donner        101
internet        0
pouvoirs        0
faudrait        0
Name: temps, dtype: uint16

retraite


retraite      657
points        161
engagement    161
compte        133
temps         121
citoyen       103
internet        0
pouvoirs        0
faudrait        0
sais            0
Name: retraite, dtype: uint16

civique


civique        652
service        380
education      134
obligatoire    118
tout             0
pouvoirs         0
faudrait         0
sais             0
engagement       0
internet         0
Name: civique, dtype: uint16

In [140]:
for i in df_qu_25_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_25[i].sort_values(ascending=False).head(10))

citoyens


citoyens           1.000000
pouvoirs           0.290283
elus               0.263033
ecoute             0.248227
publics            0.245971
pouvoir            0.240185
administrations    0.223618
administration     0.216248
non                0.214403
tous               0.207921
Name: citoyens, dtype: float32

citoyen


citoyen           1.000000
engagement        0.555335
parcours          0.285714
valoriser         0.227545
vie               0.226453
pouvoirs          0.216482
faut              0.214653
administration    0.198130
non               0.196399
compte            0.193603
Name: citoyen, dtype: float32

administration


administration    1.000000
pouvoirs          0.591636
relations         0.583562
publics           0.418999
ecoute            0.243499
non               0.235679
public            0.200368
faut              0.196658
citoyens          0.189938
service           0.184529
Name: administration, dtype: float32

engagement


engagement    1.000000
citoyen       0.442216
valoriser     0.313772
retraite      0.245053
compte        0.208754
temps         0.193732
faut          0.174807
exemple       0.167959
vie           0.167335
pouvoirs      0.150062
Name: engagement, dtype: float32

faire


faire              1.000000
participer         0.367003
faut               0.181234
tout               0.151064
tous               0.149752
administrations    0.146985
administration     0.126242
publics            0.125530
vie                0.125251
citoyens           0.124743
Name: faire, dtype: float32

service


service           1.000000
civique           0.582822
obligatoire       0.498576
public            0.398897
jeunes            0.336088
non               0.186579
tous              0.143564
services          0.134364
administration    0.133840
publics           0.113656
Name: service, dtype: float32

publics


publics            1.000000
pouvoirs           0.852399
services           0.489893
relations          0.372603
administration     0.288720
administrations    0.206030
citoyens           0.148871
faut               0.137532
citoyen            0.111873
faire              0.109711
Name: publics, dtype: float32

vie


vie               1.000000
parcours          0.490566
tout              0.131915
citoyen           0.119261
engagement        0.110669
citoyens          0.093943
faire             0.092661
service           0.085415
administration    0.085330
compte            0.000000
Name: vie, dtype: float32

tout


tout              1.000000
faut              0.169666
vie               0.124248
faire             0.105263
administration    0.087084
citoyen           0.084433
citoyens          0.070842
internet          0.000000
pouvoirs          0.000000
faudrait          0.000000
Name: tout, dtype: float32

services


services          1.000000
publics           0.349449
service           0.091056
administration    0.085915
citoyens          0.083162
reconnaitre       0.000000
faudrait          0.000000
sais              0.000000
engagement        0.000000
internet          0.000000
Name: services, dtype: float32

valoriser


valoriser     1.000000
engagement    0.173625
citoyen       0.100264
citoyens      0.053388
compte        0.000000
tout          0.000000
pouvoirs      0.000000
faudrait      0.000000
sais          0.000000
internet      0.000000
Name: valoriser, dtype: float32

pouvoirs


pouvoirs           1.000000
publics            0.587786
relations          0.342466
administration     0.281122
administrations    0.159548
citoyens           0.121150
citoyen            0.092876
engagement         0.080848
tout               0.000000
faudrait           0.000000
Name: pouvoirs, dtype: float32

tous


tous              1.000000
service           0.093473
faire             0.089696
citoyens          0.086242
administration    0.068966
citoyen           0.064908
internet          0.000000
pouvoirs          0.000000
faudrait          0.000000
sais              0.000000
Name: tous, dtype: float32

administrations


administrations    1.000000
pouvoirs           0.156212
publics            0.139101
citoyens           0.091376
faire              0.086731
citoyen            0.064380
compte             0.000000
internet           0.000000
faudrait           0.000000
sais               0.000000
Name: administrations, dtype: float32

faut


faut              1.000000
tout              0.140426
faire             0.104522
publics           0.090755
engagement        0.090126
administration    0.089421
citoyen           0.088127
citoyens          0.077002
internet          0.000000
pouvoirs          0.000000
Name: faut, dtype: float32

exemple


exemple           1.000000
engagement        0.086150
citoyen           0.066491
administration    0.064290
citoyens          0.060062
compte            0.000000
tout              0.000000
faudrait          0.000000
sais              0.000000
internet          0.000000
Name: exemple, dtype: float32

donner


donner        1.000000
temps         0.143875
citoyens      0.069815
citoyen       0.056992
internet      0.000000
relations     0.000000
pouvoirs      0.000000
faudrait      0.000000
sais          0.000000
engagement    0.000000
Name: donner, dtype: float32

temps


temps         1.000000
travail       0.263866
retraite      0.184170
donner        0.139696
engagement    0.090126
citoyen       0.070712
citoyens      0.051848
internet      0.000000
pouvoirs      0.000000
faudrait      0.000000
Name: temps, dtype: float32

retraite


retraite      1.000000
points        0.501558
compte        0.223906
temps         0.172365
engagement    0.106693
citoyen       0.054354
internet      0.000000
pouvoirs      0.000000
faudrait      0.000000
sais          0.000000
Name: retraite, dtype: float32

civique


civique        1.000000
obligatoire    0.336182
service        0.306205
education      0.233043
tout           0.000000
pouvoirs       0.000000
faudrait       0.000000
sais           0.000000
engagement     0.000000
internet       0.000000
Name: civique, dtype: float32

In [141]:
for i in df_qu_25_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_25[i].sort_values(ascending=False).head(10))

citoyens


citoyens           0.000513
pouvoirs           0.000149
elus               0.000135
ecoute             0.000127
publics            0.000126
pouvoir            0.000123
administrations    0.000115
administration     0.000111
non                0.000110
tous               0.000107
Name: citoyens, dtype: float32

citoyen


citoyen           0.000528
engagement        0.000293
parcours          0.000151
valoriser         0.000120
vie               0.000120
pouvoirs          0.000114
faut              0.000113
administration    0.000105
non               0.000104
compte            0.000102
Name: citoyen, dtype: float32

administration


administration    0.000584
pouvoirs          0.000346
relations         0.000341
publics           0.000245
ecoute            0.000142
non               0.000138
public            0.000117
faut              0.000115
citoyens          0.000111
service           0.000108
Name: administration, dtype: float32

engagement


engagement    0.000663
citoyen       0.000293
valoriser     0.000208
retraite      0.000162
compte        0.000138
temps         0.000128
faut          0.000116
exemple       0.000111
vie           0.000111
pouvoirs      0.000099
Name: engagement, dtype: float32

faire


faire              0.000741
participer         0.000272
faut               0.000134
tout               0.000112
tous               0.000111
administrations    0.000109
administration     0.000094
publics            0.000093
vie                0.000093
citoyens           0.000092
Name: faire, dtype: float32

service


service           0.000806
civique           0.000470
obligatoire       0.000402
public            0.000321
jeunes            0.000271
non               0.000150
tous              0.000116
services          0.000108
administration    0.000108
publics           0.000092
Name: service, dtype: float32

publics


publics            0.000848
pouvoirs           0.000723
services           0.000416
relations          0.000316
administration     0.000245
administrations    0.000175
citoyens           0.000126
faut               0.000117
citoyen            0.000095
faire              0.000093
Name: publics, dtype: float32

vie


vie               0.001002
parcours          0.000492
tout              0.000132
citoyen           0.000120
engagement        0.000111
citoyens          0.000094
faire             0.000093
service           0.000086
administration    0.000086
benevolat              NaN
Name: vie, dtype: float32

tout


tout               0.001064
faut               0.000180
vie                0.000132
faire              0.000112
administration     0.000093
citoyen            0.000090
citoyens           0.000075
benevolat               NaN
administrations         NaN
emploi                  NaN
Name: tout, dtype: float32

services


services           0.001189
publics            0.000416
service            0.000108
administration     0.000102
citoyens           0.000099
benevolat               NaN
administrations         NaN
emploi                  NaN
cas                     NaN
travail                 NaN
Name: services, dtype: float32

valoriser


valoriser          0.001198
engagement         0.000208
citoyen            0.000120
citoyens           0.000064
benevolat               NaN
administrations         NaN
administration          NaN
emploi                  NaN
cas                     NaN
travail                 NaN
Name: valoriser, dtype: float32

pouvoirs


pouvoirs           0.001230
publics            0.000723
relations          0.000421
administration     0.000346
administrations    0.000196
citoyens           0.000149
citoyen            0.000114
engagement         0.000099
benevolat               NaN
emploi                  NaN
Name: pouvoirs, dtype: float32

tous


tous               0.001238
service            0.000116
faire              0.000111
citoyens           0.000107
administration     0.000085
citoyen            0.000080
benevolat               NaN
administrations         NaN
emploi                  NaN
cas                     NaN
Name: tous, dtype: float32

administrations


administrations    0.001256
pouvoirs           0.000196
publics            0.000175
citoyens           0.000115
faire              0.000109
citoyen            0.000081
benevolat               NaN
administration          NaN
emploi                  NaN
cas                     NaN
Name: administrations, dtype: float32

faut


faut               0.001285
tout               0.000180
faire              0.000134
publics            0.000117
engagement         0.000116
administration     0.000115
citoyen            0.000113
citoyens           0.000099
benevolat               NaN
administrations         NaN
Name: faut, dtype: float32

exemple


exemple            0.001292
engagement         0.000111
citoyen            0.000086
administration     0.000083
citoyens           0.000078
benevolat               NaN
administrations         NaN
emploi                  NaN
cas                     NaN
travail                 NaN
Name: exemple, dtype: float32

donner


donner             0.001383
temps              0.000199
citoyens           0.000097
citoyen            0.000079
benevolat               NaN
administrations         NaN
administration          NaN
emploi                  NaN
cas                     NaN
travail                 NaN
Name: donner, dtype: float32

temps


temps              0.001425
travail            0.000376
retraite           0.000262
donner             0.000199
engagement         0.000128
citoyen            0.000101
citoyens           0.000074
benevolat               NaN
administrations         NaN
administration          NaN
Name: temps, dtype: float32

retraite


retraite           0.001522
points             0.000763
compte             0.000341
temps              0.000262
engagement         0.000162
citoyen            0.000083
benevolat               NaN
citoyens                NaN
administrations         NaN
administration          NaN
Name: retraite, dtype: float32

civique


civique            0.001534
obligatoire        0.000516
service            0.000470
education          0.000357
benevolat               NaN
citoyens                NaN
administrations         NaN
administration          NaN
emploi                  NaN
cas                     NaN
Name: civique, dtype: float32

In [142]:
gc.collect()

147

# Question 26:  Quelles sont les incivilités les plus pénibles dans la vie quotidienne et que faudrait-il faire pour lutter contre ces incivilités ?

In [143]:
question_26 = "Quelles sont les incivilités les plus pénibles dans la vie quotidienne et que faudrait-il faire pour lutter contre ces incivilités ?"
qu_26,df_qu_26_one_hot,df_cov_26,df_confidence_26,df_lift_26 = compute_similarities(question_26, new_res)

In [144]:
for i in df_qu_26_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_26[i].sort_values(ascending=False).head(10))

respect


respect        6666
non            3904
manque         2012
route           854
code            710
education       700
regles          690
publics         623
biens           620
incivilites     480
Name: respect, dtype: uint16

non


non            4943
respect        3904
route           774
code            659
regles          599
publics         500
biens           472
incivilites     427
faire           399
dechets         377
Name: non, dtype: uint16

incivilites


incivilites    2710
respect         480
non             427
faut            348
faire           341
penibles        329
education       302
route           264
lutter          261
tout            254
Name: incivilites, dtype: uint16

manque


manque         2694
respect        2012
education       511
non             278
politesse       270
incivilites     238
tout            203
publics         190
faut            190
faire           187
Name: manque, dtype: uint16

education


education      2053
respect         700
manque          511
non             352
incivilites     302
ecole           291
parents         278
tout            216
faire           206
faut            200
Name: education, dtype: uint16

faire


faire          1977
respect         461
non             399
faut            350
incivilites     341
tout            293
respecter       222
tous            207
education       206
manque          187
Name: faire, dtype: uint16

publics


publics         1877
biens            798
respect          623
non              500
lieux            457
degradation      391
degradations     387
transports       293
prives           259
espaces          209
Name: publics, dtype: uint16

insultes


insultes        1837
respect          449
non              359
degradations     223
incivilites      188
agressions       180
rue              179
manque           177
faire            173
publics          169
Name: insultes, dtype: uint16

dechets


dechets     1782
respect      399
non          377
jetes        306
publique     272
rue          266
megots       235
nature       223
route        191
jeter        181
Name: dechets, dtype: uint16

faut


faut           1679
respect         427
faire           350
incivilites     348
non             327
tout            214
education       200
manque          190
lutter          181
sanctionner     154
Name: faut, dtype: uint16

tout


tout           1629
respect         427
non             333
faire           293
incivilites     254
monde           231
education       216
faut            214
manque          203
tous            156
Name: tout, dtype: uint16

degradations


degradations    1623
respect          422
biens            408
publics          387
non              337
insultes         223
vols             202
public           179
faire            177
manque           157
Name: degradations, dtype: uint16

biens


biens           1539
publics          798
respect          620
non              472
degradations     408
degradation      377
prives           263
manque           176
faire            155
publiques        138
Name: biens, dtype: uint16

violence


violence     1523
respect       389
verbale       319
non           266
physique      224
manque        178
faut          136
insultes      130
faire         123
education     116
Name: violence, dtype: uint16

route


route          1515
code            916
respect         854
non             774
incivilites     264
dechets         191
publics         158
faire           155
transports      155
regles          148
Name: route, dtype: uint16

rue


rue            1450
respect         308
dechets         266
harcelement     263
non             259
transports      224
incivilites     193
femmes          187
faire           180
insultes        179
Name: rue, dtype: uint16

tous


tous           1240
respect         343
non             287
faire           207
incivilites     207
tout            156
faut            152
manque          135
vie             127
education       114
Name: tous, dtype: uint16

transports


transports     1227
commun          532
respect         331
publics         293
non             283
rue             224
incivilites     198
route           155
dechets         141
insultes        137
Name: transports, dtype: uint16

public


public          1147
espace           452
respect          396
non              357
degradation      182
degradations     179
dechets          162
incivilites      123
publics          117
tout             105
Name: public, dtype: uint16

agressions


agressions      1142
verbales         435
physiques        269
respect          213
vols             210
non              186
insultes         180
degradations     142
femmes           121
publics          120
Name: agressions, dtype: uint16

In [145]:
for i in df_qu_26_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_26[i].sort_values(ascending=False).head(10))

respect


respect          1.000000
non              0.789804
manque           0.746845
regles           0.729387
code             0.726714
environnement    0.612688
route            0.563696
valeurs          0.537162
agees            0.519573
politesse        0.512777
Name: respect, dtype: float32

non


non              1.000000
zones            0.833828
code             0.674514
regles           0.633192
respect          0.585659
droit            0.576087
route            0.510891
environnement    0.479132
pietons          0.436842
vitesse          0.431981
Name: non, dtype: float32

incivilites


incivilites    1.000000
penibles       0.726269
petites        0.451493
lutter         0.343421
quotidien      0.295165
volant         0.244755
faudrait       0.224924
citoyens       0.211129
societe        0.208633
faut           0.207266
Name: incivilites, dtype: float32

manque


manque       1.000000
politesse    0.459966
savoir       0.442907
respect      0.301830
vivre        0.271120
education    0.248904
jeunes       0.194134
parents      0.187332
general      0.173352
ecole        0.165934
Name: manque, dtype: float32

education


education    1.000000
civique      0.588816
parents      0.374663
ecole        0.319780
enfants      0.288786
lutter       0.205263
politesse    0.192504
manque       0.189681
jeunes       0.174581
tout         0.132597
Name: education, dtype: float32

faire


faire        1.000000
payer        0.523810
respecter    0.474359
appliquer    0.355340
lois         0.261871
loi          0.241758
faut         0.208457
mettre       0.205696
droit        0.192029
faudrait     0.185410
Name: faire, dtype: float32

publics


publics         1.000000
prives          0.766272
lieux           0.668129
espaces         0.605797
biens           0.518519
services        0.419580
degradation     0.388668
transports      0.238794
degradations    0.238447
tags            0.179272
Name: publics, dtype: float32

insultes


insultes         1.000000
crachats         0.267606
vols             0.196474
harcelement      0.158793
agressions       0.157618
femmes           0.153475
violences        0.149045
degradations     0.137400
rue              0.123448
comportements    0.118070
Name: insultes, dtype: float32

dechets


dechets     1.000000
jetes       0.627049
nature      0.438114
jeter       0.428910
jet         0.382979
megots      0.309211
sauvages    0.290650
terre       0.284992
publique    0.282158
partout     0.256927
Name: dechets, dtype: float32

faut


faut           1.000000
punir          0.294554
eduquer        0.262042
lutter         0.238158
sanctionner    0.211538
justice        0.181962
enfants        0.179724
faire          0.177036
mettre         0.169304
parents        0.164420
Name: faut, dtype: float32

tout


tout          1.000000
monde         0.620968
genre         0.563910
exemple       0.148837
faire         0.148204
vie           0.133333
faut          0.127457
tous          0.125806
incivilite    0.107561
education     0.105212
Name: tout, dtype: float32

degradations


degradations    1.000000
prives          0.352071
biens           0.265107
vols            0.254408
tags            0.217087
publiques       0.213552
publics         0.206180
public          0.156059
violences       0.138854
agressions      0.124343
Name: degradations, dtype: float32

biens


biens           1.000000
prives          0.778107
publics         0.425147
degradation     0.374751
publiques       0.283368
degradations    0.251386
non             0.095489
respect         0.093009
faire           0.078402
violence        0.072226
Name: biens, dtype: float32

violence


violence        1.000000
verbale         0.674419
physique        0.578811
faut            0.081001
biens           0.071475
insultes        0.070768
manque          0.066073
degradations    0.064695
faire           0.062215
respect         0.058356
Name: violence, dtype: float32

route


route            1.000000
code             0.937564
vitesse          0.350835
pietons          0.276316
comportement     0.183386
non              0.156585
regles           0.156448
comportements    0.135524
respect          0.128113
transports       0.126324
Name: route, dtype: float32

rue


rue            1.000000
harcelement    0.345144
transports     0.182559
femmes         0.180502
megots         0.160526
dechets        0.149270
insultes       0.097441
agressions     0.095447
faire          0.091047
route          0.079868
Name: rue, dtype: float32

tous


tous           1.000000
vie            0.126368
faire          0.104704
tout           0.095764
faut           0.090530
incivilites    0.076384
non            0.058062
publics        0.057006
education      0.055528
respect        0.051455
Name: tous, dtype: float32

transports


transports       1.000000
commun           0.690013
fraude           0.260181
publics          0.156100
trottoirs        0.155488
rue              0.154483
femmes           0.108108
comportements    0.107803
route            0.102310
public           0.088056
Name: transports, dtype: float32

public


public          1.000000
espace          0.788831
degradation     0.180915
degradations    0.110290
dechets         0.090909
transports      0.082315
non             0.072223
tout            0.064457
publics         0.062334
respect         0.059406
Name: public, dtype: float32

agressions


agressions      1.000000
verbales        0.613540
physiques       0.555785
vols            0.264484
femmes          0.116795
insultes        0.097986
degradations    0.087492
rue             0.075172
faut            0.070280
publics         0.063932
Name: agressions, dtype: float32

In [146]:
for i in df_qu_26_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_26[i].sort_values(ascending=False).head(10))

respect


respect          0.000150
non              0.000118
manque           0.000112
regles           0.000109
code             0.000109
environnement    0.000092
route            0.000085
valeurs          0.000081
agees            0.000078
politesse        0.000077
Name: respect, dtype: float32

non


non              0.000202
zones            0.000169
code             0.000136
regles           0.000128
respect          0.000118
droit            0.000117
route            0.000103
environnement    0.000097
pietons          0.000088
vitesse          0.000087
Name: non, dtype: float32

incivilites


incivilites    0.000369
penibles       0.000268
petites        0.000167
lutter         0.000127
quotidien      0.000109
volant         0.000090
faudrait       0.000083
citoyens       0.000078
societe        0.000077
faut           0.000076
Name: incivilites, dtype: float32

manque


manque       0.000371
politesse    0.000171
savoir       0.000164
respect      0.000112
vivre        0.000101
education    0.000092
jeunes       0.000072
parents      0.000070
general      0.000064
ecole        0.000062
Name: manque, dtype: float32

education


education    0.000487
civique      0.000287
parents      0.000182
ecole        0.000156
enfants      0.000141
lutter       0.000100
politesse    0.000094
manque       0.000092
jeunes       0.000085
tout         0.000065
Name: education, dtype: float32

faire


faire        0.000506
payer        0.000265
respecter    0.000240
appliquer    0.000180
lois         0.000132
loi          0.000122
faut         0.000105
mettre       0.000104
droit        0.000097
faudrait     0.000094
Name: faire, dtype: float32

publics


publics         0.000533
prives          0.000408
lieux           0.000356
espaces         0.000323
biens           0.000276
services        0.000224
degradation     0.000207
transports      0.000127
degradations    0.000127
tags            0.000096
Name: publics, dtype: float32

insultes


insultes         0.000544
crachats         0.000146
vols             0.000107
harcelement      0.000086
agressions       0.000086
femmes           0.000084
violences        0.000081
degradations     0.000075
rue              0.000067
comportements    0.000064
Name: insultes, dtype: float32

dechets


dechets     0.000561
jetes       0.000352
nature      0.000246
jeter       0.000241
jet         0.000215
megots      0.000174
sauvages    0.000163
terre       0.000160
publique    0.000158
partout     0.000144
Name: dechets, dtype: float32

faut


faut           0.000596
punir          0.000175
eduquer        0.000156
lutter         0.000142
sanctionner    0.000126
justice        0.000108
enfants        0.000107
faire          0.000105
mettre         0.000101
parents        0.000098
Name: faut, dtype: float32

tout


tout          0.000614
monde         0.000381
genre         0.000346
exemple       0.000091
faire         0.000091
vie           0.000082
faut          0.000078
tous          0.000077
incivilite    0.000066
education     0.000065
Name: tout, dtype: float32

degradations


degradations    0.000616
prives          0.000217
biens           0.000163
vols            0.000157
tags            0.000134
publiques       0.000132
publics         0.000127
public          0.000096
violences       0.000086
agressions      0.000077
Name: degradations, dtype: float32

biens


biens           0.000650
prives          0.000506
publics         0.000276
degradation     0.000244
publiques       0.000184
degradations    0.000163
non             0.000062
respect         0.000060
faire           0.000051
violence        0.000047
Name: biens, dtype: float32

violence


violence        0.000657
verbale         0.000443
physique        0.000380
faut            0.000053
biens           0.000047
insultes        0.000046
manque          0.000043
degradations    0.000042
faire           0.000041
respect         0.000038
Name: violence, dtype: float32

route


route            0.000660
code             0.000619
vitesse          0.000232
pietons          0.000182
comportement     0.000121
non              0.000103
regles           0.000103
comportements    0.000089
respect          0.000085
transports       0.000083
Name: route, dtype: float32

rue


rue            0.000690
harcelement    0.000238
transports     0.000126
femmes         0.000124
megots         0.000111
dechets        0.000103
insultes       0.000067
agressions     0.000066
faire          0.000063
route          0.000055
Name: rue, dtype: float32

tous


tous           0.000806
vie            0.000102
faire          0.000084
tout           0.000077
faut           0.000073
incivilites    0.000062
non            0.000047
publics        0.000046
education      0.000045
respect        0.000041
Name: tous, dtype: float32

transports


transports       0.000815
commun           0.000562
fraude           0.000212
publics          0.000127
trottoirs        0.000127
rue              0.000126
femmes           0.000088
comportements    0.000088
route            0.000083
public           0.000072
Name: transports, dtype: float32

public


public          0.000872
espace          0.000688
degradation     0.000158
degradations    0.000096
dechets         0.000079
transports      0.000072
non             0.000063
tout            0.000056
publics         0.000054
respect         0.000052
Name: public, dtype: float32

agressions


agressions      0.000876
verbales        0.000537
physiques       0.000487
vols            0.000232
femmes          0.000102
insultes        0.000086
degradations    0.000077
rue             0.000066
faut            0.000062
publics         0.000056
Name: agressions, dtype: float32

In [147]:
gc.collect()

133

# Question 27: Que peuvent et doivent faire les pouvoirs publics pour répondre aux incivilités ?

In [148]:
question_27 = "Que peuvent et doivent faire les pouvoirs publics pour répondre aux incivilités ?"
qu_27,df_qu_27_one_hot,df_cov_27,df_confidence_27,df_lift_27 = compute_similarities(question_27, new_res)

In [149]:
for i in df_qu_27_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_27[i].sort_values(ascending=False).head(10))

faire


faire          3351
respecter       683
loi             668
appliquer       621
lois            457
payer           359
incivilites     311
tout            260
justice         256
police          248
Name: faire, dtype: uint16

sanctionner


sanctionner    2664
eduquer         343
incivilites     253
faire           236
travaux         199
interet         196
general         159
severement      143
parents         128
amendes         123
Name: sanctionner, dtype: uint16

education


education     2187
ecole          290
repression     247
civique        232
parents        224
faire          215
sanctions      180
enfants        159
tout           137
sanction       136
Name: education, dtype: uint16

appliquer


appliquer    1868
loi           854
faire         621
lois          575
peines        202
sanctions     170
justice       140
mettre          0
france          0
tig             0
Name: appliquer, dtype: uint16

loi


loi            1847
appliquer       854
faire           668
respecter       328
rappel          145
justice         125
incivilites     115
application     113
tout            108
sanctionner     105
Name: loi, dtype: uint16

incivilites


incivilites    1643
faire           311
sanctionner     253
faut            169
travaux         153
interet         151
education       135
police          135
amendes         126
mettre          125
Name: incivilites, dtype: uint16

sanctions


sanctions      1571
faire           184
education       180
appliquer       170
travaux         139
interet         133
incivilites     115
general         109
voir              0
tout              0
Name: sanctions, dtype: uint16

amendes


amendes        1518
travaux         212
mettre          175
faire           159
interet         158
incivilites     126
sanctionner     123
general         122
incivilite        0
delinquants       0
Name: amendes, dtype: uint16

travaux


travaux        1484
interet         967
general         733
generaux        413
interets        333
faire           224
amendes         212
sanctionner     199
incivilites     153
sanctions       139
Name: travaux, dtype: uint16

justice


justice        1392
faire           256
police          243
moyens          194
peines          162
appliquer       140
donner          125
loi             125
incivilites     111
faut            104
Name: justice, dtype: uint16

police


police         1387
proximite       410
faire           248
justice         243
moyens          162
incivilites     135
mettre          104
peines            0
voir              0
delinquants       0
Name: police, dtype: uint16

interet


interet        1381
general         995
travaux         967
travail         230
faire           211
sanctionner     196
peines          163
generaux        162
amendes         158
incivilites     151
Name: interet, dtype: uint16

eduquer


eduquer        1213
sanctionner     343
punir           119
enfants         110
faire           110
laxisme           0
repression        0
incivilite        0
delinquants       0
parents           0
Name: eduquer, dtype: uint16

lois


lois           1192
appliquer       575
faire           457
respecter       222
justice         102
mettre            0
voir              0
incivilite        0
delinquants       0
parents           0
Name: lois, dtype: uint16

exemple


exemple        1175
montrer         340
donner          214
faire           196
incivilites     118
sanctionner     112
tig               0
laxisme           0
france            0
mettre            0
Name: exemple, dtype: uint16

mettre


mettre         1151
place           386
faire           199
amendes         175
incivilites     125
moyens          118
police          104
citoyens          0
publics           0
delinquants       0
Name: mettre, dtype: uint16

general


general        1092
interet         995
travaux         733
travail         199
faire           163
sanctionner     159
peines          131
amendes         122
incivilites     121
sanctions       109
Name: general, dtype: uint16

faut


faut           1056
faire           231
incivilites     169
sanctionner     118
education       109
tout            107
justice         104
appliquer         0
tig               0
tolerance         0
Name: faut, dtype: uint16

punir


punir            1043
severement        151
faire             131
eduquer           119
incivilites       101
laxisme             0
incivilite          0
delinquants         0
parents             0
comportements       0
Name: punir, dtype: uint16

tout


tout             1011
faire             260
education         137
loi               108
faut              107
mettre              0
voir                0
delinquants         0
parents             0
comportements       0
Name: tout, dtype: uint16

In [150]:
for i in df_qu_27_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_27[i].sort_values(ascending=False).head(10))

faire


faire        1.000000
respecter    0.827879
payer        0.741736
reparer      0.418251
lois         0.383389
loi          0.361668
appliquer    0.332441
regles       0.295890
tout         0.257171
travail      0.247851
Name: faire, dtype: float32

sanctionner


sanctionner    1.000000
severement     0.362944
eduquer        0.282770
incivilites    0.153987
general        0.145604
interet        0.141926
parents        0.139282
travaux        0.134097
faut           0.111742
exemple        0.095319
Name: sanctionner, dtype: float32

education


education     1.000000
civique       0.473469
ecole         0.296221
enfants       0.292818
jeunes        0.254042
repression    0.251527
parents       0.243743
renforcer     0.218143
sanction      0.173248
tout          0.135509
Name: education, dtype: float32

appliquer


appliquer    1.000000
lois         0.482383
loi          0.462371
peines       0.211740
faire        0.185318
sanctions    0.108211
justice      0.100575
mettre       0.000000
france       0.000000
tig          0.000000
Name: appliquer, dtype: float32

loi


loi            1.000000
rappel         0.537037
appliquer      0.457173
respecter      0.397576
application    0.383051
faire          0.199343
tout           0.106825
justice        0.089799
incivilites    0.069994
sanctionner    0.039414
Name: loi, dtype: float32

incivilites


incivilites    1.000000
auteurs        0.340984
publics        0.178730
faut           0.160038
citoyens       0.157122
cas            0.149497
tous           0.120000
general        0.110806
interet        0.109341
mettre         0.108601
Name: incivilites, dtype: float32

sanctions


sanctions        1.000000
general          0.099817
interet          0.096307
travaux          0.093666
appliquer        0.091006
education        0.082305
incivilites      0.069994
faire            0.054909
parents          0.000000
comportements    0.000000
Name: sanctions, dtype: float32

amendes


amendes        1.000000
mettre         0.152042
travaux        0.142857
interet        0.114410
general        0.111722
incivilites    0.076689
faire          0.047449
sanctionner    0.046171
incivilite     0.000000
delinquants    0.000000
Name: amendes, dtype: float32

travaux


travaux        1.000000
generaux       0.956019
interets       0.885638
interet        0.700217
general        0.671245
prison         0.172840
amendes        0.139657
peines         0.133124
incivilites    0.093122
sanctions      0.088479
Name: travaux, dtype: float32

justice


justice      1.000000
moyens       0.253595
police       0.175198
peines       0.169811
donner       0.153374
faut         0.098485
lois         0.085570
faire        0.076395
appliquer    0.074946
loi          0.067677
Name: justice, dtype: float32

police


police         1.000000
proximite      0.815109
moyens         0.211765
justice        0.174569
mettre         0.090356
incivilites    0.082167
faire          0.074008
citoyens       0.000000
repression     0.000000
delinquants    0.000000
Name: police, dtype: float32

interet


interet        1.000000
general        0.911172
travaux        0.651617
generaux       0.375000
travail        0.329513
peines         0.170860
prison         0.160494
amendes        0.104084
incivilites    0.091905
sanctions      0.084659
Name: interet, dtype: float32

eduquer


eduquer        1.000000
enfants        0.202578
sanctionner    0.128754
punir          0.114094
faire          0.032826
laxisme        0.000000
repression     0.000000
incivilite     0.000000
delinquants    0.000000
parents        0.000000
Name: eduquer, dtype: float32

lois


lois           1.000000
appliquer      0.307816
respecter      0.269091
faire          0.136377
justice        0.073276
mettre         0.000000
voir           0.000000
incivilite     0.000000
delinquants    0.000000
parents        0.000000
Name: lois, dtype: float32

exemple


exemple        1.000000
montrer        0.726496
donner         0.262577
incivilites    0.071820
faire          0.058490
sanctionner    0.042042
tig            0.000000
laxisme        0.000000
france         0.000000
mettre         0.000000
Name: exemple, dtype: float32

mettre


mettre         1.000000
place          0.536857
moyens         0.154248
amendes        0.115283
incivilites    0.076080
police         0.074982
faire          0.059385
citoyens       0.000000
voir           0.000000
delinquants    0.000000
Name: mettre, dtype: float32

general


general        1.000000
interet        0.720492
travaux        0.493935
travail        0.285100
peines         0.137317
amendes        0.080369
incivilites    0.073646
sanctions      0.069383
sanctionner    0.059685
faire          0.048642
Name: general, dtype: float32

faut


faut           1.000000
tout           0.105836
incivilites    0.102861
justice        0.074713
faire          0.068935
education      0.049840
sanctionner    0.044294
appliquer      0.000000
tig            0.000000
tolerance      0.000000
Name: faut, dtype: float32

punir


punir            1.000000
severement       0.383249
eduquer          0.098104
incivilites      0.061473
faire            0.039093
laxisme          0.000000
incivilite       0.000000
delinquants      0.000000
parents          0.000000
comportements    0.000000
Name: punir, dtype: float32

tout


tout             1.000000
faut             0.101326
faire            0.077589
education        0.062643
loi              0.058473
mettre           0.000000
voir             0.000000
delinquants      0.000000
parents          0.000000
comportements    0.000000
Name: tout, dtype: float32

In [151]:
for i in df_qu_27_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_27[i].sort_values(ascending=False).head(10))

faire


faire        0.000298
respecter    0.000247
payer        0.000221
reparer      0.000125
lois         0.000114
loi          0.000108
appliquer    0.000099
regles       0.000088
tout         0.000077
travail      0.000074
Name: faire, dtype: float32

sanctionner


sanctionner    0.000375
severement     0.000136
eduquer        0.000106
incivilites    0.000058
general        0.000055
interet        0.000053
parents        0.000052
travaux        0.000050
faut           0.000042
exemple        0.000036
Name: sanctionner, dtype: float32

education


education     0.000457
civique       0.000216
ecole         0.000135
enfants       0.000134
jeunes        0.000116
repression    0.000115
parents       0.000111
renforcer     0.000100
sanction      0.000079
tout          0.000062
Name: education, dtype: float32

appliquer


appliquer    0.000535
lois         0.000258
loi          0.000248
peines       0.000113
faire        0.000099
sanctions    0.000058
justice      0.000054
eduquer           NaN
forces            NaN
amende            NaN
Name: appliquer, dtype: float32

loi


loi            0.000541
rappel         0.000291
appliquer      0.000248
respecter      0.000215
application    0.000207
faire          0.000108
tout           0.000058
justice        0.000049
incivilites    0.000038
sanctionner    0.000021
Name: loi, dtype: float32

incivilites


incivilites    0.000609
auteurs        0.000208
publics        0.000109
faut           0.000097
citoyens       0.000096
cas            0.000091
tous           0.000073
general        0.000067
interet        0.000067
mettre         0.000066
Name: incivilites, dtype: float32

sanctions


sanctions      0.000637
general        0.000064
interet        0.000061
travaux        0.000060
appliquer      0.000058
education      0.000052
incivilites    0.000045
faire          0.000035
eduquer             NaN
forces              NaN
Name: sanctions, dtype: float32

amendes


amendes        0.000659
mettre         0.000100
travaux        0.000094
interet        0.000075
general        0.000074
incivilites    0.000051
faire          0.000031
sanctionner    0.000030
eduquer             NaN
sanctions           NaN
Name: amendes, dtype: float32

travaux


travaux        0.000674
generaux       0.000644
interets       0.000597
interet        0.000472
general        0.000452
prison         0.000116
amendes        0.000094
peines         0.000090
incivilites    0.000063
sanctions      0.000060
Name: travaux, dtype: float32

justice


justice      0.000718
moyens       0.000182
police       0.000126
peines       0.000122
donner       0.000110
faut         0.000071
lois         0.000061
faire        0.000055
appliquer    0.000054
loi          0.000049
Name: justice, dtype: float32

police


police         0.000721
proximite      0.000588
moyens         0.000153
justice        0.000126
mettre         0.000065
incivilites    0.000059
faire          0.000053
eduquer             NaN
sanctions           NaN
forces              NaN
Name: police, dtype: float32

interet


interet        0.000724
general        0.000660
travaux        0.000472
generaux       0.000272
travail        0.000239
peines         0.000124
prison         0.000116
amendes        0.000075
incivilites    0.000067
sanctions      0.000061
Name: interet, dtype: float32

eduquer


eduquer        0.000824
enfants        0.000167
sanctionner    0.000106
punir          0.000094
faire          0.000027
sanctions           NaN
forces              NaN
amende              NaN
citoyens            NaN
peines              NaN
Name: eduquer, dtype: float32

lois


lois         0.000839
appliquer    0.000258
respecter    0.000226
faire        0.000114
justice      0.000061
eduquer           NaN
sanctions         NaN
forces            NaN
amende            NaN
citoyens          NaN
Name: lois, dtype: float32

exemple


exemple        0.000851
montrer        0.000618
donner         0.000223
incivilites    0.000061
faire          0.000050
sanctionner    0.000036
eduquer             NaN
sanctions           NaN
forces              NaN
amende              NaN
Name: exemple, dtype: float32

mettre


mettre         0.000869
place          0.000466
moyens         0.000134
amendes        0.000100
incivilites    0.000066
police         0.000065
faire          0.000052
eduquer             NaN
sanctions           NaN
forces              NaN
Name: mettre, dtype: float32

general


general        0.000916
interet        0.000660
travaux        0.000452
travail        0.000261
peines         0.000126
amendes        0.000074
incivilites    0.000067
sanctions      0.000064
sanctionner    0.000055
faire          0.000045
Name: general, dtype: float32

faut


faut           0.000947
tout           0.000100
incivilites    0.000097
justice        0.000071
faire          0.000065
education      0.000047
sanctionner    0.000042
eduquer             NaN
sanctions           NaN
forces              NaN
Name: faut, dtype: float32

punir


punir          0.000959
severement     0.000367
eduquer        0.000094
incivilites    0.000059
faire          0.000037
sanctions           NaN
forces              NaN
amende              NaN
citoyens            NaN
peines              NaN
Name: punir, dtype: float32

tout


tout         0.000989
faut         0.000100
faire        0.000077
education    0.000062
loi          0.000058
eduquer           NaN
sanctions         NaN
forces            NaN
amende            NaN
citoyens          NaN
Name: tout, dtype: float32

In [152]:
gc.collect()

147

# Question 28: Quel pourrait être le rôle de chacun pour faire reculer les incivilités dans la société ?

In [153]:
question_28 = "Quel pourrait être le rôle de chacun pour faire reculer les incivilités dans la société ?"
qu_28,df_qu_28_one_hot,df_cov_28,df_confidence_28,df_lift_28 = compute_similarities(question_28, new_res)

In [154]:
for i in df_qu_28_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_28[i].sort_values(ascending=False).head(10))

faire


faire          2422
incivilites     333
respecter       206
police          180
enfants         174
incivilite      172
tout            164
faut            155
exemple         154
education       153
Name: faire, dtype: uint16

education


education      1930
enfants         436
parents         375
ecole           232
role            184
faire           153
respect         150
tout            145
civique         115
incivilites     108
Name: education, dtype: uint16

exemple


exemple          1770
montrer           654
donner            477
enfants           169
faire             154
incivilites       114
apprendre           0
parents             0
comportements       0
tout                0
Name: exemple, dtype: uint16

enfants


enfants        1624
eduquer         652
education       436
parents         425
respect         199
faire           174
exemple         169
ecole           156
role            123
incivilites     104
Name: enfants, dtype: uint16

incivilites


incivilites    1514
faire           333
denoncer        181
exemple         114
citoyens        112
faut            111
education       108
police          107
signaler        106
enfants         104
Name: incivilites, dtype: uint16

respect


respect          1126
enfants           199
education         150
comportement        0
prendre             0
parents             0
comportements       0
tout                0
voir                0
loi                 0
Name: respect, dtype: uint16

eduquer


eduquer       1067
enfants        652
parents        141
incivilite       0
commencer        0
difficile        0
civique          0
ordre            0
signaler         0
loi              0
Name: eduquer, dtype: uint16

role


role             1009
parents           230
education         184
enfants           123
faire             121
ecole             112
tout                0
sais                0
apprendre           0
comportements       0
Name: role, dtype: uint16

parents


parents      997
enfants      425
education    375
role         230
ecole        191
eduquer      141
faire        113
pouvoir        0
apprendre      0
difficile      0
Name: parents, dtype: uint16

respecter


respecter        942
faire            206
regles           148
loi                0
parents            0
comportements      0
tout               0
voir               0
prendre            0
comportement       0
Name: respecter, dtype: uint16

denoncer


denoncer       894
incivilites    181
incivilite       0
commencer        0
difficile        0
civique          0
ordre            0
signaler         0
loi              0
prendre          0
Name: denoncer, dtype: uint16

tout


tout             859
monde            192
faire            164
education        145
comportement       0
voir               0
apprendre          0
parents            0
comportements      0
loi                0
Name: tout, dtype: uint16

incivilite


incivilite       793
faire            172
intervenir       117
comportement       0
voir               0
apprendre          0
parents            0
comportements      0
tout               0
prendre            0
Name: incivilite, dtype: uint16

montrer


montrer         763
exemple         654
comportement      0
sais              0
commencer         0
difficile         0
civique           0
ordre             0
signaler          0
loi               0
Name: montrer, dtype: uint16

intervenir


intervenir       738
faire            120
incivilite       117
comportement       0
voir               0
apprendre          0
parents            0
comportements      0
tout               0
prendre            0
Name: intervenir, dtype: uint16

police


police           713
faire            180
justice          116
incivilites      107
comportement       0
tout               0
apprendre          0
parents            0
comportements      0
voir               0
Name: police, dtype: uint16

faut


faut             684
faire            155
incivilites      111
voir               0
apprendre          0
parents            0
comportements      0
tout               0
prendre            0
incivilite         0
Name: faut, dtype: uint16

donner


donner          681
exemple         477
comportement      0
sais              0
commencer         0
difficile         0
civique           0
ordre             0
signaler          0
loi               0
Name: donner, dtype: uint16

citoyen


citoyen          660
faire            147
comportement       0
voir               0
apprendre          0
parents            0
comportements      0
tout               0
prendre            0
incivilite         0
Name: citoyen, dtype: uint16

citoyens


citoyens         652
faire            147
incivilites      112
prendre            0
apprendre          0
parents            0
comportements      0
tout               0
voir               0
loi                0
Name: citoyens, dtype: uint16

In [155]:
for i in df_qu_28_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_28[i].sort_values(ascending=False).head(10))

faire


faire          1.000000
justice        0.260163
police         0.252454
peur           0.229287
faut           0.226608
citoyens       0.225460
citoyen        0.222727
incivilites    0.219947
respecter      0.218684
incivilite     0.216898
Name: faire, dtype: float32

education


education      1.000000
civique        0.458167
parents        0.376128
ecole          0.371200
enfants        0.268473
role           0.182359
tout           0.168801
respect        0.133215
incivilites    0.071334
faire          0.063171
Name: education, dtype: float32

exemple


exemple          1.000000
montrer          0.857143
donner           0.700441
enfants          0.104064
incivilites      0.075297
faire            0.063584
apprendre        0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
Name: exemple, dtype: float32

enfants


enfants        1.000000
eduquer        0.611059
parents        0.426279
ecole          0.249600
education      0.225907
respect        0.176732
role           0.121903
exemple        0.095480
faire          0.071841
incivilites    0.068692
Name: enfants, dtype: float32

incivilites


incivilites    1.000000
signaler       0.255422
denoncer       0.202461
citoyens       0.171779
faut           0.162281
police         0.150070
faire          0.137490
exemple        0.064407
enfants        0.064039
education      0.055959
Name: incivilites, dtype: float32

respect


respect          1.000000
enfants          0.122537
education        0.077720
comportement     0.000000
prendre          0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
voir             0.000000
loi              0.000000
Name: respect, dtype: float32

eduquer


eduquer       1.000000
enfants       0.401478
parents       0.141424
incivilite    0.000000
commencer     0.000000
difficile     0.000000
civique       0.000000
ordre         0.000000
signaler      0.000000
loi           0.000000
Name: eduquer, dtype: float32

role


role             1.000000
parents          0.230692
ecole            0.179200
education        0.095337
enfants          0.075739
faire            0.049959
tout             0.000000
sais             0.000000
apprendre        0.000000
comportements    0.000000
Name: role, dtype: float32

parents


parents      1.000000
ecole        0.305600
enfants      0.261699
role         0.227948
education    0.194301
eduquer      0.132146
faire        0.046656
pouvoir      0.000000
apprendre    0.000000
difficile    0.000000
Name: parents, dtype: float32

respecter


respecter        1.000000
regles           0.369077
faire            0.085054
loi              0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
voir             0.000000
prendre          0.000000
comportement     0.000000
Name: respecter, dtype: float32

denoncer


denoncer       1.000000
incivilites    0.119551
incivilite     0.000000
commencer      0.000000
difficile      0.000000
civique        0.000000
ordre          0.000000
signaler       0.000000
loi            0.000000
prendre        0.000000
Name: denoncer, dtype: float32

tout


tout             1.000000
monde            0.703297
education        0.075130
faire            0.067713
comportement     0.000000
voir             0.000000
apprendre        0.000000
parents          0.000000
comportements    0.000000
loi              0.000000
Name: tout, dtype: float32

incivilite


incivilite       1.000000
intervenir       0.158537
faire            0.071016
comportement     0.000000
voir             0.000000
apprendre        0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
prendre          0.000000
Name: incivilite, dtype: float32

montrer


montrer         1.000000
exemple         0.369492
comportement    0.000000
sais            0.000000
commencer       0.000000
difficile       0.000000
civique         0.000000
ordre           0.000000
signaler        0.000000
loi             0.000000
Name: montrer, dtype: float32

intervenir


intervenir       1.000000
incivilite       0.147541
faire            0.049546
comportement     0.000000
voir             0.000000
apprendre        0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
prendre          0.000000
Name: intervenir, dtype: float32

police


police           1.000000
justice          0.235772
faire            0.074319
incivilites      0.070674
comportement     0.000000
tout             0.000000
apprendre        0.000000
parents          0.000000
comportements    0.000000
voir             0.000000
Name: police, dtype: float32

faut


faut             1.000000
incivilites      0.073316
faire            0.063997
voir             0.000000
apprendre        0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
prendre          0.000000
incivilite       0.000000
Name: faut, dtype: float32

donner


donner          1.000000
exemple         0.269492
comportement    0.000000
sais            0.000000
commencer       0.000000
difficile       0.000000
civique         0.000000
ordre           0.000000
signaler        0.000000
loi             0.000000
Name: donner, dtype: float32

citoyen


citoyen          1.000000
faire            0.060694
comportement     0.000000
voir             0.000000
apprendre        0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
prendre          0.000000
incivilite       0.000000
Name: citoyen, dtype: float32

citoyens


citoyens         1.000000
incivilites      0.073976
faire            0.060694
prendre          0.000000
apprendre        0.000000
parents          0.000000
comportements    0.000000
tout             0.000000
voir             0.000000
loi              0.000000
Name: citoyens, dtype: float32

In [156]:
for i in df_qu_28_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_28[i].sort_values(ascending=False).head(10))

faire


faire          0.000413
justice        0.000107
police         0.000104
peur           0.000095
faut           0.000094
citoyens       0.000093
citoyen        0.000092
incivilites    0.000091
respecter      0.000090
incivilite     0.000090
Name: faire, dtype: float32

education


education      0.000518
civique        0.000237
parents        0.000195
ecole          0.000192
enfants        0.000139
role           0.000094
tout           0.000087
respect        0.000069
incivilites    0.000037
faire          0.000033
Name: education, dtype: float32

exemple


exemple        0.000565
montrer        0.000484
donner         0.000396
enfants        0.000059
incivilites    0.000043
faire          0.000036
eduquer             NaN
forces              NaN
citoyens            NaN
cas                 NaN
Name: exemple, dtype: float32

enfants


enfants        0.000616
eduquer        0.000376
parents        0.000262
ecole          0.000154
education      0.000139
respect        0.000109
role           0.000075
exemple        0.000059
faire          0.000044
incivilites    0.000042
Name: enfants, dtype: float32

incivilites


incivilites    0.000661
signaler       0.000169
denoncer       0.000134
citoyens       0.000113
faut           0.000107
police         0.000099
faire          0.000091
exemple        0.000043
enfants        0.000042
education      0.000037
Name: incivilites, dtype: float32

respect


respect      0.000888
enfants      0.000109
education    0.000069
eduquer           NaN
forces            NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
respecter         NaN
Name: respect, dtype: float32

eduquer


eduquer      0.000937
enfants      0.000376
parents      0.000133
forces            NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
respecter         NaN
regles            NaN
Name: eduquer, dtype: float32

role


role         0.000991
parents      0.000229
ecole        0.000178
education    0.000094
enfants      0.000075
faire        0.000050
eduquer           NaN
forces            NaN
citoyens          NaN
cas               NaN
Name: role, dtype: float32

parents


parents      0.001003
ecole        0.000307
enfants      0.000262
role         0.000229
education    0.000195
eduquer      0.000133
faire        0.000047
forces            NaN
citoyens          NaN
cas               NaN
Name: parents, dtype: float32

respecter


respecter    0.001062
regles       0.000392
faire        0.000090
eduquer           NaN
forces            NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
montrer           NaN
Name: respecter, dtype: float32

denoncer


denoncer       0.001119
incivilites    0.000134
eduquer             NaN
forces              NaN
citoyens            NaN
cas                 NaN
travail             NaN
pouvoir             NaN
respecter           NaN
regles              NaN
Name: denoncer, dtype: float32

tout


tout         0.001164
monde        0.000819
education    0.000087
faire        0.000079
eduquer           NaN
forces            NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
Name: tout, dtype: float32

incivilite


incivilite    0.001261
intervenir    0.000200
faire         0.000090
eduquer            NaN
forces             NaN
citoyens           NaN
cas                NaN
travail            NaN
pouvoir            NaN
respecter          NaN
Name: incivilite, dtype: float32

montrer


montrer      0.001311
exemple      0.000484
eduquer           NaN
forces            NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
respecter         NaN
regles            NaN
Name: montrer, dtype: float32

intervenir


intervenir    0.001355
incivilite    0.000200
faire         0.000067
eduquer            NaN
forces             NaN
citoyens           NaN
cas                NaN
travail            NaN
pouvoir            NaN
respecter          NaN
Name: intervenir, dtype: float32

police


police         0.001403
justice        0.000331
faire          0.000104
incivilites    0.000099
eduquer             NaN
forces              NaN
citoyens            NaN
cas                 NaN
travail             NaN
pouvoir             NaN
Name: police, dtype: float32

faut


faut           0.001462
incivilites    0.000107
faire          0.000094
eduquer             NaN
forces              NaN
citoyens            NaN
cas                 NaN
travail             NaN
pouvoir             NaN
respecter           NaN
Name: faut, dtype: float32

donner


donner       0.001468
exemple      0.000396
eduquer           NaN
forces            NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
respecter         NaN
regles            NaN
Name: donner, dtype: float32

citoyen


citoyen      0.001515
faire        0.000092
eduquer           NaN
forces            NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
respecter         NaN
regles            NaN
Name: citoyen, dtype: float32

citoyens


citoyens       0.001534
incivilites    0.000113
faire          0.000093
eduquer             NaN
forces              NaN
cas                 NaN
travail             NaN
pouvoir             NaN
respecter           NaN
regles              NaN
Name: citoyens, dtype: float32

In [157]:
gc.collect()

147

# Question 29: Quelles sont les discriminations les plus répandues dont vous êtes témoin ou victime ?

In [158]:
question_29 = "Quelles sont les discriminations les plus répandues dont vous êtes témoin ou victime ?"
qu_29,df_qu_29_one_hot,df_cov_29,df_confidence_29,df_lift_29 = compute_similarities(question_29, new_res)

In [159]:
for i in df_qu_29_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_29[i].sort_values(ascending=False).head(10))

racisme


racisme           4301
homophobie         930
sexisme            827
anti               620
blanc              404
discrimination     249
femmes             226
francais           205
antisemitisme      199
temoin             134
Name: racisme, dtype: uint16

discrimination


discrimination     3029
femmes              491
racisme             249
sociale             221
femme               219
raciale             207
embauche            202
temoin              190
discriminations     186
homme               183
Name: discrimination, dtype: uint16

femmes


femmes             2211
discrimination      491
hommes              433
discriminations     354
racisme             226
non                 138
travail             134
respect             115
vis                 113
jeunes              108
Name: femmes, dtype: uint16

discriminations


discriminations    2085
femmes              354
raciales            240
discrimination      186
temoin              160
racisme             132
sociales            132
origine             124
sexistes            106
travail             103
Name: discriminations, dtype: uint16

homophobie


homophobie        1493
racisme            930
sexisme            406
antisemitisme      124
couleur              0
non                  0
femmes               0
harcelement          0
anti                 0
discrimination       0
Name: homophobie, dtype: uint16

sexisme


sexisme           1479
racisme            827
homophobie         406
couleur              0
non                  0
antisemitisme        0
femmes               0
harcelement          0
anti                 0
discrimination       0
Name: sexisme, dtype: uint16

non


non                1101
respect             503
femmes              138
discrimination      132
racisme             130
sexisme               0
facies                0
discriminations       0
handicapes            0
blanc                 0
Name: non, dtype: uint16

femme


femme              947
homme              513
discrimination     219
racisme            106
couleur              0
blanc                0
facies               0
discriminations      0
handicapes           0
age                  0
Name: femme, dtype: uint16

anti


anti               922
racisme            620
blanc              436
francais           163
discrimination     137
couleur              0
france               0
facies               0
discriminations      0
handicapes           0
Name: anti, dtype: uint16

respect


respect            877
non                503
manque             260
femmes             115
couleur              0
age                  0
discriminations      0
handicapes           0
blanc                0
sexisme              0
Name: respect, dtype: uint16

francais


francais           767
racisme            205
anti               163
discrimination     128
couleur              0
france               0
facies               0
discriminations      0
handicapes           0
blanc                0
Name: francais, dtype: uint16

blanc


blanc             697
anti              436
racisme           404
discrimination    110
couleur             0
jeunes              0
non                 0
antisemitisme       0
femmes              0
harcelement         0
Name: blanc, dtype: uint16

temoin


temoin             670
victime            267
discrimination     190
discriminations    160
racisme            134
facies               0
handicapes           0
blanc                0
sexisme              0
couleur              0
Name: temoin, dtype: uint16

tout


tout               656
discrimination     147
monde              125
facies               0
discriminations      0
handicapes           0
blanc                0
sexisme              0
age                  0
anti                 0
Name: tout, dtype: uint16

homme


homme              640
femme              513
discrimination     183
age                  0
discriminations      0
handicapes           0
blanc                0
sexisme              0
couleur              0
france               0
Name: homme, dtype: uint16

couleur


couleur           633
peau              430
discrimination    112
jeunes              0
non                 0
antisemitisme       0
femmes              0
harcelement         0
anti                0
raciales            0
Name: couleur, dtype: uint16

travail


travail            621
discrimination     171
femmes             134
discriminations    103
couleur              0
france               0
jeunes               0
non                  0
antisemitisme        0
harcelement          0
Name: travail, dtype: uint16

age


age               547
discrimination    156
couleur             0
ans                 0
jeunes              0
non                 0
antisemitisme       0
femmes              0
harcelement         0
anti                0
Name: age, dtype: uint16

origine


origine            544
discrimination     143
discriminations    124
couleur              0
france               0
jeunes               0
non                  0
antisemitisme        0
femmes               0
harcelement          0
Name: origine, dtype: uint16

raciales


raciales           540
discriminations    240
ans                  0
jeunes               0
non                  0
antisemitisme        0
femmes               0
harcelement          0
anti                 0
discrimination       0
Name: raciales, dtype: uint16

In [160]:
for i in df_qu_29_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_29[i].sort_values(ascending=False).head(10))

racisme


racisme          1.000000
anti             0.672451
homophobie       0.622907
antisemitisme    0.580175
blanc            0.579627
sexisme          0.559162
blancs           0.359431
francais         0.267275
temoin           0.200000
non              0.118074
Name: racisme, dtype: float32

discrimination


discrimination    1.000000
embauche          0.556474
raciale           0.552000
sociale           0.423372
victime           0.346000
emploi            0.318681
homme             0.285937
age               0.285192
temoin            0.283582
travail           0.275362
Name: discrimination, dtype: float32

femmes


femmes             1.000000
hommes             0.816981
vis                0.284635
jeunes             0.224532
travail            0.215781
discriminations    0.169784
discrimination     0.162100
respect            0.131129
non                0.125341
racisme            0.052546
Name: femmes, dtype: float32

discriminations


discriminations    1.000000
raciales           0.444444
sociales           0.376068
sexistes           0.331250
temoin             0.238806
origine            0.227941
victime            0.202000
travail            0.165862
femmes             0.160109
discrimination     0.061406
Name: discriminations, dtype: float32

homophobie


homophobie        1.000000
antisemitisme     0.361516
sexisme           0.274510
racisme           0.216229
couleur           0.000000
non               0.000000
femmes            0.000000
harcelement       0.000000
anti              0.000000
discrimination    0.000000
Name: homophobie, dtype: float32

sexisme


sexisme           1.000000
homophobie        0.271936
racisme           0.192281
couleur           0.000000
non               0.000000
antisemitisme     0.000000
femmes            0.000000
harcelement       0.000000
anti              0.000000
discrimination    0.000000
Name: sexisme, dtype: float32

non


non                1.000000
respect            0.573546
femmes             0.062415
discrimination     0.043579
racisme            0.030226
sexisme            0.000000
facies             0.000000
discriminations    0.000000
handicapes         0.000000
blanc              0.000000
Name: non, dtype: float32

femme


femme              1.000000
homme              0.801562
discrimination     0.072301
racisme            0.024645
couleur            0.000000
blanc              0.000000
facies             0.000000
discriminations    0.000000
handicapes         0.000000
age                0.000000
Name: femme, dtype: float32

anti


anti               1.000000
blanc              0.625538
francais           0.212516
racisme            0.144153
discrimination     0.045229
couleur            0.000000
france             0.000000
facies             0.000000
discriminations    0.000000
handicapes         0.000000
Name: anti, dtype: float32

respect


respect            1.000000
manque             0.552017
non                0.456857
femmes             0.052013
couleur            0.000000
age                0.000000
discriminations    0.000000
handicapes         0.000000
blanc              0.000000
sexisme            0.000000
Name: respect, dtype: float32

francais


francais           1.000000
anti               0.176790
racisme            0.047663
discrimination     0.042258
couleur            0.000000
france             0.000000
facies             0.000000
discriminations    0.000000
handicapes         0.000000
blanc              0.000000
Name: francais, dtype: float32

blanc


blanc             1.000000
anti              0.472885
racisme           0.093932
discrimination    0.036316
couleur           0.000000
jeunes            0.000000
non               0.000000
antisemitisme     0.000000
femmes            0.000000
harcelement       0.000000
Name: blanc, dtype: float32

temoin


temoin             1.000000
victime            0.534000
discriminations    0.076739
discrimination     0.062727
racisme            0.031156
facies             0.000000
handicapes         0.000000
blanc              0.000000
sexisme            0.000000
couleur            0.000000
Name: temoin, dtype: float32

tout


tout               1.000000
monde              0.423729
discrimination     0.048531
facies             0.000000
discriminations    0.000000
handicapes         0.000000
blanc              0.000000
sexisme            0.000000
age                0.000000
anti               0.000000
Name: tout, dtype: float32

homme


homme              1.000000
femme              0.541711
discrimination     0.060416
age                0.000000
discriminations    0.000000
handicapes         0.000000
blanc              0.000000
sexisme            0.000000
couleur            0.000000
france             0.000000
Name: homme, dtype: float32

couleur


couleur           1.000000
peau              0.884774
discrimination    0.036976
jeunes            0.000000
non               0.000000
antisemitisme     0.000000
femmes            0.000000
harcelement       0.000000
anti              0.000000
raciales          0.000000
Name: couleur, dtype: float32

travail


travail            1.000000
femmes             0.060606
discrimination     0.056454
discriminations    0.049400
couleur            0.000000
france             0.000000
jeunes             0.000000
non                0.000000
antisemitisme      0.000000
harcelement        0.000000
Name: travail, dtype: float32

age


age               1.000000
discrimination    0.051502
couleur           0.000000
ans               0.000000
jeunes            0.000000
non               0.000000
antisemitisme     0.000000
femmes            0.000000
harcelement       0.000000
anti              0.000000
Name: age, dtype: float32

origine


origine            1.000000
discriminations    0.059472
discrimination     0.047210
couleur            0.000000
france             0.000000
jeunes             0.000000
non                0.000000
antisemitisme      0.000000
femmes             0.000000
harcelement        0.000000
Name: origine, dtype: float32

raciales


raciales           1.000000
discriminations    0.115108
ans                0.000000
jeunes             0.000000
non                0.000000
antisemitisme      0.000000
femmes             0.000000
harcelement        0.000000
anti               0.000000
discrimination     0.000000
Name: raciales, dtype: float32

In [161]:
for i in df_qu_29_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_29[i].sort_values(ascending=False).head(10))

racisme


racisme          0.000233
anti             0.000156
homophobie       0.000145
antisemitisme    0.000135
blanc            0.000135
sexisme          0.000130
blancs           0.000084
francais         0.000062
temoin           0.000047
non              0.000027
Name: racisme, dtype: float32

discrimination


discrimination    0.000330
embauche          0.000184
raciale           0.000182
sociale           0.000140
victime           0.000114
emploi            0.000105
homme             0.000094
age               0.000094
temoin            0.000094
travail           0.000091
Name: discrimination, dtype: float32

femmes


femmes             0.000452
hommes             0.000370
vis                0.000129
jeunes             0.000102
travail            0.000098
discriminations    0.000077
discrimination     0.000073
respect            0.000059
non                0.000057
racisme            0.000024
Name: femmes, dtype: float32

discriminations


discriminations    0.000480
raciales           0.000213
sociales           0.000180
sexistes           0.000159
temoin             0.000115
origine            0.000109
victime            0.000097
travail            0.000080
femmes             0.000077
discrimination     0.000029
Name: discriminations, dtype: float32

homophobie


homophobie       0.000670
antisemitisme    0.000242
sexisme          0.000184
racisme          0.000145
emploi                NaN
travail               NaN
victime               NaN
vis                   NaN
transports            NaN
handicap              NaN
Name: homophobie, dtype: float32

sexisme


sexisme       0.000676
homophobie    0.000184
racisme       0.000130
emploi             NaN
travail            NaN
victime            NaN
vis                NaN
transports         NaN
handicap           NaN
acces              NaN
Name: sexisme, dtype: float32

non


non               0.000908
respect           0.000521
femmes            0.000057
discrimination    0.000040
racisme           0.000027
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
Name: non, dtype: float32

femme


femme             0.001056
homme             0.000846
discrimination    0.000076
racisme           0.000026
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
handicap               NaN
Name: femme, dtype: float32

anti


anti              0.001085
blanc             0.000678
francais          0.000230
racisme           0.000156
discrimination    0.000049
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
Name: anti, dtype: float32

respect


respect       0.001140
manque        0.000629
non           0.000521
femmes        0.000059
emploi             NaN
travail            NaN
victime            NaN
vis                NaN
transports         NaN
handicap           NaN
Name: respect, dtype: float32

francais


francais          0.001304
anti              0.000230
racisme           0.000062
discrimination    0.000055
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
handicap               NaN
Name: francais, dtype: float32

blanc


blanc             0.001435
anti              0.000678
racisme           0.000135
discrimination    0.000052
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
handicap               NaN
Name: blanc, dtype: float32

temoin


temoin             0.001493
victime            0.000797
discriminations    0.000115
discrimination     0.000094
racisme            0.000047
emploi                  NaN
travail                 NaN
vis                     NaN
transports              NaN
handicap                NaN
Name: temoin, dtype: float32

tout


tout              0.001524
monde             0.000646
discrimination    0.000074
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
handicap               NaN
acces                  NaN
Name: tout, dtype: float32

homme


homme             0.001563
femme             0.000846
discrimination    0.000094
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
handicap               NaN
acces                  NaN
Name: homme, dtype: float32

couleur


couleur           0.001580
peau              0.001398
discrimination    0.000058
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
handicap               NaN
acces                  NaN
Name: couleur, dtype: float32

travail


travail            0.001610
femmes             0.000098
discrimination     0.000091
discriminations    0.000080
emploi                  NaN
victime                 NaN
vis                     NaN
transports              NaN
handicap                NaN
acces                   NaN
Name: travail, dtype: float32

age


age               0.001828
discrimination    0.000094
emploi                 NaN
travail                NaN
victime                NaN
vis                    NaN
transports             NaN
handicap               NaN
acces                  NaN
pauvres                NaN
Name: age, dtype: float32

origine


origine            0.001838
discriminations    0.000109
discrimination     0.000087
emploi                  NaN
travail                 NaN
victime                 NaN
vis                     NaN
transports              NaN
handicap                NaN
acces                   NaN
Name: origine, dtype: float32

raciales


raciales           0.001852
discriminations    0.000213
emploi                  NaN
travail                 NaN
victime                 NaN
vis                     NaN
transports              NaN
handicap                NaN
acces                   NaN
pauvres                 NaN
Name: raciales, dtype: float32

In [162]:
gc.collect()

147

# Question 30: Que faudrait-il faire pour lutter contre ces discriminations et construire une société plus solidaire et plus tolérante ?

In [163]:
question_30 = "Que faudrait-il faire pour lutter contre ces discriminations et construire une société plus solidaire et plus tolérante ?"
qu_30,df_qu_30_one_hot,df_cov_30,df_confidence_30,df_lift_30 = compute_similarities(question_30, new_res)

In [164]:
for i in df_qu_30_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_30[i].sort_values(ascending=False).head(10))

education


education    3339
ecole         466
tout          273
civique       269
parents       231
enfants       214
tous          199
faire         192
age           189
jeune         175
Name: education, dtype: uint16

faire


faire        2054
tout          256
tous          249
respecter     236
faut          224
societe       213
lois          213
education     192
ecole         189
appliquer     165
Name: faire, dtype: uint16

ecole


ecole        1646
education     466
faire         189
parents       180
tout          173
enfants       159
faut          158
civique       149
tous          145
apprendre     129
Name: ecole, dtype: uint16

tous


tous         1489
faire         249
education     199
societe       172
faut          169
tout          158
ecole         145
vie           131
citoyens      123
travail       115
Name: tous, dtype: uint16

tout


tout         1481
monde         363
education     273
faire         256
faut          198
ecole         173
societe       162
tous          158
arreter       116
travail       106
Name: tout, dtype: uint16

eduquer


eduquer        1332
enfants         147
sanctionner     144
ecole           114
femmes            0
culture           0
sens              0
tolerance         0
france            0
voir              0
Name: eduquer, dtype: uint16

societe


societe      1253
solidaire     235
tolerante     223
faut          219
faire         213
tous          172
tout          162
education     153
vie           127
civique         0
Name: societe, dtype: uint16

faut


faut               1167
faire               224
societe             219
tout                198
tous                169
education           167
ecole               158
discriminations     114
tolerance           104
niveau                0
Name: faut, dtype: uint16

tolerance


tolerance         856
solidarite        175
education         124
respect           115
faut              104
ecole             104
discrimination      0
immigration         0
france              0
voir                0
Name: tolerance, dtype: uint16

respect


respect      815
education    166
tolerance    115
ecole        115
tous         105
france         0
voir           0
tolerante      0
prendre        0
niveau         0
Name: respect, dtype: uint16

arreter


arreter            798
faire              158
tout               116
discriminations      0
tolerance            0
france               0
voir                 0
tolerante            0
prendre              0
niveau               0
Name: arreter, dtype: uint16

exemple


exemple        790
montrer        125
faire          114
donner         111
tous           105
education      105
immigration      0
france           0
voir             0
tolerante        0
Name: exemple, dtype: uint16

discriminations


discriminations    752
faire              126
lutter             118
education          115
faut               114
france               0
voir                 0
tolerante            0
prendre              0
niveau               0
Name: discriminations, dtype: uint16

travail


travail        749
faire          148
tous           115
tout           106
mettre           0
immigration      0
tolerance        0
france           0
voir             0
tolerante        0
Name: travail, dtype: uint16

non


non          745
faire        121
tous         110
education    104
tolerance      0
france         0
voir           0
tolerante      0
prendre        0
niveau         0
Name: non, dtype: uint16

enfants


enfants           724
education         214
parents           183
ecole             159
eduquer           147
faire             116
discrimination      0
age                 0
femmes              0
culture             0
Name: enfants, dtype: uint16

mettre


mettre             710
place              197
discriminations      0
france               0
voir                 0
tolerante            0
prendre              0
niveau               0
republique           0
droits               0
Name: mettre, dtype: uint16

sanctionner


sanctionner    641
eduquer        144
non              0
sens             0
tolerance        0
france           0
voir             0
tolerante        0
prendre          0
niveau           0
Name: sanctionner, dtype: uint16

lois


lois           637
faire          213
appliquer      194
respecter      122
immigration      0
tolerance        0
france           0
voir             0
tolerante        0
prendre          0
Name: lois, dtype: uint16

vie


vie          637
tous         131
societe      127
faire        109
tout         102
appliquer      0
tolerance      0
france         0
voir           0
tolerante      0
Name: vie, dtype: uint16

In [165]:
for i in df_qu_30_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_30[i].sort_values(ascending=False).head(10))

education


education    1.000000
nationale    0.650000
civique      0.542339
parents      0.422303
jeune        0.335893
age          0.315526
enfants      0.295580
ecole        0.283111
jeunes       0.261603
respect      0.203681
Name: education, dtype: float32

faire


faire        1.000000
respecter    0.476768
lois         0.334380
appliquer    0.316699
loi          0.239669
monde        0.199634
arreter      0.197995
travail      0.197597
faut         0.191945
france       0.186992
Name: faire, dtype: float32

ecole


ecole        1.000000
role         0.371429
parents      0.329068
civique      0.300403
apprendre    0.239332
enfants      0.219613
age          0.190317
respect      0.141104
education    0.139563
faut         0.135390
Name: ecole, dtype: float32

tous


tous        1.000000
vie         0.205651
citoyens    0.205000
francais    0.167496
egalite     0.159055
travail     0.153538
non         0.147651
faut        0.144816
societe     0.137271
exemple     0.132911
Name: tous, dtype: float32

tout


tout       1.000000
monde      0.664835
faut       0.169666
vie        0.160126
arreter    0.145363
travail    0.141522
societe    0.129290
faire      0.124635
tous       0.106111
ecole      0.105103
Name: tout, dtype: float32

eduquer


eduquer        1.000000
sanctionner    0.224649
enfants        0.203039
ecole          0.069259
sens           0.000000
droits         0.000000
tolerance      0.000000
france         0.000000
voir           0.000000
tolerante      0.000000
Name: eduquer, dtype: float32

societe


societe      1.000000
tolerante    0.822878
solidaire    0.669516
vie          0.199372
faut         0.187661
tous         0.115514
tout         0.109386
faire        0.103700
education    0.045822
civique      0.000000
Name: societe, dtype: float32

faut


faut               1.000000
societe            0.174781
discriminations    0.151596
tout               0.133693
tolerance          0.121495
tous               0.113499
faire              0.109056
ecole              0.095990
education          0.050015
age                0.000000
Name: faut, dtype: float32

tolerance


tolerance      1.000000
solidarite     0.421687
respect        0.141104
faut           0.089117
ecole          0.063183
education      0.037137
culture        0.000000
immigration    0.000000
france         0.000000
voir           0.000000
Name: tolerance, dtype: float32

respect


respect      1.000000
tolerance    0.134346
tous         0.070517
ecole        0.069866
education    0.049715
france       0.000000
voir         0.000000
tolerante    0.000000
prendre      0.000000
niveau       0.000000
Name: respect, dtype: float32

arreter


arreter            1.000000
tout               0.078325
faire              0.076923
discriminations    0.000000
tolerance          0.000000
france             0.000000
voir               0.000000
tolerante          0.000000
prendre            0.000000
niveau             0.000000
Name: arreter, dtype: float32

exemple


exemple        1.000000
montrer        0.484496
donner         0.175911
tous           0.070517
faire          0.055501
education      0.031447
immigration    0.000000
france         0.000000
voir           0.000000
tolerante      0.000000
Name: exemple, dtype: float32

discriminations


discriminations    1.000000
lutter             0.230469
faut               0.097686
faire              0.061344
education          0.034441
france             0.000000
voir               0.000000
tolerante          0.000000
prendre            0.000000
niveau             0.000000
Name: discriminations, dtype: float32

travail


travail        1.000000
tous           0.077233
faire          0.072055
tout           0.071573
mettre         0.000000
immigration    0.000000
tolerance      0.000000
france         0.000000
voir           0.000000
tolerante      0.000000
Name: travail, dtype: float32

non


non          1.000000
tous         0.073875
faire        0.058909
education    0.031147
tolerance    0.000000
france       0.000000
voir         0.000000
tolerante    0.000000
prendre      0.000000
niveau       0.000000
Name: non, dtype: float32

enfants


enfants      1.000000
parents      0.334552
eduquer      0.110360
ecole        0.096598
education    0.064091
faire        0.056475
niveau       0.000000
femmes       0.000000
culture      0.000000
tolerance    0.000000
Name: enfants, dtype: float32

mettre


mettre             1.00000
place              0.39798
discriminations    0.00000
france             0.00000
voir               0.00000
tolerante          0.00000
prendre            0.00000
niveau             0.00000
republique         0.00000
droits             0.00000
Name: mettre, dtype: float32

sanctionner


sanctionner    1.000000
eduquer        0.108108
non            0.000000
sens           0.000000
tolerance      0.000000
france         0.000000
voir           0.000000
tolerante      0.000000
prendre        0.000000
niveau         0.000000
Name: sanctionner, dtype: float32

lois


lois           1.000000
appliquer      0.372361
respecter      0.246465
faire          0.103700
immigration    0.000000
tolerance      0.000000
france         0.000000
voir           0.000000
tolerante      0.000000
prendre        0.000000
Name: lois, dtype: float32

vie


vie          1.000000
societe      0.101357
tous         0.087979
tout         0.068872
faire        0.053067
appliquer    0.000000
tolerance    0.000000
france       0.000000
voir         0.000000
tolerante    0.000000
Name: vie, dtype: float32

In [166]:
for i in df_qu_30_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_30[i].sort_values(ascending=False).head(10))

education


education    0.000299
nationale    0.000195
civique      0.000162
parents      0.000126
jeune        0.000101
age          0.000094
enfants      0.000089
ecole        0.000085
jeunes       0.000078
respect      0.000061
Name: education, dtype: float32

faire


faire        0.000487
respecter    0.000232
lois         0.000163
appliquer    0.000154
loi          0.000117
monde        0.000097
arreter      0.000096
travail      0.000096
faut         0.000093
france       0.000091
Name: faire, dtype: float32

ecole


ecole        0.000608
role         0.000226
parents      0.000200
civique      0.000183
apprendre    0.000145
enfants      0.000133
age          0.000116
respect      0.000086
education    0.000085
faut         0.000082
Name: ecole, dtype: float32

tous


tous        0.000672
vie         0.000138
citoyens    0.000138
francais    0.000112
egalite     0.000107
travail     0.000103
non         0.000099
faut        0.000097
societe     0.000092
exemple     0.000089
Name: tous, dtype: float32

tout


tout       0.000675
monde      0.000449
faut       0.000115
vie        0.000108
arreter    0.000098
travail    0.000096
societe    0.000087
faire      0.000084
tous       0.000072
ecole      0.000071
Name: tout, dtype: float32

eduquer


eduquer        0.000751
sanctionner    0.000169
enfants        0.000152
ecole          0.000052
sanctions           NaN
citoyens            NaN
cas                 NaN
travail             NaN
pouvoir             NaN
respecter           NaN
Name: eduquer, dtype: float32

societe


societe      0.000798
tolerante    0.000657
solidaire    0.000534
vie          0.000159
faut         0.000150
tous         0.000092
tout         0.000087
faire        0.000083
education    0.000037
eduquer           NaN
Name: societe, dtype: float32

faut


faut               0.000857
societe            0.000150
discriminations    0.000130
tout               0.000115
tolerance          0.000104
tous               0.000097
faire              0.000093
ecole              0.000082
education          0.000043
eduquer                 NaN
Name: faut, dtype: float32

tolerance


tolerance     0.001168
solidarite    0.000493
respect       0.000165
faut          0.000104
ecole         0.000074
education     0.000043
eduquer            NaN
sanctions          NaN
citoyens           NaN
cas                NaN
Name: tolerance, dtype: float32

respect


respect      0.001227
tolerance    0.000165
tous         0.000087
ecole        0.000086
education    0.000061
eduquer           NaN
sanctions         NaN
citoyens          NaN
cas               NaN
travail           NaN
Name: respect, dtype: float32

arreter


arreter      0.001253
tout         0.000098
faire        0.000096
eduquer           NaN
sanctions         NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
respecter         NaN
Name: arreter, dtype: float32

exemple


exemple      0.001266
montrer      0.000613
donner       0.000223
tous         0.000089
faire        0.000070
education    0.000040
eduquer           NaN
sanctions         NaN
citoyens          NaN
cas               NaN
Name: exemple, dtype: float32

discriminations


discriminations    0.001330
lutter             0.000306
faut               0.000130
faire              0.000082
education          0.000046
eduquer                 NaN
sanctions               NaN
citoyens                NaN
cas                     NaN
travail                 NaN
Name: discriminations, dtype: float32

travail


travail      0.001335
tous         0.000103
faire        0.000096
tout         0.000096
eduquer           NaN
sanctions         NaN
citoyens          NaN
cas               NaN
pouvoir           NaN
respecter         NaN
Name: travail, dtype: float32

non


non          0.001342
tous         0.000099
faire        0.000079
education    0.000042
eduquer           NaN
sanctions         NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
Name: non, dtype: float32

enfants


enfants      0.001381
parents      0.000462
eduquer      0.000152
ecole        0.000133
education    0.000089
faire        0.000078
sanctions         NaN
citoyens          NaN
cas               NaN
travail           NaN
Name: enfants, dtype: float32

mettre


mettre       0.001408
place        0.000561
eduquer           NaN
sanctions         NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
respecter         NaN
montrer           NaN
Name: mettre, dtype: float32

sanctionner


sanctionner    0.001560
eduquer        0.000169
sanctions           NaN
citoyens            NaN
cas                 NaN
travail             NaN
pouvoir             NaN
respecter           NaN
montrer             NaN
creer               NaN
Name: sanctionner, dtype: float32

lois


lois         0.001570
appliquer    0.000585
respecter    0.000387
faire        0.000163
eduquer           NaN
sanctions         NaN
citoyens          NaN
cas               NaN
travail           NaN
pouvoir           NaN
Name: lois, dtype: float32

vie


vie          0.001570
societe      0.000159
tous         0.000138
tout         0.000108
faire        0.000083
eduquer           NaN
sanctions         NaN
citoyens          NaN
cas               NaN
travail           NaN
Name: vie, dtype: float32

In [167]:
gc.collect()

147

# Question 31:  Pensez-vous qu'il faille instaurer des contreparties aux différentes allocations de solidarité ?

In [168]:
question_31 = "Pensez-vous qu'il faille instaurer des contreparties aux différentes allocations de solidarité ?"
qu_31,df_qu_31_one_hot,df_cov_31,df_confidence_31,df_lift_31 = compute_similarities(question_31, new_res)

In [169]:
for i in df_qu_31_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_31[i].sort_values(ascending=False).head(10))

oui


oui    21329
non        0
Name: oui, dtype: uint16

non


non    7795
oui       0
Name: non, dtype: uint16

In [170]:
for i in df_qu_31_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_31[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [171]:
for i in df_qu_31_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_31[i].sort_values(ascending=False).head(10))

oui


oui    0.000047
non         NaN
Name: oui, dtype: float32

non


non    0.000128
oui         NaN
Name: non, dtype: float32

In [172]:
gc.collect()

14

# Question 32: Si oui, lesquelles ?

In [173]:
question_32 = "Si oui, lesquelles ?"
qu_32,df_qu_32_one_hot,df_cov_32,df_confidence_32,df_lift_32 = compute_similarities(question_32, new_res)

In [174]:
for i in df_qu_32_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_32[i].sort_values(ascending=False).head(10))

travail


travail         4328
interet         1336
general         1081
heures           585
allocations      534
rsa              428
aide             393
faire            382
tout             361
collectivite     358
Name: travail, dtype: uint16

interet


interet         3213
general         2331
travaux         1595
travail         1336
heures           283
collectif        281
allocations      264
aide             260
associations     259
faire            241
Name: interet, dtype: uint16

allocations


allocations    3047
familiales      694
enfants         577
travail         534
solidarite      482
chomage         375
cas             370
faire           317
faut            316
non             308
Name: allocations, dtype: uint16

travaux


travaux         2729
interet         1595
general         1155
generaux         514
interets         430
associations     255
faire            253
aide             249
allocations      225
travail          219
Name: travaux, dtype: uint16

general


general         2456
interet         2331
travaux         1155
travail         1081
heures           236
aide             210
allocations      207
associations     190
faire            181
rsa              180
Name: general, dtype: uint16

aide


aide            1622
travail          393
interet          260
agees            255
travaux          249
associations     243
contrepartie     222
general          210
allocations      200
aides            198
Name: aide, dtype: uint16

aides


aides          1616
travail         325
allocations     268
sociales        230
faire           218
enfants         207
aide            198
interet         181
faut            180
travaux         169
Name: aides, dtype: uint16

faire


faire          1525
travail         382
allocations     317
travaux         253
interet         241
faut            222
aides           218
enfants         217
tout            199
rsa             198
Name: faire, dtype: uint16

enfants


enfants        1365
allocations     577
parents         389
familiales      324
travail         261
ecole           247
faire           217
education       209
aides           207
emploi          151
Name: enfants, dtype: uint16

associations


associations     1353
travail           311
interet           259
travaux           255
aide              243
heures            215
temps             212
general           190
collectivites     154
aides             149
Name: associations, dtype: uint16

heures


heures          1353
travail          585
interet          283
semaine          247
rsa              246
general          236
associations     215
travaux          192
collectivite     186
allocations      168
Name: heures, dtype: uint16

temps


temps           1314
donner           445
travail          321
associations     212
allocations      205
collectivite     191
interet          181
aide             174
faire            163
exemple          151
Name: temps, dtype: uint16

allocation


allocation      1264
travail          329
allocations      232
chomage          227
contrepartie     226
solidarite       209
interet          160
emploi           153
faire            152
enfants          150
Name: allocation, dtype: uint16

rsa


rsa            1255
travail         428
allocations     308
heures          246
interet         235
chomage         230
faire           198
travaux         190
emploi          186
exemple         180
Name: rsa, dtype: uint16

emploi


emploi         1219
recherche       496
allocations     304
travail         280
chomage         242
formation       201
rsa             186
faire           170
interet         169
obligation      154
Name: emploi, dtype: uint16

exemple


exemple        1201
travail         298
allocations     254
interet         215
travaux         215
faire           192
rsa             180
aide            174
general         166
aides           162
Name: exemple, dtype: uint16

contrepartie


contrepartie    1201
travail          352
allocations      307
allocation       226
aide             222
solidarite       219
interet          197
rsa              174
faut             166
faire            158
Name: contrepartie, dtype: uint16

solidarite


solidarite      1152
allocations      482
contrepartie     219
travail          209
allocation       209
faire            169
faut             156
societe          146
non              145
aide             136
Name: solidarite, dtype: uint16

respect


respect        1146
regles          269
lois            261
allocations     200
non             189
republique      179
enfants         123
cas             117
travail         116
societe         102
Name: respect, dtype: uint16

tout


tout            1130
travail          361
allocations      245
faire            199
salaire          190
monde            177
faut             165
aides            163
aide             153
contrepartie     137
Name: tout, dtype: uint16

In [175]:
for i in df_qu_32_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_32[i].sort_values(ascending=False).head(10))

travail


travail          1.000000
salaire          0.604061
collectif        0.514360
monde            0.444805
general          0.440147
heures           0.432373
interet          0.415811
collectivites    0.388535
utilite          0.372294
semaine          0.369963
Name: travail, dtype: float32

interet


interet      1.000000
general      0.949104
collectif    0.733681
travaux      0.584463
public       0.427632
generaux     0.415270
travail      0.308688
chomeurs     0.247166
agees        0.245115
semaine      0.214286
Name: interet, dtype: float32

allocations


allocations    1.000000
familiales     0.931544
enfant         0.563707
supprimer      0.526442
familles       0.505338
devraient      0.483957
suppression    0.482625
parents        0.471519
enfants        0.422711
solidarite     0.418403
Name: allocations, dtype: float32

travaux


travaux      1.000000
generaux     0.957169
interets     0.860000
interet      0.496421
general      0.470277
utilite      0.426407
collectif    0.331593
publique     0.313978
nettoyage    0.310777
communes     0.296703
Name: travaux, dtype: float32

general


general         1.000000
interet         0.725490
travaux         0.423232
travail         0.249769
agees           0.197158
heures          0.174427
rsa             0.143426
associations    0.140429
exemple         0.138218
aide            0.129470
Name: general, dtype: float32

aide


aide            1.000000
agees           0.452931
entretien       0.308868
nettoyage       0.300752
sociale         0.280928
contrepartie    0.184846
associations    0.179601
aider           0.167702
societe         0.151461
exemple         0.144879
Name: aide, dtype: float32

aides


aides          1.000000
sociales       0.605263
suppression    0.239382
parents        0.191456
faut           0.159433
enfants        0.151648
tout           0.144248
faire          0.142951
non            0.141304
exemple        0.134888
Name: aides, dtype: float32

faire


faire         1.000000
travailler    0.230889
aider         0.217391
participer    0.205882
faut          0.196634
tous          0.192488
tout          0.176106
exemple       0.159867
enfants       0.158974
rsa           0.157769
Name: faire, dtype: float32

enfants


enfants        1.000000
parents        0.615506
education      0.525126
familles       0.455516
familiales     0.434899
ecole          0.426598
scolaire       0.288952
suppression    0.206564
allocations    0.189367
recherche      0.160350
Name: enfants, dtype: float32

associations


associations     1.000000
collectivites    0.326964
benevolat        0.224590
temps            0.161339
heures           0.158906
participation    0.151639
aide             0.149815
donner           0.147658
exemple          0.106578
travaux          0.093441
Name: associations, dtype: float32

heures


heures           1.000000
semaine          0.452381
collectivites    0.235669
rsa              0.196016
collectivite     0.176136
benevolat        0.167213
associations     0.158906
service          0.155440
donner           0.153768
travail          0.135166
Name: heures, dtype: float32

temps


temps           1.000000
donner          0.453157
collectivite    0.180871
aider           0.158385
associations    0.156689
chomage         0.130064
exemple         0.125729
emploi          0.121411
societe         0.115146
rsa             0.113147
Name: temps, dtype: float32

allocation


allocation      1.000000
chomage         0.242004
contrepartie    0.188177
solidarite      0.181424
non             0.136364
emploi          0.125513
faut            0.121346
tout            0.115929
enfants         0.109890
rsa             0.106773
Name: allocation, dtype: float32

rsa


rsa              1.000000
beneficiaires    0.248207
semaine          0.247253
chomage          0.245203
familiales       0.190604
heures           0.181818
travailler       0.166927
emploi           0.152584
exemple          0.149875
contrepartie     0.144879
Name: rsa, dtype: float32

emploi


emploi        1.000000
recherche     0.723032
formation     0.298663
chomage       0.257996
chomeurs      0.247166
obligation    0.209809
rsa           0.148207
allocation    0.121044
faut          0.115146
temps         0.112633
Name: emploi, dtype: float32

exemple


exemple         1.000000
rsa             0.143426
chomage         0.132196
faire           0.125902
donner          0.119145
temps           0.114916
emploi          0.110747
contrepartie    0.109908
aide            0.107275
enfants         0.106960
Name: exemple, dtype: float32

contrepartie


contrepartie    1.000000
solidarite      0.190104
allocation      0.178797
faut            0.147033
rsa             0.138645
donner          0.138493
aide            0.136868
societe         0.121346
tout            0.121239
chomage         0.118337
Name: contrepartie, dtype: float32

solidarite


solidarite      1.000000
contrepartie    0.182348
allocation      0.165348
allocations     0.158188
non             0.143281
faut            0.138175
societe         0.129318
faire           0.110820
tout            0.102655
cas             0.097723
Name: solidarite, dtype: float32

respect


respect        1.000000
lois           0.683246
regles         0.603139
republique     0.521866
non            0.186759
cas            0.111006
societe        0.090345
enfants        0.090110
allocations    0.065638
travail        0.026802
Name: respect, dtype: float32

tout


tout            1.000000
monde           0.574675
salaire         0.482233
droit           0.212679
faut            0.146147
faire           0.130492
contrepartie    0.114072
societe         0.112489
allocation      0.103639
aides           0.100866
Name: tout, dtype: float32

In [176]:
for i in df_qu_32_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_32[i].sort_values(ascending=False).head(10))

travail


travail          0.000231
salaire          0.000140
collectif        0.000119
monde            0.000103
general          0.000102
heures           0.000100
interet          0.000096
collectivites    0.000090
utilite          0.000086
semaine          0.000085
Name: travail, dtype: float32

interet


interet      0.000311
general      0.000295
collectif    0.000228
travaux      0.000182
public       0.000133
generaux     0.000129
travail      0.000096
chomeurs     0.000077
agees        0.000076
semaine      0.000067
Name: interet, dtype: float32

allocations


allocations    0.000328
familiales     0.000306
enfant         0.000185
supprimer      0.000173
familles       0.000166
devraient      0.000159
suppression    0.000158
parents        0.000155
enfants        0.000139
solidarite     0.000137
Name: allocations, dtype: float32

travaux


travaux      0.000366
generaux     0.000351
interets     0.000315
interet      0.000182
general      0.000172
utilite      0.000156
collectif    0.000122
publique     0.000115
nettoyage    0.000114
communes     0.000109
Name: travaux, dtype: float32

general


general         0.000407
interet         0.000295
travaux         0.000172
travail         0.000102
agees           0.000080
heures          0.000071
rsa             0.000058
associations    0.000057
exemple         0.000056
aide            0.000053
Name: general, dtype: float32

aide


aide            0.000617
agees           0.000279
entretien       0.000190
nettoyage       0.000185
sociale         0.000173
contrepartie    0.000114
associations    0.000111
aider           0.000103
societe         0.000093
exemple         0.000089
Name: aide, dtype: float32

aides


aides          0.000619
sociales       0.000375
suppression    0.000148
parents        0.000118
faut           0.000099
enfants        0.000094
tout           0.000089
faire          0.000088
non            0.000087
exemple        0.000083
Name: aides, dtype: float32

faire


faire         0.000656
travailler    0.000151
aider         0.000143
participer    0.000135
faut          0.000129
tous          0.000126
tout          0.000115
exemple       0.000105
enfants       0.000104
rsa           0.000103
Name: faire, dtype: float32

enfants


enfants        0.000733
parents        0.000451
education      0.000385
familles       0.000334
familiales     0.000319
ecole          0.000313
scolaire       0.000212
suppression    0.000151
allocations    0.000139
recherche      0.000117
Name: enfants, dtype: float32

associations


associations     0.000739
collectivites    0.000242
benevolat        0.000166
temps            0.000119
heures           0.000117
participation    0.000112
aide             0.000111
donner           0.000109
exemple          0.000079
travaux          0.000069
Name: associations, dtype: float32

heures


heures           0.000739
semaine          0.000334
collectivites    0.000174
rsa              0.000145
collectivite     0.000130
benevolat        0.000124
associations     0.000117
service          0.000115
donner           0.000114
travail          0.000100
Name: heures, dtype: float32

temps


temps           0.000761
donner          0.000345
collectivite    0.000138
aider           0.000121
associations    0.000119
chomage         0.000099
exemple         0.000096
emploi          0.000092
societe         0.000088
rsa             0.000086
Name: temps, dtype: float32

allocation


allocation      0.000791
chomage         0.000191
contrepartie    0.000149
solidarite      0.000144
non             0.000108
emploi          0.000099
faut            0.000096
tout            0.000092
enfants         0.000087
rsa             0.000084
Name: allocation, dtype: float32

rsa


rsa              0.000797
beneficiaires    0.000198
semaine          0.000197
chomage          0.000195
familiales       0.000152
heures           0.000145
travailler       0.000133
emploi           0.000122
exemple          0.000119
contrepartie     0.000115
Name: rsa, dtype: float32

emploi


emploi        0.000820
recherche     0.000593
formation     0.000245
chomage       0.000212
chomeurs      0.000203
obligation    0.000172
rsa           0.000122
allocation    0.000099
faut          0.000094
temps         0.000092
Name: emploi, dtype: float32

exemple


exemple         0.000833
rsa             0.000119
chomage         0.000110
faire           0.000105
donner          0.000099
temps           0.000096
emploi          0.000092
contrepartie    0.000092
aide            0.000089
enfants         0.000089
Name: exemple, dtype: float32

contrepartie


contrepartie    0.000833
solidarite      0.000158
allocation      0.000149
faut            0.000122
rsa             0.000115
donner          0.000115
aide            0.000114
societe         0.000101
tout            0.000101
chomage         0.000099
Name: contrepartie, dtype: float32

solidarite


solidarite      0.000868
contrepartie    0.000158
allocation      0.000144
allocations     0.000137
non             0.000124
faut            0.000120
societe         0.000112
faire           0.000096
tout            0.000089
cas             0.000085
Name: solidarite, dtype: float32

respect


respect        0.000873
lois           0.000596
regles         0.000526
republique     0.000455
non            0.000163
cas            0.000097
societe        0.000079
enfants        0.000079
allocations    0.000057
travail        0.000023
Name: respect, dtype: float32

tout


tout            0.000885
monde           0.000509
salaire         0.000427
droit           0.000188
faut            0.000129
faire           0.000115
contrepartie    0.000101
societe         0.000100
allocation      0.000092
aides           0.000089
Name: tout, dtype: float32

In [177]:
gc.collect()

147

# Question 33:  Que pensez-vous de la situation de l'immigration en France aujourd'hui et de la politique migratoire ? Quelles sont, selon vous, les critères à mettre en place pour définir la politique migratoire ?

In [178]:
question_33 = "Que pensez-vous de la situation de l'immigration en France aujourd'hui et de la politique migratoire ? Quelles sont, selon vous, les critères à mettre en place pour définir la politique migratoire ?"
qu_33,df_qu_33_one_hot,df_cov_33,df_confidence_33,df_lift_33 = compute_similarities(question_33, new_res)

In [179]:
for i in df_qu_33_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_33[i].sort_values(ascending=False).head(10))

immigration


immigration    8656
pays           2825
france         2683
faut           2070
politique      1603
choisie        1334
francais       1221
asile          1053
faire          1020
non            1005
Name: immigration, dtype: uint16

pays


pays           7765
immigration    2825
france         2628
faut           1994
politique      1642
migrants       1540
accueillir     1530
origine        1267
faire          1228
accueil        1124
Name: pays, dtype: uint16

france


france         6822
immigration    2683
pays           2628
faut           1768
politique      1507
accueillir     1462
migrants       1335
francais       1298
faire          1107
accueil        1082
Name: france, dtype: uint16

faut


faut           5164
immigration    2070
pays           1994
france         1768
accueillir     1173
politique      1035
migrants        980
faire           881
francais        843
immigres        723
Name: faut, dtype: uint16

politique


politique      4621
migratoire     2268
pays           1642
immigration    1603
france         1507
faut           1035
asile           830
migrants        744
accueillir      674
accueil         644
Name: politique, dtype: uint16

accueillir


accueillir     3866
pays           1530
france         1462
faut           1173
immigration     976
migrants        955
monde           930
politique       674
tout            623
misere          612
Name: accueillir, dtype: uint16

migrants


migrants       3745
pays           1540
france         1335
faut            980
accueillir      955
immigration     882
politique       744
accueil         642
francais        617
faire           578
Name: migrants, dtype: uint16

francais


francais       3172
france         1298
immigration    1221
pays           1112
faut            843
migrants        617
faire           592
politique       579
accueillir      549
immigres        534
Name: francais, dtype: uint16

faire


faire          2873
pays           1228
france         1107
immigration    1020
faut            881
politique       636
francais        592
migrants        578
accueillir      556
tout            476
Name: faire, dtype: uint16

accueil


accueil        2670
pays           1124
france         1082
immigration     721
politique       644
migrants        642
faut            575
accueillir      483
terre           414
integration     412
Name: accueil, dtype: uint16

asile


asile          2653
droit          1215
immigration    1053
pays           1021
france          841
politique       830
faut            608
migrants        460
demandeurs      413
accueillir      411
Name: asile, dtype: uint16

migratoire


migratoire     2646
politique      2268
france         1015
pays            951
immigration     767
faut            598
migrants        466
accueillir      396
situation       393
faire           385
Name: migratoire, dtype: uint16

immigres


immigres       2549
france         1034
immigration     962
pays            943
faut            723
francais        534
accueillir      519
politique       448
faire           394
integration     358
Name: immigres, dtype: uint16

tout


tout           2323
pays            993
france          941
immigration     807
faut            708
monde           702
accueillir      623
francais        517
politique       498
faire           476
Name: tout, dtype: uint16

situation


situation      2306
pays            999
immigration     896
france          824
faut            633
politique       579
migrants        440
accueillir      397
migratoire      393
francais        384
Name: situation, dtype: uint16

integration


integration    2262
immigration     916
pays            709
france          667
faut            561
politique       500
francais        421
accueil         412
migrants        372
langue          368
Name: integration, dtype: uint16

droit


droit          2139
asile          1215
immigration     886
pays            817
france          688
faut            503
sol             494
politique       456
francais        448
migrants        337
Name: droit, dtype: uint16

quotas


quotas         2105
immigration     674
pays            587
faut            442
france          434
besoins         364
politique       353
mettre          351
place           325
fonction        292
Name: quotas, dtype: uint16

non


non            2036
immigration    1005
pays            833
france          739
faut            523
politique       501
francais        440
migrants        381
faire           355
droit           322
Name: non, dtype: uint16

monde


monde          1872
accueillir      930
france          867
pays            783
misere          764
tout            702
immigration     592
faut            539
politique       328
faire           328
Name: monde, dtype: uint16

In [180]:
for i in df_qu_33_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_33[i].sort_values(ascending=False).head(10))

immigration


immigration    1.000000
clandestine    0.950877
choisie        0.916838
illegale       0.900000
controlee      0.769437
stopper        0.702083
importante     0.684358
economique     0.616646
chance         0.604585
reduire        0.581152
Name: immigration, dtype: float32

pays


pays             1.000000
origine          0.869595
developpement    0.820833
developper       0.747405
guerre           0.684250
europeens        0.678010
fuient           0.661130
aider            0.659538
danger           0.621138
guerres          0.618182
Name: pays, dtype: float32

france


france      1.000000
terre       0.733424
histoire    0.583144
rester      0.536555
veulent     0.519849
veut        0.518519
venir       0.515581
partie      0.507865
arrivent    0.504762
viennent    0.499210
Name: france, dtype: float32

faut


faut          1.000000
stopper       0.433333
arreter       0.420668
traiter       0.405405
lutter        0.402778
trouver       0.382075
arrivent      0.380952
aider         0.378101
rapidement    0.373771
continuer     0.373188
Name: faut, dtype: float32

politique


politique     1.000000
migratoire    0.857143
europeenne    0.530378
actuelle      0.529536
matiere       0.386441
mise          0.375394
definir       0.371078
terme         0.349593
europeens     0.345550
europeen      0.343066
Name: politique, dtype: float32

accueillir


accueillir      1.000000
dignement       0.636156
misere          0.568773
pouvons         0.567766
monde           0.496795
devons          0.440273
fuient          0.411960
continuer       0.398551
moyens          0.383673
correctement    0.367491
Name: accueillir, dtype: float32

migrants


migrants       1.000000
economiques    0.365655
arrivee        0.359431
charge         0.340557
migrant        0.299790
dignement      0.288330
grande         0.286082
trouver        0.280660
viennent       0.279621
europeens      0.277487
Name: migrants, dtype: float32

francais


francais         1.000000
apprendre        0.583133
obligation       0.409449
nationalite      0.379195
apprentissage    0.377717
sol              0.364993
rue              0.359862
citoyens         0.357453
veulent          0.347826
5                0.346032
Name: francais, dtype: float32

faire


faire       1.000000
savoir      0.413490
venir       0.369688
famille     0.291066
veulent     0.285444
loi         0.284507
partie      0.260674
etranger    0.242280
demande     0.238839
vivre       0.236650
Name: faire, dtype: float32

accueil


accueil       1.000000
terre         0.560216
capacites     0.450161
capacite      0.329204
conditions    0.282292
rester        0.281289
refugies      0.223944
devons        0.204778
logement      0.200355
politiques    0.187603
Name: accueil, dtype: float32

asile


asile          1.000000
demandeurs     0.791188
demandes       0.580858
droit          0.568022
demande        0.446429
rapidement     0.340984
terre          0.276049
frontiere      0.262376
economique     0.251576
clandestins    0.234899
Name: asile, dtype: float32

migratoire


migratoire    1.000000
politique     0.490803
flux          0.338129
actuelle      0.293249
definir       0.233288
compte        0.227599
europeenne    0.223317
europe        0.205737
population    0.187911
europeen      0.186131
Name: migratoire, dtype: float32

immigres


immigres     1.000000
immigre      0.265152
nombre       0.232990
veulent      0.215501
chomage      0.208929
enfants      0.204248
problemes    0.199605
viennent     0.197472
societe      0.187427
culture      0.187086
Name: immigres, dtype: float32

tout


tout          1.000000
monde         0.375000
etranger      0.275534
pouvons       0.210623
temps         0.206949
vivre         0.206311
territoire    0.195496
enfants       0.194444
ans           0.188119
vie           0.185185
Name: tout, dtype: float32

situation


situation         1.000000
irreguliere       0.842308
catastrophique    0.435484
actuelle          0.322785
compte            0.193548
chomage           0.191071
etrangers         0.188256
origine           0.179135
ans               0.172560
controle          0.170284
Name: situation, dtype: float32

integration


integration      1.000000
volonte          0.383378
apprentissage    0.361413
langue           0.293227
culture          0.279801
capacite         0.272566
favoriser        0.268765
sociale          0.245783
respect          0.227394
valeurs          0.219382
Name: integration, dtype: float32

droit


droit           1.000000
sol             0.670285
asile           0.457972
supprimer       0.415550
nationalite     0.310403
regroupement    0.296296
familial        0.285983
clandestins     0.261745
sociales        0.223158
respecter       0.222816
Name: droit, dtype: float32

quotas


quotas          1.000000
instaurer       0.522078
fonction        0.245791
mettre          0.223282
definir         0.215553
besoins         0.205766
place           0.198292
canada          0.177458
familial        0.152399
regroupement    0.140551
Name: quotas, dtype: float32

non


non           1.000000
oui           0.342183
emplois       0.300948
respect       0.192819
culture       0.168874
choisie       0.167010
enfants       0.166667
ans           0.161245
republique    0.159398
aides         0.158594
Name: non, dtype: float32

monde


monde         1.000000
misere        0.710037
pouvons       0.401099
tout          0.302195
accueillir    0.240559
part          0.201087
prendre       0.181240
moyens        0.180612
terre         0.166441
vivre         0.158981
Name: monde, dtype: float32

In [181]:
for i in df_qu_33_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_33[i].sort_values(ascending=False).head(10))

immigration


immigration    0.000116
clandestine    0.000110
choisie        0.000106
illegale       0.000104
controlee      0.000089
stopper        0.000081
importante     0.000079
economique     0.000071
chance         0.000070
reduire        0.000067
Name: immigration, dtype: float32

pays


pays             0.000129
origine          0.000112
developpement    0.000106
developper       0.000096
guerre           0.000088
europeens        0.000087
fuient           0.000085
aider            0.000085
danger           0.000080
guerres          0.000080
Name: pays, dtype: float32

france


france      0.000147
terre       0.000108
histoire    0.000085
rester      0.000079
veulent     0.000076
veut        0.000076
venir       0.000076
partie      0.000074
arrivent    0.000074
viennent    0.000073
Name: france, dtype: float32

faut


faut          0.000194
stopper       0.000084
arreter       0.000081
traiter       0.000079
lutter        0.000078
trouver       0.000074
arrivent      0.000074
aider         0.000073
rapidement    0.000072
continuer     0.000072
Name: faut, dtype: float32

politique


politique     0.000216
migratoire    0.000185
europeenne    0.000115
actuelle      0.000115
matiere       0.000084
mise          0.000081
definir       0.000080
terme         0.000076
europeens     0.000075
europeen      0.000074
Name: politique, dtype: float32

accueillir


accueillir      0.000259
dignement       0.000165
misere          0.000147
pouvons         0.000147
monde           0.000129
devons          0.000114
fuient          0.000107
continuer       0.000103
moyens          0.000099
correctement    0.000095
Name: accueillir, dtype: float32

migrants


migrants       0.000267
economiques    0.000098
arrivee        0.000096
charge         0.000091
migrant        0.000080
dignement      0.000077
grande         0.000076
trouver        0.000075
viennent       0.000075
europeens      0.000074
Name: migrants, dtype: float32

francais


francais         0.000315
apprendre        0.000184
obligation       0.000129
nationalite      0.000120
apprentissage    0.000119
sol              0.000115
rue              0.000113
citoyens         0.000113
veulent          0.000110
5                0.000109
Name: francais, dtype: float32

faire


faire       0.000348
savoir      0.000144
venir       0.000129
famille     0.000101
veulent     0.000099
loi         0.000099
partie      0.000091
etranger    0.000084
demande     0.000083
vivre       0.000082
Name: faire, dtype: float32

accueil


accueil       0.000375
terre         0.000210
capacites     0.000169
capacite      0.000123
conditions    0.000106
rester        0.000105
refugies      0.000084
devons        0.000077
logement      0.000075
politiques    0.000070
Name: accueil, dtype: float32

asile


asile          0.000377
demandeurs     0.000298
demandes       0.000219
droit          0.000214
demande        0.000168
rapidement     0.000129
terre          0.000104
frontiere      0.000099
economique     0.000095
clandestins    0.000089
Name: asile, dtype: float32

migratoire


migratoire    0.000378
politique     0.000185
flux          0.000128
actuelle      0.000111
definir       0.000088
compte        0.000086
europeenne    0.000084
europe        0.000078
population    0.000071
europeen      0.000070
Name: migratoire, dtype: float32

immigres


immigres     0.000392
immigre      0.000104
nombre       0.000091
veulent      0.000085
chomage      0.000082
enfants      0.000080
problemes    0.000078
viennent     0.000077
societe      0.000074
culture      0.000073
Name: immigres, dtype: float32

tout


tout          0.000430
monde         0.000161
etranger      0.000119
pouvons       0.000091
temps         0.000089
vivre         0.000089
territoire    0.000084
enfants       0.000084
ans           0.000081
vie           0.000080
Name: tout, dtype: float32

situation


situation         0.000434
irreguliere       0.000365
catastrophique    0.000189
actuelle          0.000140
compte            0.000084
chomage           0.000083
etrangers         0.000082
origine           0.000078
ans               0.000075
controle          0.000074
Name: situation, dtype: float32

integration


integration      0.000442
volonte          0.000169
apprentissage    0.000160
langue           0.000130
culture          0.000124
capacite         0.000120
favoriser        0.000119
sociale          0.000109
respect          0.000101
valeurs          0.000097
Name: integration, dtype: float32

droit


droit           0.000468
sol             0.000313
asile           0.000214
supprimer       0.000194
nationalite     0.000145
regroupement    0.000139
familial        0.000134
clandestins     0.000122
sociales        0.000104
respecter       0.000104
Name: droit, dtype: float32

quotas


quotas          0.000475
instaurer       0.000248
fonction        0.000117
mettre          0.000106
definir         0.000102
besoins         0.000098
place           0.000094
canada          0.000084
familial        0.000072
regroupement    0.000067
Name: quotas, dtype: float32

non


non           0.000491
oui           0.000168
emplois       0.000148
respect       0.000095
culture       0.000083
choisie       0.000082
enfants       0.000082
ans           0.000079
republique    0.000078
aides         0.000078
Name: non, dtype: float32

monde


monde         0.000534
misere        0.000379
pouvons       0.000214
tout          0.000161
accueillir    0.000129
part          0.000107
prendre       0.000097
moyens        0.000096
terre         0.000089
vivre         0.000085
Name: monde, dtype: float32

In [182]:
gc.collect()

112

# Question 34:  En matière d'immigration, une fois nos obligations d'asile remplies, souhaitez-vous que nous puissions nous fixer des objectifs annuels définis par le Parlement ?

In [183]:
question_34 = "En matière d'immigration, une fois nos obligations d'asile remplies, souhaitez-vous que nous puissions nous fixer des objectifs annuels définis par le Parlement ?"
qu_34,df_qu_34_one_hot,df_cov_34,df_confidence_34,df_lift_34 = compute_similarities(question_34, new_res)

In [184]:
for i in df_qu_34_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_34[i].sort_values(ascending=False).head(10))

oui


oui            12589
pays             700
immigration      606
besoins          592
quotas           581
fonction         570
objectifs        569
faut             567
france           360
asile            333
Name: oui, dtype: uint16

non


non            5426
pays            420
immigration     396
faut            377
objectifs       343
asile           317
quotas          303
france          299
oui             270
faire           201
Name: non, dtype: uint16

pays


pays           2300
oui             700
immigration     467
faut            454
asile           421
non             420
france          364
objectifs       316
quotas          308
besoins         281
Name: pays, dtype: uint16

immigration


immigration    2084
oui             606
pays            467
non             396
faut            361
asile           354
france          320
choisie         314
quotas          283
objectifs       256
Name: immigration, dtype: uint16

objectifs


objectifs      2072
oui             569
annuels         477
fixer           393
non             343
pays            316
faut            312
asile           273
immigration     256
parlement       233
Name: objectifs, dtype: uint16

faut


faut           1888
oui             567
pays            454
non             377
immigration     361
asile           341
objectifs       312
quotas          286
france          257
accueillir      255
Name: faut, dtype: uint16

asile


asile          1843
obligations     711
pays            421
droit           408
immigration     354
faut            341
oui             333
non             317
france          307
obligation      275
Name: asile, dtype: uint16

quotas


quotas         1777
oui             581
pays            308
non             303
faut            286
immigration     283
asile           212
besoins         209
fixer           194
fonction        188
Name: quotas, dtype: uint16

france


france         1412
pays            364
oui             360
immigration     320
asile           307
non             299
faut            257
accueillir      228
objectifs       186
faire           174
Name: france, dtype: uint16

besoins


besoins        1152
oui             592
fonction        519
pays            281
quotas          209
immigration     206
objectifs       172
economiques     139
non             138
france          131
Name: besoins, dtype: uint16

obligations


obligations    1113
asile           711
pays            194
objectifs       179
faut            167
france          159
non             151
oui             142
immigration     141
pouvoir           0
Name: obligations, dtype: uint16

fonction


fonction       1034
oui             570
besoins         519
pays            234
quotas          188
immigration     147
objectifs       142
faut            125
accueil         120
france          103
Name: fonction, dtype: uint16

accueillir


accueillir    966
oui           295
pays          259
faut          255
monde         250
france        228
non           194
misere        150
asile         149
tout          135
Name: accueillir, dtype: uint16

faire


faire          949
oui            248
pays           245
faut           231
non            201
france         174
immigration    166
objectifs      152
asile          149
quotas         113
Name: faire, dtype: uint16

parlement


parlement      900
oui            287
objectifs      233
non            147
quotas         137
immigration    126
asile          118
fixer          114
annuels        114
pays           109
Name: parlement, dtype: uint16

objectif


objectif       796
oui            161
non            143
zero           140
immigration    135
pays           125
asile          112
travail          0
voir             0
besoins          0
Name: objectif, dtype: uint16

francais


francais       778
oui            201
non            196
france         157
pays           150
asile          149
immigration    146
faut           139
objectifs      106
travail        105
Name: francais, dtype: uint16

migrants


migrants      777
pays          246
oui           203
non           162
faut          152
france        151
asile         135
accueillir    129
quotas        114
objectifs     103
Name: migrants, dtype: uint16

fixer


fixer          766
objectifs      393
faut           202
quotas         194
oui            193
pays           157
immigration    138
annuels        136
asile          126
parlement      114
Name: fixer, dtype: uint16

tout


tout           763
pays           189
oui            180
monde          174
faut           163
non            157
asile          148
accueillir     135
france         134
immigration    119
Name: tout, dtype: uint16

In [185]:
for i in df_qu_34_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_34[i].sort_values(ascending=False).head(10))

oui


oui            1.000000
fonction       0.551257
canada         0.549080
besoins        0.513889
choisie        0.432836
emploi         0.414634
main           0.407115
integration    0.403377
compte         0.402827
oeuvre         0.400697
Name: oui, dtype: float32

non


non          1.000000
cas          0.308889
francais     0.251928
droit        0.223776
tous         0.221580
faire        0.211802
france       0.211756
politique    0.210210
migrants     0.208494
tout         0.205767
Name: non, dtype: float32

pays


pays           1.000000
origine        0.839394
vie            0.376812
tous           0.354528
europe         0.338936
situation      0.323308
economique     0.317881
migrants       0.316602
economiques    0.305556
politique      0.277778
Name: pays, dtype: float32

immigration


immigration    1.000000
choisie        0.937313
economique     0.476821
zero           0.369281
politique      0.256757
droit          0.253496
france         0.226629
immigres       0.205224
pays           0.203043
integration    0.200750
Name: immigration, dtype: float32

objectifs


objectifs      1.000000
annuels        0.822414
definis        0.535316
fixer          0.513055
definir        0.265116
parlement      0.258889
integration    0.206379
accueil        0.204167
faut           0.165254
obligations    0.160827
Name: objectifs, dtype: float32

faut


faut          1.000000
accueillir    0.263975
fixer         0.263708
definir       0.248837
faire         0.243414
immigres      0.236940
cas           0.226667
monde         0.226054
nombre        0.217143
droit         0.215035
Name: faut, dtype: float32

asile


asile          1.000000
droit          0.713287
obligation     0.644028
obligations    0.638814
cas            0.293333
economique     0.253863
annuels        0.237931
politique      0.237237
tous           0.229287
france         0.217422
Name: asile, dtype: float32

quotas


quotas         1.000000
fixer          0.253264
annuels        0.218966
politique      0.190691
fonction       0.181818
besoins        0.181424
parlement      0.152222
faut           0.151483
migrants       0.146718
immigration    0.135797
Name: quotas, dtype: float32

france


france        1.000000
monde         0.275862
immigres      0.246269
accueillir    0.236025
francais      0.201799
travail       0.200704
migrants      0.194337
droit         0.183566
faire         0.183351
accueil       0.180556
Name: france, dtype: float32

besoins


besoins        1.000000
fonction       0.501934
main           0.422925
oeuvre         0.421603
economiques    0.351010
pays           0.122174
quotas         0.117614
immigration    0.098848
france         0.092776
objectifs      0.083012
Name: besoins, dtype: float32

obligations


obligations    1.000000
asile          0.385784
france         0.112606
faut           0.088453
objectifs      0.086390
pays           0.084348
immigration    0.067658
non            0.027829
oui            0.011280
pouvoir        0.000000
Name: obligations, dtype: float32

fonction


fonction       1.000000
besoins        0.450521
accueil        0.166667
quotas         0.105796
pays           0.101739
france         0.072946
immigration    0.070537
objectifs      0.068533
faut           0.066208
oui            0.045278
Name: fonction, dtype: float32

accueillir


accueillir     1.000000
misere         0.488599
monde          0.478927
tout           0.176933
migrants       0.166023
france         0.161473
faut           0.135064
pays           0.112609
asile          0.080846
immigration    0.055182
Name: accueillir, dtype: float32

faire


faire          1.000000
france         0.123229
faut           0.122352
pays           0.106522
asile          0.080846
immigration    0.079655
objectifs      0.073359
quotas         0.063590
non            0.037044
oui            0.019700
Name: faire, dtype: float32

parlement


parlement      1.000000
annuels        0.196552
fixer          0.148825
objectifs      0.112452
quotas         0.077096
asile          0.064026
immigration    0.060461
pays           0.047391
non            0.027092
oui            0.022798
Name: parlement, dtype: float32

objectif


objectif       1.000000
zero           0.457516
immigration    0.064779
asile          0.060770
pays           0.054348
non            0.026355
oui            0.012789
probleme       0.000000
travail        0.000000
besoins        0.000000
Name: objectif, dtype: float32

francais


francais       1.000000
travail        0.184859
france         0.111190
asile          0.080846
faut           0.073623
immigration    0.070058
pays           0.065217
objectifs      0.051158
non            0.036122
oui            0.015966
Name: francais, dtype: float32

migrants


migrants      1.000000
accueillir    0.133540
pays          0.106957
france        0.106941
faut          0.080508
asile         0.073250
quotas        0.064153
objectifs     0.049710
non           0.029856
oui           0.016125
Name: migrants, dtype: float32

fixer


fixer          1.000000
annuels        0.234483
objectifs      0.189672
parlement      0.126667
quotas         0.109173
faut           0.106992
asile          0.068367
pays           0.068261
immigration    0.066219
non            0.020641
Name: fixer, dtype: float32

tout


tout           1.000000
monde          0.333333
accueillir     0.139752
france         0.094901
faut           0.086335
pays           0.082174
asile          0.080304
immigration    0.057102
objectifs      0.050193
non            0.028935
Name: tout, dtype: float32

In [186]:
for i in df_qu_34_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_34[i].sort_values(ascending=False).head(10))

oui


oui            0.000079
fonction       0.000044
canada         0.000044
besoins        0.000041
choisie        0.000034
emploi         0.000033
main           0.000032
integration    0.000032
compte         0.000032
oeuvre         0.000032
Name: oui, dtype: float32

non


non          0.000184
cas          0.000057
francais     0.000046
droit        0.000041
tous         0.000041
faire        0.000039
france       0.000039
politique    0.000039
migrants     0.000038
tout         0.000038
Name: non, dtype: float32

pays


pays           0.000435
origine        0.000365
vie            0.000164
tous           0.000154
europe         0.000147
situation      0.000141
economique     0.000138
migrants       0.000138
economiques    0.000133
politique      0.000121
Name: pays, dtype: float32

immigration


immigration    0.000480
choisie        0.000450
economique     0.000229
zero           0.000177
politique      0.000123
droit          0.000122
france         0.000109
immigres       0.000098
pays           0.000097
integration    0.000096
Name: immigration, dtype: float32

objectifs


objectifs      0.000483
annuels        0.000397
definis        0.000258
fixer          0.000248
definir        0.000128
parlement      0.000125
integration    0.000100
accueil        0.000099
faut           0.000080
obligations    0.000078
Name: objectifs, dtype: float32

faut


faut          0.000530
accueillir    0.000140
fixer         0.000140
definir       0.000132
faire         0.000129
immigres      0.000125
cas           0.000120
monde         0.000120
nombre        0.000115
droit         0.000114
Name: faut, dtype: float32

asile


asile          0.000543
droit          0.000387
obligation     0.000349
obligations    0.000347
cas            0.000159
economique     0.000138
annuels        0.000129
politique      0.000129
tous           0.000124
france         0.000118
Name: asile, dtype: float32

quotas


quotas         0.000563
fixer          0.000143
annuels        0.000123
politique      0.000107
fonction       0.000102
besoins        0.000102
parlement      0.000086
faut           0.000085
migrants       0.000083
immigration    0.000076
Name: quotas, dtype: float32

france


france        0.000708
monde         0.000195
immigres      0.000174
accueillir    0.000167
francais      0.000143
travail       0.000142
migrants      0.000138
droit         0.000130
faire         0.000130
accueil       0.000128
Name: france, dtype: float32

besoins


besoins        0.000868
fonction       0.000436
main           0.000367
oeuvre         0.000366
economiques    0.000305
pays           0.000106
quotas         0.000102
immigration    0.000086
france         0.000081
objectifs      0.000072
Name: besoins, dtype: float32

obligations


obligations    0.000898
asile          0.000347
france         0.000101
faut           0.000079
objectifs      0.000078
pays           0.000076
immigration    0.000061
non            0.000025
oui            0.000010
citoyens            NaN
Name: obligations, dtype: float32

fonction


fonction       0.000967
besoins        0.000436
accueil        0.000161
quotas         0.000102
pays           0.000098
france         0.000071
immigration    0.000068
objectifs      0.000066
faut           0.000064
oui            0.000044
Name: fonction, dtype: float32

accueillir


accueillir     0.001035
misere         0.000506
monde          0.000496
tout           0.000183
migrants       0.000172
france         0.000167
faut           0.000140
pays           0.000117
asile          0.000084
immigration    0.000057
Name: accueillir, dtype: float32

faire


faire          0.001054
france         0.000130
faut           0.000129
pays           0.000112
asile          0.000085
immigration    0.000084
objectifs      0.000077
quotas         0.000067
non            0.000039
oui            0.000021
Name: faire, dtype: float32

parlement


parlement      0.001111
annuels        0.000218
fixer          0.000165
objectifs      0.000125
quotas         0.000086
asile          0.000071
immigration    0.000067
pays           0.000053
non            0.000030
oui            0.000025
Name: parlement, dtype: float32

objectif


objectif       0.001256
zero           0.000575
immigration    0.000081
asile          0.000076
pays           0.000068
non            0.000033
oui            0.000016
citoyens            NaN
emploi              NaN
nombre              NaN
Name: objectif, dtype: float32

francais


francais       0.001285
travail        0.000238
france         0.000143
asile          0.000104
faut           0.000095
immigration    0.000090
pays           0.000084
objectifs      0.000066
non            0.000046
oui            0.000021
Name: francais, dtype: float32

migrants


migrants      0.001287
accueillir    0.000172
pays          0.000138
france        0.000138
faut          0.000104
asile         0.000094
quotas        0.000083
objectifs     0.000064
non           0.000038
oui           0.000021
Name: migrants, dtype: float32

fixer


fixer          0.001305
annuels        0.000306
objectifs      0.000248
parlement      0.000165
quotas         0.000143
faut           0.000140
asile          0.000089
pays           0.000089
immigration    0.000086
non            0.000027
Name: fixer, dtype: float32

tout


tout           0.001311
monde          0.000437
accueillir     0.000183
france         0.000124
faut           0.000113
pays           0.000108
asile          0.000105
immigration    0.000075
objectifs      0.000066
non            0.000038
Name: tout, dtype: float32

In [187]:
gc.collect()

147

# Question 35: Que proposez-vous afin de répondre à ce défi qui va durer ?

In [188]:
question_35 = "Que proposez-vous afin de répondre à ce défi qui va durer ?"
qu_35,df_qu_35_one_hot,df_cov_35,df_confidence_35,df_lift_35 = compute_similarities(question_35, new_res)

In [189]:
for i in df_qu_35_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_35[i].sort_values(ascending=False).head(10))

pays


pays             9062
aider            2297
origine          1756
developpement    1532
migrants         1317
immigration      1284
faut             1188
france           1179
faire            1173
aide             1085
Name: pays, dtype: uint16

immigration


immigration    3157
pays           1284
france          545
faut            434
politique       425
faire           382
choisie         378
economique      305
aider           292
origine         286
Name: immigration, dtype: uint16

aider


aider            2823
pays             2297
developpement     508
developper        464
faut              437
origine           431
migrants          418
faire             320
immigration       292
france            268
Name: aider, dtype: uint16

france


france         2662
pays           1179
immigration     545
faire           510
faut            449
migrants        424
francais        392
politique       336
origine         307
accueillir      281
Name: france, dtype: uint16

faire


faire          2518
pays           1173
france          510
faut            441
migrants        387
immigration     382
aider           320
politique       272
origine         261
tout            260
Name: faire, dtype: uint16

migrants


migrants      2447
pays          1317
france         424
aider          418
faire          387
origine        370
faut           343
accueil        286
accueillir     279
francais       260
Name: migrants, dtype: uint16

faut


faut           2325
pays           1188
france          449
faire           441
aider           437
immigration     434
migrants        343
politique       290
accueillir      270
francais        258
Name: faut, dtype: uint16

politique


politique        2191
pays             1011
immigration       425
europeenne        391
france            336
developpement     306
faut              290
faire             272
place             269
accueil           262
Name: politique, dtype: uint16

origine


origine          1850
pays             1756
aider             431
migrants          370
developpement     313
france            307
immigration       286
faire             261
aide              248
faut              238
Name: origine, dtype: uint16

developpement


developpement    1841
pays             1532
aide              552
aider             508
economique        338
origine           313
politique         306
immigration       251
migrants          213
france            204
Name: developpement, dtype: uint16

frontieres


frontieres     1619
pays            486
controle        280
fermer          248
immigration     229
europe          223
france          209
migrants        169
politique       164
controles       163
Name: frontieres, dtype: uint16

francais


francais       1598
pays            525
france          392
immigration     273
migrants        260
faut            258
faire           257
integration     220
tout            195
travail         192
Name: francais, dtype: uint16

integration


integration    1567
pays            341
accueil         257
immigration     228
francais        220
politique       218
france          216
migrants        193
langue          191
faut            177
Name: integration, dtype: uint16

accueil


accueil        1563
pays            574
migrants        286
france          263
politique       262
integration     257
faire           214
place           191
faut            190
immigration     180
Name: accueil, dtype: uint16

aide


aide             1545
pays             1085
developpement     552
politique         249
origine           248
migrants          228
immigration       227
france            218
aider             195
faut              167
Name: aide, dtype: uint16

accueillir


accueillir     1477
pays            545
france          281
migrants        279
faut            270
monde           247
faire           208
immigration     184
aider           174
tout            164
Name: accueillir, dtype: uint16

place


place          1435
pays            729
mettre          659
politique       269
aider           253
immigration     234
faut            227
france          226
faire           212
mise            200
Name: place, dtype: uint16

aides


aides            1307
pays              703
sociales          278
france            244
migrants          214
immigration       208
francais          182
faire             175
aider             174
developpement     170
Name: aides, dtype: uint16

tous


tous           1301
pays            628
france          269
faire           228
faut            224
migrants        212
immigration     208
francais        162
aider           156
politique       149
Name: tous, dtype: uint16

tout


tout           1293
pays            559
france          278
faire           260
monde           255
faut            254
immigration     202
francais        195
migrants        182
accueillir      164
Name: tout, dtype: uint16

In [190]:
for i in df_qu_35_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_35[i].sort_values(ascending=False).head(10))

pays


pays             1.000000
origine          0.949189
concernes        0.942350
emigration       0.888620
depart           0.866667
pauvres          0.854123
developpement    0.832156
dirigeants       0.825095
aider            0.813673
developper       0.811594
Name: pays, dtype: float32

immigration


immigration     1.000000
choisie         0.945000
stopper         0.466899
limiter         0.333841
economique      0.311542
besoins         0.254045
familial        0.252525
regroupement    0.248408
fonction        0.246316
lutter          0.230189
Name: immigration, dtype: float32

aider


aider            1.000000
developper       0.448309
pauvres          0.376321
rester           0.343533
populations      0.303488
argent           0.292035
viennent         0.287554
puissent         0.279302
developpement    0.275937
vivre            0.263027
Name: aider, dtype: float32

france


france         1.000000
venir          0.361419
etrangers      0.311502
ans            0.301703
nationalite    0.299169
sociales       0.295844
misere         0.292343
valeurs        0.275294
droits         0.270833
pouvoir        0.267108
Name: france, dtype: float32

faire


faire        1.000000
sorte        0.804636
respecter    0.386111
guerre       0.219672
vivre        0.209677
moyens       0.207578
exemple      0.205179
cas          0.203065
tout         0.201083
arreter      0.194845
Name: faire, dtype: float32

migrants


migrants       1.000000
viennent       0.349785
economiques    0.323965
origine        0.200000
accueillir     0.188896
mieux          0.187079
travailler     0.186170
vie            0.184211
accueil        0.182981
territoire     0.178667
Name: migrants, dtype: float32

faut


faut        1.000000
misere      0.238979
societe     0.222222
exemple     0.211155
probleme    0.207723
monde       0.206263
vivre       0.204715
moyens      0.204283
prendre     0.200787
guerre      0.200000
Name: faut, dtype: float32

politique


politique     1.000000
migratoire    0.547804
europeenne    0.420430
economique    0.229826
europeen      0.197289
mettre        0.196208
niveau        0.190583
place         0.187456
asile         0.173220
accueil       0.167626
Name: politique, dtype: float32

origine


origine          1.000000
pays             0.193776
developpement    0.170016
situation        0.166913
economique       0.163432
aide             0.160518
travailler       0.154255
asile            0.154091
populations      0.153488
aider            0.152674
Name: origine, dtype: float32

developpement


developpement    1.000000
aide             0.357282
economique       0.345250
favoriser        0.314545
emigration       0.278450
cooperation      0.245902
pauvres          0.241015
afrique          0.235079
aider            0.179950
origine          0.169189
Name: developpement, dtype: float32

frontieres


frontieres    1.000000
fermer        0.772586
controles     0.534426
controle      0.423601
renforcer     0.341085
europe        0.190761
droit         0.125623
europeenne    0.122581
asile         0.114772
aides         0.094874
Name: frontieres, dtype: float32

francais


francais         1.000000
apprentissage    0.411765
apprendre        0.373665
nationalite      0.299169
sol              0.263525
francaise        0.237160
etrangers        0.236422
formation        0.225806
citoyens         0.207547
territoire       0.200000
Name: francais, dtype: float32

integration


integration    1.000000
langue         0.303175
formation      0.213710
francaise      0.187311
accueil        0.164427
travail        0.161414
francais       0.137672
immigres       0.121411
mettre         0.114592
politique      0.099498
Name: integration, dtype: float32

accueil


accueil        1.000000
conditions     0.199409
refugies       0.196262
integration    0.164008
langue         0.161905
territoire     0.134667
place          0.133101
mettre         0.130256
politique      0.119580
asile          0.117960
Name: accueil, dtype: float32

aide


aide             1.000000
developpement    0.299837
economique       0.151175
origine          0.134054
populations      0.120930
pays             0.119731
non              0.115979
politique        0.113647
place            0.096864
europe           0.094098
Name: aide, dtype: float32

accueillir


accueillir    1.000000
misere        0.359629
monde         0.266739
mieux         0.173620
integrer      0.171036
tout          0.126837
faut          0.116129
migrants      0.114017
travail       0.108883
immigres      0.106645
Name: accueillir, dtype: float32

place


place          1.000000
mise           0.716846
mettre         0.543281
populations    0.136047
politique      0.122775
accueil        0.122201
developper     0.103382
non            0.103093
europe         0.101796
faut           0.097634
Name: place, dtype: float32

aides


aides            1.000000
sociales         0.679707
supprimer        0.284289
donner           0.138070
droit            0.129611
francais         0.113892
non              0.105670
developpement    0.092341
france           0.091660
immigres         0.087777
Name: aides, dtype: float32

tous


tous        1.000000
asile       0.130712
monde       0.128510
droit       0.115653
europe      0.110351
immigres    0.109926
francais    0.101377
france      0.101052
tout        0.100541
faut        0.096344
Name: tous, dtype: float32

tout


tout          1.000000
monde         0.275378
territoire    0.188000
vie           0.126794
francais      0.122028
droit         0.111665
accueillir    0.111036
faut          0.109247
travail       0.108883
france        0.104433
Name: tout, dtype: float32

In [191]:
for i in df_qu_35_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_35[i].sort_values(ascending=False).head(10))

pays


pays             0.000110
origine          0.000105
concernes        0.000104
emigration       0.000098
depart           0.000096
pauvres          0.000094
developpement    0.000092
dirigeants       0.000091
aider            0.000090
developper       0.000090
Name: pays, dtype: float32

immigration


immigration     0.000317
choisie         0.000299
stopper         0.000148
limiter         0.000106
economique      0.000099
besoins         0.000080
familial        0.000080
regroupement    0.000079
fonction        0.000078
lutter          0.000073
Name: immigration, dtype: float32

aider


aider            0.000354
developper       0.000159
pauvres          0.000133
rester           0.000122
populations      0.000108
argent           0.000103
viennent         0.000102
puissent         0.000099
developpement    0.000098
vivre            0.000093
Name: aider, dtype: float32

france


france         0.000376
venir          0.000136
etrangers      0.000117
ans            0.000113
nationalite    0.000112
sociales       0.000111
misere         0.000110
valeurs        0.000103
droits         0.000102
pouvoir        0.000100
Name: france, dtype: float32

faire


faire        0.000397
sorte        0.000320
respecter    0.000153
guerre       0.000087
vivre        0.000083
moyens       0.000082
exemple      0.000081
cas          0.000081
tout         0.000080
arreter      0.000077
Name: faire, dtype: float32

migrants


migrants       0.000409
viennent       0.000143
economiques    0.000132
origine        0.000082
accueillir     0.000077
mieux          0.000076
travailler     0.000076
vie            0.000075
accueil        0.000075
territoire     0.000073
Name: migrants, dtype: float32

faut


faut        0.000430
misere      0.000103
societe     0.000096
exemple     0.000091
probleme    0.000089
monde       0.000089
vivre       0.000088
moyens      0.000088
prendre     0.000086
guerre      0.000086
Name: faut, dtype: float32

politique


politique     0.000456
migratoire    0.000250
europeenne    0.000192
economique    0.000105
europeen      0.000090
mettre        0.000090
niveau        0.000087
place         0.000086
asile         0.000079
accueil       0.000077
Name: politique, dtype: float32

origine


origine          0.000541
pays             0.000105
developpement    0.000092
situation        0.000090
economique       0.000088
aide             0.000087
travailler       0.000083
asile            0.000083
populations      0.000083
aider            0.000083
Name: origine, dtype: float32

developpement


developpement    0.000543
aide             0.000194
economique       0.000188
favoriser        0.000171
emigration       0.000151
cooperation      0.000134
pauvres          0.000131
afrique          0.000128
aider            0.000098
origine          0.000092
Name: developpement, dtype: float32

frontieres


frontieres    0.000618
fermer        0.000477
controles     0.000330
controle      0.000262
renforcer     0.000211
europe        0.000118
droit         0.000078
europeenne    0.000076
asile         0.000071
aides         0.000059
Name: frontieres, dtype: float32

francais


francais         0.000626
apprentissage    0.000258
apprendre        0.000234
nationalite      0.000187
sol              0.000165
francaise        0.000148
etrangers        0.000148
formation        0.000141
citoyens         0.000130
territoire       0.000125
Name: francais, dtype: float32

integration


integration    0.000638
langue         0.000193
formation      0.000136
francaise      0.000120
accueil        0.000105
travail        0.000103
francais       0.000088
immigres       0.000077
mettre         0.000073
politique      0.000063
Name: integration, dtype: float32

accueil


accueil        0.000640
conditions     0.000128
refugies       0.000126
integration    0.000105
langue         0.000104
territoire     0.000086
place          0.000085
mettre         0.000083
politique      0.000077
asile          0.000075
Name: accueil, dtype: float32

aide


aide             0.000647
developpement    0.000194
economique       0.000098
origine          0.000087
populations      0.000078
pays             0.000077
non              0.000075
politique        0.000074
place            0.000063
europe           0.000061
Name: aide, dtype: float32

accueillir


accueillir    0.000677
misere        0.000243
monde         0.000181
mieux         0.000118
integrer      0.000116
tout          0.000086
faut          0.000079
migrants      0.000077
travail       0.000074
immigres      0.000072
Name: accueillir, dtype: float32

place


place          0.000697
mise           0.000500
mettre         0.000379
populations    0.000095
politique      0.000086
accueil        0.000085
developper     0.000072
non            0.000072
europe         0.000071
faut           0.000068
Name: place, dtype: float32

aides


aides            0.000765
sociales         0.000520
supprimer        0.000218
donner           0.000106
droit            0.000099
francais         0.000087
non              0.000081
developpement    0.000071
france           0.000070
immigres         0.000067
Name: aides, dtype: float32

tous


tous        0.000769
asile       0.000100
monde       0.000099
droit       0.000089
europe      0.000085
immigres    0.000084
francais    0.000078
france      0.000078
tout        0.000077
faut        0.000074
Name: tous, dtype: float32

tout


tout          0.000773
monde         0.000213
territoire    0.000145
vie           0.000098
francais      0.000094
droit         0.000086
accueillir    0.000086
faut          0.000084
travail       0.000084
france        0.000081
Name: tout, dtype: float32

In [192]:
gc.collect()

147

# Question 36:  Quelles sont, selon vous, les modalités d'intégration les plus efficaces et les plus justes à mettre en place aujourd'hui dans la société ?

In [193]:
question_36 = "Quelles sont, selon vous, les modalités d'intégration les plus efficaces et les plus justes à mettre en place aujourd'hui dans la société ?"
qu_36,df_qu_36_one_hot,df_cov_36,df_confidence_36,df_lift_36 = compute_similarities(question_36, new_res)

In [194]:
for i in df_qu_36_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_36[i].sort_values(ascending=False).head(10))

langue


langue           6317
apprentissage    2207
francaise        2105
travail          1149
apprendre        1126
pays             1002
integration       977
valeurs           816
formation         775
culture           750
Name: langue, dtype: uint16

francais


francais         5547
apprendre        1274
apprentissage    1059
france            977
travail           858
integration       816
cours             783
pays              732
langue            661
francaise         642
Name: francais, dtype: uint16

travail


travail          4344
langue           1149
integration       870
francais          858
apprentissage     528
logement          517
education         516
ecole             464
francaise         407
pays              399
Name: travail, dtype: uint16

integration


integration      3659
langue            977
travail           870
francais          816
pays              553
francaise         514
apprentissage     509
france            467
faut              457
faire             397
Name: integration, dtype: uint16

apprentissage


apprentissage    3217
langue           2207
francais         1059
francaise         776
travail           528
integration       509
obligatoire       492
formation         480
valeurs           452
education         365
Name: apprentissage, dtype: uint16

francaise


francaise        2971
langue           2105
apprentissage     776
francais          642
integration       514
culture           491
france            480
valeurs           453
apprendre         443
nationalite       413
Name: francaise, dtype: uint16

pays


pays           2878
langue         1002
francais        732
integration     553
france          526
apprendre       447
accueil         422
origine         412
faire           405
travail         399
Name: pays, dtype: uint16

education


education        2664
langue            595
travail           516
francais          433
apprentissage     365
integration       364
civique           341
formation         337
francaise         250
logement          218
Name: education, dtype: uint16

france


france         2499
francais        977
langue          643
pays            526
francaise       480
integration     467
faire           381
histoire        368
valeurs         354
apprendre       345
Name: france, dtype: uint16

apprendre


apprendre     2374
francais      1274
langue        1126
pays           447
francaise      443
travail        365
france         345
obligation     288
faire          279
valeurs        277
Name: apprendre, dtype: uint16

formation


formation          2082
langue              775
francais            488
apprentissage       480
travail             365
professionnelle     353
education           337
francaise           326
integration         311
emploi              239
Name: formation, dtype: uint16

ecole


ecole            2012
travail           464
langue            417
francais          330
integration       321
enfants           313
apprentissage     274
francaise         198
education         185
formation         175
Name: ecole, dtype: uint16

valeurs


valeurs          1956
langue            816
republique        698
francais          574
francaise         453
apprentissage     452
integration       387
pays              361
france            354
respect           332
Name: valeurs, dtype: uint16

faire


faire          1851
francais        556
langue          455
pays            405
integration     397
france          381
travail         284
faut            283
apprendre       279
francaise       265
Name: faire, dtype: uint16

integrer


integrer       1803
francais        515
langue          444
pays            372
faut            372
france          323
integration     295
travail         287
faire           258
francaise       246
Name: integrer, dtype: uint16

faut


faut           1659
francais        498
integration     457
pays            374
langue          373
integrer        372
france          342
travail         312
faire           283
tout            233
Name: faut, dtype: uint16

republique


republique       1564
valeurs           698
langue            580
francais          516
francaise         396
lois              353
apprentissage     314
respect           284
integration       272
apprendre         259
Name: republique, dtype: uint16

respect


respect          1513
langue            538
lois              350
valeurs           332
francais          330
pays              324
laicite           294
francaise         290
republique        284
apprentissage     283
Name: respect, dtype: uint16

culture


culture          1498
langue            750
francaise         491
francais          424
pays              340
apprentissage     316
integration       309
france            255
histoire          229
apprendre         221
Name: culture, dtype: uint16

tout


tout           1434
francais        439
langue          340
integration     308
pays            277
france          271
faut            233
travail         232
faire           226
francaise       215
Name: tout, dtype: uint16

In [195]:
for i in df_qu_36_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_36[i].sort_values(ascending=False).head(10))

langue


langue           1.000000
maitrise         0.791809
francaise        0.708516
apprentissage    0.686043
connaissance     0.671315
institutions     0.557927
principes        0.517787
histoire         0.511526
culture          0.500668
metier           0.486957
Name: langue, dtype: float32

francais


francais      1.000000
cours         0.633495
sol           0.554455
examen        0.553571
apprendre     0.536647
savoir        0.534535
obligation    0.505187
connaitre     0.461883
niveau        0.421053
femmes        0.416031
Name: francais, dtype: float32

travail


travail        1.000000
trouver        0.525896
logement       0.423423
acces          0.327373
donner         0.310630
aides          0.292985
monde          0.290598
integration    0.237770
permettre      0.236842
pouvoir        0.233906
Name: travail, dtype: float32

integration


integration     1.000000
parcours        0.555147
volonte         0.457627
bonne           0.450199
assimilation    0.445183
faciliter       0.409091
favoriser       0.305936
politique       0.304450
place           0.290043
niveau          0.289474
Name: integration, dtype: float32

apprentissage


apprentissage      1.000000
obligatoire        0.418723
langue             0.349375
professionnelle    0.318637
metier             0.315942
francaise          0.261192
aide               0.234146
valeurs            0.231084
formation          0.230548
civique            0.226562
Name: apprentissage, dtype: float32

francaise


francaise       1.000000
nationalite     0.597685
maitrise        0.354949
citoyennete     0.335052
langue          0.333228
culture         0.327770
connaissance    0.324701
histoire        0.285401
societe         0.272059
obligatoire     0.266383
Name: francaise, dtype: float32

pays


pays         1.000000
origine      0.690117
us           0.389241
accueil      0.378136
coutumes     0.373077
connaitre    0.327354
cas          0.309963
histoire     0.307355
savoir       0.303303
respecter    0.284817
Name: pays, dtype: float32

education


education      1.000000
civique        0.444010
acces          0.221458
logement       0.178542
enfants        0.177716
cours          0.166667
formation      0.161864
emploi         0.123534
laicite        0.123175
obligatoire    0.122553
Name: education, dtype: float32

france


france         1.000000
histoire       0.403952
rester         0.388013
vivre          0.335655
etrangers      0.300987
ans            0.274276
origine        0.266332
nationalite    0.243126
connaitre      0.242152
pouvoir        0.233906
Name: france, dtype: float32

apprendre


apprendre     1.000000
obligation    0.298755
connaitre     0.239910
respecter     0.239791
trouver       0.239044
francais      0.229674
travailler    0.198157
coutumes      0.197436
histoire      0.192097
lois          0.187837
Name: apprendre, dtype: float32

formation


formation          1.000000
professionnelle    0.707415
emploi             0.186865
logement           0.184275
civique            0.179688
acces              0.173315
apprentissage      0.149207
obligatoire        0.144681
education          0.126502
accueil            0.126344
Name: formation, dtype: float32

ecole


ecole          1.000000
adultes        0.410658
enfants        0.288214
tous           0.129730
obligatoire    0.123404
travail        0.106814
logement       0.105651
republique     0.102302
cours          0.091424
tout           0.090656
Name: ecole, dtype: float32

valeurs


valeurs          1.000000
republicaines    0.811448
republique       0.446292
respect          0.219432
respecter        0.206283
histoire         0.204171
laicite          0.198905
francaise        0.152474
nationalite      0.149059
societe          0.144958
Name: valeurs, dtype: float32

faire


faire        1.000000
cas          0.193727
respecter    0.193717
origine      0.175879
faut         0.170585
vivre        0.164345
tout         0.157601
france       0.152461
non          0.149866
integrer     0.143095
Name: faire, dtype: float32

integrer


integrer    1.000000
veulent     0.451613
volonte     0.393220
mieux       0.291080
faut        0.224231
societe     0.203782
aider       0.200371
migrants    0.169940
immigres    0.160463
vivre       0.149025
Name: integrer, dtype: float32

faut


faut           1.000000
integrer       0.206323
mettre         0.173438
tout           0.162483
immigration    0.160410
vivre          0.158774
immigres       0.153846
faire          0.152890
societe        0.152311
migrants       0.145015
Name: faut, dtype: float32

republique


republique    1.000000
valeurs       0.356851
lois          0.271747
regles        0.224629
laicite       0.213504
respecter     0.205236
respect       0.187707
devoirs       0.151335
droits        0.138824
francaise     0.133288
Name: republique, dtype: float32

respect


respect       1.000000
lois          0.269438
laicite       0.268248
regles        0.201824
republique    0.181586
valeurs       0.169734
non           0.165031
coutumes      0.157692
culture       0.116155
pays          0.112578
Name: respect, dtype: float32

culture


culture      1.000000
histoire     0.251372
francaise    0.165264
langue       0.118727
pays         0.118138
respect      0.115003
cours        0.109223
valeurs      0.107873
faut         0.104280
france       0.102041
Name: culture, dtype: float32

tout


tout          1.000000
monde         0.490029
territoire    0.233967
faut          0.140446
droits        0.123529
faire         0.122096
non           0.114184
donner        0.110423
societe       0.109244
france        0.108443
Name: tout, dtype: float32

In [196]:
for i in df_qu_36_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_36[i].sort_values(ascending=False).head(10))

langue


langue           0.000158
maitrise         0.000125
francaise        0.000112
apprentissage    0.000109
connaissance     0.000106
institutions     0.000088
principes        0.000082
histoire         0.000081
culture          0.000079
metier           0.000077
Name: langue, dtype: float32

francais


francais      0.000180
cours         0.000114
sol           0.000100
examen        0.000100
apprendre     0.000097
savoir        0.000096
obligation    0.000091
connaitre     0.000083
niveau        0.000076
femmes        0.000075
Name: francais, dtype: float32

travail


travail        0.000230
trouver        0.000121
logement       0.000097
acces          0.000075
donner         0.000072
aides          0.000067
monde          0.000067
integration    0.000055
permettre      0.000055
pouvoir        0.000054
Name: travail, dtype: float32

integration


integration     0.000273
parcours        0.000152
volonte         0.000125
bonne           0.000123
assimilation    0.000122
faciliter       0.000112
favoriser       0.000084
politique       0.000083
place           0.000079
niveau          0.000079
Name: integration, dtype: float32

apprentissage


apprentissage      0.000311
obligatoire        0.000130
langue             0.000109
professionnelle    0.000099
metier             0.000098
francaise          0.000081
aide               0.000073
valeurs            0.000072
formation          0.000072
civique            0.000070
Name: apprentissage, dtype: float32

francaise


francaise       0.000337
nationalite     0.000201
maitrise        0.000119
citoyennete     0.000113
langue          0.000112
culture         0.000110
connaissance    0.000109
histoire        0.000096
societe         0.000092
obligatoire     0.000090
Name: francaise, dtype: float32

pays


pays         0.000347
origine      0.000240
us           0.000135
accueil      0.000131
coutumes     0.000130
connaitre    0.000114
cas          0.000108
histoire     0.000107
savoir       0.000105
respecter    0.000099
Name: pays, dtype: float32

education


education      0.000375
civique        0.000167
acces          0.000083
logement       0.000067
enfants        0.000067
cours          0.000063
formation      0.000061
emploi         0.000046
laicite        0.000046
obligatoire    0.000046
Name: education, dtype: float32

france


france         0.000400
histoire       0.000162
rester         0.000155
vivre          0.000134
etrangers      0.000120
ans            0.000110
origine        0.000107
nationalite    0.000097
connaitre      0.000097
pouvoir        0.000094
Name: france, dtype: float32

apprendre


apprendre     0.000421
obligation    0.000126
connaitre     0.000101
respecter     0.000101
trouver       0.000101
francais      0.000097
travailler    0.000083
coutumes      0.000083
histoire      0.000081
lois          0.000079
Name: apprendre, dtype: float32

formation


formation          0.000480
professionnelle    0.000340
emploi             0.000090
logement           0.000089
civique            0.000086
acces              0.000083
apprentissage      0.000072
obligatoire        0.000069
education          0.000061
accueil            0.000061
Name: formation, dtype: float32

ecole


ecole          0.000497
adultes        0.000204
enfants        0.000143
tous           0.000064
obligatoire    0.000061
travail        0.000053
logement       0.000053
republique     0.000051
cours          0.000045
tout           0.000045
Name: ecole, dtype: float32

valeurs


valeurs          0.000511
republicaines    0.000415
republique       0.000228
respect          0.000112
respecter        0.000105
histoire         0.000104
laicite          0.000102
francaise        0.000078
nationalite      0.000076
societe          0.000074
Name: valeurs, dtype: float32

faire


faire        0.000540
cas          0.000105
respecter    0.000105
origine      0.000095
faut         0.000092
vivre        0.000089
tout         0.000085
france       0.000082
non          0.000081
integrer     0.000077
Name: faire, dtype: float32

integrer


integrer    0.000555
veulent     0.000250
volonte     0.000218
mieux       0.000161
faut        0.000124
societe     0.000113
aider       0.000111
migrants    0.000094
immigres    0.000089
vivre       0.000083
Name: integrer, dtype: float32

faut


faut           0.000603
integrer       0.000124
mettre         0.000105
tout           0.000098
immigration    0.000097
vivre          0.000096
immigres       0.000093
faire          0.000092
societe        0.000092
migrants       0.000087
Name: faut, dtype: float32

republique


republique    0.000639
valeurs       0.000228
lois          0.000174
regles        0.000144
laicite       0.000137
respecter     0.000131
respect       0.000120
devoirs       0.000097
droits        0.000089
francaise     0.000085
Name: republique, dtype: float32

respect


respect       0.000661
lois          0.000178
laicite       0.000177
regles        0.000133
republique    0.000120
valeurs       0.000112
non           0.000109
coutumes      0.000104
culture       0.000077
pays          0.000074
Name: respect, dtype: float32

culture


culture      0.000668
histoire     0.000168
francaise    0.000110
langue       0.000079
pays         0.000079
respect      0.000077
cours        0.000073
valeurs      0.000072
faut         0.000070
france       0.000068
Name: culture, dtype: float32

tout


tout          0.000697
monde         0.000342
territoire    0.000163
faut          0.000098
droits        0.000086
faire         0.000085
non           0.000080
donner        0.000077
societe       0.000076
france        0.000076
Name: tout, dtype: float32

In [None]:
gc.collect()

147

# Question 37:   Y a-t-il d'autres points sur la démocratie et la citoyenneté sur lesquels vous souhaiteriez vous exprimer ?

In [None]:
question_37 = "Y a-t-il d'autres points sur la démocratie et la citoyenneté sur lesquels vous souhaiteriez vous exprimer ?"
qu_37,df_qu_37_one_hot,df_cov_37,df_confidence_37,df_lift_37 = compute_similarities(question_37, new_res)

In [None]:
for i in df_qu_37_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_37[i].sort_values(ascending=False).head(10))

In [None]:
for i in df_qu_37_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_37[i].sort_values(ascending=False).head(10))

In [None]:
for i in df_qu_37_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_37[i].sort_values(ascending=False).head(10))

In [None]:
gc.collect()